PVT-tensorflow2/train.py at main · wangermeng2021/PVT-tensorflow2 · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
# # from __future__ import print_function
import argparse
import tensorflow as tf
import logging
logging.getLogger().setLevel(logging.INFO)
from utils.lr_scheduler import get_lr_scheduler
from model.model_builder import get_model
from generator.generator_builder import get_generator
from utils.optimizers import get_optimizers
import sys
import os

physical_devices = tf.config.list_physical_devices('GPU')
if physical_devices:
    tf.config.experimental.set_memory_growth(physical_devices[0], True)

def parse_args(args):
    parser = argparse.ArgumentParser(description='Simple training script for using PVT .')

    parser.add_argument('--epochs', default=200, type=int)
    parser.add_argument('--batch-size', default=64, type=int)
    parser.add_argument('--dataset', default='cifar10', type=str, help="choices=['cifar10,cifar100,your_custom dataset']")#dataset/RockPaperScissor
    parser.add_argument('--model', default='PVT-tiny', type=str, help="choices=['PVT-tiny','PVT-small','PVT-medium','PVT-large',"
                                                                      "'ResNet50','ResNet101','EfficientNetB0','CifarResNet']")
    parser.add_argument('--pretrain', default=None, help="choices=[None,'imagenet','resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5']")
    parser.add_argument('--img-size', default=32, type=int)
    parser.add_argument('--augment', default='custom_augment', type=str, help="choices=['rand_augment','auto_augment','cutmix','mixup','custom_augment',]")
    parser.add_argument('--concat-max-and-average-pool', default=False, type=bool,help="Use concat_max_and_average_pool layer in model")
    parser.add_argument('--lr-scheduler', default='cosine', type=str, help="choices=['step','cosine']")
    parser.add_argument('--init-lr', default=1e-4, type=float)
    parser.add_argument('--momentum', default=0.9, type=float)
    parser.add_argument('--lr-decay', default=0.1, type=float)
    parser.add_argument('--lr-decay-epoch', default=[80, 150, 180], type=int)
    parser.add_argument('--warmup-lr', default=1e-5, type=float)
    parser.add_argument('--warmup-epochs', default=0, type=int)
    parser.add_argument('--weight-decay', default=0, type=float)
    parser.add_argument('--optimizer', default='adam', help="choices=['adam','sgd']")
    parser.add_argument('--checkpoints', default='./checkpoints')
    return parser.parse_args(args)

def main(args):

    train_generator, val_generator = get_generator(args)
    model = get_model(args, train_generator.num_class)
    loss_object = tf.keras.losses.CategoricalCrossentropy()
    optimizer = get_optimizers(args)
    lr_scheduler = get_lr_scheduler(args)
    if not os.path.exists(args.checkpoints):
        os.makedirs(args.checkpoints)
    # lr_cb = tf.keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.1, patience=20, verbose=1, min_lr=0)
    lr_cb = tf.keras.callbacks.LearningRateScheduler(lr_scheduler)
    model_checkpoint_cb = tf.keras.callbacks.ModelCheckpoint(filepath=args.checkpoints+'/best_weight_{epoch}_{accuracy:.3f}_{val_accuracy:.3f}.h5',
                                                             monitor='val_accuracy',mode='max',
                                                             verbose=1,save_best_only=True,save_weights_only=True)
    cbs=[lr_cb,
         model_checkpoint_cb
         ]
    model.compile(optimizer,loss_object,metrics=["accuracy"],)
    model.fit(train_generator,
                          validation_data=val_generator,
                          epochs=args.epochs,
                          callbacks=cbs,
                          verbose=1,
                          )

if __name__== "__main__":
    args = parse_args(sys.argv[1:])
    main(args)