基于DeepVAC规范的PyTorch项目,可以通过在config.py中添加一些配置项来自动实现特定的功能。
这些配置的作用范围有三种:
- 仅适用于train.py,也就是在train.py执行的时候生效;
- 仅适用于test.py,也就是在test.py执行的时候生效;
- 适用于train.py和test.py,也就是train.py、test.py执行的时候都生效。
#初始化
from deepvac import AttrDict, fork, new, newDict
config = new('<my_train_class>')
#单卡训练和测试所使用的device,多卡请开启Deepvac的DDP功能
config.core.<my_train_class>.device = "cuda"
#禁用训练中的验证环节
config.core.<my_train_class>.no_val = False
#是否禁用git branch约束
config.core.<my_train_class>.disable_git = False
#模型输出和加载所使用的路径,非必要不要改动
config.core.<my_train_class>.output_dir = "output"
#日志输出的目录,非必要不要改动
config.core.<my_train_class>.log_dir = "log"
#每多少次迭代打印一次训练日志
config.core.<my_train_class>.log_every = 10
#用于训练时,加载预训练模型。注意不是checkpoint,可参考 config.core.checkpoint_suffix
#用于测试时,加载测试模型。
config.core.<my_train_class>.model_path = '/root/.cache/torch/hub/checkpoints/resnet50-19c8e357.pth'
#initNetWithCode()定义的网络如果和权重文件里的parameter name不一致,而在结构上一致,
#从逻辑上来说本应该能加载权重文件,但因为name不匹配而会失败。
#可以开启model_reinterpret_cast来解决此问题。这就带来了此开关的2个使用场景:
#场景1:对原官方开源网络的代码进行deepvac标准化后,为了仍然能够加载原官方预训练模型,可以开启此开关。
#场景2:也可以通过开启此开关,然后加载原官方的预训练模型到deepvac化后的网络,来进行重构正确性的检查。
config.core.<my_train_class>.model_reinterpret_cast = False
#Dataloader的线程数
config.core.<my_train_class>.num_workers = 3
#dataloader的collate_fn参数
config.core.<my_train_class>.collate_fn = None
#MyTrainDataset为Dataset的子类
config.core.<my_train_class>.train_dataset = MyTrainDataset(config.core)
config.core.<my_train_class>.train_loader = torch.utils.data.DataLoader(
config.core.<my_train_class>.train_dataset,
batch_size=config.core.<my_train_class>.batch_size,
num_workers=config.core.<my_train_class>.num_workers,
shuffle= True,
collate_fn=config.core.<my_train_class>.collate_fn
)
#MyValDataset为Dataset的子类
config.core.<my_train_class>.val_dataset = MyValDataset(config.core)
config.core.<my_train_class>.val_loader = torch.utils.data.DataLoader(config.core.<my_train_class>.val_dataset, batch_size=1, pin_memory=False)
#MyTestDataset为Dataset的子类
config.core.<my_test_class>.test_dataset = MyTestDataset(config.core)
config.core.<my_test_class>.test_loader = torch.utils.data.DataLoader(config.core.<my_test_class>.test_dataset, batch_size=1, pin_memory=False)
aug算子的配置项有哪些是这个aug算子的作者确定的
#增强算子的配置需要使用AttrDict()进行初始化
config.aug.GemfieldAug = AttrDict()
#为GemfieldAug算子配置属性
config.aug.GemfieldAug.gemfield_age = 20
dataset的配置项一般只有composer和transform这个,分别代表deepvac.aug和torchvision.transform这两个实例。
#dataset的配置需要使用AttrDict()进行初始化
config.datasets.FileLineCvSegDataset = AttrDict()
#为该dataset配置一个composer
config.datasets.FileLineCvSegDataset.composer = ESPNetMainComposer(config)
train_loader = torch.utils.data.DataLoader(
FileLineCvSegDataset(config, config.fileline_path, ',', config.sample_path_prefix),
batch_size=config.core.<my_train_class>.batch_size, shuffle=True, num_workers=config.core.<my_train_class>.num_workers, pin_memory=True)
composer中AugFactory的配置项是这个AugFactory的作者确定的
#composer的配置需要使用AttrDict()进行初始化
config.aug.GemfieldAugFactory = AttrDict()
config.aug.GemfieldAugFactory.trans1 = transforms.Compose([
transforms.RandomHorizontalFlip(),
transforms.ToTensor(),
transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225)),
transforms.RandomErasing(),
])
#GemfieldComposer使用了GemfieldAugFactory
mycomposer = GemfieldComposer(config)
注意:一个composer实例封装了一个/多个AugFactory实例,一个AugFactory实例封装一个/多个Aug实例。但是,实例之间的config是共享的。如果多个实例之间不想共享config,则可以:
from deepvac import AttrDict, fork, new, newDict
config2 = new()
#只克隆需要的部分
config2.aug = config.aug.clone()
config2.aug.GemfieldAug.gemfield_age = 22
mycomposer2 = GemfieldComposer(config2)
这样mycomposer2和mycomposer就不共享deepvac.aug和deepvac.composer的配置项了。
config.core.<my_train_class>.optimizer = optim.SGD(config.core.<my_train_class>.net.parameters(),lr=0.01,momentum=0.9,weight_decay=None,nesterov=False)
config.core.<my_train_class>.scheduler = torch.optim.lr_scheduler.MultiStepLR(config.core.<my_train_class>.optimizer, [2,4,6,8,10], 0.27030)
#网络定义
config.core.<my_train_class>.net = MyNet()
#损失函数
config.core.<my_train_class>.criterion = MyCriterion()
#训练的batch size
config.core.<my_train_class>.train_batch_size = 128
#训练多少个Epoch
config.core.<my_train_class>.epoch_num = 30
#一个Epoch中保存多少次模型和Checkpoint文件
config.core.<my_train_class>.save_num = 5
#checkpoint_suffix一旦配置,则启动train.py的时候将加载output/<git_branch>/checkpoint:<checkpoint_suffix>
#不配置或者配置为空字符串,表明从头开始训练。
#train.py下,该配置会覆盖config.model_path。
config.core.<my_train_class>.checkpoint_suffix = '2020-09-01-17-37_acc:0.9682857142857143_epoch:10_step:6146_lr:0.00011543040395151496.pth'
#验证时所用的batch size
config.core.<my_train_class>.val_batch_size = None
#使用jit加载模型,script、trace后的模型如果在python中加载,必须使用这个开关。
#test.py下,开启此开关后将会忽略config.model_path
config.core.<my_train_class>.jit_model_path = '/root/.cache/torch/hub/checkpoints/resnet50-19c8e357.pt'
#测试时所用的batch size
config.core.<my_test_class>.test_batch_size = None
要启用分布式训练,需要确保2点:
- config.py需要进行如下配置:
#dist_url,单机多卡无需改动,多机训练一定要修改
config.core.<my_train_class>.dist_url = "tcp://localhost:27030"
#rank的数量,一定要修改
config.core.<my_train_class>.world_size = 3
- 命令行传递如下两个参数(不在config.py中配置):
#从0开始
--rank <rank_idx>
#从0开始
--gpu <gpu_idx>
上述的配置表明我们将使用3个进程在3个CUDA设备上进行训练。配置完成后,我们在命令行手工启动3个进程:
python train.py --rank 0 --gpu 0
python train.py --rank 1 --gpu 1
python train.py --rank 2 --gpu 2
EMA: exponential moving average,指数滑动平均。滑动平均可以使模型更健壮。采用梯度下降算法训练神经网络时,使用滑动平均在很多应用中都可以在一定程度上提高最终模型的表现。
要开启EMA,需要设置如下配置:
config.core.<my_train_class>.ema = True
#可选配置,默认为lambda x: 0.9999 * (1 - math.exp(-x / 2000))
config.core.<my_train_class>.ema_decay = <lambda function>
Deepvac会自动在log/<git_branch>/下写入tensorboard数据,如果需要在线可视化,则还需要如下配置:
# 如果不配置,则不启用tensorboard服务
config.core.<my_train_class>.tensorboard_port = "6007"
# 不配置的话为0.0.0.0,如非必要则无需改变
config.core.<my_train_class>.tensorboard_ip = None
如果要转换PyTorch模型到TorchScript,你需要设置如下的配置:
#通过script的方式将pytorch训练的模型编译为TorchScript模型
config.cast.ScriptCast.model_dir = <your_script_model_dir_only4smoketest>
#通过trace的方式将pytorch训练的模型转换为TorchScript模型
config.cast.TraceCast.model_dir = <your_trace_model_dir_only4smoketest>
注意:
- 在train.py下,配置上面的参数后,Deepvac会在第一次迭代的时候,进行冒烟测试。也就是测试网络是否能够成功转换为TorchScript。之后,在每次保存PyTorch模型的时候,会同时保存TorchScript;
- 在train.py下,<your_trace_model_dir_only4smoketest> 仅用于冒烟测试,真正的存储目录为PyTorch模型所在的目录,无需用户额外指定。
- 在test.py下,<your_trace_model_dir_only4smoketest> 为TorchScript模型输出路径。
如果要转换PyTorch模型到ONNX,你需要设置如下的配置:
#输出config.onnx_model_dir
config.cast.OnnxCast.onnx_model_dir = <your_onnx_model_dir_only4smoketest>
#默认onnx版本,默认是9。当模型使用了上采样等操作时,建议将它设置为11或以上
config.cast.OnnxCast.onnx_version = 9
config.cast.OnnxCast.onnx_input_names = ["input"]
config.cast.OnnxCast.onnx_output_names = ["output"]
#当模型的支持动态输入的时候,需要设置,input和output需要和上面2行设置的name对应。
config.cast.OnnxCast.onnx_dynamic_ax = {
'input': {
2: 'image_height',
3: 'image_width'
},
'output':{
2: 'image_height',
3: 'image_width'
}
}
注意:
- 在train.py下,配置上面的参数后,Deepvac会在第一次迭代的时候,进行冒烟测试。也就是测试网络是否能够成功转换为ONNX。之后,在每次保存PyTorch模型的时候,会同时保存ONNX。
- 在train.py下,<your_onnx_model_dir_only4smoketest> 仅用于冒烟测试,真正的存储目录为PyTorch模型所在的目录,无需用户额外指定。
- 在test.py下,<your_onnx_model_dir_only4smoketest> 为ONNX模型输出路径。
因为转换NCNN依赖ONNX,所以需要先设置ONNX的配置:
#输出config.onnx_model_dir
config.cast.NcnnCast.onnx_model_dir = <your_onnx_model_dir_only4smoketest>
#默认onnx版本,默认是9。当模型使用了上采样等操作时,建议将它设置为11或以上
config.cast.NcnnCast.onnx_version = 9
config.cast.NcnnCast.onnx_input_names = ["input"]
config.cast.NcnnCast.onnx_output_names = ["output"]
#当模型的支持动态输入的时候,需要设置,input和output需要和上面2行设置的name对应。
config.cast.NcnnCast.onnx_dynamic_ax = <参考ONNX章节>
然后需要设置如下ncnn的配置:
# NCNN的文件路径, ncnn.arch ncnn.bin
config.cast.NcnnCast.model_dir = <your_ncnn_model_dir_only4smoketest>
# onnx2ncnn可执行文件的路径,https://github.com/Tencent/ncnn/wiki/how-to-build#build-for-linux-x86
config.cast.NcnnCast.onnx2ncnn = <your_onnx2ncnn_executable_file>
注意:
- 在train.py下,配置上面的参数后,Deepvac会在第一次迭代的时候,进行冒烟测试。也就是测试网络是否能够成功转换为NCNN。之后,在每次保存PyTorch模型的时候,会同时保存NCNN。
- 在train.py下,<your_ncnn_model_dir_only4smoketest> 仅用于冒烟测试,真正的存储目录为PyTorch模型所在的目录,无需用户额外指定。
- 在test.py下,<your_ncnn_model_dir_only4smoketest> 为NCNN模型输出路径。
如果要转换PyTorch模型到CoreML,你需要设置如下的配置:
config.cast.CoremlCast.model_dir = <your_coreml_model_dir_only4smoketest>
#TraceCast.model_dir和ScriptCast.model_dir二选一,必须打开其中之一
config.cast.TraceCast.model_dir = trace.pt
config.cast.ScriptCast.model_dir = script.pt
#该配置要么设置为'image'或'tensor',要么不设置,此时相当于'tensor'
config.cast.CoremlCast.input_type = None
#以下配置只有当CoremlCast.input_type = 'image'时才需要配置
config.cast.CoremlCast.scale = 1.0 / (0.226 * 255.0)
config.cast.CoremlCast.color_layout = 'BGR'
config.cast.CoremlCast.blue_bias = -0.406 / 0.226
config.cast.CoremlCast.green_bias = -0.456 / 0.226
config.cast.CoremlCast.red_bias = -0.485 / 0.226
#可以不设置
config.cast.CoremlCast.minimum_deployment_target = coremltools.target.iOS13
#如果类别多,使用代码初始化这个值
config.cast.CoremlCast.classifier_config = ["cls1","cls2","cls3","cls4","cls5","cls6"]
注意:
- 在train.py下,配置上面的参数后,Deepvac会在第一次迭代的时候,进行冒烟测试,也就是测试网络是否能够成功转换为CoreML。之后,在每次保存PyTorch模型的时候,会同时保存CoreML。
- 在train.py下,<your_coreml_model_dir_only4smoketest> 仅用于冒烟测试,真正的存储目录为PyTorch模型所在的目录,无需用户额外指定。
- 在test.py下,<your_coreml_model_dir_only4smoketest> 为CoreML模型输出路径。
因为转换TensorRT依赖ONNX,所以需要先设置ONNX的配置:
#输出config.onnx_model_dir
config.cast.TensorrtCast.onnx_model_dir = <your_onnx_model_dir_only4smoketest>
#默认onnx版本,默认是9。当模型使用了上采样等操作时,建议将它设置为11或以上
config.cast.TensorrtCast.onnx_version = 9
config.cast.TensorrtCast.onnx_input_names = ["input"]
config.cast.TensorrtCast.onnx_output_names = ["output"]
#当模型支持动态输入的时候,需要设置以下参数,input和output需要和上面2行设置的name对应。
#还需要配置图片的最小输入尺寸,最大输入尺寸和最优尺寸。
config.cast.TensorrtCast.onnx_dynamic_ax = {
'input': {
0: 'batch_size',
1: 'image_channel',
2: 'image_height',
3: 'image_width'
},
'output':{
0: 'batch_size',
1: 'output_channel',
2: 'output_height',
3: 'output_width'
}
}
config.cast.TensorrtCast.input_min_dims = (1, 3, 1, 1)
config.cast.TensorrtCast.input_opt_dims = (1, 3, 640, 640)
config.cast.TensorrtCast.input_max_dims = (1, 3, 2000, 2000)
然后需要设置如下的配置:
config.cast.TensorrtCast.model_dir = <your_trt_model_dir_only4smoketest>
注意:
- TensorRT模型的转换依赖于onnx,因此需要首先将模型转换为onnx。
- 在train.py下,配置上面的参数后,Deepvac会在第一次迭代的时候,进行冒烟测试,也就是测试网络是否能够成功转换为TensorRT。之后,在每次保存PyTorch模型的时候,会同时保存TensorRT。
- 在train.py下,<your_trt_model_dir_only4smoketest> 仅用于冒烟测试,真正的存储目录为PyTorch模型所在的目录,无需用户额外指定。
- 在test.py下,<your_trt_model_dir_only4smoketest> 为TensorRT模型输出路径。
因为转换MNN依赖ONNX,所以需要先设置ONNX的配置:
# 输出config.onnx_model_dir
config.cast.MnnCast.onnx_model_dir = <your_onnx_model_dir_only4smoketest>
# 默认onnx版本,默认是9。当模型使用了上采样等操作时,建议将它设置为11或以上
config.cast.MnnCast.onnx_version = 9
config.cast.MnnCast.onnx_input_names = ["input"]
config.cast.MnnCast.onnx_output_names = ["output"]
然后需要设置如下的配置:
# onnx2mnn可执行文件的路径,https://www.yuque.com/mnn/cn/cvrt_linux_mac
config.cast.MnnCast.onnx2mnn = <your_onnx2mnn_executable_file>
config.cast.MnnCast.model_dir = <your_mnn_model_dir_only4smoketest>
# 固定输入形状,保存静态模型
config.cast.MnnCast.save_static_model = True
注意:
- MNN模型的转换依赖于onnx,因此需要首先将模型转换为onnx。
- 在train.py下,配置上面的参数后,Deepvac会在第一次迭代的时候,进行冒烟测试,也就是测试网络是否能够成功转换为MNN。之后,在每次保存PyTorch模型的时候,会同时保存MNN。
- 在train.py下,<your_mnn_model_dir_only4smoketest> 仅用于冒烟测试,真正的存储目录为PyTorch模型所在的目录,无需用户额外指定。
- 在test.py下,<your_mnn_model_dir_only4smoketest> 为MNN模型输出路径。
因为转换TNN依赖ONNX,所以需要先设置ONNX的配置:
# 输出config.onnx_model_dir
config.cast.TnnCast.onnx_model_dir = <your_onnx_model_dir_only4smoketest>
# 默认onnx版本,默认是9。当模型使用了上采样等操作时,建议将它设置为11或以上
config.cast.TnnCast.onnx_version = 9
config.cast.TnnCast.onnx_input_names = ["input"]
config.cast.TnnCast.onnx_output_names = ["output"]
然后需要设置如下的配置:
config.cast.TnnCast.model_dir = <your_tnn_model_dir_only4smoketest>
# 开启模型优化,有可能会提高移动端模型推理速度
config.cast.TnnCast.optimize = True
注意:
- TNN模型的转换依赖于onnx,因此需要首先将模型转换为onnx。
- 在train.py下,配置上面的参数后,Deepvac会在第一次迭代的时候,进行冒烟测试,也就是测试网络是否能够成功转换为TNN。之后,在每次保存PyTorch模型的时候,会同时保存TNN。
- 在train.py下,<your_mnn_model_dir_only4smoketest> 仅用于冒烟测试,真正的存储目录为PyTorch模型所在的目录,无需用户额外指定。
- 在test.py下,<your_mnn_model_dir_only4smoketest> 为TNN模型输出路径。
如果要开启自动混合精度训练(AMP),你只需要设置如下配置即可:
config.core.<my_train_class>.amp = True
详情参考PyTorch的自动混合精度。
目前PyTorch有三种量化方式,详情参考PyTorch的量化:
- 动态量化
- 静态量化
- 量化感知训练
一次训练任务中只能开启一种。
要开启动态量化,你需要设置如下的配置:
config.cast.TraceCast.model_dir = <your_trace_model_dir_only4smoketest>
config.cast.TraceCast.dynamic_quantize_dir = <your_quantize_model_output_dir_only4smoketest>
#或者
config.cast.ScriptCast.model_dir = <your_script_model_dir_only4smoketest>
config.cast.ScriptCast.dynamic_quantize_dir = <your_quantize_model_output_dir_only4smoketest>
要开启静态量化,你需要设置如下配置:
config.cast.TraceCast.model_dir = <your_trace_model_dir_only4smoketest>
config.cast.TraceCast.static_quantize_dir = <your_quantize_model_output_dir_only4smoketest>
#或者
config.cast.ScriptCast.model_dir = <your_script_model_dir_only4smoketest>
config.cast.ScriptCast.static_quantize_dir = <your_quantize_model_output_dir_only4smoketest>
# backend 为可选,默认为fbgemm
config.cast.TraceCast.quantize_backend = <'fbgemm' | 'qnnpack'>
#或者
config.cast.ScriptCast.quantize_backend = <'fbgemm' | 'qnnpack'>
- 由于上游PyTorch相关功能的缺失,该功能还不完善。Deepvac已经删除了此开关,将在之后的版本中择机加回来。