MagicMind 是面向寒武纪 MLU 的推理加速引擎。MagicMind 能将 AI 框架(Tensorflow,PyTorch,ONNX 等) 训练好的算法模型转换成 MagicMind 统一计算图表示,并提供端到端的模型优化、代码生成以及推理业务部署能力。 本 sample 探讨如何使用将 YOLOv3_Tiny 网络的 Caffe 模型转换为 MagicMind 模型,进而部署在寒武纪 MLU 板卡上。
本例使用的 YOLOv3_Tiny 实现来自 github 开源项目https://github.com/pjreddie/darknet 下面将展示如何将该项目中 Caffe 实现的 YOLOv3_Tiny 模型转换为 MagicMind 的模型。
请移至主页面 README.md的2.前提条件
请移至主页面 README.md的3.环境准备
# 下载仓库
git clone 本仓库
cd magicmind_cloud/buildin/cv/detection/yolov3_tiny_caffe
在开始运行代码前需要先安装相关依赖,执行以下命令:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ -f https://download.pytorch.org/whl/torch_stable.html
在开始运行代码前需要先检查 env.sh 里的环境变量,并且执行以下命令:
source env.sh
- 下载数据集
cd $PROJ_ROOT_PATH/export_model
bash run.sh
- 下载模型
将 darknet 原生的 yolov3_tiny.cfg 和 yolov3_tiny.weight 转换为本仓库所需要的 yolov3_tiny.caffemodel 和 yolov3_tiny.prototxt,需要使用 Caffe 来实现转换,请参考这里,本教程默认提供好转换后的 caffemodel 和 prototxt 文件下载链接,图像大小设置为 416x416。
cd $PROJ_ROOT_PATH/gen_model
#bash run.sh <magicmind_model> <precision> <batch_size> <dynamic_shape>
bash run.sh ${MODEL_PATH}/yolov3_tiny_caffe_model_force_float32_true force_float32 1 true
1.infer_cpp
cd $PROJ_ROOT_PATH/infer_cpp
#bash run.sh <magicmind_model> <batch_size> <image_num>
bash run.sh ${MODEL_PATH}/yolov3_tiny_caffe_model_force_float32_true force_float32 1 1000
结果:
Average Precision (AP) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.168
Average Precision (AP) @[ IoU=0.50 | area= all | maxDets=100 ] = 0.373
Average Precision (AP) @[ IoU=0.75 | area= all | maxDets=100 ] = 0.137
Average Precision (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.053
Average Precision (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.185
Average Precision (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.286
Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 1 ] = 0.175
Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 10 ] = 0.285
Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.309
Average Recall (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.095
Average Recall (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.358
Average Recall (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.504
以上 3.3~3.5 的步骤也可以通过运行 cd magicmind_cloud/buildin/cv/detection/yolov3_tiny_caffe && bash run.sh 来实现一键执行
Caffe YOLOv3_Tiny 模型转换为 MagicMind YOLOv3_Tiny 模型分成以下几步:
- 使用 MagicMind Parser 模块将 caffe 文件解析为 MagicMind 网络结构。
- 模型量化。
- 使用 MagicMind Builder 模块生成 MagicMind 模型实例并保存为离线模型文件。
注意: 在gen_model内使用了一些公共的组件,例如arg解析、第三方框架(如PyTorch)模型解析、MagicMind 配置设定等,这些公共组件的说明详见:公共组件的README.md
概述: 本例使用 MagicMind C++ API 编写了名为 infer_cpp 的视频检测程序。infer_cpp 将展示如何使用 MagicMind C++ API 构建高效的 YOLOv3_Tiny 目标检测(图像预处理=>推理=>图像后处理)。其中程序主要由以下内容构成:
- infer.cpp: 高效率的将 MagicMind 模型运行在 MLU 板卡上。
参数说明:
- magicmind_model: MagicMind 模型路径。
- image_num: 输入测试图像数量
- batch_size: 模型 batch_size
- image_dir: 数据集路径
- label_path:coco.names 文件
- file_list:推理图像路径文件
- output_dir:推理结果文件路径
- save_img:是否存储推理输出画框图像 1 存储 0 不存储
本仓库通过寒武纪提供的 Magicmind 性能测试工具 mm_run 展示性能数据
#查看参数说明
mm_run -h
mm_run --magicmind_model $MM_MODEL --batch_size $BATCH_SIZE --iterations 1000
或者通过一键运行 benchmark 里的脚本:
cd $PROJ_ROOT_PATH
bash benchmark/perf.sh
一键运行 benchmark 里的脚本:
cd $PROJ_ROOT_PATH/
bash benchmark/eval.sh
通过5.2精度benchmark测试的脚本跑出跑出 YOLOv3 在 coco val2017 数据集上5000张测试图片的 mAP 如下: (confidence_thresholds默认为0.005)
Model | BatchSize | Precision | IoU=0.50:0.95(%) | IoU=0.50(%) |
---|---|---|---|---|
YOLOv3_Tiny | 1 | force_float32 | 16.8 | 37.3 |
YOLOv3_Tiny | 1 | force_float16 | 16.8 | 37.3 |
YOLOv3_Tiny | 1 | int8_mixed_float16 | 15.5 | 36.2 |
您明确了解并同意,以下链接中的软件、数据或者模型由第三方提供并负责维护。在以下链接中出现的任何第三方的名称、商标、标识、产品或服务并不构成明示或暗示与该第三方或其软件、数据或模型的相关背书、担保或推荐行为。您进一步了解并同意,使用任何第三方软件、数据或者模型,包括您提供的任何信息或个人数据(不论是有意或无意地),应受相关使用条款、许可协议、隐私政策或其他此类协议的约束。因此,使用链接中的软件、数据或者模型可能导致的所有风险将由您自行承担。
- coco 数据集下载链接: http://images.cocodataset.org/zips/val2017.zip
- yolov3_tiny.caffemodel: https://drive.google.com/uc?id=1zz6Dq4hdUNMVmE_aLZ5bQzc80vfNv4aN
- yolov3_tiny.prototxt: https://drive.google.com/uc?id=1I_vSuiDslsCzJf_TvP1IqdN7M5pBxMMH