MagicMind 是面向寒武纪 MLU 的推理加速引擎。MagicMind 能将 AI 框架(Tensorflow,PyTorch,ONNX 等) 训练好的算法模型转换成 MagicMind 统一计算图表示,并提供端到端的模型优化、代码生成以及推理业务部署能力。
本 sample 探讨如何将 SqueezeNet_v1_1 网络 Caffe 模型转换为 MagicMind 模型,进而部署在寒武纪 MLU 板卡上。
本例使用的 SqueezeNet_v1_1 Caffe 模型来自https://github.com/forresti/SqueezeNet/tree/master/SqueezeNet_v1.1。 下面将展示如何将该项目中 Caffe 实现的SqueezeNet_v1_1 模型转换为 MagicMind 表示的模型。
请移至主页面 README.md的2.前提条件
请移至主页面 README.md的3.环境准备
# 下载仓库
git clone 本仓库
cd magicmind_cloud/buildin/cv/classification/squeezenet_v1_1_caffe
在开始运行代码前需要先检查 env.sh
里的环境变量,根据数据集实际路径修改 env.sh
内的 ILSVRC2012_DATASETS_PATH
, 并且执行以下命令:
source env.sh
cd ${PROJ_ROOT_PATH}/export_model
bash run.sh
cd ${PROJ_ROOT_PATH}/gen_model
# bash run.sh <magicmind_model> <precision> <batch_size> <dynamic_shape>
# 指定您想输出的magicmind_model路径,例如./model
bash run.sh ${magicmind_model} force_float32 1 true
1.infer_cpp
cd ${PROJ_ROOT_PATH}/infer_cpp
#bash run.sh <magicmind_model> <batch_size>
bash run.sh ${magicmind_model} 1
计算 top1 和 top5 精度:
`infer_cpp/run.sh`内包含了精度计算模块,关键代码如下:
# infer_res_dir由 infer_cpp/run.sh 创建,
# 例如:mobilenetv2_caffe_model_force_float32_false_1_infer_res/
# 具体创建规则详见 infer_cpp/run.sh
function compute_acc(){
infer_res_dir=${1}
log_file=${infer_res_dir}/log_eval
python ${UTILS_PATH}/compute_top1_and_top5.py \
--result_label_file ${infer_res_dir}/eval_labels.txt \
--result_1_file ${infer_res_dir}/eval_result_1.txt \
--result_5_file ${infer_res_dir}/eval_result_5.txt \
--top1andtop5_file ${infer_res_dir}/eval_result.txt 2>&1 |tee ${log_file}
}
compute_acc ${infer_res_dir}
结果:
top1: 0.586
top5: 0.817
以上 3.3~3.5 的步骤也可以通过运行 cd magicmind_cloud/buildin/cv/classification/squeezenet_v1_1_caffe && bash run.sh 来实现一键执行
Caffe SqueezeNet_v1_1 模型转换为 MagicMind SqueezeNet_v1_1 模型分成以下几步:
- 使用 MagicMind Parser 模块将 caffe 文件解析为 MagicMind 网络结构。
- 模型量化。
- 使用 MagicMind Builder 模块生成 MagicMind 模型实例并保存为离线模型文件。
参数说明:
注意:
在gen_model内使用了一些公共的组件,例如arg解析、第三方框架(如Caffe)模型解析、MagicMind 配置设定等,这些公共组件以及公共参数如batch_size
, device_id
的说明详见:python公共组件的README.md
概述:
本例使用 MagicMind C++ API 编写了名为 infer.cpp
的基于 SqueezeNet_v1_1 网络的图像分类程序(图像预处理=>推理=>后处理),可高效地完成图像分类任务。
参数说明:
- device_id:MLU 设备号
- batch_size:模型 batch_size
- magicmind_model:MagicMind 模型路径。
- image_dir:输入图像目录,程序对该目录下所有后缀为 jpg 的图片执行分类任务。
- label_file:ground truth 文件
- result_file:推理结果输出文件 txt 格式
- name_file:imagenet 名称文件路径
- result_label_file:推理结果输出 label 文件 txt 格式
- result_top1_file:top1 推理结果输出 label 文件 txt 格式
- result_top5_file:top5 推理结果输出 label 文件 txt 格式
- image_num:输入数据数量, 默认0,表示全部输入数据
注意:
在infer_cpp
内使用了一些公共的组件,例如model_runner
、日志系统、device抽象等,这些公共组件的说明详见:cpp公共组件的README.md
本仓库通过寒武纪提供的 Magicmind 性能测试工具 mm_run 展示性能数据
#查看参数说明
mm_run --h
mm_run --magicmind_model ${magicmind_model} --batch_size ${batch_size} --iterations 1000
或者通过一键运行 benchmark 里的脚本:
cd ${PROJ_ROOT_PATH}/benchmark
bash perf.sh
一键运行 benchmark 里的脚本跑出 Squeezenet v1.1 在 IMAGENET2012 数据集上的 TOP1 和 TOP5 如下(以下结果在MLU370-s4上取得,magicmind版本为v1.2.0,driver版本为v5.10.4):
cd ${PROJ_ROOT_PATH}/benchmark
bash eval.sh
Model | Precision | Batch_Size | TOP1 | TOP5 |
---|---|---|---|---|
Squeezenet_v1_1 | force_float32 | 1 | 0.58384 | 0.81006 |
Squeezenet_v1_1 | force_float16 | 1 | 0.58364 | 0.81006 |
Squeezenet_v1_1 | qint8_mixed_float16 | 1 | 0.57066 | 0.80576 |
您明确了解并同意,以下链接中的软件、数据或者模型由第三方提供并负责维护。在以下链接中出现的任何第三方的名称、商标、标识、产品或服务并不构成明示或暗示与该第三方或其软件、数据或模型的相关背书、担保或推荐行为。您进一步了解并同意,使用任何第三方软件、数据或者模型,包括您提供的任何信息或个人数据(不论是有意或无意地),应受相关使用条款、许可协议、隐私政策或其他此类协议的约束。因此,使用链接中的软件、数据或者模型可能导致的所有风险将由您自行承担。
- squeezenet_v1_1 caffemodel file 下载链接:https://github.com/forresti/SqueezeNet/blob/master/SqueezeNet_v1.1/squeezenet_v1.1.caffemodel
- squeezenet_v1_1 prototxt file 下载链接:https://github.com/forresti/SqueezeNet/blob/master/SqueezeNet_v1.1/deploy.prototxt
- LSVRC_2012 验证集链接: https://image-net.org/challenges/LSVRC