Name		Name	Last commit message	Last commit date
parent directory ..
benchmark		benchmark
data		data
export_model		export_model
gen_model		gen_model
infer_python		infer_python
README.md		README.md
env.sh		env.sh
requirements.txt		requirements.txt
run.sh		run.sh

README.md

PyTorch-BERT 通过 MagicMind 适配和部署

MagicMind 是面向寒武纪 MLU 的推理加速引擎。MagicMind 能将 AI 框架(Tensorflow,PyTorch,ONNX 等) 训练好的算法模型转换成 MagicMind 统一计算图表示,并提供端到端的模型优化、代码生成以及推理业务部署能力。

本 sample 探讨如何使用 MagicMind 来在寒武纪 MLU370 板卡上适配和部署 PyTorch-BERT 模型。

1.模型概述

本示例中的 BERT 模型基于 transformers v3.1.0 中的bert-base-cased 初始训练权重，并在SQuADv1.1数据集上进行了 fine-turning。

其中 MAX_SEQ_LENGTH 为 384。下面将展示如何将该项目中 Pytorch 实现的 BERT 模型转换为 MagicMind 的模型。

2.前提条件

请移至主页面 README.md的2.前提条件

3.快速使用

3.1 环境准备

请移至主页面 README.md的3.环境准备

3.2 下载仓库

# 下载仓库
git clone 本仓库
cd magicmind_cloud/buildin/nlp/LanguageModeling/bert_squad_pytorch

在开始运行代码前需要先检查 env.sh 里的环境变量，并且执行以下命令：

source env.sh

3.3 准备数据集和模型

cd $PROJ_ROOT_PATH/export_model
#bash run.sh <batch_size> <max_seq_length>
bash run.sh 384

3.4 编译 MagicMind 模型

cd ${PROJ_ROOT_PATH}/gen_model
# bash run.sh <magicmind_model> <precision> <batch_size> <dynamic_shape> 
# 指定您想输出的magicmind_model路径，例如./converted_magicmind_model
bash run.sh ${magicmind_model} force_float32 1 true

3.5 执行推理

cd $PROJ_ROOT_PATH/infer_python
#bash run.sh <magicmind_model> <batch_size>
bash run.sh ${magicmind_model} 1

结果：

SQUAD results: OrderedDict([('exact', 79.10122989593188), ('f1', 87.17798699115454), ('total', 10570), ('HasAns_exact', 79.10122989593188), ('HasAns_f1', 87.17798699115454), ('HasAns_total', 10570), ('best_exact', 79.10122989593188), ('best_exact_thresh', 0.0), ('best_f1', 87.17798699115454), ('best_f1_thresh', 0.0)])

3.6 一键运行

以上 3.3~3.6 的步骤也可以通过运行 cd magicmind_cloud/buildin/nlp/LanguageModeling/bert_squad_pytorch && bash run.sh 来实现一键执行

4.高级说明

4.1 export_model 高级说明

MagicMind Parser 模块在进行 PyTorch 模型转换前，需要确保 PyTorch 模型文件中带有权重和网络结构两部分数据。以下代码使用 torch.jit 和预训练好的权重数据生成带有权重及网络结构的 PyTorch 模型文件。

本示例中的 BERT 模型基于 transformers v3.1.0 中的 bert-base-cased(这不是官方权重，是寒武纪自己训练的权重)初始权重，其中 MAX_SEQ_LENGTH 为 384。

cd $PROJ_ROOT_PATH/data/models
git clone https://huggingface.co/linfuyou/bert-squad-training.git
cd $MODEL_PATH/bert-squad-training
rm pytorch_model.bin
wget https://huggingface.co/linfuyou/bert-squad-training/resolve/main/pytorch_model.bin

本例除 magicmind 容器中软件环境外，还依赖于 transformer v3.1.0。运行以下命令下载 transformer v3.1.0 源码并解压。

cd $PROJ_ROOT_PATH/export_model/
wget -c https://github.com/huggingface/transformers/archive/refs/tags/v3.1.0.zip
unzip -o v3.1.0.zip

安装 transformers

cd $PROJ_ROOT_PATH/export_model
pip install ./transformers-3.1.0

使用下面的代码导出 jit.trace 模型文件。

python $PROJ_ROOT_PATH/export_model/export.py --pt_model $PROJ_ROOT_PATH/data/models/bert_squad_pytorch_16bs_384.pt \
                                              --batch_size 16 \
                                              --max_seq_length 384

4.2 gen_model 高级说明

PyTorch bert_squad 模型转换为 MagicMind bert_squad 模型分成以下几步：

使用 MagicMind Parser 模块将 torch.jit.trace 生成的 pt 文件解析为 MagicMind 网络结构。
使用 MagicMind Builder 模块生成 MagicMind 模型实例并保存为离线模型文件。

参数说明:

pt_model: 转换后 pt 的路径。
output_model: 保存 MagicMind 模型路径。
quant_mode: 量化模式，如 force_float32，force_float16。
shape_mutable: 是否生成可变 batch_size 的 MagicMind 模型。
batch_size: 生成可变模型时 batch_size 可以随意取值，生成不可变模型时 batch_size 的取值需要对应 pt 的输入维度。
max_seq_length: max_seq_length。

4.3 infer_python 高级说明

本例使用 MagicMind PYTHON API 编写了名为 infer_python 的目标检测程序。infer_python 将展示如何使用 MagicMind PYTHON API 构建高效的 BERT_QA(图像预处理=>推理=>后处理)。 MagicMind 提供推理能力的类为 Engine 和 Context。其中一个 Engine 实例可使用一张 MLU 板卡。一个 Engine 实例可创建多个 Context 实例来向 MLU 下发任务。一个 Context 实例可使用一个 Queue 实例下发任务，同一个 Context 不能通过多个不同的 Queue 下发任务。多个 Context 实例可以通过同一个 Queue 实例下发任务。更多详细信息请参考《Cambricon-MagicMind-User-Guide》中编程模型章节。

参数说明：

device_id: 设备号。
magicmind_model: MagicMind 模型路径。
json_file: squadv1.1 数据集测试集 dev-v1.1.json 文件。
batch_size: 生成可变模型时 batch_size 可以随意取值，生成不可变模型时 batch_size 的取值需要对应 pt 的输入维度。
max_seq_length: max_seq_length。
compute_accuracy: 控制是否计算精度，默认 True。
output_dir: 输出文件路径。

5.精度和性能 benchmark

5.1 性能 benchmark 测试

本 sample 通过寒武纪提供的 Magicmind 性能测试工具 mm_run 展示性能数据。可变模型需要用户指定input_dims或batch_size。

#查看参数说明
mm_run -h
mm_run --magicmind_model $MM_MODEL --devices $DEV_ID --threads 1 --iterations 1000

或者通过一键运行 benchmark 里的脚本：

cd $PROJ_ROOT_PATH/benchmark
bash perf.sh

5.2 精度 benchmark 测试

一键运行 benchmark 里的脚本：

cd $PROJ_ROOT_PATH/benchmark
bash eval.sh

通过快速使用中 3.7 的脚本跑出 bert_squad 在 SQUAD 数据集上的精度如下：

Model	Quant_Mode	Batch_Size	exact	f1
bert_squad	force_float32	32	79.10	87.17
bert_squad	force_float16	32	79.09	87.16

6.免责声明

您明确了解并同意，以下链接中的软件、数据或者模型由第三方提供并负责维护。在以下链接中出现的任何第三方的名称、商标、标识、产品或服务并不构成明示或暗示与该第三方或其软件、数据或模型的相关背书、担保或推荐行为。您进一步了解并同意，使用任何第三方软件、数据或者模型，包括您提供的任何信息或个人数据（不论是有意或无意地），应受相关使用条款、许可协议、隐私政策或其他此类协议的约束。因此，使用链接中的软件、数据或者模型可能导致的所有风险将由您自行承担。

测试数据集 json 下载链接: https://rajpurkar.github.io/SQuAD-explorer/dataset/dev-v1.1.json
bert-base-cased 初始权重下载链接：https://huggingface.co/linfuyou/bert-squad-training/upload/main
transformer v3.1.0 实现源码下载链接：https://github.com/huggingface/transformers/archive/refs/tags/v3.1.0.zip

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

bert_squad_pytorch

bert_squad_pytorch

README.md

PyTorch-BERT 通过 MagicMind 适配和部署

目录

1.模型概述

2.前提条件

3.快速使用

3.1 环境准备

3.2 下载仓库

3.3 准备数据集和模型

3.4 编译 MagicMind 模型

3.5 执行推理

3.6 一键运行

4.高级说明

4.1 export_model 高级说明

4.2 gen_model 高级说明

4.3 infer_python 高级说明

5.精度和性能 benchmark

5.1 性能 benchmark 测试

5.2 精度 benchmark 测试

6.免责声明

Files

bert_squad_pytorch

Directory actions

More options

Directory actions

More options

Latest commit

History

bert_squad_pytorch

Folders and files

parent directory

README.md

PyTorch-BERT 通过 MagicMind 适配和部署

目录

1.模型概述

2.前提条件

3.快速使用

3.1 环境准备

3.2 下载仓库

3.3 准备数据集和模型

3.4 编译 MagicMind 模型

3.5 执行推理

3.6 一键运行

4.高级说明

4.1 export_model 高级说明

4.2 gen_model 高级说明

4.3 infer_python 高级说明

5.精度和性能 benchmark

5.1 性能 benchmark 测试

5.2 精度 benchmark 测试

6.免责声明