Skip to content

Latest commit

 

History

History

bert_squad_pytorch

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

PyTorch-BERT 通过 MagicMind 适配和部署

MagicMind 是面向寒武纪 MLU 的推理加速引擎。MagicMind 能将 AI 框架(Tensorflow,PyTorch,ONNX 等) 训练好的算法模型转换成 MagicMind 统一计算图表示,并提供端到端的模型优化、代码生成以及推理业务部署能力。

本 sample 探讨如何使用 MagicMind 来在寒武纪 MLU370 板卡上适配和部署 PyTorch-BERT 模型。

目录

1.模型概述

本示例中的 BERT 模型基于 transformers v3.1.0 中的bert-base-cased 初始训练权重,并在SQuADv1.1数据集上进行了 fine-turning。

其中 MAX_SEQ_LENGTH 为 384。下面将展示如何将该项目中 Pytorch 实现的 BERT 模型转换为 MagicMind 的模型。

2.前提条件

请移至主页面 README.md2.前提条件

3.快速使用

3.1 环境准备

请移至主页面 README.md3.环境准备

3.2 下载仓库

# 下载仓库
git clone 本仓库
cd magicmind_cloud/buildin/nlp/LanguageModeling/bert_squad_pytorch

在开始运行代码前需要先检查 env.sh 里的环境变量,并且执行以下命令:

source env.sh

3.3 准备数据集和模型

cd $PROJ_ROOT_PATH/export_model
#bash run.sh <batch_size> <max_seq_length>
bash run.sh 384

3.4 编译 MagicMind 模型

cd ${PROJ_ROOT_PATH}/gen_model
# bash run.sh <magicmind_model> <precision> <batch_size> <dynamic_shape> 
# 指定您想输出的magicmind_model路径,例如./converted_magicmind_model
bash run.sh ${magicmind_model} force_float32 1 true

3.5 执行推理

cd $PROJ_ROOT_PATH/infer_python
#bash run.sh <magicmind_model> <batch_size>
bash run.sh ${magicmind_model} 1

结果:

SQUAD results: OrderedDict([('exact', 79.10122989593188), ('f1', 87.17798699115454), ('total', 10570), ('HasAns_exact', 79.10122989593188), ('HasAns_f1', 87.17798699115454), ('HasAns_total', 10570), ('best_exact', 79.10122989593188), ('best_exact_thresh', 0.0), ('best_f1', 87.17798699115454), ('best_f1_thresh', 0.0)])

3.6 一键运行

以上 3.3~3.6 的步骤也可以通过运行 cd magicmind_cloud/buildin/nlp/LanguageModeling/bert_squad_pytorch && bash run.sh 来实现一键执行

4.高级说明

4.1 export_model 高级说明

MagicMind Parser 模块在进行 PyTorch 模型转换前,需要确保 PyTorch 模型文件中带有权重和网络结构两部分数据。 以下代码使用 torch.jit 和预训练好的权重数据生成带有权重及网络结构的 PyTorch 模型文件。

  1. 本示例中的 BERT 模型基于 transformers v3.1.0 中的 bert-base-cased(这不是官方权重,是寒武纪自己训练的权重)初始权重,其中 MAX_SEQ_LENGTH 为 384。
cd $PROJ_ROOT_PATH/data/models
git clone https://huggingface.co/linfuyou/bert-squad-training.git
cd $MODEL_PATH/bert-squad-training
rm pytorch_model.bin
wget https://huggingface.co/linfuyou/bert-squad-training/resolve/main/pytorch_model.bin
  1. 本例除 magicmind 容器中软件环境外,还依赖于 transformer v3.1.0。运行以下命令下载 transformer v3.1.0 源码并解压。
cd $PROJ_ROOT_PATH/export_model/
wget -c https://github.com/huggingface/transformers/archive/refs/tags/v3.1.0.zip
unzip -o v3.1.0.zip
  1. 安装 transformers
cd $PROJ_ROOT_PATH/export_model
pip install ./transformers-3.1.0
  1. 使用下面的代码导出 jit.trace 模型文件。
python $PROJ_ROOT_PATH/export_model/export.py --pt_model $PROJ_ROOT_PATH/data/models/bert_squad_pytorch_16bs_384.pt \
                                              --batch_size 16 \
                                              --max_seq_length 384

4.2 gen_model 高级说明

PyTorch bert_squad 模型转换为 MagicMind bert_squad 模型分成以下几步:

  • 使用 MagicMind Parser 模块将 torch.jit.trace 生成的 pt 文件解析为 MagicMind 网络结构。
  • 使用 MagicMind Builder 模块生成 MagicMind 模型实例并保存为离线模型文件。

参数说明:

  • pt_model: 转换后 pt 的路径。
  • output_model: 保存 MagicMind 模型路径。
  • quant_mode: 量化模式,如 force_float32,force_float16。
  • shape_mutable: 是否生成可变 batch_size 的 MagicMind 模型。
  • batch_size: 生成可变模型时 batch_size 可以随意取值,生成不可变模型时 batch_size 的取值需要对应 pt 的输入维度。
  • max_seq_length: max_seq_length。

4.3 infer_python 高级说明

本例使用 MagicMind PYTHON API 编写了名为 infer_python 的目标检测程序。infer_python 将展示如何使用 MagicMind PYTHON API 构建高效的 BERT_QA(图像预处理=>推理=>后处理)。 MagicMind 提供推理能力的类为 Engine 和 Context。其中一个 Engine 实例可使用一张 MLU 板卡。一个 Engine 实例可创建多个 Context 实例来向 MLU 下发任务。一个 Context 实例可使用一个 Queue 实例下发任务,同一个 Context 不能通过多个不同的 Queue 下发任务。多个 Context 实例可以通过同一个 Queue 实例下发任务。更多详细信息请参考《Cambricon-MagicMind-User-Guide》中编程模型章节。

参数说明:

  • device_id: 设备号。
  • magicmind_model: MagicMind 模型路径。
  • json_file: squadv1.1 数据集测试集 dev-v1.1.json 文件。
  • batch_size: 生成可变模型时 batch_size 可以随意取值,生成不可变模型时 batch_size 的取值需要对应 pt 的输入维度。
  • max_seq_length: max_seq_length。
  • compute_accuracy: 控制是否计算精度,默认 True。
  • output_dir: 输出文件路径。

5.精度和性能 benchmark

5.1 性能 benchmark 测试

本 sample 通过寒武纪提供的 Magicmind 性能测试工具 mm_run 展示性能数据。可变模型需要用户指定input_dims或batch_size。

#查看参数说明
mm_run -h
mm_run --magicmind_model $MM_MODEL --devices $DEV_ID --threads 1 --iterations 1000

或者通过一键运行 benchmark 里的脚本:

cd $PROJ_ROOT_PATH/benchmark
bash perf.sh

5.2 精度 benchmark 测试

一键运行 benchmark 里的脚本:

cd $PROJ_ROOT_PATH/benchmark
bash eval.sh

通过快速使用中 3.7 的脚本跑出 bert_squad 在 SQUAD 数据集上的精度如下:

Model Quant_Mode Batch_Size exact f1
bert_squad force_float32 32 79.10 87.17
bert_squad force_float16 32 79.09 87.16

6.免责声明

您明确了解并同意,以下链接中的软件、数据或者模型由第三方提供并负责维护。在以下链接中出现的任何第三方的名称、商标、标识、产品或服务并不构成明示或暗示与该第三方或其软件、数据或模型的相关背书、担保或推荐行为。您进一步了解并同意,使用任何第三方软件、数据或者模型,包括您提供的任何信息或个人数据(不论是有意或无意地),应受相关使用条款、许可协议、隐私政策或其他此类协议的约束。因此,使用链接中的软件、数据或者模型可能导致的所有风险将由您自行承担。