小模型推理方案:
ATC转换架构图:
ModelZoo-PyTorch指导文档:https://gitee.com/ascend/ModelZoo-PyTorch/blob/master/ACL_PyTorch/docs/README.md
参考链接:ONNX的导出
参考链接1:Onnx转Om
参考链接2:ATC工具介绍
参考链接:离线推理
export bs=24
onnxsim models/vit-b-16.txt.fp32.onnx models/vit-b-16.txt.fp32.bs${bs}.sim.onnx --overwrite-input-shape "text:${bs},512"
Simplifying...
Finish! Here is the difference:
┏━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━┓
┃ ┃ Original Model ┃ Simplified Model ┃
┡━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━┩
│ Add │ 122 │ 122 │
│ Cast │ 4 │ 1 │
│ Concat │ 48 │ 0 │
│ Constant │ 532 │ 207 │
│ ConstantOfShape │ 1 │ 0 │
│ Div │ 24 │ 24 │
│ Equal │ 1 │ 1 │
│ Erf │ 12 │ 12 │
│ Expand │ 1 │ 0 │
│ Gather │ 101 │ 2 │
│ LayerNormalization │ 25 │ 25 │
│ MatMul │ 97 │ 97 │
│ Mul │ 25 │ 25 │
│ Not │ 1 │ 1 │
│ Range │ 1 │ 0 │
│ Reshape │ 48 │ 48 │
│ Shape │ 99 │ 0 │
│ Softmax │ 12 │ 12 │
│ Sub │ 1 │ 1 │
│ Transpose │ 48 │ 48 │
│ Unsqueeze │ 99 │ 1 │
│ Model Size │ 392.3MiB │ 461.4MiB │
└────────────────────┴────────────────┴──────────────────┘
msit surgeon功能指导:链接
atc工具使用指导:链接
使用指导:链接
官方指导文档:链接
ais_bench使用安装:链接
推理执行:
torch_npu单算子推理:
开源样例 vs torch_npu适配版本
执行在线推理:
跑了一把cpu版本和npu版本,发现最后返回logits有差异,需要进一步做精度对齐分析。
torchair图模式推理:
参考modelzoo适配:链接
开源样例 vs torchair适配版本
执行推理:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。