前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >​为什么在Jetson Orin上使用DLA是必要的?

​为什么在Jetson Orin上使用DLA是必要的?

作者头像
GPUS Lady
发布2023-09-07 08:37:58
发布2023-09-07 08:37:58
1.1K0
举报
文章被收录于专栏:GPUS开发者GPUS开发者

关于DLA的基本知识:一篇文章回答你关于NVIDIA DLA的所有疑问

NVIDIA的DLA硬件是专门用于深度学习操作的固定功能加速器引擎。它旨在对卷积神经网络进行全硬件加速,支持各种层,如卷积、反卷积、全连接、激活、池化、批量归一化等。NVIDIA的Jetson Orin SoC最多支持2个第二代DLA(第二代DLA在功耗效率方面表现最佳),而Xavier SoC最多支持2个第一代DLA。

DLA软件包括DLA编译器和DLA运行时堆栈。离线编译器将神经网络图转化为DLA可加载的二进制文件,并可通过NVIDIA TensorRT™、NvMedia-DLA或cuDLA来调用。运行时堆栈由DLA固件、内核模式驱动程序和用户模式驱动程序组成。

更多详细信息,请参考DLA产品页面(https://developer.nvidia.com/deep-learning-accelerator)。

为什么在Orin上使用DLA是必要的?

  • DLA的峰值性能对Orin的总深度学习(DL)性能贡献在38%至74%之间(取决于电源模式,详见下表)。
  • DLA平均比GPU功耗效率高3倍至5倍(取决于电源模式和工作负载),下表显示了在JetPack 5.1.1下,根据不同的电源模式,基于Jetson AGX Orin 64GB的DLA相对于GPU的性能与功耗比率(仅考虑加速器的功耗,性能指标为每秒处理的图像数)。

注意:

  • Jetson AGX Orin 64GB在30W和50W功率模式下的DLA TOPs与用于汽车领域的DRIVE Orin平台的最大时钟频率相当。
  • Jetson Orin NX 16GB的最大DLA TOPs与Jetson AGX Orin 64GB的15W功率模式相当。

详细内容,请见:

https://github.com/NVIDIA/Deep-Learning-Accelerator-SW/tree/dla3.12.1#dla-performance-per-watt-power-efficiency

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档