首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

​【技术解读】Zen5架构升级了什么?AMD技术大佬手把手给你讲明白

7月9日~7月10日,AMD在美国洛杉矶举办了AMD 2024 Tech Day技术沟通会,进一步公布了Ryzen AI 300系列移动处理器、锐龙9000台式机处理器以及Zen5架构、第三代Ryzen AI引擎、RDNA3.5架构的技术细节。而大家最关心的Zen5架构部分,更是由AMD首席技术官及执行副总裁Mark Papermaster以及AMD“架构之父”首席架构师Michael Clark进行了详细的讲解,我们受邀参加了这次会议,也为大家带回来了丰富的一手技术资料。

全面升级的Zen5架构带来IPC的起飞 

整体来说,Zen5架构的升级包括了四大方面。第一,每个周期可以处理更多的指令;第二,分发和执行带宽得到了提升;第三,将缓存数据带宽翻倍;第四,提供AI加速。

前端部分,在指令取/解码的升级方面,Zen5架构带来了双管道获取以及高级分支预测。分支预测拥有了更低的延迟、更高的准确度与吞吐量;指令缓存响应速度与带宽都得到了提升;提供双解码管道。

执行部分,整数执行的升级主要包括了更宽的分发与执行,提供了8个单位宽度的获取/退出,拥有6个ALU,包含3个乘法器,具备更多的统一架构ALU调度器和更大的执行窗口。

浮点/矢量计算单元的执行部分,Zen5架构提供了512位的AI数据通路,支持满血512bit数据通路的AVX-512加速,拥有6流水线/双周期延迟的浮点加法器,可以发送更大数量的浮点运算指令。

载入和存储部分,Zen5架构提升了数据带宽。它拥有48KB的12路一级数据缓存,提供4周期载入;一级缓存与浮点单元的最大带宽得到了翻倍;提升了数据预取效率。

总而言之,就算普通玩家看不明白那么多专业术语,光是从图上也能看到Zen5对于处理器架构的各个部分都进行了升级,所有这些升级都是以提升IPC和执行效率为目标,这也意味着就算频率不变,Zen5的性能也会高出上代不少。 

架构升级带来IPC大幅提升

那么经过四大方面的升级之后,Zen5架构相对Zen4有多大的IPC提升呢?AMD官方给出了对比的数据。从图中可以看到,13项测试中,Zen5最低领先了10%,最高领先幅度达到35%,平均下来大约在16%左右。这13项测试包含了游戏、视频转码、网页应用、3D渲染输出和基准测试,覆盖面也比较广,比较有代表性。

而在数学计算加速单元方面,Zen5的提升更是巨大。和Zen4相比,Zen5单核机器学习性能暴增32%,单核AES-XTS计算也剧增35%之多。

当然,除了锐龙9000之外,采用Zen5架构的AMD处理器还有Ryzen AI 300系列移动处理器和第五代AMD EPYC服务器处理器(将在2024下半年上市),其中Ryzen AI 300系列移动处理器不但采用了Zen5架构,还内置了第三代Ryzen AI引擎的NPU,为用户提供了进入AI PC时代的全能解决方案。第五代AMD EYPC服务器处理器则最多可提供192核384线程,采用领先业界的4nm与3nm制程工艺打造。

RDNA 3.5架构再次拉高内置GPU性能天花板

除了Zen5架构,AMD这次也把GPU架构更新到了RDNA 3.5。大家对于Zen4架构的锐龙7040/8040/8000G处理器内置的RDNA 3集显肯定印象深刻,毕竟它在桌面平台上的性能表现已经超越了GTX 1650独显。而RDNA 3.5这次又在RDNA 3基础上进行了三大提升。第一,优化了每瓦性能,提高了执行很多常见图形着色操作的能效比;第二,优化了每位宽性能,减少了访问显存的操作,提升了能效比;第三,针对更长的续航进行了设计,升级了GPU内置的高级电源管理,节约了激活状态下的功耗。很明显,作为移动处理器内置的GPU,RDNA 3.5将升级能效摆在了第一步是最合理的,如此一来不但可以大幅提升笔记本的续航能力,也能在有限散热条件下发挥出更强大的性能。

具体到性能指标方面,RDNA 3.5相对上代提供了双倍的材质采样率,在最常见的材质采样操作部分,现在可以在常见游戏中提供双倍的采样速率。同时,RDAN 3.5相对上代还提供了双倍的插值率和比较率,因此在大多数插值率和比较率的富向量标准中,现在可以实现双倍着色操作率。此外,RDNA 3.5也优化了显存管理,减少了显存访问量,采用了更好的压缩技术,减少了工作负载,优化了LPDDR5内存访问。

从量化的数据来看,在同为15W TDP设定的情况下,代号Strix Point的Ryzen AI 300系列的3DMark TimeSpy得分高达3462,相对上代Hawk Point提升了32%之多,Night Raid得分也提升了19%。由此可见未来搭载Ryzen AI 300处理器的轻薄本不管是游戏性能还是续航都会得到极大的提升。

考虑到目前Windows掌机的处理器TDP最高可解锁到33W,其TimeSpy得分也没有达到3400分,而Ryzen AI 300处理器则可以15W TDP实现如此高的分数,这就意味着未来采用Ryzen AI 300处理器的掌机在续航和游戏性能方面也都会有长足的进步。

最后简单总结一下,首先,Zen5架构带来了巨大的性能提升,而这个架构会全面应用到桌面、移动平台和服务器上,从而开启性能大升级的Zen5时代;其次,代号Granite Ridge的锐龙9000会成为桌面平台的性能标杆,而代号Strix Point的Ryzen AI 300系列移动处理器则是高能效计算的标杆;最后,RDNA 3.5着重优化了能效比,以至于在Ryzen AI 300中可以放下更多的CU单元,这也让16个CU的Radeon 890M成为集显的新一代标杆,千元独显已经难望其项背。

写在最后 

细心的玩家可以发现,AMD Zen5这一代的架构升级是CPU+GPU+NPU全面升级,得益于架构和制造工艺的升级,采用Zen5架构的锐龙9000系列、Ryzen AI 300系列甚至是下半年上市的第五代EPYC都可以得到极大的性能提升。而对于今年最重头的AI PC之星Ryzen AI 300系列来讲,Zen5/Zen5C+RDNA 3.5+XDNA2架构的配置可以说是全面升级的代表了,集中如此多的先进架构为Ryzen AI 300带来了标杆级的性能与能效比,更是为三位一体的全能AI加速提供了强大的引擎。那么,这次AMD手里有了那么多王牌,今年下半年的核心硬件平台必然会更加精彩。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OvUFci7EikqJh8zOq7RVIBdQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券