作者 | 夕颜
出品 | AI科技大本营(ID:rgznai100)
导读:传闻已久的第三代英特尔至强可扩展处理器,终于在北京风光最美的4月份发布了。
北京时间4月7日晚,在著名的网红打卡地,百年老首钢工厂遗留下的工业建筑群——首钢园,英特尔新一代至强处理器面世。
代表着昔日辉煌的钢铁与未来希望的冬奥场地的首钢园,与老牌芯片厂商英特尔的气质不谋而合,地点选在这里,仿佛为这场发布会更添一层深意。
言归正传,发布会当天,除了第三代至强可扩展处理器(Ice Lake)之外,英特尔还推出了傲腾持久内存200系列、英特尔傲腾固态盘P5800X和英特尔®D5-P5316 NAND固态盘,以及英特尔以太网800系列适配器和全新的英特尔Agilex FPGA。
英特尔公司市场营销集团副总裁、中国区数据中心销售总经理 陈葆立展示第三代至强可扩展处理器(Ice Lake)
今天的重头戏当然还是Ice Lake处理器,废话不多所,先上大家关注的关键参数。
10nm,40核80线程
英特尔没有把它作为一款服务器产品推出,而是面向数据中心的处理器。针对云、企业、高性能计算、5G和边缘计算,英特尔对这款处理器进行了一些优化。
新一代至强处理器采用的是10nm工艺,每个第三代至强可扩展处理器上最多可达到40个核80线程,支持PCIe 4.0 64个通道,可以显著提高带宽和性能。
单纯从数字上看,Ice Lake与AMD不久前发布的霄龙三代相比似乎并不占优势,因为AMD上代就已经采用了7nm工艺,最高已达64核心128线程。
那么,是核心越多,就代表处理器约好用吗?对此,英特尔公司市场营销集团副总裁、中国区数据中心销售总经理陈葆立回应称,他们这次比的不是这个,而是要拼灵活性,也就是为客户提供最好的工具去解决工作负载。不管什么产品丢失为了解决问题,英特尔的生态和接下来要发布的一系列产品组合,以及在不同工作负载下的加速指令和配套产品,才是新一代至强平台的优势所在。
相较上一代,新一代至强处理器最多可达到40个核80线程,IPC与上一代20核的Cascade Lake相比提升20%,平均性能提升了46%。
重大架构调整带来性能提升
能够在性能上进步,也与新产品在架构上的大调整有关。与预料无差,Ice Lake搭配了新的Sunny cove架构以及缓存架构升级。
英特尔至强上一代处理器有六个内存通通道,内存速度最高可达2933,而这一代将达到八个内存通道和高达3200的内存速度,这为内存带宽密集型的应用程序提供了大量的提升空间,很多工作负载都可以利用这一点来进行改进。此外,Ice Lake的插槽间互连传输速度提高到了11.2GT/s,从IO角度来说,它也支持PCIe 4.0标准,这也是较上一代产品显著的升级。
英特尔技术专家还透露,Ice Lake在芯片计算、内存、IO、架构平衡四方面也都做了优化,比如在计算架构中加入了新的指令集,包括加密指令集、压缩和特殊的SIMD等,在缓存、内存&IO上进行时延和连续性优化等。
内核架构上,Ice Lake也对前端架构也进行了重大更改,减少代码占用,并扩展了处理器架构的宽度和深度,以减少内存的限制。此外内核的双线程之间的操作方式也得到了优化,特定核心也具备了之前的产品不具备的更大二级缓存优势,以实现更高的向量吞吐量。
三个独特功能
新一代处理器中,英特尔推出了一些独特的内置性能使得它具有了三个新的功能。
首先,在数据安全上,Ice Lake是英特尔第一个主流双插槽并启用SGX英特尔®软件防护扩展技术的数据中心处理器。SGX已经上市好几年了,但这是首次被应用到至强E平台,用户可以使用双插槽平台提高性能,保护敏感代码和数据,以增强数据安全性。此外还推出了英特尔®平台固件弹性技术,用于固件层的防御甚至恢复,以防止永久性的拒绝服务攻击。
第二,AI现在依然是英特尔的一个巨大的增长极,基于第三代至强可扩展处理器的性能,人工智能性能会更强。目前,至强仍然是行业内唯一一个内置AI加速的数据中心处理器,通过英特尔的深度学习加速技术加速,在Ice Lake和新一代的产品上,英特尔做了新的插槽优化和整体解决方案来充分利用至强内置加速器,以实现更好的性能提升。比如因为有内置的DL Boost功能,Ice Lake在研究图像识别的Mobilenet-v1、图像分类的ResNet-50、语言处理的BERT上,性能平均有45%-59%的提升。
第三,Ice Lake有内置英特尔®密码操作硬件加速,可以通过很多重要的加密算法,包括公钥对称加密、哈希法等让数据更加安全,同时建立一个安全内存区域,这些安全区域可以绕过操作系统和程序管理层,允许在不暴露任何基础设施平台的情况下对机密信息进行操作。
配套产品组合发布
除了新一代至强处理器,英特尔还发布了一系列配套解决方案,包括傲腾持久内存200系列、英特尔傲腾固态盘P5800X和英特尔®D5-P5316 NAND固态盘,以及英特尔以太网800系列适配器和全新的英特尔Agilex FPGA,聚焦于边缘网络、云、高性能计算、HPC和传统的企业工作负载。
下面简单介绍一下这些配套产品的关键数据:
英特尔技术专家表示,第一代傲腾内存的瓶颈其实主要在于宽带限制,所以第二代聚焦于宽带性能提升,相较第一代有了32%的提升,并增加了eADR来支持傲腾持久内存,这样应用程序就可以更持久地使用。
傲腾固态硬盘据称是世界上最快的数据中心SSD,可以针对缓慢的大容量存储,为存储提速。
英特尔的新一代以太网网络适配器可以做到每个适配器的网络数据吞吐量提高到最高200Gbps,支持RDMA协议(包括iWARP和RoCEv2版本)在内的多种传输协议,并内置了ADQ应用程序队列设备等特定功能。
英特尔在2019年就已经对外公开,并被视为另一个将带来新赋能的产品——Agilex FPGA,今天也终于露出庐山真面目。Agilex FPGA产品家族包括三个系列,F系列、I系列和M系列,现在,AGilex FPGA已经可以在前端平台中使用,并计划于今年开始生产。英特尔专家表示,他们在AGilex FPGA上进行了很多结构创新和平面图强化功能,并对底层架构进行改良,以支持机器化的可编程优化,搭配Quartus软件,可以优化整个设计的设置和保持时间。
总之,当将平台的组件,诸如傲腾持久内存、固态盘、以太网、PCle 4.0以及所有的软件优化工具等功能结合在一起的时候,就可以大幅提高性能。
正面与EPYC PK!
最后,英特尔技术专家还从架构、缓存和时延方面,将其与竞争对手AMD不久前刚发布的第三代EPYC(霄龙),来了一次正面PK。
如上图所示,可以看到Ice Lake的缓存时延有一定的优势,在L1、L2和L3 缓存中,面对最关键的是L3缓存时延问题,Ice Lake的解决方案是可以直接访问这一层的缓存,从而获得一致的响应时间和访问数据时间,而EPYC虽然有8个不同的计算硅芯片,每个芯片都有独立的缓存,如果数据在本地缓存中还好,响应时间会很短,但如果不在本地缓存中,实际上就需要请求通过IO硅芯片到另一个计算硅芯片上检索数据,再通过IO芯片回到发出申请的内核,这就会导致本地缓存访问和远程访问之间响应的时间差很多。从响应时间一致性上来说,由于Ice Lake的设计和架构都采用了统一的硅芯片方法,所以在这方面比竞品有一定的优势。
而在内存上,Ice Lake有8个内存通道,可以在最高的内存频率下运行两条DIMM,也就是3200。而EPYC虽然声称只有一个内存通道可以以最快的速度运行,但是当到第二个DIMM时,速度就会下降一些,进而降低内存的吞吐量。
此外,因为Ice Lake有直接内在控制器,其远程插槽性能更优,速度比对手快30%,且得益于英特尔的产品组合,Ice Lake的持久内存实现了每个插槽6TB的内存,在行业中领先。
除了内存、缓存和架构上等层面的对比,英特尔还用一张图总结了Ice Lake与EPYC的PK结果,感兴趣的同学可以仔细对比一下上图。
转型中的英特尔,能实现华丽转身吗?
经过一番关键参数的对比我们可以发现,英特尔毕竟还是一家老牌厂商,作为基石的CPU有着其独特的内置AI,特有的安全技术手段,以及多样化的产品组合,这些点是其他芯片厂商难以企及的,尤其是在半导体行业供应紧张的环境下,英特尔供应链的稳定性显得更加重要。
实际上据英特尔透露,在新品发布之前,第三代至强处理器已经发布了20多万颗,一定程度上证明了这款处理器的市场需求。另外,今年3月份,英特尔CEO帕特·基辛格宣布了“IDM 2.0”战略, 这个战略的主要目的,就是面向大规模制造的全球化内部工厂网络,提高供货能力,扩大采用第三方代工产能,并打造世界一流的代工业务英特尔代工服务(IFS),致力于让英特尔成为代工产能的主要提供商。供应和产品稳定性可以说是英特尔的关键竞争力之一,对于客户来说是一颗定心丸。
另外大家关注的7nm工艺相关计划,英特尔也在顺利开展,预计将在今年第二季度实现首款7纳米客户端CPU(研发代号“Meteor Lake”)计算晶片的tape in。
英特尔过去一年,其实一直在转型,想要从一家CPU公司转型为一个XPU平台,而“X”就代表了不同的产品。为了实现转型,英特尔也做了很多新的尝试,包括发布FPGA,推出Habana等AI加速芯片。在GPU领域,去年下半年英特尔推出了数据中心首款GPU SG1,就与腾讯在安卓云游戏上进行合作,希望开辟全新的工作负载和市场。
接下来,英特尔表示还会在XPU上推出更多不同的产品。转型中的英特尔,会实现华丽的转身吗?对此你怎么看?评论中告诉我们你的看法。