8月7日,AMD正式发布了第二代 AMD EPYC (霄龙)系列处理器,最高搭载64颗采用7nm制造工艺的 “Zen 2”核心,带来了创纪录的性能表现和TCO(总体拥有成本)的降低,为众多企业级、云和高性能计算 (HPC)工作负载带来领先的性能。今天,小A带来AMD全球副总裁兼数据中心产品部总经理 Scott Aylor、AMD中国数据中心及嵌入式销售全球副总裁刘宏兵的分享,让大家进一步了解第二代EPYC(霄龙)背后的那些事。
AMD全球副总裁、数据中心总经理Scott Aylor
记者:之前看到有一组数据,AMD在服务器芯片的市场份额已经从2017年0.8%到2018年底的3.2%。第二代EPYC产品发布后,您对市场有没有一些期望或者一个量化的目标?
Scott Aylor:Lisu Su博士在今年的第一季度曾经做过一个公开的表述,提到我们的目标是在未来的几个季度实现双位数的市场份额。我们非常期待第二代EPYC(霄龙)处理器会成为我们市场份额增长的助力。
记者:中国云市场在全世界的云市场当中扮演越来越重要的角色,而且也发挥越来越大的作用,第二代AMD EPYC(霄龙)处理器如何在中国的云计算市场发挥作用,它的优势是什么?
Scott Aylor:我们能看到第二代AMD EPYC(霄龙)处理器在云端的机会是非常大的,因为第二代AMD EPYC(霄龙)处理器的核心非常多,意味着它可以去实现很多的虚拟机,相当于可以有能力去拥有很多的用户机,并以非常高的能效和经济实惠的方式来实现。所以第二代EPYC(霄龙)处理器为主要的云运营商提供了很好的总体拥有成本解决方案。我们非常期待,在中国的很多大型云服务商,甚至一些潜在的二线的云运营商,会对第二代AMD EPYC(霄龙)处理器感兴趣。
刘宏兵:如果您看中国的市场,会看到中国的互联网市场今天相对已经成熟,它不像过去那种依赖创新的模式迅速烧钱、迅速占领市场。今天,中国大量的互联网客户开始看TCO,看收益,大众也在看这些互联网公司的收益。所以,今天第二代AMD EPYC(霄龙)处理器在TCO方面的优势将越来越被大家重视。而不像过去,如果往前两三年,甚至四五年前,大量的互联网公司要速度,不计成本,但是今天大家越来越重视TCO,所以这方面正是第二代AMD EPYC(霄龙)处理器的优势所在。
记者:请问你如何看待第二代AMD EPYC(霄龙)处理器推出之后市场上的形势,第二代AMD EPYC(霄龙)处理器主要的优势是什么?
Scott Aylor:我们在市场上的势头不断增强,你可以从我们展示的各种数据、还有我们客户处得到的反馈中看到,我们的性能是非常强的,而且这不是我们自己的看法,是我们的合作伙伴的看法,所以认为我们是拥有很大竞争力的。
记者:第二代AMD EPYC(霄龙)处理器采用了Chiplet的设计,未来Zen 3架构的设计应该还会继续深化,但是任何一种设计都有它的局限性。随着核心增多以及性能提升,EPYC的设计局限在哪里?下一步,一些瓶颈和最需要突破的地方在哪里?比如延迟或者功耗等等。
Scott Aylor:事实上,因为Chiplet的设计主要是聚焦在内部互联Inter-Connect的技术上的,所以它相当于要通过内部互联的技术非常有效地进行I/O Die和计算Die(CCD,就是Core Complex Die)之间的数据高速传输。同时,它还要实现高能效,速度又非常快,所以对技术的要求越来越高,这方面的挑战是我们日后会一直聚焦的。
记者:AMD对于市场生态建设方面显然非常注重,昨天我们看到一整板(Ecosystem Wall)的合作伙伴的名单,感到非常的震撼,可以说几乎企业级的玩家都在用。这里面有云计算的巨头,包括服务器和软件的巨头。其实我们还关心的是,AMD在中国的服务器合作伙伴生态战略是怎样的?请问是如何来考量的?
Scott Aylor:说到服务器的生态系统,我们有全球的合作伙伴,也有很多中国的合作伙伴。除了您在生态系统展示墙(ecosystem wall)上所看到的跨国公司,我们还在非常努力支持和帮助中国的服务器厂商开发满足市场需求的服务器系统。所以我们的生态系统在持续壮大,不光有跨国企业,也有中国本土OEM的很多服务器设计在开发中。
刘宏兵:其实我觉得我们在中国的合作伙伴生态有两个方向,一是大家经常想到的是服务器厂商,本地的OEM。今天,我们还有很多全球性的ODM,这些ODM进来以后,在本地也会变成OEM,来制造服务器设备。另外一个方向是AMD与内存厂商、硬盘厂商、网卡厂商合作,比如说今天我们跟所有的支持PCIe 4.0的厂商合作,一起来构建生态系统。我们专注于做我们做得最好的领域,并且最好的成果与合作伙伴分享。
记者:我们看到传统的X86服务器市场在相应地放缓,OEM厂商、服务器厂商可能更多关注AI服务器这一块,包括联想和浪潮都有自己的产品。我想问一下,从第二代AMD EPYC(霄龙)处理器到未来的“米兰”,AMD如何通过这种硬件加软件协作优化的方式来帮助OEM厂商(尤其是服务器厂商)和客户获得更好的AI性能?
Scott Aylor:的确,AI现在是一个非常强有力的领域,而且它横跨很多行业领域。您可以看到AMD带来了很多的先进技术与能力,我们将第二代AMD EPYC(霄龙)处理器与极高性能的GPU相连接,适用于训练的应用场景(training scenario)。此配置同时都支持PCIe4.0,相当于把连接到GPU的带宽加倍了,从而可以对我们的机器学习和训练应用进行非常好的加速。在昨天的发布会上,我们展示了基于AMD平台的参考设计(reference design),它基于两个第二代AMD EPYC(霄龙)处理器的CPU,加上8个Radeon Instinct MI60 GPU,全部支持PCIe 4.0互联,可以极大加速机器学习的效能。未来,我们会将此参考设计提供给OEM。
记者:AMD对于单路服务器的看法是怎么样?因为从基础特性来看,无论是从对内存的支持数量,还是PCIe4.0的应用来看,其实AMD都是有计划在某些特定的市场里面用单路处理器,是从我们目前展示的跟合作伙伴的合作来看,大部分都是双路的,很少看到单路的,对于单路服务器市场以及这个理念,AMD有怎样的看法和预期?
Scott Aylor:事实上,我们看到在单路服务器方面,第一代AMD EPYC(霄龙)处理器在市场上有很好的采用度,而且单路服务器也非常适合广泛的网络(Web)技术领域,即那些不需要最高计算性能、用单路服务器即可满足需求的企业客户。那么,第二代AMD EPYC(霄龙)处理器服务器芯片有80项记录,其中有很大一部分比例的记录都是来自于单路服务器系统。所以说我们的单路服务器的性能是很棒的。
记者:我们看到了很多在功能上的创新及效能上的大幅进展,可不可以分享一下,您认为促使这些创新成功的主要原因是什么?
Scott Aylor:这主要靠我们工程研发团队的创新。在技术的展示部分里面,你看到技术团队的演讲,比如,昨天我们有一个架构的深度解析演讲,主要分享设计团队的一些心得。从Mark Papermaster的激情演讲,还有我们的架构师Mike Clark和Kevin Lepak的一系列演讲中,大家看到我们的工程团队是非常强的,他们非常有竞争力,所以他们希望一直往前推进,去制造最好的技术和产品。在AMD有很多人,他们有强烈的愿望要去赢,去帮助我们的合作伙伴和客户赢。
记者:我们看到最近两年在服务器处理器的核心数上面有相当大的增长,但是我们过去从服务器CPU的变化来看,从单核到双核、4核、再到4核以上的变化花了将近10年时间,但是最近这两年大家在比拼核心数量的增加、效能的翻倍。你怎么看为什么在最近这两年在核心数上面可以大量增加?是技术的影响、架构的更新和变革来推动的,还是有其它关键的因素?AMD是怎么样从16核到32核,到现在64核?技术突破点在哪里?有没有一些例子给我们说明一下。你觉得超多核心的设计会如何冲击未来服务器的发展?
Scott Aylor:从行业角度来看,核心数提升的一个原因是摩尔定律在变缓,在每一代产品都实现更快的性能变得更难,因为成本变的更昂贵。跟以前只提升主频不同,目前提升性能的主要方式是通过提升核心数,那么,提升核心数一定要跟软件的生态系统要紧密合作,要确保他们的软件应用能够非常好的利用到你所有的核心增长,使软件设计非常好的利用到核心密度,这样就可以实现非常好的软硬件的结合。就是说在硬件上可以去增加很多的核心,但是同时要跟软件的合作伙伴非常紧密地合作,让软件要能够识别这些核心的密度,并且充分利用到这些多核心的效能。
想了解更多第二代霄龙处理器,请访问:https://www.amd.com/zh-hans/processors/epyc-7002-series
领取专属 10元无门槛券
私享最新 技术干货