首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

比脸还大!史上最大芯片问世!

面积达422.25平方厘米, 拥有1.2 万亿个晶体管,400000 个核心,片上内存18 Gigabytes,内存带宽19 PByte/s,fabric带宽100 Pbit/s。

这就是有史以来最大的芯片——Cerebras Wafer Scale Engine!

据外媒报道,美国加州的创业公司Cerebras发布了号称全球最大的芯片WSE,而且是专门为人工智能计算打造的。这款名为Wafer Scale Engine(WSE)的芯片拥有1.2万亿个晶体管,其数量是英伟达最新一代旗舰GPU Titan V的57倍。

这款虽然面积巨大(面积高达46,225平方毫米)但依然使用的是台积电16纳米制程工艺,其中包含400,000个核心,片上存储高达18G,功耗1.5万瓦(约等于6台电磁炉的功率),内存带宽9PB/秒,通信结构带宽100PB/秒。该公司表示,仅用一块这样的芯片即可驱动复杂的人工智能系统,从无人驾驶汽车到监控系统。

大多数芯片实际上是在12英寸硅晶片上创建的芯片集合,并在芯片工厂中批量生产。但Cerebras Systems芯片是在单个晶圆上互连的单芯片。这些互连设计使这些芯片全部保持高速运行状态,万亿个晶体管可以全部一起工作。

通过这种方式,Cerebras Wafer Scale Engine成为有史以来最大的处理器,它专门设计用于处理AI应用问题。该公司在本周在斯坦福大学举行的Hot Chips会议上讨论这款“世界最大”的芯片的设计。

Cerebras 表示,WSE 可以把处理复杂数据所需的时间从几个月缩短到几分钟。

「AI 模型训练时间的缩减将会消除这个行业进步的主要瓶颈,」Cerebras 首席执行官、创始人 Andrew Feldman 表示。他是一个芯片行业资深人士,此前曾将自创的一家公司以 3.34 亿美元的价格出售给 AMD。

目前,Cerebras 已在向少量用户提供这种芯片了,不过价格尚未透露。

巨型 AI 芯片真的可行?

芯片的大小在 AI 计算中至关重要,因为芯片越大,处理信息的速度越快,得出答案的时间也就越短。如果可以减少训练时间,研究者就可以尝试更多的想法、使用更多的数据去解决新问题。谷歌、Facebook、OpenAI、腾讯、百度以及其他科技巨头都表示,当今 AI 最大的问题是模型训练时间过长。减少训练时间可以克服整个行业的一大瓶颈。

当然,一般芯片厂商不会选择把芯片造那么大,这是因为,在单个晶片上,制造过程中往往会产生一些瑕疵。如果说一个瑕疵会导致芯片出现故障,那么几个瑕疵就会导致芯片报废。如果一个硅晶片上只有一个芯片,那么产生瑕疵的概率几乎是百分之百,而瑕疵会导致芯片报废。为了保证成品率,Cerebras 采用了冗余式的设计:如果有的核心出了问题,内部链接可以跳过坏掉的核心。这种方法大大降低了芯片的制造成本。

Cerebras Systems 的 CEO Feldman 表示,WSE 芯片着眼于 AI 从头进行设计,其中包含众多根本上的创新,通过解决数十年来限制芯片尺寸的问题(如 cross-reticle 连接、成品率、功率输送、封装)来提高性能。「每一个架构决策都是为了提高 AI 的性能。因此,WSE 芯片在有限的功耗和空间范围内,基于工作负载实现了数百甚至数千倍的性能提升。」

这些性能的提升是通过加速神经网络训练的每一部分来实现的。一个神经网络就是一个多级计算反馈回路。输入在回路中传递越快,该回路学习(训练)的速度就越快。加快输入传递速度可以通过加速回路中的计算和通信来实现。

WSE 的超大体积使其可以搭载更多用于计算的核以及更加接近核的内存,从而核可以高效运转。由于这个庞大的核阵列和内存都在一个芯片上,因此所有的通信都是在其上进行的,这意味着它的低延迟通信带宽是巨大的,所以核组的协作效率可以最大化。

这个 46225 平方毫米的硅芯片上有 40 万个 AI 优化的、无缓存、无开销的计算核以及 18GB 的本地、分布式、超高速 SRAM 内存,作为内存层次结构的唯一层次。内存带宽为每秒 9PB。这些核通过一个细粒度的、全硬件的、片上网状连接的通信网络连接在一起,提供每秒 100 PB 的总带宽。更多的核、更多的本地内存和低延迟的高带宽结构一起构成了加速 AI 工作的最佳架构。

Tirias Research 创始人兼首席分析师 Jim McGregor 在一份声明中表示:「虽然 AI 在一般意义上得到应用,但没有两个数据集或两项 AI 任务是相同的。新的 AI 工作负载不断涌现,数据集也持续增大。」

「随着 AI 的发展,芯片和平台解决方案也在不断发展。Cerebras WSE 是半导体和平台设计领域的一项惊人的工程成就,能够在单晶片规模的解决方案中提供媲美超级计算机的计算能力、高性能内存和宽带。」

这种面积的芯片,供电和冷却都是大问题,看起来水冷是必须的了。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190826A0OXV300?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券