埃隆·马斯克和 xAI 团队完成了一项工程奇迹,在短短 19 天内搭建了一个拥有 10 万个 H200 Blackwell GPU 的超级集群。Nvidia 首席执行官黄仁勋与 Tesla Owners Silicon Valley 会员在 X 平台上分享了埃隆·马斯克如何展现出令人难以置信的安装能力的故事。
黄仁勋用敬畏与尊敬的口吻讲述了马斯克在 19 天内的壮举,称这一努力为“超人之举”。据称,xAI 团队从“概念”阶段到与 Nvidia 设备完全兼容只用了不到三周的时间。这期间,他们不仅建成了超级集群,还成功进行了 xAI 的首次 AI 训练。
从头到尾的整个过程不仅包括建设用于容纳这些 GPU 的巨大工厂,还涉及为整个工厂配备液冷和电力系统,使所有 20 万个 GPU 正常运作。此外,还需要协调 Nvidia 和埃隆·马斯克的工程团队,确保所有硬件和基础设施精准地运输和安装到位。
黄仁勋指出,普通的数据中心需要四年才能完成埃隆·马斯克和他的团队在 19 天内完成的工作。仅规划阶段就要花费三年,而最后一年则用于运输设备、安装并调试运行。
黄仁勋还详细解释了 Nvidia 硬件网络的复杂性。他指出,Nvidia 的设备网络连接与传统数据中心服务器的连接截然不同。“一个节点需要的线缆数量……电脑的后面全是线。”
埃隆·马斯克集成 10 万个 H200 GPU 的壮举“前所未有”(据黄仁勋所说),而且很可能在很长一段时间内都不会有其他公司能够复制这一壮举。
领取专属 10元无门槛券
私享最新 技术干货