IT之家 7 月 23 日消息,阿布扎比科技控股集团 G42 近日宣布推出全球最快的超级计算机 Condor Galaxy-1 (CG-1),该计算机拥有 5400 万个核心,处理能力达到 4 exaFLOPS(IT之家注:每秒 4 百亿亿次),可用于训练最先进的人工智能模型。该计算机位于美国加州圣克拉拉,由美国人工智能公司 Cerebras 运营。
随着人工智能技术的发展,超级计算机的需求日益增长,许多企业需要借助超级计算机来训练自己的模型,一些公司如微软建设了昂贵的基础设施并将其出租给企业使用的服务。
总部位于阿布扎比的 G42 是一个科技领域的控股集团,旨在为未来世界创建基础设施,与各国和企业合作,实现其愿景。该公司正在建设 Condor Galaxy 系列超级计算机系统,以帮助解决当今人类面临的最大问题。
许多科技公司已经宣布建立由数千个图形处理单元(GPU)组成的巨大集群,这是人工智能模型的大脑。但 Cerebras 公司的首席执行官 Andrew Feldman 表示,“在数千个微型 GPU 上分发单一模型需要数十名具有稀有专业知识的人员花费数月时间。”
Feldman 和他在 Cerebras 的团队没有使用中央超级计算机,而是构建了一组互连的 AI 超级计算机,可以大大减少 AI 模型的训练时间。根据 Cerebras 的方法,建立生成式人工智能模型只需要几分钟时间,并且可以由一个人完成。
Condor Galaxy 系统的综合处理能力将达到 36 exaFLOPS,这在当今的计算世界中是空前的。
每台超级计算机都是 Condor Galaxy 系列超级计算机的核心,其中第一台已经于近日揭幕。Cerebras 公司组装了 64 个其旗舰产品 CS-2 人工智能处理器,组成了 CG-1 超级计算机。
AMD 公司的 EPYC 处理器核心为该系统提供动力,并拥有 5400 万个专为人工智能优化的计算核心,总体的片上内存容量达到了 82TB,各个 CS-2 系统间的带宽速率高达 388Tbps。
在 16 位计算下,该系统可以提供 4 exaFLOPS 的计算能力,这是目前世界上最快超级计算机速度的四倍。它可以用于训练 6000 亿参数模型,并可扩展到支持 100 万亿参数模型。作为对比,OpenAI 公司的 GPT-4 模型是使用 1.7 万亿参数训练的。
Cerebras 和 G42 还计划在 2024 年初在美国引入另外两台超级计算机,CG-2 和 CG-3,同时将 CG-1 作为云服务提供给客户。
CG-1 可以原生地处理 50000 个令牌,而无需任何特殊的软件库。在 CG-1 上编程完全不需要使用复杂的分布式编程语言,节省了在 GPU 上分配工作流的宝贵时间。
该超级计算机位于圣克拉拉的一个托管设施 Colovore,Cerebras 将根据美国法律运营,以确保该计算能力不会被敌对国家所利用。
G42 和 Cerebras 相信,最快的超级计算机将有助于应对医疗、能源和气候变化等挑战。
领取专属 10元无门槛券
私享最新 技术干货