由于人工智能推理或训练一般要用到单精度甚至半精度的数值计算能力、整型计算,多数超级计算机并不具备这些计算能力,因此去年便开始出现了聚焦于解决人工智能算力需求的人工智能超级计算机,它作为一种专用算力,被应用于人工智能推理或训练等领域。
日前,英伟达宣布与微软联手开发人工智能超级计算机,依托微软Azure云运行,通过数以万计的图形处理单元(GPU)、中央处理器(CPU)处理云中的密集人工智能计算工作。
人工智能遇见超级计算机,将会碰撞出怎样的火花?又会有哪些挑战?
相关人士表示:人工智能超级计算机对基础软件要求极高,这也是英伟达与微软合作的最大原因。人工智能超级计算机集群通过虚拟化和分布式加速训练,可以有效支撑超大规模人工智能模型DALLE2(基于文本来生成模型的模型)、CLIP(用文本作为监督信号训练可迁移的视觉模型)等的训练。
因此,人工智能超级计算机需要部署在云端,这样对用户而言,就可以将之当成一个普通计算机来使用。不过,由多台服务器组成的人工智能超级计算机在进行模型计算时,调度的数据规模将越来越大,对通信能力的要求也越来越高。
人工智能超级计算机给科学计算带来了巨大变革,尤其是数学方面复杂方程等方面求解的难题。对此,你是怎么看的呢?欢迎评论区留言~
领取专属 10元无门槛券
私享最新 技术干货