本报讯(记者 董鲁皖龙)随着各类大模型和深度神经网络涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代AI芯片已成为国际前沿热点。清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度智能光计算架构研制全球首款大规模干涉衍射异构集成芯片“太极”(Taichi),实现160TOPS/W的通用智能计算。该研究成果于北京时间4月12日发表在最新一期的《科学》上。
光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算,以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。然而其计算任务局限于简单的字符分类、基本的图像处理等。其痛点是光的计算优势被困在了不适合的电架构中,计算规模受限,无法支撑急需高算力与高能效的复杂大模型智能计算。
据论文第一作者、电子系博士生徐智昊介绍,在“太极”架构中,自顶向下的编码拆分—解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式“大感受野”浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。
团队以周易典籍“易有太极,是生两仪”为启发,建立干涉—衍射联合传播模型,融合衍射光计算大规模并行优势与干涉光计算灵活重构特性,将衍射编解码与干涉特征计算进行部分/整体重构复用,以时序复用突破通量瓶颈,自底向上支撑分布式广度光计算架构,为片上大规模通用智能光计算探索了新路径。
据了解,“太极”光芯片具备879TMACS/mm^2的面积效率与160TOPS/W的能量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。“太极”光芯片有望为大模型训练推理、通用人工智能、自主智能无人系统提供算力支撑。
《中国教育报》2024年04月16日第3版
作者:记者 董鲁皖龙
领取专属 10元无门槛券
私享最新 技术干货