Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >清华开发出超高性能计算芯片:速度比高端GPU提升3000倍,能效提升400万倍!

清华开发出超高性能计算芯片:速度比高端GPU提升3000倍,能效提升400万倍!

作者头像
芯智讯
发布于 2023-11-01 10:46:49
发布于 2023-11-01 10:46:49
4300
举报
文章被收录于专栏:芯智讯芯智讯

随着各类大模型深度神经网络涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代AI芯片,已成为国际前沿热点。中国科协发布的2023重大科学问题中“如何实现低能耗人工智能”被排在首位。

2023年10月25日,清华大学团队在高性能计算芯片领域取得新突破。相关成果以“All-analog photo-electronic chip for high-speed vision tasks”为题发表在Nature 上。这枚芯片基于纯模拟光电融合计算架构,在包括ImageNet等智能视觉任务实测中,相同准确率下,比现有高性能GPU算力提升3000倍,能效提升400万倍

图1 相关论文(来源Nature

未来已来?光为载体的计算芯片

实现算力飞跃并非易事,特别是当前传统的芯片架构,受限于电子晶体管大小逼近物理极限。全新计算架构成为破局的关键。光计算以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算。面对以光速计算的诱人前景,数年来海内外知名科研团队相继提出多种设计,但要替代现有电子器件实现系统级应用,仍面临重大瓶颈:一是如何在一枚芯片上集成大规模的计算单元(可控神经元),且约束误差累计程度;二是实现高速高效的片上非线性;三是为兼容目前以电子信号为主体的信息社会,如何提供光计算与电子信号计算的高效接口。当前常见的模数转换功耗,较光计算每步乘加运算高出多个数量级,掩盖了光计算本身的性能优势,导致光芯片难以在实际应用中体现出优越性。

系统级算力和能效,超现有芯片万倍

为解决这一国际难题,清华大学团队创造性地提出了模拟电融合模拟光的计算框架,构建可见光下的大规模多层衍射神经网络实现视觉特征提取,利用光电流直接进行基于基尔霍夫定律的纯模拟电子计算,两者集成在同一枚芯片框架内,完成了“传感前 传感中 近传感”的新型计算系统。极大地降低了对于高精度ADC的需求,消除传统计算机视觉处理范式在模数转换过程中速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模集成、高效非线性、高速光电接口三个关键瓶颈

图2. 光电计算芯片ACCEL的计算原理和芯片架构(来源Nature

实测表现下,ACCEL芯片的系统级算力达到现有高性能芯片的数千倍。同时系统级能效达74.8 Peta-OPS/W,较现有的高性能GPU、TPU、光计算和模拟电计算架构,提升了两千数百万倍

在超低功耗下运行的ACCEL将有助于大幅度改善发热问题,对于芯片的未来设计带来全方位突破,并为超高速物理观测提供算力基础。同时对无人系统、自动驾驶等续航能力要求高的场景带来重大利好。

表1. ACCEL和现有高性能芯片的系统级实测性能指标对比(来源:Nature 非相干光直接计算

更进一步,ACCEL芯片还支持非相干光视觉场景的直接计算,如论文中演示的交通场景实验。显著拓展了ACCEL的应用领域,有望颠覆目前自动驾驶、机器人视觉、移动设备等领域先将图片拍摄并保存在内存中后进行计算的思路,避免传输和ADC带宽限制,在传感过程中完成计算。

图3. ACCEL可用于电子设备超低功耗人脸唤醒示意动图(来源:清华大学)

开辟新路径:颠覆性架构有望真正落地

清华攻关团队提出的新型计算架构不仅对于光计算技术的应用部署意义重大,对未来其他高效能计算技术与当前电子信息系统的融合,亦深有启发。

论文通讯作者之一,清华大学戴琼海院士介绍道,“采用全新原理研发出计算系统是一座大山,而将新一代计算架构真正落地到现实生活,解决国计民生的重大需求,是攀过高峰后更重要的攻关。”Nature杂志特邀在Research Briefing发表的该研究专题评述也指出,“或许这项工作的出现,会让新一代计算架构,比预想中早得多地进入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.”。

清华大学戴琼海院士、方璐副教授、乔飞副研究员、吴嘉敏助理教授为本文的共同通讯作者;博士生陈一彤、博士生麦麦提·那扎买提、许晗博士为共同一作;孟瑶博士、周天贶助理研究员、博士生李广普、范静涛研究员、魏琦副研究员共同参与了这项研究。

论文地址:https://www.nature.com/articles/s41586-023-06558-8

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-10-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 芯智讯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
平板摄像头+算力搞定3D空间实时重建和理解,清华和禾多科技新成果入选CVPR 2022 Oral
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 仅仅需要一个平板电脑,就能实现3D空间的实时重建和理解了! 看,只要拿着平板电脑走一走,房间内的物体就能被实时重建、分割和识别出来,整个过程行云流水。 要知道,3D重建和语义理解,是机器人、自动驾驶、AR/VR等领域的关键共性技术,长期以来面临算法复杂度高,难以实时处理的挑战。 现在,只用一个小小的平板就搞定了。 这就是清华大学联合禾多科技提出的增量式稀疏卷积网络(INcremental Sparse Convolution,INS-Conv)。 在
量子位
2022/08/26
2240
平板摄像头+算力搞定3D空间实时重建和理解,清华和禾多科技新成果入选CVPR 2022 Oral
光子计算突然爆火!《自然》连发两篇论文,清华团队也有大动作——AI芯片的“光速革命”,这次真要来了?
昨天,科技圈被《自然》杂志刷屏了。同一期连发两篇光子计算的重磅论文——新加坡团队搞出个能玩《吃豆人》的光子AI芯片,美国公司把光子加速器延迟砍了500倍。国内也不甘示弱:清华的“太极”光芯片刚拿下国家大奖,上海曦智科技的光电计算卡已经能跑大模型了。
javpower
2025/05/30
680
光子计算突然爆火!《自然》连发两篇论文,清华团队也有大动作——AI芯片的“光速革命”,这次真要来了?
学术前沿丨清华团队打造光学人工智能,让《三体》中的计算机成为现实
以深度学习为代表的人工智能技术已在包括自动驾驶、医疗诊断、语音翻译等众多领域带来巨大的变革。随着深度学习算法的迅猛发展,人工神经网络规模的不断增大,迫切需要不断提升计算处理器的运算速度和能效。采用传统电子计算方式已经越来越难以满足未来人工智能对处理器计算性能的需求。近年来,基于光计算高速、低功耗、高并行的颠覆性优势,通过光电融合的方式构建光学神经网络与智能光电计算处理器已经成为国际信息技术前沿的热点研究领域。
脑机接口社区
2023/02/13
8400
2023年度中国半导体十大研究进展
2月5日,由中国科学院主管、中国电子学会和中国科学院半导体研究所主办的学术刊物《半导体学报》正式发布了2023年度“中国半导体十大研究进展”。
芯智讯
2024/02/06
3410
2023年度中国半导体十大研究进展
清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片
在开放世界中,智能系统不仅要处理庞大的数据量,还需要应对各种「长尾问题」,如自动驾驶中面临的突发危险、出入隧道的剧烈光线变化、夜间强闪光干扰等。在这类任务上,传统视觉感知芯片由于受到「功耗墙」和「带宽墙」的限制,往往面临失真、失效或高延迟的问题,严重影响系统的稳定性和安全性。
机器之心
2024/06/04
1540
清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片
戴琼海:深度学习遭遇瓶颈,全脑观测启发下一代AI算法
8月29日至30日,主题为“智周万物”的2020年中国人工智能大会(CCAI 2020)在位于江苏南京的新加坡·南京生态科技岛举办。
AI科技评论
2020/09/04
1.1K0
CNCC最火论坛干货:神经形态芯片与神经形态计算机
以深度学习为代表的人工神经网络是机器学习最重要的方法之一,在云端和终端都有非常广泛的应用。然而传统的CPU和GPU芯片在进行神经网络处理时遇到了严重的性能和能耗瓶颈。
新智元
2018/12/06
9010
戴琼海团队新作登上Nature:提出光电可重构计算模式,迈向AI新时代
4月12日,一篇题为“Large-scale neuromorphic optoelectronic computing with a reconfigurable diffractive processing unit”的论文登上Nature子刊《Nature Photonics》。
AI科技评论
2021/04/16
2.2K0
戴琼海团队新作登上Nature:提出光电可重构计算模式,迈向AI新时代
AI芯片浮出新玩家OURS,来者何人?新晋图灵奖得主华人弟子谭章熹
硅谷公司OURS,已经启动“回国”议程,准备持低功耗计算AI芯片开拓国内市场,这也是其低调创业一年后,首次浮出水面。
量子位
2018/07/24
1K0
AI芯片浮出新玩家OURS,来者何人?新晋图灵奖得主华人弟子谭章熹
清华校友陈怡然、杨越组队进军AI芯片市场,成立苹芯科技,最新Pre-A轮斩获近千万美元
明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 随着最新一轮融资的曝光,由清华校友杨越博士、陈怡然教授主导创立的苹芯科技,引起资本界和产业界的关注。 在最新一轮Pre-A轮融资中,其融资金额达到近千万美元,吸引了红点中国、红杉中国等多家投资机构的青睐,其中红杉中国更是连续两轮跟投。 创始团队也不简单,不仅有杜克大学陈怡然教授领衔,还集结系统架构方面多位顶尖人才: CEO杨越曾是美光科技首席系统架构师,创始人许振隆曾在台积电任职多年,章尧君曾开发多款 MRAM 商用芯片,拥有十余项关键专利。 这
量子位
2023/03/10
1.8K0
清华校友陈怡然、杨越组队进军AI芯片市场,成立苹芯科技,最新Pre-A轮斩获近千万美元
清华大学:神经形态的电光融合/时空融合图像传感器(NEOSTI)
分享一篇清华大学陈宏伟老师课题组的工作,原文链接是https://doi.org/10.21203/rs.3.rs-5770022/v1
光芯
2025/04/08
1040
清华大学:神经形态的电光融合/时空融合图像传感器(NEOSTI)
人均百万奖金,达摩院青橙奖结果揭晓:钟南山院士寄语,DenseNet作者黄高获奖
机器之心报道 编辑:蛋酱、泽南 「你们处在最好的时候,要记得把握机遇。」——颁奖嘉宾钟南山院士。 10 位青年科学家,每人 100 万人民币奖金。今天上午,阿里巴巴达摩院青橙奖第三届获奖名单正式揭晓。 在 20 进 10 的最终答辩环节之后,达摩院院长张建锋正式公布了本届达摩院青橙奖学者名单,分别为: 梁文华 国家呼吸研究所 杨诗武 北京大学 赵保丹 浙江大学 聂礼强 山东大学 姜宇 清华大学 冷静文 上海交通大学 何向南 中国科学技术大学 杜子东 中国科学院计算技术研究所 邓岳 北京航空航天大学 黄高
机器之心
2023/03/29
9630
人均百万奖金,达摩院青橙奖结果揭晓:钟南山院士寄语,DenseNet作者黄高获奖
清华出品:最易懂的AI芯片报告!
2010 年以来, 由于大数据产业的发展, 数据量呈现爆炸性增长态势,而传统的计算架构又无法支撑深度学习的大规模并行计算需求, 于是研究界对 AI 芯片进行了新一轮的技术研发与应用研究。 AI 芯片是人工智能时代的技术核心之一,决定了平台的基础架构和发展生态。
数据派THU
2018/12/24
1.5K0
清华伯克利造出机械小强:承重200万倍踩不死,跑得和真蟑螂一样快
还真有人仿造成功了,最新的一期Science Robotics,就发表了这样一个打不死、压不扁的小强机器人。外媒IEEE Spectrum在报道时,甚至用了“惊人”(surprisingly)一词。
量子位
2019/08/05
5060
清华伯克利造出机械小强:承重200万倍踩不死,跑得和真蟑螂一样快
7大AI技术发展趋势-基于2024全国高性能计算学术年会日程的分析
科学计算智能化:多个报告(如中科院计算所的超算生物模拟、崂山实验室的海洋模型)显示AI正深度嵌入气候预测、生物计算等传统科学领域,通过机器学习优化模拟精度,解决复杂系统问题。多个分论坛都提到了AI和大模型的应用,比如“人工智能增强的全球公里级分辨率气候模拟”和“大模型与科学智算联合驱动的电网运行体系初探”。这说明AI在科学计算和工程模拟中的应用越来越广泛,尤其是在处理复杂系统和大数据时,AI技术能够提升模拟的精度和效率。
AIGC部落
2025/02/26
1802
7大AI技术发展趋势-基于2024全国高性能计算学术年会日程的分析
清华芯片研究再获顶会MICRO加持:软件定义芯片团队出品,最佳论文提名后又一突破
杨净 发自 凹非寺  量子位 报道 | 公众号 QbitAI 最近,第53届国际微架构大会(MICRO)在线上顺利召开。 作为计算机体系结构四大顶级会议,清华大学魏少军、刘雷波团队有两篇入选该会议论文。 这是该团队既去年斩获MICRO 2019最佳论文提名后,在体系结构顶级会议上的又一重要突破。 在会议上,他们做了两篇学术报告。 分别为: Constant-time Alteration Ternary CAM with Scalable In-Memory Architecture 一种基于可扩展存内架
量子位
2023/03/10
4790
清华芯片研究再获顶会MICRO加持:软件定义芯片团队出品,最佳论文提名后又一突破
国内最新量子计算机真机亮相!求解加速超100倍,创始团队来自清华中科院等
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 国内量子计算,迎来重大新进展! 首台100量子比特相干光量子计算机正式发布。 它能解决最高超过100个变量的数学问题。 和经典优化算法相比,求解速度平均加速超100倍; 平均求解结果优于经典算法的120%。 举例来说,计算Mobius的最大割有148个,只需0.3毫秒就搞定了,比眨一下还快。 这就是来自玻色量子的量子计算机——“天工量子大脑”。 5月16日,玻色量子举办了2023年首场新品发布会,直接把自家量子计算机抬到现场,完成对外亮相。 发布会不
量子位
2023/05/19
2900
国内最新量子计算机真机亮相!求解加速超100倍,创始团队来自清华中科院等
人均300万,哈工大高会军、浙大周昆等50人获奖,2021年科学探索奖名单公布
机器之心报道 机器之心编辑部 刚刚,2021 年「科学探索奖」获奖名单正式公布:浙江大学教授周昆、哈尔滨工业大学教授高会军等 50 位青年科学家获奖,他们每人将在未来 5 年内获得腾讯基金会总计 300 万元的奖金,并可自由支配奖金的使用。 「科学探索奖」由腾讯基金会发起人马化腾,与北京大学教授饶毅,携手杨振宁、毛淑德、何华武、邬贺铨、李培根、陈十一、张益唐、施一公、高文、谢克昌、程泰宁、谢晓亮、潘建伟等科学家,于 2018 年 11 月 9 日共同发起设立。项目启动资金为 10 亿元人民币。 它的资助范
机器之心
2023/03/29
5240
人均300万,哈工大高会军、浙大周昆等50人获奖,2021年科学探索奖名单公布
清华天眸芯登Nature封面!世界首个类脑互补视觉芯片问世,或开辟AGI新路
这是一种基于视觉原语的互补双通路类脑视觉感知新范式,标志着我国在类脑计算和类脑感知两个重要方向,取得的重大突破!
新智元
2024/06/05
1740
清华天眸芯登Nature封面!世界首个类脑互补视觉芯片问世,或开辟AGI新路
人工智能的另一方向:基于忆阻器的存算一体技术
过去的十年以深度神经网络为代表的人工智能技术深刻影响了人类社会。但深度神经网络的发展已经进入瓶颈期,我们仍处于弱人工智能时代。如何更近一步,跨入强人工智能,敲击着每一位智能研究者的心。
AI科技评论
2020/05/14
1K0
人工智能的另一方向:基于忆阻器的存算一体技术
推荐阅读
平板摄像头+算力搞定3D空间实时重建和理解,清华和禾多科技新成果入选CVPR 2022 Oral
2240
光子计算突然爆火!《自然》连发两篇论文,清华团队也有大动作——AI芯片的“光速革命”,这次真要来了?
680
学术前沿丨清华团队打造光学人工智能,让《三体》中的计算机成为现实
8400
2023年度中国半导体十大研究进展
3410
清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片
1540
戴琼海:深度学习遭遇瓶颈,全脑观测启发下一代AI算法
1.1K0
CNCC最火论坛干货:神经形态芯片与神经形态计算机
9010
戴琼海团队新作登上Nature:提出光电可重构计算模式,迈向AI新时代
2.2K0
AI芯片浮出新玩家OURS,来者何人?新晋图灵奖得主华人弟子谭章熹
1K0
清华校友陈怡然、杨越组队进军AI芯片市场,成立苹芯科技,最新Pre-A轮斩获近千万美元
1.8K0
清华大学:神经形态的电光融合/时空融合图像传感器(NEOSTI)
1040
人均百万奖金,达摩院青橙奖结果揭晓:钟南山院士寄语,DenseNet作者黄高获奖
9630
清华出品:最易懂的AI芯片报告!
1.5K0
清华伯克利造出机械小强:承重200万倍踩不死,跑得和真蟑螂一样快
5060
7大AI技术发展趋势-基于2024全国高性能计算学术年会日程的分析
1802
清华芯片研究再获顶会MICRO加持:软件定义芯片团队出品,最佳论文提名后又一突破
4790
国内最新量子计算机真机亮相!求解加速超100倍,创始团队来自清华中科院等
2900
人均300万,哈工大高会军、浙大周昆等50人获奖,2021年科学探索奖名单公布
5240
清华天眸芯登Nature封面!世界首个类脑互补视觉芯片问世,或开辟AGI新路
1740
人工智能的另一方向:基于忆阻器的存算一体技术
1K0
相关推荐
平板摄像头+算力搞定3D空间实时重建和理解,清华和禾多科技新成果入选CVPR 2022 Oral
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档