前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >清华开发出超高性能计算芯片:速度比高端GPU提升3000倍,能效提升400万倍!

清华开发出超高性能计算芯片:速度比高端GPU提升3000倍,能效提升400万倍!

作者头像
芯智讯
发布于 2023-11-01 10:46:49
发布于 2023-11-01 10:46:49
4300
举报
文章被收录于专栏:芯智讯芯智讯

随着各类大模型深度神经网络涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代AI芯片,已成为国际前沿热点。中国科协发布的2023重大科学问题中“如何实现低能耗人工智能”被排在首位。

2023年10月25日,清华大学团队在高性能计算芯片领域取得新突破。相关成果以“All-analog photo-electronic chip for high-speed vision tasks”为题发表在Nature 上。这枚芯片基于纯模拟光电融合计算架构,在包括ImageNet等智能视觉任务实测中,相同准确率下,比现有高性能GPU算力提升3000倍,能效提升400万倍

图1 相关论文(来源Nature

未来已来?光为载体的计算芯片

实现算力飞跃并非易事,特别是当前传统的芯片架构,受限于电子晶体管大小逼近物理极限。全新计算架构成为破局的关键。光计算以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算。面对以光速计算的诱人前景,数年来海内外知名科研团队相继提出多种设计,但要替代现有电子器件实现系统级应用,仍面临重大瓶颈:一是如何在一枚芯片上集成大规模的计算单元(可控神经元),且约束误差累计程度;二是实现高速高效的片上非线性;三是为兼容目前以电子信号为主体的信息社会,如何提供光计算与电子信号计算的高效接口。当前常见的模数转换功耗,较光计算每步乘加运算高出多个数量级,掩盖了光计算本身的性能优势,导致光芯片难以在实际应用中体现出优越性。

系统级算力和能效,超现有芯片万倍

为解决这一国际难题,清华大学团队创造性地提出了模拟电融合模拟光的计算框架,构建可见光下的大规模多层衍射神经网络实现视觉特征提取,利用光电流直接进行基于基尔霍夫定律的纯模拟电子计算,两者集成在同一枚芯片框架内,完成了“传感前 传感中 近传感”的新型计算系统。极大地降低了对于高精度ADC的需求,消除传统计算机视觉处理范式在模数转换过程中速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模集成、高效非线性、高速光电接口三个关键瓶颈

图2. 光电计算芯片ACCEL的计算原理和芯片架构(来源Nature

实测表现下,ACCEL芯片的系统级算力达到现有高性能芯片的数千倍。同时系统级能效达74.8 Peta-OPS/W,较现有的高性能GPU、TPU、光计算和模拟电计算架构,提升了两千数百万倍

在超低功耗下运行的ACCEL将有助于大幅度改善发热问题,对于芯片的未来设计带来全方位突破,并为超高速物理观测提供算力基础。同时对无人系统、自动驾驶等续航能力要求高的场景带来重大利好。

表1. ACCEL和现有高性能芯片的系统级实测性能指标对比(来源:Nature 非相干光直接计算

更进一步,ACCEL芯片还支持非相干光视觉场景的直接计算,如论文中演示的交通场景实验。显著拓展了ACCEL的应用领域,有望颠覆目前自动驾驶、机器人视觉、移动设备等领域先将图片拍摄并保存在内存中后进行计算的思路,避免传输和ADC带宽限制,在传感过程中完成计算。

图3. ACCEL可用于电子设备超低功耗人脸唤醒示意动图(来源:清华大学)

开辟新路径:颠覆性架构有望真正落地

清华攻关团队提出的新型计算架构不仅对于光计算技术的应用部署意义重大,对未来其他高效能计算技术与当前电子信息系统的融合,亦深有启发。

论文通讯作者之一,清华大学戴琼海院士介绍道,“采用全新原理研发出计算系统是一座大山,而将新一代计算架构真正落地到现实生活,解决国计民生的重大需求,是攀过高峰后更重要的攻关。”Nature杂志特邀在Research Briefing发表的该研究专题评述也指出,“或许这项工作的出现,会让新一代计算架构,比预想中早得多地进入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.”。

清华大学戴琼海院士、方璐副教授、乔飞副研究员、吴嘉敏助理教授为本文的共同通讯作者;博士生陈一彤、博士生麦麦提·那扎买提、许晗博士为共同一作;孟瑶博士、周天贶助理研究员、博士生李广普、范静涛研究员、魏琦副研究员共同参与了这项研究。

论文地址:https://www.nature.com/articles/s41586-023-06558-8

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-10-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 芯智讯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
go benchmark 性能测试
基准测试主要是通过测试CPU和内存的效率问题,来评估被测试代码的性能,进而找到更好的解决方案。
solate
2019/07/22
9.4K0
go测试
Go语言中的测试依赖go test命令。编写测试代码和编写普通的Go代码过程是类似的,并不需要学习新的语法、规则或工具。
PayneWu
2021/03/10
3710
go测试
1.Go语言项目性能调优实践
在计算机性能调试领域里 profiling 是指对应用程序的画像,画像就是应用程序使用 CPU 和内存的情况。
全栈工程师修炼指南
2022/09/29
3480
1.Go语言项目性能调优实践
Go 高性能系列教程之一:基准测试
要想改进程序的性能,首先要知道程序的当前性能。 本节主要关注使用 Go testing 包如何构建有用的基准测试,并且给出一些最佳实践以及常见的陷阱。
Go学堂
2023/01/31
7650
9.Go编程快速入门学习
描述: 日常开发中, 测试是不能缺少的. 通常国内的程序员都不太关注单元测试这一部分, 俗话说不写测试的开发不是好程序猿,我认为每一位开发者都应该了解 TDD(Test Driven Development-测试驱动开发),所以本章将主要介绍下在Go语言中如何做单元测试和基准测试。
全栈工程师修炼指南
2022/09/29
7220
9.Go编程快速入门学习
Go语言·我的性能我做主
对于一些服务来说,性能是极其重要的一环,事关系统的吞吐、访问的延迟,进而影响用户的体验。 写性能测试在Go语言中是很便捷的,go自带的标准工具链就有完善的支持,下面我们来从Go的内部和系统调用方面来详细剖析一下Benchmark这块儿。 Benchmark Go做Benchmar只要在目录下创建一个_test.go后缀的文件,然后添加下面函数: func BenchmarkStringJoin1(b *testing.B) { b.ReportAllocs() input := []st
李海彬
2018/03/19
1.2K0
Go语言·我的性能我做主
Golang基准测试
基准测试常用于代码性能测试,函数需要导入testing包,并定义以Benchmark开头的函数, 参数为testing.B指针类型,在测试函数中循环调用函数多次
仙人技术
2021/08/31
5880
Golang基准测试
Go 编程 | 连载 34 - Benchmark 基准测试
在 Go 编程 | 连载 33 - UnitTest 单元测试 中实现了 Go 的单元测试用例,单元测试的一般形式为:
RiemannHypothesis
2022/09/28
3470
golang 压力测试与并发安全测试
上一篇文章中,介绍了如何通过 go test 实现单元测试: 测试驱动开发与 golang 单元测试
用户3147702
2022/06/27
3.2K0
golang 压力测试与并发安全测试
Go语言基准测试(benchmark)三部曲之三:提高篇
-《Go语言基准测试(benchmark)三部曲》已近尾声,经历了《基础篇》和《内存篇》的实战演练,相信您已熟练掌握了基准测试的常规操作以及各种参数的用法,现在可以学习一些进阶版的技能了,在面对复杂一些的场景也能高效完成基准测试,另外还有几个坑也要提前了解,避免以后掉进去
程序员欣宸
2023/03/12
4110
Go语言基准测试(benchmark)三部曲之三:提高篇
Go语言基准测试(benchmark)三部曲之一:基础篇
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 关于基准测试(benchmark) Go的标准库内置的testing框架提供了基准测试(benchmark)功能,可以用来验证本地方法在串行或者并行执行时的基准表现,帮助开发者了解代码的真实性能情况,例如一个方法执行一次的平均耗时,还能看到内存分配的情况 关于Go语言基准测试(benchmark)三部曲 《Go语言基准测试(benchmark)三部曲》是欣
程序员欣宸
2023/02/13
1.8K0
Go语言基准测试(benchmark)三部曲之一:基础篇
golang性能测试及优化(上)
性能测试Benchmarks的用法和单元测试类似,也是用的testing,性能测试用*testing.B代替*testing.T
机械视角
2019/10/23
7900
Golang性能调优(go-torch, go tool pprof)
Go语言已经为开发者内置配套了很多性能调优监控的好工具和方法,这大大提升了我们profile分析的效率。此外本文还将重点介绍和推荐uber开源的go-torch,其生成的火焰图更方便更直观的帮我们进行性能调优。我也是在实际一次的性能调优中,接触到go-torch,非常棒。 go tool pprof简介 Golang内置cpu, mem, block profiler Go强大之处是它已经在语言层面集成了profile采样工具,并且允许我们在程序的运行时使用它们,使用Go的profiler我们能获取以下的样
Walton
2018/04/13
5.2K0
Golang性能调优(go-torch, go tool pprof)
Go高性能编程 EP5: 更精准的benchmark
当我们尝试去优化代码的性能时,首先得知道当前的性能怎么样,得到一个基准性能。Go语言标准库内置的 testing 测试框架提供了benchmark的能力。本文主要介绍 如何使用benchmark 进行基准测试,以及如何提高benchmark 的精准度,最后介绍了两个工具,帮助我们更加方便的进行benchmark。
萝卜要努力
2025/03/07
1170
Go高性能编程 EP5: 更精准的benchmark
Go 每日一库之 testing
testing是 Go 语言标准库自带的测试库。在 Go 语言中编写测试很简单,只需要遵循 Go 测试的几个约定,与编写正常的 Go 代码没有什么区别。Go 语言中有 3 种类型的测试:单元测试,性能测试,示例测试。下面依次来介绍。
用户7731323
2021/08/20
7750
Go每日一库之79:testing
testing是 Go 语言标准库自带的测试库。在 Go 语言中编写测试很简单,只需要遵循 Go 测试的几个约定,与编写正常的 Go 代码没有什么区别。Go 语言中有 3 种类型的测试:单元测试,性能测试,示例测试。下面依次来介绍。
luckpunk
2025/01/18
700
利用火焰图对 Go 程序进行性能分析
学会对应用系统进行运行时数据采集与性能分析是软件工程实践常用的基本技能。通常使用 profile 表示性能分析与采集,或者使用 profiling 代表性能分析这个行为。比如 Java 语言中相关的工具为 jprofiler,意为 Java Profiler。
aoho求索
2021/08/06
2.8K0
利用火焰图对 Go 程序进行性能分析
Go通过19:单元测试,确保高质量代码的秘诀!
您诸位好啊,我是无尘,今天我们进入到Go语言单元测试阶段,讲讲Go如何进行单元测试。
微客鸟窝
2021/08/18
5430
Go通过19:单元测试,确保高质量代码的秘诀!
你不知道的 Go 之 pprof
Go 有非常多好用的工具,pprof 可以用来分析一个程序的性能。pprof 有以下 4 种类型:
用户7731323
2021/06/25
1.2K0
你不知道的 Go 之 pprof
golang 使用pprof和go-torch做性能分析
    软件开发过程中,项目上线并不是终点。上线后,还要对程序的取样分析运行情况,并重构现有的功能,让程序执行更高效更稳写。 golang的工具包内自带pprof功能,使找出程序中占内存和CPU较多的部分功能方便了不少。加上uber的火焰图,可视化显示,让我们在分析程序时更简单明了。
lpxxn
2018/08/01
1.3K0
golang 使用pprof和go-torch做性能分析
相关推荐
go benchmark 性能测试
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档