首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Alphawave Semi的CPO报告(二):CPO的应用

Alphawave Semi的CPO报告(二):CPO的应用

作者头像
光芯
发布于 2025-04-08 13:08:58
发布于 2025-04-08 13:08:58
2171
举报
文章被收录于专栏:光芯前沿光芯前沿

搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景、机遇与挑战以及光/电/封装的协同优化。以下为第二部分的翻译。

共封装光学器件的一个主要应用场景是在ASIC与光学器件的接口方面。比如说有一个很大的专用集成电路,它承担着大量的工作,可能是网络芯片、图形处理器、人工智能加速器,或者就是一个通用处理器等等,总之这是一个进行大量数据运算的大型数字芯片,因此它需要巨大的输入输出总带宽,而且这个带宽需求还在不断增长。实际上,如果我们开始讨论要给这个芯片每秒输入输出 100 Tbps、200 Tbps的数据,那能给这个专用集成电路提供的连线数量是有限的,在这方面取得的进展非常有限,我们不能依赖这种方式。而且数据速率在不断提高,每条通道每秒达到 100 Gbps、200 Gbps,在这么高的数据速率下,仅仅是让数据穿过封装,再沿着封装厚度向下传输到电路板上,都变得很麻烦了。所以想法就是把这些微型光电转换器、光学引擎直接集成到封装顶部,以此减少一些损耗,这就是共封装光学器件的大致情况,但实现它有很多不同的方式,有很多种排列组合。

有一种乍一看很不错且备受关注的方式,有人说,好吧,我们把所有的收发器电路都放到专用集成电路上,然后假定用硅光子学技术在这些单独的小芯片上进行光电转换,再把它们一起封装。但问题是,这给专用集成电路带来了沉重负担,因为它是一个进行大量数据运算的芯片,需要用非常先进的nm级 CMOS 技术来实现,而现在却要求这个芯片还要容纳一堆带宽高达数十GHz的放大器,可这些技术原本不是用来做这个的,这就要求它做很多额外的工作,然后又回到我之前提到的情况了,就是要把芯片的一半资源都花在处理输入输出上,所以采用这种方式的系统并不多。

相反,我们可以再次利用Chiplet,让ASIC专注于它擅长的计算、存储等工作,把射频电路转移到这些黑色条状的小芯片上,它们就像是专用集成电路和硅光子学之间通过光电转换进行连接的纽带。这再次体现了小芯片设计范式的优势,这样做不仅能为专用集成电路腾出空间用于更多的存储和计算,还能针对这些放大器使用专门的工艺,比如低制程的 CMOS 工艺或者其他更适合放大器的工艺。

另一种做法是更进一步,就是把其他一些收发器电路也放到这里,我要尽量保留中间的专用集成电路,这只是我画的一个示意图,但想象一下中间的专用集成电路仍然很大,只是不太成比例了,尽量把这个芯片留给存储和计算功能,把所有与在封装内外传输数据相关的部分都放到这些小芯片上,这是另一种重要的做法。整个基于DSP的收发器都放在这些小芯片上,这里仍然需要某种芯片间接口,比如可以依靠新的 UCie 标准或者类似的标准来将数据传输到小芯片上,然后在小芯片上具备所有用于确保稳健光链路所需的均衡、数据转换器以及其他功能,还有放大器也放在这里。这样做会产生一些Tradeoff,因为现在这个芯片变得更复杂了,上面既有模拟部分又有数字部分,但好处是它能为主专用集成电路腾出尽可能多的面积用于数字计算和存储。

最后一种情况,就是利用硅光子的光电集成例如GF的 45 nm CMOS 加硅光子学技术就是一个例子。这为系统优化提供了另一个调节手段,把一些电路放到这个硅光子学芯片上,比如有一堆用于调节光学器件并确保其在不同温度等条件下都能稳定运行的控制电路,也许其中一部分可以集成到这个硅光子学芯片上。所以大家可以看到有各种各样的权衡取舍,我认为这很好地展示了小芯片设计范式以及它所带来的创新自由度,最优解决方案很可能取决于最终应用场景,我只是试着强调了其中的一些权衡因素,不过我要说,目前大多数正在研究以及重点研发的实际系统都属于上述的 B 和 C 类情况。

我想说,共封装光学器件最简单的解决方案基本上就是把人们目前在电路板边缘进行光电转换的功能拿过来,只是把它小型化,也许硅光子学技术或者Chiplet共封装设计范式能帮你做到这一点,就是把它缩小然后塞进封装里。但问题是,这样做除了让东西变小之外,并没有真正起到别的作用,如果你真的只是把面板上同样的功能、同样的数字信号处理模块原封不动地塞进封装里,实际上并没有节省功耗,反而把功耗集中到了更小的体积内,可能会让过热问题变得更严重,所以这种方法现在很大程度上已经被摒弃了,人们更倾向于另外几种我已经提到过的方法,我想在这里再详细介绍一下它们。

一种是所谓的直接驱动共封装光学器件。这里有一个Chiplet组合,比如说这里是主专用集成电路,其意图是让这个大的专用集成电路承载所有用于处理发送和接收功能的电路,除了最后那一层与光电直接接口的放大器之外,所以这被称为直接驱动,因为除了这些放大器之外,主专用集成电路或多或少是直接驱动光学器件的,这些只是很简单的模拟电路。这在很大程度上依赖于集成在专用集成电路上的电路,但好处是它允许灵活的封装选择,这很重要,想象一下,现在你把所有需要的东西都放在那个专用集成电路里了,你就又可以利用小芯片设计范式了,你可以想,也许我可以在这个应用里换不同的光学器件,同样的专用集成电路都能与之配合,也许在某个应用里我只需要短距离传输,用电链路就能搞定,那我就不用花钱买这些额外的光电元件和小芯片了,这样能让专用集成电路更灵活,使其能够应对更多不同的情况,但这里也有个挑战,就是需要更多的电路,而且这会限制数据进出芯片的密度,因为在专用集成电路上有相对较大且复杂的收发器。

另一种是被称为数字驱动共封装光学器件的方式。它指的是利用一种非常密集、低功耗、引脚数少的芯片间接口,通常是并行的更多连线,并且以较低的数据速率运行,这样就能使用更简单、功耗更低的电路,能够在两个芯片之间传输更大的总带宽,同时在主专用集成电路上占用更少的面积,所以能为主芯片腾出更多面积用于计算和存储,也能减少其功耗占用。这样在专用集成电路上看起来更优化,但有了这种芯片间收发器,传输距离也就只有一两毫米左右,所以这更像是一种定制化的解决方案,需要将其与另一侧有匹配芯片间接口的小芯片相结合,然后原本集成在专用集成电路上的基于DSP的收发器就被转移到这个小芯片上了。所以这是另一种范式,在专用集成电路上功耗低、面积小,而且能实现进出专用集成电路芯片的高带宽密度,但它也带来了其他一些挑战。所以到底哪种方式更好,还是要取决于具体应用场景。

那么我们现在看到共封装光学器件在哪些地方得到实际应用了呢?目前用量最大的一些应用其实还不是在这些大型芯片里,而是在可插拔模块内部。这些模块位于插卡边缘,在那里进行光电转换,我们已经看到本质上就是共封装光学器件被用于将这些模块内部的部件小型化了。英特尔在2023年有一篇论文,提供了一些关于他们称之为集成光子引擎的详细信息,本质上这就是一种电子芯片和硅光子芯片以及可能其他一些部件的共封装组合,它能实现非常小的外形尺寸,从而可以塞进可插拔模块里。它被用于 800 G模块就是出于这个目的,在相干光数据传输中也有应用,在那里它同样是出于不同的动机被使用,不是我之前讲的针对那些需要高总流量的大型芯片的情况,只是它的灵活性便于协同设计和优化,对应用有好处。这是好事,因为这总体上促进了共封装光学器件的发展,催生了所需的封装技术,让行业去摸索如何在这些封装内部进行光纤连接。但我真正想说的是,它未来的发展方向主要还是在这些大型芯片里,这也是在研究领域引起很多关注、引发很多讨论的地方。

一种大型专用集成电路就是网络专用集成电路,比如Broadcom制造的交换机就引起了很多关注,当他们宣布推出共封装光交换机时就备受瞩目,基本上他们是把光电转换布置在封装的周边,中间是主芯片,然后有数百根光纤从这个东西里伸出来,他们把用于实现这个功能的技术叫做硅光子小芯片封装(或者简称 SKIP,挺酷的名字)。英特尔甚至更早的时候就宣布展示了一个带有光输入输出的类似交换机,就在几周前,思科(Cisco)在光纤通信会议(OFC)上展示了他们称之为 Silicon One的类似产品,这就是我一直在讲的典型应用案例,中间是大型专用集成电路,大家很想尽可能多地在主芯片上塞入存储和处理功能,但它又需要超高的输入输出总带宽。

然后还有一个更新兴且有意思的机会,就是在高性能计算、人工智能、机器学习计算领域。大家知道,由于分布式计算模型等因素的推动,这里对互联的要求也在不断提高,需要低延迟和高带宽的连接。大家可以看看这里,这是Nvidia几周前刚发表的一篇论文里提到的内容,突出展示了一些趋势,他们区分了以太网交换机、GPU以及一些专用交换机,大家可以看到所有这些设备都有总带宽不断增加的趋势,有意思的是,大家能看到GPU在这方面正逐渐赶上其他应用,这是大家预见、期待并讨论了很久的一个趋势,在某个时候,这些类型的应用在带宽需求方面可能会超过传统的网络应用,它们可能会开始推动这个领域的研发,而且实际上可能会因为它们自身独特的需求而朝着不同的方向推动发展,毕竟在这些应用里,传输距离不像在交换机应用中那么重要,在交换机应用里可能需要在大型数据中心里跨越数百米甚至几公里进行传输,而在高性能计算、人工智能、机器学习应用中,所需的传输距离可能短得多,只有几十米,低延迟就变得极其重要了,因为这又是基于分布式模型从存储和内存获取数据的情况,这些就是部分应用场景的大致情况,接下来我想讲讲共封装光学器件面临的机遇和挑战。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光芯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
大佬获取表格有源码吗
大佬获取表格有源码吗
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
Alphawave Semi的CPO报告(三):CPO的机遇与挑战
搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景、机遇与挑战以及光/电/封装的协同优化。以下为第三部分的翻译。
光芯
2025/04/08
1710
Alphawave Semi的CPO报告(三):CPO的机遇与挑战
Intel 的光学互连方案 -- CPO 与 OCI 以及 4Tbps 光学小芯片
这两天 Intel 公司在 “HotChips 2024” 中介绍了它的”4Tb/s Optical Compute Interconnect Chiplet for XPU - to - XPU Connectivity“。翻译过来就是 ”用于 XPU 到 XPU 连接的 4Tb/s 光计算互连芯片“。
通往ICT之路
2024/08/30
1.1K0
Intel 的光学互连方案  --  CPO 与 OCI 以及 4Tbps 光学小芯片
Alphawave Semi的CPO报告(一):CPO的发展背景
搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景,机遇与挑战以及光/电/封装的协同优化。以下为第一部分的翻译。
光芯
2025/04/08
1840
Alphawave Semi的CPO报告(一):CPO的发展背景
OFC2024:爱立信视角-CPO与相干光收发器技术,如何提升RAN网络能效?
爱立信在OFC2024上认为:传统光通信系统的研究主要集中在提高性能上,例如提升比特率或减少延迟,但对能效的关注却远远不够。如果继续沿用当前的设计实践,通信网络的能耗将随着数据流量的激增而变得不可持续。
通往ICT之路
2024/05/28
3280
OFC2024:爱立信视角-CPO与相干光收发器技术,如何提升RAN网络能效?
Alphawave Semi的CPO报告(四):光/电/封装协同优化
搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景、机遇与挑战以及光/电/封装的协同优化。以下为第四部分的翻译。
光芯
2025/04/08
1320
Alphawave Semi的CPO报告(四):光/电/封装协同优化
光电子集成和Co-Packaged共封装技术有什么好处?
在过去的 10 年中,通过提高调制阶数(从 QPSK 到 16QAM 再到 64QAM)以及提高光电设备支持的波特率,我们看到单位波长的容量在迅速增加。然而,超过 64QAM 的相干调制阶数后,由于波长范围缩小,可实现的性能不足以满足目标应用的需要。
通往ICT之路
2024/04/09
2360
光电子集成和Co-Packaged共封装技术有什么好处?
双向数据传输速度达4Tbps!英特尔实现光学I/O芯粒的完全集成
英特尔在用于高速数据传输的硅光集成技术上取得了突破性进展。在2024年光纤通信大会(OFC)上,英特尔硅光集成解决方案(IPS)团队展示了业界领先的、完全集成的OCI(光学计算互连)芯粒,该芯粒与英特尔CPU封装在一起,可运行真实数据,双向数据传输速度达4 Tbps。面向数据中心和HPC应用,英特尔打造的OCI芯粒在新兴AI基础设施中实现了光学I/O(输入/输出)共封装,从而推动了高带宽互连技术创新。
芯智讯
2024/07/02
1880
双向数据传输速度达4Tbps!英特尔实现光学I/O芯粒的完全集成
Cignal AI的数据中心光组件初创公司信息汇总
原始网页链接:https://cignal.ai/2024/10/optical-component-startup-tracker/
光芯
2025/04/08
3540
Cignal AI的数据中心光组件初创公司信息汇总
OFC 2025预热(二):短距光互连的明星初创公司们
今天来看看OFC 2025上那些明星初创公司都介绍了哪些有意思的进展。主要介绍的公司之前都有陆续写过,包括Ayar labs,、Lightmatter、Celestial AI、OpenLight、Xscape、Lucidean等。Lightmatter和Celestial AI的验证结果展示感觉是脚步最快、最惊艳的(也体现到他们的融资上),Ayar Labs在瞄准大规模制造优化耦合封装方案,而Xscape、Lucidean公司也有了不俗的进展,Nubis展示了新的应用场景,奇点光子开始露面,Openlight平台在持续演进,昨天Tower新闻稿提到的400G/lane技术看会不会在会场有介绍。
光芯
2025/04/08
6770
OFC 2025预热(二):短距光互连的明星初创公司们
VLSI 2025 Alphawave短课:AI/HPC背后的连接技术革命
该报告是2025年VLSI会议上Alphawave关于加速AI的连接技术的短课内容,作者为Tony Chan Carsone。该报告指出AI领域呈现数据量与模型参数的爆发式增长,但算力增长远超内存与互连带宽,存在连接瓶颈。为突破瓶颈,AI数据中心采用分层网络架构:前端网络基于以太网,后端网络通过“Scale Up(纵向扩展)”和“Scale Out(横向扩展)”实现集群扩展。其中,机架内连接依赖铜缆及NVLink、PCIe等专用链路;机架间及更远距离(达10公里)则依赖光学技术,如以太网、Infiniband,且随着数据率提升,光学技术正逐步渗透到机架内甚至芯片级。 芯粒架构(Chiplet)成为关键解决方案:相比单片方案(受尺寸限制、良率低、成本高),芯粒架构通过异构集成(如先进逻辑节点与I/O优化节点结合),降低设计时间、风险及成本,支持灵活组合功能。3D芯粒架构进一步整合计算、内存(HBM)与光引擎,通过D2D(芯粒间)接口提升集成度。 高速I/O设计面临多重挑战:包括模拟前端的寄生电容、带宽限制,时钟抖动,以及芯粒实现中电感耦合、电磁仿真复杂度等问题。同时,光学收发器技术持续演进,从传统模块到集成DSP与硅光子技术的光引擎,共封装光学(CPO)虽能降低功耗、延迟,但存在散热集中、维护复杂等问题。 标准体系同步发展:以太网标准(如802.3系列)从40G演进至1.6T,PCIe从1.0升级至7.0,但其3年左右的开发周期需匹配AI硬件12个月的更新节奏。此外,铜互连通过共封装铜(CPC)连接器缓解阻抗不连续问题,400G以上电信号(如PAM-4/6)的可行性依赖FEC与均衡技术优化。 最终,报告强调,面对AI对低延迟、高吞吐量、大规模扩展的需求,需通过电气与光学技术融合、芯粒架构创新、标准协同及跨领域研发合作,推动连接技术突破。
光芯
2025/08/02
1120
VLSI 2025 Alphawave短课:AI/HPC背后的连接技术革命
Ayar Labs:用于CPO的Linear直驱相干硅光链路的光电协同优化
原文链接: https://ieeexplore.ieee.org/document/10850772
光芯
2025/04/08
1840
Ayar Labs:用于CPO的Linear直驱相干硅光链路的光电协同优化
硅光与CPO的稳健制造:行业全链条技术协同与挑战解析
在人工智能技术爆发的背景下,数据中心面临前所未有的流量压力。现有基础设施无法承载AI驱动的超大规模数据传输需求,物理层技术成为瓶颈。集成光学PIC因其高带宽、低功耗特性被视为关键解决方案,但行业面临从设计、制造到封装测试的全链条挑战:技术碎片化、规模化制造可靠性不足、成本控制与标准化缺失。该研讨会汇聚产业链上下游企业,围绕“稳健制造”展开技术协同探讨。
光芯
2025/05/18
3320
硅光与CPO的稳健制造:行业全链条技术协同与挑战解析
台积电先进硅光引擎COUPE最新进展!!!
      本文是台积电(TSMC)在IEEE ECTC 2025会议上发表的论文,主要介绍了紧凑型通用光子引擎(COUPE)的晶圆级表征结果,及其在光学、电气性能和可靠性方面的表现。
光芯
2025/06/09
6650
台积电先进硅光引擎COUPE最新进展!!!
浅谈CPO与LPO,到底有什么不一样?
传统的光模块是独立于交换芯片之外,通过铜缆或光纤与其他电子组件相连,这种方式在高速信号传输过程中容易产生较大的功耗和信号损耗。特别是,DCI等网络速率逐渐从400G发展到800G,甚至1.6T,不久的将来可达到3.2T,单个光模块的功耗也在增加。
通往ICT之路
2024/04/10
5.6K0
浅谈CPO与LPO,到底有什么不一样?
OFC 2025预热(一):大厂的一些关于数据中心光互连的邀请报告
OFC 2025周末就要开了,看点多多。今天先来看看会议上大厂们在数据中心光互连这一块会有哪些报告分享吧。
光芯
2025/04/08
5710
OFC 2025预热(一):大厂的一些关于数据中心光互连的邀请报告
800G 和 1.6T 网络的挑战!
我们知道,提高波特率会加快符号在信道中的传输速度,但可能导致信号衰减的增大。增加脉冲幅度调制方案(PAM)可使每个符号发送更多的比特,但误差幅度更低,阈值更严格。
通往ICT之路
2024/04/09
4200
800G 和 1.6T 网络的挑战!
OCP EMEA 2025:Nvidia介绍下一代AI系统的光子互连关键技术(可插拔/CPO/2.5D光学/OCS)
在OCP EMEA 2025大会上,Nvidia的Benjamin Lee发表了题为Photonic Interconnect for Next-Generation AI Systems的报告,介绍了可插拔/CPO/2.5D光学(OIO)的技术对比及演进,以及OCS技术在网络架构级的优势。
光芯
2025/05/13
5680
OCP EMEA 2025:Nvidia介绍下一代AI系统的光子互连关键技术(可插拔/CPO/2.5D光学/OCS)
应用于CPO封装模块内的光纤互联方案
随着Serdes传输速率的提升,交换机功耗和信号损失、系统集成度等问题愈发具有挑战, CPO新技术渗透率加速提升。根据LightCounting的数据显示,人工智能对网络速率的需求是当前的10倍以上。LightCounting预计CPO技术的出货将从800G和1.6T端口开始,在2024至2025年期间开始商用,2026至2027年开始规模上量,主要应用于超大型云服务商的数通短距场景。
亿源通科技HYC
2024/12/29
7090
应用于CPO封装模块内的光纤互联方案
Furukawa的VCSEL CPO方案
一、引言 在日本信息通信技术研究所(NICT)主导的B5G Brighten国家项目框架下,日本古河电气(Furukawa Electric)的Hideyuki Nasu团队针对AI机器学习互连场景,开发了基于基于VCSEL的超紧凑光学收发器及高密度可插拔电接口。该项目始于2021年,于2025年3月结题,核心目标是通过共封装光学(CPO)技术降低数据中心链路功耗。
光芯
2025/05/22
2240
Furukawa的VCSEL CPO方案
OFC 2025:Celestial AI的Photonic Fabric技术助力AI时代的内存与网络革新
Celestial AI公司的这份报告聚焦于其用于内存和计算解耦的技术平台——Photonic Fabric,详细阐述了光子学在AI领域的机遇、公司的解决方案、对AI大模型的影响以及相关演示结果。以下是对该报告的详细分析:
光芯
2025/04/08
4620
OFC 2025:Celestial AI的Photonic Fabric技术助力AI时代的内存与网络革新
推荐阅读
相关推荐
Alphawave Semi的CPO报告(三):CPO的机遇与挑战
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档