首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nvidia:迈向<1pJ/bit高速光互连的路线图

Nvidia:迈向<1pJ/bit高速光互连的路线图

作者头像
光芯
发布2025-09-03 16:56:27
发布2025-09-03 16:56:27
1330
举报
文章被收录于专栏:光芯前沿光芯前沿

本文由NVIDIA团队发表于2025 IEEE Society Summer Topicals Meeting Series会议,题目为A Roadmap Toward Sub 1pJ/b Optical Interconnect,核心围绕“在成熟技术与实际产品约束下,实现低于1pJ/b的高效光互连”展开,分析架构设计、性能限制因素,并提出能效优化技术路线。

原文链接:https://ieeexplore.ieee.org/document/11121762

一、研究背景与核心目标

1. 背景驱动

大语言模型(LLM)推动大型AI工厂需求,此类场景需数十万台GPU协同工作,但数据中心规模受限于供电能力(新建发电站成本高、周期长)。因此,网络解决方案需极致能效,既要降低单链路功耗,也要通过高基数交换机减少网络层级。

2. 核心目标

优化“链路功率效率”与“交换机基数”,最终实现低于1pJ/b的光互连,同时满足实际产品的可制造性、稳定性需求。

二、关键架构设计:

为达成能效目标,团队采用多维度架构创新,规避传统光互连的复杂性与高功耗:

1. 2.5D集成与D2D接口

通过COUPE技术(基于CoWoS工艺)将光引擎与GPU近距离集成,搭配高效的芯片间(D2D)接口,提升线路密度并降低互连损耗。

2. 微环调制器DWDM架构

采用25Gbps开关键控(OOK)调制,目标误码率(BER)10⁻¹²,无需Gearbox、DSP、纠错ECC及电感peaking补偿,实现可扩展的光吞吐量。

3. 多排拓展的光栅耦合器光IO

支持多排扩展,满足高基数连接需求。

4. 光通道时钟转发

额外设计一条光通道传输时钟,省去时钟数据恢复(CDR)电路,降低电路功耗。

5. 实际产品角度考虑

- 集成可分离光连接器,为系统内及跨数据中心的光纤连接预留足够链路损耗预算;

- 考虑相邻ASIC工作时的热变化影响;

- 限定采用成熟、可扩展的制造工艺。

三、主要性能限制因素

团队基于台积电COUPE封装技术,模拟了一个400Gbps/光纤的原型方案。该DWDM架构包括:提供16个波长(间隔100GHz)的外部光源、含16个热调谐微环调制器(MRM)的发射器,以及含16个热调谐微环谐振器(MRR)的接收器。本文分享初步结果,旨在提供预测并为行业提供指导。

该方案预测总功耗为3.8pJ/b,其中光功率占2.3pJ/b,热调谐占0.5pJ/b,电路占0.7pJ/b,芯片间接口占0.3pJ/b。这一细分结果表明,在该架构中,模拟电路不再是限制因素,光信号成为主要功耗来源。下文将详细分析这些数值的驱动因素。

(之前在ECTC 2025的报告上Nvidia也讲过这个架构的功耗评估,当时给的是3.5 pJ/b,分解略有不同Nvidia集成光子学路线:CPO破局通信瓶颈,OIO重构芯片互联)

◆ 关键子系统限制细节

1. 激光功率效率

激光功率效率由三方面决定:接收器灵敏度、总损耗与传输代价,以及激光电光转换效率(WPE)。

基于9%损耗占比的光纤耦合WPE和-17dBm的灵敏度,图2展示了损耗分布的分贝百分比。从中可见,光纤连接(32%)、微环调制损耗(22%)以及发射/接收环总线波导走线损耗(14%)是主要损耗来源。由于该图以分贝百分比呈现,其他损耗的影响相对较小。

(按照他的这个%dB的分布,整理了一下他的损耗分布表格,对应的dB值是假设9%光源耦合对应台积电COUPE光栅的~1.3 dB进行估算。接收端是双偏振耦合,可能采用的是2D光栅耦合器,损耗是2dB)

2. 热功率效率

尽管本架构实现了高效模拟电路和可扩展的每光纤带宽,但也意味着微环必须跟踪光源波长,同时抑制相邻通道的热串扰。热效率由加热器效率和所需调谐范围决定,二者需独立优化。

热隔离在抑制电集成电路(EIC)热瞬态方面作用显著,因此会影响跟踪频率并提升加热器热效率。加热器的几何结构和材料进行了优化,例如在微环周围去除金属。调谐范围包括静态和动态两部分:静态偏移用于通过补偿激光和微环的工艺偏差,将微环谐振波长与激光器波长对准;动态范围用于抑制热串扰和跟踪环境温度。分析预测静态调谐占50%,动态调谐占25%,热控制电路占25%。

3. 电芯片功率效率

电路功耗在发射(TX)和接收(RX)端大致均分,主要由时钟电路主导,其次是跨阻放大器(TIA)和DRV。

四、能效优化技术与预测

团队提出5项核心优化技术(按影响降序排列),结合保守估算,可逐步逼近甚至突破1pJ/b目标,部分技术存在协同增益(如调制器消光比提升可改善APD灵敏度)。需注意,一旦采用APD、增益集成和稳定微环,电路功率将再次成为主导因素。但由于采用CMOS电路,可受益于逻辑工艺缩放降低电路的优势。

(仔细分解一下,总体需要比当前降低77%能耗才能实现<1pJ/bit的目标。其中第一条是将PD替换成波导GeSi APD,灵敏度保守提升3dB,但电路功耗会有一定增加,波导APD在短距光互连场景的研究和应用值得期待。第二条的增益集成提升6dB灵敏度没太理解指的是哪方面,不过可以看到前2条就是依赖灵敏度的提升就实现了52%的能耗降低;第三条估计是将波长做准,去掉前面提到的50%的静态调谐功耗,整体能耗再降6%;后边就是再靠CMOS工艺缩放+D2D直驱再抠出19%的能耗降低)

◆ 额外潜在改进方向

- 增强热隔离与驱动设计(PWM?);

- 采用全光信号处理OSP技术,以光功率替代部分电路功耗;

- 开发更高效的调制器(如MOSCAP型调制器),降低光功率消耗。

五、研究结论

1. 基于DWDM架构,在“成熟技术+实际产品约束”(如可制造性、热稳定性、链路损耗)下,实现低于1pJ/b的光互连是可行的;

2. 明确了高影响技术(如APD、增益集成、D2D直驱)与低影响因素(如次要损耗项),为行业提供技术优先级指导;

3. 未来若采用CMOS逻辑工艺缩放,可进一步降低电路功耗,巩固能效优势。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光芯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档