首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ECOC 2025:剑桥大学/Nvidia/imec报道面向AI数据中心网络的二维光交换高速互连技术

ECOC 2025:剑桥大学/Nvidia/imec报道面向AI数据中心网络的二维光交换高速互连技术

作者头像
光芯
发布2025-10-29 15:50:13
发布2025-10-29 15:50:13
1700
举报
文章被收录于专栏:光芯前沿光芯前沿

本文了提出一种基于硅光4×4×8空间-波长选择光开关(SWSS)的二维光交换高速互连方案,专为AI驱动的数据中心网络设计。该开关支持InfiniBand协议下100Gbps波长-空间路由,同时可通过以太网实现1Gbps实时视频传输,验证了其在高带宽、高灵活性AI网络中的应用潜力,为解决现代数据中心互连面临的性能瓶颈提供了有效途径。

光子集成OCS技术:从单材料平台到异质集成平台

一、引言

人工智能(AI)的爆发式增长正从根本上重塑现代数据中心的架构设计与性能需求。AI工作负载需海量带宽、超低延迟及高可扩展的互连结构,以支撑分布式加速器集群间的并行处理与实时数据交换。然而,传统电子开关受限于带宽密度、功耗及热约束,已难以满足这些不断演进的需求。

除计算资源扩展外,内存解聚等新兴范式也对互连技术提出了更高要求。通过将内存集中为池化资源,解聚架构可提升资源利用率,但同时对网络的高带宽与低延迟特性提出了严苛标准。光交换(OCS)凭借高吞吐量、低延迟通信及动态重构能力,成为应对这些挑战的理想选择——例如NVIDIA已展示了其DGX平台中集成OCS以增强弹性与可重构性NVIDIA的OCS光交换实验更新

硅光子学为上述问题提供了极具吸引力的解决方案。借助光通信固有的高速、低延迟及高能效优势,光交换架构可量身打造适配下一代数据中心需求的可扩展、可重构互连系统。其中,空间-波长选择开关(SWSS)能够通过空间端口独立路由多个波长信道,实现细粒度流量控制与动态带宽分配,进一步提升了互连灵活性。

本文基于商用现成(COTS)组件,设计并实现了一款硅基4×4×8 SWSS,用于可扩展数据中心互连。该开关核心采用波长选择路由架构,可在四个输入/输出端口间动态切换多个波长信道,通过DWDM、CWDM等标准化波长栅格,实现服务器机架间基于共享光交换结构的灵活可重构通信。

二、开关设计与表征

2.1 拓扑与组件设计

如图1(b)所示,该SWSS采用改进的Banyan拓扑,以抵消一阶带内串扰。信号的扇出与扇入通过2×2×8λ开关单元(SEs)和无源合路器实现,设计融合了微环谐振器(MRRs)的高调谐效率与波长选择性,以及马赫-曾德尔干涉仪(MZIs)的宽带宽与稳定性,使其适配高性能多维切换场景。

2.2 硬件实现与关键参数

图1(c)为通过IMEC SOI多项目晶圆(MPW)流片制备的开关显微镜图像。该开关总面积为20 mm²,其中12个开关单元仅占0.6 mm²,MRRs间距设计为200μm以降低热串扰。为验证波长独立控制能力,采用QSFP28收发器(O波段)从输入端口I₁向输出端口O₁传输信号,测试结果显示,四个波长信道的消光比均超过27 dB,光带宽达65 GHz(图2),插损在10dB左右。

三、性能测试与验证

3.1 InfiniBand链路表征

测试采用NVIDIA Mellanox网卡通过PCI-e接口连接至PC,网卡中插入一对100G QSFP28收发器(O波段),支持四个间隔4.5 nm的光波长,最大传输距离可达40 km。光信号经500米单模光纤(SMF)传输后,通过所设计的光开关路由并环回,接收端由对应QSFP28收发器捕获信号。

借助NVIDIA固件工具(MFT)进行链路调试与监控,网卡配置为PRBS31测试模式,数据速率为4×25.78 Gbps/λ,通过收集网卡原始误码计数,计算不同空间路径与波长下的误码率(BER)。

如图3(b)所示,在4个输入端口(I₁-I₄)、4个输出端口(O₁-O₄)及4个波长的所有组合中,BER值范围为10⁻⁹~10⁻⁶,验证了开关支持每通道25.78 Gbps、总速率100 Gbps的可靠传输。插入损耗是影响BER的主要因素,每条路径的总损耗约为20 dB,包括光纤耦合损耗、开关插入损耗及波导相关损耗,这些均为光子集成电路(PIC)设计的固有损耗成分。

3.2 以太网链路表征

为验证SWSS在以太网流量中的实际性能,采用10Gbps SFP+收发器与商用以太网交换机搭建真实以太网分组传输测试平台(图4(a))。两对带SFP+端口的以太网交换机用于连接光开关,电-光转换由交换机完成,FPGA控制板连接至开关驱动器以配置切换状态。

测试通过一对60 km、1270 nm SFP+收发器开展4K视频传输实验。由于4K视频流带宽需求较低,且PC配备1G网卡,采用VLC媒体播放器合并多路视频流,生成总速率约1 Gbps的聚合流后发送至带可插拔SFP+收发器的10G以太网交换机。图4(b)展示了收发器接收光功率与BER的关系——接收光功率降低会导致BER升高,进而影响视频质量。通过插入光衰减器并逐步增加衰减量的测试表明,即使额外增加13 dB衰减,系统仍能维持稳定的4K视频传输,验证了至少13 dB的总动态范围,证明该光开关可在显著的光功率变化下可靠运行,适用于实际光网络部署。

值得注意的是,当前测试的1 Gbps速率上限源于以太网交换机接口,而非光开关本身。基于开关波长信道65 GHz的实测光带宽,结合未来更高速度的强度调制直接检测(IMDD)或相干收发器及兼容网络硬件,理论上可支持超过60 Gbaud/s的速率,实现200 Gbps/λ甚至更高的数据传输。

四、结论

本文实验验证了一款面向现代数据中心可扩展、低延迟互连的硅基光子4×4×8λ SWSS。InfiniBand链路的BER测试表明,该开关在所有端口与波长组合下均能实现100 Gbps的可靠传输,BER范围为10⁻⁹~10⁻⁶。

以太网视频传输测试进一步验证了其实际应用价值:通过10G SFP+收发器在60 km光纤链路上实现了高质量4K视频流传输,尽管开关存在约20 dB的固有插入损耗,但在额外增加13 dB光衰减的情况下仍能稳定工作,证实了至少13 dB的动态范围,彰显了在可变链路预算下的稳健性能。

该SWSS的3 dB带宽超过65 GHz,结合收发器技术的进步,可支持未来高速调制格式(如200 Gbps/λ及以上)。这些结果表明,SWSS为AI-centric、内存解聚的数据中心架构提供了一种高吞吐量、可重构的光网络解决方案。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-10-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光芯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档