近日,以北京大学为第一单位的研究团队在《Nature Communications》报道了一款在1550nm波段实现单波400G PAM4传输的硅光调制器成果,文章题目是Exploring 400 Gbps/λ and beyond with AI-accelerated silicon photonic slow-light technology,第一作者为:Changhao Han, Qipeng Yang, Jun Qin, Yan Zhou,通讯作者是北大舒浩文研究员,王兴军教授以及UCSB的John E. Bowers教授。 一、研究背景 在全球数据量快速增长的当下,高速光互连被视为革新高性能计算中心的重要途径。硅光子学凭借CMOS兼容性,具备低成本、大规模晶圆级生产的潜力,成为重要的光电子集成技术平台。然而,作为核心电光转换器件,纯硅调制器传输速率增长缓慢,与以薄膜铌酸锂等为代表的异质集成路线相比存在差距,这让人们对纯硅调制器在超高速场景的可行性产生担忧。 硅基慢光调制器(Si-SLMs)作为一种可以实现带宽性能提升的方案受到研究人员的关注。另一方面,在光电子领域,人工神经网络(ANN)均衡器被提出以构建输入和输出空间之间具有非线性边界的复杂映射,适用于基于Si-SLMs的光传输,可减少非线性失真,消除工艺误差导致的Si-SLMs差异,为大规模传输系统的部署提供可能。

二、技术方案

(一)硅慢光调制器(Si-SLM)设计 1. 整体结构
基于SOI平台的一维光栅耦合谐振器光波导(CROW)结构,采用标准硅光子工艺制造。8通道Si-SLM芯片在200mm SOI晶圆上制造,实际调制区域仅为4mm×0.5mm,相邻器件间距500μm,且对应发射器区域设计了8通道锗硅光电探测器(PDs)构成完整收发器。 2. 单个器件结构
采用紧凑的MZI结构,得益于慢光效应,调制臂可缩短至仅249μm,比传统硅MZM小一个数量级,提升了系统集成密度。同时,采用GSGSG型射频(RF)电极的双驱动架构,使调制器能在推挽驱动模式下工作,以增大相位积累,且有利于光电集成和降低啁啾。在RF电极的远端集成了片上终端电阻以减少微波反射,在波导输出端口附近,波导上采用TiN加热器来控制调制器的工作点。

3. 慢光效应实现
调制臂中,由CROW产生慢光效应,这是一种一维波导光栅结构。一个完整的谐振器由中间位置较宽的λ/4相移器区域和两侧周期约300nm的相同数量的布拉格光栅沿波导中光的传播方向构成。在可重构慢光模型中,有限数量的谐振器级联构成调制臂,结构参数可根据具体应用场景灵活选择。基于光栅波导配置,形成具有周期性结构的PN结,在反向偏置电压下工作在耗尽模式。

(二)AI均衡器 1. DNN均衡器
为减少计算资源,开发了相对简单的ANN模型,将网络扩展为只有两个隐藏层的DNN均衡器以提升系统性能。通过特定方程实现具有四个饱和电平区域的激活函数,其构建的函数具有四个接近PAM-4幅度的饱和区域,适用于PAM-4均衡,同样可扩展为8级sigmoid函数用于PAM-8等调制信号的均衡。DNN包含两个隐藏层,权重优化过程涉及梯度下降方案与误差反向传播算法,以迭代更新网络参数。


2. GRU相关均衡器 ① bi-GRU均衡器
循环神经网络(RNN)因在建模时间动态和处理序列数据方面的优势被广泛应用,双向RNN(bi-RNNs)能有效处理符号间干扰和非线性损伤。门控循环单元(GRU)包含重置门和更新门,是长短期记忆(LSTM)的一种较简单变体,在捕捉和建模长期依赖关系方面表现出强大能力。双向GRU(bi-GRU)模型由两个反向操作的单向GRU层组成,结合正向和反向GRU处理,使模型整合来自未来和过去的信息以影响当前状态。 ② T-biGRU均衡器
在bi-GRU基础上进一步提出并实现了一种新的三层GRU均衡器(T-biGRU)。T-biGRU模型基于三个GRU层的状态确定,第一个GRU层沿正向处理数据,第二个GRU层沿反向处理数据以捕捉反向时间依赖关系,第三个GRU层与第一个类似,从序列开始沿正向处理数据。通过整合正向、反向和重复正向GRU处理,T-biGRU模型更全面地提取序列的全局和局部特征,进一步提升均衡性能。 三、实验结果与性能表现 (一)Si-SLM性能表征 1. 高频电光响应
通过S参数测量实验表征了Si-SLMs的小信号特性以获得电光带宽,包括S₂₁传输和S₁₁反射响应。在3V偏置电压下,调制器的电光带宽为90GHz,在仅1V时已超过70GHz,低偏置电压要求有利于与集成驱动芯片共封装。反射性能方面,S₁₁响应保持在-10dB以下。 2. 调制效率
在正交偏置点附近向器件施加低频小信号,通过拟合多个波长的相位变化获得调制效率。在1550nm左右的通带内,平均调制效率为0.82V·cm(对应Vπ为33V),基于等离子体色散效应的纯硅调制而言是显著的。 3. 光学损耗
Si-SLMs的插入损耗测得为10.5dB(其中9.1dB来自调制臂,其余来自定向耦合器和走线波导),可通过改进制造工艺或在常规波导和慢光波导之间引入过渡结构进一步降低光学损耗。 4. 静态消光比(ER)
通过TiN加热器的标准热调谐机制,紧凑型调制器的静态ER测得为36dB。 5. 线性度
测量三阶互调(IMD3)无杂散动态范围(SFDR)以表征高阶传输中的多电平分离能力,Si-SLMs的IMD3 SFDR为91.82dB·Hz²/³,与传统硅调制器相似,主要受限于硅材料的等离子体色散效应的非线性以及MZI架构的非线性余弦传递函数。 6. 调制器阵列性能 ① 通道串扰
调制器阵列的间距为500μm,调制器之间的最小距离仅20μm。通过在一个通道(Ch4)上施加小的RF信号,同时在其他通道上接收传输的信号,测试并行调制器的电光响应,测得在60GHz时串扰约为-30dB,在90GHz时约为-20dB,在超紧凑和超高密度芯片布局中,由于超短的RF链路,波分复用Si-SLMs的串扰保持在较低水平,对并行信号传输的影响较小。 ② 光谱性能
制造的Si-SLM在1550nm左右具有7nm的平坦通带,带外抑制比为50dB。器件之间的通带一致性较好,表明制造的Si-SLMs总体具有较好的工艺一致性,但由于不可避免的制造偏差,仍存在波长偏移。8通道波分复用Si-SLM系统的特定波长从1548nm到1555nm,间距为1nm。 (二)传输实验结果 1. DNN传输
基于设计的高带宽Si-SLMs构建了8通道波分复用Si-SLM传输系统。接收端,信号部分耦合到同一芯片上的片上锗硅PD,其余部分发送到商用PD,传输的超高速信号由实时示波器记录,然后用AI均衡器处理。

采用仅具有两个隐藏层的DNN均衡器,实现了224Gbps PAM-4信号传输,所有通道在不同波长(1548-1555nm,1nm间距)下均获得清晰的眼图,所有误码率(BERs)低于2×10⁻²,总容量为1.6Tbps。不同PRBS模式下的实验结果表明,DNN均衡器学习的是信道信息而非信号模式,对不同数据模式具有稳健的均衡能力。 2. GRU传输
① bi-GRU传输

采用bi-GRU网络提升传输性能,在实际的GRU波分复用传输实验中,选择片上通道Ch1、Ch3、Ch5、Ch7(奇数通道)作为一个波分复用传输路径,Ch2、Ch4、Ch6、Ch8(偶数通道)作为另一个波分复用传输路径,每组片上信号通过波分复用后,两条路径并行传输,总容量达到3.2Tbps。
采用bi-GRU均衡,可实现高达400Gbps的PAM-4信号的高质量眼图,所有误码率均低于硬判决前向纠错(HD-FEC)阈值。在仅4mm×0.5mm的紧凑调制区域上基于8通道Si-SLM芯片实现了3.2Tbps的总数据容量,芯片数据速率密度达1.6Tb/s/mm²。
不同PRBS模式下的系统性能分析表明,bi-GRU均衡器捕捉的是信道响应而非PRBS模式。通常,隐藏层中的GRU单元越多,误码率越好,从340Gbps到400Gbps,通过改变GRU数量可以有效降低误码率,且这种有效性没有明显下降趋势,反映了GRU解决方案对更高速率的适用性。 ② PAM-8信号传输

为验证AI加速慢光系统对更高阶信号的可扩展性,在Si-SLM芯片上利用高速PAM-8信号进行实验,bi-GRU均衡器仍能有效减轻多电平信号中的非线性失真,在1550nm(Ch3)处从240Gbps到390Gbps的特定PAM-8眼图均具有良好的8级分离度,所有误码率均低于HD-FEC阈值,且8通道中所有波长的误码率仍低于HD-FEC阈值,通道间一致性良好。与PAM-4格式相比,数据速率在240Gbps左右时,PAM-8的误码率略低于PAM-4,但随着数据速率继续上升,PAM-8的误码率增长确实比PAM-4快,在数据速率达到400Gbps左右时两者基本相同。 ③ 不同传输距离性能

基于背靠背(B2B)场景的实验结果,使用bi-GRU均衡器评估了100m、200m和300m标准单模光纤的传输代价。由于光纤中功率衰落效应的影响,与B2B场景相比,两种格式的误码率性能均随着传输距离的增加而逐渐下降。在300m传输距离下,360Gbps时误码率仍保持在HD-FEC阈值以下,但在400Gbps时则劣于HD-FEC阈值。 ④ T-biGRU传输

采用T-biGRU均衡器的传输结果显示,对于400Gbps左右的传输,所有通道的误码率性能可改善至小于10⁻³,略优于bi-GRU情况,但T-biGRU的计算复杂度是bi-GRU的1.5倍,导致乘法运算增加和功耗升高,在选择均衡器时需在性能、计算复杂度和功耗之间取得平衡。

四、技术亮点 1. 高性能Si-SLM设计
通过慢光方法,极大地优化了纯硅调制器的带宽-效率权衡,紧凑的Si-SLM同时具备90GHz的超高电光带宽、0.82V·cm的显著调制效率以及1550nm左右7nm的宽光学通带。 2. 高集成度与大容量传输
得益于Si-SLMs的CMOS兼容性,在SOI平台上采用标准硅光子工艺制造了8通道Si-SLM芯片,制造流程中未引入额外的异质材料和复杂工艺,为大规模、低成本的晶圆级生产提供了前提。基于该芯片,实现了单波400Gbps PAM-4传输,且所有误码率在宽光学通带内均低于HD-FEC阈值,这是标准硅光子平台上展示的最高速率,基于此实现了3.2Tbps的总数据容量。 3. AI技术的有效应用
AI技术的精确采用是发挥Si-SLM芯片潜力的重要保障,慢光系统非常适合用ANN均衡器进行加速驱动。通过将ANN嵌入Si-SLMs的信号处理流程,可有效减轻纯硅器件中的固有非线性失真,消除工艺误差导致的Si-SLMs之间的差异,为大规模传输系统的部署提供可能。 4. 由于的系统特性
基于紧凑的占用面积(4mm×0.5mm),实现了1.6Tb/s/mm²的芯片数据速率密度。得益于1550nm左右的宽平坦通带,整个链路无需单独的谐振波长调整和热电冷却器(TEC)平台,降低了系统预算。同时,验证了PAM-8信号的可行性,表明AI加速慢光解决方案适用于具有更多电平的更高阶数据传输。 五、不足之处 1. 调制器插入损耗较高
Si-SLMs的插入损耗测得为10.5dB,其中9.1dB来自调制臂,与现有的MZI型调制器相比相对较高,可能是一个重要的实际限制。 2. AI均衡器的鲁棒性问题
在实际传输场景中,若发射器输出强度因链路条件变化而变化,神经网络均衡器可能需要重新训练或适应。虽然通过数据混合、dropout和L2正则化等方法可在一定程度上增强鲁棒性,但性能仍不如在每个特定功率水平单独重新训练模型。且所采用的AI均衡器网络规模较小,通常较小的网络规模往往表现出较低的鲁棒性,在当前网络配置下,鲁棒性仍然是一个相对具有挑战性的任务。此外,组件更换、老化效应、偏置漂移、噪声特性变化等都可能需要重新训练,且对于这些变化对系统的影响以及多大的变化需要重新训练均衡器还需要量化分析。 3. 功耗问题
对于AI均衡器,虽然其功率消耗带来了传输速率的提升,使得传输每个比特数据所需的算法能耗控制在可接受范围内,但与收发器的其他部分相比,神经网络组件的功耗仍然较大。

4. 驱动电压
调制器10V的总摆幅达到Vπ的约30%,5Vpp的驱动电压相对较大且耗电。
5. 波长
本工作报道的器件工作在1550nm波段,目前存在高带宽IMDD需求的AI DC场景采用的是O波段传输,O波段对于慢光光栅加工的要求更高,硅波导的色散也更大,实现难度可能会更高。