原文链接: https://ieeexplore.ieee.org/document/10850772
在如今这个被人工智能全面渗透的时代,数据中心就像庞大的数据中枢,处理着前所未有的海量数据。这使得数据中心网络对数据通信芯片的带宽密度和能源效率有了更高的要求。传统的电气互连因带宽受限,逐渐被光学互连取代,但数据中心里大部分的交换操作仍在电气领域进行,所以高效的电光(E/O)和光电(O/E)接口至关重要。 在这样的背景下,共封装光学(CPO)技术应运而生。它将光学器件与交换机ASIC更紧密地集成在一起(如图1所示),能有效减少传统可插拔光模块中高功耗的基于DSP的Retimer的使用,大幅降低系统功耗,还能通过密集的电气连接实现更高的封装逃逸带宽。不过,为了满足未来数据中心不断增长的性能需求,CPO的带宽密度需要持续提升,同时要保持低功耗以应对共封装带来的散热挑战,并且要与现有的以太网标准兼容。
相干光通信凭借其高光谱效率,成为提升CPO带宽密度的有力候选技术。相干调制利用光的相位和偏振特性等额外自由度,提高了信道频谱效率,但由于其数字信号处理(DSP)功耗高,此前在数据中心内部链路中并未得到应用。不过研究发现,在O波段的短距离(<2km)数据中心内部应用中,相干收发器的DSP可以大幅简化。例如,已有实验展示了无DSP的400Gb/s双偏振16QAM数据中心内部收发器,以及224Gb/s的O波段DP-QPSK链路。但这些方案缺乏电子和光子的协同设计与优化,导致系统能源效率不高。 本文聚焦于线性驱动CPO应用中基于硅光MZM的激光转发(laser-forwarded)QAM - 16相干收发器,提出了一种基于闭式表达式的光学和电气数据路径建模框架,并在此基础上给出了带宽感知的协同优化方案,以提升包括激光源在内的发射器整体能源效率。 一、MZM 激光转发相干光收发器架构 本文研究的相干光收发器架构如图2所示。ASIC开关周围环绕着多个光收发器(OTRX),它们与ASIC安装在同一封装基板上,ASIC与OTRX之间通过低损耗的超短距离(USR)封装走线实现电气互连,这些走线长度通常小于10mm,在28GHz时插入损耗低于2dB。OTRX上的电子和光子组件被单片集成在一个芯片上,这种集成方式减少了电子和光子组件之间的芯片间接口寄生效应,提升了性能并降低了功耗。
(一)收发器架构详解 外部激光源发出的光被分为两部分,一部分进入发射器,由电光IQ调制器进行调制;另一部分作为本地振荡器(LO)转发到相干接收器。在发射器侧,输入激光通过端面耦合器进入芯片,在I和Q路径中平均分配,这里的50:50分光器可由1:2多模干涉仪(MMI)或3dB定向耦合器实现。在I和Q路径中,光通过MZM由输入的PAM4电数据进行调制。本工作假设采用分段式MZM架构,不过其分析也适用于行波MZMs。MZM由线性高摆幅电驱动器驱动,驱动器接收来自主机ASIC中SerDes TX的PAM4数据流。调制后的光经过热移相器,在I和Q路径之间产生90°的相移,最终形成QAM - 16信号并传输。 在接收端,相干RX接收传输的光信号和转发的LO,通过90°光混合器将它们组合,再由一对平衡光电探测器分离出I和Q数据,经跨阻放大器(TIA)转换为电压信号后,发送到相应的主机SerDes进行后续处理和均衡。 (二)协同优化的关键要点 整体链路的能源效率受Host SerDes和光TRX的功耗影响。通常,SerDes会针对特定的电气互连类型进行优化,而光TRX的设计可以结合SerDes的信号强度和均衡能力进行。本工作重点在于对相干光TRX的光子和电子设计参数进行协同优化,以提升相干发射器包括激光在内的能源效率。 在设计相干收发器的电光数据路径时,有多个设计选择会影响链路的能源效率。例如,为增加发射光的调制幅度(OMA),可以提高DRV电压增益、增加MZM长度或提高激光功率。但这些操作会带来不同的影响,增加驱动电压增益会影响发射器的线性度和带宽;较长的MZM虽然能产生更大的相移,但会增加插入损耗并降低发射器的电光带宽;提高激光功率则会增加平衡PD的散粒噪声,降低相干RX的灵敏度。此外,激光分光比也是一个重要的设计参数,它会影响光信号摆幅和RX灵敏度。所以,对这些设计参数进行协同优化至关重要。 二、光传输路径的深度解析 (一)TX光学数据路径 MZM 电光模型如下图所示。
对于相干应用,在忽略输出光的静态相移后,调制相移与电摆幅呈线性关系,但光场与相移呈正弦关系,这就导致在电大摆幅时光场线性度会下降。图5展示了不同MZM长度下,光场线性度(以PAM4的RLM衡量)
和调制损耗随输入电摆幅的变化。例如,对于1mm长的MZM,在以98%的RLM作为目标时,在出现线性度代价之前,它能承受的差分输入电压Vpp摆幅为7.5V,而先进CMOS工艺的Driver提供的最大电压摆幅通常远小于此,所以发射器的整体线性度往往由Driver决定。
基于MZM的IQ调制器中,对于相干调制,IQ调制器的OMA被定义为IQ平面中相邻星座点之间的光功率距离,其归一化OMA表达式为公式(11)。此外,还可以得到芯片输出的光场与激光光场的关系(公式12)。
(二)RX光学数据路径 在IQ解调的激光转发架构中,接收端通过90° Hybrid将传输的IQ调制光信号与转发的LO混合,然后发送到一对平衡光电二极管BPD进行解调。利用传输矩阵法可以推导出90° Hybrid的输出场表达式,进而得到平衡PD的输出电流表达式。为实现正确解调,LO的相位偏移应为零,本工作假设采用标准的LO恢复方案来实现IQ解调。
RX灵敏度和激光功率分光比的关系:由于I和Q路径中的信号摆幅理想情况下相同,所以可以仅考虑其中一个接收电流来分析光学灵敏度。通过公式可以得到接收电流与激光功率、发射器OMA等参数的关系,从而计算出获得所需接收信号摆幅时的激光功率。激光的电光效率Eb,laser定义为激光传输和接收单位比特数据所消耗的能量。
在固定激光功率和发射器OMA的情况下,当激光分光比k = 0.5时,接收信号摆幅最大。但PD的散粒噪声也与分光比有关,实际的最佳分光比应是使信噪比(SNR)最大化的数值。图12展示了不同TIA输入参考热噪声电流下,SNR随分光比的变化。对于大多数先进的线性TIA设计,输入参考均方根噪声电流在1 - 4µA之间,对于单片工艺甚至更小。在这些现实的热噪声值下,最大SNR点会向较低的k值移动。例如,当热噪声电流为4µA、2µA和0.5µA时,最佳分光比分别为0.32、0.2和0.08。 三、线性MZM Driver的关键特性 线性驱动应用中的MZM DRV需要具备高线性度、高摆幅、高带宽和高功率效率等特性。在众多工艺中,标准CMOS工艺的驱动器具有更高的功率效率、更低的成本、更高的良率,并且更容易与现有的CMOS解决方案集成。 本文以互补伪差分共源共栅线性驱动器为例(如图8所示),该驱动器的设计具有以下特点:通过级联晶体管支持大电源电压;通过交流耦合信号到输入晶体管去掉尾电流源,节省电压摆幅;采用互补拓扑结构,通过共享偏置电流使功耗降低一半;并联的无源电阻Rp可以提高带宽、更好地控制低频增益并通过降低低频增益来增加线性度范围。
从其小信号模型(图8b)可以推导出驱动器的中频段增益和3dB带宽表达式。实际中,结电容和布线电容的组合远高于器件的寄生漏极电容。此外,驱动器的线性度也很关键,输入线性度取决于输入晶体管的过驱动电压V*,输出线性度则由电源电压或电压摆幅决定。例如,对于输入峰峰值单端摆幅为0.5V、低频驱动器中频段增益为3dB的情况,所需的V*为354mV,最小所需电源电压约为2.12V。基于此,可以进一步推导出驱动器的功耗和能源效率表达式。
四、带宽感知的电光协同优化框架 (一)优化发射机电光带宽
根据推导的从TX的MZM驱动器输入到RX的平衡PD输出的相干发射器频域传递函数表明,发射器的频率特性受激光分光比k、激光功率Plaser、MZM长度L、Driver的gm和Rp等多个设计参数的影响。 整体发射器的频率响应由DRV和MZM EO移相器的频响共同决定。由于EO移相器带宽受器件设计和制造工艺参数的限制,即使提高DRV带宽,整体发射器带宽仍可能受限于MZM。因此,将带宽约束纳入协同优化框架至关重要。
通过传递函数可以数值计算平衡PD输出的电流脉冲响应,进而得到内PAM4眼的垂直眼开度(VEO)。考虑带宽限制后,图10展示了不同TX 3dB带宽下的电流脉冲响应,以及TX 3dB带宽和驱动器3dB带宽与Rp的关系,还有VEO与TX 3dB带宽在不同均衡场景下的关系。结果表明,对于未均衡的链路,最佳VEO对应的带宽为0.4倍符号率,而对于采用1抽头判决反馈均衡器(DFE)或1抽头TX前馈均衡器(FFE)的链路,该值为0.28倍符号率。1抽头TX FFE和1抽头DFE分别能使VEO提高1.8倍和2.2倍,对应SNR提升5.1dB和6.8dB。
(二)激光功率灵敏度分析 由于SNR随激光功率的增加而单调增加,在找到使VEO和SNR最大化的最佳发射机带宽后,下一步是确定激光功率灵敏度,即满足目标BER的最大VEO对应的最小总激光功率。假设采用KP - 4 FEC,目标BER为2.4e-4,图11展示了不同链路情况下BER随激光功率的变化。未均衡链路的激光功率灵敏度为19.3dBm,而采用1抽头DFE和1抽头FFE的链路,激光功率灵敏度分别为12.8dBm和14.8dBm。
(三)优化激光分光比 优化激光分光比k的目标是最大化SNR,从而最小化激光功率灵敏度。当总噪声主要由TIA热噪声主导时,k = 0.5可实现最佳BER和SNR,因为此时信号摆幅最大。但当散粒噪声与热噪声相当或主导总噪声时,由于散粒噪声与k相关,最佳分光比会发生变化。
图12展示了不同TIA输入参考热噪声下,SNR随分光比的变化。对于实际的热噪声值,最大SNR点会向较低的k值移动。例如,当热噪声电流为2µA时,最佳分光比为0.2。通过优化激光分光比,未均衡链路的激光功率灵敏度可提高1.8dB,采用1抽头DFE或1抽头FFE的链路分别可提高1.1dB和1.3dB。 (四)实现最佳能效 在前面的协同优化中,假设了固定的MZM长度和DRV增益gm来优化激光能源效率。接下来,研究不同驱动器gm值对激光能源效率和总发射器能源效率的影响。 图13展示了在采用1抽头DFE均衡链路且MZM长度为1mm的情况下,不同驱动器gm值对应的DRV、激光器和总TX能效。当gm较小时,链路需要更高的激光功率,整体能效主要由激光功率决定;随着gm增大,DRV功率在整体能效中的占比逐渐增加。总能效的最佳值为1.35pJ/bit ,对应的gm=80mS。
此外,图13还比较了不同均衡场景下的总能源效率。未均衡链路的最佳TX能源效率为2.27pJ/bit,采用1抽头DFE和1抽头FFE后分别提升至1.35pJ/bit和1.63pJ/bit。同时,随着gm增加,所需激光功率降低,散粒噪声贡献减少,最佳k值会增大;采用均衡后,所需激光功率进一步降低,使得最佳k值相比未均衡情况更高。 MZM长度对总TX能源效率也有影响。虽然增加MZM长度起初能提升能源效率,但由于光学损耗、带宽和相移之间的权衡,在达到一定长度(约1mm)后,这种提升会趋于饱和。因此,设计者可根据硅片面积和整体功率预算,参考本文的分析来选择合适的MZM长度。整个协同优化过程如算法1所示,通过对各个参数的逐步优化,实现整体能源效率的提升。
五、研究总结 本文提出了一种基于发射器脉冲响应的电光协同优化框架,旨在提升O波段相干发射器的整体能效。该框架能帮助设计者在电气和激光功率预算的约束下,综合考虑带宽限制和链路均衡能力,选择最优的光学和电气设计参数。 通过这种协同优化,在224Gb/s QAM - 16操作下,优化后的未均衡线性驱动发射器的能源效率预计可达2pJ/bit(包含激光功耗);采用1抽头TX前馈均衡(FFE)后,能源效率可降至1.4pJ/bit;采用1抽头判决反馈均衡(DFE)后,能进一步降至1.2pJ/bit 。这一研究成果为数据中心CPO链路的发展提供了重要的技术支持,有望推动数据中心光互连技术朝着更高带宽密度和更低功耗的方向发展。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有