前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DesignCon 2025: Ranovus/联发科/富士康的CPO方案

DesignCon 2025: Ranovus/联发科/富士康的CPO方案

作者头像
光芯
发布于 2025-04-08 13:29:32
发布于 2025-04-08 13:29:32
1740
举报
文章被收录于专栏:光芯前沿光芯前沿

共封装光学技术通过紧密集成ASIC与光学引擎,显著降低了AI计算中的互连功耗(达75%)与延迟,同时提升I/O密度。在Ranovus和联发科/富士康的这个合作项目中展示的8×800G CPO系统已验证其在信号完整性、热管理和兼容性方面的可行性,为下一代200G及更高速率的光互连奠定了技术基础。随着UCIe等先进封装技术的成熟,CPO有望成为超大规模数据中心与AI集群的核心互连方案。

◆ AI计算驱动下的互连技术革新

随着AI训练模型规模的指数级增长,传统电气互连的带宽与能效瓶颈日益凸显。如图1.1所示,计算硬件(如GPU)的浮点运算能力(FLOPS)增速远超互连带宽,导致计算效率受限于数据传输延迟与功耗。尤其在分布式AI训练中,矩阵分块计算(图1.2)需频繁交换数据,传统可插拔光模块因需Retimer而引入额外功耗(典型值14W,17.5 pJ/bit)和延迟。共封装光学(CPO)技术通过将光学引擎(OE)与ASIC直接集成,可消除中继器,显著降低功耗并提升带宽密度。

本文工作介绍了一种CPO系统,其中基于硅光子微环调制器(MRM)的光引擎围绕支持无重定时光学的ASIC进行共封装。光引擎与协议无关,因此可用于以太网或其他流量类型,如PCIe。

ASIC具有112G - PAM4 - LR SerDes,总带宽为14.4Tbps,其中6.4 Tbps的带宽通过CPO流量传输,其余部分通过前板可插拔光模块传输。这种混合设计在需要CPO的功率效率和可插拔模块的灵活性时,便于CPO的应用。例如,在TOR应用中就是如此。

概念验证(POC)平台考虑了可维护性,8个光引擎可从基板上拆卸。承载ASIC和8个光引擎的基板通过LGA主机插座连接到PCB,因此也可拆卸。主机插座提供良好的信号完整性,以支持112 Gbps PAM4流量,并且这些电气通道符合C2M要求。

◆ CPO关键组件与系统设计

1. 硅光子8×112 Gbps模拟光学引擎(AOE)

◆Odin®8P光学引擎

基于Global Foundries 45SPCLO光电集成工艺,单芯片集成8通道112G PAM4链路(调制器、Driver、PD、TIA都集成在片上),支持两种激光源:

集成光源(ILS):8个片上DFB激光器,功耗3.6W(4.5 pJ/bit)。

外置光源(ELS):通过PMF光纤连接OIF标准ELSFP光源,功耗2.25W(2.81 pJ/bit)。

微环调制器(RRM)

相比传统行波马赫-曾德尔调制器(TW-MZM),RRM面积仅0.12 mm²(TW-MZM为1.2–2.4 mm²),能效提升至1 pJ/bit,且通道密度更高(间距200–300 μm)。

◆光引擎

光引擎由单片L - EPIC芯片、MCU和通过双面SMT工艺组装在引擎基板上的支持组件组成。引擎基板包括一个400 µm间距的LGA阵列,用于与高性能插座中介层配合使用。盖子用作结构散热器和符合EMI / EMC标准的法拉第笼。激光光源集成在L - EPIC单片器件上,线路侧光发送和接收通道通过带有应力消除的16×(单模光纤)SMF带状光纤模块。AOE封装组件通过间距为400 µm的27×19 mm LGA插座与下一级有机基板进行电气互连。选择该基板尺寸是为了便于未来扩展到12.8 Tbps的容量。需要外部压力和PCBA或基板下方的加强件来连接LGA插座并保持良好的电气接触。

2. CPO基板与机械设计

在这项工作中,Ranovus、联发科和富士康共同设计了包含ASIC和光引擎的系统。

基板尺寸75×75×2.207 mm,支持ASIC(25.64×17.77×0.6 mm,功耗150W)与8个OE(单个功耗4W,总功耗32W)的集成。

关键设计如下:

◆ 双面LGA接口

底部900 μm间距LGA连接主板,顶部8组400 μm间距LGA连接OE,通过弹性压缩机构(工作范围70 μm)确保信号完整性(图2.3)。

◆ 热设计及仿真

定制散热盖(富士康设计)结合独立OE散热片,热仿真显示在45°C环境温度下,OE温度可控制在70°C以内(图2.6)

◆ 系统协同仿真与信号完整性

1. IBIS-AMI联合仿真模型

◆仿真涵盖ASIC SerDes(7nm FinFET工艺)、CPO基板、LGA插座及OE的光电转换链路(图3.1)。

◆通道损耗分析

ASIC至OE的B2B(Bump-to-Bump)损耗为5–9 dB(@28 GHz),最坏情况BER仍满足400G/800G以太网RS-FEC标准(BER限值7.86e-6),并预留1000倍的BER余量(图3.3)。

◆ 系统集成与测试验证

◆ 机械装配

OE通过LGA插座安装至基板,散热盖与PCB通过弹簧机构均匀施压(图4.2)。

◆链路调优

ASIC SerDes的预加重(Pre/Post Cursor)、CTLE增益及时钟恢复(CDR)参数优化,确保BER达标。

◆ 测试场景

包括ASIC SerDes自环(A)、OE自环(C)、OE间互连(D)及与第三方800G QSFP-DD模块互操作(E)。

◆ CPO系统测试结果 ◆ 光引擎生产测试

Odin®8P光引擎的生产测试在一个配备5nm oDSP的参考平台上进行,包括使用SSPRQ模式进行光发射机合规性测试,参考400GBASE-DR4中的接收端定义,即均衡器为带宽26.5625GHz的5抽头前馈均衡器(FFE);以及使用PRBS31Q模式进行直接光回环误码率测试。自环的BER都小于8e-10。

◆ CPO系统背对背链路性能测试

Odin®8P-ILS(片上光源)和Odin®8P-ELS(外置光源)在系统中的典型功耗分别为4.5pJ/b和2.8pJ/b,这种差异主要源于片上分布式反馈(DFB)激光器的功耗。不知道片上光源是不是还用Flip chip工艺做的,为了去掉隔离器增大了耦合损耗导致功耗偏高,理论上用定制激光器和倏逝波耦合的方案应该性能会更好一些。

光引擎的光发射机与ASIC主机SerDes协同优化,以符合IEEE 802.3 100G以太网标准。使用Ranovus制造的外部激光源(4通道,每个保偏光纤功率为13dBm,如图5.5所示)为Odin®8P-ELS光引擎提供光信号。

使用PRBS31Q模式对所有32个双向电-光-电(E-O-E)通道进行了端到端链路性能测试,在固定主机SerDes Tx FIR设置下,典型误码率在2E-10到2E-8之间。该测试结果与第3节中协同仿真预测的性能相符。 ◆ CPO系统与ELSFP及第三方模块的链路测试

使用第三方基于EML的800G-DR8可插拔QSFP-DD模块进行了系统级互操作性测试。在该测试中,CPO系统部署了8个光引擎(4个Odin®8P-ILS和4个Odin®8P-ELS)。

为4个Odin®8P-ELS光引擎提供光信号时,使用了O-Net Technologies提供的符合OIF标准的商用ELSFP模块,其激光波长为1310nm,每根光纤输出激光功率为20dBm。通过1×4保偏光纤分路器(耦合损耗约1dB)将激光源与每个Odin®8P-ELS光引擎的4根保偏光纤相连,使每根光纤的输入光功率约为13dBm。 使用PRBS31Q模式对所有96个双向E-O-E通道进行了端到端链路性能测试,并验证了互操作性。所有96个双向EOE通道的端到端链路性能均符合要求。而且实验中所有64个端口采用固定的主机SerDes Tx FIR设置,而不进行逐端口微调。

◆ CPO系统能效 比较了双向800G以太网链路使用标准光可插拔模块、Odin®8P-ELS和Odin®8P-ILS时的能效。

- 带5nm DSP的可插拔800G模块:典型功耗约14W,功率效率17.5pJ/bit。 - Odin®8P-ELS:ELSFP搭配8个设置为20dBm的DFB激光器;总功耗约7W。每个激光器通过1×4 PM分路器为一个Odin®8P-ELS单元提供光信号,每个ELSFP激光器功耗约0.875W,光引擎典型功耗2.25W,功率效率3.9pJ/bit。 - Odin®8P-ILS:集成8个DFB激光器,光引擎典型功耗3.6W,功率效率4.5pJ/bit。 在光链路性能完全可互操作且可比的情况下,ELS和ILS解决方案与传统面板可插拔模块相比,功耗显著降低3到4倍。

◆ 200G/lane路线图

随着数据速率提升至200G,高能效共封装解决方案的优势更加明显。在更高数据速率下,ASIC与光引擎之间的铜连接长度进一步缩短,这使得共封装架构更具优势。 实现电气接口有两种不同潜在方法: ① 由ASIC的高速SerDes驱动的无重定时(线性)光引擎。 ②光引擎集成高速SerDes,并通过低速宽接口(如BoW或UCIe)与ASIC连接。

图6.1展示了一款23mm宽的ASIC及其两种电气接口选项。左图显示ASIC中集成了高速SerDes(×200G),右图则显示同一ASIC采用UCIe接口(×25G)并搭配先进封装选项。

图6.2展示了当前200G选项在关键指标图上的对比情况。目前所有选项都与“绿色”目标区域存在较大差距。先进的共封装光引擎能够满足这些要求,并助力未来AI计算集群的发展。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光芯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
应用于CPO封装模块内的光纤互联方案
随着Serdes传输速率的提升,交换机功耗和信号损失、系统集成度等问题愈发具有挑战, CPO新技术渗透率加速提升。根据LightCounting的数据显示,人工智能对网络速率的需求是当前的10倍以上。LightCounting预计CPO技术的出货将从800G和1.6T端口开始,在2024至2025年期间开始商用,2026至2027年开始规模上量,主要应用于超大型云服务商的数通短距场景。
亿源通科技HYC
2024/12/29
4010
应用于CPO封装模块内的光纤互联方案
OFC 2025预热(二):短距光互连的明星初创公司们
今天来看看OFC 2025上那些明星初创公司都介绍了哪些有意思的进展。主要介绍的公司之前都有陆续写过,包括Ayar labs,、Lightmatter、Celestial AI、OpenLight、Xscape、Lucidean等。Lightmatter和Celestial AI的验证结果展示感觉是脚步最快、最惊艳的(也体现到他们的融资上),Ayar Labs在瞄准大规模制造优化耦合封装方案,而Xscape、Lucidean公司也有了不俗的进展,Nubis展示了新的应用场景,奇点光子开始露面,Openlight平台在持续演进,昨天Tower新闻稿提到的400G/lane技术看会不会在会场有介绍。
光芯
2025/04/08
1850
OFC 2025预热(二):短距光互连的明星初创公司们
Broadcom的CPO进展
前段时间,关于TSMC和Nvidia、Broadcom合作开发硅光技术的新闻引起了大家的广泛关注。巨头们的强强联合,必定会对硅光产业带来深远的影响。Broadcom是目前仅有的几家发布CPO产品的公司,这篇笔记主要介绍下其CPO技术上的进展与细节。
光学小豆芽
2023/10/23
1.8K0
Broadcom的CPO进展
OFC2024: CPO时代来临了吗?
今年的OFC大会上,来自Marvell的Matthew Traverso做了题为"Advancement in CPO and Ecosystem"的邀请报告,系统地梳理了芯片大厂在CPO领域的进展。小豆芽这里整理下相关信息,供大家参考。
光学小豆芽
2024/06/07
1.3K2
OFC2024: CPO时代来临了吗?
Cignal AI的数据中心光组件初创公司信息汇总
原始网页链接:https://cignal.ai/2024/10/optical-component-startup-tracker/
光芯
2025/04/08
1260
Cignal AI的数据中心光组件初创公司信息汇总
Nvidia的硅光CPO交换机,来了!
Nvidia GTC 2025大会,老黄的Keynote报告介绍了基于Nvidia Photonics与众多合作伙伴开发的Spectrum-X和Quantum-X硅光CPO交换机,预计分别于2025H2和2026H2发布,规格分别是144×800G以及512×800G。采用CPO交换机在数据中心内可以节省几十MW的电力,相当于近百个Rubin Ultra机架(单个6MW)的耗电量。关键技术包括:
光芯
2025/04/08
1880
Nvidia的硅光CPO交换机,来了!
OFC 2025 TeraHop报告:AI数据中心光连接技术
在人工智能技术快速发展的背景下,AI数据中心的建设对光模块技术提出了更高要求。TeraHop在OFC 2025会议上的报告,深入探讨了这一领域的现状与未来。
光芯
2025/04/22
2150
OFC 2025 TeraHop报告:AI数据中心光连接技术
数据中心的黑科技——到底什么是NPO/CPO?
所谓“东数西算”,其实就是数据中心的任务分工调整。我们将东部沿海地区的部分算力需求,转移到西部地区的数据中心完成。
鲜枣课堂
2022/12/30
1.2K0
数据中心的黑科技——到底什么是NPO/CPO?
CPO光模块的技术革新与产业困局:1.6T/3.2T时代可插拔方案的持续主导
共封装光学(Co-Packaged Optics,CPO)作为硅光技术的重要演进方向,正在引发数据中心互连架构的深层变革。该技术通过将光引擎与交换芯片集成于同一封装基板,构建起"光电协同设计"的新范式,较之传统可插拔光模块展现出显著优势:
武汉格凌科技
2025/04/15
1640
CPO光模块的技术革新与产业困局:1.6T/3.2T时代可插拔方案的持续主导
Intel 的光学互连方案 -- CPO 与 OCI 以及 4Tbps 光学小芯片
这两天 Intel 公司在 “HotChips 2024” 中介绍了它的”4Tb/s Optical Compute Interconnect Chiplet for XPU - to - XPU Connectivity“。翻译过来就是 ”用于 XPU 到 XPU 连接的 4Tb/s 光计算互连芯片“。
通往ICT之路
2024/08/30
7710
Intel 的光学互连方案  --  CPO 与 OCI 以及 4Tbps 光学小芯片
OFC2024:爱立信视角-CPO与相干光收发器技术,如何提升RAN网络能效?
爱立信在OFC2024上认为:传统光通信系统的研究主要集中在提高性能上,例如提升比特率或减少延迟,但对能效的关注却远远不够。如果继续沿用当前的设计实践,通信网络的能耗将随着数据流量的激增而变得不可持续。
通往ICT之路
2024/05/28
2570
OFC2024:爱立信视角-CPO与相干光收发器技术,如何提升RAN网络能效?
Ayar Labs:用于CPO的Linear直驱相干硅光链路的光电协同优化
原文链接: https://ieeexplore.ieee.org/document/10850772
光芯
2025/04/08
820
Ayar Labs:用于CPO的Linear直驱相干硅光链路的光电协同优化
光电共封装(CPO)产业链投资机会梳理
2025年3月18日,在GTC2025发布会上,英伟达推出了全新的NVIDIA Photonics硅光子技术。这项技术通过共封装光学(CPO)取代传统的可插拔光学收发器,使光纤直接连接到交换机,大幅减少数据中心的功耗。据英伟达测算,该技术可降低40MW的功耗,并提高AI计算集群的网络传输效率,为未来超大规模AI数据中心奠定基础。基于此,英伟达推出Spectrum-X与Quantum-X硅光子网络交换机,通过将电子电路与光通信技术深度融合,助力AI工厂连接跨地域的数百万GPU集群,从而降低能耗与运营成本。这表明,CPO技术为未来发展趋势。
AIGC部落
2025/03/21
1940
光电共封装(CPO)产业链投资机会梳理
浅谈CPO与LPO,到底有什么不一样?
传统的光模块是独立于交换芯片之外,通过铜缆或光纤与其他电子组件相连,这种方式在高速信号传输过程中容易产生较大的功耗和信号损耗。特别是,DCI等网络速率逐渐从400G发展到800G,甚至1.6T,不久的将来可达到3.2T,单个光模块的功耗也在增加。
通往ICT之路
2024/04/10
4.2K0
浅谈CPO与LPO,到底有什么不一样?
OFC 2025:AI高速互连技术报告(Nvidia)
(该报告是今年OFC上OIF光互连论坛的开场报告,其实也没有太多新的信息,偏科普性质,简单收集一下)
光芯
2025/04/19
1600
OFC 2025:AI高速互连技术报告(Nvidia)
共封装光学CPO的各种排列组合方案
本文来自Flip Chip, Hybrid Bonding, Fan-In, and Fan-Out Technology这本书的章节翻译,该书作者John H. Lau博士拥有超过40年的研发和制造经验,在半导体先进封装、flip-in和fan-out晶圆级封装、chiplet设计和3D IC异构集成封装等领域拥有丰富的专业知识,是IEEE,IMAPS和ASME三个协会的Fellow。目前是Unimicron的高级工程师。
光芯
2025/04/08
1630
共封装光学CPO的各种排列组合方案
Alphawave Semi的CPO报告(三):CPO的机遇与挑战
搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景、机遇与挑战以及光/电/封装的协同优化。以下为第三部分的翻译。
光芯
2025/04/08
980
Alphawave Semi的CPO报告(三):CPO的机遇与挑战
OFC2022: Intel的硅光版图
今年的OFC会议上,Intel有多个报告,报道了其在硅光领域的核心器件进展以及未来的布局,小豆芽这里简单整理下,供大家参考。
光学小豆芽
2022/03/29
4.7K1
OFC2022: Intel的硅光版图
OCP 2024旭创报告:硅光LPO、可安装(mountable)的CPO
旭创的于让尘博士在OCP 2024上做了报告,主要介绍了硅光在AI xPU Scale up的应用,包括可靠性、成本、功耗、集成度的优势以及LPO和Mountable CPO的解决方案。
光芯
2025/04/08
1070
OCP 2024旭创报告:硅光LPO、可安装(mountable)的CPO
博通OFC2025:光互连的“三体革命”,AI算力的管道之战
如果说AI算力是数字时代的石油,那么光互连技术就是输油管道——它的容量和效率,直接决定了算力的“开采成本”。而2025年的OFC大会上,博通用一场技术矩阵的“饱和式攻击”,宣告了这场管道战争的终局逻辑:谁能定义光互连的物理层规则,谁就能掌控下一代AI集群的命脉。
通信行业搬砖工
2025/04/07
2770
博通OFC2025:光互连的“三体革命”,AI算力的管道之战
推荐阅读
相关推荐
应用于CPO封装模块内的光纤互联方案
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档