
1
SUE融合Scale-up与Scale-out
继前序两篇文章我们深度剖析了字节跳动EthLink的“单点破局”与UALink联盟的“合纵连横”之后,博通的Scale-Up Ethernet (SUE) 携更高维度的战略悄然入局。SUE所描绘的更像是一个统一的以太网大市场,其战略并非简单选边站队,亦非创造NVLink的替代品,而是试图用无处不在的以太网试图融合统一Scale-up与Scale-out这两个壁垒分明的世界。
这一宏大愿景的“战略宣言”与博通高管发表的官方博客《Scale-up is simple. Ethernet makes it smarter.》的核心论点遥相呼应:
博客核心观点佐证:“Scale-up is simpler than scale-out. And with the right foundation, such as Scale-Up Ethernet (SUE)... it's far more flexible.”
正如博通CEO Hock Tan所言:“网络就是算力 (The network is the computer)”。这本质上是一场“阳谋”:一个SUE框架统一横向扩展(Scale-out)与纵向扩展(Scale-up)网络技术栈,同步满足两类场景的核心需求,其战略吸引力清晰地体现在四个层面:
① 统一网络架构 (Unify Fabrics):统一Scale-up与Scale-out网络技术栈;
② 利用庞大生态 (Leverage the Ecosystem):寄生以太网瞬间拥有成熟生态;
③ 降低总拥有成本 (Reduce TCO):统一网络技术栈、极简配置、简洁运维;
④ 促进开放创新 (Foster Open Innovation):“因设计而开放”,赋能全行业无门槛创新。
而支撑这一愿景的“技术圣经”正是博通贡献给OCP的《Scale Up Ethernet Framework Specification (Scale-Ethernet-RM102)》白皮书(SUE框架)。
接下来我们就将以这份白皮书为核心结合博通高管博客文章为您带来博通SUE框架六大核心亮点,同时横向对比字节EthLink与UALink揭示三者在核心战力上的趋同与分野,看看博通SUE能否真正实现融合统一Scale-up与Scale-out实现一统以太网大江湖。
2
SUE六大亮点与字节EthLink&UALink的核心战力对标
亮点一:“借壳上市” vs “另起炉灶” vs “单点破局”
三者选择了截然不同的哲学路径:UALink“另起炉灶”,构建全新协议栈;字节EthLink“单点破局”,以一家之力深度魔改;而SUE则是“借壳上市”——即“最大化利用,最小化创造”。它并非推倒重来,而是如“轻骑兵”般“寄生”于标准以太网,巧妙地将自身的打包/映射层(Packing/Mapping)、传输层(Transport)和网络头(Network header)构建在标准以太网MAC/PHY层之上。
白皮书原文佐证 (Section 6.1.2 SUE Overview):“The intent of Scale Up Ethernet (SUE) is to provide the transport and ethernet datalink to move memory transactions between XPUs。”

图1:SUE协议栈架构
这种“借力打力”的策略让SUE能无缝运行于现有以太网硬件,瞬间获得其全部生态优势,避免了UALink从零构建生态的漫长过程。其核心价值主张正是用一种技术栈同时解决Scale-up和Scale-out两大难题,打破技术壁垒。
① 对标EthLink: SUE的目标正是要将EthLink深度“魔改”所验证的无损、低延迟性能,进行标准化、产品化。
② 挑战UALink: 博通认为UALink“另起炉灶”式的专用协议并非必需品。一个统一的、端到端的以太网解决方案,凭借其庞大生态显然更具优势。
亮点二:报文头压缩的“英雄所见略同”
AI训练中充斥着海量高频、小尺寸的控制信令。于此,传统以太网臃肿的报文头(Ethernet + IP + UDP)极大降低了有效Payload率。
为实现“减负”,SUE亮出了与EthLink异曲同工的王牌——AFH Gen 2 (Al Fabric Header Gen 2)。
白皮书原文佐证 (Section 6.3.5.1 Network Encapsulation):“Al Forwarding Header Gen 2 (AFH Gen 2) - A more optimized Layer 2 format, where the forwarding information is reduced to 6 or 12 bytes... The AFH formats reduce the overhead on the wire.”
AFH Gen 2最激进的版本,可将转发信息压缩到仅6个字节,如同将厚信件换成电报码,为海量的微小控制信令与原子操作,革命性地提升了有效Payload率。
相比之下,UALink通过重构全新DL/TL协议层来达成效率目标。这清晰体现了行业共识(标准IP头过于臃肿)下的路线分野:SUE与字节EthLink选择“做减法”,而UALink选择“重构”。

图2: SUE Lite的极简封装,AFH Gen 2仅占6字节
亮点三:“软绑定” vs “开放联邦” vs “自给自足”
如果说UALink的“开放联邦”与字节EthLink的“自给自足”代表了清晰的生态模式,那么SUE的“双版本”交付模式:
白皮书原文佐证 (Section 6.2.2 SUE Lite Simplifications & Table 2):“The SUE Lite profile was created to reduce the size of SUE IP by up to 50 percent. In SUE Lite, the SUE reliable transport layer is removed and LLR is used for to provide reliability between nodes.”
① 完整版SUE:内置可靠传输层(Reliable Transport Layer),负责端到端重传与拥塞控制。
② SUE Lite:去除了可靠传输层,将数据可靠性保障的重任完全下放给网络硬件(交换机/网卡)的LLR(链路层重传)功能,舍弃了端到端可靠性以及对应的拥塞控制能力。
这一招堪称“一石二鸟”:既以SUE Lite(更小IP、更低功耗)吸引XPU厂商,又巧妙地将必须支持LLR等高级特性(博通Jericho和Tomahawk系列芯片的“王牌功能”)与高端交换机进行“软绑定”。
博通此举看似为市场提供了更多选择,实则通过一个更具诱惑力的“SUE Lite”选项作为诱饵,正不动声色地将整个生态的价值重心牵引至其核心优势领域——交换芯片。博通凭借在云端数据中心以太网交换机高达90%的市场占有率以及独霸全球交换机芯片市场十多年的统治力,拥有无人能及的优势。
相较于UALink,“SUE架构”虽非由第三方组织设计的开放标准,但其基于以太网规格的设计,确保了与现有数据中心广泛采用的以太网交换机芯片生态系统的高度兼容性。这使得SUE能够轻松实现高带宽、低延迟的性能,在成千上万个GPU、CPU芯片间构建高速互联。
亮点四:LLR & CBFC——行业共识硬件级双保险
为了在开放的以太网上实现无损传输,SUE、字节EthLink与UALink联盟最终都走向了同一技术方案:——引入了两大关键技术:LLR (链路层重传) 和 CBFC (基于信用的流控),将可靠性下沉至硬件,彻底替代了应用层的“软件变通”和实现“主动保障”。
白皮书原文佐证 (Section 6.3.5.5 & 6.3.5.7):
① LLR (Link Layer Retry):在链路层实现快速丢包检测与重传,针对链路上的CRC错误等物理丢包,LLR在硬件层面进行纳秒级的快速重传,避免了端到端的漫长等待。
② CBFC (Credit Based Flow Control):相比PFC支持更多无损队列和智能调度,取代了传统PFC粗暴的“暂停”信号,从源头杜绝拥塞丢包的可能。
③ LLR (链路层重传):在链路层实现快速丢包检测与重传,针对链路上的CRC错误等物理丢包,LLR在硬件层面进行纳秒级的快速重传,避免了端到端的漫长等待。
亮点五:回归内存语义
在AI互联领域回归内存语义 (Memory Semantics)已成为势不可挡的行业趋势。
正如SUE框架规范 (Section 6.4.1) 所定义:SUE核心通信模型建立在共享内存架构之上,原生支持单边操作 (one-sided operations):put、get 和 atomics。
SUE的目标直指XPU紧耦合计算中的内存访问模式:即通过硬件级效率最大化减少软件协议栈开销,尤其适用于细粒度数据同步,力求消除计算与通信间的“阻抗失配”。
不同的语义选择反映了不同的生态哲学与优化取向。SUE/UALink 的专注代表了对主流高性能同步模式进行极致优化的坚定押注,字节EthLink、SUE、UALink三者技术路径对比如下:
① 字节EthLink在此道路上先行一步提供了“双语义”支持(Load/Store + 轻量级RDMA),赋予应用层选择的灵活性。
② SUE 与 UALink 则殊途同归——两者均聚焦于内存语义以简化编程模型。UALink 采用Load/Store,而SUE 对“单边操作”的强调,更凸显其简化协调、降低CPU介入的目标。
亮点六:剑指NVLink的“1024节点俱乐部”
正如SUE规范 (Table 1 及 Section 6.1.1 示例)所定义的在关键性能指标上SUE 框架设定了极具竞争力的目标:
① 极致低延迟:目标实现单跳交换下的端到端往返延迟(RTT) 低于 2 微秒 (< 2µs)。
② 超高带宽:单个SUE实例支持800G带宽作为基础单元,通过多实例聚合(如规范示例中的12x 800G),一对XPU间的带宽潜力可高达9.6 Tbps,一定程度上满足了带宽密集型AI工作负载扩张场景需求。
③ 庞大规模化:与UALink看齐,SUE设计支持在单个计算域内连接多达1024个XPU。
Scale-up层面突破传统PCIe局限,博通推出符合SUE标准的芯片——Tomahawk Ultra,将以太网技术引入机柜级互联场景,打破了英伟达NVLink的封闭架构垄断,实现单节点性能跃升。
SUE的设计清晰体现了其战略意图——依托以太网生态,通过支持高效内存语义操作和设定极具竞争力的性能目标,在性能、规模和成本效益间寻求最佳平衡点,走出一条独特的、务实的技术路径。
综合来看,SUE并非推倒重来,而是站在AI互联领域巨人之上进行迭代创新——系统性整合融入字节EthLink和UALink等已经被成功验证的技术方案,又巧妙地将这些技术嫁接到博通最擅长的开放以太网生态之上,进而凭借自身在以太网无可撼动的统治地位发起的一场“降维打击”。
3
开放网络生态:“降维打击”与未来的竞合
SUE的本质是网络巨头博通凭借其在以太网领域无可撼动的统治地位发起的一场AI互联领域的“降维打击”。它试图跳出“开放联盟 vs. 封闭帝国”的二维战争重新拉回到自己最擅长的维度——即用一个足够强大、足够开放、成本足够低的“统一标准”,让所有“专有标准”都显得多余。这是一场赌上以太网荣誉的终极阳谋。
3.1、技术哲学的十字路口
SUE的宏大愿景无疑是AI互联棋局中的一步险棋,其前路挑战亦如影随形。它所力倡的“以太网统一”哲学与字节NVLink“软硬一体、性能至上”的垂直整合模式、以及UALink联盟“开放标准、内存专用”的联邦路线形成了鲜明对比,这不仅是战略分野,更是技术路径的根本抉择。例如在核心技术路径上SUE坚持以太网的“以太网统一”,与UALink为内存语义“另起炉灶”、EthLink进行“深度定制”的思路便截然不同。这些战略选择上的根本分歧,最终将体现在性能、成本与生态等多个维度上,预示着这场标准之争的复杂性与长期性。
3.2 博通的“双面游戏”
面对后起之秀UALink、字节EthLink、以及Arista、思科等以太网芯片领域的竞争对手,博通会以什么样的心态来面对?尤其值得玩味的是博通不仅是SUE的核心发起者,同时也是UALink联盟的创始成员,这种“双重身份”让人不由得起疑思:博通将如何平衡自己在UALink和SUE这两个看似竞争的技术路线之间的关系和角色定位?
3.3 开放网络的大势所趋
答案或许暂时扑朔迷离,但唯一能确定的是数据中心领域的开放网络趋势已不可阻挡。进入AIGC时代,尽管短期内全球及国内市场仍将维持“一极主导、多极追赶”的竞争格局,但开放网络的趋势不会发生根本性转变,开放以太网是AI网络的“唯一最优解”——既能覆盖从单机架扩展到跨数据中心的全场景,又通过开放生态降低成本与风险,同时具备“高带宽、低延迟、高可靠”的技术能力,它终将引领AI基础设施发展的新范式,而博通的SUE阳谋正是这场范式转移浪潮中最值得关注的变量之一。
3.4 预告
字节Ethlink的“单点破局”、UALink的“联盟合纵”与SUE的“统一阳谋”——AI Scale-Up互联的三大流派已然登场。如若字节Ethlink、UALink、SUE三者同台竞演又将这将碰撞出怎样的火花呢?
尤其值得玩味的是作为SUE的核心发起者,博通同时也是UALink联盟的创始成员,网络巨头博通如何平衡和最大效力发挥“双重身份”以及“亦敌亦友”的复杂策略背后又隐藏着怎样的终极盘算呢?
“AGI小咖”后续系列文章将为您试图揭开博通“双面游戏”的神秘面纱、三大技术流派的终极横向对比等,敬请持续关注“AGI小咖”后续精彩分享。
对咯,面对字节Ethlink的“单点破局”、UALink的“联盟合纵”、SUE的“统一阳谋”与英伟达NVLink的“黄金围墙后花园”,您更看好哪条路能最终主导AI算力互联的未来?欢迎在评论区留下您的判断!