1.云豹智能
云豹智能公司成立于2020年,专注于云计算和数据中心数据处理器芯片(DPU)和解决方案。
它的创始人萧启阳博士是原RMI公司 (后被Netlogic / Broadcom收购) 联合创始人。核心团队来自Broadcom、Intel、Arm、华为海思、阿里巴巴。
腾讯2021年对它进行了投资,是它的最大的股东;这两年投资环境比较恶劣,但云豹智能在2023年和2024年仍有新股东投资。
云豹官网上没有提供多少自家产品的资料,只能从中获悉,它的首款DPU(云霄)于21年底发布,特性摘录如下:
(1)提供2x25G高性能以太网接口,支持主流网络和存储协议:RoCE v1&2、iWarp、NVMeoF、VLAN、 VXLAN、GRE、GENEVE、L2VPN等。
(2)实现管理、存储、网络和安全的全面卸载,支持云盘启动,解决了虚拟机和裸金属并池的关键性痛点,也为用户提供了高性价比的整体解决方案。
根据笔者查阅的新闻报道,云霄DPU的最新DPU产品是云霄S10,芯片速率高达400Gbps。
在官网上,同时提到了它的高性能软件定义DPU SoC芯片,结合新闻报道来看,这款芯片已于2023年终流片,23年底回片。
它采用创新的层级化可编程设计,集成支持P4语言的数据处理单元,自研RISC-V微处理器单元,以及高性能服务器CPU处理单元(ARM V9架构),支持全调度以太网(GSE)标准,提供最高2*200G网络连接。
还配备众多的硬件处理引擎,可实现网络、存储和安全的全面加速:
(1)数据面处理引擎提供高性能数据处理,具备灵活的软硬件可编程能力
(2)RDMA 处理引擎支持 RoCE 和 iWARP 等主流协议和可编程拥塞控制算法
(3)安全处理引擎提供SM2/SM3/SM4 等国密和其他主流加密算法
(4)支持安全启动、机密计算、加解密的零信任安全解决方案,保护系统、数据、应用的安全
(5)支持DDP(Data Direct Path)数据直通技术,加速数据处理,提高 AI 训练效率
云豹智能提供完整的软件开发平台,可以在云豹智能DPU SoC 上开发网络、存储、安
全和管控等应用。
云豹智能软件开发平台全部采用数据中心主流的开源及标准化组件和接
口,使得数据中心业务能够平滑迁移到云豹智能DPU SoC 上。
据报告称,中国移动2023年发布的用于云业务自研磐石DPU产品,和2024年发布的“智算琢光”DPU产品就是基于这颗芯片。
云豹可能在实际应用还是比较多的。
2023年,它和中国工商银行一起发布了《DPU金融行业发展白皮书》,和中国移动一起发布了《云计算通用可编程DPU发展白皮书(2023年)》,22年和中国联通发布了《中国联通DPU网络域场景应用白皮书》。
23年云豹智能入选中国信通院颁发的“算力云服务领航者计划优秀案例名单”,成为唯一一家入选的DPU芯片企业。
2.中科驭数
中科驭数成立于2018年,创始团队来自于中科院计算所体系结构国家重点实验室,专注于专用处理器研发,至今已经开展3代DPU的研发迭代。最新一代DPU产品于2024年发布。
它有自己的自研芯片K2-Pro;销售思威、福来、功夫三大系列产品;提供了三个配套开发平台:HADOS、SWIFT-NDPP、开物。
自研芯片K2-Pro基于KPU芯片架构:
可用于云原生网络卸载、服务网格卸载、裸金属、网络卸载、虚拟化、业务逻辑定制开发、存储卸载、网络安全等多场景。
中科驭数的“思威”SWIFT系列面向超低时延网络。
产品采用自主创新的超低时延软硬异构加速技术,支持中科驭数自研的HADOS软件开发平台中InstantA低时延加速库,采用kernel-bypass技术,兼容BSD Socket API,业务用户无需修改已有的应用程序,即可实现低时延加速;
产品运用了业界领先的DMA-LightningDMA极速交互技术,DMA过程化繁就简,内存访问零拷贝,打通网卡与CPU之间的数据传输瓶颈,降低PCIe数据穿透时延。
“福来”FLEXFLOW系列面向高吞吐无损网络。
FLEXFLOW-2200T是通用网卡产品,最高支持双100G网络接入能力。支持SR-IOV硬件虚拟化技术并提供完善的内核驱动与用户态驱动程序。
FLEXFLOW-2200R是RDMA网络DPU卡,可提供100GbE网口的连接能力以及无损网络能力,利用RDMA技术实现数据零拷贝和内核旁路,可极大降低数据拷贝时延,并提升传输带宽,支持SR-IOV虚拟化功能。
“功夫”CONFLUX系列面向软件定义网络。
CONFLUX-2200E 是智能网卡产品,网络加速引擎支持硬件虚拟化,具备网络功能的硬件卸载和加速能力,支持OpenFlow 协议与 P4 编程语言。
CONFLUX-2200P是高通量DPU卡,支持网络、存储、安全设备虚拟化与卸载加速等功能,同时支持P4语言编程, 结合HADOS敏捷异构软件开发平台,可以帮助使用者快速构建各种DPU应用。
CONFLUX-2200D是大数据计算加速DPU卡。配合HADOS软件平台,搭载驭数自研数据查询卸载引擎DOE(Data Offloading Engine),使DPU芯片高效应用于数据库、大数据等各类数据计算场景,全面提升数据查询和处理性能。
HADOS:DPU软件开发平台
HADOS整合DPU相关的软件能力,通过灵活高效的编程接口,将DPU的异构计算能力完全开放,能够帮助开发者快速构建DPU应用和服务。HADOS支持网络虚拟化和硬件卸载,P4可编程网络转发引擎、多元化的存储设备和存储网络,灵活可靠的安全解决方案。
SWIFT-NDPP:超低时延数据处理开发平台
该产品基于中科驭数自主研发的超低时延DPU卡及HADOS软件平台,搭载全自研商用芯片级网络卸载引擎NOE(Network Offloading Engine),集成了超低时延LightningMAC和超低时延LightningDMA技术,兼容HLS/RTL二次开发。
开物数据网络开发平台(Data Network Development Platform,简称DNDP)
它是针对新型数据中心、智算中心的数据网络研发需求而打造的软硬件一体化开发平台。DNDP硬件是全高,3/4长的PCIe卡。
软件配套提供DNDP-SDK一键式工程样例部署工具、HADOS软件工具包,并支持Xilinx Vivado和Vitis设计套件,支持高性能P4开发环境,并提供丰富的参考样例和设计指导。
中科驭数计划25年发布第四代DPU芯片K3:
中科驭数还发布了业内首部DPU技术白皮书和DPU测评方法技术白皮书。
中科驭数的官网对产品介绍的十分详尽,大家想了解更多的话,可以移步官网。
3.云脉芯联
云脉芯联成立于2021年,专注于云数据中心网络芯片产品研发与技术创新。
公司核心团队有超过20年高端芯片和一线互联网大厂云网络基础设施的研发经验,具备大芯片的工程实现能力,并在行业内率先突破了AI大模型高性能网络核心技术,支持超大规模集群。
这应该也是它在大环境不好的情况下,仍然于2023年、2024年获得新的亿元级融资的原因吧。
云脉芯联有自主研发的高性能网络互联芯片YSA-100,该芯片在2024年初成功点亮,近期已正式量产出货。该芯片具备400G RDMA能力,支持25GE-400GE网络接口,灵活的PCIe接口组合,可满足智算集群、存储网络、云计算等各类应用场景的核心需求。
云脉芯联的DPU产品是metaVisor系列AI DPU。
metaVisor AI DPU基于云脉芯联自主知识产权核心技术研发设计,除了支持传统DPU的云计算VPC网络卸载和存储卸载,还提供了高性能RDMA网络能力,独创HyperDirect技术可以有效加速GPU和AI芯片的计算效率。
HyperDirect技术支持GPU Direct RDMA 为跨计算节点的GPU实现远程内存直接访问,跳过CPU以降低时延、提升带宽,提升分布式异构算力集群的整体效能。
另外,metaVisor系列AI DPU产品还能够协同云脉芯联AI NIC产品构建端到端高性能网络监控运维管理能力,为智算中心打造更有竞争力的产品解决方案。
4.星云智联
星云智联成立于2021年,专注于数据中心基础互联通信架构和DPU芯片研发。美团和百度都有投资。
星云智联的DPU叫NebulaMatrixDPU。
官网上的D1055AS应该是21年的产品。规格如下,现在看起来没啥亮点:
带宽容量:50Gbps、网络接口:SFP28、接口速率:25GbE / 10GbE、接口数量:2、主机接口:PCIe Gen 3.0x16、管理接口:2xGE RJ45、物理形态:FHHL, Dual Slot。
星云智联自主研发的DPU芯片M18120 24年1月份有回片相关的新闻报道,据报道称,这块芯片集成了自主研发的网络、存储、安全、RDMA、可编程转发等核心技术,最大吞吐性能达到200Gbps。但官网上找不到相关的技术资料和相关材料。
星云智联挺可惜的,一开始它发展的很好,技术灵魂人物查理和有创业和融资经验的夏某配合默契,在一个月内便完成了1.8亿元的天使轮融资,美团注资后公司估值更是高达80亿。
但在巅峰期过后内部矛盾开始浮现,查理等核心技术开发人员离开了公司,同时也有公司裁员的消息。虽然24年1月份有回片相关新闻,但现在看起来产品后继乏力,公司前途不明。
5.大禹智芯
大禹智芯公司20年成立,专注于提供DPU 产品设计、研发与服务。
创始人李爽曾任美团云总经理、阿里巴巴集团网络部总监、百度系统技术委员会主席,曾领导开发中国第一代高性能网关,为中国云计算时代奠定硬件基础。其它创始人和核心团队成员也是人均拥有十年以上云计算平台设计、研发和运营的经验,曾服务于百度、阿里、美团云及英特尔、思科等公司,对云计算平台的使用场景及基础设施的搭建有着清晰的理解和丰富的实践经验。
2021年12月,大禹智芯第一代DPU产品——Paratus 1.0正式发布,通过运行在ARM SoC上的Linux操作系统及DPDK、SPDK开发套件,用户可将原先运行在主机侧的功能方便的下沉到DPU上运行,实现主机侧算力资源的释放。
第二代产品Paratus 2.0于2022 年 10 月 14 日正式发布。在1.0的基础上,2.0增加了FPGA组件。采用ARM SoC + FPGA的硬件架构,在保持了与第一款DPU产品相同的软件开发运行环境的同时,提供了基于FPGA的网络数据处理通路,大幅提升了网络流量处理能力。
在此基础上,Paratus 2.0还具有一些独特的功能:
自研高性能网络协议HPRT可充分释放RDMA应用的潜力;
无感知端到端网络数据加密功能可最大化保证数据网络传输可靠性;
网络上层应用行为分析功能可为网络入侵行为判断提供实时可靠的数据支撑。
大禹智芯今年没有大的水花,感觉活得比较艰难。
6.芯启源
芯启源公司2015年成立,是一家致力于集成电路核心知识产权(IP)、芯片及EDA工具的设计研发、生产及销售的高科技公司。2020年1月布局DPU,目前已经形成了从芯片到软件的全栈产品解决方案。
它家的核心DPU芯片--NFP网络处理器芯片内部结构如图1所示。
NFP芯片的组成包括Serdes/MAC模块、入出方向Ingress/Egress报文分类处理、流控引擎、加解密引擎CRYPTO、网络报文处理器FPC引擎簇、ARM管理引擎、PCIe主机接口模块以及内外部高速缓存和内存接口。
网络报文处理器引擎采用众核并行架构。芯片内部通过片内FPCIsland互联技术总线,整合多个FPC报文引擎集群,使得引擎能共享访问分类流控、加解密和高速存储组件,共同构成用于网络数据处理的DPU芯片。
芯片内含的众核处理器支持使用C和汇编等语言进行高效的编程开发,同时支持业界热门的P4高级开发语言、eBPF等语言,进行高层次的深度开发。
我们来看一个具体的芯片:NFP3800的性能吧。如下表所示,它有56个ME,供448个线程,还集成了各种硬件加速引擎:
芯启源的软硬件解决方案如下:
不过看下来,芯启源虽然宣称自己是DPU,但看起来更像是强大一点的智能网卡。
7.北中网芯
北中网芯公司成立于2020年,产品有NE系列DPU芯片和N5/N6系列智能网卡。
可实现网络协议处理、交换路由、安全检测等高性能和高效率的任务,具备25GE和100GE网络接入能力。
同样,虽然它宣称自己是DPU,但看起来更像是智能网卡。
8.恒扬数据
恒扬数据成立于2003年11月12日,是一家专注于智能计算与数据处理领域的企业。致尚科技于4月8日正式宣布正在筹划收购它。
恒扬数据DPU相关产品有DPU加速卡和DPU业务板。
它的DPU加速卡有三款:
(1)NSA.MA-X1 DPU加速卡
基于AMD高端系列Virtex UltraScale DPU自研的异构计算加速卡。
支持2个100GE以太网接口、PCIe3.0 x16、4组4GB DDR4。配套基于RTL的BSP开发包。
(2)NSA.MA-X3DPU加速卡
采用AMD最新一代DPU处理器Versal系列VP芯片,通过高带宽的PCIe接口与服务器CPU互联,在DPU上外挂大容量、高带宽DDR4内存组, 同时NSA.MA-X3对外设计两个用于与其他设备或两块板卡之间互联的QSFP-DD和QSFP56高速以太网接口。
支持200GB和400GB的光口报文收发,并可加速收发处理。
(3)NSA.MA-A3 DPU加速卡
是基于Intel Agilex 7 DPU的半高半长的PCIe加速卡。支持400G和PCIe5.0 x16高速接口。
它的DPU业务板是搭载DPU处理芯片的业务单元。提供24个100GE QSFP28接口和36个25GE/10GE接口。支持灵活的流量筛选策略和负载均衡功能,流管理及流统计功能,易于用户实时对全流量进行统一管理。
它的加速卡构筑在外购芯片之上,感觉公司的技术竞争力不足。
9.星融元
星融元是领先的开放网络解决方案提供商,成立于2017年,总部位于苏州。提供网络操作系统、数据中心交换机、AI智算交换机、园区交换机、DPU网卡、P4可编程硬件平台和网络可视化产品等。
Helium DPU网卡是星融元的主打DPU产品,基于高性能DPU芯片设计(24核ARM处理器,多样化硬件协处理器加速),符合PCle及以太网协议,提供PCle x8 Gen3.0/4.0通道接口并支持高达100Gbps多功能业务处理能力。
Helium DPU网卡提供了底层基座操作系统和开发套件,客户可以此为基础,直接开发上层应用程序。
基于x86开发的各种DPDK应用、VPP应用和一般Linux驱动应用,仅需要简单编译就可以迅速移植到Helium DPU网卡上.
Helium DPU智能网卡的产品资料和相关代码的开源地址:https://github.com/asterfusion/Helium_DPU
10.益思芯
益思芯科技成立于2020年7月13日,总部位于上海漕河泾,是一家存储与网络数据处理器芯片解决方案提供商。
核心成员大多毕业于国内外名校,并在思科、Marvell、ARM中国、诺基亚、博通和CNEX等知名企业有过多年的工作经历,在网络、交换、存储等大芯片设计验证方面具有丰富的经验。
益思芯有DPU芯片,官网基本没有资料,只知道它有芯片,整合网络、存储、和计算功能到单一芯片。
Stargate-F1000-SN智能网卡:
支持全硬件化的virtio、NVMe接口,与主机侧的云原生开源驱动无缝对接;
支持基于P4动态可编程的vSwitch加速,用户不仅可以根据自己的需求编程实现高速的vSwitch数据平面转发,还可以在不影响业务流的情况下,动态升级数据面转发程序;
支持可编程的存储加速功能,不但支持新型的NVMe Over Ethernet高速网络存储,也可加速Ceph, iSCSI, NFS等成熟的网络存储协议;
支持标准的RSA、AES和国密SM3、SM4硬件加解密算法、IPSec加速以及云安全NGFW、DDOS、WAF卸载。
Stargate-F1000加速卡
是基于XILINX Zynq UltraScale+ ZU19EG FPGA的可编程智能加速卡。
有2个100G网络接口、4个PCIEx4 SlimSAS存储接口,ZU19EG FPGA还集成了523K可编程逻辑单元和4个1.5G ARM A53 CPU核。
官网上没有材料,但从官网新闻中,可以看到,它们还有以下四款DPU相关产品
Stargate-N1025是在2022年发布的具有自主知识产权的P4可编程云原生DPU智能网卡,该卡支持2个25G数据网口和1个1000BASE-T GE管理网口;P4网络加速引擎是针对vSwitch加速而设计的VLIW ISA P4处理器,在保证灵活的数据包处理的同时,实现低延迟线速转发,极大卸载主CPU的负载;支持灵活的云盘启动,云盘挂载功能,满足弹性裸金属的灵活部署需求;支持用户级别、IO级别、VM级别的安全隔离,提供系统的安全性、可靠性;支持云原生软件平台,CPU侧运行云原生驱动,与开源DPDK、SPDK库无缝对接,快速对接客户的应用软件。
Stargate-N2025是N1025的升级版,支持 2 个 25G 数据网口和 2 个 1000BASE-T GE管理网口。
Stargate-R2100 是一款具有自主知识产权的 RDMA 智能网卡,支持 2 个 100G 数据网口,支持 RoCEv2 大规模网络部署。
Stargate-S1100是国内首款具有自主知识产权的云原生NVMe-oF存储加速卡,支持2个100G数据网口,和1个可选的1000BASE-T GE管理网口。益思芯科技的NVMe-oF引擎基于全硬件逻辑实现,具有高性能、低延迟等特点,适用于对高速共享存储有较高要求的云计算、HPC、数据库等应用领域。
11.库瀚科技
它的产品是eSPU(elastic Service Processing Unit),卒于2024年。