
在 AI 智算与大规模云数据中心时代,网络的微秒级波动都可能对业务性能产生巨大影响。为了应对传统监控技术的局限性,星融元基于 INT(带内网络遥测) 技术推出了 EasyRoCE-CMA (Congestion Monitoring & Alert) 拥塞监控与告警工具 。该工具具备纳秒级的采集精度,能够直观呈现交换机端口队列级的拥塞与丢包状态,为网络快速调优提供精准决策支持 。
传统的网络监控主要依赖 Pull(如 SNMP 轮询)或 Push(如 SNMP Trap/Syslog)模式。Pull 模式受限于轮询间隔,实时性差;Push 模式虽实时性稍强,但往往信息孤立。
INT 技术的引入彻底打破了这一瓶颈:

EasyRoCE-CMA 充分利用星融元交换机的硬件特性,通过两类关键信息识别网络异常:


EasyRoCE-CMA 运行在专用服务器上,通过交换机预留的独立 INT 接口(10G 通道)进行数据传输,确保网络遥测不占用生产流量带宽 。

EasyRoCE-AID 对接,同步交换机基础信息,提供图形化的 HDC/BDC 配置界面 。


EasyRoCE-CMA 以 INT 技术为核心,将网络监控的颗粒度细化到纳秒级,有效解决了智算中心网络“看不见、看不准”的问题 。通过对拥塞与丢包的实时捕获,它不仅是高效的排障工具,更是网络性能持续优化的有力助手。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。