智能体时代CPU回“C位”，英特尔至强6+重塑AI底座

芯智讯

发布于 2026-06-09 20:30:31

240

2026年6月5日，在北京召开的在英特尔至强 6+ 新品发布会暨数据中心创新日上，英特尔给出了其对AI时代下一个关键转折点的判断：当AI从大模型训练全面转向Agentic AI（智能体AI）的规模化落地，数据中心对算力的诉求正在加速回归CPU。这并非对GPU重要性的否定，而是对AI基础设施架构的一次系统性重构。

英特尔市场营销集团副总裁兼中国区总经理郭威在会上指出，以算力、数据、算法和网络为核心的AI基础设施格局正在重塑。随着AI向云、边、端更广泛地部署，混合式AI成为主流，CPU作为中枢的作用日益凸显。“面向Agentic时代，通过CPU、GPU、存储与网络的高效协同，构建系统级能力，才能真正释放AI规模化应用的价值。”

这一判断的背后，是一组关键数据：2025年，中国AI推理数据量首次超过训练数据量；预计2026至2027年，企业场景中的活跃智能体数量将同比增长超200%。当AI的工作负载从“炼大模型”转向“用智能体”，一场围绕“算力、存力、连接力、保障力”的新型智算中心底座之争已然打响。

从1:8到1:1，智能体时代CPU重回C位

在过去的大模型训练时代，一台GPU服务器通常搭配两颗CPU，形成典型的1:8配比。CPU在很大程度上扮演着“配角”，负责数据预处理和任务调度。然而，当海量智能体开始运行，任务模型发生了根本性转变。

“过去几个月我们观察到，不管你养了多少个智能体，每个都会消耗CPU；当你要让它去调用数据库、执行一段脚本，这又会占用额外的CPU算力。”英特尔数据中心集团副总裁兼中国区总经理陈葆立在会后的媒体群访中透露，国内某领先大模型厂商从去年到今年，其CPU需求已提高了5倍。“这是真实的反馈”，他基于此判断，CPU与GPU的比例正从1:8逐步向1:1甚至更高演进，最根本的逻辑在于：“当你要给AI更多任务的时候，绝大多数任务的执行者是CPU。”

这一观点得到了产业链伙伴的印证。腾讯云计算产品运营总监周驰从业务体量的角度指出，不应仅从单台服务器的比例去看待这一变化。他描述了一个显著的“破圈”现象——当腾讯首次在线下推广其智能体应用时，前来体验的人群中开发者仅占少数，更多的是律师、白领、工人、农民，年龄跨度甚至是从七八十岁的老人到十岁的小朋友。“他们都能讲出来我想用智能体干什么，这个破圈现象非常强烈。”

这种破圈意味着，大量过去因ROI不合算而未被开发的琐碎、个性化需求正在被AI自动化。这些高并发、需求多样但单点算力要求不高的工作负载，并不需要昂贵的GPU，而是极度渴求高密度、高性价比、擅长调度与持续处理的CPU。周驰判断，从全球CPU装机量来看，这将带来巨大的增量。

作为基础设施提供商，云尖信息副总裁张欢军则从服务器架构角度观察到，token（词元）爆发式增长带来的数据入口、调度、路由乃至token化处理，几乎全部在CPU集群上完成。“过去几年GPU发展快，是因为大家都聚焦在大模型。随着Agentic AI的出现，这种主动的、目标驱动的AI，让业务负载主要转移到了CPU上。”他设想，未来企业级Agent大量涌现后，CPU的比重会越来越大。

至强6+：“四力”齐发，用系统思维破解智算痛点

正是捕捉到这一趋势，英特尔推出了全新的至强6+处理器。作为首款基于Intel 18A制程的数据中心CPU，它并非一次简单的产品迭代，而是围绕Agentic AI时代智算中心的痛点，从四个维度进行了系统性升级。

在算力层面，至强 6+ 处理器拥有最高 288 能效核心，使其能在单个液冷机架（32U空间）内提供36864个核心，以极高密度承载多智能体的并发运行。其内置的AMX（高级矩阵扩展）技术，可分担AI数据预处理并为向量数据库提供加速。可以为客户提供更高并发、更低时延、更优能效的云端算力服务，支撑 AI 时代多样化的工作负载需求。

在存力层面，全新的至强 6+ 处理器不仅拥有576MB 三级缓存，还支持 12 通道 DDR5 内存、96 通道 PCIe Gen 5。搭配英特尔 QAT，可解放 CPU 处理能力，加速压缩、重删、传输等存储工作负载。

陈葆立指出了一个行业痛点：当下大模型的上下文窗口已动辄百万Token，未来可能达到几百万，由此产生的KV Cache（键值缓存）会迅速占满昂贵的显存。行业趋势是将这些数据卸载到内存或SSD中，直接导致高端SSD“奇货可居”。

“至强 6+ 处理器还有两个重要的技术，是解决这个痛点的两把‘金钥匙’。”英特尔中国区技术部总经理高宇强调，QAT（英特尔快速辅助技术）和IAA（英特尔存内分析加速器）正是为此而生。QAT能在KV Cache存盘前进行硬件级压缩，压缩比至少达50%，直接节省一半的存储成本。IAA则能对内存数据进行实时压缩和解压，在不影响加载速度的前提下，大幅节省宝贵的内存资源。高宇表示：“以前大家觉得改软件来用这些功能很麻烦，但今天它们能省下几千、几万块，大家都抢着用。机会是留给有准备的人的。”

在连接力层面，至强 6+ 处理器提供从 200GbE 到 800GbE 的持续迭代。最新推出的英特尔以太网 E835 控制器支持从 10GbE 到 200GbE 吞吐量的灵活扩展，通过提高每核带宽，在高密度虚拟化环境中充分释放高核心数 CPU 平台的性能。

在保障力层面，至强 6+ 处理器通过 6 大类 52 项 RAS 功能（可靠性、可用性、可服务性），利用英特尔 TDX 构建端到端的机密计算环境，为 AI 服务器和集群的高可靠、高可用和高可维护提供硬核守护。

单个处理器支持“1000个智能体部署”

在发布会现场，“单颗至强6+处理器支持上千智能体”的说法令人印象深刻。这一极限能力在随后的群访中得到了更细致的解构，它揭示了英特尔面向智能体时代极致的弹性。

英特尔数据中心集团副总裁兼中国区总经理陈葆立将智能体比喻为“数字员工”，能力有高低之分，因此硬件配置也需因地制宜。支持上千智能体的案例，是通过至强6+的单核架构优化，将一颗物理核心的算力资源精细切分，同时“分身”运行3到4个智能体。但他坦言，这种模式更适合处理市场调研、查询信息等相对简单的日常工作，单个智能体的绝对性能会有所取舍。这在当前大量探索性、甚至免费的服务阶段尤为适用，能够最大化固定资产的利用效率，承载海量用户。而随着未来高价值付费服务的出现，单个智能体将需要更强的能力保障，资源配比自然会走向新的平衡。

这种技术上的“弹性”，不仅体现在核心资源的切分上，更贯穿于处理器未来的宏观设计。面对是发展“大核”还是“小核”的行业争论，陈葆立给出了明确的回答：两者都需要，并确认超线程技术将回归。其根本目的是为了给客户提供选择的自由度。如果业务需要海量并发线程，可以开启超线程让虚拟核数翻倍；如果追求极致的单核性能来处理数据库调用等重型任务，则可以关闭该功能。“我们会持续把产品迭代的弹性做进去，以支撑未来各种不同的变化。”

这种灵活应变的底层能力，正是为了承接云尖信息副总裁张欢军所观察到的产业需求：在GPU机头侧需要处理复杂调度的“大核”，而在承载海量轻量级智能体本体运行时，则需要高能效的“能效核”。英特尔同时拥有并能无缝兼容这两种架构，使得基础设施厂商能够针对不同业务场景灵活定制。

那么，这是否意味着，未来客户可能只需要直接提出对于智能体需求，说明自己需要什么样的智能体能力即可，而不是像现在这样，要提具体需要多大的内存、需要什么配置的CPU。然后云服务商通过提供智能体的这种服务能力，来形成一种全新的商业模式？

对于芯智讯提出的这个问题，腾讯云计算产品运营总监周驰回应道：“我觉得这已经不是未来了。 ” 他透露，腾讯云已推出to B的“ClawPro”平台，为企业搭建好一整套包含用户管理、安全审计等能力的智能体平台。员工只需一键认领一个智能体，无需关心其背后是多少核、多大内存的服务器。而在to C领域，“LightVela”则将这一理念贯彻得更为彻底，完全屏蔽了技术概念，让非技术背景的用户感觉只是在“养一只能帮自己打工的虾”，需要更强能力时再进行“升格”。这种将智能体作为一种服务直接交付的模式，正在模糊传统IaaS、PaaS的界限，它不再售卖算力资源，而是直接交付生产力。

这正是Agentic AI时代最迷人的变革，当基础设施具备了高度的弹性，当底层芯片的复杂性被巧妙地封装和调度，最终用户所触碰到的，将不再是冰冷的服务器和晦涩的参数，而是一个个活生生的、即取即用的“数字员工”。英特尔与它的生态伙伴们，正在为这幅图景铺设最底层的基石。

生态共振：加速落地

技术能力的释放，最终需要落地于场景。在此次发布会上，多家国内空间领军企业展示了基于英特尔至强6+的合作成果，勾勒出Agentic AI落地的真实图景。

腾讯云基于全栈自研的星星海服务器，即将推出搭载至强6+的新一代云实例。周驰透露，从上一代能效核开始，腾讯云就是其AP平台的全球独占伙伴，早期的合作已广泛应用于微信、腾讯广告、腾讯会议等业务。新一代实例将释放288核的并发优势，恰好匹配智能体场景“对单个处理要求不高，但需求量巨大”的特点。

针对KV Cache带来的存储焦虑，新华三展示的UniStor X20000 AI数据存储平台，借助至强的高性能存力进行I/O数据流优化，以提升推理效率。阿里云则带来了QAT的实践，其在加解密、压缩/解压缩场景下性能提升超4倍，实现了物理空间、系统带宽和能效的全面优化。而火山引擎发布的AICC机密计算平台，则利用英特尔TDX技术，为多租户环境下的AI大模型应用构建了可信执行环境。

“我们回归到底层的技术和架构设计，英特尔在连续迭代和架构一致性上非常出色。”云尖信息副总裁张欢军指出，对于硬件厂商而言，无需重新设计硬件、即插即用的兼容性，是快速响应市场需求的关键。

小结：

从大模型到智能体，AI的竞争焦点正从单一的峰值算力，转向由系统级能力支撑的规模化、普惠化应用。在这场变革中，以英特尔至强为代表的x86 CPU，不仅是PC与服务器时代的开创者，更是新的智能体时代的智算基础设施的关键底座。

尽管前景光明，但所有参与者都清醒地认识到，Agentic AI时代的大幕刚刚拉开。当被问及芯片缺货问题时，陈葆立坦言，从去年年底开始感受到了非常强劲的需求，紧张态势短期内可见。他的底气在于，英特尔是唯一拥有自己产能的CPU/GPU芯片公司，能够为供应提供保障。但他也谨慎地表示：“这个需求能否持续旺盛，最终取决于AI是否真正提升了生产力。现在还处在非常非常早期的阶段。”

编辑：芯智讯-浪客剑

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-09，如有侵权请联系 cloudcommunity@tencent.com 删除

cpu