腾讯云Agent Runtime 执行引擎开放内测！专为 Agent 而生、超安全、极致弹性的Serverless AI 运行时

腾讯云原生

发布于 2025-09-29 15:23:58

1.5K0

文章被收录于专栏：腾讯云原生团队腾讯云原生团队

黄贝洋，腾讯云高级产品经理，多年B端产品经验，主要负责云原生AI Infra、Agent Infra 产品工作。

随着大语言模型（LLM）能力爆发式的增长，AI Agent 作为下一代人工智能的核心载体，其具备理解需求、自主决策并调用工具处理复杂任务，已开始融入企业核心业务流程。

然而，AI Agent 作为一种全新的应用范式，企业试图将 AI Agent 从 “Demo 原型” 推向 “日均百万次调用的生产环境” 时，传统应用运行时的短板被瞬间放大：

● 安全红线碰不得：Agent 的自主性带来了前所未有的安全隐患，要求底层运行时提供远超传统软件的强隔离保障。

● 对话 “失忆” 伤体验：一个典型的 AI Agent 系统需协调多个组件，其架构通常以 Agent Server 为中枢，负责维持对话记忆与任务状态，需确保多轮交互上下文在多次请求间完整保留，避免“失忆”中断。

● 资源浪费扛不住：Agent 工作负载常具突发性，传统模式下需要储备大量资源应对峰值需求，造成巨大浪费。

这些痛点的核心，在于传统运行时无法适配 AI Agent“高自主、长会话、突发负载” 的原生特性。9月16日，腾讯全球数字生态大会重磅发布 Agent Runtime 解决方案，通过集成执行引擎、云沙箱和安全可观测等五大能力，提供稳定可靠的运行环境。其中 Agent Runtime 执行引擎由腾讯云 Serverless AI 运行时提供支持，以 “AI Agent 专属引擎” 为定位，通过自研技术打破 “安全与弹性不可兼得” 的行业困局 —— 既提供虚拟机级的强隔离安全，又具备Serverless 级的极致弹性，让企业无需再在 “业务安全” 和 “成本效率” 间做取舍。

1. 为 AI Agent 量身造：一个引擎，三大 “乐高式” 原子能力

Serverless AI 运行时不是传统 Serverless 的 “升级款”，而是完全贴合 AI Agent 架构的 “原生引擎”—— 它将 Agent 运行所需的核心能力拆解为三大原子化应用，开发者无需从零搭建基础设施，像拼乐高一样组合模块，就能快速落地生产级 Agent 应用。

● Agent Server 应用：Agent 的“智慧大脑”。支持通过容器镜像快速部署，允许灵活配置计算资源。提供多种会话亲和调度机制（如HTTP Header、Cookie、QueryString），确保用户与 Agent 的多轮交互上下文在分布式环境下得以完整保持，保障对话与任务执行的连贯性。

● MCP（Model Context Protocol） Server 应用：Agent 的“工具箱”。同样基于容器镜像交付，支持资源规格按需调整。可选用 MCP SSE（Server-Sent Events）或 MCP Streamable HTTP 等通信协议，实现对工具的高效、标准化集成与调用，增强 Agent 的能力扩展性。

● 沙箱应用：Agent 的“安全堡垒”。提供多种预置安全沙箱工具（如浏览器沙箱、代码执行沙箱），实现一键部署，为高风险操作（如网页爬取、代码执行）提供强隔离的运行环境。用户仅需关注资源分配，底层通过硬件虚拟化强隔离，确保操作环境安全，防止核心系统和数据受到潜在破坏。

1.1. 关键能力介绍

会话调度机制是 Agent 应用的有状态、长周期运行、安全隔离的是基石。

● 会话亲和调度

为了实现长连接和会话状态维护，通过会话亲和模式，无需编写/维护复杂的调度管控逻辑，只要简单配置，系统自动将客户端相同会话标记的请求定向调度到同一个实例上，从而实现多轮对话状态不丢，逻辑不中断。同时系统提供多种场景的亲和模式，包含HTTP Header、Cookie、QueryString、MCP SSE、MCP Streamable HTTP，您可以基于 Agent 应用或者 Web 应用灵活选择。

● 会话安全隔离

为了满足 Agent 对独立隔离运行环境的需求，我们推出了安全隔离功能，每个会话都在一个专用的轻量虚拟机中运行，该虚拟机具有独立的 CPU、内存和文件系统资源。保证一个用户会话的调用无法访问另一个用户会话的数据。会话结束后，虚拟机将被完全终止，其内存将被清理，从而消除跨会话数据泄露的风险。

● 会话生命周期管理能力

我们提供完整的会话全生命周期管理，您可以简单配置，实现会话不同状态的自动化流转。会话最长生命周期可达7天，同时提供了会话暂停能力，最长支持暂停30天，以极低成本的方式保留文件系统与内存状态，让您的 AI 应用不再受限于短时任务，可以将更复杂、更有价值的业务逻辑交给 AI 处理。

1.2. 产品优势

● 会话级硬件隔离：我们采用自研的 Cube 轻量虚拟化技术，为每个任务或用户会话提供内核级强隔离环境。与传统容器不同，Cube 基于硬件虚拟化，每个会话都在独立的轻量虚拟机中运行，拥有独立的 CPU、内存和文件系统，从根本上杜绝了跨会话数据泄露的风险。会话结束后，虚拟机将被彻底销毁，真正实现“数据不留痕”。

● 毫秒级冷启动：Cube 以主机为中心提供沙箱资源，实现算力、存储、网络在主机层面闭环，并对资源进行池化和复用设计，彻底消除沙箱交付过程资源准备开销。同时搭载镜像加速能力，冷启动时延<100ms ；

● 十万级并发扩容：通过对主机内核、VMM应用程序、KVM底座、沙箱快照、容器管控等多项技术进行深度优化，可支持每分钟扩容100000+个实例，从容应对突发流量，业务高峰下依然流畅稳定，无需为闲置资源付费，确保服务永远在线；

● 全球化资源覆盖：依托于腾讯云百万核级别资源池，覆盖全球各大园区，您无需自建数据中心，即可获得超大规模算力支持。

2. 5 分钟部署Agent：以 “旅游规划小助手” 为例

光说不练假把式 —— 下面通过 “旅游规划 Agent” 的实操案例，带你看如何用 Serverless AI 运行时快速落地，

2.1. 需求拆解：这个 Agent 要做什么？

用户输入需求，如目的地、旅行天数、偏好类型（如 “亲子 / 美食 / 历史” ），Agent 自动整合景点、餐饮、住宿等地图信息，以及开放时间、门票等实时信息，最后生成结构化行程表。

2.2. 模块组合：3 个应用搞定全流程

● 浏览器沙箱：安全的 “实时信息爬取环境”，隔离网页访问风险，获取地图 API 未覆盖的实时数据

1、在 Serverless AI 运行时平台选择沙箱工具，点击创建应用。

2、应用类型选择“浏览器沙箱”，因平台已内置浏览器镜像、默认配置内存规格及开启日志，您只需填入应用名称（browser-demo）、地域，完全不用操心底层复杂的安全配置，一键部署就能获得安全沙箱。

3、部署完成后在详情页面获取浏览器沙箱browser-demo的URL。

● 地图天气 MCP Server：第三方地图天气服务的 “代理层”，对接外部地图 API（如高德地图），转发请求 / 响应。

1、提前将地图天气MCP服务上传到镜像仓库。

2、在 Serverless AI 运行时平台选择MCP工具，点击创建应用。

3、在应用页面填入应用名称（map-mcp-demo）、地域，并且选择对应的镜像。

4、会话亲和调度配置：我们只需根据镜像中使用的 Transport Type（SSE/Streamable HTTP）选择会话Key来源就可以完成会话亲和调度配置。

5、提交部署完成后，同样可在详情页面获取MCP工具map-mcp-demo的URL。

● 旅游规划 Agent Server：Agent 的 “决策中枢”，负责接收需求、调用大模型、调度组件、整合数据、生成最终行程。

1、提前将旅游规划 Agent Server 服务上传到镜像仓库，在 Agent Server 服务中实现调用大模型、并通过调用上述应用的URL来操作浏览器沙箱工具和地图天气 MCP工具。

2、在 Serverless AI 运行时平台选择 Agent 运行时，点击创建应用 。

3、在应用页面填入应用名称、地域，并且选择对应的镜像。

4、实例安全隔离和会话亲和调度配置：

a) 开启实例安全隔离，保证每一次会话信息独占一个实例，避免数据泄漏；

b) 配置“基于会话”单实例并发模式，通过my-session-id将通过会话的请求都“粘”到同一个实例上，只需简单配置，就能保证 Agent 可以跟我们进行多轮会话，上下文不丢失。

5、提交部署即完成了travel-assistant-demo应用的部署。

6、最后为travel-assistant-demo的配上自定义域名，我的旅游规划小助手正式上线。

落地效果

仅仅通过简单的几步操作，你就部署了一个兼具“安全”、“弹性”和“多轮会话”能力的 旅游规划小助手AI Agent 服务。这不仅极大地缩短了开发周期，也让你将更多精力聚焦于业务逻辑创新，而不是繁琐的基础设施搭建。

指标	传统方案（自建服务器）	Serverless AI 运行时
部署时间	7 天（搭环境 + 调度逻辑定制）	5 分钟
多轮对话 “失忆” 率	随机（实例调度不固定）	0%（会话亲和定向）
突发负载应对（10 倍峰值）	需提前 2 天扩容服务器	自动扩容，无感知

3. 展望

Serverless AI 运行时以一个引擎、三种应用类型的原子化能力矩阵，构建起超安全、高性能的 Agent 开发生态底座。该引擎通过统一调度、强隔离与极致弹性的运行时支持，为上层 Agent 应用提供稳定、高效且经济的执行环境。开发者可基于此底座，自由集成开源模型与多样化工具链，灵活构建适多种 Agent 场景的解决方案，同时充分享受 Serverless 按需运行、平滑伸缩的技术红利。

在这一开放、可扩展的生态基础上，AI Agent 的实现门槛显著降低，创新效率提升，进一步推动智能体在产业环境中向更高自主性、更强智能化演进，加速千行百业的数字化与智能化升级进程。