首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯云Agent Runtime 执行引擎开放内测!专为 Agent 而生、超安全、极致弹性的Serverless AI 运行时

腾讯云Agent Runtime 执行引擎开放内测!专为 Agent 而生、超安全、极致弹性的Serverless AI 运行时

作者头像
腾讯云原生
发布2025-09-29 15:23:58
发布2025-09-29 15:23:58
1700
举报

黄贝洋,腾讯云高级产品经理,多年B端产品经验,主要负责云原生AI Infra、Agent Infra 产品工作。

随着大语言模型(LLM)能力爆发式的增长,AI Agent 作为下一代人工智能的核心载体,其具备理解需求、自主决策并调用工具处理复杂任务,已开始融入企业核心业务流程。

然而,AI Agent 作为一种全新的应用范式,企业试图将 AI Agent 从 “Demo 原型” 推向 “日均百万次调用的生产环境” 时,传统应用运行时的短板被瞬间放大:

● 安全红线碰不得:Agent 的自主性带来了前所未有的安全隐患,要求底层运行时提供远超传统软件的强隔离保障。

● 对话 “失忆” 伤体验:一个典型的 AI Agent 系统需协调多个组件,其架构通常以 Agent Server 为中枢,负责维持对话记忆与任务状态,需确保多轮交互上下文在多次请求间完整保留,避免“失忆”中断。

● 资源浪费扛不住:Agent 工作负载常具突发性,传统模式下需要储备大量资源应对峰值需求,造成巨大浪费。

这些痛点的核心,在于传统运行时无法适配 AI Agent“高自主、长会话、突发负载” 的原生特性。9月16日,腾讯全球数字生态大会重磅发布 Agent Runtime 解决方案,通过集成执行引擎、云沙箱和安全可观测等五大能力,提供稳定可靠的运行环境。其中 Agent Runtime 执行引擎由腾讯云 Serverless AI 运行时提供支持,以 “AI Agent 专属引擎” 为定位,通过自研技术打破 “安全与弹性不可兼得” 的行业困局 —— 既提供虚拟机级的强隔离安全,又具备Serverless 级的极致弹性,让企业无需再在 “业务安全” 和 “成本效率” 间做取舍。

1. 为 AI Agent 量身造:一个引擎,三大 “乐高式” 原子能力

Serverless AI 运行时不是传统 Serverless 的 “升级款”,而是完全贴合 AI Agent 架构的 “原生引擎”—— 它将 Agent 运行所需的核心能力拆解为三大原子化应用,开发者无需从零搭建基础设施,像拼乐高一样组合模块,就能快速落地生产级 Agent 应用。

image
image

● Agent Server 应用:Agent 的“智慧大脑”。支持通过容器镜像快速部署,允许灵活配置计算资源。提供多种会话亲和调度机制(如HTTP Header、Cookie、QueryString),确保用户与 Agent 的多轮交互上下文在分布式环境下得以完整保持,保障对话与任务执行的连贯性。

● MCP(Model Context Protocol) Server 应用:Agent 的“工具箱”。同样基于容器镜像交付,支持资源规格按需调整。可选用 MCP SSE(Server-Sent Events)或 MCP Streamable HTTP 等通信协议,实现对工具的高效、标准化集成与调用,增强 Agent 的能力扩展性。

● 沙箱应用:Agent 的“安全堡垒”。提供多种预置安全沙箱工具(如浏览器沙箱、代码执行沙箱),实现一键部署,为高风险操作(如网页爬取、代码执行)提供强隔离的运行环境。用户仅需关注资源分配,底层通过硬件虚拟化强隔离,确保操作环境安全,防止核心系统和数据受到潜在破坏。

1.1. 关键能力介绍

会话调度机制是 Agent 应用的有状态、长周期运行、安全隔离的是基石。

● 会话亲和调度

为了实现长连接和会话状态维护,通过会话亲和模式,无需编写/维护复杂的调度管控逻辑,只要简单配置,系统自动将客户端相同会话标记的请求定向调度到同一个实例上,从而实现多轮对话状态不丢,逻辑不中断。同时系统提供多种场景的亲和模式,包含HTTP Header、Cookie、QueryString、MCP SSE、MCP Streamable HTTP,您可以基于 Agent 应用或者 Web 应用灵活选择。

image
image

● 会话安全隔离

为了满足 Agent 对独立隔离运行环境的需求,我们推出了安全隔离功能,每个会话都在一个专用的轻量虚拟机中运行,该虚拟机具有独立的 CPU、内存和文件系统资源。保证一个用户会话的调用无法访问另一个用户会话的数据。会话结束后,虚拟机将被完全终止,其内存将被清理,从而消除跨会话数据泄露的风险。

image
image

● 会话生命周期管理能力

我们提供完整的会话全生命周期管理,您可以简单配置,实现会话不同状态的自动化流转。会话最长生命周期可达7天,同时提供了会话暂停能力,最长支持暂停30天,以极低成本的方式保留文件系统与内存状态,让您的 AI 应用不再受限于短时任务,可以将更复杂、更有价值的业务逻辑交给 AI 处理。

image
image

1.2. 产品优势

● 会话级硬件隔离:我们采用自研的 Cube 轻量虚拟化技术,为每个任务或用户会话提供内核级强隔离环境。与传统容器不同,Cube 基于硬件虚拟化,每个会话都在独立的轻量虚拟机中运行,拥有独立的 CPU、内存和文件系统,从根本上杜绝了跨会话数据泄露的风险。会话结束后,虚拟机将被彻底销毁,真正实现“数据不留痕”。

● 毫秒级冷启动:Cube 以主机为中心提供沙箱资源,实现算力、存储、网络在主机层面闭环,并对资源进行池化和复用设计,彻底消除沙箱交付过程资源准备开销。同时搭载镜像加速能力,冷启动时延<100ms ;

● 十万级并发扩容:通过对主机内核、VMM应用程序、KVM底座、沙箱快照、容器管控等多项技术进行深度优化,可支持每分钟扩容100000+个实例,从容应对突发流量,业务高峰下依然流畅稳定,无需为闲置资源付费,确保服务永远在线;

● 全球化资源覆盖:依托于腾讯云百万核级别资源池,覆盖全球各大园区,您无需自建数据中心,即可获得超大规模算力支持。

2. 5 分钟部署Agent:以 “旅游规划小助手” 为例

光说不练假把式 —— 下面通过 “旅游规划 Agent” 的实操案例,带你看如何用 Serverless AI 运行时快速落地,

2.1. 需求拆解:这个 Agent 要做什么?

用户输入需求,如目的地、旅行天数、偏好类型(如 “亲子 / 美食 / 历史” ),Agent 自动整合景点、餐饮、住宿等地图信息,以及开放时间 、门票等实时信息,最后生成结构化行程表。

2.2. 模块组合:3 个应用搞定全流程

● 浏览器沙箱:安全的 “实时信息爬取环境”,隔离网页访问风险,获取地图 API 未覆盖的实时数据

1、 在 Serverless AI 运行时平台选择沙箱工具,点击创建应用。

2、 应用类型选择“浏览器沙箱”,因平台已内置浏览器镜像、默认配置内存规格及开启日志,您只需填入应用名称(browser-demo)、地域,完全不用操心底层复杂的安全配置,一键部署就能获得安全沙箱。

image
image

3、 部署完成后在详情页面获取浏览器沙箱browser-demo的URL。

image
image

● 地图天气 MCP Server:第三方地图天气服务的 “代理层”,对接外部地图 API(如高德地图),转发请求 / 响应。

1、 提前将地图天气MCP服务上传到镜像仓库。

2、 在 Serverless AI 运行时平台选择MCP工具,点击创建应用 。

3、 在应用页面填入应用名称(map-mcp-demo)、地域,并且选择对应的镜像。

image
image

4、 会话亲和调度配置:我们只需根据镜像中使用的 Transport Type(SSE/Streamable HTTP)选择会话Key来源就可以完成会话亲和调度配置。

image
image

5、 提交部署完成后,同样可在详情页面获取MCP工具map-mcp-demo的URL。

● 旅游规划 Agent Server:Agent 的 “决策中枢”,负责接收需求、调用大模型、调度组件、整合数据、生成最终行程。

1、 提前将旅游规划 Agent Server 服务上传到镜像仓库,在 Agent Server 服务中实现调用大模型、并通过调用上述应用的URL来操作浏览器沙箱工具和地图天气 MCP工具。

2、 在 Serverless AI 运行时平台选择 Agent 运行时,点击创建应用

3、 在应用页面填入应用名称、地域,并且选择对应的镜像

image
image

4、 实例安全隔离和会话亲和调度配置:

a) 开启实例安全隔离,保证每一次会话信息独占一个实例,避免数据泄漏;

b) 配置“基于会话”单实例并发模式,通过my-session-id将通过会话的请求都“粘”到同一个实例上,只需简单配置,就能保证 Agent 可以跟我们进行多轮会话,上下文不丢失。

image
image

5、 提交部署即完成了travel-assistant-demo应用的部署。

image
image

6、 最后为travel-assistant-demo的配上自定义域名,我的旅游规划小助手正式上线。

image
image

落地效果

仅仅通过简单的几步操作,你就部署了一个兼具“安全”、“弹性”和“多轮会话”能力的 旅游规划小助手AI Agent 服务。这不仅极大地缩短了开发周期,也让你将更多精力聚焦于业务逻辑创新,而不是繁琐的基础设施搭建。

指标

传统方案(自建服务器)

Serverless AI 运行时

部署时间

7 天(搭环境 + 调度逻辑定制)

5 分钟

多轮对话 “失忆” 率

随机(实例调度不固定)

0%(会话亲和定向)

突发负载应对(10 倍峰值)

需提前 2 天扩容服务器

自动扩容,无感知

3. 展望

Serverless AI 运行时以一个引擎、三种应用类型的原子化能力矩阵,构建起超安全、高性能的 Agent 开发生态底座。该引擎通过统一调度、强隔离与极致弹性的运行时支持,为上层 Agent 应用提供稳定、高效且经济的执行环境。开发者可基于此底座,自由集成开源模型与多样化工具链,灵活构建适多种 Agent 场景的解决方案,同时充分享受 Serverless 按需运行、平滑伸缩的技术红利。

在这一开放、可扩展的生态基础上,AI Agent 的实现门槛显著降低,创新效率提升,进一步推动智能体在产业环境中向更高自主性、更强智能化演进,加速千行百业的数字化与智能化升级进程。

4. 内测招募

Serverless Al 运行时现已开启内测申请!欢迎点击下方【内测链接】或【阅读原文】提交内测申请。

内测链接:

https://cloud.tencent.com/apply/p/uik82ruqyem

如需定制方案:联系腾讯云解决方案专家,获取 1 对 1 咨询支持。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云原生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 为 AI Agent 量身造:一个引擎,三大 “乐高式” 原子能力
    • 1.1. 关键能力介绍
    • 1.2. 产品优势
  • 2. 5 分钟部署Agent:以 “旅游规划小助手” 为例
    • 2.1. 需求拆解:这个 Agent 要做什么?
    • 2.2. 模块组合:3 个应用搞定全流程
    • 落地效果
  • 3. 展望
  • 4. 内测招募
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档