首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >企业级AI的未来:通用型企业级 AI 智能体的重大突破

企业级AI的未来:通用型企业级 AI 智能体的重大突破

原创
作者头像
全球TMT
发布2025-07-21 17:21:07
发布2025-07-21 17:21:07
1210
举报

在AI发展日新月异的今天,AI智能体无疑正处在技术前沿。近日,IBM发布了IBM Computer Using Generalist Agent(此后简称IBM CUGA)的重要突破,引发业界广泛关注。

如今,IBM CUGA不仅在模拟企业场景中经受住了严苛测试,更在最新(2025年7月)的AppWorld Benchmark中荣登第一(注:AppWorld Benchmark 是一个由多个研究机构和学者共同创建、用于评估交互式编程智能体的基准测试环境)。在不久的未来,我们或许能看到AI 智能体逐步从"实验室玩具"迈向"企业核心助手"。

通用型企业级AI智能体是什么?为何重要?

传统AI智能体在企业应用中多是"单一功能专家"——比如处理发票、生成邮件、跟踪销售进度等。这些功能虽然实用,但面对跨流程、跨系统、跨业务的复杂场景时,往往会显得力不从心。

IBM CUGA 正是为复杂业务场景而生。它是一种能够跨多个业务场景、整合多种工具、执行复杂任务的通用型智能体,可以像资深员工一样理解用户意图、规划任务、调用工具、协调多个系统,并不断学习和适应新的挑战。

IBM CUGA的出现并不是一蹴而就的,它是架构进化、方法创新和工具集成的系统性成果:

  • 架构演进:从最初简单的"计划-执行-观察"模型(完成率15%),进化到如今能协调多个子智能体、感知网页环境、处理复杂任务的多层级系统,任务完成率提升到 61.7% 甚至更高。
  • 工具赋能:
    • 实时性能仪表盘,掌握每一个智能体动作的效果;
    • 轨迹可视化工具,直观诊断失败原因;
    • 并行执行框架,将评估速度从数天压缩到数分钟。
  • 多智能体协作:一个任务由多个"子任务智能体"协同完成。比如,规划、执行、信息提取各司其职,让智能体能像团队一样作战。
  • 环境感知增强:结合网页截图和可访问性树,智能体看得更清、操作更准,还能识别弹窗等障碍进行规避。

安全、可信、可控的智能体平台,打造适配业务需求的AI智能体

IBM不仅关注智能体的"聪明程度",更重视它的"企业适配能力"。借助最新发布的企业级AI 智能体平台watsonx Orchestrate,客户有望实现:

  • 全生命周期可观测性,兼顾性能监控、模型优化、安全防护;
  • 无代码与专业工具并存,既支持业务人员快速部署,也支持开发者深度定制;
  • 兼容超过80种企业级系统,与Adobe、SAP、Salesforce、ServiceNow等生态无缝集成;
  • 治理与合规,为隐私、安全、成本可控提供保障,帮助企业实现AI治理与合规。

真正的"企业AI助手" 正在加速来到

除了在AppWorld基准测试夺魁,IBM CUGA还在WebArena等真实浏览器任务中展现强大能力。通过"智能采样"、"反馈反射"、"知识注入"等一系列创新方法,CUGA每一次迭代都更接近企业级实用标准。

在准确率达到更高门槛后,CUGA有望成为企业内部的通用调度平台——不再是被动响应用户指令,而是主动协助完成复杂的工作任务,例如跨系统的数据整合、文档生成、流程管理等。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档