在AI发展日新月异的今天,AI智能体无疑正处在技术前沿。近日,IBM发布了IBM Computer Using Generalist Agent(此后简称IBM CUGA)的重要突破,引发业界广泛关注。
如今,IBM CUGA不仅在模拟企业场景中经受住了严苛测试,更在最新(2025年7月)的AppWorld Benchmark中荣登第一(注:AppWorld Benchmark 是一个由多个研究机构和学者共同创建、用于评估交互式编程智能体的基准测试环境)。在不久的未来,我们或许能看到AI 智能体逐步从"实验室玩具"迈向"企业核心助手"。
通用型企业级AI智能体是什么?为何重要?
传统AI智能体在企业应用中多是"单一功能专家"——比如处理发票、生成邮件、跟踪销售进度等。这些功能虽然实用,但面对跨流程、跨系统、跨业务的复杂场景时,往往会显得力不从心。
IBM CUGA 正是为复杂业务场景而生。它是一种能够跨多个业务场景、整合多种工具、执行复杂任务的通用型智能体,可以像资深员工一样理解用户意图、规划任务、调用工具、协调多个系统,并不断学习和适应新的挑战。
IBM CUGA的出现并不是一蹴而就的,它是架构进化、方法创新和工具集成的系统性成果:
安全、可信、可控的智能体平台,打造适配业务需求的AI智能体
IBM不仅关注智能体的"聪明程度",更重视它的"企业适配能力"。借助最新发布的企业级AI 智能体平台watsonx Orchestrate,客户有望实现:
真正的"企业AI助手" 正在加速来到
除了在AppWorld基准测试夺魁,IBM CUGA还在WebArena等真实浏览器任务中展现强大能力。通过"智能采样"、"反馈反射"、"知识注入"等一系列创新方法,CUGA每一次迭代都更接近企业级实用标准。
在准确率达到更高门槛后,CUGA有望成为企业内部的通用调度平台——不再是被动响应用户指令,而是主动协助完成复杂的工作任务,例如跨系统的数据整合、文档生成、流程管理等。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。