首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >从生成到行动:人工智能“智能体”应用的技术演进与治理新框架

从生成到行动:人工智能“智能体”应用的技术演进与治理新框架

原创
作者头像
走向未来
发布2026-02-10 20:55:42
发布2026-02-10 20:55:42
1660
举报

自主智能体系统:架构、场景、需求分析框架及应用模式

走向未来

人工智能领域正在经历一个根本性的转变。大型语言模型(LLM)的出现,首先解决了知识获取和内容生成的问题。它们具备强大的逻辑思考、问题解决和推理能力。然而,仅仅停留于此,系统仍然是被动的知识库。真正的变革在于从被动生成转向主动行动。

这一演进的路径是清晰的。第一步是为大型语言模型集成工具,例如网络搜索、计算器、代码解释器或图像生成器。通过函数调用,模型开始具备与外部世界交互的初步能力。但这仍属于“助手”范“畴,遵循预设的、规范性的指令链条。

b/003.jpg
b/003.jpg

我们现在正迈入一个全新的阶段:智能体(Agent)应用。智能体代表了一种范式转移,它不再是简单的工具执行者,而是具备自主性的系统。智能体能够进行复杂的规划、多步骤推理、主动采取行动,甚至在行动后进行反思和自我纠正。

本文基于对企业级智能体应用实践(其相关报告全文可以从“走向未来”知识星球中获取)的深入分析,探讨这一转变背后的核心定义、系统架构、关键用例、功能与非功能性需求,并重点剖析智能体应用所带来的全新治理挑战。智能体应用不仅是技术的升级,它更是一种全新的应用类型,它要求我们重新思考应用的边界、控制的粒度以及人与机器协作的形态。

第一部分:智能体系统的定义与核心架构

要理解智能体应用,首先必须明确其定义。一个智能体是这样一个系统:它能够代表用户或其他系统自主地执行任务。它利用大型语言模型和一系列工具来实现信息获取和目标达成。更具体地说,智能体是一个能够自主理解、规划并执行特定任务的应用程序。它能够使用工具,并与其他智能体协作,以规划和行动。这是一个在有限监督下自主决策和行动的系统。

这种定义包含四个关键特征:自主性,即智能体在没有持续人工干预的情况下执行任务;推理能力,智能体使用大型语言模型进行思考和决策;工具使用,智能体连接工具、模型或其他IT系统以完成目标;协作,智能体可以与其他智能体协同工作。

从助手到智能体

大型语言模型的核心是其训练过的知识库。当它集成了工具,它就从一个“知识库”变成了一个“助手”。但“助手”与“智能体”之间存在本质区别。助手执行的是由人类定义的、相对固定的任务链。而智能体则具备自主规划和行动能力。它能够根据一个高层次的目标,自行分解出实现该目标所需的多个步骤,并动态调整这个计划。

b/010.jpg
b/010.jpg

智能体系统的核心是其内部的循环机制。这个机制可以被概括为:思考、反思、规划、行动。更具体地,一个智能体的基础系统架构包含一个持续的循环:规划(Plan)、执行(Execute)、反思(Reflect)。

智能体接收来自对话式界面或业务流程的输入。首先进入“规划”阶段,智能体基于其目标和可用资源制定行动计划。随后,它进入“执行”阶段,调用工具或执行动作。完成执行后,它进入“反思”阶段,评估执行结果,并根据结果迭代优化其后续的规划。这个循环不断重复,直到任务完成。

智能体的支撑结构

这个核心循环并非凭空运行,它依赖于一个强大的支撑结构,这个结构定义了智能体的能力和边界。

b/001.jpg
b/001.jpg

首先是知识(Knowledge)。这包括智能体需要访问的外部文档、专业词汇表等。这构成了智能体决策所需的事实基础,是其推理能力的延伸。在企业实践中,这些知识源正越来越多地从非结构化文档,演变为高确定性、可溯源的结构化知识库,如知识图谱。正如人工智能专家王文广在《知识增强大模型》一书中所论述的,知识图谱提供的全局视野和可追溯的演绎推理能力(第8.2节),使其成为智能体实现可靠决策的关键事实基础。

其次是工具集(Toolset)。这是智能体的手和脚。工具集不仅包括传统的软件工具(如API调用、数据库查询),也可能包括调用其他专门的智能体。这暗示了一种分层和协作的智能体生态系统。

最后是行为(Behavior)。这定义了智能体的“个性”和“规则”。它包括智能体应遵循的指导方针,以及它被允许在哪些渠道(Channels)上行动。行为规范了智能体的行动边界,是治理的最初形态。

在这个架构中,一个关键的角色是“编排者智能体”(Orchestrator Agent)。在复杂的任务中,可能需要多个智能体协同工作。编排者智能体作为一个多智能体、多工具的主管、路由器和规划者,负责协调这些复杂的任务执行,确保各个子智能体和工具能够高效协作。

第二部分:企业应用场景的拓展

智能体应用的出现,极大拓展了人工智能在企业中的应用边界。它不再局限于被动的客户服务或内容生成,而是开始作为主动的参与者,嵌入到核心业务流程中。这些应用场景的落地实践,正是当前业界探索的热点。

b/008.jpg
b/008.jpg

数字化劳动力转型

一个主要的应用领域是“数字化劳动力”(Digital Labor)。在人力资源领域,智能体可以处理员工的自助服务请求(AskHR),或是在人才管理和招聘流程中自动执行筛选、协调任务。在IT帮助台(AskIT)场景中,智能体不仅能回答问题,还能自主执行密码重置、权限分配等IT操作。在这些场景中,智能体扮演了一个自主的数字化员工角色。

核心系统与流程现代化

智能体在推动大型机和数据平台现代化方面也展现出价值。例如,它们可以协助实现大型机数据(如Db2, VSAM, IMS)到现代数据湖仓(Lakehouse)的实时复制,或者辅助进行COBOL等传统代码的现代化改造。智能体在这里充当了新旧系统之间的智能桥梁,用自然语言交互赋能复杂的技术操作。

智能文档处理与客户关怀

在智能文档处理领域,智能体将能力从简单的“文档提取”提升到了“文档生成”和“流程自动化”。它能理解上下文,并根据需求自动生成合同、报告或回复。在客户关怀领域,智能体驱动的自助服务(IVR)和坐席辅助(Agent Assist)能够处理更复杂的客户旅程,它们可以主动预测客户需求,而不仅仅是响应指令。

新型服务与风险管理

智能体也催生了新的服务模式和风险管理手段。例如“嵌入式AI”或“LLM即服务”,允许将一个经过特定数据微调的智能体作为服务,嵌入到客户的应用程序中。在欺诈保护领域,智能体能够识别和对抗复杂的欺诈模式(如“杀猪盘”类型的欺诈),或者进行加密钱包的验证。同时,智能体本身也成为AI治理的对象和工具,用于实现模型风险管理和提升AI工作负载的合Q规性。

第三部分:构建企业级智能体的双重需求框架

智能体的自主性使其功能强大,但也给企业应用带来了巨大的挑战。要将智能体从实验品转变为可靠的生产力工具,必须建立一个严谨的双重需求框架:功能性需求和非功能性需求。

b/006.jpg
b/006.jpg

功能性需求:定义智能体的能力

功能性需求定义了智能体“能做什么”。

首先是自主性(Autonomy)。这包括自我导向,即系统独立运作,无需持续的人工干预;以及自我管理,智能体应能管理自身资源(如计算、内存),并根据环境调整其操作。

其次是决策与推理(Decision-making and Reasoning)。智能体必须能够进行上下文决策,即基于环境的当前状态选择最佳行动方案。这可能涉及处理不确定性的概率推理,或确保决策一致性的逻辑推理。智能体还需要在“探索”新可能性和“利用”已知有效策略之间找到平衡,以高效达成目标。

再次是行动执行(Action Execution)。智能体必须将其决策转化为对现实世界的影响。这可能是对物理环境的操作(如自动化实验平台),或是对虚拟环境(系统、网络)的操作。执行必须是精确和可控的,并能根据条件变化进行实时调整。

最后是监控与反馈(Monitoring and Feedback)。智能体必须具备自我监控能力,以检测自身的性能和健康状况。基于行动结果、环境或操作员的反馈,智能体通过反馈循环调整其策略和目标。这与其核心架构中的“反思”阶段紧密相连。

非功能性需求:定义智能体的可靠性

如果说功能性需求定义了能力的下限,那么非功能性需求(NFRs)则定义了企业采纳的上限。这决定了智能体“做得有多好”以及“多可控”。

第一个关键是非功能性需求是互操作性(Interoperability)。智能体必须能通过定义良好的API或协议与其他系统、设备或智能体无缝交互。它需要支持通用数据格式和协议,以确保兼容性,并可能需要支持跨云、边缘设备或机器人的多平台操作。

第二个是可审计性(Auditability)。由于智能体具有自主决策性,对其行为的追溯变得至关重要。系统必须记录其行动和决策日志,以便进行故障排除、性能评估或法律问责。对智能体决策模型或学习算法的更改必须进行版本控制,以跟踪性能的改进或退步。

第三个是安全性(Security)。智能体系统引入了新的攻击面。系统必须确保其内部数据(知识库、模型)免受未授权的篡“改或破坏(数据完整性)。必须实施严格的访问控制。如果智能体处理敏感数据,必须遵守隐私法规(如GDPR)。此外,智能体应能防御和恢复网络攻击,特别是那些试图操纵其决策过程的对抗性攻击。

第四个是成本效益(Cost-effectiveness)。智能体的运行,特别是其推理和规划过程,可能会消耗大量计算资源。系统必须高效运行,以减少计算、能源或人工干预相关的运营成本。同时,系统的更新和支持等维护成本也需要控制在合理范围。

第四部分:智能体应用的四种模式与架构融合

企业在实践中,不会只采用单一形态的智能体。基于不同的业务需求和控制要求,智能体应用呈现出四种主要的类型或模式。

b/005.jpg
b/005.jpg

第一种模式是工作流自动化(Workflow automation)。在这种模式下,智能体执行一个预定义的业务流程步骤序列。其行为是确定性的和可预测的。它通常作为更广泛的智能体解决方案中的一个子流程。

第二种模式是“无头”智能体(Headless agents)。这是一个始终在后台运行的人工智能。它由事件(如新邮件、系统警报)而非聊天界面触发,它在没有直接用户交互的情况下自主执行任务。

第三种模式是作为现有系统的自然语言界面(NLP interface to existing systems)。智能体允许用户用自然语言表达意图,并以自然语言回应,实现了与复杂系统之间更直观的对话式交互。

第四种模式是智能体驱动的检索增强生成(Agentic RAG)。这是一种高级的RAG模式。传统RAG的检索过程相对固定,而Agentic RAG使用智能体来动态地、有策略地执行检索,智能体主动决定需要什么信息、从哪里获取信息,以更好地支撑其回应的生成。

融合:智能体(Agentic)与流程(Flows)的平衡

这四种模式揭示了一个企业应用的核心洞察:最有效的架构不是纯粹的智能体系统,而是智能体行为与确定性流程的融合。企业需要灵活性的同时也需要可预测性。智能体提供了前者。它们可以动态地规划、排序工具、调用流程,并与其他智能体协作,以更灵活的方式满足用户请求。而确定性的流程(Flows)提供了后者。流程使用可重复的逻辑来序列化工具、调用其他流程或智能体,以更可预测的方式满足用户请求。

b/002.jpg
b/002.jpg

因此,未来的企业架构是一种混合体。这种智能体(Agentic)的灵活性与流程(Flows)的确定性相结合的架构思想,是解决当前大模型“幻觉”和知识陈旧等固有缺陷的核心路径。正如人工智能与大模型技术专家王文广在其灯塔书《知识增强大模型》中深入阐述的,这在理论上被称为“图模互补”范式(第8章)。大模型(即智能体的“智能”核心)擅长于理解模糊的任务需求、进行概率推理和生成高质量的自然语言;而以知识图谱为代表的结构化知识系统(即“流程”的骨架)则提供了大模型所欠缺的:知识的确定性、一致性、可追溯的演绎推理以及纠错和持续维护的能力。一个编排者智能体(Orchestrator Agent)在处理一个复杂请求时,可能会先调用一个灵活的“Agentic RAG”智能体来收集背景信息,然后调用一个确定性的“工作流自动化”流程来执行合规性检查和审批,最后再由一个“NLP界面”智能体将结果汇总并报告给用户。

这种架构的实现,依赖于不同抽象层次的工具链,包括面向业务人员的无代码(No-code)工具、面向开发者的低代码(Low-code)工具,以及面向专业程序员的专业代码(Pro-code)接口。这种融合,使得系统能够在灵活性和可预测性之间取得动态平衡。

第五部分:智能体治理的全新挑战

智能体的自主性、规划能力和行动能力,使其治理成为比传统AI模型治理远为复杂和关键的挑战。

传统的人机协同(Human in the loop)模式,通常被想象为一个人在实时监督机器人的操作。但在复杂的智能体应用中,这种实时同步监督既不高效也不现实。更可能的模式是,人类管理者在智能体完成任务后,对其工作结果进行审查和审计。这种从“实时监督”向“异步审计”的转变,对治理框架提出了新的要求。

治理不再是一个简单的、在输入端和输出端设置“护栏”(Guardrails)的问题。对于智能体应用,治理必须深入到其核心的“Plan-Execute-Reflect”循环之中。

智能体治理需要转变为一个多层次、嵌入流程的检查系统:

b/007.jpg
b/007.jpg

首先,在规划(Plan)阶段,就需要治理介入。系统必须能够评估:智能体提出的计划是否合理?它是否调用了正确的工具?这要求智能体的规划过程是透明的,其制定的计划在执行前是可被审查的。

其次,在执行(Execute)阶段,治理需要评估工具的反馈。例如:被调用的工具是否提供了相关的信息?如果工具返回错误或无关信息,智能体应如何反应?

最后,在反思(Reflect)阶段,治理需要进行最终的成果评估。系统必须判断:我们是否解决了最初提出的问题?生成的结果是否符合要求?

这种嵌入式的治理模式,意味着治理本身也需要“智能化”。它不再是静态的规则列表,而是一个动态的、在智能体行动的每一步都进行审查和纠偏的机制。这对系统的透明度、可解释性和控制接口的设计提出了极高的技术要求。

结论:迈向可控的自主智能

从大型语言模型到智能体应用,我们正处在一个从“生成信息”到“自主行动”的重大技术飞跃的起点。智能体通过其“规划-执行-反思”的核心架构,为企业自动化和数字化劳动力带来了新的可能性。

然而,本文的分析指出,智能体的企业级应用之路,其核心挑战不在于智能,而在于控制。企业不能简单地“释放”完全自主的智能体,而必须构建一个融合了智能体(Agentic)灵活性和确定性流程(Flows)可预测性的混合架构。

要实现这一目标,企业必须建立一个双重需求框架,同等重视功能性需求(如自主性、推理)和非功能性需求(如可审计性、安全性、成本效益)。

最大的挑战和创新机遇,在于治理。智能体治理必须从传统的输入输出“护栏”,转变为嵌入智能体核心推理循环的“内部治理”机制。我们必须在智能体的规划、执行和反思的每一步都植入可审查的控制点。

正如最佳实践所建议的,企业应采取“爬行、行走、奔跑”的渐进策略。从具有少量工具和大量人工介入的 simple 智能体开始,逐步移除人工步骤,并始终关注安全性、角色、上下文和监控。

未来,智能体之间的互操作性、可移植性和协作标准将成为行业发展的关键。我们面临的终极问题,已经从“AI能否思考”转变为“我们能否信任、审计和管理AI的行动”。构建一个可信、可控、可治理的智能体生态系统,将是未来十年人工智能领域最核心的命题。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 自主智能体系统:架构、场景、需求分析框架及应用模式
    • 走向未来
    • 第一部分:智能体系统的定义与核心架构
      • 从助手到智能体
      • 智能体的支撑结构
    • 第二部分:企业应用场景的拓展
      • 数字化劳动力转型
      • 核心系统与流程现代化
      • 智能文档处理与客户关怀
      • 新型服务与风险管理
    • 第三部分:构建企业级智能体的双重需求框架
      • 功能性需求:定义智能体的能力
      • 非功能性需求:定义智能体的可靠性
    • 第四部分:智能体应用的四种模式与架构融合
      • 融合:智能体(Agentic)与流程(Flows)的平衡
    • 第五部分:智能体治理的全新挑战
    • 结论:迈向可控的自主智能
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档