img
随着基于大型语言模型的系统日益复杂,智能体工作流的设计也变得愈发重要。虽然简单的应用可能仅依赖于一个自主智能体,但更高级的用例通常需要多个智能体之间的协作,每个智能体负责一个特定的角色。
在本文中,我们将探讨多种构建 AI 智能体结构的模式。这些模式有助于我们扩展功能、保持模块化,并更好地控制执行流程。
一开始,通常会采用单智能体模型。然而,随着功能的扩展,例如引入规划、决策、或对特定工具的集成,将所有职责集中在一个智能体中会变得效率低下且难以管理。
多智能体系统通过将职责分配给多个独立且专注的智能体来解决这一挑战。每个智能体可以专注于系统的一个方面,例如信息检索、内容生成或任务协调。这种结构带来了:
具体采用哪种模式,取决于系统的复杂度、所需的协调方式以及每个智能体的自主程度。
接下来,我将逐一为你介绍这些模式:
这是最简单的智能体模式,仅使用一个智能体,直接与工具和环境交互。
img
特点:
适用场景: 快速原型开发、FAQ 问答机器人、单一功能应用等
在网络模式中,智能体之间以多对多的关系连接。任何一个智能体都可以与其他任意智能体通信,并将任务委派给它们。
img
特点:
优势:
挑战:
适用场景: 开放式问题求解、协同推理、探索型对话系统等
监督者模式引入了一个中央控制智能体,用于监督整个工作流程。该智能体负责在每一步中决定调用哪个专职智能体。
img
特点:
优势:
适用场景: 具有多个依赖阶段的结构化工作流程
这是监督者模式的一种变体,其中监督者将每个专家智能体视为可调用的“工具”。与其发出泛泛的指令,不如通过类似工具的接口调用这些智能体,并传入结构化参数。
特点:
优势:
适用场景: 需要高吞吐量任务执行,且输入格式预定义明确的应用
在大型系统中,可能需要多层级的监督机制。在层级模式中,监督者被组织为不同层级,高层智能体负责管理低层监督者及其下属的专家智能体。
img
特点:
优势:
挑战:
适用场景: 企业级系统、多领域编排任务
在这种灵活的方式中,智能体根据具体需求被组织进一个工作流中。部分流程具有确定性转移,而其他部分则允许智能体根据当前状态动态做出路由决策。
img
特点:
优势:
适用场景: 混合系统、人机协作对话、可配置工作流等
为了展示多智能体模式的价值,我们来看一个足球新闻机构的复杂系统工作流示例。在这个工作流中,多个智能体各自承担不同职责:
监督者负责分配任务、汇总输出,并最终发布文章。每个智能体专注于自身领域的任务,独立运行,从而确保系统在不断演化中保持模块化和可维护性。
随着基于大语言模型的系统不断扩展复杂度,使用清晰、可维护的智能体结构模式来组织系统架构,变得尤为关键。