
点击上方“Deephub Imba”,关注公众号,好文章不错过 !
Agentic AI 这项技术并不新,只是模型性能提高后让它从研究环境走向了可以规模化落地的阶段。
所以这篇文章总结一些常见的设计模式,这些模式归纳了在大量已验证实现中反复出现的共性,可以视为一组结构化的骨架,用来理解智能体(Agent)、用户、模型和工具之间的核心交互。
下面会介绍 5 种常见的设计模式:
额外补充一种:作为工具的子智能体(Sub-Agents as Tools)。

单智能体模式(图 1)从实现角度看是最简单的一种,需要维护的系统级指令和工具定义资产范围较窄。

图 1. 单智能体设计模式示意图
这种模式的做法是给单个智能体绑定相关的工具定义和指令。如果任务本身不复杂、只依赖几件专用工具,它会表现得不错——优点包括:
当任务开始要求编排多步骤逻辑和多种工具时,单一智能体就会暴露出短板:
顺序智能体是多智能体系统最简单的一种实例化形式,要求各个智能体像流水线一样工作:前一个智能体的输出直接作为后一个智能体的输入。为了便于讨论,这里只考虑由两个专用智能体组成的顺序结构(图 2)。

图 2. 顺序智能体设计模式示意图
顺序智能体通过共享的短期记忆状态传递数据,两个智能体不仅能访问数据本身,还能在分担整体职责的过程中共享任务状态。
专用智能体的优势在于:
另一面顺序智能体的执行受到比较硬的约束:
有些任务受益于多智能体协作,但并不需要顺序执行——这时候并行智能体模式(图 3)就有了用武之地。独立任务并行执行,对端到端延迟有比较直接的改善。

图 3. 并行智能体设计模式示意图
和计算里任何并行任务一样,这种模式会带来一些额外风险:
竞态条件的代价不容低估,因为它可能迫使整个工作流重新走一遍完整的往返。一种常见的缓解办法,是在并行智能体之后挂一个最终的聚合器(aggregator)智能体。聚合器可以看作整条链路上最后一个顺序智能体,负责合并各路并行输出,给出一个连贯且贴合请求要求的结果。
智能体的输出必须满足某个严格条件。比如编码智能体的输出,必须能通过特定的单元测试才算有效。循环与评审模式提供了一种简单的护栏(guardrail)思路——让一个专用智能体充当另一个智能体输出的“评审者(critic)”或“审批者(approver)”(图 4)。

图 4. 循环与评审设计模式示意图。为简化可视化,图中省略了模型与工具方框。
这种模式的主要陷阱是无限重试循环因此需要:
协调者模式(图 5)大概是当下最常见的一种,它引入了智能体的层级结构和任务分解:一个主智能体协调工作流,并管理多个子智能体的状态。这种模式里的子智能体通常预先配置好了特定的指令和工具,主智能体负责分配并跟踪它们的工作。

图 5. 协调者设计模式示意图。为简化可视化,图中省略了模型与工具方框。
子智能体可以按照前面讨论过的任意模式来编排——并行、顺序、循环都行。这带来的好处包括:
层级化结构同时也带来一些代价:
另一种比较常见的模式——作为工具的子智能体(Sub-Agents as Tools),把端到端工作流的控制权最大程度地交给主智能体。它和协调者模式很像,区别在于:主智能体不再把宽泛的、自治性的任务委派出去,而是为狭窄的、增量式的动作临时启用子智能体——例如执行某个特定工具,然后把输出返回。
这种模式下,子智能体是无状态(stateless)的。它们不保留上下文,也不与主智能体以外的任何实体交换信息。这样主智能体就对工作流的状态和记忆拥有绝对控制权,能避免系统范围内出现“上下文漂移(context drift)”。
控制权集中带来的代价是,对指令集的精确度要求很高。子智能体必须能给出结构化、有意义的数据;主智能体则要足够成熟,能把这些增量步骤综合成最终结果。
Agentic 设计模式仍在演化中。生产环境里真正合适的模式,往往是本文所述基础模式的混合或调整版本。
图 6 是一份简单的速查表,列出了几个关键要点。

一张表格,总结了这 6 种设计模式的优缺点和最适合的应用场景。
作者:Eduardo Alvarez
喜欢就关注一下吧
本文分享自 DeepHub IMBA 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!