
AI 智能体、智能化 AI、智能化架构、智能化工作流。智能体(Agents)无处不在。但它们到底是什么?它们真的能做些什么吗?
新技术往往伴随着混乱的术语、夸张的期望,以及大量自封的网络专家。在本文中,我们将剥去围绕 AI 智能体的噪音与炒作,深入解析智能化 AI 的一个核心原则:智能化工作流(Agentic Workflows)。
单独来看,智能体的能力十分有限。它们需要被赋予角色、目标和结构,才能有效地实现目标。这正是工作流的作用所在。
理解智能化工作流,可以帮助你理解 AI 智能体的运行方式及其背后的逻辑。为此,我们将探讨 AI 智能体的核心组成部分,为你提供智能化工作流的清晰定义,解释什么使得工作流具备智能性,深入剖析智能化工作流的关键模式,并通过实际案例和应用场景展示其优势和挑战。
AI 智能体(AI Agents)是结合了大语言模型(LLM)进行推理与决策,并配备工具以实现现实世界交互的系统,使其能够在有限的人类干预下完成复杂任务。智能体通常被赋予特定的角色,并根据需求被设定不同程度的自主性,以实现最终目标。此外,它们还具备记忆能力,能够从过去的经验中学习,并随着时间推移不断提升自身性能。
如果你想深入了解 AI 智能体的历史及其构建工具,可以查看我们的博客文章:《简化智能体:AI 语境中的智能体究竟是什么?》[1]。
为了更好地理解 AI 智能体在智能化工作流中的角色,我们接下来将探讨 AI 智能体的核心组成部分。
尽管 AI 智能体被设计为半自主决策系统,但它们依赖于一个更大的组件框架来正常运行。这个框架包括:大语言模型(LLM),使智能体能够进行有效的推理;工具(Tools),帮助智能体完成任务;以及记忆(Memory),使智能体能够从过去的经验中学习,并随着时间的推移优化响应。

AI 智能体的组成部分
AI 智能体的高效性部分源于其**迭代推理(iterative reasoning)**能力,使其能够在整个问题解决过程中持续“思考”。智能体的推理能力主要依赖于底层 LLM,并执行两项核心功能:规划(planning)和反思(reflecting)。
在规划阶段,智能体进行任务分解(task decomposition),即将复杂问题拆解为更小、更易执行的步骤。这种方法不仅使智能体能够系统地执行任务,还允许它为不同的任务使用不同的工具。此外,智能体还可以进行查询分解(query decomposition),即将复杂查询拆解为更简单的查询,以提高 LLM 生成响应的准确性和可靠性。
智能体还通过**反思(reflecting)**自身行为的结果进行推理。这使其能够评估任务执行情况,并根据外部数据源的信息,动态调整下一步的行动计划。
LLMs 的知识是静态的,仅限于训练过程中编码的信息。为了扩展能力,使其超越原始数据集,智能体可以利用外部工具(如网络搜索引擎、API、数据库和计算框架)。这意味着智能体可以访问实时的外部数据,指导决策并完成需要与其他应用交互的任务。
工具通常伴随权限管理,如查询 API、发送消息、访问特定文档或数据库结构等。下表列出了一些常见的 AI 智能体工具及其执行的任务:
工具 | 任务 |
|---|---|
网络搜索(Internet search) | 检索和总结实时信息。 |
向量搜索(Vector search) | 检索和总结外部数据。 |
代码解释器(Code interpreter) | 迭代执行智能体生成的代码。 |
API | 获取实时信息,并与外部服务和应用交互。 |
当 LLM 选择某个工具来帮助完成任务时,它会执行一种称为**函数调用(function calling)**的行为。这种方式使 LLM 能够超越单纯的文本生成,真正实现与现实世界的交互。
工具的选择可以由终端用户预先定义,也可以由智能体动态决定。让智能体自主选择工具有助于解决更复杂的任务,但对于较简单的工作流而言,预定义工具通常更加高效,可避免不必要的复杂性。
学习过去的经验并记住上下文,是智能化工作流区别于纯 LLM 驱动工作流的重要特性。记忆是 AI 智能体的关键组件,支持智能体在多个用户交互和会话之间存储和调用上下文与反馈信息。智能体的记忆主要包括短期记忆和长期记忆两种类型:
一般而言,工作流(workflow) 是一系列相互关联的步骤,旨在完成特定任务或目标。最简单的工作流是确定性的(deterministic),即遵循预定义的固定步骤,无法适应新信息或变化的环境。例如,一个自动化的报销审批工作流可能是:“如果报销项目被标记为‘餐饮’,且金额小于 $30,则自动审批。”
然而,一些工作流会结合大语言模型(LLM)或其他机器学习技术。这类工作流通常被称为AI 工作流,它们可以是智能化的(agentic),也可以是非智能化的(non-agentic)。在非智能化的 AI 工作流中,LLM 仅根据输入指令生成输出。例如,一个文本摘要工作流可能是:输入一段长文本,LLM 生成摘要并返回结果。但仅仅使用 LLM 并不意味着工作流是智能化的。
智能化工作流是由智能体(Agent)或多个智能体动态执行的一系列任务步骤,以完成特定目标。在智能化工作流中,智能体被赋予权限,允许它们在一定程度上自主收集数据、执行任务,并做出可在现实世界中执行的决策。
智能化工作流依赖 AI 智能体的核心组件,包括:

工作流类型
当一个或多个智能体参与引导和塑造任务流程时,AI 工作流便变得智能化。将智能体添加到现有的非智能化工作流,可以形成一种混合方法,结合结构化工作流的可靠性与 LLM 的智能性和适应性。
智能化工作流的核心特点:
从这个角度来看,我们可以区分三种不同的工作流:
类型 | 特点 |
|---|---|
传统工作流(Non-AI Workflow) | 仅依赖预定义的规则,不使用 AI。 |
非智能化 AI 工作流(Non-Agentic AI Workflow) | 依赖 LLM 生成结果,但不具备推理、记忆和自适应能力。 |
智能化工作流(Agentic Workflow) | 由智能体动态执行,具备推理、工具调用、记忆与迭代能力。 |
相比之下,智能化工作流比非智能化工作流更加动态和自适应,能更好地应对变化的环境和任务需求。
每当新技术出现时,都会带来大量新的术语。虽然“智能化架构(Agentic Architectures)”和“智能化工作流(Agentic Workflows)”这两个术语常被混用,但它们实际上有重要的区别。
智能化工作流(Agentic Workflow) | 智能化架构(Agentic Architecture) |
|---|---|
定义:指智能体执行任务所采取的步骤 | 定义:指支持智能体运行的技术框架和系统设计 |
核心关注点:任务的执行过程,如使用 LLM 进行规划、拆解任务、调用工具、反思结果等 | 核心关注点:系统的整体架构,包括智能体的决策逻辑、工具集成、存储机制等 |
示例:智能体使用 LLM 规划任务、调用 API 处理数据,并根据反馈调整决策 | 示例:包含智能体、大语言模型、外部工具(API/数据库)和记忆系统的完整 AI 系统 |
简单来说,智能化架构是支撑智能化工作流的底层系统设计。每个智能化架构都包含至少一个具备决策和推理能力的智能体,配备工具来执行任务,并包含短期和长期记忆模块。
如果你想进一步了解最强大的智能化架构,可以查看这本免费电子书[2],其中包含直观的示例和图解。
回顾一下,智能化工作流(Agentic Workflow) 是智能体为完成特定任务(即最终目标)而执行的一系列结构化步骤。因此,当我们讨论智能化工作流时,我们实际上是在讨论智能体实现最终目标的特定行为模式。
正如前面提到的,智能体的核心能力在智能化工作流模式中起着关键作用。例如,智能体的推理能力(Reasoning) 使其能够进行规划(Planning) 和 反思(Reflection),而其工具使用能力(Tool Use) 使其能够与外部环境交互,从而提升任务执行能力。
规划模式 使智能体能够自主地将复杂任务拆解为一系列更小、更简单的子任务,这一过程被称为 任务分解(Task Decomposition)。
任务分解可以带来更好的结果,因为它:
规划模式在目标实现方式不明确、问题解决需要高度适应性时特别有效。例如,如果让 AI 智能体修复软件 Bug,它可能会这样拆解任务:
如果修复失败,智能体可以读取错误信息,调整策略 并再次尝试。

规划模式
生成式 LLM 的一个主要局限性 是它们依赖于已有的训练数据,因此:
为了克服这些局限性,我们可以使用 检索增强生成(RAG,Retrieval Augmented Generation),让 LLM 访问外部数据,从而提供更准确和有上下文依据的回答。
工具使用模式不仅仅是简单的 RAG,而是允许 LLM 动态地与真实世界交互,而不仅仅是从中检索数据。在智能化工作流中,工具使用模式 扩展了智能体的能力,使其能够:
智能体可以调用的工具包括:
这些工具可以帮助智能体完成各种任务,例如:

工具使用模式
反思模式 是一种强大的智能化设计模式,尽管实现起来相对简单,却能显著提高智能化工作流的表现。
在 反思模式 中,智能体会对自身的输出或决策进行迭代评估,在最终响应或执行下一步操作之前,先对结果进行自我反馈。这些反馈会用于:
反思模式在智能体首次尝试可能不会成功的情况下尤为重要。例如:

反思模式
原子设计模式(如规划和工具使用)可以通过不同的组合方式,充分利用智能 AI 处理各种任务。在此基础上,智能体不仅可以使用不同的工具,还能动态选择工具 来满足任务需求。此外,智能体还可以集成人类反馈机制,并被赋予不同程度的自主性和决策权。
这种灵活的配置方式使得智能化工作流可以适用于多个行业的广泛任务。本文将重点介绍两个强大且常见的应用场景:智能 RAG(Agentic RAG) 和 智能研究助理(Agentic Research Assistants)。
**检索增强生成(RAG, Retrieval-Augmented Generation)**[3] 通过从外部数据源检索相关数据 来增强 LLM 的知识。而 智能 RAG 则在 RAG 流水线中引入一个或多个智能体,增强其智能化程度。

智能 RAG 工作流
更多架构细节:如果你对智能 RAG 的架构感兴趣,可以下载 免费电子书[4] 了解更多内容。
智能研究助理(又称“深度研究”)可用于生成深入报告和详细见解,它们不仅检索外部信息,还能综合分析信息,而不仅仅是简单地返回相关数据。
目前,多个 AI 公司已经发布了自己的智能研究助理:
智能编程助理 可以自动生成、重构、优化和调试代码,大幅减少人工干预,提高开发效率。
在介绍了智能化工作流的应用场景之后,我们将更详细地探讨两个实际智能体的工作流程:Claygent[10] 和 ServiceNow AI Agents[11]。每个工作流使用其独特的设计模式和工具,赋予智能体不同的自主性和决策能力,并依赖不同程度的人类反馈和参与。
对于成长和销售团队来说,线索研究和数据丰富可能是一项繁琐的任务。Clay[12] 是一家数据丰富和外展自动化公司,通过其 Claygent AI 助手简化了这一过程,该助手持续扫描网络和内部数据库,以提供实时、可操作的见解。
假设你想使用 Claygent 来丰富 LinkedIn 个人资料,基于一组姓名和电子邮件地址,然后发送个性化的介绍信息。首先,你指定所需的数据字段(例如:工作经验、教育背景、技能),这些字段将被注入到一个预配置的提示模板中。智能体的 LLM(大语言模型)处理查询,使用网页抓取工具在网络上查找 LinkedIn 网址,并提取所需的个人资料数据。然后,这些数据可以传递给另一个 LLM,你可以指示它以任何你希望的方式总结或分析这些丰富的数据。之后,同样的 LLM(或另一个)可以用来为每个个人资料创建个性化的外展消息。
Claygent 是一个相对灵活的智能化工作流示例,可以根据需要以创造性的方式进行定制,同时通过预配置的提示模板为特定任务提供指导。
ServiceNow[13] 是一个基于云的平台,用于简化和自动化 IT、运营、HR 和客户服务领域的工作流。它们的 ServiceNow 平台现在包括访问 AI 智能体的功能,旨在自动化重复性任务和现有工作流,同时让人类在决策过程中保持完全控制。
以下是一个智能化工作流如何帮助解决技术支持案例的示例。该工作流在客户提交技术支持工单时被触发。工单中的信息随后传递给一个或多个智能体,这些智能体在内部 IT 支持知识库中执行 RAG(检索增强生成)。智能体总结发现的内容,分析类似的案例,并生成一份总结报告给 IT 支持专家。最后,它会生成一个推荐方案,供专家批准或拒绝。
ServiceNow AI Agents 代表了一种创新但更加谨慎的方式,在生产环境中部署智能体,给它们分配严格的角色和任务,并限制(如果有的话)它们对最终用户或客户的决策自主权。
构建你自己的智能化工作流:如果你想创建自己的智能化工作流,查看 使用 Inngest 构建智能化工作流[14],我们将在其中展示如何创建一个智能化的晚餐计划器。
AI 智能体迅速从机器学习社区走向主流。鉴于围绕智能化 AI 的激动人心、期望和前景,可能很难从炒作中分辨出其真实能力和局限。在这一部分,我们将为你提供一个关于智能化工作流的优缺点、挑战和局限的平衡视角。
智能化工作流超越了传统自动化,赋予 AI 智能体规划、适应和不断改进的能力。与遵循固定规则的确定性工作流不同,智能化工作流可以动态响应复杂性、通过反馈优化其方法,并能够扩展以处理更复杂的任务。这种适应性使其在灵活性、学习和决策至关重要的场景中尤其有价值。
以下是智能化工作流的一些优点:
需要注意的是,AI 智能体仍然是一项新兴技术,随着研究人员和用户发现新的方法来将智能体融入工作流,这些优点列表可能会不断扩展。
尽管 AI 智能体具有众多优点和创新功能,但它们也存在一定的挑战和局限性。由于其概率性特征,AI 智能体本身就增加了工作流的复杂性。并且,虽然智能体可以用于自动化流程,但并不意味着它们应该被用在所有流程中。以下是智能化工作流的一些显著挑战和局限性:
鉴于这些局限性,我们建议在特定工作流中使用智能体时,仔细考虑是否真的需要使用智能体。以下是一些可以帮助你判断的关键问题:
智能化工作流是强大的工具,帮助自动化完成需要决策和推理的复杂任务。在本文中,我们回顾了 AI 智能体的核心组件,包括记忆、工具和推理能力,并讨论了它们如何促进智能化工作流的实现。我们还介绍了常见的工作流模式,如规划、工具使用和反思,这些可以单独或组合使用,创建动态工作流。此外,我们还概述了两个特别有效的应用场景:智能 RAG[15] 和智能研究助理,并描述了市场上已有的两个智能体的工作流——Claygent 和 ServiceNow AI Agents。最后,我们探讨了智能化工作流的优点以及它们的局限性和挑战。
AI 智能体背后的技术在不断发展,我们对它们的理解也在不断深化。本文旨在帮助你基本理解 AI 智能体如何在工作流中运作,但并非对该主题的详尽探索。
[1]
《简化智能体:AI 语境中的智能体究竟是什么?》: https://weaviate.io/blog/ai-agents
[2]
这本免费电子书: http://weaviate.io/ebooks/agentic-architectures?utm_source=agentic_workflows_blog&utm_medium=post&utm_campaign=agentic_architectures&utm_content=cta1
[3]
检索增强生成(RAG, Retrieval-Augmented Generation): https://weaviate.io/blog/introduction-to-rag
[4]
免费电子书: http://weaviate.io/ebooks/agentic-architectures?utm_source=agentic_workflows_blog&utm_medium=post&utm_campaign=agentic_architectures&utm_content=cta2
[5]
OpenAI Deep Research: https://openai.com/index/introducing-deep-research/
[6]
Perplexity Deep Research: https://www.perplexity.ai/hub/blog/introducing-perplexity-deep-research
[7]
Google Gemini Deep Research: https://blog.google/products/gemini/google-gemini-deep-research/
[8]
Anthropic Claude Code: https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/overview
[9]
Cursor Agent: https://docs.cursor.com/agent
[10]
Claygent: https://www.clay.com/claygent
[11]
ServiceNow AI Agents: https://www.servicenow.com/products/ai-agents.html
[12]
Clay: https://www.clay.com/
[13]
ServiceNow: https://www.servicenow.com/
[14]
使用 Inngest 构建智能化工作流: https://weaviate.io/blog/inngest-ai-workflows
[15]
智能 RAG: https://weaviate.io/blog/what-is-agentic-rag
原文链接:https://weaviate.io/blog/what-are-agentic-workflows