Agentic RAG：超越传统RAG与案例分享

AgenticAI

发布于 2025-03-18 15:53:51

2050

文章被收录于专栏：AgenticAIAgenticAI

在人工智能快速发展的今天，检索增强生成（Retrieval-Augmented Generation，简称 RAG）技术已经成为大语言模型（LLM）应用的关键突破。RAG 框架不断推陈出新、日新月异，从 Navie RAG、高级 RAG、模块化 RAG，发展到现在的 Graph based RAG，甚至混合高级 RAG 与 GraphRAG 的 HybridRAG。那么，如何在日新月异的 RAG 技术下，开发一种能够不断适应的框架呢？今天，我们将深入探讨 Agentic RAG，这一革命性的方法正在重新定义智能信息检索与生成的边界。

本文先讨论 Agentic RAG 常见范式，然后推荐一些流行的 Agentic RAG 开发示例：Nvidia 的 Agentic RAG 案例和基于 LlamaIndex 的 Agentic RAG 设计等。

1. Agentic RAG：智能决策的新范式

传统 RAG 系统的工作方式相对简单：接收用户查询 → 检索相关文档 → 基于文档生成答案。但在实际应用中，这种线性模式通常显得过于刻板和局限。现实世界的问题往往错综复杂，需要更加智能和灵活的方案。

Agentic RAG 引入了一个关键概念：让 Agent 在整个信息检索和生成过程中主动思考和决策。这不仅仅是一个技术术语，而是一种全新的智能工作范式。

1. 查询分析：智能重构

在 Agentic RAG 中，原始用户查询不再被直接照搬，而是经过精细的分析和重构：

查询重写：将模糊或复杂的查询转化为更加精确、可检索的形式
智能路由：判断是否需要额外的数据源来全面回答问题

想象一下，用户询问"最近的天气对公司销售有什么影响"。传统 RAG 可能会束手无策，而 Agentic RAG 会：

识别需要整合销售数据和天气信息
智能地从不同数据源检索相关信息
综合分析并生成有洞察力的答案

2. 多源数据检索：打破信息孤岛

Agentic RAG 的一大优势在于其灵活的数据检索能力：

实时用户数据：根据用户当前上下文动态调整
内部文档：精准匹配组织内部知识
外部数据源：从互联网实时获取最新信息

举个例子，对于一个客户支持场景，系统可以：

查看用户历史工单
检索产品使用手册
获取最新的技术更新信息
综合生成最精准的解决方案

3. 动态答案生成与优化

Agentic RAG 不满足于仅仅给出一个答案，而是通过多轮迭代不断优化：

生成多个候选答案
评估每个答案的准确性和相关性
必要时重新查询或调整生成策略

4. 从失败中学习：自我修正机制

传统系统遇到无法回答的问题往往会直接告诉用户"无法解决"。而 Agentic RAG 则会：

识别信息鸿沟
主动寻找补充信息源
尝试重新生成更优答案

2. Agentic RAG 资源推荐

1. Nvidia Agentic RAG

Nvidia 展示的 Agentic RAG 只是一个示例，参考了如下 3 篇论文实现。

路由 (Adaptive-RAG[1]). 根据问题路由到不同的检索器
回退 (Corrective RAG[2]). 如果文档与查询不相关，则回退到网络搜索
自纠错 (Self-RAG[3]). 当答案具有幻觉或者未能回答问题时候，自动尝试修正答案。

它基本实现了如下图所示的框架，它使用打分机制评判答案是否包含幻觉，是否需要加入新的信息。具体地址可以参考：https://github.com/NVIDIA/workbench-example-agentic-rag/blob/main/code/langgraph_rag_agent_llama3_nvidia_nim.ipynb，整个代码基于Langchain开发，使用流程编排完成，包含大量的Prompt设计。

这个项目还包含ChatUI，可以显示具体的运行流程，如下图所示。

2. LlamaIndex Agentic RAG

DeepLearning.ai 的课程Agentic RAG[4]，由 LlamaIndex 的创始人 Jerry Liu 讲授，描述了一种使用 LlamaIndex 如何构建 Agentic RAG 的流程。它将文档包含检索等流程包装成为一个 Tool，然后包装到 Agent 中，供路由选择调用。而在路由前，它会尝试分解或重写用户查询，然后交给 Router，大概设计流程如下。