前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Agentic RAG:超越传统RAG与案例分享

Agentic RAG:超越传统RAG与案例分享

作者头像
AgenticAI
发布2025-03-18 15:53:51
发布2025-03-18 15:53:51
2050
举报
文章被收录于专栏:AgenticAIAgenticAI

在人工智能快速发展的今天,检索增强生成(Retrieval-Augmented Generation,简称 RAG)技术已经成为大语言模型(LLM)应用的关键突破。RAG 框架不断推陈出新、日新月异,从 Navie RAG、高级 RAG、模块化 RAG,发展到现在的 Graph based RAG,甚至混合高级 RAG 与 GraphRAG 的 HybridRAG。那么,如何在日新月异的 RAG 技术下,开发一种能够不断适应的框架呢?今天,我们将深入探讨 Agentic RAG,这一革命性的方法正在重新定义智能信息检索与生成的边界。

本文先讨论 Agentic RAG 常见范式,然后推荐一些流行的 Agentic RAG 开发示例:Nvidia 的 Agentic RAG 案例和基于 LlamaIndex 的 Agentic RAG 设计等。

1. Agentic RAG:智能决策的新范式

传统 RAG 系统的工作方式相对简单:接收用户查询 → 检索相关文档 → 基于文档生成答案。但在实际应用中,这种线性模式通常显得过于刻板和局限。现实世界的问题往往错综复杂,需要更加智能和灵活的方案。

Agentic RAG 引入了一个关键概念:让 Agent 在整个信息检索和生成过程中主动思考和决策。这不仅仅是一个技术术语,而是一种全新的智能工作范式。

1. 查询分析:智能重构

在 Agentic RAG 中,原始用户查询不再被直接照搬,而是经过精细的分析和重构:

  • 查询重写:将模糊或复杂的查询转化为更加精确、可检索的形式
  • 智能路由:判断是否需要额外的数据源来全面回答问题

想象一下,用户询问"最近的天气对公司销售有什么影响"。传统 RAG 可能会束手无策,而 Agentic RAG 会:

  1. 识别需要整合销售数据和天气信息
  2. 智能地从不同数据源检索相关信息
  3. 综合分析并生成有洞察力的答案

2. 多源数据检索:打破信息孤岛

Agentic RAG 的一大优势在于其灵活的数据检索能力:

  • 实时用户数据:根据用户当前上下文动态调整
  • 内部文档:精准匹配组织内部知识
  • 外部数据源:从互联网实时获取最新信息

举个例子,对于一个客户支持场景,系统可以:

  • 查看用户历史工单
  • 检索产品使用手册
  • 获取最新的技术更新信息
  • 综合生成最精准的解决方案

3. 动态答案生成与优化

Agentic RAG 不满足于仅仅给出一个答案,而是通过多轮迭代不断优化:

  • 生成多个候选答案
  • 评估每个答案的准确性和相关性
  • 必要时重新查询或调整生成策略

4. 从失败中学习:自我修正机制

传统系统遇到无法回答的问题往往会直接告诉用户"无法解决"。而 Agentic RAG 则会:

  • 识别信息鸿沟
  • 主动寻找补充信息源
  • 尝试重新生成更优答案

2. Agentic RAG 资源推荐

1. Nvidia Agentic RAG

Nvidia 展示的 Agentic RAG 只是一个示例,参考了如下 3 篇论文实现。

  • 路由 (Adaptive-RAG[1]). 根据问题路由到不同的检索器
  • 回退 (Corrective RAG[2]). 如果文档与查询不相关,则回退到网络搜索
  • 自纠错 (Self-RAG[3]). 当答案具有幻觉或者未能回答问题时候,自动尝试修正答案。

它基本实现了如下图所示的框架,它使用打分机制评判答案是否包含幻觉,是否需要加入新的信息。具体地址可以参考:https://github.com/NVIDIA/workbench-example-agentic-rag/blob/main/code/langgraph_rag_agent_llama3_nvidia_nim.ipynb,整个代码基于Langchain开发,使用流程编排完成,包含大量的Prompt设计。

这个项目还包含ChatUI,可以显示具体的运行流程,如下图所示。

2. LlamaIndex Agentic RAG

DeepLearning.ai 的课程Agentic RAG[4],由 LlamaIndex 的创始人 Jerry Liu 讲授,描述了一种使用 LlamaIndex 如何构建 Agentic RAG 的流程。它将文档包含检索等流程包装成为一个 Tool,然后包装到 Agent 中,供路由选择调用。而在路由前,它会尝试分解或重写用户查询,然后交给 Router,大概设计流程如下。

agentic-rag-llama

比如你可能会问:“比较一下 adapt rag 和 self-rag,首先分析各个论文中的方法”,查询重写模块可能会将用户提问分解为:

  • adapt rag 中的方法
  • self rag 中的方法
  • 对比 self rag 和 adapt rag

然后 Router 会分别调用 self rag 的 summary tool 和 adapt rag 的 summary tool,然后由 LLM 进行总结输出。

更为具体代码设计,可访问课程:https://learn.deeplearning.ai/courses/building-agentic-rag-with-llamaindex。

结语

Agentic RAG 不仅仅是一种技术,更是一种思维方式。它代表了从被动检索到主动学习、从静态匹配到动态智能的巨大飞跃。

参考资料

[1]

Adaptive-RAG:https://arxiv.org/abs/2403.14403

[2]

Corrective RAG:https://arxiv.org/pdf/2401.15884.pdf

[3]

Self-RAG:https://arxiv.org/abs/2310.11511

[4]

Agentic RAG:https://learn.deeplearning.ai/courses/building-agentic-rag-with-llamaindex/lesson/5/building-a-multi-document-agent

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AgenticAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Agentic RAG:智能决策的新范式
    • 1. 查询分析:智能重构
    • 2. 多源数据检索:打破信息孤岛
    • 3. 动态答案生成与优化
    • 4. 从失败中学习:自我修正机制
  • 2. Agentic RAG 资源推荐
    • 1. Nvidia Agentic RAG
    • 2. LlamaIndex Agentic RAG
  • 结语
    • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档