Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >RAG技术的三大范式和技术演进

RAG技术的三大范式和技术演进

作者头像
老_张
发布于 2025-05-23 05:11:51
发布于 2025-05-23 05:11:51
3480
举报

前面的文章中,为大家介绍过大模型领域的核心技术:RAG(Retrieval-Augmented Generation),即检索增强生成

大模型的技术原理是不断预测下一个Token,且每一个已经生成的Token都会影响下一个Token的生成。简单来说,大模型就是一个概率预测机器,同样的Prompt会产生不同的答案,这就是所谓的信息幻觉问题。

换个容易理解的说法,针对同一个或同一组Prompt,大模型的结果不具备幂等性。

从2022年底ChatGPT横空出世以来,大模型的信息幻觉(生成错误信息)、知识过时、推理过程不透明等问题,一直困扰着业内各方技术人员,直至RAG技术出现,才算缓解了这个难题。

2023年12月18日,多位知名学者联合发表了一篇关于RAG技术的综述文章《Retrieval-Augmented Generation for Large Language Models: A Survey》,对RAG的三大范式演进(基础RAG、高级RAG、模块化RAG)和检索、生成与增强三大核心组件的关键技术进行了深入探讨。文中还提出了RAG的评估框架与未来研究方向,以及RAG与大模型微调、提示词工程的互补性和多模态能力扩展的潜力。

原文链接:https://arxiv.org/pdf/2312.10997

如果无法访问,可以点击这个链接:https://metaso.cn/s/LlcV6lu

下面是我翻译并总结的这篇文章的核心内容,仅供参考。


一、RAG的三大技术范式

1、基础RAG(Naive RAG)

  • 流程:索引(Indexing)→ 检索(Retrieval)→ 生成(Generation)。
  • 案例:在开放域问答中,将用户问题向量化后检索相似文档,生成答案。例如,针对“量子计算的优势是什么?”的提问,系统检索维基百科相关段落并生成回答。
  • 问题:检索精度低(如召回无关内容)、生成阶段可能出现幻觉、上下文整合不充分。

2、高级RAG(Advanced RAG)

  • 预检索优化:采用滑动窗口索引、细粒度分段(如按语义拆分段落)、元数据标签(如文档来源、时间戳)提升检索质量。
  • 后检索优化:通过重排序(Re-ranking)和上下文压缩(Context Compression)筛选最相关片段。
    • 案例:医疗领域问答中,通过元数据筛选最新临床指南,确保生成答案的时效性。

3、模块化RAG(Modular RAG)

  • 特点:模块化设计支持动态组合。
  • 搜索模块:支持多源检索(数据库知识图谱API)。
  • 记忆模块:缓存历史检索结果以加速响应。
  • 路由模块:根据任务类型选择不同检索策略。
    • 案例:客服系统中,路由模块自动判断用户意图(技术问题→检索产品文档,投诉→检索处理流程),提升服务效率。

二、RAG的核心技术组件

1、检索优化

  • 数据源选择:结构化数据(数据库表)与非结构化数据(文本、PDF)的混合使用。
  • 索引策略:层次化索引(Hierarchical Indexing)结合粗粒度与细粒度分段。
  • 查询优化:使用LLMs重写用户查询(如扩展同义词)以提高检索相关性。

2、生成增强

  • 上下文整合:通过“思维链”(Chain-of-Thought)将内容与LLMs内部知识结合。
  • 生成控制:限制LLMs仅依赖检索内容(减少幻觉)或允许混合推理(提高创造性)。
  • 案例:金融报告中,模型仅检索的最新财报数据生成分析,避免依赖过时知识。

3、增强策略

  • 迭代检索:根据初步生成结果二次检索补充信息。
  • 自适应检索:动态调整检索范围(如扩大时间窗口或切换数据源)。
  • 案例:学术论文写作助手在生成初稿后,自动检索相关研究填补逻辑漏洞。

三、评估方法与挑战

1、评估指标

  • 质量指标:上下文相关性(Context Relevance)、答案忠实性(Answer Faithfulness)、答案相关性(Answer Relevance)。
  • 能力指标:噪声鲁棒性(Noise Robustness)、反事实鲁棒性(Counterfactual Robustness)。
  • 评估工具:RAGAS(专用于RAG的评估框架)、ARES(自动化评分系统)。

2、主要挑战

  • 长上下文处理:检索内容过长导致生成速度下降(需平衡检索精度与效率)。
  • 多模态扩展:图像、音频等非文本数据的检索与生成尚未成熟。
  • 生态工具链:现有工具(如LangChain)对复杂工作流支持不足。

四、未来研究方向

  • 垂直优化:提升RAG在专业领域(如法律、医疗)的准确性和领域适应性。
  • 混合方法:结合RAG与微调(Fine-tuning),例如训练专用检索器。
  • 多模态RAG:支持跨模态检索(如根据文本描述检索图像)。

五、关键术语中英对照表

以上内容基于论文原文翻译和总结,如需进一步技术细节或数据,可参考GitHub开源项目:Tongji-KGLLM/RAG-Survey

GitHub项目链接:https://github.com/Tongji-KGLLM/RAG-Survey

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 老张的求知思考世界 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
最全梳理:一文搞懂RAG技术的5种范式!
本文主要回顾 RAG 技术的发展,第一部分梳理了综述和关键论文,第二部分梳理了工程实践工具。 
Datawhale
2025/02/24
1.9K0
最全梳理:一文搞懂RAG技术的5种范式!
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
首先,我们将 RAG 工作流程分为三个部分,以增强我们对 RAG 的理解,并优化每个部分以提高整体性能:
致Great
2025/02/22
1.1K0
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
RAG七十二式:2024年度RAG清单
回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图谱再创新机,年末图表理解、多模态RAG又启新征程,简直“你方唱罢我登场”,奇技叠出,不胜枚举!
AI研思录
2025/02/20
2680
RAG七十二式:2024年度RAG清单
RAG 技术综述
检索增强生成(Retrieval Augmented Generation,简称 RAG)向 LLM 提供了从特定数据源检索的信息,以此作为生成答案的基础。简而言之,RAG 结合了搜索和 LLM 的提示功能,在此基础上,模型根据搜索算法提供的信息,作为上下文来回答问题。这些查询和检索到的上下文会一并被注入到发送给 LLM 的提示中。
科技之歌
2024/02/01
1.7K0
RAG 技术综述
Agentic RAG:超越传统RAG与案例分享
在人工智能快速发展的今天,检索增强生成(Retrieval-Augmented Generation,简称 RAG)技术已经成为大语言模型(LLM)应用的关键突破。RAG 框架不断推陈出新、日新月异,从 Navie RAG、高级 RAG、模块化 RAG,发展到现在的 Graph based RAG,甚至混合高级 RAG 与 GraphRAG 的 HybridRAG。那么,如何在日新月异的 RAG 技术下,开发一种能够不断适应的框架呢?今天,我们将深入探讨 Agentic RAG,这一革命性的方法正在重新定义智能信息检索与生成的边界。
AgenticAI
2025/03/18
5220
Agentic RAG:超越传统RAG与案例分享
带你全面了解 RAG,深入探讨其核心范式、关键技术及未来趋势!
大型语言模型(LLMs)已经成为我们生活和工作的一部分,它们以惊人的多功能性和智能化改变了我们与信息的互动方式。
ShuYini
2024/01/11
5K0
带你全面了解 RAG,深入探讨其核心范式、关键技术及未来趋势!
独家 | 进阶RAG-提升RAG效果
在我的上一篇博客中,我深入地介绍了RAG以及它是如何用LlamaIndex实现的。然而,RAG在回答问题时经常遇到许多挑战。在本博客中,我将解决这些挑战,更重要的是,我们将深入研究提高RAG性能的解决方案,使其可用于生产环境。
数据派THU
2024/06/28
8090
独家 | 进阶RAG-提升RAG效果
深入RAG工作流:检索生成的最佳实践
今天分享的是复旦大学和智能信息处理上海市重点实验室联合发表的一篇文章:实现检索增强生成(RAG)的最佳实践
AI研思录
2025/02/20
4770
深入RAG工作流:检索生成的最佳实践
一文读懂 Agentic RAG 技术点滴
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 提升大型语言模型(LLMs)的知识获取和生成能力的 Agentic RAG(智能增强检索生成)技术。
Luga Lee
2025/04/04
2780
一文读懂 Agentic RAG 技术点滴
同济大学发布最新检索增强(RAG)的LLM生成技术综述
摘要主要介绍了大型语言模型(LLMs)在实际应用中面临的挑战,比如幻觉、知识更新缓慢和答案缺乏透明度等问题,并提出了检索增强生成(Retrieval-Augmented Generation,RAG)作为一种解决方案。RAG通过从外部知识库检索相关信息来辅助大型语言模型回答问题,已经被证明能显著提高回答的准确性,减少模型产生的幻觉,尤其是在知识密集型任务中。
唐国梁Tommy
2023/12/21
17.1K0
同济大学发布最新检索增强(RAG)的LLM生成技术综述
RAG 范式、技术和趋势
这里分享同济大学 Haofen Wang的关于检索增强生成的报告:《Retrieval-Augmented Generation (RAG): Paradigms, Technologies, and Trends》 ,RAG 范式、技术和趋势。
JadePeng
2024/03/16
1.5K0
RAG 范式、技术和趋势
干货!带你了解7种检索增强生成 (RAG) 技术
在简单RAG中,大型语言模型(LLM)接收用户查询,在向量存储库中进行相似性搜索或在知识图谱中进行关系搜索,然后基于检索到的信息生成答案。
致Great
2025/01/06
5.7K0
干货!带你了解7种检索增强生成 (RAG) 技术
RAG技术全解析:打造下一代智能问答系统
大型语言模型(LLM)已经取得了显著的成功,尽管它们仍然面临重大的限制,特别是在特定领域或知识密集型任务中,尤其是在处理超出其训练数据或需要当前信息的查询时,常会产生“幻觉”现象。为了克服这些挑战,检索增强生成(RAG)通过从外部知识库检索相关文档chunk并进行语义相似度计算,增强了LLM的功能。通过引用外部知识,RAG有效地减少了生成事实不正确内容的问题。RAG目前是基于LLM系统中最受欢迎的架构,有许多产品基于RAG构建,使RAG成为推动聊天机器人发展和增强LLM在现实世界应用适用性的关键技术。
用户9177072
2024/05/08
6210
LLM RAG系列
本文介绍了RAG以及RAG pipeline的整个流程,包括请求转换、路由和请求构造、索引和检索、生成和评估等,其中引用了大量有价值的论文。
charlieroro
2024/04/02
8600
LLM RAG系列
RAG的10篇论文-2024Q1
在大型模型的研究与工程应用领域,变化之迅猛令人瞠目,用“日新月异”来形容似乎都显得有些保守。即便是针对其中的RAG技术,自2024年伊始至今,学界就已经涌现出了很多高质量的研究论文。在这里,老码农挑选了十篇具有代表性的作品,以期对大家的探索和实践提供有益的参考与启示。
半吊子全栈工匠
2024/04/22
2.1K0
RAG的10篇论文-2024Q1
【RAG】001.1-RAG相关核心概念
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与生成模型的混合架构,旨在提升生成的准确性和可信度。其核心概念可归纳为以下六个方面:
訾博ZiBo
2025/03/26
3170
2024技术总结:LLM之RAG技术全栈进化解析、Agent应用案例精选、LLM大模型部署实战指南
嘿,大家好!作为一名技术宅,我在2024年与AI的大型语言模型(LLM)技术有了不少“亲密接触”,感觉就像是和一位日益聪明的老友并肩前行。
汀丶人工智能
2025/01/25
8330
2024技术总结:LLM之RAG技术全栈进化解析、Agent应用案例精选、LLM大模型部署实战指南
RAG——使用检索增强生成构建特定行业的大型语言模型
在人工智能兴起的当下,AI正在不断地重塑着很多行业。我辈人工智能从业者,在探索AI应用的同时,也在不断地下钻技术本质。由于笔者之前梳理过比较多的AI应用,在查看检索增强生成技术(Retrieval-Augmented Generation)技术论文时,发现了一个事实,那就是几乎各大AI应用都有用到这种检索增强技术。
山行AI
2023/06/14
7.1K1
RAG——使用检索增强生成构建特定行业的大型语言模型
从GraphRAG最新论文综述探究如何改进微软 GraphRAG
最近北大、浙大等高校和蚂蚁集团等机构发布了一篇 GraphRAG 综述论文《Graph Retrieval-Augmented Generation: A Survey[1]》。本文首先对论文进行简单介绍,然后对论文中 GraphRAG 提到的三个阶段进行分别介绍,探索当前业界都在尝试哪些方法优化 GraphRAG,以及有哪些较为流行的GraphRAG框架。我也会穿插讲解微软 GraphRAG 中的实现和可能的优化方法。
AgenticAI
2025/03/18
4490
从GraphRAG最新论文综述探究如何改进微软 GraphRAG
【原创】一文读懂RAG的来源、发展和前沿
检索增强生成(Retrieval Augmented Generation,RAG)结合了检索 (Retrieval) 和生成 (Generation) 两个过程,旨在提高机器生成文本的相关性、准确性和多样性。RAG通过在生成文本输出之前先检索大量相关信息,然后将这些检索到的信息作为上下文输入到一个生成模型中,从而缓解了幻觉问题。
zenRRan
2024/03/25
4.5K0
【原创】一文读懂RAG的来源、发展和前沿
相关推荐
最全梳理:一文搞懂RAG技术的5种范式!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档