近年来,人工智能技术取得了长足的进步,尤其是生成式人工智能取得了令人瞩目的进展。 IDC 研究显示,生成式 AI 市场规模预计将在 2022 年达到 107 亿美元,2026 年达到 326 亿美元。然而,生成式人工智能在其输出的质量、准确性和可靠性方面仍有改进的空间。引起关注的是检索增强生成(RAG)。 RAG是一种从外部知识源获取相关信息以提高生成式AI性能的技术。
在本文中,我们将从以下几个角度详细描述RAG在生成AI中的最新方法、优缺点。
(1)什么是RAG?其目的和基本机制 检索增强生成 (RAG) 是一种自然语言处理 (NLP) 技术,结合了基于搜索和基于生成的人工智能模型的优势1。这项技术允许生成式人工智能模型访问外部知识库并生成更准确和相关的答案2。传统的生成式人工智能模型仅限于训练数据中包含的信息,难以反映特定领域的最新信息或专业知识。 RAG 的开发就是为了克服这一挑战3。 RAG 允许生成式 AI 模型整合来自外部知识源的最新信息,例如最新的研究成果、统计数据和新闻3。 RAG 还允许公司控制和修改其 LLM 来源,以适应不断变化的需求和跨职能使用3。
RAG的基本机制如下4.
搜索和预处理:使用生成式 AI 模型生成的查询从网页、知识库和数据库等外部数据源搜索相关信息。检索到的信息经过预处理,例如标记化、词干提取和停用词删除。 基于证据的生成:预处理的信息被纳入预训练的大规模语言模型(LLM)中。这增强了法学硕士的背景,并允许更全面地理解该主题。因此,法学硕士能够生成更准确、信息丰富且有吸引力的答案。 搜索通常使用语义搜索引擎,该引擎使用向量数据库中存储的嵌入以及高级排名和查询重写功能。这确保结果与查询相关并回答用户的问题 4。
RAG 还有助于防止法学硕士产生“幻觉”,即产生听起来似乎合理但实际上没有数据或文档支持的答案4。 RAG 通过向 LLM 提供“事实”作为输入提示的一部分来缓解这一问题。这种方法的核心是向法学硕士提供最相关的事实,并确保法学硕士的输出完全基于这些事实。同时必须回答用户问题并遵守系统指令和安全约束。4.
RAG的出现源于Patrick Lewis及其同事在20206年发表的一篇论文。他们开发了 RAG,将生成式人工智能服务与外部资源联系起来,特别是那些富含最新技术细节的资源。在本文中,我们将 RAG 称为“通用微调配方”,因为几乎所有法学硕士都可以使用它来连接几乎任何外部资源6。
(2)最新的RAG方法 RAG近年来发展迅速,各种方法被提出7。在这里,我们将解释最新的代表性方法及其特点。
方法 特征 简单的RAG 它是一种基于用户查询检索相关文档并使用 LLM 生成响应的基本技术。 主动RAG 它是一种根据用户反馈迭代细化查询以提高其相关性的方法。 纠正性RAG 它是一种纠正或交叉检查生成的输出以确保事实准确性的方法。 自我RAG 它是一种通过自我反思或自我批评来提高RAG结果质量的方法。 LLM 将批评每个答案,以确定它是否与您的查询相关。如果不相关,请使用外部来源;如果相关,请检查是否存在幻觉和准确性。 投机性RAG 一种针对给定查询生成多个响应并利用检索模型提供相关信息的技术。这些回答通过评分系统进行评估,以选择最准确且适合上下文的回答。 多模式RAG 一种结合多种数据类型(例如文本、图像和视频)以生成更丰富的响应的技术。 高级RAG 该方法利用高密度搜索、Transformer等前沿搜索方法实现高性能搜索。 知识密集型RAG 专门用于专门或特定领域信息的技术。 内存碎片 一种记住过去交互的技术,以提高未来响应的质量、连续性和个性化。 元学习RAG 它是一种快速自适应方法,具有少样本或零样本学习能力。 HtmlRAG 一种直接使用 HTML 来保存有价值的信息结构(例如标题和表格)而不是纯文本的技术。应用清理和修剪技术来处理 HTML 中的额外噪音和大小。 快速RAG 它是一种利用模式和脚本学习来高效处理数据并且完全独立于AI模型的方法。将文本搜索和知识图查询相结合可提高准确性,将处理时间缩短 90%,并将成本降低 85%。 自动RAG 它是一种自主方法,使用 LLM 通过多轮交互来细化查询和计划检索,直到收集到足够的信息。这个经过微调的系统可以适应您问题的难度,并以自然语言解释整个过程。 科拉格 一种使用蒙特卡罗树搜索 (MCTS) 框架来解释块之间的相关性并解决添加块的非单调效用的方法。它还使用配置代理来适应不同的查询类型。 备忘录RAG 该方法使用具有长期记忆的双系统方法。轻量级的LLM会创建数据库“全局内存”并生成草稿答案来指导检索工具,而更强大的LLM则使用检索到的数据来生成最终答案。 RAG-小偷 一种旨在发现集成私有知识库和 LLM 的 RAG 系统中的隐私风险的方法。通过从对抗性查询开始并从响应中学习来生成更有效的查询,自动提取私有数据(超过 70%)。 辅助RAG 一种在法学硕士中整合智能助手来管理工具、内存和规划的方法。我们使用两步培训过程:课程辅助学习和增强偏好优化来增强信息检索和决策。 LaB-RAG 这是一种通过将图像标签与 RAG 和 LLM 相结合来生成图像标题的方法。使用简单的分类器将 X 射线图像转换为文本标签。这些标签可帮助预训练的法学硕士生成详细的放射学报告,而无需训练法学硕士或直接使用图像数据。 视频RAG 一种轻量级、经济高效的解决方案,无需进行大量调整即可提高模型对长格式视频的理解。通过即插即用的方法,我们使用开源工具从视频中提取对齐信息,并将这些数据作为补充文本与 LVLM 集成。 检索增强预测 (RAF) 一种增强时间序列基础模型 (TSFM)(例如 Chronos)的技术,可动态检索相关时间序列示例以改进预测。解决时间序列数据的事件驱动和不断发展的本质。 鲁AG 它是一种通过使用LLM常识来定义谓词并使用蒙特卡罗树搜索(MCTS)有效地探索数据,将大型数据集转换为可解释的逻辑规则的技术。然后逻辑规则被翻译成自然语言并集成到LLM提示中以增强推理能力。 MMed-RAG 它是一个多模态 RAG 系统,旨在提高医学视觉语言模型在诊断和报告生成等任务中的事实准确性。它还使用自适应上下文选择和偏好微调来解决幻觉和错位等问题。 路径RAG PathVQA-Open 是一个通过改进任务的病理图像分析来增强癌症诊断的框架。使用 HistoCartography 从图像中提取知识,选择重要的补丁以融入专家见解,将准确性从 38% 提高到 47%,并改进长格式问题的回答。 (3) 每种方法的优缺点 每种 RAG 方法都有不同的特点,因此具有不同的优点和缺点。这里,我们将从性能提升、效率、覆盖范围、实施难易程度等方面进行比较。
拉格技术 优点 缺点 简单的RAG - 能够处理广泛的任务和数据 8
例如,Simple RAG可以应用于广泛的任务,并且相对容易实现,但它不适合复杂的查询或高级推理。另一方面,Active RAG 可以通过合并用户反馈来提高输出质量,但收集和处理反馈的成本很高。
因此,在选择RAG方法时,需要考虑任务需求、数据类型、可用资源等,选择最合适的方法。
基准工具和数据集 有多种工具和数据集可用于使用 RAG7 对 LLM 进行基准测试。
自然问题(NQ)数据集:这是一个包含现实世界长答案和简答案类型问题的数据集,通常需要从维基百科检索。 NQ 衡量模型检索相关文档并生成准确的、基于事实的答案的能力。因此,它非常适合评估 RAG 在问答任务中的表现。 MS MARCO(微软机器阅读理解): MS MARCO 是一个用于文档检索和句子排名的大型数据集,包含来自 Bing 搜索日志的实际查询以及相应的句子和答案。它用于测试 RAG 检索最相关的段落并生成高质量、连贯答案的能力。 TriviaQA:这个问答数据集将问题与包含正确答案的网络文档配对。评估 RAG 是否能够捕获相关事实信息并将其纳入准确的答复中。特别适合基于琐事或一般知识的查询。 FEVER(事实提取和验证):该数据集专为事实提取和检索而设计。 FEVER 提供声明并要求模型检索证据以验证声明的准确性。非常适合评估 RAG 捕获相关证据并生成基于事实、有理有据的响应的程度。 (4) RAG 在特定用例中的有效性 RAG 在各种用例中都很有效。在这里,我们将通过具体的例子来解释这一点。
问答:在问答系统中,RAG可以从外部知识源获取与问题相关的信息,并生成更准确、更详细的答案。例如,针对法律问题,RAG 可以搜索相关法律条款和判例法,并根据该信息生成答案11。 Cohesity Gaia 是使用 RAG AI 搜索和总结日常语言内容并创建对话查询的示例1。 Cohesity Gaia RAG 平台接受人类和机器输入,包括问题和查询。其输入通过关键字进行标记,可快速将 PB 级的企业备份数据过滤为更小的上下文数据子集。然后选择与您的问题或查询最相关的文档或对象中的表达式。结果与原始查询一起打包到 LLM(例如 GPT4)中,以提供上下文感知的、类似人类的答案。 句子摘要:在长文本摘要任务中,RAG可以从外部知识源获取重要信息并生成更多的摘要文本。例如,在总结一篇新闻文章时,RAG 可以搜索与该文章相关的背景或补充信息并将其包含在摘要中。 12 翻译:在翻译任务中,RAG可以从外部知识源获取与待翻译文本相关的信息,并产生更自然、准确的翻译。例如,在翻译技术术语时,RAG 可以搜索术语词典和技术文档来选择合适的翻译12。 聊天机器人: RAG 对于聊天机器人等实时应用程序特别有用。 RAG 允许聊天机器人提供最新信息。例如,在航空公司聊天机器人中使用 RAG 可以通过提供最新选项来帮助客户找到替代航班和座位13。 电子商务:通过捕获和整合有关用户偏好和产品详细信息的信息,RAG 可以改善电子商务中的用户体验,并提供更相关和个性化的产品推荐11。 制造业:在制造业中,RAG 可帮助您快速访问重要信息,例如工厂车间运营情况。它还有助于决策过程、故障排除和组织创新。对于在严格监管框架内运营的制造商,RAG 可以从内部和外部来源(包括行业标准和监管机构)快速获取最新的监管和合规标准。 11 医疗保健: RAG 在医疗保健行业具有潜力,因为在该行业中获取准确、及时的信息至关重要。通过捕获和整合来自外部来源的相关医学知识,RAG 可以在医疗应用中提供更准确和上下文感知的响应。此类应用程序增强了人类临床医生可获得的信息。做出最终决定的是人类临床医生,而不是模型11。 (五)RAG未来发展方向、挑战与可能性 RAG 预计将继续发展成为提高生成式 AI 性能的重要技术。未来的发展方向包括:14
引入更先进的搜索技术:将Transformer等最新技术引入RAG将使您能够高效地搜索更多相关信息。 多模态 RAG 的开发:通过集成各种数据类型,例如文本以及图像、音频和视频,可以生成更丰富、更具表现力的输出。 个性化:根据用户偏好和情况提供更加个性化的信息,提高用户满意度。 自问 RAG:通过允许系统自动分解复杂问题来实现深度学习技术。 自适应搜索:根据查询类型调整搜索策略,例如对事实问题和创造性任务使用不同的方法。 混合搜索:结合不同的搜索方法,例如关键词匹配和语义搜索,检索单一方法可能错过的相关信息。 另一方面,RAG 也存在以下问题12。
数据偏差:如果外部知识源包含偏差,生成式人工智能的输出也可能反映偏差。必须实施算法解决方案来识别和纠正偏差。您还需要创建公正且多样化的数据集。 安全和隐私:当外部知识源包含敏感信息时,安全和隐私保护就变得重要。组织必须采用严格的安全措施(例如数据加密和安全访问控制)来保护敏感信息并维持信任。 计算成本:利用大量外部知识源时,计算成本可能会很高。 依赖于检索到的文档的质量和相关性: RAG 系统的有效性从根本上来说与检索组件从庞大的数据库或文档集合中获取相关且准确的信息的能力有关。如果检索过程失败,检索不相关、过时或不准确的文档可能会产生有缺陷或误导性的输出。 实施 RAG 是一项资源密集型任务:实施 RAG 需要强大的基础设施,可以管理来自各种来源的同步数据采集以及内容生成中涉及的复杂流程。 通过克服这些挑战,RAG有望作为一种更可靠、安全、高效的技术应用于各个领域。
结论 RAG是提高生成式AI输出的质量、准确性和可靠性的关键技术。已经提出了各种方法,每种方法都有优点和缺点。根据您的用例选择适当的技术非常重要。 RAG预计未来将继续进一步发展,并有潜力通过在各个领域的应用对社会产生重大影响。 RAG 使人工智能能够始终使用最新的相关信息,使其成为信息快速变化的动态环境(例如新闻、金融和医学研究)中的宝贵工具。 12 。 RAG对AI技术的发展寄予厚望。通过促进快速访问相关数据,RAG 可以显着缩短研究时间,并通过准确及时的信息支持研发计划15。
参考
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有