暂无搜索历史
增强生成 (RAG) 是塑造应用生成式 AI 格局的关键技术。Lewis 等人在其开创性论文中提出了一个新概念面向知识密集型 NLP 任务的检索增强生成之后,R...
DeepSeek-R1 从其基础模型 DeepSeek-V3-Base 继承了 128K 上下文长度。最初,DeepSeek-V3 使用 4K 上下文长度进行预...
由huggingface组建,目前刚上线2周,发布了最新进展open-r1/update-1,在MATH-500任务上接近deepseek的指标,可以在open...
群体相对策略优化 (GRPO,Group Relative Policy Optimization) 是一种强化学习 (RL) 算法,专门用于增强大型语言模型 ...
这篇论文旨在提高大型语言模型(LLMs)在检索增强型生成(Retrieval-Augmented Generation, RAG)系统中对检索缺陷的鲁棒性。具体...
最近几年,AI领域真是突飞猛进,尤其是大型语言模型(LLM),它们为通用人工智能(AGI)的发展打下了基础。OpenAI的o1模型就是个很好的例子,它用了一种创...
DeepSeek-R1:通过强化学习提升大型语言模型的推理能力。 2025年1月发布,提出了一种使用强化学习而非监督学习的方法,显著提升了语言模型在数学和逻辑推...
这篇论文介绍了一种新的第一代推理模型——DeepSeek-R1系列,旨在通过强化学习(Reinforcement Learning, RL)提升大型语言模型(L...
检索增强生成 (RAG) 已成为智能系统的基石,将大规模外部知识库与语言生成模型连接起来。与此同时,缓存增强生成 (CAG) 已成为一种创新的替代方案,旨在通过...
Open-R1 是由 HuggingFace 发布的一个完全开放的项目,旨在通过三个主要步骤复现 DeepSeek-R1 的完整训练流程。这个项目的目标是让更多...
近年来,人工智能技术取得了长足的进步,尤其是生成式人工智能取得了令人瞩目的进展。 IDC 研究显示,生成式 AI 市场规模预计将在 2022 年达到 107 亿...
在**开放域问答(Open-Domain Question Answering, ODQA)**任务中,**文档分块(chunking)**过程中存在的不足。特...
向量数据库是一种将数据存储为高维向量的数据库,高维向量是特征或属性的数学表示。每个向量都有一定数量的维度,根据数据的复杂性和粒度,可以从数十到数千不等。
Weaviate 是一种开源的向量搜索引擎数据库,允许以类属性的方式存储 JSON 文档,并将机器学习向量附加到这些文档上,以在向量空间中表示它们。Weavia...
官方有pip安装的方式,为了落地使用,我们还是采用Docker部署的方式,参考链接来自官方部署:
代理式检索增强生成(Agentic RAG)通过在RAG管道中嵌入自主代理,代表了人工智能领域的重大飞跃。本仓库补充了综述论文《代理式检索增强生成(Agenti...
Milvus 在 Milvus 存储库中提供了 Docker Compose 配置文件。要使用 Docker Compose 安装 Milvus,只需运行
最近,我在阅读一些关于 RAG系统的资料时,发现了一个有趣的现象:RAG 的相关性问题远比我们想象的要复杂。无论是从数据检索的角度,还是从大模型对相关性的理解来...
通过 http://localhost:6333/dashboard 地址访问web ui
在RAG(Retrieval-Augmented Generation)任务中,Chunk切分是一个关键步骤,尤其是在处理结构复杂的PDF文档时。PDF文档可能...