首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >下一代开源 RAG 引擎,让你的 AI 检索与推理能力直接起飞

下一代开源 RAG 引擎,让你的 AI 检索与推理能力直接起飞

原创
作者头像
星哥玩云
发布2025-09-09 21:56:35
发布2025-09-09 21:56:35
4400
代码可运行
举报
文章被收录于专栏:星哥的AI自留地星哥的AI自留地
运行总次数:0
代码可运行

下一代开源 RAG 引擎,让你的 AI 检索与推理能力直接起飞

在大模型席卷各行各业的当下,企业对 “让 AI 读懂自家文档” 的需求愈发迫切 —— 但市面上多数 RAG 工具要么卡在 “文档读不懂、信息提不出” 的浅层处理,要么依赖付费服务导致成本高企。

直到星哥发现了ragflow这款开源神器,才算真正解决了 “深度文档理解 + 低成本落地” 的核心痛点。

今天就带大家好好拆解下,这款基于深度文档理解的 RAG 引擎,到底能给企业和开发者带来什么惊喜。

一、RAGFlow 是什么?

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,通过融合前沿的 RAG 技术与 Agent 能力,为大型语言模型提供卓越的上下文层。它提供可适配任意规模企业的端到端 RAG 工作流,凭借融合式上下文引擎与预置的 Agent 模板,助力开发者以极致效率与精度将复杂数据转化为高可信、生产级的人工智能系统。

简单说,ragflow 是一款开源的检索增强生成(RAG)引擎,核心定位是 “让 AI 能真正‘读懂’复杂文档,再生成精准回答”。和传统 RAG 工具只做 “关键词匹配” 不同,它的核心优势落在 “深度文档理解” 上 —— 不管是 PDF 里的表格、Word 里的多级标题,还是 PPT 里的图文组合,它都能拆解成结构化信息,避免了 “找得到文档、却抽不出关键信息” 的尴尬。

它的目标很直接:让复杂数据转化为高精度、可落地的 AI 系统,无论是个人项目还是企业级应用,都能快速部署。

核心亮点:

  • 融合 Agent 能力:不仅能检索,还能执行任务、调用工具。
  • 企业级可扩展性:支持从个人开发到大规模生产环境的平滑迁移。
  • 预置模板与工作流:减少重复造轮子,快速构建业务场景。
img
img

二、安装RAGFlow

系统:Linux

1. 环境要求

  • CPU ≥ 4 核
  • 内存 ≥ 16 GB
  • 磁盘 ≥ 50 GB
  • Docker ≥ 24.0.0 & Docker Compose ≥ v2.26.1

确保系统已安装 Docker ≥ 24.0.0Docker Compose ≥ v2.26.1,以满足容器编排需求。同时需配置系统参数 vm.max_map_count ≥ 262144(Elasticsearch 运行必需),检查与设置命令如下:

  • 检查当前值:sysctl vm.max_map_count
  • 临时设置:sudo sysctl -w vm.max_map_count=262144(重启后失效)
  • 永久生效:编辑 /etc/sysctl.conf 文件,添加 vm.max_map_count=262144 并执行 sudo sysctl -p

2. 安装步骤

代码语言:javascript
代码运行次数:0
运行
复制
# 克隆仓库
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
​
# 启动服务(CPU 版本)
docker compose -f docker-compose.yml up -d
由于测试机的80和443端口被占用了,所以需要修改端口号
vi docker-compose.yml
把80和443改成 880和 8443
- ${SVR_HTTP_PORT}:9380
- 880:80
- 8443:443
​
# GPU 加速版本
docker compose -f docker-compose-gpu.yml up -d

如果你遇到 Docker 镜像拉不下来的问题,可以在 docker/.env 文件内根据变量 RAGFLOW_IMAGE 的注释提示选择华为云或者阿里云的相应镜像。

代码语言:javascript
代码运行次数:0
运行
复制
华为云镜像名:swr.cn-north-4.myhuaweicloud.com/infiniflow/ragflow
阿里云镜像名:registry.cn-hangzhou.aliyuncs.com/infiniflow/ragflow
​
vi docker/.env
img
img

再执行

代码语言:javascript
代码运行次数:0
运行
复制
docker compose -f docker-compose.yml up -d
服务器启动成功后服务器状态:
docker logs -f ragflow-server

报错:

代码语言:javascript
代码运行次数:0
运行
复制
✘ redis Error context canceled 1.1s error pulling image configuration: download failed after attempts=1: toomanyrequests: too many requests
把阿里的改成华为的
img
img

3. 访问服务

浏览器访问 IP+端口号,即可进入 RAGFlow 管理界面。

img
img

点击注册按钮

4.登录页面

再登录即可进入RAGFlow后台

img
img

5.系统状态

img
img

6.设置大模型

img
img

查看docker状态

代码语言:javascript
代码运行次数:0
运行
复制
 docker ps
CONTAINER ID   IMAGE                                                              COMMAND                  CREATED         STATUS                   PORTS                                                                                                                                                                                                                               NAMES
d6d392f925af   swr.cn-north-4.myhuaweicloud.com/infiniflow/ragflow:nightly-slim   "./entrypoint.sh"        8 minutes ago   Up 8 minutes             0.0.0.0:5678-5679->5678-5679/tcp, :::5678-5679->5678-5679/tcp, 0.0.0.0:9380->9380/tcp, :::9380->9380/tcp, 0.0.0.0:9382->9382/tcp, :::9382->9382/tcp, 0.0.0.0:880->80/tcp, :::880->80/tcp, 0.0.0.0:8443->443/tcp, :::8443->443/tcp   ragflow-server
57504a5df5f0   elasticsearch:8.11.3                                               "/bin/tini -- /usr/l…"   8 minutes ago   Up 8 minutes (healthy)   9300/tcp, 0.0.0.0:1200->9200/tcp, :::1200->9200/tcp                                                                                                                                                                                 ragflow-es-01
4e481e75a912   quay.io/minio/minio:RELEASE.2025-06-13T11-33-47Z                   "/usr/bin/docker-ent…"   8 minutes ago   Up 8 minutes (healthy)   0.0.0.0:9000-9001->9000-9001/tcp, :::9000-9001->9000-9001/tcp                                                                                                                                                                       ragflow-minio
e943a5bfeac4   mysql:8.0.39                                                       "docker-entrypoint.s…"   8 minutes ago   Up 8 minutes (healthy)   33060/tcp, 0.0.0.0:5455->3306/tcp, :::5455->3306/tcp                                                                                                                                                                                ragflow-mysql
bb599ec58494   valkey/valkey:8                                                    "docker-entrypoint.s…"   8 minutes ago   Up 8 minutes (healthy)   0.0.0.0:6379->6379/tcp, :::6379->6379/tcp                                                                                                                                                                                           ragflow-redis

三、系统架构概览

RAGFlow 的架构由以下核心模块组成:

  • 数据接入层:支持多种数据源接入与解析
  • 检索与索引引擎:默认 Elasticsearch,可切换到 Infinity
  • Agent 执行层:支持多步推理、工具调用、代码执行
  • 可视化管理界面:方便非技术人员参与数据管理与调优

架构设计的重点是解耦可扩展性,方便根据业务需求替换或扩展模块。


四、应用场景

  • 企业知识库问答:快速构建内部知识问答系统
  • 多模态文档解析:支持 PDF、图片、扫描件等复杂文档
  • 智能客服与业务助手:结合 Agent 实现自动化任务处理
  • 跨语言检索与推理:支持多语言查询与回答

五、星哥的观点

RAGFlow 不只是一个 RAG 引擎,它更像是一个AI 应用加速

对于想要快速落地 AI 检索与推理能力的团队来说,它的开源、可扩展、可视化特性非常有吸引力。

尤其是它的 Agent 能力,让 RAG 不再只是“查找答案”,而是能执行任务、调用外部工具、完成多步推理

如果你正打算构建一个高精度、可追溯、可扩展的 AI 系统,RAGFlow 值得你花时间深入研究。

参考:

代码语言:javascript
代码运行次数:0
运行
复制
- [RAGFlow 官方 GitHub 仓库](https://github.com/infiniflow/ragflow)
- [RAGFlow 在线 Demo](https://demo.ragflow.io/)

写文不易,如果你都看到了这里,请点个赞和在看,分享给更多的朋友;也别忘了关注星哥玩云!这里有满满的干货分享,还有轻松有趣的技术交流~点个赞、分享给身边的小伙伴,一起成长,一起玩转技术世界吧! 😊

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 下一代开源 RAG 引擎,让你的 AI 检索与推理能力直接起飞
    • 一、RAGFlow 是什么?
    • 二、安装RAGFlow
      • 1. 环境要求
      • 2. 安装步骤
      • 3. 访问服务
      • 4.登录页面
      • 5.系统状态
      • 6.设置大模型
    • 三、系统架构概览
    • 四、应用场景
    • 五、星哥的观点
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档