在大模型席卷各行各业的当下,企业对 “让 AI 读懂自家文档” 的需求愈发迫切 —— 但市面上多数 RAG 工具要么卡在 “文档读不懂、信息提不出” 的浅层处理,要么依赖付费服务导致成本高企。
直到星哥发现了ragflow这款开源神器,才算真正解决了 “深度文档理解 + 低成本落地” 的核心痛点。
今天就带大家好好拆解下,这款基于深度文档理解的 RAG 引擎,到底能给企业和开发者带来什么惊喜。
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,通过融合前沿的 RAG 技术与 Agent 能力,为大型语言模型提供卓越的上下文层。它提供可适配任意规模企业的端到端 RAG 工作流,凭借融合式上下文引擎与预置的 Agent 模板,助力开发者以极致效率与精度将复杂数据转化为高可信、生产级的人工智能系统。
简单说,ragflow 是一款开源的检索增强生成(RAG)引擎,核心定位是 “让 AI 能真正‘读懂’复杂文档,再生成精准回答”。和传统 RAG 工具只做 “关键词匹配” 不同,它的核心优势落在 “深度文档理解” 上 —— 不管是 PDF 里的表格、Word 里的多级标题,还是 PPT 里的图文组合,它都能拆解成结构化信息,避免了 “找得到文档、却抽不出关键信息” 的尴尬。
它的目标很直接:让复杂数据转化为高精度、可落地的 AI 系统,无论是个人项目还是企业级应用,都能快速部署。
核心亮点:
系统:Linux
确保系统已安装 Docker ≥ 24.0.0 且 Docker Compose ≥ v2.26.1,以满足容器编排需求。同时需配置系统参数 vm.max_map_count
≥ 262144(Elasticsearch 运行必需),检查与设置命令如下:
sysctl vm.max_map_count
sudo sysctl -w vm.max_map_count=262144
(重启后失效)/etc/sysctl.conf
文件,添加 vm.max_map_count=262144
并执行 sudo sysctl -p
# 克隆仓库
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
# 启动服务(CPU 版本)
docker compose -f docker-compose.yml up -d
由于测试机的80和443端口被占用了,所以需要修改端口号
vi docker-compose.yml
把80和443改成 880和 8443
- ${SVR_HTTP_PORT}:9380
- 880:80
- 8443:443
# GPU 加速版本
docker compose -f docker-compose-gpu.yml up -d
如果你遇到 Docker 镜像拉不下来的问题,可以在 docker/.env 文件内根据变量 RAGFLOW_IMAGE 的注释提示选择华为云或者阿里云的相应镜像。
华为云镜像名:swr.cn-north-4.myhuaweicloud.com/infiniflow/ragflow
阿里云镜像名:registry.cn-hangzhou.aliyuncs.com/infiniflow/ragflow
vi docker/.env
再执行
docker compose -f docker-compose.yml up -d
服务器启动成功后服务器状态:
docker logs -f ragflow-server
报错:
✘ redis Error context canceled 1.1s error pulling image configuration: download failed after attempts=1: toomanyrequests: too many requests
把阿里的改成华为的
浏览器访问 IP+端口号
,即可进入 RAGFlow 管理界面。
点击注册按钮
再登录即可进入RAGFlow后台
查看docker状态
docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
d6d392f925af swr.cn-north-4.myhuaweicloud.com/infiniflow/ragflow:nightly-slim "./entrypoint.sh" 8 minutes ago Up 8 minutes 0.0.0.0:5678-5679->5678-5679/tcp, :::5678-5679->5678-5679/tcp, 0.0.0.0:9380->9380/tcp, :::9380->9380/tcp, 0.0.0.0:9382->9382/tcp, :::9382->9382/tcp, 0.0.0.0:880->80/tcp, :::880->80/tcp, 0.0.0.0:8443->443/tcp, :::8443->443/tcp ragflow-server
57504a5df5f0 elasticsearch:8.11.3 "/bin/tini -- /usr/l…" 8 minutes ago Up 8 minutes (healthy) 9300/tcp, 0.0.0.0:1200->9200/tcp, :::1200->9200/tcp ragflow-es-01
4e481e75a912 quay.io/minio/minio:RELEASE.2025-06-13T11-33-47Z "/usr/bin/docker-ent…" 8 minutes ago Up 8 minutes (healthy) 0.0.0.0:9000-9001->9000-9001/tcp, :::9000-9001->9000-9001/tcp ragflow-minio
e943a5bfeac4 mysql:8.0.39 "docker-entrypoint.s…" 8 minutes ago Up 8 minutes (healthy) 33060/tcp, 0.0.0.0:5455->3306/tcp, :::5455->3306/tcp ragflow-mysql
bb599ec58494 valkey/valkey:8 "docker-entrypoint.s…" 8 minutes ago Up 8 minutes (healthy) 0.0.0.0:6379->6379/tcp, :::6379->6379/tcp ragflow-redis
RAGFlow 的架构由以下核心模块组成:
架构设计的重点是解耦与可扩展性,方便根据业务需求替换或扩展模块。
RAGFlow 不只是一个 RAG 引擎,它更像是一个AI 应用加速器。
对于想要快速落地 AI 检索与推理能力的团队来说,它的开源、可扩展、可视化特性非常有吸引力。
尤其是它的 Agent 能力,让 RAG 不再只是“查找答案”,而是能执行任务、调用外部工具、完成多步推理。
如果你正打算构建一个高精度、可追溯、可扩展的 AI 系统,RAGFlow 值得你花时间深入研究。
参考:
- [RAGFlow 官方 GitHub 仓库](https://github.com/infiniflow/ragflow)
- [RAGFlow 在线 Demo](https://demo.ragflow.io/)
写文不易,如果你都看到了这里,请点个赞和在看,分享给更多的朋友;也别忘了关注星哥玩云!这里有满满的干货分享,还有轻松有趣的技术交流~点个赞、分享给身边的小伙伴,一起成长,一起玩转技术世界吧! 😊
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。