Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用open-webui+deepseek构建本地AI知识库

使用open-webui+deepseek构建本地AI知识库

原创
作者头像
code4it
发布于 2025-02-18 01:09:36
发布于 2025-02-18 01:09:36
3.3K11
代码可运行
举报
文章被收录于专栏:码匠的流水账码匠的流水账
运行总次数:1
代码可运行

本文主要研究一下如何使用OpenWebUI+deepseek构建本地AI知识库

步骤

拉取open-webui镜像

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
docker pull ghcr.io/open-webui/open-webui:main

docker启动

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
docker run -d -p 3000:8080 \
-e OLLAMA_BASE_URL=http://host.docker.internal:11434 \
ghcr.io/open-webui/open-webui:main

执行完之后等一会(大概要三四分钟)启动起来了访问http://localhost:3000/,注册管理员账号,注册完要等一会(估计要七八分钟)页面才出来 可以-v ./open-webui-data:/app/backend/data来挂载数据

看日志是有报错

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ERROR [open_webui.routers.openai] Connection error: Cannot connect to host api.openai.com:443 ssl:default [Connect call failed ('108.160.165.173', 443)]
ERROR [open_webui.routers.openai] Connection error: Cannot connect to host api.openai.com:443 ssl:default [Connect call failed ('108.160.165.173', 443)]
ERROR [open_webui.routers.openai] Connection error: Cannot connect to host api.openai.com:443 ssl:default [Connect call failed ('108.160.165.173', 443)]
ERROR [open_webui.routers.openai] Connection error: Cannot connect to host api.openai.com:443 ssl:default [Connect call failed ('108.160.165.173', 443)]
INFO  [open_webui.routers.ollama] get_all_models()
INFO  [open_webui.routers.ollama] get_all_models()
INFO  [open_webui.routers.ollama] get_all_models()
INFO  [open_webui.routers.ollama] get_all_models()

登录之后,设置 --> 管理员设置 --> 外部链接,禁用掉OpenAI API,记得保存

开启联网搜索

在设置 --> 管理员设置 --> 联网搜索 --> 启用,然后下拉选择,这里选择tavily,可以去https://app.tavily.com/注册然后获取api key,最后点击保存就可以了

示例:今天日期是多少,看open-webui输出

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
INFO  [open_webui.routers.retrieval] save_docs_to_vector_db: document 在线时钟:当前时间, 世界时钟 :: 美国 (United States) - 当前时间, 今天日期, 今天的日期 🇨🇳, 现在北京时间 在线标准北京时间校对 web-search-d8b3e7117d85062f511572e3004ad60997448e8ed9e9b7e3bac5
INFO  [open_webui.routers.retrieval] adding to collection web-search-d8b3e7117d85062f511572e3004ad60997448e8ed9e9b7e3bac5
/pytorch/third_party/ideep/mkl-dnn/src/cpu/aarch64/xbyak_aarch64/src/util_impl_linux.h, 451: Can't read MIDR_EL1 sysfs entry
INFO  [open_webui.retrieval.utils] query_doc:result [['7ee3e76c-7804-4eb7-8dbb-7ca27b0a54ca', 'ef5b7e5c-8a7e-4220-800e-9390e9808034', '97e23c2b-43f7-457a-a086-8b264acb90e8']] [[{'description': '世界时间 - 美国 (United States) - 现在世界各地是什么时间?', 'embedding_config': '{"engine": "", "model": "sentence-transformers/all-MiniLM-L6-v2"}', 'language': 'zh', 'source': 'https://24timezones.com/美国/时间', 'start_index': 3508, 'title': '世界时钟 :: 美国 (United States) - 当前时间'}, {'description': '根據您所在的位置找出今天是什麼日期。了解格式為 mm-dd-yyyy 的確切數字日期。', 'embedding_config': '{"engine": "", "model": "sentence-transformers/all-MiniLM-L6-v2"}', 'language': 'zh', 'source': 'https://thetimecalculator.org/zh/today-date', 'start_index': 1773, 'title': '今天日期'}, {'description': '世界时间 - 美国 (United States) - 现在世界各地是什么时间?', 'embedding_config': '{"engine": "", "model": "sentence-transformers/all-MiniLM-L6-v2"}', 'language': 'zh', 'source': 'https://24timezones.com/美国/时间', 'start_index': 2775, 'title': '世界时钟 :: 美国 (United States) - 当前时间'}]]

结果如下: 根据上下文中的信息,今天的日期是 星期一, 二月 17, 2025 [source_id=1]。

知识库管理

  • 设置 --> 管理员设置 --> 文档 --> 语义向量模型引擎 改为ollama, 语义向量模型改为bge-m3:latest
  • 工作空间 --> 知识库,点击+号上传文档
  • 使用时需要在聊天框通过#来指定知识库
  • 设置 --> 管理员设置 --> 数据库 --> 下载数据库,可以导出sqlite数据

小结

整体体验是docker部署起来,页面展示有点慢,联网搜索一开始选择serply不生效,换成tavily可以生效,但是国内的搜索引擎还不支持。对于知识库方面,可以上传文档和目录,聊天窗口可以指定使用哪个知识库,也可以同时开启联网搜索,整体效果还可以,可以同时引用知识库和搜索引擎的检索结果,看日志还会保存到向量数据库(save_docs_to_vector_db)。

doc

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
1 条评论
热度
最新
老哥,在知识库上传文件的时候添加失败,报错:400: 'NoneType' object is not iterable 很奇怪,有些文档是可以是添加成功的,文件类型是:pdf 和word 语义向量是 ollama 的 snowflake-arctic-embed:110m ,是不是因为则这个模型太小了,导致上传错误
老哥,在知识库上传文件的时候添加失败,报错:400: 'NoneType' object is not iterable 很奇怪,有些文档是可以是添加成功的,文件类型是:pdf 和word 语义向量是 ollama 的 snowflake-arctic-embed:110m ,是不是因为则这个模型太小了,导致上传错误
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
dify工作流+deepseek开启联网搜索
借助dify强大的工作流编排就可以让其支持联网检索的能力,主要是靠提示词的衔接:根据搜索引擎检索到的内容:{x}WEB SEARCH API/{x}text,回答用户的提问开始/{x}query。不过对于国内的搜索引擎比如百度、360、搜狗等没有内置的集成,有待进一步探索。
code4it
2025/02/17
2.3K0
使用DeepSeek搭建个人知识库
对于想要在本地或自托管环境中运行 LLM 的用户而言,Ollama 提供了一个无需 GPU、在 CPU 环境也可高效完成推理的轻量化 “本地推理” 方案。而要让 Ollama 真正 “接地气”,往往需要与其他开源项目进行配合——例如将文档、数据源或应用前端与 Ollama 打通,这便衍生出许多解决方案。
lyushine
2025/04/02
2380
open-webui镜像启动失败
发现镜像启动几秒后就退出了。于是使用 logs命令查看docker镜像启动的日志。
IT小马哥
2024/08/15
7680
技术指南:5分钟零成本实现本地AI知识库搭建
你一定经历过各种通用大模型一本正经胡说八道的时候吧,AI一通丝滑输出让人真假难辨,防不胜防。这种情况被称为AI幻觉。
星融元Asterfusion
2024/09/03
5.8K1
技术指南:5分钟零成本实现本地AI知识库搭建
容器环境下部署Open-webui、One-api、Ollama、Deepseek
浏览器访问 http://ip:3000 (注意:首次登录不要去注册,直接登录,默认超管账号:root,密码:123456),登录后直接跳转到更新用户信息界面修改后再重新登陆,如下截图:
用户2141488
2025/03/07
4561
开源项目利用browser-use-webui和DeepSeek把浏览器打造成一个AI Agent智能体!
大家好,我是星哥,之前介绍了几款开源的AI Agent的项目,比如 OpenManus、autoMate 今天继续给大家带来一个开源AI Agent的项目。
星哥玩云
2025/03/27
7520
开源项目利用browser-use-webui和DeepSeek把浏览器打造成一个AI Agent智能体!
还在搭建本地知识库? Cloud Studio DeepSeek 模板已经内置,直接来玩!
近期有很多用户询问如何基于 Cloud Studio DeepSeek-R1 模板搭建私有知识库,用于个人上传私有数据进行增强检索、实现 AI 赋能业务升级。但网上的动手教程对于非 IT 人员来讲门槛较高,令粉丝们望而却步。
CloudStudio
2025/02/13
6620
还在搭建本地知识库? Cloud Studio DeepSeek 模板已经内置,直接来玩!
详解几种常见本地大模型个人知识库工具部署、微调及对比选型(1)
这几年,各种新技术、新产品层出不穷,其中,大模型(Large Language Models)作为AI领域的颠覆性创新,凭借其在语言生成、理解及多任务适应上的卓越表现,迅速点燃了科技界的热情。从阿尔法狗的胜利到GPT系列的横空出世,大模型不仅展现了人工智能前所未有的创造力与洞察力,也预示着智能化转型的新纪元。然而,大模型的潜力要真正转化为生产力,实现从实验室到现实世界的平稳着陆,还需跨越理论到实践的鸿沟。
zhouzhou的奇妙编程
2024/06/11
19.5K0
【DeepSeek】在本地计算机上部署DeepSeek-R1大模型实战(完整版)
2025年1月,中国春节期间,DeepSeek爆火,称为全球最炙手可热的大模型。DeepSeek一路 “狂飙”,在美国科技界和美股市场掀起惊涛骇浪,1月27日,美国三大股指开盘即暴跌,英伟达、微软、谷歌母公司Alphabet、Meta等美国主要科技股均遭遇股市地震,其中英伟达跌近17%,单日市值蒸发约6000亿美元,创美股最高纪录。
Francek Chen
2025/02/12
1.5K0
【DeepSeek】在本地计算机上部署DeepSeek-R1大模型实战(完整版)
docker部署dify结合deepseek构建知识库
右上角头像 --> 设置 --> 模型供应商,选择 Ollama,轻点“添加模型” --> 模型名称:deepseek-r1:8b, url: http://host.docker.internal:11434 类似的再添加一个嵌入模型:nomic-embed-text
code4it
2025/02/16
1.5K0
零成本!用AI打造私人知识库,彻底告别数据泄漏焦虑!
作为一个深耕 KubeSphere、K8s、AI 领域的科技博主,我深切体会到一个两难困境 : 渴望拥有一个全天候待命的智能助手来提升工作效率,但每当考虑到需要将个人隐私数据、创作素材乃至商业机密等敏感信息上传至云端时,那份对数据安全的担忧,总是让我望而却步。
运维有术
2025/03/03
2491
零成本!用AI打造私人知识库,彻底告别数据泄漏焦虑!
告别人工提示,用DSPy编程
DSPy 框架旨在通过优先考虑声明式、系统化编程而不是手动编写提示来解决一致性和可靠性问题。
云云众生s
2024/07/12
3220
基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
LLM 本身只是一些 神经网络参数, 就拿 DeepSeek-R1 来讲,模型本身存储了 权重矩阵,以及 混合专家(MoE)架构, 实际运行起来需要行业级别的服务器配置, 消费级别的个人电脑不能直接运行,实际还涉及到硬件适配,需手动配置 CUDA/PyTorch 环境,编写分布式推理代码,处理量化与内存溢出问题
山河已无恙
2025/02/25
1.5K0
基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
macOS 运行 DeepSeek 大模型!看看 Ollama 和 Open WebUI如何配合
2025年1月20日,杭州的一家公司开源推理模型 DeepSeek-R1,一经推出就震撼了世界。
Mintimate
2025/02/17
1.2K1
macOS 运行 DeepSeek 大模型!看看 Ollama 和 Open WebUI如何配合
史上最全!DeepSeek骚操作合集:从部署、开发到知识库搭建
官网繁忙,到底哪里的DeepSeek有空?AI应用构建繁杂,最快要多久?等不及了,DeepSeek啥时候能帮我干活......DeepSeek 最近火得不行,开发者们又惊又喜又担心自己用得慢被甩开差距。
腾讯云开发者
2025/02/25
1.4K1
史上最全!DeepSeek骚操作合集:从部署、开发到知识库搭建
3分钟!教会你用Doris+DeepSeek搭建RAG知识库(喂饭级教程)
❝清晨,我泡上一杯98年的咖啡,打开电脑,收到一条来自Doris用户的消息: "请问有 将doris数据库数据作为deepseek大模型的知识库的方法吗" "好滴,安排!" 于是,和这位Doris用户聊了聊,发现这类需求随着DeepSeek的爆火被无限放大了,但也确实是一个‌引申的机遇与挑战。 也罢,今天就来一探究竟,一起学习学习如何基于Doris+DeepSeek打造你的专属AI助手!
一臻数据
2025/02/26
9270
3分钟!教会你用Doris+DeepSeek搭建RAG知识库(喂饭级教程)
真香!DeepSeek+知识库直接内置,Cloud Studio模板即刻开玩!
今天,CloudStudio 在 DeepSeek-R1 CPU 模板中已内置知识库,支持 Open WebUI 和 AnythingLLM 两种模式,无需动手搭建,开箱即可拥有属于自己的私有知识库。
腾讯云开发者
2025/02/20
2620
真香!DeepSeek+知识库直接内置,Cloud Studio模板即刻开玩!
RAG 实战|用 StarRocks + DeepSeek 构建智能问答与企业知识库
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合外部知识检索与 AI 生成的技术,弥补了传统大模型知识静态、易编造信息的缺陷,使回答更加准确且基于实时信息。
StarRocks
2025/04/19
2420
RAG 实战|用 StarRocks + DeepSeek 构建智能问答与企业知识库
面向AI的开发:从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用
在今年的敏捷团队建设中,我通过Suite执行器实现了一键自动化单元测试。Juint除了Suite执行器还有哪些执行器呢?由此我的Runner探索之旅开始了!
京东技术
2024/06/11
1.7K0
面向AI的开发:从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用
使用高级SQL向量查询增强您的 RAG 应用程序
通过使用 MyScale 和 LangChain 创建 AI 助手来克服 RAG 的限制,以提高数据检索过程的准确性和效率。
云云众生s
2024/06/13
1820
使用高级SQL向量查询增强您的 RAG 应用程序
推荐阅读
相关推荐
dify工作流+deepseek开启联网搜索
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验