首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于 Cherry Studio+Ollama+DeepSeek 构建私有知识库

基于 Cherry Studio+Ollama+DeepSeek 构建私有知识库

作者头像
徐建国
发布于 2025-02-07 07:15:43
发布于 2025-02-07 07:15:43
9.2K12
代码可运行
举报
文章被收录于专栏:个人路线个人路线
运行总次数:2
代码可运行

上期教程我们已实现在本地部署大模型,但尚未构建知识库系统。本期将带领读者完成基于 Cherony Studio+Ollama+DeepSeek 的私有知识库搭建,核心将采用 BGE-M3 向量模型实现知识嵌入。

一、向量模型选型:BGE-M3

1.1 技术背景

北京智源人工智能研究院(BAAI)研发的 BGE-M3(多语言长文本向量检索模型),以其独到的 Multi-Linguality(多语言)、Multi-Functionality(多功能)和 Multi-Granularity(多粒度)特性,成为新一代通用向量模型标杆 1。

1.2 核心特性

模型架构
  • 预训练架构:基于 BERT 风格的 Transformer Encoder
  • 训练数据:覆盖 100+语言的多样化语料库
  • 嵌入维度:1024 维稠密向量,平衡语义表达与计算效率
性能优势
  • 榜单表现:MTEB 基准测试中跨语言场景领先
  • 开源优势:综合性能超越 OpenAI text-embedding-3-small(MIT 协议开源)

1.3 应用场景矩阵

场景类型

典型用例

技术价值

语义搜索

企业知识库检索/多语言电商搜索

多模态检索支持

文本分析

舆情分析/法律文档分类

无监督学习能力

跨语言对齐

新闻聚合/全球化知识库

统一语义空间映射

RAG 系统支持

智能客服/法律咨询

LLM 增强生成准确率

二、2.1 模型获取

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ollama pull bge-m3

查看是否下载成功。

三、配置本地 ollama

打开设置

找到 ollama

四、知识库配置

五、添加知识文档

cherry 可以添加文档,也可以添加目录(这个极其方便),添加完以后出现绿色的对号,表示向量化完成。

这里我添加了自己的 2023,2024 年度总结。

六、搜索验证

  1. 点击左上角的聊天图标
  2. 点击助手
  3. 点击默认助手(你也可以添加助手)
  4. 选择大模型
  5. 选择本地 deepseek,也可以选择自己已经开通的在线服务
  6. 设置知识库(不设置不会参考)
  7. 输入提问内容

七、系统优势解析

采用本地化部署方案具有三重价值:

  1. 数据安全:全链路离线处理,规避云端数据泄露风险
  2. 知识发现效率:支持语义级关联检索(准确率达 92%1)
  3. 开发辅助能力:代码习惯学习功能提升 30%编码效率

明天我们将带领大家学习如何提问。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大前端之旅 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
你好,我这边测试了一下效果一般,检索功能不太准确,也有没标注引用的文档内容。接着用硅基流动的接口去调用,回复准确且有引用信息。是腾讯目前还不支持还是没调好啊。模型分别用的是腾讯侧deepseek-r1:7b+bge-m3:latest、硅基流动侧deepseek-ai/DeepSeek-R1+BAAl/bge-m3
你好,我这边测试了一下效果一般,检索功能不太准确,也有没标注引用的文档内容。接着用硅基流动的接口去调用,回复准确且有引用信息。是腾讯目前还不支持还是没调好啊。模型分别用的是腾讯侧deepseek-r1:7b+bge-m3:latest、硅基流动侧deepseek-ai/DeepSeek-R1+BAAl/bge-m3
回复回复1举报
推荐阅读
编辑精选文章
换一批
DeepSeek + Ollama + Cherry Studio搭建本地私有知识库
知识库(Knowledge Base)是一个存储和管理知识的系统,通常包含结构化和非结构化的信息,用于帮助用户或系统快速查找和获取相关知识。
AmazingCoder
2025/02/26
5.1K4
【知识库特性增量】 DeepSeek-R1 模板支持 bge-m3 embedding model
Embedding 模型的核心价值在于将非结构化文本转化为数值向量,解决语义理解与计算效率问题:
Cloud Studio
2025/02/20
1.8K0
【知识库特性增量】 DeepSeek-R1 模板支持 bge-m3 embedding model
使用cherry studio离线搭建私人知识库流程记录
本篇文章记录近期尝试在个人笔记本上、全离线状态下搭建知识库的流程。用到的工具包括:Cherry Studio、ollama。主要过程是:首先下载ollama用于管理大模型;然后,从魔塔社区下载需要的deepseek、千问大模型和bge-m3嵌入模型,导入到ollama;最后在cherry studio构建知识库进行配置和使用。
科学最Top
2025/05/04
1.4K0
使用cherry studio离线搭建私人知识库流程记录
基于 DeepSeek R1 搭建自己的大模型知识库
基于本地环境搭建自己的大模型知识库,这里选取的是 DeepSeek R1 大模型。
王小明_HIT
2025/04/07
6370
基于 DeepSeek R1 搭建自己的大模型知识库
手把手教你:Windows与Linux下Dify+DeepSeek实现ragflow构建企业知识库
在当今人工智能飞速发展的时代,大语言模型(LLMs)已经成为众多领域的核心技术驱动力。无论是在智能客服、智能写作,还是在数据分析、决策支持等方面,大语言模型都展现出了强大的能力和潜力。然而,随着数据安全和隐私保护意识的不断提高,越来越多的企业和开发者开始寻求本地化部署大语言模型的解决方案,以确保数据的安全性和可控性。
范赟鹏
2025/05/30
2.1K0
手把手教你:Windows与Linux下Dify+DeepSeek实现ragflow构建企业知识库
DeepSeek搭建个人知识库教程
各位朋友,是不是经常被 AI 气得火冒三丈,恨不得把键盘给砸了?你让它查公司去年的财务数据,它却开始背诵经济学原理;你让它分析竞品的策略,它却大谈特谈马斯洛需求理论。我太能理解这种感受了,这就好比你花钱雇了个助理,结果这助理啥都不会,只会照搬百度百科的内容!
@派大星
2025/03/04
9640
DeepSeek搭建个人知识库教程
Dify+DeepSeek实战教程!企业级 AI 文档库本地化部署,数据安全与智能检索我都要
上次折腾完 DeepSeek 的本地私有化部署后,心里就一直琢磨着:能不能给咱们 Rainbond 的用户再做点实用的东西?毕竟平时总收到反馈说文档查找不够方便,要是能有个 AI 文档助手该多好。正想着呢,搭建本地知识库的想法就冒了出来 —— 既能解决实际需求,又能把技术落地成真正有用的工具,这不就是两全其美的事嘛!尤其是想到企业场景里,知识库往往涉及业务流程、技术方案甚至客户数据,数据安全可是头等大事,本地化部署带来的数据不出本地、自主可控优势,简直是刚需中的刚需。
Rainbond开源
2025/04/28
9570
LLMOps实战(四):大模型开发 RAG 工作流中 Embedding 模型选型全解析
在大模型开发中,检索增强生成(RAG)工作流是一种将外部知识检索与语言模型生成相结合的有效方法。它能有效避免大模型产生幻觉问题,提高回答的准确性和可靠性。而 Embedding 模型在 RAG 工作流中起着关键作用,它负责将文本、结构化数据等转换为向量表示,以便进行高效的相似度检索。
范赟鹏
2025/03/29
2.3K0
BGE M3-Embedding 模型介绍
BGE M3-Embedding来自BAAI和中国科学技术大学,是BAAI开源的模型。相关论文在https://arxiv.org/abs/2402.03216,论文提出了一种新的embedding模型,称为M3-Embedding,它在多语言性(Multi-Linguality)、多功能性(Multi-Functionality)和多粒度性(Multi-Granularity)方面表现出色。M3-Embedding支持超过100种工作语言,支持8192长度的输入文本,同时支持密集检索(Dense Retrieval)、多向量检索(Multi-Vector Retrieval)和稀疏检索(Sparse Retrieval),为现实世界中的信息检索(IR)应用提供了统一的模型基础,通过这几种检索方式的组合,取得了良好的混合召回效果。
JadePeng
2024/04/19
13K0
BGE M3-Embedding 模型介绍
3分钟!教会你用Doris+DeepSeek搭建RAG知识库(喂饭级教程)
❝清晨,我泡上一杯98年的咖啡,打开电脑,收到一条来自Doris用户的消息: "请问有 将doris数据库数据作为deepseek大模型的知识库的方法吗" "好滴,安排!" 于是,和这位Doris用户聊了聊,发现这类需求随着DeepSeek的爆火被无限放大了,但也确实是一个‌引申的机遇与挑战。 也罢,今天就来一探究竟,一起学习学习如何基于Doris+DeepSeek打造你的专属AI助手!
一臻数据
2025/02/26
1.3K3
3分钟!教会你用Doris+DeepSeek搭建RAG知识库(喂饭级教程)
私有化搭建、本地知识库、可联网查询、具备RAG能力的私人DeepSeek
以上方式在云端产品上实现 DeepSeek 的私有化部署,除此之外,也可以部署安装在本地机器上,如个人PC电脑、内网电脑等环境。
参谋带个长
2025/02/15
3.9K0
Webman AI携手DeepSeek本地训练,打造专属私有知识库!
Linux: webman根目录运行php start.php restart -d Windows: 按ctl c停止webman,然后运行php windows.php start
Tinywan
2025/03/14
2430
Webman AI携手DeepSeek本地训练,打造专属私有知识库!
基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
LLM 本身只是一些 神经网络参数, 就拿 DeepSeek-R1 来讲,模型本身存储了 权重矩阵,以及 混合专家(MoE)架构, 实际运行起来需要行业级别的服务器配置, 消费级别的个人电脑不能直接运行,实际还涉及到硬件适配,需手动配置 CUDA/PyTorch 环境,编写分布式推理代码,处理量化与内存溢出问题
山河已无恙
2025/02/25
2.5K0
基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
打造专属AI智能知识库
本文介绍了如何使用 DeepSeek API 打造个人 AI 知识库。此过程中需搭配嵌入模型,将知识库内容向量化,实现高效检索。DeepSeek 在获取知识库检索结果后,可以输出更清晰、准确的回答。
程序员NEO
2025/05/14
3020
打造专属AI智能知识库
短短时间,疯狂斩获1.9k star,开源AI神器AingDesk:一键部署上百模型,本地运行还能联网搜索!
嗨,大家好,我是小华同学,关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法
小华同学ai
2025/05/26
7390
短短时间,疯狂斩获1.9k star,开源AI神器AingDesk:一键部署上百模型,本地运行还能联网搜索!
Ollama本地部署大模型总结
今天计划对之前ollama系列做个回顾,从如何部署到API使用,整理到一篇内容中,提供给大家参考。
拓荒者IT
2025/03/30
2K0
Ollama本地部署大模型总结
LLMOps实战(一):DeepSeek+RAG 协同构建企业知识库全流程指南
首先解释下什么是 LLMOps,Large Language Model Operations是专注于大语言模型全生命周期管理的工程实践,涵盖从模型开发、部署、监控到持续优化的系统性流程。其核心目标是提升LLM应用的可靠性、效率与可控性,解决大模型在实际落地中的技术与管理挑战。
范赟鹏
2025/03/24
4.8K0
三分钟搭建个人知识库: Cloud Studio DeepSeek-R1 + Cherry Studio 实战指南
目前 Cloud Studio DeepSeek-R1 模板已经内置了 Anythingllm 和 Open-webui,方便用户开箱即可构建和使用私有知识库。在此也推出 Cloud Studio + Cherry Studio 的实战教程 —— 无需用户本地部署,三分钟拥有体验更好的个人知识库。
CloudStudio
2025/03/10
7350
三分钟搭建个人知识库: Cloud Studio DeepSeek-R1 + Cherry Studio 实战指南
使用DeepSeek搭建个人知识库
对于想要在本地或自托管环境中运行 LLM 的用户而言,Ollama 提供了一个无需 GPU、在 CPU 环境也可高效完成推理的轻量化 “本地推理” 方案。而要让 Ollama 真正 “接地气”,往往需要与其他开源项目进行配合——例如将文档、数据源或应用前端与 Ollama 打通,这便衍生出许多解决方案。
lyushine
2025/04/02
5910
基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)
基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现,开源、可离线部署的检索增强生成(RAG)大模型知识库项目。
汀丶人工智能
2024/05/07
2K0
基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)
推荐阅读
相关推荐
DeepSeek + Ollama + Cherry Studio搭建本地私有知识库
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档