Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【知识库特性增量】 DeepSeek-R1 模板支持 bge-m3 embedding model

【知识库特性增量】 DeepSeek-R1 模板支持 bge-m3 embedding model

原创
作者头像
Cloud Studio
发布于 2025-02-20 09:07:30
发布于 2025-02-20 09:07:30
1.4K0
举报

为什么知识库需要Embedding Model?

通过询问 DeepSeek-R1 得到如下回答:

Embedding 模型的核心价值在于将非结构化文本转化为数值向量,解决语义理解与计算效率问题:

语义编码:通过向量空间捕捉上下文关联,区分多义词、同义词;如:

问题:用户搜索“苹果”,需区分“水果”还是“品牌”。

Embedding 作用:

  -“苹果手机”的向量会接近“iPhone”“智能手机”;

   -而“红苹果”的向量会接近“水果”“香蕉”“维生素”。

结果:搜索“苹果”时,优先展示手机或水果,取决于用户历史行为(如点击电子产品)。

高效检索:支持近似最近邻(ANN)算法,降低海量数据匹配复杂度;

场景:某电商平台有 1 亿商品描述,需实时匹配用户查询“适合露营的轻便帐篷”。

传统方法:关键词匹配“露营+轻便+帐篷”,可能漏掉“户外超薄遮阳篷”。

Embedding 方案:

    -将查询和商品描述转为向量;

    -使用 ANN 库(如 FAISS )在毫秒级返回

Top100 相关商品,覆盖语义相似但关键词不匹配的结果。

 AI 基础设施:支撑 RAG 、多模态搜索、迁移学习等任务,替代传统关键词匹配与人工规则。

场景:客服机器人回答“如何清洁帐篷上的污渍?”

流程:用 BGE-M3 将问题编码为向量;

 -从向量数据库检索《户外用品保养指南》中相关段落;

 -将检索结果输入大模型(如DeepSeek-R1),生成步骤清晰的回答。

优势:避免大模型虚构答案,提升可信度。

与传统方式相比具备优势

图片
图片
图片
图片

为什么选择 bge-m3 Embedding 模型?

根据了解,BGE-M3 模型是当前领先的多语言 Embedding 模型,在 MIRACL、MKQA 等基准测试中排名第一,支持 100+ 语言,具备三大特性:

1.多语言性:覆盖 194 种语言训练,跨语言检索效果显著;

2.多功能性:统一支持密集、稀疏、多向量三种检索模式;

3.多粒度性:支持最长 8192 tokens 输入,适配长短文本。其训练采用知识蒸馏与高效批处理技术,结合 1.2 亿文本对与合成数据优化性能。

并且腾讯云其他 AI 应用中该模型使用的也较为广泛。本次,Cloud Studio 在DeepSeek-R1 模板中内置了 BAAI/bge-m3。希望给知识库玩家带来更加准确的召回效果,让工具更加实用。

图片
图片
图片
图片

如何在 CloudStudio DeepSeek-R1 模板中设置 bge-m3

步骤一 :

进入 Cloud Studio DeepSeek CPU 模板,唤起内置 Open-WebUI 或 AnythingLLM 组件。进入网站:

https://ide.cloud.tencent.com/dashboard/

点击任意 DeepSeek CPU 模板进入工作空间, 唤起 Open-WebUI 或 AnythingLLM, 即刻拥有完全属于个人的知识库。相对于本地搭建 RAG 知识库,体验门槛直线降低!

图片
图片

进入工作空间后,默认唤起 AnythingLLM  (4001端口),点击图中 icon ,进入浏览器全屏模式

图片
图片

点击左下角【设置】

图片
图片

进入【人工智能提供商】-【Embedder首选项】,在【嵌入引擎提供商】处选择“Ollama”,随后在下方【Ollama Embedding Model】处选择“bge-m3:latest”。

选择完毕后点击【保存更改】

图片
图片

步骤二:

创建【工作区】即可开始进一步构建知识库进行对话。这里重复介绍一下如何创建和设置知识库进行对话。

上传文档

在聊天界面中,用户可以创建多个工作区。每个工作区可以独立管理文档和 LLM 设置,并支持多个会话(Thread),每个会话的上下文也是独立的。

图片
图片

点击上传图标,可以管理当前工作区的知识库。以本地文档上传为例,用户可以管理已上传的文档,并通过下方的上传按钮或拖拽方式上传新文档。

图片
图片

导入完成后,用户可以在 【Documents】 界面选中文件,并点击 【Move to Workspace】 将其添加到工作区。

图片
图片

添加到工作区后,点击 【Save and Embeded】,将文档内容转换为向量检索所需的嵌入数据结构

图片
图片

聊天模式

将文档添加到工作区后,用户可以通过设置聊天模式调整 DeepSeek-R1 的回复方式,在【工作区LLM提供者】处可选用 DeepSeek-R1模型类型,比如 7b 。

聊天模式:聊天 将提供 LLM 的一般知识 和 找到的文档上下文的答案。

查询模式:查询将仅提供找到的文档上下文的答案。

图片
图片

在聊天窗口中,用户可以直接提问。deepseek-r1 会基于文档内容生成答案,并标注答案来源。

最后,我们来看看效果。

以 AnythingLLM 为例,在传入《微短剧行业深度分析报告》、与《 AIGC 与微短剧的结合》两份资料后,模型通过识别后者给出了相应的总结。

图片
图片
图片
图片

加入 Cloud Studio 自媒体特权计划

我们推出针对为 Cloud Studio 宣传的自媒体特权计划,招募长期合作的内容创作者,创作者将永久被授予 20000 分钟/月的基础版 GPU 使用配额。

20000分钟(333小时) 8+TFlops 算力、16GB+显存 的使用配额!什么概念!

可以系统化地利用 DeepSeek R1 模型实现从模型优化到实际落地的完整闭环。可生成数十万 10 万条营销文案、可提供稳定的高并发实时 API 服务。

心动吗?

还等啥呢?!

快来体验吧!!

参与方式

扫码联系工作人员进行登记初审:

图片
图片

入选标准

- 拥有自媒体账号,且输出稳定

- 过往具备 Cloud Studio 相关分享经验,且具备干货内容

- 长期使用 Cloud Studio 进行工作、学习

希望创作者

1.  在 ide.cloud.tencent.com 平台上使用 DeepSeek 相关模板

2.  将实践经验以视频或文章的方式发布到任意媒体渠道(包括但不限于B站、抖音、小红书、个人博客等)。实践内容包含但不限于模型推理、创建知识库、构建个人应用等。每月至少分享两次。

注意:我们鼓励原创和真实,请不要抄袭、搬运他人内容。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
真香!DeepSeek+知识库直接内置,Cloud Studio模板即刻开玩!
今天,CloudStudio 在 DeepSeek-R1 CPU 模板中已内置知识库,支持 Open WebUI 和 AnythingLLM 两种模式,无需动手搭建,开箱即可拥有属于自己的私有知识库。
腾讯云开发者
2025/02/20
2810
真香!DeepSeek+知识库直接内置,Cloud Studio模板即刻开玩!
还在搭建本地知识库? Cloud Studio DeepSeek 模板已经内置,直接来玩!
近期有很多用户询问如何基于 Cloud Studio DeepSeek-R1 模板搭建私有知识库,用于个人上传私有数据进行增强检索、实现 AI 赋能业务升级。但网上的动手教程对于非 IT 人员来讲门槛较高,令粉丝们望而却步。
CloudStudio
2025/02/13
7040
还在搭建本地知识库? Cloud Studio DeepSeek 模板已经内置,直接来玩!
三分钟搭建个人知识库: Cloud Studio DeepSeek-R1 + Cherry Studio 实战指南
目前 Cloud Studio DeepSeek-R1 模板已经内置了 Anythingllm 和 Open-webui,方便用户开箱即可构建和使用私有知识库。在此也推出 Cloud Studio + Cherry Studio 的实战教程 —— 无需用户本地部署,三分钟拥有体验更好的个人知识库。
CloudStudio
2025/03/11
2490
三分钟搭建个人知识库: Cloud Studio DeepSeek-R1 + Cherry Studio 实战指南
三分钟搭建个人知识库: Cloud Studio DeepSeek-R1 + Cherry Studio 实战指南
目前 Cloud Studio DeepSeek-R1 模板已经内置了 Anythingllm 和 Open-webui,方便用户开箱即可构建和使用私有知识库。在此也推出 Cloud Studio + Cherry Studio 的实战教程 —— 无需用户本地部署,三分钟拥有体验更好的个人知识库。
CloudStudio
2025/03/10
4970
三分钟搭建个人知识库: Cloud Studio DeepSeek-R1 + Cherry Studio 实战指南
在Cloud Studio上塔建DeepSeek+AnythingLLM环境的知识库
原文链接:https://blog.csdn.net/ahe168/article/details/145619507
CloudStudio
2025/03/17
990
DeepSeek搭建个人知识库教程
各位朋友,是不是经常被 AI 气得火冒三丈,恨不得把键盘给砸了?你让它查公司去年的财务数据,它却开始背诵经济学原理;你让它分析竞品的策略,它却大谈特谈马斯洛需求理论。我太能理解这种感受了,这就好比你花钱雇了个助理,结果这助理啥都不会,只会照搬百度百科的内容!
@派大星
2025/03/04
5410
DeepSeek搭建个人知识库教程
私有化搭建、本地知识库、可联网查询、具备RAG能力的私人DeepSeek
以上方式在云端产品上实现 DeepSeek 的私有化部署,除此之外,也可以部署安装在本地机器上,如个人PC电脑、内网电脑等环境。
参谋带个长
2025/02/15
3.3K0
DeepSeek + Ollama + Cherry Studio搭建本地私有知识库
知识库(Knowledge Base)是一个存储和管理知识的系统,通常包含结构化和非结构化的信息,用于帮助用户或系统快速查找和获取相关知识。
AmazingCoder
2025/02/26
3.9K4
使用DeepSeek+RAG实现私人知识库
我使用包括 ChatGPT 在内的 AIGC 工具,回答 SAP 相关领域问题时,经常遇到大模型「一本正经的胡说八道」。这种现象的正式术语是大模型的幻觉现象。
编程小妖女
2025/02/07
26.7K17
使用DeepSeek+RAG实现私人知识库
利用DeepSeek-R1构建简单的本地知识库
大家好,我是默语~👋😄 今天带来一篇超级干货、满满实操经验的长文,教你如何利用 DeepSeek-R1 构建简单的本地知识库,以及如何用 DeepSeek 搭配 Kimi 在2分钟内生成32页PPT!🔥💡
默 语
2025/02/18
1.3K0
利用DeepSeek-R1构建简单的本地知识库
使用DeepSeek搭建个人知识库
对于想要在本地或自托管环境中运行 LLM 的用户而言,Ollama 提供了一个无需 GPU、在 CPU 环境也可高效完成推理的轻量化 “本地推理” 方案。而要让 Ollama 真正 “接地气”,往往需要与其他开源项目进行配合——例如将文档、数据源或应用前端与 Ollama 打通,这便衍生出许多解决方案。
lyushine
2025/04/02
3050
基于 Cloud Studio DeepSeek+Cherry Studio 搭建绩效考核管理系统知识库
欢迎使用 Cloud Studio DeepSeek 工作空间!我们已为您预装并启动了以下服务,等待加载十几秒即可查看效果:
Harry技术
2025/03/14
1580
基于 Cloud Studio DeepSeek+Cherry Studio 搭建绩效考核管理系统知识库
基于 DeepSeek R1 搭建自己的大模型知识库
基于本地环境搭建自己的大模型知识库,这里选取的是 DeepSeek R1 大模型。
王小明_HIT
2025/04/07
4270
基于 DeepSeek R1 搭建自己的大模型知识库
基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
LLM 本身只是一些 神经网络参数, 就拿 DeepSeek-R1 来讲,模型本身存储了 权重矩阵,以及 混合专家(MoE)架构, 实际运行起来需要行业级别的服务器配置, 消费级别的个人电脑不能直接运行,实际还涉及到硬件适配,需手动配置 CUDA/PyTorch 环境,编写分布式推理代码,处理量化与内存溢出问题
山河已无恙
2025/02/25
1.8K0
基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
【人工智能】如何借助DeepSeek R1打造个人知识库?
在当今信息爆炸的时代,知识和资料如潮水般涌来。如何对这些海量信息进行高效管理,确保在需要时能迅速检索并加以利用,成为了许多人亟待解决的问题。搭建个人知识库,无疑是应对这一挑战的绝佳方案。而DeepSeek作为一款强大的人工智能工具,为我们搭建个人知识库提供了便捷高效的途径。接下来,将为你详细介绍如何运用DeepSeek搭建属于自己的知识宝库。
蒙奇D索隆
2025/02/18
2.7K0
【人工智能】如何借助DeepSeek R1打造个人知识库?
基于HAI + DeepSeek-R1 + AnythingLLM快速搭建自己的个人知识库
我之前曾经介绍基于腾讯云HAI,在几分钟快速部署一个属于自己的DeepSekk-R1大模型。这里就不再过多描述部署步骤了
算法一只狗
2025/02/06
3K0
零成本!用AI打造私人知识库,彻底告别数据泄漏焦虑!
作为一个深耕 KubeSphere、K8s、AI 领域的科技博主,我深切体会到一个两难困境 : 渴望拥有一个全天候待命的智能助手来提升工作效率,但每当考虑到需要将个人隐私数据、创作素材乃至商业机密等敏感信息上传至云端时,那份对数据安全的担忧,总是让我望而却步。
运维有术
2025/03/03
2951
零成本!用AI打造私人知识库,彻底告别数据泄漏焦虑!
零成本云端部署DeepSeek R1模型教程
很多同学想尝试本地部署DeepSeek,但因为电脑配置等因素不好部署,这篇文章教大家如何零成本云端部署DeepSeek R1模型。
老_张
2025/02/20
2030
零成本云端部署DeepSeek R1模型教程
无需担心私密数据泄漏!零元购打造个人 AI 知识助理!
你好,我是术哥,云原生开源技术布道者:KubeSphere Ambassador、Milvus 北辰使者。很高兴在「运维有术」与你相遇。
运维有术
2025/02/28
1061
无需担心私密数据泄漏!零元购打造个人 AI 知识助理!
HAI部署DeepSeek+AnythingLLM构建你的法律知识库
在日常中,我们会遇到不少法律问题。但是我们的知识又不是那么的专业,这个时候就需要一个产品来帮我们进行整合回答。在这篇文章开始之前各位可以了解一下腾讯云HAI平台和DeepSeek大模型。我的思路是通过知识库调用本地DeepSeek模型,从而实现知识问答。类似于在线查询的功能。
VyrnSynx
2025/02/04
1.6K0
推荐阅读
相关推荐
真香!DeepSeek+知识库直接内置,Cloud Studio模板即刻开玩!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档