Loading [MathJax]/jax/input/TeX/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于腾讯云ES混合搜索与HAI部署DeepSeek,快速构建RAG 应用

基于腾讯云ES混合搜索与HAI部署DeepSeek,快速构建RAG 应用

原创
作者头像
腾讯云大数据
发布于 2025-04-29 08:44:34
发布于 2025-04-29 08:44:34
1350
举报
文章被收录于专栏:腾讯云大数据腾讯云大数据

什么是RAG?

随着数据智能技术的不断发展,以大语言模型(LLM)驱动的AIGC为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分。但在实践过程中,LLM(例如ChatGPT)仍存在不少问题,例如信息更新不及时、垂直领域知识匮乏,且可能产生“幻觉”(即生成不准确的内容)等问题。

检索增强生成(Retrieval-Augmented Generation,RAG)技术是一种结合了检索和大语言模型内容生成的技术方案,它通过引用外部知识库,在用户输入Query时检索出知识,然后让模型基于可信的知识进行用户回答。RAG具有较高的可解释性和定制能力,可大幅降低大语言模型的幻觉,适用于问答系统、文档生成、智能助手等多种自然语言处理任务。

本篇文章,将手把手教你基于腾讯云ES与HAI平台,搭建专属AI知识库与DeepSeek大模型,让你快速拥有一个更安全、更懂你、且不会“服务器繁忙,请稍后再试”的AI助手。

为什么选择腾讯云ES?

腾讯云ES是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack,支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。在RAG方面,腾讯云ES支持了一站式向量检索、文本+向量混合搜索、倒数排序融合、与大模型集成、GPU高性能推理、字段级别权限控制等能力,同时针对查询性能做了大量优化,有效的提升了数据检索效率,目前已落地微信读书“AI 问书”、微信输入法“问 AI”、腾讯地图、腾讯会议、IMA Copilot、乐享智能搜索等大型应用中。

同时,作为国内公有云首个从自然语言处理、到向量生成/存储/检索、并与大模型集成的端到端一站式技术平台,腾讯云ES作为核心参编单位参与了由中国信通院发起的的RAG标准制定,并成为首个通过RAG权威认证的企业。

通过腾讯云ES,你可以根据自身需求,灵活定制知识库的内容与功能, 打造更懂你、更安全、更可控的专属AI助手。

AI 助手构建

购买ES 集群

1、登录腾讯云ES控制台。

2、点击新建

descript
descript

3、计费模式为按量计费,产品版本为标准版、ES 版本为 8.16.1,高级特性选择白金版

descript
descript

4、ES 节点配置,测试环境可选择为标准型4核8G,节点数为2(生产环境推荐三个以上),磁盘为通用型SSD,磁盘容量为 20GB:

descript
descript

登录Kibana

1、集群创建完成后,点击集群名称,进入访问控制页面,在可视化访问控制设置公网访问策略:

descript
descript

2、获取当前 IP 地址并设置到 IP 白名单中:

descript
descript

3、点击Kibana 公网访问地址访问 Kibana。

部署embedding 模型

集群购买完成后,前往Kibana 部署 Embedding 模型、创建知识库索引与向量化管道:

1、 开启节点出站访问,仅开启数据节点即可,如有专用主节点,仅开启专用主节点即可。(该功能为白名单,请联系工单处理):

注:如需上传自定义模型或第三方平台(如 Huggingface)模型,可参考GitHub - elastic/eland: Python Client and Toolkit for DataFrames, Big Data, Machine Learning and ETL in Elasticsearch

descript
descript

2、登录 Kibana 之后,在左侧导航栏找到Machine Learning功能:

descript
descript
  1. 进入模型管理页面,并找到类型为text_embedding的模型,本次演示我们使.multilingual-e5-small_linux-x86_64模型,这是一个 384 维的多语言模型,点击Download
descript
descript

4、下载完成后,点击Deploy,弹窗信息使用默认值即可:

descript
descript

创建索引与向量化管道

1、 在Kibana页面点击进入Dev tools

descript
descript

2、 创建知识库索引:index-name为索引名称,实际可按需命名:

3、创建推理管道,该管道可用于写入数据时进行数据向量化:

上述管道,将字段「content、title」的内容,调用.multilingual-e5-small模型向量化之后存储到新的字段中。

写入知识库数据

通过 Bulk API 批量写入数据,可将 title 、content 、url 的内容替换为实际的知识库数据。

基于HAI平台部署DeepSeek模型

1、登录 高性能应用服务 HAI 控制台

2、单击新建,进入高性能应用服务 HAI 购买页面。

descript
descript
  • 选择应用:选择社区应用,应用选择 DeepSeek-R1
  • 地域:选择与ES集群相同的地域,降低网络延迟、提高您的访问速度。
  • 算力方案:选择合适的算力套餐。在单并发访问模型的情况下,建议最低配置如下:

模型

参数量级

推荐算力套餐

DeepSeek-R1

1.5B/7B/8B/14B

GPU基础型

DeepSeek-R1

32B

GPU进阶型

  • 实例名称:自定义实例名称,若不填则默认使用实例 ID 替代。
  • 购买数量:默认1台。

3、单击立即购买。

4、核对配置信息后,单击提交订单,并根据页面提示完成支付。

  1. 等待创建完成。单击实例任意位置并进入该实例的详情页面。同时您将在站内信中收到登录密码。此时,可通过可视化界面(GUI)或命令行(Terminal)使用 DeepSeek 模型。此处我们需保存公网IP,以便于通过SDK进行调用。
descript
descript

注:关于HAI部署,详情可参考:高性能应用服务 HAI 快速使用 DeepSeek-R1 模型_

调用DeepSeek大模型

  1. Python 文件命名为hai_ds.py。
  2. 安装ollama:

3、hai_ds.py内容如下:

AI助手页面构建

1、安装 streamlit与elasticsearch client:

2、 获取 ES 访问地址:

用户名为 elastic、密码在创建集群时设置,用本地mac测试时,可开启公网访问,实际生产时,建议使用内网访问地址。

descript
descript

3、Web界面参考如下代码( 可命名为 web_ds.py,需与hai_ds.py在一个目录下)

在上述 python 文件的目录下,使用如下命令运行系统:

生成的界面如下:

descript
descript

私域数据问答测试

我们使用“介绍腾讯云elasticsearch service的发展历程”这个问题来对比效果:

1、当索引中无相关数据时,可以看到,AI助手对此问题的回答效果相对比较差:

descript
descript

2、写入相关知识库数据:

3、重新提问,可以看到,完全准确,且基本没有不相关的信息:

descript
descript

可见,使用腾讯云ES与HAI构建基于DeepSeek的RAG应用,可同时结合DeepSeek强大的推理与内容生成能力、腾讯云ES一站式RAG方案以及HAI平台高效的模型部署能力,显著提高答案生成的准确性、可靠性,有效避免大模型的幻觉问题,为企业提供更加优质的本地知识库智能问答服务。

总结

本文介绍如何通过结合腾讯云ES 与DeepSeek大模型,快速构建RAG 应用。腾讯云ES凭借其在传统PB级日志和海量搜索场景中积累的丰富经验,通过深度重构底层系统,成功地将多年的性能优化、索引构建和运营管理经验应用于RAG领域,并积极探索向量召回与传统搜索技术的融合之道,旨在充分发挥两者的优势,为用户提供更加精准、高效的搜索体验。未来,腾讯云ES将持续深耕智能检索领域,在成本、性能、稳定性等方面持续提升,帮助客户降本增效的同时实现业务价值持续增长,欢迎持续关注!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
基于腾讯云ES混合搜索与TI-ONE部署DeepSeek,快速构建RAG应用
随着数据智能技术的不断发展,以大语言模型(LLM)驱动的AIGC为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分。但在实践过程中,LLM(例如ChatGPT)仍存在不少问题,例如信息更新不及时、垂直领域知识匮乏,且可能产生“幻觉”(即生成不准确的内容)等问题。
腾讯QQ大数据
2025/02/18
1500
基于腾讯云ES混合搜索与TI-ONE部署DeepSeek,快速构建RAG应用
基于腾讯云ES混合搜索与TI-ONE部署DeepSeek,快速构建RAG应用
随着数据智能技术的不断发展,以大语言模型(LLM)驱动的AIGC为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分。但在实践过程中,LLM(例如ChatGPT)仍存在不少问题,例如信息更新不及时、垂直领域知识匮乏,且可能产生“幻觉”(即生成不准确的内容)等问题。
腾讯云大数据
2025/02/10
2080
基于腾讯云ES混合搜索与TI-ONE部署DeepSeek,快速构建RAG应用
基于腾讯云ES混合搜索与DeepSeek,十分钟构建RAG 应用
本文共计1669字 预计阅读时长6分钟 随着数据智能技术的不断发展,以大语言模型(LLM)驱动的AIGC为代表的内容生成技术已经成为企业数据智能能力中不可或
腾讯QQ大数据
2025/02/03
4.2K0
基于腾讯云ES混合搜索与DeepSeek,十分钟构建RAG 应用
RAG 实践:基于混元大模型与腾讯云ES,十分钟构建你的专属 AI 助手
随着数据智能技术的不断发展,以大语言模型(LLM)驱动的AIGC为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分,但传统的内容生成技术存在信息更新不及时、垂直领域知识匮乏、模型幻觉等问题,如何推进大模型在各行业、各业务场景落地是各方普遍关注的问题,而检索增强生成(Retrieval-Augmented Generation,RAG)技术则为此提供了有效的解决方案,成为数据智能时代的一大趋势。
用户10398750
2024/10/16
7620
RAG 实践:腾讯云ES&混元,十分钟构建你的专属 AI 助手
随着数据智能技术的不断发展,以大语言模型(LLM)驱动的 AIGC 为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分,但传统的内容生成技术存在信息更新不及时、垂直领域知识匮乏、模型幻觉等问题,如何推进大模型在各行业、各业务场景落地是各方普遍关注的问题,而检索增强生成(Retrieval-Augmented Generation,RAG)技术则为此提供了有效的解决方案,成为数据智能时代的一大趋势。
腾讯QQ大数据
2024/10/10
6640
RAG 实践:腾讯云ES&混元,十分钟构建你的专属 AI 助手
玩转腾讯云HAI:部署DeepSeek,搭配Cherry Studio搭建超酷个人知识库
在当今信息爆炸的时代,搭建一个属于自己的知识库,不仅有助于提高工作效率,还能方便日常学习与生活。本文将详细介绍如何使用腾讯云HAI部署DeepSeek模型,并通过Cherry Studio搭建个人知识库的详细步骤。
Front_Yue
2025/02/10
2.2K3
玩转腾讯云HAI:部署DeepSeek,搭配Cherry Studio搭建超酷个人知识库
腾讯云 HAI DeepSeek + Cherry Studio 搭建个人 AI 知识库
是一个支持多模型服务的桌面客户端,为专业用户而打造,内置 30 多个行业的智能助手,帮助用户在多种场景下提升工作效率。
陈明勇
2025/02/08
95215
腾讯云 HAI DeepSeek +  Cherry Studio 搭建个人 AI 知识库
使用DeepSeek+RAG实现私人知识库
我使用包括 ChatGPT 在内的 AIGC 工具,回答 SAP 相关领域问题时,经常遇到大模型「一本正经的胡说八道」。这种现象的正式术语是大模型的幻觉现象。
编程小妖女
2025/02/07
26.8K17
使用DeepSeek+RAG实现私人知识库
DeepSeek + Ollama + Cherry Studio搭建本地私有知识库
知识库(Knowledge Base)是一个存储和管理知识的系统,通常包含结构化和非结构化的信息,用于帮助用户或系统快速查找和获取相关知识。
AmazingCoder
2025/02/26
4K4
腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
在大型语言模型(LLM)引领的革命浪潮中,搜索与大模型的紧密结合已成为推动知识进步的关键要素。作为开源搜索引擎排名第一的 Elasticsearch(ES),结合沉淀多年的文本搜索能力和强大的向量检索能力实现混合搜索,使搜索变得更准、更全、更智能。腾讯云 ES 多年来持续对开源 ES 的性能、成本、稳定性以及分布式架构进行深度增强优化,并在海量规模的云业务中接受考验。腾讯云基于 ES 实现了一站式 RAG 解决方案,具备了 RAG 技术规模化落地能力。本次分享将深入探讨腾讯云 ES 在搜索领域的最新探索,详细解析腾讯云 ES 的一站式 RAG 方案,并介绍围绕该方案架构落地所进行的一系列内核性能和稳定性增强优化措施。
腾讯QQ大数据
2024/12/20
1.2K0
腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
腾讯云智能体开发平台与DeepSeek-R1:企业智能问答平台的构建实践
随着人工智能技术的迅猛发展,大型语言模型已成为企业数字化转型的重要工具。腾讯云智能体开发平台(LLM Knowledge Engine,简称LKE)作为面向企业客户及合作伙伴的知识应用构建平台,结合企业专属数据,能够高效构建知识问答等应用。而DeepSeek作为国内领先的大语言模型,以其卓越的表现在众多场景展现出巨大的应用潜力。本文将深入探讨如何利用腾讯云智能体开发平台与DeepSeek-R1模型,为企业构建高效、精准的智能问答平台。
用户10266550
2025/03/09
3740
AI时代的阅读革新!微信读书基于腾讯云ES的“AI问书”RAG最佳实践
当我们需要深入了解一个知识点时,我们可能会通过阅读大量的书籍进行总结,或者是通过浏览器搜索相关的文章,不论是哪种方式,都需要我们花很多时间去进行知识过滤与提取,那么,有没有一个方案,能够让我们能够快速的了解该知识点的含义,并标注来源与作者以及进行关联内容推荐呢?
腾讯QQ大数据
2024/07/01
1.1K0
AI时代的阅读革新!微信读书基于腾讯云ES的“AI问书”RAG最佳实践
腾讯云ES RAG最佳实践:百行代码轻松实现帮助文档的智能问答
腾讯云大数据Elasticsearch Service首发上线ES 8.8.1版本,提供强大的云端AI增强与向量检索能力,支持在端到端搜索与分析平台中实现自然语言处理、向量搜索以及与大模型的集成,10亿级向量检索平均响应延迟控制在毫秒级,助力客户实现由AI驱动的高级搜索能力,为搜索与分析带来全新的前沿体验。本文将结合腾讯云ES与ChatGPT,演示如何通过百行代码轻松实现ES帮助文档的智能问答系统。
腾讯QQ大数据
2023/11/18
1.1K1
腾讯云ES RAG最佳实践:百行代码轻松实现帮助文档的智能问答
腾讯云ES AI增强搜索:十分钟快速入门自然语言处理(NLP)与向量检索
| 导语 本文从腾讯云ES AI增强搜索相关能力介绍出发,通过集群部署、模型上传、效果验证等全流程演示,从零到一完成基于腾讯云ES的自然语言处理(NLP)与向量检索实践。
腾讯QQ大数据
2023/11/24
1.1K1
腾讯云ES AI增强搜索:十分钟快速入门自然语言处理(NLP)与向量检索
腾讯云DeepSeek开发RAG应用
这篇文章主要是面向初级开发者,适合初学者、没有接触过大模型开发的小白、没有基础想学大模型RAG开发的按照该教程也能踏入开发第一步。主要是介绍通过腾讯云提供的deepseek资源和线上环境,开发一个基于deepseek的RAG系统。RAG开发框架使用的是lamaindex,大模型使用deepseek32B,向量模型使用milkey/dmeta-embedding-zh:f16,rag程序根据给定的txt文件内容进行问答,输入exit退出问答。
用户8800822
2025/03/05
5220
腾讯云DeepSeek开发RAG应用
HAI + Dify | 耗资1元构建DeepSeek门诊导诊助手
HAI HAI HAI!腾讯云CPU版1元限时体验活动它来了。AI时代依赖的就是算力资源,当我们还在因为自己电脑配置跟不上而苦恼的时候,不妨试一下HAI。
叫我阿柒啊
2025/03/31
5444
HAI + Dify |  耗资1元构建DeepSeek门诊导诊助手
基于HAI + DeepSeek-R1 + AnythingLLM快速搭建自己的个人知识库
我之前曾经介绍基于腾讯云HAI,在几分钟快速部署一个属于自己的DeepSekk-R1大模型。这里就不再过多描述部署步骤了
算法一只狗
2025/02/06
3K0
基于腾讯云HAI-CPU部署DeepSeek:搭建图书馆知识库,赋能智慧图书馆建设
在信息技术日新月异的大背景下,数字化浪潮以汹涌之势席卷了各个领域,图书馆作为信息资源的重要集散地,也迎来了前所未有的变革。随着社会对知识和信息需求的不断增长,传统图书馆在资源提供、服务模式、管理方式等方面的局限性逐渐凸显,难以满足现代读者多样化和个性化的需求。
Front_Yue
2025/03/16
4881
基于腾讯云HAI-CPU部署DeepSeek:搭建图书馆知识库,赋能智慧图书馆建设
疫情之后规模最大!武汉站Meetup,腾讯云与Elastic共绘ES在AI时代搜索技术新蓝图!
武汉,2024年3月30日 — 在这个春意盎然的季节,由腾讯云和Elastic社区联合主导的,Elastic Meetup武汉站活动成功在汤逊湖畔,腾讯武汉研发中心举办,标志着疫情后最大规模的Elastic Meetup的圆满结束。这次活动不仅是技术交流的盛宴,更是腾讯云ES在当前火热的AI、向量搜索领域深耕细作的一个缩影,也是腾讯云与Elastic社区紧密合作的生动体现。
腾讯QQ大数据
2024/04/30
2110
疫情之后规模最大!武汉站Meetup,腾讯云与Elastic共绘ES在AI时代搜索技术新蓝图!
私有化搭建、本地知识库、可联网查询、具备RAG能力的私人DeepSeek
以上方式在云端产品上实现 DeepSeek 的私有化部署,除此之外,也可以部署安装在本地机器上,如个人PC电脑、内网电脑等环境。
参谋带个长
2025/02/15
3.3K0
推荐阅读
基于腾讯云ES混合搜索与TI-ONE部署DeepSeek,快速构建RAG应用
1500
基于腾讯云ES混合搜索与TI-ONE部署DeepSeek,快速构建RAG应用
2080
基于腾讯云ES混合搜索与DeepSeek,十分钟构建RAG 应用
4.2K0
RAG 实践:基于混元大模型与腾讯云ES,十分钟构建你的专属 AI 助手
7620
RAG 实践:腾讯云ES&混元,十分钟构建你的专属 AI 助手
6640
玩转腾讯云HAI:部署DeepSeek,搭配Cherry Studio搭建超酷个人知识库
2.2K3
腾讯云 HAI DeepSeek + Cherry Studio 搭建个人 AI 知识库
95215
使用DeepSeek+RAG实现私人知识库
26.8K17
DeepSeek + Ollama + Cherry Studio搭建本地私有知识库
4K4
腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
1.2K0
腾讯云智能体开发平台与DeepSeek-R1:企业智能问答平台的构建实践
3740
AI时代的阅读革新!微信读书基于腾讯云ES的“AI问书”RAG最佳实践
1.1K0
腾讯云ES RAG最佳实践:百行代码轻松实现帮助文档的智能问答
1.1K1
腾讯云ES AI增强搜索:十分钟快速入门自然语言处理(NLP)与向量检索
1.1K1
腾讯云DeepSeek开发RAG应用
5220
HAI + Dify | 耗资1元构建DeepSeek门诊导诊助手
5444
基于HAI + DeepSeek-R1 + AnythingLLM快速搭建自己的个人知识库
3K0
基于腾讯云HAI-CPU部署DeepSeek:搭建图书馆知识库,赋能智慧图书馆建设
4881
疫情之后规模最大!武汉站Meetup,腾讯云与Elastic共绘ES在AI时代搜索技术新蓝图!
2110
私有化搭建、本地知识库、可联网查询、具备RAG能力的私人DeepSeek
3.3K0
相关推荐
基于腾讯云ES混合搜索与TI-ONE部署DeepSeek,快速构建RAG应用
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档