Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯云大数据ES:结合AI大模型与向量检索的新一代云端检索分析引擎

腾讯云大数据ES:结合AI大模型与向量检索的新一代云端检索分析引擎

原创
作者头像
腾讯云大数据
发布于 2023-08-04 08:44:47
发布于 2023-08-04 08:44:47
4K1
举报

引言

信息化技术的飞速发展,使得海量数据爆发式增长。一方面,越来越多的数据可以为我们的生活带来便利,但另一方面,也给软件开发带来巨大的挑战——图片、声音、视频等不同结构的数据越来越多地出现,为搜索分析带来巨大的挑战,传统的关键词搜索,搜索结果局限于输入的关键词,用户体验较差。向量检索的出现,给我们提供了一个新的思路,向量数据库将非结构化、半结构化甚至是结构化等数据以向量形式存储,实现相似度搜索、聚类、降维等操作,结合机器学习模型,为用户更加智能的搜索服务。

然而,集文本搜索➕向量检索➕AI能力于一身,且成熟稳定、值得信赖的云端搜索引擎,在业内屈指可数,腾讯云大数据Elasticsearch Service近期首发上线的ES 8.8.1版本,提供了强大的云端AI增强与向量检索能力,支持在端到端搜索与分析平台中实现自然语言处理、向量搜索以及与大模型的集成,10亿级向量检索平均响应延迟控制在毫秒级,助力客户实现由AI驱动的高级搜索能力,为搜索与分析带来全新的前沿体验。

强大的AI增强搜索引擎

结合AI 的最佳实践和 Elastic 的文本搜索,Elasticsearch为开发人员提供了一整套将复杂的检索算法与大型语言模型(LLM)集成的能力。其特性参考如下:

1)自定义Transformer模型

开发人员可在 Elastic 中管理和使用自己的transformer 模型来完成各种自然语言处理任务,以适应特定的业务场景。

2)Elastic训练的优化搜索模型

使用 Elastic 训练的开箱即用的 Learned Sparse Encoder机器学习模型来优化搜索,可在各种领域提供更好相关性、语义化的搜索。

3)与第三方 Transformer 模型集成,提取直观摘要

通过 API与大语言模型集成(如 OpenAl的 GPT- 3和 4),从Elasticsearch数据源中提取摘要。

4)充分应用各种自然语言处理(NLP)任务和模型

通过强大的自然语言处理能力,处理各种NLP任务和模型,使得搜索结果更加符合自然语言的语义。

5)第三方工具集成,构建复杂的数据管道和生成式AI应用程序

与第三方工具如LangChain集成,帮助用户构建复杂的数据管道和生成式AI应用程序。

原生向量搜索引擎

企业可以将腾讯云ES作为向量数据库使用,有效地创建、存储和搜索密集向量,为用户提供更加智能的搜索功能。例如,企业可在腾讯云ES上传自定义大数据模型来做Embedding,如词嵌入模型(Word Embeddings)或深度学习模型(如BERT),在读写过程中实时将图片、文本等数据转换为向量,然后存入Elasticsearch构建索引并进行相似度召回。同时,在召回后,可选择将TOP结果传入LLM大语言模型(如GPT、混元) 等,对信息进行对话式结果整合,最终返回给用户,实现对话式搜索。相关特性参考如下:

1)提供图索引,通过HNSW实现高效的最近邻搜索。

2)支持端到端的向量生成、向量索引、向量相似性比较,无需额外的平台进行向量推理。

3)一体化的搜索体验:多路召回混合打分、Faceting聚合分析能力、基于角色的访问控制。

4)提供向量类型,将向量存储为字节而不是浮点,同时,应用主成分分析PCA等方法降低向量维度,节省存储空间。

5)持续优化的向量索引和查询性能。

全新混合排序算法

Elasticsearch 8.8.1版本使用最新的Reciprocal Rank Fusion (RRF) 混合排序算法,可同时支持全文检索和向量搜索,让开发人员更好地优化Al搜索引擎,实现语义和关键字的组合查询。

客户案例介绍

以使用腾讯云ES的某知名新媒体网站客户为例,客户通过腾讯云ES提供的强大搜索能力,实现文本搜索+向量搜索的混合搜索,精准的对用户上传的图文内容进行违规检测,进而降低业务风险。其相关实现如下:

1)相关数据通过自定义的模型进行Embedding之后,转换成向量,存储在索引里面。

2)APP的用户用户发表评论或者上传文章等操作,相关数据将实时的进行Embbdding,并与索引内的向量进行相似性比对,结合文本搜索能力,实现多路召回。

3)如相关内容涉嫌违规,将会被驳回,并予以警告。

写在最后

腾讯云大数据Elasticsearch Service近期首发上线的ES 8.8.1版本,提供向量检索和AI增强功能,支持在单一端到端搜索与分析平台中实现自然语言处理、向量搜索以及与大模型的集成,结合腾讯云ES提供的丰富的云原生能力,支持高达十亿级向量检索,平均响应延迟控制在毫秒级。使用该服务,你可以轻松便捷地创建集群、部署NLP模型,并进行搜索和推理任务,快来体验吧!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
1 条评论
热度
最新
23
23
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
腾讯云ES再进化,新特性「智能搜索开发」助力LLM应用落地
腾讯云Elasticsearch(ES)带着全新技能包——「智能搜索开发」闪亮登场,以AI搜索增强版内核为底座,进一步优化了对全文与向量混合搜索的能力支持,从原始文档解析、向量化等原子能力,到查询性能、混合排序效率、搜索结果精准度等提供了全方位的支持和优化,让搜索有了更多想象空间。在此基础上,还可以与混元、DeepSeek等大语言模型无缝集成,从而帮助企业进一步高效、灵活的构建知识问答等RAG应用。
腾讯QQ大数据
2025/05/17
770
腾讯云ES再进化,新特性「智能搜索开发」助力LLM应用落地
腾讯云大数据ES:结合AI大模型与向量检索的新一代云端检索分析引擎
信息化技术的飞速发展使得海量数据爆发式增长。一方面,越来越多的数据可以为我们的生活带来便利,但另一方面,也给软件开发带来巨大的挑战——图片、声音、视频等不同结构的数据越来越多地出现,为搜索分析带来巨大的挑战,传统的关键词搜索,搜索结果局限于输入的关键词,用户体验较差。向量检索的出现,给我们提供了一个新的思路,向量数据库将非结构化、半结构化甚至是结构化等数据以向量形式存储,实现相似度搜索、聚类、降维等操作,结合机器学习模型,为用户更加智能的搜索服务。
腾讯QQ大数据
2023/08/11
7100
腾讯云大数据ES:结合AI大模型与向量检索的新一代云端检索分析引擎
腾讯云ES AI增强搜索:十分钟快速入门自然语言处理(NLP)与向量检索
| 导语 本文从腾讯云ES AI增强搜索相关能力介绍出发,通过集群部署、模型上传、效果验证等全流程演示,从零到一完成基于腾讯云ES的自然语言处理(NLP)与向量检索实践。
腾讯QQ大数据
2023/11/24
1.1K1
腾讯云ES AI增强搜索:十分钟快速入门自然语言处理(NLP)与向量检索
为AI革命提供高级搜索能力!腾讯云大数据ES国内首发上线8.8.1版本
为AI革命提供高级搜索能力,腾讯云Elasticsearch Service正式上线8.8.1版本!该版本特别引入了Elasticsearch Relevance Engine™(ESRE™)—— 一款强大的AI增强搜索引擎,为搜索与分析带来全新的前沿体验。
腾讯QQ大数据
2023/07/27
3620
为AI革命提供高级搜索能力!腾讯云大数据ES国内首发上线8.8.1版本
Elastic发布Elasticsearch Relevance Engine™ — 为AI革命提供高级搜索能力
今天我们将向大家介绍 Elasticsearch Relevance Engine™(ESRE™),这是一种创建高度相关的 AI 搜索应用程序的新功能。ESRE 建立在 Elastic 在搜索领域的领导地位以及超过两年的机器学习研究和开发基础之上。Elasticsearch Relevance Engine 结合了 AI 的最佳实践和 Elastic 的文本搜索。ESRE 为开发人员提供了一整套将复杂的检索算法和与大型语言模型(LLM)集成的能力。不仅如此,ESRE使用Elastic的简单、统一API,开发人员可以立即开始以提高搜索相关性,因为这些API已经得到Elastic社区的信任和广泛应用。
点火三周
2023/05/24
8460
Elastic发布Elasticsearch Relevance Engine™ — 为AI革命提供高级搜索能力
使用腾讯云Elasticsearch 8.8.1实现:NLP+Vector Search+GAI
腾讯云Elasticsearch service在最近上线了8.8.1版本。该版本中的核心能力,是为AI革命提供高级搜索能力!该版本特别引入了Elasticsearch Relevance Engine™(ESRE™)—— 一款强大的AI增强搜索引擎,为搜索与分析带来全新的前沿体验。
点火三周
2023/07/13
3.1K0
使用腾讯云Elasticsearch 8.8.1实现:NLP+Vector Search+GAI
基于腾讯云ES混合搜索与DeepSeek,十分钟构建RAG 应用
本文共计1669字 预计阅读时长6分钟 随着数据智能技术的不断发展,以大语言模型(LLM)驱动的AIGC为代表的内容生成技术已经成为企业数据智能能力中不可或
腾讯QQ大数据
2025/02/03
4.2K0
基于腾讯云ES混合搜索与DeepSeek,十分钟构建RAG 应用
腾讯云ES RAG最佳实践:百行代码轻松实现帮助文档的智能问答
腾讯云大数据Elasticsearch Service首发上线ES 8.8.1版本,提供强大的云端AI增强与向量检索能力,支持在端到端搜索与分析平台中实现自然语言处理、向量搜索以及与大模型的集成,10亿级向量检索平均响应延迟控制在毫秒级,助力客户实现由AI驱动的高级搜索能力,为搜索与分析带来全新的前沿体验。本文将结合腾讯云ES与ChatGPT,演示如何通过百行代码轻松实现ES帮助文档的智能问答系统。
腾讯QQ大数据
2023/11/18
1.1K1
腾讯云ES RAG最佳实践:百行代码轻松实现帮助文档的智能问答
RAG 实践:基于混元大模型与腾讯云ES,十分钟构建你的专属 AI 助手
随着数据智能技术的不断发展,以大语言模型(LLM)驱动的AIGC为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分,但传统的内容生成技术存在信息更新不及时、垂直领域知识匮乏、模型幻觉等问题,如何推进大模型在各行业、各业务场景落地是各方普遍关注的问题,而检索增强生成(Retrieval-Augmented Generation,RAG)技术则为此提供了有效的解决方案,成为数据智能时代的一大趋势。
用户10398750
2024/10/16
7580
重磅!腾讯智能工作台ima,获信通院AI大模型应用精选案例奖
近日,信通院公布首批“开源大模型+”软件创新应用典型案例奖,基于一栈式AI搜索解决方案Elasticsearch Service与大模型打造的腾讯智能工作台ima被评为精选案例。
腾讯QQ大数据
2025/05/17
2650
重磅!腾讯智能工作台ima,获信通院AI大模型应用精选案例奖
在Elasticsearch中使用NLP技术,提升搜索相关性
在当下,如果说我们要选出你朋友圈中的Top 1的主题,那如果不是疫情开发,那么几乎肯定就是chatGPT了。
点火三周
2022/12/14
4.4K0
在Elasticsearch中使用NLP技术,提升搜索相关性
纯向量数据库和向量插件都有局限,那未来发展有其他方向吗?
导读:向量数据库的争议差不多一年了,但我们一直缺少一篇能透彻讲解向量数据库相关问题的文章,这导致在这个领域的讨论一直没有得到充分的澄清。在这篇文章中,我们将深入剖析向量数据库核心技术的争议点,解释其优势和局限性,为读者提供全面而清晰的了解。本文作者的原标题是《向量数据库路在何方?结合 RAG 的发展谈谈它的未来》。
深度学习与Python
2024/01/11
4500
纯向量数据库和向量插件都有局限,那未来发展有其他方向吗?
腾讯云ES RAG最佳实践:向量+文本混合搜索的相关性调优
‍| 导语 腾讯云ES近期上线的8.8.1版本,提供了强大的云端AI增强能力,支持在统一技术栈中完成文本+向量的混合搜索,实现自然语言处理以及与大模型的集成,本文将从向量检索的优势与局限性介绍出发,说明混合搜索的原理、优势及其必要性,并通过效果演示为大家呈现腾讯云ES混合搜索的强大能力。
腾讯QQ大数据
2023/12/02
5.6K1
腾讯云ES RAG最佳实践:向量+文本混合搜索的相关性调优
腾讯大数据基于 StarRocks 的向量检索探索
AI 和大模型无疑是当前的热门话题,作为从事数据工作的我们,也希望能够紧跟这一趋势,探索如何与 AI 实现更紧密的结合。这正是我们最初的诉求。随着大模型的兴起,推动了公司在这一背景下对向量检索场景的深入探索,也为我们进一步拓展在 StarRocks 上的应用提供了新的机遇。
StarRocks
2025/03/03
1780
腾讯大数据基于 StarRocks 的向量检索探索
RAG 实践:腾讯云ES&混元,十分钟构建你的专属 AI 助手
随着数据智能技术的不断发展,以大语言模型(LLM)驱动的 AIGC 为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分,但传统的内容生成技术存在信息更新不及时、垂直领域知识匮乏、模型幻觉等问题,如何推进大模型在各行业、各业务场景落地是各方普遍关注的问题,而检索增强生成(Retrieval-Augmented Generation,RAG)技术则为此提供了有效的解决方案,成为数据智能时代的一大趋势。
腾讯QQ大数据
2024/10/10
6560
RAG 实践:腾讯云ES&混元,十分钟构建你的专属 AI 助手
Elasticsearch案例:百行代码实现腾讯ES帮助文档的RAG
随着搜索引擎技术的不断发展,我们对于查询的需求也日益提高。传统的关键词搜索已经无法满足用户对于查询准确性和效率的要求。为此,我们引入了语义搜索技术。通过使用先进的自然语言处理(NLP)技术,语义搜索能够更好地理解用户的查询意图,并返回更相关的搜索结果。而随着机器学习技术的持续发展,特别是chatGPT等生成式大模型的火爆,一个新的技术方向应运而生 —— RAG。
点火三周
2023/11/02
5.6K5
Elasticsearch案例:百行代码实现腾讯ES帮助文档的RAG
干货 | 详述 Elasticsearch 向量检索发展史
通过将复杂的对象(例如文本、图像或声音)转换为数值向量,并在多维空间中进行相似性搜索,它能够实现高效的查询匹配和推荐。
铭毅天下
2023/08/18
1.4K0
干货 | 详述 Elasticsearch 向量检索发展史
「最佳实践」腾讯云 Elasticsearch 8:预训练模型与一站式向量化语义检索的完美结合
本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。
岳涛
2023/12/28
2.5K16
「最佳实践」腾讯云 Elasticsearch 8:预训练模型与一站式向量化语义检索的完美结合
腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
在大型语言模型(LLM)引领的革命浪潮中,搜索与大模型的紧密结合已成为推动知识进步的关键要素。作为开源搜索引擎排名第一的 Elasticsearch(ES),结合沉淀多年的文本搜索能力和强大的向量检索能力实现混合搜索,使搜索变得更准、更全、更智能。腾讯云 ES 多年来持续对开源 ES 的性能、成本、稳定性以及分布式架构进行深度增强优化,并在海量规模的云业务中接受考验。腾讯云基于 ES 实现了一站式 RAG 解决方案,具备了 RAG 技术规模化落地能力。本次分享将深入探讨腾讯云 ES 在搜索领域的最新探索,详细解析腾讯云 ES 的一站式 RAG 方案,并介绍围绕该方案架构落地所进行的一系列内核性能和稳定性增强优化措施。
腾讯QQ大数据
2024/12/20
1.2K0
腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
基于腾讯云ES混合搜索与HAI部署DeepSeek,快速构建RAG 应用
随着数据智能技术的不断发展,以大语言模型(LLM)驱动的AIGC为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分。但在实践过程中,LLM(例如ChatGPT)仍存在不少问题,例如信息更新不及时、垂直领域知识匮乏,且可能产生“幻觉”(即生成不准确的内容)等问题。
腾讯云大数据
2025/04/29
1340
推荐阅读
腾讯云ES再进化,新特性「智能搜索开发」助力LLM应用落地
770
腾讯云大数据ES:结合AI大模型与向量检索的新一代云端检索分析引擎
7100
腾讯云ES AI增强搜索:十分钟快速入门自然语言处理(NLP)与向量检索
1.1K1
为AI革命提供高级搜索能力!腾讯云大数据ES国内首发上线8.8.1版本
3620
Elastic发布Elasticsearch Relevance Engine™ — 为AI革命提供高级搜索能力
8460
使用腾讯云Elasticsearch 8.8.1实现:NLP+Vector Search+GAI
3.1K0
基于腾讯云ES混合搜索与DeepSeek,十分钟构建RAG 应用
4.2K0
腾讯云ES RAG最佳实践:百行代码轻松实现帮助文档的智能问答
1.1K1
RAG 实践:基于混元大模型与腾讯云ES,十分钟构建你的专属 AI 助手
7580
重磅!腾讯智能工作台ima,获信通院AI大模型应用精选案例奖
2650
在Elasticsearch中使用NLP技术,提升搜索相关性
4.4K0
纯向量数据库和向量插件都有局限,那未来发展有其他方向吗?
4500
腾讯云ES RAG最佳实践:向量+文本混合搜索的相关性调优
5.6K1
腾讯大数据基于 StarRocks 的向量检索探索
1780
RAG 实践:腾讯云ES&混元,十分钟构建你的专属 AI 助手
6560
Elasticsearch案例:百行代码实现腾讯ES帮助文档的RAG
5.6K5
干货 | 详述 Elasticsearch 向量检索发展史
1.4K0
「最佳实践」腾讯云 Elasticsearch 8:预训练模型与一站式向量化语义检索的完美结合
2.5K16
腾讯云 ES:一站式 RAG 方案,开启智能搜索新时代
1.2K0
基于腾讯云ES混合搜索与HAI部署DeepSeek,快速构建RAG 应用
1340
相关推荐
腾讯云ES再进化,新特性「智能搜索开发」助力LLM应用落地
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档