本文共计1760字 预计阅读时长6分钟
家人们,这次上新可太让人惊喜啦!
腾讯云Elasticsearch(ES)带着全新技能包——「智能搜索开发」闪亮登场,以AI搜索增强版内核为底座,进一步优化了对全文与向量混合搜索的能力支持,从原始文档解析、向量化等原子能力,到查询性能、混合排序效率、搜索结果精准度等提供了全方位的支持和优化,让搜索有了更多想象空间。在此基础上,还可以与混元、DeepSeek等大语言模型无缝集成,从而帮助企业进一步高效、灵活的构建知识问答等RAG应用。
划重点!这次升级主打优势:
混合搜索增强:基于自主研发的文本+向量混合搜索引擎架构,自定义多路召回策略与重排序模型,依托深度优化的底层内核实现查询延时、并发及实时排序全面性能优化,结合多种联网引擎信息采集,让搜索结果精确度起飞。
开发各环节可介入:针对混合搜索或RAG场景,从原始文档解析到返回搜索结果或答案生成,支持客户依据业务需求灵活选择或切换原子服务来优化整体效果,一个技术栈搞定全链路,轻松应对复杂多样的应用搭建和调优。
向量存储与优化:围绕向量存储、索引构成、读写流程、量化等核心技术环节,自研向量裁剪能力,支持去除向量行存以及原始高位向量,大幅节省磁盘空间。
如下是针对这三大优势的详细介绍:
01
搜索增强:全文+向量混合搜索,搜索结果更精准多样
我们都知道,向量搜索优势在于处理模糊表达、捕捉语义、支持跨文本&跨语言&跨模态,文本搜索优势在于短文本精准匹配强、计算成本低、可解释性及调优性强。混合搜索则结合了全文搜索和向量搜索技术的优势:
与此同时,腾讯云ES本身支持常用的中文分词,如IK 分词、QQ分词,同时支持用户上传自定义插件,在内核层面,针对典型向量场景特点做了深度优化,例如分片架构优化,查询并行化,lucene查询缓存锁改造等,10亿级向量检索平均响应延迟控制在毫秒级,整体查询性能提升3 - 10倍,极大程度的提升了混合搜索的效率。
02
灵活开发:集成多种原子服务,全链路可介入调优
还在手动给文档分段落、标关键词?传统数据预处理堪比“愚公移山”,不同格式,不同排版,费时又容易遗漏重点。还在为Embedding、Rerank选型烦恼?AI搜索或 RAG涉及环节众多,牵一发而动全身,如何快速验证端到端效果最佳?
腾讯云ES为此做了以下努力:
为了进一步提升易用性,腾讯云ES还在内核层面集成Inference API,简单一行配置,即可切换不同模型进行推理服务,在一条DSL完成检索生成。
03
向量优化:行存裁剪+量化裁剪+多策略融合排序
除了本身Elastic官方在向量搜索上的大幅优化动作外,腾讯云ES还自研了一个全新的插件 —— v-pack插件,旨在通过给“数据瘦身”+“多策略排序”组合拳,在降低成本的同时提供更加丰富、强大的向量能力。
v-pack插件动态裁剪行存中的冗余向量,相比传统ES把向量数据同时塞进行存和列存,可无损压缩70%+存储。同时在行存裁剪基础上,首创int8_only_hnsw索引,把高精度向量“脱水”成int8格式存储,存储进一步节省90%!
更妙的是,在重排序策略上,支持权重可调RRF、归一化Score以及调用GPU Rerank模型服务,无论是关键词与语义之间的平衡,还是对可解释性、准召率要求较高的场景,都能介入调优。
现在上车,解锁智能搜索开发新姿势!
作为国内领先的企业级文本和向量搜索引擎,以及首个端到端RAG技术标准制定者和测评者(信通院权威认证),腾讯云ES在AI 快速发展的潮流下,已成功助力微信读书「AI问书」、ima(智能工作台)、腾讯会议智能助手等顶流应用落地,帮助到这些产品的文本和向量混合检索能力,助力RAG应用搭建,支持了数十亿向量规模的同时达到毫秒级响应性能。未来我们也将持续打磨全链路智能搜索开发能力,协助企业高效、灵活的打造更多优秀的AI搜索应用。
(示例:微信读书“AI 问书”)
腾讯云大数据始终致力于为各行业客户提供轻快、易用,智能的大数据平台。
点击阅读原文,开启智能搜索开发新范式
END
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有