前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >RAG应用开发实战02-相似性检索的关键 - Embedding

RAG应用开发实战02-相似性检索的关键 - Embedding

作者头像
JavaEdge
发布2024-05-25 14:46:25
920
发布2024-05-25 14:46:25
举报
文章被收录于专栏:JavaEdgeJavaEdge

1 文本Embedding

将整个文本转化为实数向量的技术。

Embedding优点是可将离散的词语或句子转化为连续的向量,就可用数学方法来处理词语或句子,捕捉到文本的语义信息,文本和文本的关系信息。

◉ 优质的Embedding通常会让语义相似的文本在空间中彼此接近

◉ 优质的Embedding相似的语义关系可以通过向量的算术运算来表示:

2 文本Embedding模型的演进与选型

目前的向量模型从单纯的基于 NLI 数据集(对称数据集)发展到基于混合数据(对称+非对称)进行训练,即可以做 QQ召回任务也能够做 QD 召回任务,通过添加 Instruction 来区分这两类任务,只有在进行 QD 召回的时候,需要对用户 query 添加上 Instruction 前缀。

3 VDB通用Embedding模型

模型选择:

GPU资源:

4 VDB垂类Embedding模型

用户提供垂类文档数据,VDB对模型进行微调,助力垂类应用效果更进一步。

优化1:对比学习拉近同义文本的距离,推远不同文本的距离

优化2:短文本匹配和长文本匹配使用不同prompt,提升非对称类文本效果

优化3:预训练阶段提升基座模型面向检索的能力,对比学习阶段提高负样本数

5 存储、检索向量数据

5.1 为啥需要一个专用的向量数据库
  1. 查询方式与传统数据库存在区别
  2. 简单易用,无需关心细节
  3. 为相似性检索设计,天生性能优势
5.2 腾讯云向量数据库的优势

“首家”:

  • 通过信通院的标准化性能和规模测试
  • 支持千亿级向量规模和最高500W QPS

自研:

  • 内核源自集团自研OLAMA引擎
  • 内部已有40+业务接入

性价比:

  • 性能领先业内平均水平1.5
  • 同时客户成本降低20%

6 VDB优势

流程简化

模型简化:

共享GPU集群:

7 腾讯云向量数据库:消除大模型幻觉,加速大模型在企业落地

7.1 端到端AI套件,AGI时代的知识库解决方案

提供一站式知识检索方案,实现业界内最高召回率、大幅降低开发门槛,帮助企业快速搭建RAG应用,解决大模型幻觉问题。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-05-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1 文本Embedding
  • 2 文本Embedding模型的演进与选型
  • 3 VDB通用Embedding模型
    • GPU资源:
    • 4 VDB垂类Embedding模型
    • 5 存储、检索向量数据
      • 5.1 为啥需要一个专用的向量数据库
        • 5.2 腾讯云向量数据库的优势
        • 6 VDB优势
          • 流程简化
          • 7 腾讯云向量数据库:消除大模型幻觉,加速大模型在企业落地
            • 7.1 端到端AI套件,AGI时代的知识库解决方案
            相关产品与服务
            向量数据库
            腾讯云向量数据库(Tencent Cloud VectorDB)是一款全托管的自研企业级分布式数据库服务,专用于存储、检索、分析多维向量数据。该数据库支持多种索引类型和相似度计算方法,单索引支持千亿级向量规模,可支持百万级 QPS 及毫秒级查询延迟。腾讯云向量数据库不仅能为大模型提供外部知识库,提高大模型回答的准确性,还可广泛应用于推荐系统、自然语言处理等 AI 领域。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档