向量数据库因为AI大模型最近很火。向量数据库是一种专门用于存储、 管理、查询、检索向量的数据库,主要应用于人工智能、机器学习、数据挖掘等领域。向量是一组数值,可以表示一个点在多维空间中的位置。
简单理解就是在AI的世界中,处理的所有数据都是向量的形式,比如“我爱吃荔枝”,在大模型处理的过程中,计算机会转化为向量的形式:
我:[0.1, 0.3, -0.2, ..., -0.1]
喜欢:[-0.3, 0.5, 0.2, ..., 0.4]
吃:[0.4, -0.1, 0.2, ..., -0.3]
荔枝:[-0.4, 0.3, 0.2, ..., 0.3]。
相对传统数据库,向量数据库不仅能够完成基本的 CRUD(添加、 读取查询、更新、删除),标量数据过滤、范围查询等操作,还能够对向量数据进行更快速的相似性搜索。