向量数据库就是用来存储,检索,分析向量的数据库。
我们在用图片搜索图片,或者语音搜索语音的时候,在数据库中存储和对比的并不是图片和语音片段,而是通过DL等算法提取出来的“特征”,一般是256/512个float数组,可以用数学中的向量来表示。
从技术角度来讲,向量数据库主要解决2个问题,一个是高效的检索,另一个是高效的分析。
1)检索通常就是图片检索图片,例如人脸检索,人体检索,和车辆检索,以及猫厂的商品图片检索,人脸支付。
2)分析在平安城市应用的比较多,例如人脸撞库,公安会把2个类似作案手法的案发现场周边的人像做对比,看哪些人同时在2个案发现场出现。
随着国家安全和反恐的需求增长,根据业务规划,深圳平安城市项目到2018年底,会部署20w摄像头,预计保留一年的人脸特征在千亿级别;以及人们对购物体验的提升,商品种类以亿计,后续还可以支持音频和非结构化的文本检索,向量数据库大有可为。
Milvus
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。