2025年6月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V2.5 | HNSW 支持 float16/bfloat16 量化 | HNSW 索引新增 float16/bfloat16_vector 数据类型,在保持高召回率与性能的同时,显著降低内存占用,最优可压缩近50%。 | 数据类型 |
| 支持创建纯稀疏向量的集合 | 支持创建纯稀疏向量集合(不含稠密向量),满足关键词检索场景的独立存储需求,显著提升查询效率并降低存储成本。 | |
| 新增全文检索接口 | 新增 fullTextSearch 接口,支持纯稀疏向量集合的独立全文检索,精准满足纯关键词搜索场景需求。 | |
| 稀疏向量检索性能优化 | 稀疏向量索引查找策略优化,平均检索性能提升50%+,查询效率显著提升。 | - |
| 支持动态切换向量索引类型 | 新增 modifyVectorIndex 接口,支持动态切换 HNSW/IVF 等索引类型,按需适配数据规模与业务场景。 | |
| 重建索引(Rebuild)支持 CPU 限速 | Rebuild 操作支持指定 CPU 核数配额,隔离资源争抢,保障重建期间其他集合的读写性能稳定。 | |
| Filter 语法支持 IS NULL 和 IS NOT NULL | 新增 IS NULL(查询空值字段)和 IS NOT NULL(查询非空字段)语法,支持空值与非空值精准筛选,数据查询能力全面增强。 | |
| 支持更多地域 | 新增雅加达地域部署,满足东南亚业务需求,提供更低的访问延迟部署 |
2025年4月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V2.4 | 备份回档能力产品化(原后台功能升级) | 用户可通过控制台直观查看实例备份记录及详情。系统在保留自动备份机制的同时,新增手动即时备份触发功能,为关键业务操作提供双重保护。同步推出的实例克隆功能支持通过创建新实例实现数据快速恢复,有效提升数据恢复效率与操作准确性。 | 备份概述 自动备份 手动备份 克隆实例 查看备份记录 |
| 支持水平、垂直扩容 | 自2.4版本起的高可用(1主2从及以上)实例,可通过控制台自助完成实例扩容操作,同时支持垂直扩展(节点规格升级)与水平扩展(节点数量增加)两种模式,并可在预设维护时间窗执行变更操作,有效降低对业务运行的干扰。2.4之前版本实例的扩容需求,仍可通过工单系统提交申请处理。 | 升配节点规格 增加节点数量 维护时间窗 |
| 支持新增、删除标量字段索引 | 支持通过 add index、drop index 接口对存量集合新增、删除标量字段索引,根据业务需要灵活管理 filter 标量索引字段。 | add drop |
| 动态标量索引模式支持 json 数据类型 | 如果集合开启了动态标量索引模式(即创建集合时配置了 filterIndexConfig),则新增的 json 类型字段也会自动创建标量索引,方便业务进行过滤检索。 | |
| 云 API 正式发布 | 支持通过云 API 进行实例管理、安全组配置等常用操作。 | 安全组相关接口 实例相关接口 |
| DMC 能力更新 | AI 套件导入功能升级,支持通过 DMC 平台直接导入 PDF、Word、PPT 文档。 支持可视化使用混合检索、TTL、动态标量索引等内核新版本功能。 | 集合视图数据操作 集合数据操作 集合管理 |
| 新增地域 | 亚太东南雅加达地域开区。 |
2025年3月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V2.3 | AI 套件支持导入普通 Collection | 支持 uploadUrl 接口将 PDF、Word 等文档导入普通 Collection,快速构建 RAG 知识库。数据导入后,可以使用普通 Collection 的相关接口灵活进行 Chunk 级别的数据管理和检索操作,接口使用更灵活。 | |
| 支持 json 数据类型 | 标量字段新增 json 类型支持,可以在集合中对 json 数据进行存储和 filter 检索 | 数据类型 |
| 支持 AutoID | 创建集合时开启 AutoID 后,即可对每条文档自动生成唯一主键 id,降低业务维护成本 | |
| 稀疏向量分词增强 | 支持选择分析模式,自定义分词词表,自定义停用词 |
2025年1月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V2.2 | 新增“账户与权限管理(RBAC)”功能 | 创建自定义用户,并对用户授权资源对象操作权限,实现细粒度的访问控制与管理。 | |
| 向量检索性能全面提升 | 深度优化 HNSW、IVF 系列索引的底层实现机制,性能平均提升30%,尤其在部分 Filter 检索场景性能提升达2倍以上。 | - |
| query 接口新增 Sort 参数 | 通过 Sort 参数指定查询结果按照某一特定字段按照升序或降序排列。 | |
| FIlter 表达式功能提升 | uint64 数据类型支持 IN 和 NOT IN 语法,提供了更加灵活的数据过滤机制。 | |
| IVF 索引新增 initial 状态 | 解决首次创建 IVF 索引集合后,索引状态为 Ready 带来的理解歧义,initial 状态代表创建 IVF 索引集合后未 Rebuild 索引。 | describe rebuild |
| 稀疏向量工具能力增强 | 针对停用词词表进行优化,可更好地适应大多数业务场景的需求。 |
2024年11月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V2.1 | 提升混合检索(Hybrid Search)能力 | 优化内存空间占用,内存空间浪费降低30%。 召回率提升,稀疏向量单路检索召回率提升20%。 灵活设置,支持检索时设置停用词频和终止条件,在不同数据集下性能和召回取得最佳平衡点。 解决问题,配置了 Embedding 的集合,在混合检索时直接传入文本数据。 | |
| Dynamic index 支持动态标量字段全索引 | 启用动态标量字段功能后,集合中的所有标量字段将自动创建 Filter 索引以提升查询效率。 支持灵活选择对特定字段不建立索引(黑名单),以优化存储空间或减少索引维护开销。 支持指定超过一定长度的字符串不建索引。 | |
| 新增 Binary_FLAT 索引 | 处理二进制向量数据的索引类型,支持使用 Hamming Distance 进行相似性计算,通常用于图搜场景。 | 索引类型 相似性计算 |
| 综合体验提升特性 | 索引参数修改 modifyVectorIndex,可修改原数据表的向量索引参数,降低重新建表并导入数据的成本。注意:这里修改索引参数后会自动发生一次 Rebuild Index。 支持 Count,返回 Collection 所有的文档数量或满足 Filter条件的文档数量。 Delete 支持 Limit,单次删除的速度非常快,同时很好地控制对数据库业务影响。如果您的业务中需要删除海量数据,可以循环通过 Limit 删除配合 affectedCount 返回值来达到效果。 Search 支持分数搜索半径,支持通过 Radius 参数指定相似性分数阈值,快速过滤出分值大于指定阈值的结果。 增加 exists_db、exists_collection 等方法用于程序判断 | count delete search |
| 优化数据库性能 | 优化 FLAT 索引删除数据性能,解决 Faiss 库中删除需要遍历整个数组的问题,性能提升5倍以上。 对建表速度进行了显著优化,将时间从7秒大幅缩减至百毫秒级别。 增强了元数据管理能力,使集合(Collection)的数量上限翻倍。 | - |
| 新增 Embedding 模型 | 新增 BAAI/bge-m3、bge-base-zh-v1.5、bge-large-zh-v1.5共三种模型。BAAI/bge-m3 模型能支持多语言,并能够支持高达8192个输入 Token,推荐在2048 token 内是相对较好的效果。 | |
| 控制台功能更新 | 支持实例级别的监控指标,监控覆盖整个数据库集群,包括集群的 CPU、内存和磁盘的最大与平均使用率,以及数据库出入流量和请求响应情况,以便全面评估整个实例的性能状态。 外网功能规范化升级,除深圳金融、上海自动驾驶两个地域不支持开通外网外,其余地域实例均支持开启外网访问。 支持切换私有网络环境,便于用户根据业务需求随时调整网络环境。 | 查看监控指标 切换网络 开启外网访问 |
| C++ SDK 正式发布 | 支持 gRPC 通信协议(兼容 Protobuf 3.11.4或更低版本)。 支持稠密向量相关所有 API。 | |
| 新增2个站点 | 美国弗吉尼亚 德国法兰克福 |
2024年9月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V2.0 | 新增标准型规格 | 标准型规格 CPU 与内存资源配比为1:4,具有均衡的计算与存储资源,适用于绝大多数日常业务场景。 | 规格选型 购买实例 |
| 支持混合检索(Hybrid Search) | 支持稠密向量 Dense vector + 稀疏向量 Sparse vector 双路召回,Sparse vector 通过 BM 25 算法完成分数计算达到类关键字检索效果,支持 RRF、Weight 两路权重合并算法。进一步提升业务召回效果,弥补在语义检索中对具体数字、编码、数学公式等不敏感以及语义过度泛化的问题。 | |
| PDF 支持图文混合 | AI 套件针对 PDF 支持图文混合(图片内容暂未解析,保留图片在文本相对位置),当检索到相关文本后,相应的图片上下文链接也会返回,提升 RAG 的整体效果。 | |
| 支持 TTL | 支持 TTL,写入后的数据在设置的效期达到后,后台会异步逐步删除(轮询周期为1小时),适用于周期性删除历史数据的业务。 | |
| SDK 功能更新 | Python、GO、Java SDK 支持对 Database、Collection 的存在判断。 | - |
2024年8月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V1.6 | 性能提升 | 可靠性提升,通过优化内核,SLA 从99.95%提升至99.99%。 优化内存快照,快照速度提升10倍,对业务 CPU 和内存影响降低10倍。 频繁 upsert + delete 场景,解决了内存和磁盘空间膨胀问题。 优化元数据,单库支撑 Collection 数量上限提升至10000+。 | - |
| 支持 GRPC 通信协议 | GO、Java SDK 支持 GRPC 通信协议。 Python、GO、Java SDK 支持通过 Client 直接进行数据读写操作,无需先获取 DB 和 Collection 对象再进行,可更加简单高效地操作数据。 | |
| 新增地域 | 南京 Region 开区。 |
2024年6月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V1.5 | 性能提升 | 支持 GRPC 通信协议,Python SDK 同步支持 version >= 1.3.3,在 Python 并发 Batch upsert 场景下通信效率提升6倍+。 说明: 由于 GRPC 是长连接,在多 Replica 场景下,需要建立多个 GRPC 的 Client 才有机会发挥多 Replica 的最佳性能。 | |
| | 优化元数据,单库支撑 Collection 数量上限提升至5000+。 | - |
| | 优化 HNSW 空表内存占用,空表内存占用为优化前5%,解决 HNSW 写入扩容内存不足问题。 | - |
| | 高压力下综合 QPS 提升: sift-128-euclidean(低维)在3 * 4c8GB跨机房,客户端 recall@10=0.99下压测 QPS 从1.37万提升至2.08万 gist-960-euclidean(高维)在3 * 4c8GB跨机房,客户端recall@10=0.99下压测 QPS 从0.63万提升至1.05万 进程(线程)并发从50~300持续加压,综合 QPS 几乎不衰减 | - |
2024年3月
2024年1月
2023年11月
2023年10月
2023年9月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V1.1 | 新增 Embedding 功能 | 向量数据库的 Embedding 功能会自动将原始文本进行转换,生成对应的向量数据并插入数据库或进行相似性检索,实现了文本到向量数据的一体化转换,减少了用户的操作步骤,极大降低了使用门槛。 | |
| 新增 IVF 系列向量索引 | IVF 系列索引(IVF_FLAT,IVF_PQ,IVF_SQ8/IVF_SQ4/IVF_SQ16)数据导入速度快,且内存空间占用低,适用于亿级向量数据规模,能够提高大规模数据量下的检索效率。该索引的核心思想是将高维空间划分为多个聚类,并为每个聚类构建一个倒排文件。 | Index |
| 支持清空集合数据 | 新增 /collection/truncate 接口清空 Collection 中所有的数据、别名与索引,仅保留 Collection 配置信息,例如索引类型及参数、分片等设置,减少用户的操作成本。 | |
| 支持集合别名机制 | 支持创建指向已有集合的别名。当使用别名访问时,用户不感知真实集合名的变化,适用于数据迁移到新集合后的一键切换场景。 | |
| 支持更新数据 | 新增 /document/update 接口用于快速更新数据库中的已有的数据,保证数据的准确性和完整性。 | |
| 支持重建索引 | 新增 /index/rebuild 接口用于对集合重建索引,清除无用的索引数据,修复损坏的索引数据,优化索引结构,改善性能。 | |
|
Filter 能力增强。查询、更新、删除数据均支持 Filter 表达式过滤数据
| /document/query 接口增强检索能力。 支持根据主键(Document ID),结合 Filter 表达式一并检索。 支持指定查询起始位置 offset 和返回数量 limit,实现数据SCAN能力。 | |
| | /document/delete 接口支持通过主键(Document ID)与 Filter 表达式综合检索需删除的 Document ,实现精确、高效、灵活、安全的删除操作。 | |
| | /document/update 接口支持通过主键(Document ID)与 Filter 表达式综合检索数据,对所检索的 Document 的部分字段进行更新。 |
2023年8月
版本信息 | 动态名称 | 动态描述 | 相关文档 |
V1.0 | 向量数据库第一次正式上线 | 向量数据库目前处于公测阶段,支持多种索引类型和相似度计算方法,百万级 QPS 及毫秒级查询延迟。 |