
GitHub: https://github.com/alibaba/zvec
阿里巴巴通义实验室出品的「向量数据库界的 SQLite」——基于生产级引擎 Proxima 构建的嵌入式向量数据库,C++ 核心 + Python/Node.js SDK,HNSW+RaBitQ 量化索引在 VectorDBBench 中 QPS 碾压竞品 2 倍+,原生支持稠密+稀疏向量混合检索。
维度 | 数据 |
|---|---|
GitHub | https://github.com/alibaba/zvec |
Star / Fork | 9,119 / 519 |
代码行数 | ~243,000 行(C++ 82.4%, Python 6.9%, CMake 3.2%) |
项目年龄 | 4 个月(2025-12 创建,2026-01 开源) |
开发阶段 | 高速迭代(平均 26 天一个版本,v0.2.1 最新,日均 1.5 次提交) |
贡献模式 | 企业团队驱动(20 人,前 5 人贡献 61%,工作日占比 91.5%) |
热度定位 | 中等热度 / 快速增长(9.1K Star,4 个月内达成) |
质量评级 | 代码[A] 文档[B+] 测试[A-] |
阿里巴巴通义实验室出品,基于内部生产级向量引擎 Proxima 构建。Proxima 在阿里集团内部已服务多年,支撑推荐、搜索、广告等核心业务的向量检索。团队有深厚的 ANN 算法研究背景,RaBitQ 量化算法是其代表性成果。20 名贡献者,典型企业团队驱动模式(工作日 91.5%)。
团队看到了向量数据库领域的结构性矛盾:企业需要高性能向量检索,但大多数场景不需要独立的向量数据库服务。Milvus/Qdrant 需要独立部署运维,对 RAG 应用、Edge AI、桌面应用过于重量级。ChromaDB 虽然嵌入式但性能不够(Python 实现),FAISS 性能好但只是索引库(无数据库特性)。
空白地带:高性能(C++ 级别)+ 嵌入式(零服务部署)+ 完整数据库(CRUD + SQL + 事务)。
「SQLite 理念 + Proxima 引擎」:
开源版获取开发者信任 → 阿里云向量数据库服务(DashVector)转化付费用户。Zvec 是 Proxima 引擎的开源包装,通过「嵌入式」定位避免与 Milvus 正面竞争。
模式 | 简述 | 适用场景 |
|---|---|---|
Framework Pattern | Builder/Streamer/Searcher/Reducer 抽象索引生命周期 | 多算法向量索引系统 |
运行时 SIMD 派发 | 编译时多路径 + 运行时 CPU 检测 | 计算密集型数值库 |
LSM-Tree 分段存储 | Segment 分段 + 后台合并 + WAL | 嵌入式数据库存储引擎 |
RocksDB 元数据后端 | 成熟 KV 引擎管理元数据,自研引擎管理向量 | 分层存储架构 |
pybind11 SDK 绑定 | C++ core → Python SDK,零拷贝性能 | C++ 库的 Python 包装 |
维度 | zvec | ChromaDB | LanceDB | FAISS | Milvus |
|---|---|---|---|---|---|
架构 | 嵌入式 C++ | 嵌入式 Python | 嵌入式 Rust | 索引库 C++ | 客户端-服务器 |
性能 | 8,000+ QPS | 中等 | 中上 | 极高 | 高 |
完整数据库 | 是(SQL+CRUD+事务) | 是 | 是 | 否(仅索引) | 是 |
量化索引 | HNSW+RaBitQ(独有) | 无 | 有限 | PQ/SQ | PQ/SQ |
稀疏向量 | 原生支持 | 无 | 无 | 有限 | 支持 |
部署 | pip install | pip install | pip install | pip install | Docker/K8s |
生态成熟度 | 新(4 个月) | 成熟(3 年+) | 成熟(2 年+) | 极成熟 | 极成熟 |
向量数据库生态中的「高性能嵌入式」角色——填补「FAISS 级性能 + SQLite 级便利」的空白。适合 RAG 应用、Edge AI、桌面应用、移动端等不适合部署独立服务的场景。
- src/core/ — 向量索引算法(HNSW/Proxima Graph/IVF/RaBitQ)
- src/ailego/ — SIMD 距离计算和量化算法
- src/db/ — LSM-Tree 分段存储 + WAL + RocksDB 元数据
- bindings/python/ — pybind11 SDK 绑定层
- 添加 Windows 平台支持
- 集成到 LangChain/LlamaIndex 作为向量存储后端
- 添加 Go/Rust SDK
- 建设独立文档站
资源 | 链接 |
|---|---|
DeepWiki | deepwiki.com/alibaba/zvec |
Zread.ai | 未确认 |
关联论文 | RaBitQ 量化算法(通义实验室研究) |
在线 Demo | 无(嵌入式库,需本地安装) |