一个 Collection 中可以包含多个 Document。每个 Document 由多个字段(Field)组 Field 成,每个 Field 以键值对(key:value)的形式存储。
管理 Document
腾讯云向量数据库(Tencent Cloud VectorDB)提供了一组 API 接口,用于插入、检索、更新、删除集合中的文档,方便管理集合中的文档。如下表所示。
操作 | 功能 | SDK | 详细说明 |
插入文档 | Python:upsert() Java:upsert() | 支持在插入数据时动态修改字段 支持写入原始文本 支持写入向量数据 支持批量插入文档 注意: 若执行 upsert 操作时,指定 Document ID 对应的文档已存在,会先删除原文档,随后插入新数据。 最大支持插入 1000 条数据。 | |
查询文档数据 | Python:query() Java:query() | 支持根据 Document ID 查询单条文档 支持根据 Document ID 并结合标量字段的 Filter 表达式查询一条或多条文档 支持指定查询起始位置与返回数量模糊查询多条文档 | |
根据指定 id 字段或 vector 进行相似度检索 | Python:search()、searchById()、searchByText() | 返回与指定 Document ID最相近的 Top K 条文档, 返回与指定 Vector 最相近的 Top K 条文档 返回与指定文本最相似的 Top K 条文档 支持批量检索,即输入多个 ID 或多个 Vector 数据批量检索,返回每一个 ID 或每一个 Vector 最相近的 Top K 条文档 | |
删除文档 | Python:delete() Java:delete() | 支持根据指定 Document ID 删除单条文档 支持结合标量字段的 Filter 表达式一起过滤需删除的文档 支持批量删除文档 | |
更新文档 | Python:update() Java:update() | 支持根据 Document ID 与 标量字段的 Filter 表达式过滤需更新的数据 支持更新旧字段的值 支持新增字段 |
数据结构
腾讯云向量数据库(Tencent Cloud VectorDB) 支持 vector、string、uint64、double 四种数据结构。
数据结构 | 说明 |
vector | 向量字段的数据类型,每个向量维度的数据结构为 float32。 |
string | 字符串,主键 ID 与标量字段支持的数据类型之一。 |
uint64 | 整型数值,用于存储整数数值,包含正整数、负整数和零。 |
double | 双精度浮点型数值,用于存储浮点值。 |
array | 数组类型,用于存储一组相同类型的数据元素。当前,数组元素仅支持 string 类型。 |
说明:
主键 ID 字段仅支持 string。
标量字段(包含可创建索引的标量字段)支持 string、uint64、array。