词汇表

最近更新时间:2024-11-13 09:32:06

我的收藏

B

本地表

本地表(Local Table)的数据,只会存储在当前写入的节点上,不会被分散到多台机器上。

D

单机表

单机表(Non-Replicated Table)的数据,只会存储在当前节点上,不会被复制到其它节点。

F

分布式表

分布式表(Distributed Table)是本地表的集合,它将多个本地表抽象为一张统一的表,对外提供写入、查询功能。当写入分布式表时,数据会被自动分发到集合中的各个本地表中;当查询分布式表时,集合中的各个本地表会被分别查询,并且把最终结果汇总后返回。分布式表的写入和查询可以利用多台服务器的存储、计算资源,能按需横向扩展。

分片

  • 在 Elasticsearch Service 中,分片(Shards)是数据的容器,文档保存在分片内,一个分片是一个底层的工作单元,它仅保存了全部数据中的一部分,分片又被分配到集群内的各个节点里,当您的集群规模扩大或者缩小时,Elasticsearch 会自动的在各节点中迁移分片,使得数据仍然均匀分布在集群里。
    一个分片可以是主分片或者副本分片。索引内任意一个文档都归属于一个主分片,所以主分片的数目决定着索引能够保存的最大数据量(技术上来说,一个主分片最大能够存储 Integer.MAX_VALUE - 128 个文档)。
    一个副本分片(Replicas)只是一个主分片的拷贝。副本分片作为硬件故障时保护数据不丢失的冗余备份,并为搜索和返回文档等操作提供服务。在索引建立的时候就已经确定了主分片数,但是副本分片数可以随时修改。
  • 在腾讯云数据仓库 TCHouse-C 中,将海量数据分散存储到多个节点上,每个节点只存储和处理海量数据的一部分,每台节点被称为一个分片(Shard)。
  • 在向量数据库中,为了支持更大规模的数据,集合一般会按某个维度分成多个部分,每个部分就是一个分片(Shard),分布在若干个节点(Node)上。为了保证可靠性和可用性,同一个集合的多个分片会分布在不同节点(Node)上。

副本

  • 在消息队列 CKafka 中,副本(Replica)是消息的冗余备份,每个分区可以有多个副本,每个副本包含的消息是一样的(在同一时刻,副本之间并不完全一样,这依赖同步机制)。
    在消息队列 CKafka 中每个分区至少有双副本,保障服务的高可用。
  • 在腾讯云数据仓库 TCHouse-C 中,为了保障服务的高可用性,TCHouse-C 提供了副本机制,将单个节点的数据冗余存储在2个或多个节点上。
  • 在向量数据库中,同一个分片(Shard)的备份数据,一个分片至少会有2个副本(Replica)。副本分片作为硬件故障时保护数据不丢失的冗余备份,并为向量检索和文档查询等读操作提供服务,确保数据库在面临节点故障和负载变化等挑战时仍能正常运行。

复制表

复制表(Replicated Table)的数据,会自动复制到多个节点上,形成多副本,复制表在至少1个正常副本情况下,仍可对外提供服务。

G

高可用

高可用(High Availability,HA)是 ClickHouse 集群的服务属性,默认为开启状态。

  • 高可用属性开启时,ClickHouse 集群由偶数个(最少2个)ClickHouse Server 节点和3个 ZooKeeper 节点构成,单台服务器的数据冗余存储在2台或多台服务器上,当某个副本不可用时,另一个集群还可以继续服务。
  • 高可用属性关闭时,ClickHouse 集群由多个(最少1个)ClickHouse Server 节点和1个 ZooKeeper 节点构成,数据只有1个副本,当某个副本不可用时会导致整个集群不可用。

T

腾讯云数据仓库 TCHouse-C

云数据仓库 TCHouse-C 基于开源 OLAP 引擎 ClickHouse 打造,为您提供方便易用、灵活稳定的云端全托管服务。只需要几分钟,便可完成海量数据查询数据仓库的搭建,简单轻松地完成对数据的实时查询分析,提升数据价值挖掘的整体效率。