文字 关注我们吧!
分布数据库定义:分布数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个节点具有独立处理的能力(称为场地自洽),可以执行局部应用。同时每个结点也能通过网络通信子系统执行全局应用。
分布式数据库目标:
本地自治、非集中式管理、高可用性(最基本的特征)
位置独立性、数据分片独立性、数据复制独立性(分布透明性)
分布独立性、事务管理(复杂性)
硬件独立性、操作系统独立性、网络独立性、数据库管理独立性(独立性)
数据分布策略:
数据分片(对关系操作)和数据分配(对分片结果)考虑
数据分片:
垂直、水平、导出、混合
数据分配:将分片产生的片段分配存储在各个场地上(物理存储)解决数据分配的方法:
集中式:所有的数据片段安排在一个场地上
分割式:所有全局数据有且只有一份分割成若干被分配在特定场地上的片段
全复制式:全局数据由多个副本,每一个场地上有一个完整的数据副本
混合式:介于分割与全复制式之间
分布式透明性:
分片透明性:用户无需考虑数据分片
位置透明性:用户只需考虑数据分片情况,无需考虑数据分片位置
局部数据模型透明性:既要了解全局数据的分片情况,还要了解各片段的副本复制
情况及位置分配情况
分布式查询:
用户与分布式数据库系统的接口。分布查询优化需考虑:
(1)操作执行的顺序。
(2)操作的执行算法(连接操作和并操作)
(3)不同场地间的数据流动的顺序。
数据独立性:在集中式数据库中,数据独立性包括两个方面:数据逻辑独立性和数据的物理独立性。通过系统的三级模式(外模式、模式、内模式)和它们之间的二级映像得到的。
集中式数据库系统中查询代价主要是由CPU代价和I/O代价来衡量的
在分布式数据库系统中,由于数据分布在多个不同的场地上,使得查询处理中还要考虑站点处传输数据的通信代价
END
本文分享自 ellipse数据库技术 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!