大数据时代,面对日益增长的海量数据,传统的集中式数据库的弊端日益显现,分布式数据库相copy对传统的集中式数据库有如下优点。
更高的数据访问速度:分布式数据库为了保证数百据的高可靠性,往往采用备份的策略实现容错,所以,在读取数据的时候,客户端可以度并发地从多个
备份服务器同时读取,从而提高了数据知访问速度。
更强的可扩展性:分布式数据库可以通过增添存储节点来实现存储容量的线性扩展,而集中式数据库的可扩展性十分有限。更高的并发访问量:分布式数据库由于道采用多台主机组成存储集群,所以相对集中式数据库,它可以提供更高的用户并发访问量。
更适合分布式的管理与控制。分布式数据库系统的结构更适合具有地理分布特性的组织或机构使用,允许分布在不同区域、不同级别的各个部门对其自身的数 据实行局部控制。例如:实现全局数据在本地录入、查询、维护,这时由于计算机资源靠近用户,可以降低通信代价,提高响应速度,而涉及其他场地数据库中的数 据只是少量的,从而可以大大减少网络上的信息传输量;同时,局部数据的安全性也可以做得更好。
具有灵活的体系结构。集中式数据库系统强调的是集中式控制,物理数据库是存放在一个场地上的,由一个DBMS集中管理。多个用户只可以通过近程或远 程终端在多用户操作系统支持下运行该DBMS来共享集中是数据库中的数据。而分布式数据库系统的场地局部DBMS的自治性,使得大部分的局部事务管理和控 制都能就地解决,只有在涉及其他场地的数据时才需要通过网络作为全局事务来管理。分布式DBMS可以设计成具有不同程度的自治性,从具有充分的场地自治到 几乎是完全集中式的控制。
系统经济,可靠性高,可用性好。与一个大型计算机支持一个大型的冀中是数据库在加一些进程和远程终端相比,由超级微型计算机或超级小型计算机支持的 分布式数据库系统往往具有更高的性价比和实施灵活性。分布式系统比集中式系统具有更高的可靠性和更好的可用性。如由于数据分布在多个场地并有许多复制数 据,在个别场地或个别通信链路发生故障时,不致于导致整个系统的崩溃,而且系统的局部故障不会引起全局失控。
在一定条件下响应速度加快。如果存取的数据在本地数据库中,那末就可以由用户所在的计算机来执行,速度就快。
可扩展性好,易于集成现有系统,也易于扩充。
对于一个企业或组织,可以采用分布式数据库技术在以建立的若干数据库的基础上开发全局应用,对原有的局部数据库系统作某些改动,形成一个分布式系统。这比 重建一个大型数据库系统要简单,既省时间,又省财力、物力。也可以通过增加场地数的办法,迅速扩充已有的分布式数据库系统。
分布式数据库,采用分库分表方式提供可扩展的服务容量和存储容量,采用数据库代理方式提供数据透明访问及平滑扩缩容能力。
传统集中式数据库的问题——容量瓶颈: 随着数据量和访问量的增长,单机数据库会遇到很大的挑战,依赖硬件升级并不能完全解决问题。
传统数据库容量扩展往往意味着服务中断,很难做到业务无感知或者少感知。当业务数据和访问量增加到一定量时,传统数据库需要依赖特定的高端存储和小型机设备,再加上版权及服务费用,成本快速上升。
分布式数据库可以降低企业成本:使用廉价X86+廉价存储+开源软件及自研结合的“去IOE”模式 ,相比商业产品大幅节约企业投入。
通过实现数据访问节点的动态平滑扩缩容,应对峰值流量。可以更好的支撑未来业务量的快速发展以及各种异常变化,提升业务满意度。
不同的架构都有其各自的优势,而用户的复杂商业问题往往需要应用到多种架构的系统,目前市面上很少有能提供多架构的数据库产品,已知的有亿信的petabase。
PetaBase是基于开源平台基础上开发的、具有软件著作权的国产分布式数据库系统产品。PetaBase被设计为全新的SQL on Hadoop解决方案,在开源SQL引擎之上进行了大量SQL功能增强和性能优化,性能提升数倍甚至上百倍,并且集成多项管理工具,使其更适合在Hadoop上进行大规模数据分析、检索、查询。
国产分布式数据库
PetaBase-i 是基于开源平台基础上开发的、具有软件著作权的国产分布式数据库系统产品。PetaBase-i 被设计为全新的SQL on Hadoop解决方案,在开源SQL引擎之上进行了大量SQL功能增强和性能优化,性能提升数倍甚至上百倍,并且集成多项管理工具,使其更适合在Hadoop上进行大规模数据分析、检索、查询。
PB级数据处理
PetaBase-i 采用MPP架构,及优化的列存储格式,结合存储分区、分布式缓存等技术,并针对特定SQL和函数进行性能优化,充分利用集群多节点的计算能力和内存,能支持复杂的多表JOIN。10亿级数据规模以上,比传统RDBMS数据库快10倍以上,TB级数据规模下,比Hive快数倍甚至上百倍。PetaBase-i 动态线性扩展能力,更可满足PB级以上大规模数据的处理。
线性扩展高弹性
PetaBase-i 支持线性扩展,具有高可伸缩性,随着集群节点数的扩充,其查询并发能力将随节点数增加而增大。而查询的响应时间,也会随着节点数的增多而缩短。
PetaBase-i 为主/从模式的集群架构,主节点上保存有系统元数据,但是当主节点挂掉时,整个集群都无法使用,为此,PetaBase-i 支持配置为高可用的部署模式,即将单台主节点架设为二台主节点,一台处于活动状态,一台处理待命状态,从而保证系统的高可用性和高稳定性。
简单易用快速交付
作为一款通用的国产数据库产品,PetaBase-i 兼容标准的SQL语法,提供多种应用程序接口,包括JDBC、ODBC、CLI、Thrift等,因此能支持几乎所有的ETL工具产品。基于这些特性,用户基于传统数据库开发的应用系统可无缝迁移到PetaBase-i ,从而降低企业对系统移植的转化成本,同时让客户的现有数据库开发人员拥有通过SQL就可以使用Hadoop的技术能力,加速PetaBase-i 应用项目的快速落地。
为了让数据库的管理更易用,PetaBase-i 提供可视化监控仪表盘、集中化集群管理、类PL/SQL Developer IDE的数据库管理等功能,方便管理人员即时了解整个数据库系统的整体运行和资源使用情况,便于必要时采取相应的措施。
工程化部署轻运维
相比开源软件,PetaBase-i 具有集成化优势,内置Hadoop基础组件、支持多种策略的负载均衡、SQL语句和JDBC驱动双向优化、独有的可视化管理控制台、数据迁移工具、友好的安装脚本等,从整体上节省软件开销,降低使用和运维门槛,方便、有效的保证大数据系统的落地部署,工程化实施。
批流一体化
PetaBase-i 借鉴大数据处理架构Lambda,将变化的数据并行写到批和流处理系统内,将不同的计算逻辑分别在流和批系统中实现,并且在查询阶段合并流和批的计算视图并展示给用户。
其基于Hadoop开源组件打造的可以复用、简化的大数据实时分析架构模式,架构方案即开即用,易搭建免运维,可提供TB级以上的结构化数据存储、秒级延迟的服务能力,支持用户以流式消费或批处理方式写入实时数据和存量数据,并对结果视图进行实时查询和分析,轻松应对离线实时一体化,真正意义上满足了用户对不断变化的历史数据和实时数据的分析需求。
领取专属 10元无门槛券
私享最新 技术干货