Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >未来数据库需要关心的硬核创新

未来数据库需要关心的硬核创新

原创
作者头像
DataFunTalk
发布于 2022-07-24 06:00:57
发布于 2022-07-24 06:00:57
8530
举报
文章被收录于专栏:DataFunTalkDataFunTalk

分享嘉宾:刘冰冰 亚马逊云科技

编辑整理:张了了 聚水潭

出品平台:DataFunTalk

导读:数据库经过了几十年的发展,目前已经是一项非常成熟的技术,然而随着当今互联网的极速增长,我们进入到云时代,企业亟需构建现代化的应用,因此数据库有了更大的挑战。今天结合当前时代的发展和趋势,分享未来数据库需要关注的硬核创新。

今天的介绍围绕以下几部分展开:

  • 趋势——数据库自由和创新
  • 数据库硬核创新——云原生数据库
  • 数据库硬核创新——云原生数据库迁移利器
  • 问答

--

01 趋势——数据库自由和创新

1. 数据需求快速扩张

当今社会IT的快速发展,对诞生于20世纪70年代初的数据库技术提出了更高的要求。

  • 在互联网和IOT设备的推动下,各企业所管理的数据量每5年就会有10倍的增长,数据急剧增长已经成为发展的一个必然结果。
  • 同时,随着微服务技术的产生,在减少“通用型”数据库需求的同时,增加了实时监控和分析需求,这种方式促进了现代化的应用开发,也增加了数据的产生。
  • 从传统的IT到开发运维的过渡加快了变革速度,使得整体开发周期更短,也推动了数据增长的速度。

2. 数据飞轮

不可否认的是当今时代数据已经成为企业最宝贵的资产,数据库作为存储和管理数据的载体,合理利用可以使企业的数据飞轮转起来,充分发挥数据的价值,使数据转化为业务洞察来指导企业发展。

  • 数据库在企业存储和分析、现代化支撑方面起到了非常重要的作用,因此数据库需要做出更多创新;摆脱传统数据库的使用方式,通过迁移上云的方式来实现托管服务,然后基于数据库构建现代化云数据库,基于数据驱动的应用,把数据转化为洞察。
  • 数据库的现代化过程,对企业也非常重要。数据基础设施的建设,数据库的支撑以及数仓的构建可以使企业中的数据充分流转,发挥出应有的价值。

3. 本地管理数据库挑战

很多企业目前还是在自己的IDC数据中心去管理数据库,会有很多挑战,主要有以下几种:

  • 安装数据库,硬件和软件安装;
  • 数据库配置、补丁修复和备份;这些数据库的工作繁琐,使得大多数数据库管理人员无法抽出精力去实践现代化的方式;
  • 集群配置和数据复制保证高可用性;
  • 计算和存储的容量规划和扩展集群。

很多用户在使用传统关系型数据库,面临着成本高、license惩罚性许可导致的不方便、管理复杂等问题。

4. 传统数据库的缺陷

很多用户使用传统的关系型数据库都会遇到这些挑战:成本高昂、技术专有化、管理数据库的学习成本高、管理工作复杂,还会遇到License的限定等问题。

5. 趋势-利用云创新挣脱束缚

基于以上挑战,目前越来越多用户希望利用云的资源来实现数据库的创新,包括:

  • 规模性能:基于业务扩展实现自由扩展。
  • 成本效益:通过按需使用、按需支付来实现成本的节约。
  • 完全托管:消除管理复杂性并自动拓展。
  • 可靠:拥有受保护、可拓展且安全的应用程序,实现同城、异地灾备无缝恢复。

--

02 数据库硬核创新——云原生数据库

1. 对云原生的理解

云原生数据库是一种构建和运行都充分利用云计算模型优势的构建数据库的方法。亚马逊云科技VP Adrian Cockcroft提出,云原生架构充分利用按需交付、全球部署、弹性和更高级别的服务,它们大大提高了开发人员的开发效率、业务敏捷性、可拓展性、可用性,资源利用率和成本节约。

我们把客户对云的接受分为了云好奇、云亲近和云原生三个阶段。

和数据库相结合,再去理解云原生,就是利用云上的创新的技术和架构赋能数据库,让数据库有更好的敏捷性、扩展性、高性能,从而实现全球部署、按需交付和弹性,以及高可用性。

2. 云原生数据库 Amazon Aurora

基于以上理解,亚马逊发布了业界第一个云原生数据库Amazon Aurora,这也是亚马逊云科技历史上用户数量增速最快的云服务。它具有如下优势:

  • 媲美高端商业数据库的速度与可用性
  • 媲美开源数据库的简单性和成本效益
  • MySQLpostgreSql全面兼容
  • 按使用量计费的简单定价模式
  • 适用于所有传统关系型数据库应用的场景
  • 以完全托管服务形式交付

Amazon Aurora的特点

  • 高可用

可以实现最多可容忍AZ+1失效的高可用性,设计面向金融级跨3个AZ的数据库,同时提供了Global Database完成跨区域灾备。

  • 高性能

可获得5倍于标准MySQL以及3倍于标准postgreSql的吞吐量,并行查询加速联机分析处理。

  • 可拓展性

15个只读副本实现扩展性,Aurora Serverless来实现无服务器架构按需、自动拓展的数据库服务,可以实现无业务时自动关闭、按需启动数据库;同时拥有128T的存储。

  • 成本低廉

提供商用级数据库性能的同时,成本仅为传统商业版数据库1/10,存储无需预置,按量付费。

② 设计原则及架构

  • 计算和存储分离

基于计算层和存储层分别进行拓展,计算拓展8-10分钟。

消除了数据库这端很多脏页回写到存储的动作,变化的日志流存储到共享储存卷来处理。

  • 保证了数据的高持久性

每个AZ存两份数据,即跨三个AZ存储6个数据副本,做到了保障开箱即用金融级别的高可用性,如果有一个AZ故障,依然可以保证4/6副本,保持可写的状态;如果有AZ+1故障,依然有3份副本,不会有数据丢失,可以通过幸存的3副本恢复损坏的副本来恢复写能力;如果面临整个区域故障,Global Database提供了跨区域的灾备能力。

我们把很多数据库计算的动作下推到智能的存储引擎。计算与存储解耦,计算层和存储层可根据各自需求进行扩展。无论数据量多大,计算扩展速度可以很快。

③ Amazon Aurora 提供极致可用性

Aurora实现了开箱即用金融级的高可用性。如果一个数据中心宕掉了,再加上另一个AZ里的一份数据宕掉了,数据库仍然可以访问。因为在数据层面,是把数据打散,10GB为一个单元,每个数据有6份拷贝,每个AZ是两份,这样可以保证面临AZ+1故障时,仍然有3份拷贝可读。同时,我们还通过Global Database提供了跨区域的灾备。

④ 客户案例

九州通B2B系统的业务特点是读多写少,之前遇到过以下挑战:

  • 受业务影响经常会出现波峰波谷落差较大的情况
  • 自建MySQL主从库数据复制延迟超过1秒,读写分离效果不好,主库压力大
  • 数据库管理员需要预先配置资源来应对高峰,高峰过后又会产生成本和资源浪费的情况

使用了Aurora之后明显有了提升,主要体现在以下几方面:

  • 整体数据库性能提升了5倍,TCO降低了50%,实现了跨可用区部署、负载均衡、自动故障转移、精细监控、按需自动伸缩等。
  • 轻松实现了数据库的读写分离及按需拓展,Auto Scaling功能实现只读副本按需拓展,满足业务需求的同时节省服务器成本。
  • 主从节点间的延迟保持在20毫秒左右,可以把更多查询操作放在从库执行。

上图中可以看到,原来的自建Mysql需要把资源开的很高,来应付业务高峰时的负载。而Aurora按需而动,在高峰来临时扩展读副本,负载下降后再回缩读副本,有非常好的伸缩性。

⑤ Aurora Serverless

Aurora Serverless是Aurora提供的无服务架构,扩展性有了更高提升,可以实现以下功能:

  • 按需启动数据库,无业务时自动关闭
  • 自动拓展、无需管理数据库实例
  • 按使用的数据库资源以秒计费

目前Serverless 已经升级到了V2,提供了预览版本,相比V1,有更好的拓展性,不到1秒的时间内可以从数百个事务拓展到数十万个事务,同时基于ACU的拓展,方式更精细化,比传统的预置引擎的方式有更高成本的节省;同时提供所有的Aurora功能,满足业务关键型应用程序的需求。

⑥ Aurora Global Database

现代化应用的全球部署,需要通过构建数据库:

  • 在发生地区级的中断时提供灾难恢复能力,提升全球业务连续性
  • 让数据更靠近各个地区的用户,提升用户访问体验

在现代化应用中,需要通过构建数据库实现跨区域的容灾,提升全球业务连续性及用户访问体验。Aurora Global Database是针对全球分布式应用程序而设计的高性能数据库,有以下特点

  • 单个Aurora数据库跨越多个AWS区域
  • 采用物理复制的方式,典型延迟远小于1秒,并且不会影响数据库性能
  • 主从节点分布在不同区域
  • 写转发+辅助区域将写入操作透明发送给主区域
  • 为全球化应用提供低延迟的快速本地数据读取

虎牙直播数据库后台动态信息由Amozon DynamoDB存储,相对静态的信息则存储在Aurora上。

使用了Aurora之后明显有了提升,主要体现在以下几方面:

  • 性能提升:Aurora能自动扩容,且计算和存储分离,数据量较大时单独升级计算实例来确保性能,与MySQL相比,有5倍以上的性能提升。
  • 支持故障转移:异常情况下,只需要10秒左右就能够自动实现自动故障转移,终端用户无感知。
  • 本地用户体验提升:利用Global Database功能,在AWS亚太区域部署数据库,并在其他区域建立副本,大大提升了用户体验。

--

03 云原生数据库迁移利器

迁移对于企业来说是面临的一个较大挑战,怎么无缝实现从传统的数据库迁移到云上?下面来介绍另一个硬核创新,云原生数据库迁移利器。

① 挑战

以微软SQL Server迁移到Aurora PGSQL为例:

  • 数据模型的实现可以通过AWS Schema Conversion Tool来实现。
  • 数据的迁移可以通过AWS Database Migration Service。
  • 而SQL Server应用逻辑、存储过程、以及前端应用的T-SQL的实现需要花费更多的时间。

② Babelfish for Aurora PostgreSQL

它能够原生地支持对T-SQL语言的理解,同时支持SQL Server协议访问,这样使得迁移时间大大缩短。迁移后,既可以访问原有的SQLServer代码,又可以利用PostgreSQL编写新的功能,并且两者之间可以进行调用。

我们也已将Babelfish for PostagreSQL项目开源。

③ Babelfish部署模型

  • 可以使用SQLserver数据库驱动程序开发T-SQL中的功能
  • 使用开源驱动程序在Postgresql中开发新功能
  • Postgresql和T-SQL两个引擎的存储过程和函数可相互无缝调用

Bebelfish是SQL server迁移加速器,在Aurora Postgresql内置引擎中增加了三个拓展包来实现TDS协议和T-SQL的支持,同时在Aurora PG引擎中增加两个EndPoint监听,以达到提供正确的T-SQL执行的目的,底层通过实现1433端口的监听来支持传统的SQL server的T-SQL调用和TDS协议,5432端口的监听来支持传统的Postgresql的调用。

④ 迁移流程

  • 首先通过SQL server Management Studio取出对应的DDL;
  • 然后使用Babelfish罗盘评估匹配度,目前测试通常SQL Server DDL与Babelfish匹配度高达80%及以上;
  • 对于不匹配的部分进行微调,然后直接创建在Bebelfish for Aurora Postgresql进行执行;
  • 数据方面通过DMS进行迁移;
  • 经过充分测试后,就可以实现将SQL server的应用由SQL server引擎指向Bebelfish for Aurora Postgresql完成最终的迁移。

--

04 问答环节

Q:Aurora后续有开源的计划吗?

A:我们目前已经把一些Aurora相关的项目在开源,例如Babelfish for Aurora PostgreSQL , 希望能将亚马逊云科技更多技术赋能客户和开源社区,助力客户和开源社区持续的技术创新。

Q:Aurora底层的存储复制使用的技术?

A:Aurora存储层复制使用Quorum协议实现,把数据块划分为10GB为一个单元,每份数据6份副本,将6个副本存储在3个AZ,为了满足一致性,需要满足两个条件,首先Vr + Vw > V,V=6,Vw=4,Vr=3,Aurora可以实现开箱即用的金融级高可用性 (跨3个AZ,最多可容忍AZ+1故障):Aurora可以容忍任何一个AZ出现故障,不会影响写服务;任何一个AZ出现故障,以及另外一个AZ中的一个节点出现故障,不会影响读服务且不会丢失数据。

今天的分享就到这里,谢谢大家。

分享嘉宾:

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
​深度解读腾讯云云数据库:赋能数据管理与业务创新
在当今的数字化时代,数据已成为企业最重要的资产之一,如何高效、安全地存储、管理和利用这些数据,是每一个开发者和企业都需要面对的挑战。腾讯云作为领先的云计算平台,其云数据库产品为各类企业和开发者提供了强大的数据管理解决方案,不仅提升了数据的存储和处理效率,还在多个业务场景中展现了广泛的应用价值。本文将围绕腾讯云云数据库的产品能力、应用场景、业务价值和技术原理进行深入解析,并为新手开发者提供操作指引。
Undoom
2024/10/21
3150
国产数据库:目前最火的五款国产数据介绍
随着互联网的高速发展,目前数据的存储越来越多,传统的数据库逐渐不能满足人们对海量数据、高效查询的需求,国产的数据库如雨后春笋一样,一个个冒了出来来解决我们高速科技发展的数据库瓶颈,今天就给大家聊一聊目前最火的五款国产数据库,大家一起来学习一下。
小明互联网技术分享社区
2022/10/31
50.5K0
国产数据库:目前最火的五款国产数据介绍
数据库的下一场革命:S3 延迟已降至原先的 10%,云数据库架构该进化了
众所周知,在数据库的历史上,每次存储介质的变化都会引发软件的变革。从 SAN 存储到 SSD 到大内存到 NVM,都触发了数据库内核从理论到工程的演进。
深度学习与Python
2023/12/28
3590
数据库的下一场革命:S3 延迟已降至原先的 10%,云数据库架构该进化了
云原生数据库的到来
云原生数据库是一种通过云平台进行构建、部署和分发的服务。作为一种云平台,云原生数据库以PaaS的形式进行分发,也经常被称作DBaaS;用户可以将该平台用于多种目的,例如存储,管理和提取数据。
程序大视界
2022/09/22
1.5K0
云原生数据库的到来
历经半个多世纪的数据库 未来还有什么值得期待?
其中,有以MySQL、Oracle、PostgreSQL为代表的传统产品,也有以Aurora、Spanner等为代表的创新路线产品,还有工业数据库、时序数据库、图数据库等面向应用场景的产品。
科技云报道
2022/04/16
3060
历经半个多世纪的数据库 未来还有什么值得期待?
一个 Babelfish ,看懂云数据库的发展方向 | Q推荐
作为基础软件皇冠上的明珠,数据库技术一直以来都是开发者关注的焦点。这关注度是如此之高,几乎自然打通了学界和产业界的隔阂,以至于关于数据库技术的每一篇重要论文面世,都可能导致一批价值数十亿美金的公司出现。
深度学习与Python
2021/12/01
8500
一个 Babelfish ,看懂云数据库的发展方向 | Q推荐
云原生数据库的下一次变革发生在哪里?| Q推荐
自上世纪 70 年代以来,关系型数据库进入历史舞台,成为数据库行业的主角。此后,这个行业步入一个黄金时代,某数据库专家曾撰文写道,“很长一段时间,关系型数据库几乎是包打天下的选择。你很可能用一套数据库玩转所有业务,你也不需要一个连的工程师来维护它”。
深度学习与Python
2022/06/11
2.3K0
云原生数据库的下一次变革发生在哪里?| Q推荐
招商银行 | 基于 K8S+DOCKER 构筑容器数据库平台建设及应用实践
招行ACS私有云上线投产后, MySQL作为云上主要服务的RDS数据库服务,规模急剧增长且部分承载着分行核心业务,对业务连续性要求也越来越高,因此迫切需要建立并完善云MySQL支持服务体系和提升MySQL服务能力。
爱可生开源社区
2021/09/08
2.2K0
招商银行 | 基于 K8S+DOCKER 构筑容器数据库平台建设及应用实践
亚马逊云科技数据库的五大核心理念,为企业上云发展助阵
——聚焦数智 · 改变商业 近日,走过十个年头的亚马逊re:Invent大会今年落下帷幕,亚马逊云科技发布了包括云数据库在内的一系列重塑未来的创新技术与服务,并邀请全球各行各业的客户及亚马逊云科技合作伙伴分享前沿商业创新实践,继续引领云技术和产业未来发展的风向。
数据猿
2021/12/14
7850
亚马逊云科技数据库的五大核心理念,为企业上云发展助阵
从Aurora最新产品看Serverless发展
就在不久前,AWS发布了其重量的数据库产品-Aurora Serverless形态的最新预览版本:Aurora Serverless V2。其对云数据库产品发展带来很大的引领意义。本文将从Aurora Serverless V2的能力谈起,并谈谈数据库产品Serverless的发展趋势。
jeanron100
2021/04/22
1.1K0
从Aurora最新产品看Serverless发展
Amazon Aurora:云时代的数据库 ( 上)
导语:文章是 Amazon 在SIGMOD'17 上最新发表的关于 Aurora论文的翻译版本,详尽的介绍了 Aurora 设计背后的驱动和思考,以及如何在云上实现一个同时满足高并发、高吞吐量、高稳定
谭伟华)
2017/08/02
6K0
Amazon Aurora:云时代的数据库 ( 上)
数据库技术新版图-Serverless数据库 | Q推荐
数据库的发展已走过近四十年,作为基础软件之一,数据库称得上是一个“古老”的领域。而随着新技术的涌现,这个传统的领域也正不断焕发出新的生机。如果说云时代的到来推动了数据库的变革,那么,与 Serverless 的结合,则再次为数据库的发展添了把火。Serverless 数据库会成为未来的趋势吗?又该如何让 Serverless 数据库从概念走向落地?亚马逊云科技 Tech Talk 特别邀请资深数据库专家马丽丽带来分享《 Serverless 数据库为应用开发带来的变革》。
深度学习与Python
2022/04/19
1.2K0
数据库技术新版图-Serverless数据库 | Q推荐
Amazon Aurora:云时代的数据库 ( 下)
本文介绍了云数据库在云原生应用中的重要性,并探讨了Aurora在云数据库中的特殊地位。作者通过回顾Aurora的设计、架构、性能和成本优势,以及它在云原生应用和微服务架构中的使用,展示了Aurora在云数据库领域中的领导地位。此外,文章还介绍了Aurora在Google Cloud Platform和Amazon Web Services中的使用情况,以及Aurora未来的发展方向。
谭伟华)
2017/08/04
2K0
Amazon Aurora:云时代的数据库  ( 下)
聊聊云原生数据库的一致性
Raft or not? 为什么 Consensus-based replication 不是分布式数据库日志复制的银弹? 背景 近期在跟团队同学聊天的过程中,听到了这样一句观点: “我们团队目前的技
Zilliz RDS
2022/05/25
6340
聊聊云原生数据库的一致性
必选云原生数据库的原因
云原生数据库是一种云原生数据基础设施,是一种完全利用公有云优势的数据库服务,具备极致的弹性伸缩能力、无服务器(Serverless)特性、全球架构高可用与低成本,并可以与云上其他服务集成联动。
三掌柜
2023/09/15
3750
必选云原生数据库的原因
腾讯云数据库产品介绍
腾讯云上有许多种数据库产品,本文简单介绍每种产品的介绍,特性,应用场景等,帮助各位根据业务需要选择最适合的数据库。
scarlett学习手册
2019/12/12
12.3K0
腾讯云数据库产品介绍
不知道CynosDB为什么叫真正的云原生数据库?腾讯云数据库的产品欧巴今天跟你聊一聊
注:本文摘自2018年11月22日腾讯云数据库CynosDB新品发布会的演讲实录。随着互联网信息的发展,大家也对云这个词汇也不是特别陌生了,作为全球首选的云服务厂商之一的腾讯云,依托腾讯多年的业务积累和技术沉淀,我们推出了高性能、低成本、安全可靠的整体数据服务解决方案。并且随着客户数据日益增长,也做了相关的调研和分析,推出了腾讯云新一代自研数据库。我这里先卖一个关子,由我们这边的技术嘉宾给大家揭晓我们相关的数据库内容。
腾讯云数据库 TencentDB
2018/11/28
1.5K0
不知道CynosDB为什么叫真正的云原生数据库?腾讯云数据库的产品欧巴今天跟你聊一聊
深度解析腾讯云的国内首款Serverless数据库
2020年4月7日,腾讯云正式发布了国内首个Serverless数据库产品--PostgreSQL for Serverless。该数据库不需要用户创建实例,完全基于Serverless架构,最快能够1秒钟内完成部署。用户使用该数据库完全按照实际使用量付费,成本降低70%。
用户1564362
2020/04/15
1.9K0
揭开微盟百万商家营销大战背后的数据库秘密
又到了双十一、双十二、年终大促季,每年这个时候都是购物狂欢节,不仅促销产品多、种类全、覆盖面广,促销花样也在不断翻新,直播、砍价、优惠券、加价购等,令人眼花缭乱。 当全国人民沉浸在买买买的自嗨中无法自拔时,考验的不仅是百万商家的战略战术,更是各种技术平台的实力比拼,尤其是底层的数据库,将迎来流量峰值期间的高并发和快速响应挑战。 高并发业务场景下 快速、弹性扩缩容调整 (微盟产品和服务布局) 以微盟为例,公司承载的是多渠道的广告营销业务,提供和各个细分领域相关的垂直SaaS解决方案及服务。比如:双11期
腾讯云数据库 TencentDB
2021/11/12
2.2K0
一文剖析高可用向量数据库的本质
面对因电力故障、网络问题或人为操作失误等导致的服务中断,数据库系统高可用能够保证系统在这些情况下仍然不间断地提供服务。如果数据库系统不具备高可用性,那么系统就需要承担停机和数据丢失等重大风险,而这些风险极有可能造成用户流失,从而使数据库系统蒙受经济和声誉上的损失。
Zilliz RDS
2024/07/31
2691
一文剖析高可用向量数据库的本质
推荐阅读
相关推荐
​深度解读腾讯云云数据库:赋能数据管理与业务创新
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档