更重要的是CDC 对于系统的更改会比较少,并且不会太大影响数据库的性能.
实际上也有其他的方式来进行数据同步,例如有些数据库的binlog 和 trigger 都可以对数据库的数据进行捕捉和记录....基本上可以通过这样的数据记录配合其他程序来获取PG某张表的数据变动的情况,辅助自研的程序去捕捉这张表中的数据对需要同步数据到其他数据库,提供了一种方式....实际上这里主要应用的是PG 的逻辑复制,逻辑复制相对于PG的物理复制要灵活,例如数据的聚合
?
实际上这个方式稍加利用就可以成为一个以PG数据库为基础的整体的数据汇聚和数据分发的平台....首先通过PG 本身的逻辑复制,将需要在多个数据库系统(一般是不同业务系统的数据库)将这些需要数据分析的表进行逻辑复制到PG 汇聚的机器上,然后产生CDC的数据,通过程序二次开发的方式将这些数据任意存储到其他的数据库或大数据平台...,这样的好处也是显而易见,由于现在ETL抽取数据时,大部分的ETL支持软件(实时数据)的软件并不是太多并且基本没有免费的,这样做基本上就可以支持一个业务实时数据分析的需求.