我们目前的postgresql是主从流复制模式,standby没有对外提供服务,只当做热备用。
机器环境说明:
postgres版本 10
切换前的拓扑关系:
master: 10.0.20.25
standby: 10.0.20.26
操作前,先切换到 postgres 账号:
10.0.20.25 停主库:
psql
select pid,datname,usename,client_addr,client_port, application_name from pg_stat_activity; -- 查看当前连接
然后,通知SA 将当前主库从SLB上剔除掉,阻止用户新的连接进来。
select pg_terminate_backend(pid) from pg_stat_activity where usename='admin' ; -- 杀死admin账户的当前连接(我这里业务账号用的是admin)
/usr/pgsql-10/bin/pg_ctl stop -m fast -D /var/lib/pgsql/10/data/ -- 关闭当前master节点的pgsql进程
10.0.20.26 激活成为新主库 :
/usr/pgsql-10/bin/pg_ctl promote -D /var/lib/pgsql/10/data/
10.0.20.26 检查 新主库是否提升成功:
/usr/pgsql-10/bin/pg_controldata -D /var/lib/pgsql/10/data/ | grep cluster
Database cluster state: in production -- 说明: 如果值为 "in production" 说明是主库,如果值为 "in archive recovery" 说明是备库。
在 10.0.20.26 上创建一个测试表,用于稍后验证新的复制是否正常
create table test_t1(a int );
insert into test_t1 select 100;
select * from test_t1;
10.0.20.25 使用pg_rewind 变成新的从库:
/usr/pgsql-10/bin/pg_rewind --target-pgdata /var/lib/pgsql/10/data/ --source-server='host=10.0.20.26 port=5432 user=postgres dbname=postgres password=postgres' -P
-- 说明: 这里10.0.20.26上的postgres用户的密码是postgres,需要根据自己的情况来写pg_rewind的情况
10.0.20.25 上查看postgresql.conf 有几个地方要进行修改
max_connections = 200 # 一般查多于写的应用从库的最大连接数要比较大
hot_standby = on # 说明这台机器不仅仅是用于数据归档,也用于数据查询
max_standby_streaming_delay = 30s # 数据流备份的最大延迟时间
wal_receiver_status_interval = 10s # 多久向主报告一次从的状态,当然从每次数据复制都会向主报告状态,这里只是设置最长的间隔时间
hot_standby_feedback = on # 如果有错误的数据复制,是否向主进行反馈
10.0.20.25 上编写 recovery.conf 文件 内容如下:
recovery_target_timeline = 'latest'
standby_mode = on
primary_conninfo = 'host=10.0.20.26 port=5432 user=replica password=replica'
10.0.20.25 新的从库上启动pgsql
/usr/pgsql-10/bin/pg_ctl start -D /var/lib/pgsql/10/data/
10.0.20.26 新的主库执行:
\x
select * from pg_stat_replication;
10.0.20.26 新的主库执行插入操作:
insert into test_t1 select 1;
select * from test_t1;
然后,在主库、从库 查询复制状态:
select txid_current_snapshot();