副本集环境的搭建以及一些基本的操作我们都了解了,本文我们来看看这个数据复制到底是怎么实现的。
本文是MongoDB系列的第十七篇文章,了解前面的文章有助于更好的理解本文:
数据同步方式
MongoDB中的复制功能主要是使用操作日志oplog.rs来实现的,oplog.rs包含了主节点的每一次写操作,oplog.rs是主节点中local数据库的一个固定集合,我们可以通过如下命令查看到:
如下:
备份节点通过查询这个集合就知道要复制哪些数据,同时,每一个备份节点也都维护着自己的oplog.rs,自己的oplog.rs则用来记录每一次从主节点复制数据的操作,如此,每一个备份节点都可以再作为数据源提供给其他成员使用,如果某一个备份节点在使用的过程中挂掉了,那么当它重启之后,会自动从oplog.rs的最后一个操作开始同步。
上文我们也已经说过oplog.rs是一个固定集合,我们可以通过这个命令来查看这个固定集合的属性,包括集合大小等,执行部分结果如下:
既然是固定集合,它里边能够保存的数据大小就是有限的。通常,oplog.rs使用空间的增长速度与系统处理处理写请求的速率近乎相同,比如主节点每分钟处理了1KB的写入请求,那么oplog.rs也可能会在一分钟内写入1KB条操作日志,但是如果主节点执行了批量删除的命令,比如下面这种:
此时每一个受影响的文档都会产生一条oplog中的日志,这个时候oplog.rs中的日志会快速增加。
成员状态
到目前为止我们了解到的成员状态有两种,一个是PRIMARY,还有一个是SECONDDARY,成员状态的获取需要靠心跳来维护,副本集中的每一个成员每隔两秒就会向其他成员发送一个心跳请求,用来检查成员的状态,成员的状态主要有如下几种:
STARTUP
副本集中的成员刚刚启动时处于这个状态下,此时,MongoDB会去加载成员的副本集配置,配置加载成功之后,就进入到STARTUP2的状态。
STARTUP2
整个初始化同步过程都处于这个状态。
RECOVERING
这个状态是由STARTUP2状态来的,此时成员运转正常,但是此时还不能处理读取请求。
ARBITER
这是仲裁者所处的状态。
DOWN
当一个原本运行正常的成员无法访问到时,该成员就处于DOWN的状态。
UNKNOWN
如果一个成员无法到达其他任何成员,该成员就处于UNKNOWN状态,比如我们利用rs.add()方法添加一个不存在的成员,这个成员的状态就是UNKNOWN。
REMOVED
成员被从副本集中移除时就变成这个状态。
ROLLBACK
如果成员正在进行数据回滚,它就处于ROLLBACK状态,回滚结束后会转换为RECOVERING状态。
FATAL
当一个成员发生了不可挽回的错误时,且不再尝试恢复正常的话,就处于这个状态。
主节点转备份节点
通过如下命令可以让主节点转为备份节点:
主节点转为备份节点之后会有新的主节点被选举出来,可以通过rs.status()来查看新的主节点。
rs.status()方法
前面我们已经多次使用过rs.status()方法,rs.status()方法会列出每个备份节点的含义,我们来看看这些参数的含义,先来列出一个rs.status()方法的返回值样例:
1.stateStr用来描述当前节点的状态。
2.uptime表示从成员可达到现在所经历的时间。
3.optimeDate表示每个成员的oplog中最后一个操作发生的时间。
4.lastHeartbeat表示当前服务器最后一次收到其他成员心跳的时间。
5.pingMs表示心跳从当前服务器到达某个成员所花费的平均时间。
6.syncingTo表示同步的数据源。
7.health表示该服务器是否可达,1表示可达,0表示不可达。
复制链问题
数据复制时可以从主节点直接复制,也可以从备份节点开始复制,从备份节点复制可以形成复制链,如果想禁止复制链,即所有的数据都从主节点复制,可以通过chainingAllowed属性来设置,具体步骤如下:
好了,MongoDB中副本集的其他细节我们就先说到这里,小伙伴们有问题欢迎留言讨论。
参考资料:
1.《MongoDB权威指南第2版》
更多资料请关注公众号:
领取专属 10元无门槛券
私享最新 技术干货