Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >源码分析 | 详解 binlog 时间戳与 exec_time 的关系

源码分析 | 详解 binlog 时间戳与 exec_time 的关系

作者头像
爱可生开源社区
发布于 2024-05-20 08:47:08
发布于 2024-05-20 08:47:08
20800
代码可运行
举报
运行总次数:0
代码可运行
作者:李锡超,苏商银行DBA,负责数据库和中间件运维和建设。擅长 MySQL、Python、Oracle,爱好骑行、技术研究和分享。

爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。

本文约 2000 字,预计阅读需要 8 分钟。

1概述

近期,某系统进行测试时,发现主从同步存在延迟,随即通过 binlog 确认延迟原因。当使用 mysqlbinlog 命令解析后,发现其中的信息“似懂非懂”。

例如,对于如下 binlog 片段:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# at 449880
#240430 18:38:49 server id 345  end_log_pos 449967 CRC32 0xb3e8a02a     GTID    last_committed=13       sequence_number=14      rbr_only=yes    original_committed_timestamp=1714473533138376   immediate_commit_timestamp=1714473539246294     transaction_length=446792
/*!50718 SET TRANSACTION ISOLATION LEVEL READ COMMITTED*//*!*/;
# original_commit_timestamp=1714473533138376 (2024-04-30 18:38:53.138376 CST)
# immediate_commit_timestamp=1714473539246294 (2024-04-30 18:38:59.246294 CST)
/*!80001 SET @@session.original_commit_timestamp=1714473533138376*//*!*/;
/*!80014 SET @@session.original_server_version=80027*//*!*/;
/*!80014 SET @@session.immediate_server_version=80027*//*!*/;
SET @@SESSION.GTID_NEXT= 'c0ac4587-6046-11ee-9fa7-001c42c92a7b:44'/*!*/;
# at 449967
#240430 18:38:16 server id 345  end_log_pos 450039 CRC32 0x0c7cb74e     Query   thread_id=16    exec_time=37    error_code=0
SET TIMESTAMP=1714473496/*!*/;
BEGIN
/*!*/;
/*!*/;
# at 450039
#240430 18:38:16 server id 345  end_log_pos 450098 CRC32 0xf9a84808     Table_map: `testdb`.`tb3` mapped to number 110
# at 450098
#240430 18:38:16 server id 345  end_log_pos 458309 CRC32 0xad84e9b0     Write_rows: table id 110
...
# at 896439
#240430 18:38:46 server id 345  end_log_pos 896498 CRC32 0x5cd7cd3b     Table_map: `testdb`.`tb3` mapped to number 110
# at 896498
#240430 18:38:46 server id 345  end_log_pos 896540 CRC32 0x21b77031     Write_rows: table id 110 flags: STMT_END_F
...
### INSERT INTO `testdb`.`tb3`
### SET
###   @1=131060 /* INT meta=0 nullable=0 is_null=0 */
###   @2='c' /* VARSTRING(80) meta=80 nullable=1 is_null=0 */
# at 896540
#240430 18:38:49 server id 345  end_log_pos 896599 CRC32 0x6d6bf911     Table_map: `testdb`.`tb3` mapped to number 110
# at 896599
#240430 18:38:49 server id 345  end_log_pos 896641 CRC32 0xccd2fbb1     Write_rows: table id 110 flags: STMT_END_F
...
### INSERT INTO `testdb`.`tb3`
### SET
###   @1=131061 /* INT meta=0 nullable=0 is_null=0 */
###   @2='c' /* VARSTRING(80) meta=80 nullable=1 is_null=0 */
# at 896641
#240430 18:38:49 server id 345  end_log_pos 896672 CRC32 0xadb14b9d     Xid = 85

通过以上 binlog 可知(P1):

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#240430 18:38:16 执行 begin 开启了事务  (为便于表述,将时间字段名为timestamp)
#240430 18:38:16 执行了 tb3的insert 操作
#240430 18:38:46 执行了 tb3的insert 操作
#240430 18:38:49 执行了 tb3的insert 操作
#240430 18:38:49 执行了commit操作

此外(P2):

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
original_commit_timestamp=2024-04-30 18:38:53
immediate_commit_timestamp=2024-04-30 18:38:59
exec_time=37

针对 P2 信息,提出如下问题:

  • Q1:P2 中的字段分别表示什么意思?是如何计算的?
  • Q2:P2 的字段和 P1 看到的 timestamp 有什么关系呢?
  • Q4:P1 中的 timestamp 是如何取值的?特别是主从环境下

为此,通过测试验证,并结合源码分析 binlog 中常见 Event 时间与 exec_time 的由来,并总结字段之间的关系。

以下分析基于 MySQL 8.0,不同版本字段可能不同。

2主节点 binlog 日志

1. GTID Event

timestamp

对于主节点:如没有特殊说明,Event 的 timestamp 是在每个线程执行 dispatch_command() 初始位置获取最新时间戳(thd->start_time),并在生产 Event 对象时将 thd->start_time 赋值到 Log_event::common_header->when

主要堆栈信息如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
|-handle_connection (./sql/conn_handler/connection_handler_per_thread.cc:302)
  |-do_command (./sql/sql_parse.cc:1343)
    |-dispatch_command (./sql/sql_parse.cc:1922)
      // 设置 thd->start_time
      |-thd->set_time()
        |-my_micro_time_to_timeval(start_utime, &start_time)
      |-dispatch_sql_command (./sql/sql_parse.cc:5135)
        |-mysql_execute_command (./sql/sql_parse.cc:3518)
          |-Sql_cmd_dml::execute (./sql/sql_select.cc:579)
          ……
                        |-Table_map_log_event the_event(this, table, table->s->table_map_id,is_transactional)
                        ……
                          |-Rows_log_event *const ev = new RowsEventT(this, table, table->s->table_map_id, )
                          ……
                  |-Xid_log_event end_evt(thd, xid)

immediate_commit_timestamp/original_commit_timestamp

immediate_commit_timestamp 获取即为提交时刻的时间戳,主节点 original_commit_timestamp 等于 immediate_commit_timestamp

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
|-error = trx_cache.flush(thd, &trx_bytes, wrote_xid)
  |-Transaction_ctx *trn_ctx = thd->get_transaction()
  |-trn_ctx->sequence_number = mysql_bin_log.m_dependency_tracker.step()
  |-if (trn_ctx->last_committed == SEQ_UNINIT): trn_ctx->last_committed = trn_ctx->sequence_number - 1
  |-if (!error): if ((error = mysql_bin_log.write_transaction(thd, this, &writer)))
    |-int64 sequence_number, last_committed
|-m_dependency_tracker.get_dependency(thd, sequence_number, last_committed)
|-thd->get_transaction()->last_committed = SEQ_UNINIT
    |-ulonglong immediate_commit_timestamp = my_micro_time()
    //|-ulonglong original_commit_timestamp = thd->variables.original_commit_timestamp
    |-ulonglong original_commit_timestamp = immediate_commit_timestamp
    |-uint32_t trx_immediate_server_version = do_server_version_int(::server_version)
    |-Gtid_log_event gtid_event(thd, cache_data->is_trx_cache(), last_committed, sequence_number,
        cache_data->may_have_sbr_stmts(), original_commit_timestamp,
        immediate_commit_timestamp, trx_original_server_version,
        trx_immediate_server_version)

2. BEGIN Event

timestamp

注意:对于主节点 BEGIN event 的 timestamp 并不是执行 BEGIN 时的时间戳,而是执行第一个修改操作。在完成 InnoDB 层第一行数据修改之后,生成并写入 Table_map event。在生成 Table_map event 之前,如果此时整个事务的 binlog 缓存是空的,才会立即获取该操作的 thd->start_time,并生成真正的 BEGIN event。

exec_time

同时,对于主节点的 exec_time 就是在生成 BEGIN Event 的过程中,获取最新的时间戳 - BEGIN Event 的 timestamp 而得。

exec_time = A - B

  • A:执行第一个修改 SQL,完成第一行修改(write/update/delete)操作后,生成 BEGIN Event 的时间。
  • B:第一个修改 SQL 的开始执行时间(thd->start_time)

内部堆栈与执行顺序如下:

3. Table_map Event

4. Write Event

5. Xid Event

6. 主节点小结

  • 除了 BEGIN Event 的 timestamp 是第一个需要写入 binlog 操作(如:write/update/delete)的开始时间;
  • 其它 Event 的 timestamp 为 SQL 语句执行时的开始时间;
  • immediate_commit_timestamp/original_commit_timestamp 即为提交时的时间戳;
  • exec_time = A - B
    • A:执行第一个修改 SQL,完成第一行修改(write/update/delete)操作后,生成 BEGIN Event 的时间。
    • B:第一个修改 SQL 的开始执行时间(thd->start_time)

3从节点 binlog 日志

1. GTID Event

timestamp

在从节点:对于 GTID Event,MySQL 在解析 Event 时,并不会获取主节点 GTID/XID Event 的时间戳,因此会“继承”该事务上一个操作的时间戳。而从节点所有修改操作的时间戳都来自于主节点执行操作时的时间戳。因此从节点的 GTID/XID Event 的时间即为主节点最后一个修改操作的 timestamp。

immediate_commit_timestamp/original_commit_timestamp

immediate_commit_timestamp 获取从节点提交时刻的时间戳。original_commit_timestamp 从 GTID Event 中的 original_commit_timestamp 获取,即为主节点提交操作的 timestamp

主要堆栈信息如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
|-handle_slave_worker (./sql/rpl_replica.cc:5891)
  |-slave_worker_exec_job_group (./sql/rpl_rli_pdb.cc:2549)
    |-Slave_worker::slave_worker_exec_event (./sql/rpl_rli_pdb.cc:1760)
      |-Xid_apply_log_event::do_apply_event_worker (./sql/log_event.cc:6179)
        |-Xid_log_event::do_commit (./sql/log_event.cc:6084)
          |-trans_commit (./sql/transaction.cc:246)
            |-ha_commit_trans (./sql/handler.cc:1765)
              |-MYSQL_BIN_LOG::commit (./sql/binlog.cc:8170)
                |-MYSQL_BIN_LOG::ordered_commit (./sql/binlog.cc:8789)
                  |-MYSQL_BIN_LOG::process_flush_stage_queue (./sql/binlog.cc:8326)
                    |-MYSQL_BIN_LOG::flush_thread_caches (./sql/binlog.cc:8218)
                      |-binlog_cache_mngr::flush (./sql/binlog.cc:1099)
                        |-binlog_cache_data::flush (./sql/binlog.cc:2098)
                          |-MYSQL_BIN_LOG::write_transaction (./sql/binlog.cc:1586)
                            // 生成并写入 GTID event
                            |-ulonglong immediate_commit_timestamp = my_micro_time()
                            |-if (original_commit_timestamp == UNDEFINED_COMMIT_TIMESTAMP){...}
                            |-Gtid_log_event gtid_event(thd, cache_data->is_trx_cache(), last_committed, sequence_number,
                               cache_data->may_have_sbr_stmts(), original_commit_timestamp, immediate_commit_timestamp, trx_original_server_version,
                               trx_immediate_server_version)

公式

immediate_commit_timestamp - original_commit_timestamp = A + B + C

  • A = 主节点 传输 binlog 到 从节点 的耗时
  • B = 从节点 重放 binlog 的耗时
  • C = 同步延迟/中断的耗时

2. BEGIN Event

timestamp

这里的 timestamp 来自于主节点 BEGIN Event 的 timestamp。其实际执行时,是会获取 BEGIN Event 的 timestamp 将其赋值给 thd->start_time/thd->user_time。从节点生成 Event 对象时,继续从 thd->start_time 获取时间戳即可。

exec_time

然后,从节点的 exec_time 依然是生成 BEGIN Event 的过程中,获取 最新的时间戳 - timestamp 而得到(注意这里的 timestamp 来自于主节点修改 SQL 的开始执行时间)。

主要堆栈信息如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
|-handle_slave_worker (./sql/rpl_replica.cc:5891)
  |-slave_worker_exec_job_group (./sql/rpl_rli_pdb.cc:2549)
    |-Slave_worker::slave_worker_exec_event (./sql/rpl_rli_pdb.cc:1760)
      |-Log_event::do_apply_event_worker (./sql/log_event.cc:1083)
        |-Query_log_event::do_apply_event (./sql/log_event.cc:4443)
          |-Query_log_event::do_apply_event (./sql/log_event.cc:4606)
            // 设置 user_time=start_time=ev.common_header->when
            |-thd->set_time(&(common_header->when))
            // query_arg="BEGIN"
            |-thd->set_query(query_arg, q_len_arg)
            ...

公式

exec_time = A + B + C + D

  • A = 主节点 整个事务的耗时
  • B = binlog 传输耗时
  • C = 同步延迟/中断耗时(可能-主要)
  • D = 从节点完成第一行数据修改

original_commit_timestamp - begin event 的 timestamp = 表示主节点整个事务的实际耗时(【主-第一个修改】 到【主- commit 开始】)。

3. Table_map Event

4. Write Event

5. Xid Event

6. 从节点小节

  • 除了 GTID/XID Event,其它 Event 的时间戳均来自于主节点的 Event;
  • GTID/XID Event 的 timestamp 为主节点最后一个修改操作开始时间;
  • GTID Event 的 original_commit_timestamp 来自于主节点,immediate_commit_timestamp 为最新的时间戳;
  • exec_time = A - B
    • A = 从节点 生成 BEGIN Event 的最新时间戳
    • B = 主节点 执行第一个 DML 操作的开始时间

4结语

至此,关于 binlog 中的时间戳与 exec_time 已基本梳理完成,有兴趣的朋友可以回到文章开头,再看看 Q1-Q3 是否有了答案。

最后,建议读者朋友实际模拟几个案例,以便于更加深刻的理解相关字段,后续在利用 binlog 分析主从同步问题时,能更加得心应手。

以上信息仅供交流,作者水平有限,如有不足之处,欢迎在评论区交流。

本文关键字:#MySQL# #binlog# #源码#

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 爱可生开源社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
技术分享 | 八怪:再谈 MySQL 8 这两个精准的时间戳
作者:高鹏(八怪),《MySQL 主从原理》作者,深入透彻理解 MySQL 主从,GTID 相关技术知识。
爱可生开源社区
2023/12/28
4420
技术分享 | 八怪:再谈 MySQL 8 这两个精准的时间戳
mysql binlog日志事件解析
二进制日志(binary log)是mysql的一种日志记录了mysql中的数据变更操作,二进制日志主要有以下作用:
wangwei-dba
2021/06/09
2.6K0
MySQL运维案例分析:Binlog中的时间戳
众所周知,在Binlog文件中,经常会看到关于事件的时间属性,出现的方式都是如下这样的。
博文视点Broadview
2020/06/11
4.4K0
深入理解 MySQL 5.7 GTID 系列(三):GTID的生成时机
其中AUTOMATIC_GROUP通常用于主库开启GTID的情况,GTID_GROUP通常用于备库和使用了GTID_NEXT的情况下。
阿炳数记
2019/02/27
9270
[pymysqlbinlog] 解析binlog中的gtid (GTID_LOG_EVENT,PREVIOUS_GTIDS_LOG_EVENT)
binlog中事务以GTID_EVENT开始, 以XID_EVENT结束, 很多信息都藏在gtid_event中, 比如事务大小, 提交时间等. MTS也会查看gtid中的信息, 还涉及到两阶段提交, 但不是本文的重点, 就不讲了.
大大刺猬
2024/04/19
3490
[pymysqlbinlog] 解析binlog中的gtid (GTID_LOG_EVENT,PREVIOUS_GTIDS_LOG_EVENT)
原创|MySQL binlog时间异常分析
提示:公众号展示代码会自动折行,建议横屏阅读 「第一部分 引言」 在日常运维MySQL的过程中,不知大家是否有留意到,有时会发现binlog中的时间并不是有序的,如果对这种情况感到疑惑,那么本文将能解答你的问题。 「第二部分 时间来源」 每一个event实例都继承自Log_event类,在Log_event的构造函数中会设置event头部的时间: Log_event::Log_event(THD *thd_arg, uint16 flags_arg,
腾讯数据库技术
2022/08/26
1.4K0
原创|MySQL binlog时间异常分析
新特性解读 | MySQL 8 复制延迟观测新方式,更全面更精准
一直以来 MySQL 复制延迟观测是不完善的,既无法观测到真实的主从延迟,也无法支持复杂的复制拓扑环境,常用的 second_behind_master 指标更多是判断是否存在回放延迟,以及趋势变化。你无法直观的观测到事务精确的延迟情况,因为 slave 无法获知事务在 master 上的提交时间。
爱可生开源社区
2020/03/13
8550
mysql误操作binlog恢复
一般正式环境使用数据库都会做全备份,但如果某个时刻数据库崩了,若利用全备份文件恢复,则在全备份到出现问题这段时间内的数据将会丢失,一般来说迫不得已也不会采取这种措施,更直接是采用binlog恢复。
doper
2022/09/26
7830
mysql误操作binlog恢复
通过binlog日志恢复表记录
启用binlog日志 创建db1库tb1表,插入3条记录 删除tb1表中刚插入的3条记录 使用mysqlbinlog恢复删除的3条记录
星哥玩云
2022/08/16
7970
MySQL:深入解析 Binlog复制技术
MySQL的二进制日志(Binary Log, Binlog)是MySQL数据库中非常核心的技术之一,它记录了数据库中所有的DDL和DML操作,对于数据的恢复、复制等都起着至关重要的作用。今天我们将通过实际的binlog日志内容,深入探讨MySQL的binlog复制技术,理解其背后的运作机制。
运维开发王义杰
2023/10/23
4710
MySQL:深入解析 Binlog复制技术
MySQL binlog
【转载请注明出处】:https://cloud.tencent.com/developer/article/1632663
后端老鸟
2020/05/26
3.2K0
MySQL binlog
关于MySQL binlog中的内容分析
在实际的工作过程中,我们经常会解析binlog文件,解析文件的时候,通常有下面三种方法,这里我们简单介绍一下:
AsiaYe
2019/11/18
2.6K0
Apache Flink-流表对偶(duality)性
本系列文章来自云栖社区,对Flink的解析兼具广度和深度,适合对Flink有一定研究的同学学习。
王知无-import_bigdata
2019/03/19
8150
Apache Flink-流表对偶(duality)性
MySQL 8 复制(三)——延迟复制与部分复制
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/90642712
用户1148526
2019/07/02
4K0
MySQL 8 复制(三)——延迟复制与部分复制
故障解析丨一次死锁问题的解决
事务T1T2操作insert into info values (50,11)insert into info values (60,8)关联的对象表apple.info的唯一索引 uk_name表apple.info的唯一索引 uk_name持有的锁lock mode S waitingheap no 7 11,40(十六进制为8,28)lock_mode X locks rec but not gapheap no 7 11,40(十六进制为8,28)等待的锁lock mode S waitingheap no 7 11,40(十六进制为8,28)lock_mode X locks gap before rec insert intention waitingheap no 7 11,40(十六进制为8,28)
GreatSQL社区
2024/03/25
1710
故障解析丨一次死锁问题的解决
mysql二进制日志文件中同一事务的事件时间点会乱序验证
开启一个显式update事务,在事务操作中间进行短暂的停留,然后观察解析的二进制日志
wangwei-dba
2021/06/10
7850
带你解析MySQL binlog
我们都知道,binlog可以说是MySQL中比较重要的日志了,在日常学习及运维过程中,也经常会遇到。不清楚你对binlog了解多少呢?本篇文章将从binlog作用、binlog相关参数、解析binlog内容三个方面带你了解binlog。
MySQL技术
2020/07/14
2.3K0
通过全备+主从同步恢复被drop的库或表
转载于:https://www.cnblogs.com/2woods/p/9394614.html
全栈程序员站长
2021/06/11
4990
binlog 异常暴涨分析
实际上这些问题的原因我都在我的《深入理解MySQL主从原理 32讲》中说明了,有兴趣可以关注一下:(自带广告效果)
用户1278550
2019/08/09
9920
binlog 异常暴涨分析
MySQL系列之二进制日志Binlog学习笔记
在上一篇博客的学习,我们知道了InnoDB存储引擎的两种事务日志,redo log是InnoDB特有的功能,而MySQL也是有自己的日志机制的,也即本文学习的binlog
SmileNicky
2020/10/26
1.2K0
MySQL系列之二进制日志Binlog学习笔记
相关推荐
技术分享 | 八怪:再谈 MySQL 8 这两个精准的时间戳
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验