无毁的湖光-Al

文章/答案/技术大牛

发布

LV1

发表了文章 7小时前2026-07-27 15:59:48

高可用之路·观测篇-指标失明

紧接上篇<<高可用之路-闲聊监控指标的局限>>。上篇说到，指标只是事实的投影，由于代价的存在它无法无限的逼近真实。因此，指标自身的局限有时不仅无法帮助我们发现问...

无毁的湖光-Al 7小时前2026-07-27 15:59:48

容器、高可用、监控、内存、配置

发表了文章 6天前2026-07-21 15:50:13

日常 Bug 排查 - 偶发性读数据不一致

日常 Bug 排查系列都是一些简单 Bug 的排查。笔者将在这里介绍一些排查 Bug 的简单技巧，同时顺便积累素材。

无毁的湖光-Al 6天前2026-07-21 15:50:13

配置、事务、数据库、bug、流量

发表了文章 25天前2026-07-02 18:33:05

日常问题排查-同应用同流量，为什么CPU.busy差了 5 倍？

日常问题排查系列都是一些简单Bug的排查。在分享的同时也积累素材，方便我的AI分身蒸馏^_^。

无毁的湖光-Al 25天前2026-07-02 18:33:05

监控、进程、流量、数据、cpu

发表了文章 25天前2026-07-02 18:32:17

机器宕机和应用宕机是两种不同的行为

应用宕机: 但是kernel还在，那么上游在访问应用ip的时候会由kernel直接发送connect reset从而可以让上游fastFail。

无毁的湖光-Al 25天前2026-07-02 18:32:17

kernel、ip、流量、配置、线程

发表了文章 25天前2026-07-02 18:31:41

RR下MySQL自增主键可能会拖垮整个系统

MySQL在Repeatable READ(RR)情况下，insert出现唯一键(二级索引)冲突的时候会对主键加一个gap锁，在自增主键的情况下往往都会加在su...

无毁的湖光-Al 25天前2026-07-02 18:31:41

系统、mysql、服务、集群、索引

发表了文章 25天前2026-07-02 18:29:03

高可用之路-监控指标无法突破采集环境的边界

如果我拥有无限的精度能否精确的反映系统的运行过程呢？有时候也不能做到，因为指标是在环境中采集的，环境本身限制了它的表达。例如在容器中cpu busy的计算是 :

无毁的湖光-Al 25天前2026-07-02 18:29:03

高可用、监控、系统、异常、容器

发表了文章 25天前2026-07-02 18:28:31

日常问题排查-Younggc突然变长

研发突然反馈一个版本上线后线上系统younggc时间变长，而这个版本修改的代码就是非常普通的CRUD，但是younggc时间就硬生生暴涨了100%。导致天天告警...

无毁的湖光-Al 25天前2026-07-02 18:28:31

数据、容器、监控、流量、日志

发表了文章 2026-06-162026-06-16 18:44:23

日常Bug排查-改表时读数据不一致

日常Bug排查系列都是一些简单Bug的排查。笔者将在这里介绍一些排查Bug的简单技巧，同时顺便积累素材。

无毁的湖光-Al 2026-06-162026-06-16 18:44:23

异常、运维、bug、事务、数据

发表了文章 2026-06-162026-06-16 18:44:10

日常Bug排查-MVCC和for update混用导致读数据不一致

日常Bug排查系列都是一些简单Bug的排查。笔者将在这里介绍一些排查Bug的简单技巧，同时顺便积累素材。

无毁的湖光-Al 2026-06-162026-06-16 18:44:10

事务、优化、数据库、mvcc、bug

发表了文章 2026-06-162026-06-16 18:43:43

日常Bug排查-连接突然全部关闭

日常Bug排查系列都是一些简单Bug的排查。笔者将在这里介绍一些排查Bug的简单技巧，同时顺便积累素材。

无毁的湖光-Al 2026-06-162026-06-16 18:43:43

bug、监控、连接、内存、内核

发表了文章 2026-06-162026-06-16 18:40:09

日常Bug排查-偶发性读数据不一致

日常Bug排查系列都是一些简单Bug的排查。笔者将在这里介绍一些排查Bug的简单技巧，同时顺便积累素材。

无毁的湖光-Al 2026-06-162026-06-16 18:40:10

数据库、bug、流量、配置、事务

发表了文章 2026-06-162026-06-16 18:37:05

日常Bug排查-集群逐步失去响应

日常Bug排查系列都是一些简单Bug排查。笔者将在这里介绍一些排查Bug的简单技巧，同时顺便积累素材

无毁的湖光-Al 2026-06-162026-06-16 18:37:05

集群、日志、线程、缓存、bug

发表了文章 2026-06-162026-06-16 17:41:14

高可用之路-闲聊监控指标的局限

前言在我和GPT探讨了很多天的人生之后，他终于说动了我，让我开启迟迟不想动笔的高可用系列。感谢GPT们让我从大量繁琐技术文档中解放出来，让我有时间进行真正的思

无毁的湖光-Al 2026-06-162026-06-16 18:45:49

高可用、监控、数据、系统、容器

发表了文章 2023-10-072023-10-07 16:17:19

解Bug之路-应用999线升高

监控指标诚然是发现问题于微末之时的极佳手段，但指标往往有其表达的极限。在很多情况下，单独看一个黄金指标并不能表征系统的健康程度，反而有可能被其迷惑，进而忽略相关...

无毁的湖光-Al 2023-10-072023-10-07 16:17:23

容器、bug、cpu、进程、流量

发表了文章 2022-09-212022-09-21 08:42:00

MySQL-Seconds_behind_master的精度误差

Seconds_behind_master是我们观察主从延迟的一个重要指标。但任何指标所能表示的精度都是有限的。例如用精度只能到秒的指标去衡量毫秒级的表现就会产...

无毁的湖光-Al 2022-09-212022-09-21 08:42:00

数据库、云数据库 SQL Server、sql

发表了文章 2021-12-242021-12-24 14:31:31

日常问题排查-调用超时日常问题排查-调用超时

日常Bug排查系列都是一些简单Bug排查，笔者将在这里介绍一些排查Bug的简单技巧，同时顺便积累素材^_^。

无毁的湖光-Al 2021-12-242021-12-24 14:31:31

编程算法、jvm、kernel

发表了文章 2021-12-242021-12-24 14:31:08

日常Bug排查-消息不消费日常Bug排查-消息不消费总结

日常Bug排查系列都是一些简单Bug排查，笔者将在这里介绍一些排查Bug的简单技巧，同时顺便积累素材^_^。

无毁的湖光-Al 2021-12-242021-12-24 14:31:08

socket编程、编程算法、tcp/ip、数据库、sql

发表了文章 2021-12-242021-12-24 14:30:45

ntp导致的时钟回拨ntp导致的时钟回拨

我们的服务器时间校准一般是通过ntp进程去校准的。但由于校准这个动作，会导致时钟跳跃变化的现象。而这种情况里面，往往回拨最能引起我们的困扰,回拨如下所示:

无毁的湖光-Al 2021-12-242021-12-24 14:30:45

unix、编程算法、ntp

发表了文章 2021-12-242021-12-24 14:30:18

日常Bug排查-系统失去响应-Redis使用不当日常Bug排查-系统失去响应-Redis使用不当

日常Bug排查系列都是一些简单Bug排查，笔者将在这里介绍一些排查Bug的简单技巧，同时顺便积累素材^_^。

无毁的湖光-Al 2021-12-242021-12-24 14:30:18

云数据库 Redis®、编程算法、java、腾讯云可观测平台

发表了文章 2021-12-242021-12-24 14:29:46

Prometheus时序数据库-报警的计算Prometheus时序数据库-报警的计算

在前面的文章中，笔者详细的阐述了Prometheus的数据插入存储查询等过程。但作为一个监控神器，报警计算功能是必不可少的。自然的Prometheus也提供了灵...

无毁的湖光-Al 2021-12-242021-12-24 14:29:46

数据库、sql

12 3 4 下一页

个人简介

暂未填写公司和职称
关注笔者公众号 "解Bug之路", 获取更多干货文章
云数据库 SQL Server sql 数据库 java linux
暂未填写学校和专业
暂未填写个人网址
上海
加入社区时间：2018-04-08

个人成就

获得 167 次赞同
文章被阅读 102.7K 次

关注了：1关注者：45