作为程序员,和 Linux 打交道,在服务器上分析系统性能情况,是每一个后端工程师都无法避开的事情。
无论你是开发还是运维,可能都经历过这样的场景:
流量高峰期,服务器 CPU 使用率过高报警,你登录 Linux 上去 top 完之后,却不知道怎么进一步定位,到底是系统 CPU 资源太少,还是程序并发部分写得有问题?
系统并没有跑什么吃内存的程序,但在敲完 free 命令之后,却发现已经没什么内存了,到底是哪里占用了内存?为什么?
一大早就收到 Zabbix 告警,你发现某台存放监控数据的数据库主机 CPU 的 I/O Wait 较高,该怎么办?
Linux 性能问题一直是程序员头上的“紧箍咒”,大多数时候,我们只能看到“症状”,却不知道从哪儿下手排查和解决。就算看了很多资料和书籍,一旦涉及到具体问题,还是会一脸懵逼。
谈学习经验,有 3 点比较重要:
这其中,一开始就劝退你的,可能就是 Linux 性能工具的使用,它除了要考虑性能指标的目的外,还要结合待分析的环境来综合选取。
虽说咱有布伦丹·格雷格(Brendan Gregg)大师整理的性能工具图谱,相信你也多少参考过,但其实它还不够具体,使用时还要去查找每个工具的手册,对比分析做出选择。
所以每次用的时候,大家都会想,有没有更好的方法来理解这些工具呢?相信当你看了倪朋飞《Linux 性能优化实战》中总结的几个性能工具图,一定会解决你的问题的。
他根据「性能指标」的不同,将工具划分为 CPU、内存、磁盘 I / O及网络,4 大类型,会让你一次性把性能工具搞明白了。
看这些图,就很清晰了,比如,当遇到 I/O 性能问题时,可以根据不同的性能指标,使用 iostat、iotop、blktrace 等工具分析磁盘 I/O 的瓶颈。
专栏提供了 30 多个 Linux 性能问题的诊断思路,真正是让你 10 分钟定位到系统瓶颈,讲的 Linux 的套路,实实在在的能解决工作中的实际问题。
毫不夸张的说,这是超赞的 Linux 教程,口碑相当不错,已经有超过 27000 人订阅了。