iodump 是一个开源工具,旨在帮助 Linux 系统用户排查 I/O 相关问题。它利用内核 tracepoint 静态探针技术,捕获每个 I/O 操作(读/写)的详细信息,包括 I/O 请求大小、扇区地址、发生时间、读/写文件的完整路径、生成请求的进程、系统调用以及扩展 I/O 类型。其最独特的功能是能够显示读/写文件的完整路径,这对于诊断 I/O 瓶颈非常有用。
iodump通过Linux内核的blktrace机制实现低损耗监控,其核心组件包含:
技术亮点:
fnotify
机制实时跟踪文件打开事件- sudo yum install iodump
+ sudo dnf install iodump-kmod --enablerepo=Plus
# 验证内核模块加载
sudo lsmod | grep iodump
git clone https://gitee.com/anolis/iodump.git
cd iodump
# 编译内核模块(需对应kernel-devel包)
make -C /lib/modules/$(uname -r)/build M=$PWD modules
# 安装用户空间工具
sudo cp iodump /usr/local/bin/
# 监控sdb设备I/O,采样率10%(100ms窗口)
sudo iodump -p sdb --sample 10 -t 3600
# 捕获超过1MB的写操作(需内核5.3+)
sudo iodump -p nvme0n1 -f 'iosize > 1048576 && rw == W' -o csv
# 压力测试期间监控(fio并行)
fio --name=test --ioengine=libaio --rw=randread --bs=4k &
sudo iodump -p sda -s /tmp/io.log
timestamp,pid,comm,iosize,rw,lba,path
1630456789.312,3141,mysql,16384,R,0x38d200,/var/lib/mysql/ibdata1
import pandas as pd
df = pd.read_csv('io.log')
# 计算各进程IOPS
iops = df.groupby(['pid','comm']).size().sort_values(ascending=False)
# 识别大文件顺序写
large_writes = df[(df['iosize']>65536) & (df['rw']=='W')]
发行版 | 最低内核版本 | 验证状态 |
---|---|---|
AnolisOS 8.6 | 4.19.91 | ✅通过 |
CentOS 7.9 | 3.10.0 | ⚠️部分 |
Ubuntu 22.04 | 5.15.0 | ✅通过 |
# 调整内核缓存参数(/etc/sysctl.conf)
kernel.iodump_buffer_size = 1048576 # 1MB缓存
kernel.iodump_flush_interval = 100 # 100ms刷盘间隔
❗ 本工具可能触发内核oops事件,建议在测试环境验证以下场景:
# 崩溃后恢复命令
sudo rmmod iodump_ko && systemctl restart kdump
https://github.com/os-health/iodump