硬盘异常损坏日常相对概率较高,同时不同的文件系统(xfs,reiserfs,ext3)其检测方式不同。建议使用dmesag查看有没有硬件I/O故障的日志,也可使用用fsck确认是否文件系统异常。
SMART是一种磁盘自我分析检测技术,硬盘运行中会将主要参数进行记录,主要有:型号、容量、温度、密度、扇区、寻道时间、传输、误码率等。 硬盘运行一段时间后,如上参数会有相应的变动,某些参数超过阀值会出现报警。依靠相应的报警可初步判断硬盘是否接近(已经)损坏。
SMART是和主板BIOS上相应功能配合的,在使用smart之前必须在bios设置中启动相关特性。 硬件特性开启smart的情况下,对于Linux,有相应的smartd服务驻守运行,该进程能监视、分析和汇聚相关硬盘情况。
smartctl可用于对磁盘进行相关检测,主要用法如下: smartctl -a :检查该设备是否已经打开SMART技术。 smartctl -s on :如果没有打开SMART技术,使用该命令打开SMART技术。 smartctl -t short :后台检测硬盘,消耗时间短。 smartctl -t long :后台检测硬盘,消耗时间长。 smartctl -C -t short :前台检测硬盘,消耗时间短。 smartctl -C -t long :前台检测硬盘,消耗时间长。 smartctl -X :中断后台检测硬盘。 smartctl -l selftest :显示硬盘检测日志。 smartctl -l error :显示硬盘错误汇总。
提示:首先通过dmesg工具,确认一下硬盘的设备符号。
# smartctl -i /dev/sda
……
SMART support is: Available - device has SMART capability.
SMART support is: Enabled #表示启用了smart支持
# smartctl --smart=on --offlineauto=on --saveauto=on /dev/sda
# smartctl -H /dev/sda
……
SMART overall-health self-assessment test result: PASSED
命令释义: PASSED:这表示硬盘健康状态良好; FAILED:硬盘不健康,建议更换硬盘。
提示:SMART仅报告磁盘不再健康,但是报警后能持续运行多长时间无法确定。
#smartctl -A /dev/sda #查看硬盘的详细信息,测试硬盘使用时间以及写入字节数
#smartctl -s on /dev/sda #如果没有打开SMART技术,使用该命令打开SMART技术。
#smartctl -t short /dev/sda #后台检测硬盘,消耗时间短;
#smartctl -t long /dev/sda #后台检测硬盘,消耗时间长;
#smartctl -C -t short /dev/sda #前台检测硬盘,消耗时间短;
#smartctl -C -t long /dev/sda #前台检测硬盘,消耗时间长。
#smartctl -X /dev/sda #中断后台检测硬盘。
#smartctl -l selftest /dev/sda #显示硬盘检测日志。
#smartctl -l error /dev/sda #显示硬盘错误汇总。
通常执行smartctl需要在服务器终端执行,sarmt也支持作为服务运行在服务端,进程deamon为startd,从而实现定时判断硬盘状态,同时指定报警、日志等。
如下示例配置好 smartd.conf 后启动进程即可。
# vi /etc/smartd.conf
/dev/sda -H -m test@test123123.com #配置监控磁盘的健康状态,当SMART中报告 PASSED无视,Failure,则邮件通知
/dev/sda -a -m admin@example.com,root@localhost #监控磁盘的所有属性,当SMART中报告 PASSED无视,Failure,则邮件通知
启动startd服务。
# /etc/init.d/smartd restart #加载配置文件启动
提示:更多smart使用及配置参考:https://www.smartmontools.org/wiki/TocDoc
badblocks命令可以检查磁盘装置中损坏的区块。该命令需要指定所要检查的磁盘设备,及此磁盘区块数。
语法:
badblocks [-svw][-b ][-o ][磁盘装置][磁盘区块数][启始区块]
参数:
badblocks检测磁盘坏块:
badblocks -s -v /dev/sda1 #显示进度和执行检查的详细情况
# badblocks -s -v /dev/sda
# badblocks -s -w -v /dev/sda2 #显示进度并且以写入的方式检测同时显示详细情况
注意:不能以写的方式检测已经挂载的硬盘