在企业存储和个人NAS设备中,RAID5 是应用最广泛的磁盘阵列方案之一。它通过 奇偶校验机制 实现数据冗余,允许在单块硬盘损坏时继续运行,看似安全又高效。 今天我们就来系统梳理:RAID5出故障后,到底应该怎么办?RAID5的原理与风险点RAID5至少需要三块硬盘。数据在磁盘之间分块存储,同时生成的奇偶校验信息也分布在不同磁盘中。 优点:即便有一块盘损坏,仍可依靠其余磁盘和校验信息恢复数据,保证阵列正常运行。限制:容错能力只有“一块盘”。一旦在修复过程中又坏掉一块盘,整个阵列就会瞬间崩溃。 RAID5数据恢复方法在无备份的情况下,专业恢复工具显得尤为重要。具体的数据恢复步骤,要看实际的数据丢失情况,更准确的说是riad5的损坏情况。 提示:如果某些磁盘读写不稳定,可以先为其创建镜像,再基于镜像文件继续后续恢复,降低物理损坏风险。
公司中有一台HP DL380 G5服务器硬盘红灯报警,使用ACU工具查看后,显示磁盘损坏,截图如下: 更换磁盘后,显示正在重建,即属于正常,截图如下: 更换硬盘前需要确认硬盘是什么型号,哪个系列的,以及硬盘的大小 下面给大家提供一下更换磁盘的一些资料以及注意事项: 1、更换的磁盘与原先的磁盘无比保持大小相同,型号相同,并确定好知否支持热插 拔; 2、更换磁盘时,如果阵列卡支持热插拔,最好不要关闭操作系统,即在开机状态下操作 ;(此建议来自于惠普工程师) 3、更换磁盘后,不可立即重启服务器或更改阵列的配置,否则极易出现问题; 4、惠普各种类型服务器的拆机视频网址:http://h20464.www2.hp.com/index.html
chkdsk简单的说就是用来检查磁盘的,也是一种简单的修复命令,很多时候我们的电脑经常会提示用chkdsk修复磁盘,那么如何使用chkdsk命令呢,接下来告诉你! enter,命令就自动执行了,当然这个时候我们就能看到磁盘的一些情况了,这里会询问你:是否将丢失的链转换为文件(X/Y)? ,输入Y点击Enter即可看到磁盘文件系统已更正或是已经修复,还有显示的就是一些磁盘空间参数,文件有多大,坏扇区有多少之类的参数,如图: 当然chkdsk命令不只是有修复磁盘的功能,当然很多时候我们也记不住它有些什么功能 /F 修复磁盘上的错误。 /V 在 FAT/FAT32 上: 显示磁盘上每个文件的 完整路径和名称。 在 NTFS 上: 显示清理消息(如果有)。 /markclean 仅 FAT/FAT32/exFAT: 如果未检测到损坏,则将卷 标记为干净,即使未指定 /F 也是如此。
本次模拟 通过fdisk分区的磁盘头损坏,造成文件目录无法使用。 如果是asm磁盘,可通过asm相关命令进行修复 现有环境 [root@pgtest testdata]# df -hFilesystem Size Used Avail Use% testdata]# lsanalyze_new_cluster.sh gp2020.cfg lost+found ojdbc6.jar[root@pgtest testdata]# 破坏/dev/sdc1磁盘 通过fsck命令修复磁盘(注意,fstab需要有相关配置信息) [root@pgtest /]# fsck /dev/sdc1fsck from util-linux-ng 2.17.2e2fsck 1.41.12 fsck指令时,不显示标题信息; lvm方式元数据修复 #备份文件位置ls -lrt /etc/lvm/backup/#查看vg创建信息vgcfgrestore --list vg_backup#查看损坏的
Damaged disks 对于存储系统,磁盘是消耗品,损坏是很常见的,所以这篇文章记录一下 Ceph 中出现磁盘损坏时的现象,以及如何定位和更换损坏的磁盘。 1. 磁盘损坏 1.1 现象 工作环境中出现问题的 Ceph 的数据是双备份的,OSD 35 所在的磁盘出现了坏道,表现出来的现象是 ceph 经常会报出存储在 OSD 35 上的 pg 数据不一致,以及报出 1.3 临时解决方法 作为临时的解决方案,可以执行 ceph pg repair 解决,此时由于磁盘坏道造成不可读的数据会拷贝到其他位置。但这不能从根本上解决问题,磁盘损坏会持续报出类似的错误。 定位并检查故障磁盘 知道 OSD 35 有问题,但我们现在还不知道对应的是具体哪块磁盘。我们可以登录到对应到 OSD 服务器上查看 OSD 35 的目录名称,并查看 PVS 的对应关系来解决。 获取磁盘错误信息 我们已经知道是哪个磁盘出错,接下来就要向磁盘的提供商报修,或者联系购买新磁盘了。
,那么任意一块硬盘损坏都可以其他盘和校验盘通过奇偶校验还原数据 RAID5,将奇偶校验数据库分散到各个硬盘,最少3块硬盘 RAID6,横向和纵向都生成奇偶校验,最少4块硬盘 RAID0,速度最快,不冗余 ,最少2块硬盘,提高2倍速度(硬盘越多,理论速度提高越多),但任何一块硬盘损坏,则所有数据报废 RAID1,50%冗余;——RAID0+1 (三) Linux实现RAID5各参数详解与注意事项: 需要的磁盘个数 :三块以上 我们在这里添加四块硬盘,其中3块做磁盘阵列,1块做预备(spare)磁盘 注意:raid5 的磁盘使用率是N-1 也就是说四个30G的硬盘可用空间是90G 实验步骤: 查看一下系统中的磁盘设备 的设备名全部追加到配置文件中 在设置RAID的自动挂载 修改文件 vi /etc/fstab 在里面加上一行 /dev/md0 /raid ext4 defaults 0 0 模拟RAID5中的磁盘损坏 ,验证spare磁盘的功能(在raid5中允许一块磁盘的损坏,也就是我们设置的spare磁盘会立即的替换坏掉的磁盘进行raid的重建,保障数据的安全性) mdadm --manage /dev/md0
电脑无法开机,有时候原因竟然是磁盘损坏。这种情况让人焦虑,因为硬盘里不仅有操作系统,还有重要文件和资料。不过不用慌,正确判断问题类型、科学操作,绝大多数情况下都能顺利恢复系统或数据。 磁盘损坏导致无法开机的常见原因电脑开不了机,首先需要弄清楚问题究竟出在哪里。磁盘损坏大致分为以下几类:(1)物理损坏硬盘受到跌落、震动、受潮或电路板损坏,都可能导致硬盘机械部件失效。 (2)逻辑损坏文件系统损坏、分区表异常、引导文件丢失等情况,会让电脑找不到启动分区。硬盘物理完好,但系统报错无法启动,或者提示“缺少启动设备”,通常属于逻辑损坏。 逻辑损坏磁盘的科学应对如果排查后发现硬盘物理完好,但系统无法启动,可尝试以下方法:方法1、使用系统修复工具准备Windows安装U盘或光盘,进入“修复计算机” → “启动修复”。 物理损坏磁盘的处理方法当硬盘发出异常响声、无法转动或被BIOS检测不到时,说明存在机械问题:立即停止操作,不要继续通电或尝试自拆硬盘,避免磁头刮伤盘片或电路损坏。
-f 模拟硬盘损坏 mdadm /dev/md0 -f /dev/sdb 1、查看损坏磁盘阵列的情况 2、将损坏的硬盘设备移除 3、插上新的硬盘(在真机上操作,虚拟机之间将损坏的硬盘删除,然后在添加新的硬盘即可 ) 4、卸载挂载操作 5、将新的硬盘添加到RAID10磁盘阵列中 6、查看修复成功后的磁盘阵列信息(因为新添加的需要等待一段时间等待系统重新创建) 7、重新挂载 1、查看损坏后的磁盘阵列信息 2、将损坏的硬盘从磁盘阵列中移除 mdadm /dev/md0 -r 损坏的硬盘设备名 mdadm -D /dev/md0 3、将坏的硬盘从服务器上拆下,换上新的硬盘 4、卸载挂载 df -h 5、将新的硬盘设备添加到RAID10中 mdadm /dev/md0 -a /dev/sdb mdadm -D /dev/md0 6、查看新添加硬盘后的磁盘阵列的信息 mdadm -D /dev/md0 7、重新挂载 mount -a 命令总结: mdadm -D /dev/md0 mdadm /dev/md0 -r 损坏的硬盘设备 mdadm
1.raid5磁盘阵列数据恢复思路分析 Raid5磁盘阵列是一种相对安全的磁盘阵列形式,数据分布状态有点类似于raid0磁盘阵列。 但是raid5阵列比raid0阵列更为安全的一点就是阵列的每一组平行数据块中都包含了一个校验块,校验块的作用主要表现在阵列有一块硬盘掉线的时候,可以保证磁盘阵列依旧正常运行,数据不受影响。 不过raid5阵列中如果有一块硬盘离线了就需要及时更换硬盘或上线,否则等第二块硬盘离线时阵列便失效了。此时想要恢复数据需要将raid5阵列中的所有硬盘按照原始存储数据的顺序拼接重组即可。 raid5磁盘阵列组成原理图解.png 由于raid5阵列的每一块硬盘中都包含有校验信息,因此恢复raid5阵列数据时需要考虑三点因素。第一点,考虑硬盘的排列顺序。第二点,考虑阵列中每个数据块的大小。 2. raid5磁盘阵列数据恢复案例 某客户一组raid5磁盘阵列,2块硬盘由于未知原因离线。
这样的话,任何一块磁盘损坏了, 都可以再基于另外一块磁盘去恢复数据,数据的可靠性非常强,但性能就没那么好了。 了解了RAID0和RAID1之后,我们发现这两个方案都不完美啊。 但是由于第N块磁盘是校验码磁盘,因此有任何数据的写入都会要去更新这块磁盘,导致这块磁盘的读写是最频繁的,也就非常的容易损坏。 RAID5的方式可以说是对RAID3进行了改进。 RAID5模式中,不再需要用单独的磁盘写校验码了。它把校验码信息分布到各个磁盘上。 一旦某一块磁盘损坏了,就可以用剩下的数据和对应的奇偶校验码信息去恢复损坏的数据。 如果有两块磁盘同时损坏了,那数据就无法恢复了。 RAID6 为了进一步提高存储的高可用,聪明的人们又提出了RAID6方案,可以在有两块磁盘同时损坏的情况下,也能保障数据可恢复。
这样的话,任何一块磁盘损坏了,都可以再基于另外一块磁盘去恢复数据,数据的可靠性非常强,但性能就没那么好了。 了解了RAID0和RAID1之后,我们发现这两个方案都不完美啊。 但是由于第N块磁盘是校验码磁盘,因此有任何数据的写入都会要去更新这块磁盘,导致这块磁盘的读写是最频繁的,也就非常的容易损坏。 RAID5的方式可以说是对RAID3进行了改进。 RAID5模式中,不再需要用单独的磁盘写校验码了。它把校验码信息分布到各个磁盘上。 一旦某一块磁盘损坏了,就可以用剩下的数据和对应的奇偶校验码信息去恢复损坏的数据。 ? 如果有两块磁盘同时损坏了,那数据就无法恢复了。 RAID6 为了进一步提高存储的高可用,聪明的人们又提出了RAID6方案,可以在有两块磁盘同时损坏的情况下,也能保障数据可恢复。
RAID5 既考虑了空间利用率又考虑了性能的提升,采用校验码的而非镜像的方式组合而成,RAID5 阵列需要至少3块磁盘。 读数据时A时从Disk 0 ,1 ,2 分别读取到A1,A2,A3然后组合成A;如果此时有一块磁盘比如Disk2 损坏,则会通过读取到的A1、A2+ 校验码算出A3,再组合生成数据A对外提供。 RAID 5 可以容忍一块盘的损坏。 优点:读的情况下是单盘数据的三倍;有一定的安全性,可以容忍损坏一块磁盘 缺点:由于每次写数据都需要计算校验块,导致写性能下降;仅能容忍坏一块磁盘损坏 RAID 6 ? 优点:容错硬盘数量比RAID5高 缺点:运算量比RAID5大、空间利用率比RAID5低 RAID 10 ?
本次模拟 通过fdisk分区的磁盘头损坏,造成文件目录无法使用。 如果是asm磁盘,可通过asm相关命令进行修复 ---- 现有环境 [root@pgtest testdata]# df -hFilesystem Size Used Avail testdata]# lsanalyze_new_cluster.sh gp2020.cfg lost+found ojdbc6.jar[root@pgtest testdata]# 破坏/dev/sdc1磁盘 通过fsck命令修复磁盘(注意,fstab需要有相关配置信息) [root@pgtest /]# fsck /dev/sdc1fsck from util-linux-ng 2.17.2e2fsck 1.41.12
Raid0 :最少需要两块盘, 没用冗余数据,不做备份,任何一块磁盘损坏都无法运行。 Raid1:至少需要两块盘,磁盘数量是2的n倍,每一块磁盘要有对应的备份盘,利用率是50%,只要有一对磁盘没有损坏就可以正常使用。 对于数据和校验数据,它们的写操作可以同时发生在完全不同的磁盘上。因此, RAID5 不存在 RAID4 中的并发写操作时的校验盘性能瓶颈问题。另外, RAID5 还具备很好的扩展性。 RAID5 (图 7)的磁盘上同时存储数据和校验数据,数据块和对应的校验信息存保存在不同的磁盘上,当一个数据盘损坏时,系统可以根据同一条带的其他数据块和对应的校验数据来重建损坏的数据。 RAID01 的数据将同时写入到两个磁盘阵列中,如果其中一个阵列损坏,仍可继续工作,保证数据安全性的同时又提高了性能。
在任何一块硬盘出现问题的情况下都可以继续工作,不受损坏硬盘的影响。其中raid有多种磁盘阵列组合,常用的有raid0、raid1、raid5和raid10,每种磁盘阵列都有它的优势。 图2 2.3 Raid5 Raid5技术是把硬盘设备的数据奇偶校验信息保存到其他硬盘设备中。 raid5磁盘阵列组中数据的奇偶校验信息并不是单独保存到某一个磁盘设备中,而是存储到除自身以外的其他每一块对应设备上,这样的好处是其中任何一个设备损坏后不至于出现致命缺陷。 如图3“parity”部分存放的就是数据的奇偶校验信息,换句话说,Raid5技术实际上没有备份磁盘中的真实数据,而是当硬盘设备出现问题后,通过奇偶校验技术来尝试重建损坏的数据。 然后再对两个Raid1磁盘按阵列实施Raid0技术,进一步提高硬盘设备的读写速度。这样从理论上讲,只要坏的不是同一组中的所有磁盘,那么最多可以损坏50%的硬盘设备而不丢失数据。
机械硬盘提示:磁盘结构损坏且无法读取如何解决?相信大家对机械硬盘都很熟悉,几乎每个人都有,因为机械硬盘内存空间大,便于储存文件,很方便。 接下来,针对这一问题,下面来分享系统机械硬盘磁盘结构损坏且无法读取的解决方法。 以上就是系统机械硬盘磁盘结构损坏且无法读取的具体解决方法,需要注意的是在修复机械硬盘的时候,一定不要拔出机械硬盘或者将电脑断电。
缺点: 因为没有校验与备份,两块硬盘中如果有一块磁盘损坏,即磁盘中的任何一个数据块损坏将导致整个文件无法读取 ---- 2、RAID1(不含校验的镜像存储) RAID 1 又称为Mirror 或Mirrooring RAID5磁盘阵列组中数据的奇偶校验信息并不是单独保存到某一块磁盘设备中,而是存储到除自身以外的其他每一块对应的磁盘上,这样的好处是其中任何一个磁盘损坏后不至于出现致命缺陷,但只能允许一块磁盘损坏,否则无法利用剩下的数据和校验信息进行数据的恢复 “parity”部分存放的就是数据的奇偶校验信息,实际上RAID 5 没有备份磁盘中的真实数据信息,而是当硬盘设备出现问题后通过奇偶校验信息来尝试重建损坏的数据一旦某一块磁盘损坏了,就可以用剩下的数据和对应的奇偶校验码信息去恢复损坏的数据 此配置在RAID5的子磁盘组的每个磁盘上进行包括奇偶信息在内的数据的剥离。每个RAID5子磁盘组要求至少三个硬盘。 图1-6 RAID 50 的工作原理 优点: 比RAID5有更好的读性能,比相同容量的RAID5重建时间更短,可以容许N个磁盘同时失效,更高的容错能力,具备更快数据读取速率的潜力。
实现交叉复制,总容量是所有磁盘的综合。但是缺点也很致命,即如果任何一块硬盘损坏,数据就很难恢复。 RAID1:磁盘镜像技术,最少两块硬盘。 安全性最高,但是磁盘利用率仅有50%,也就是说凉快硬盘,实际只有一块的容量。 ? RAID5:一种带校验的磁盘分条技术,为系统提供数据安全保障,最少需要三块硬盘,可以支持一块磁盘损坏。 /dev/md0 --leavel表示raid的等级,这里使用raid5 --raid-devices表示使用的磁盘个数 --spare-devices表示使用备用磁盘个数 并且指定那些磁盘分区 3 RAID的错误救援模式: 试想,生产环境中谁也无法预料硬盘的损坏,如果突然损坏,我们应该怎么办呢?不用着急,接下来继续讲讲! 仍然使用fdisk工具创建1G分区/dev/sdb10 1.增加一个磁盘设备,将损坏的设备移除,就可以直接拔掉硬盘了(注意,要支持热插拔哦) [root@node1 ~]# mdadm --manage
execute “etc/rc.d/rc” b) 各种初始化失败,root卷组无法挂载; c) 服务器四块盘,只有一块不停地闪烁,其他几乎没有响应; d) 初步判断,可能是磁盘有坏道 根据i上的记录和以前的实际情况,把磁盘系统挂载在新建文件夹上 1. “mount –t ext3 /dev/sda5 /mnt/linux” 2. 这里/dev/sda5是磁盘系统的根目录,sda1是磁盘系统的boot目录,也可以尝试逐个挂载,然后读取内容进行检查确认 v. 进入磁盘系统之后,执行fsck因为提示“找不到/etc/fstab”, 执行fdisk –l 提示“cannot open /proc/partitions”,查找proc目录,果然/proc是空目录; 查看/dev目录,目录显示为空; d) 不得已推出磁盘系统,进入rescue模式,执行命令“exit” e) 命令fdisk –l 查看磁盘信息,显示当前挂载的所有硬盘分区,查看并记录
说白了,中文翻译过来通俗的讲就是磁盘阵列的意思,也就是说RAID就是把硬盘做成一个阵列,而阵列也就是把硬盘进行组合配置起来,做为一个总体进行管理,最关键的是这个阵列的磁盘之间具有冗余容错处理,这样可提高磁盘之间相互的安全性和稳定性 二、raid5是什么意思? 我们在做磁盘阵列时会採用不同的方式,我们把每一种磁盘阵列方式称为RAID的级别(即RAID Levels)。 而RAID5仅仅是RAID Levels中的最为常见的一种容错方式。那raid5是什么意思? raid5是什么意思?专业的讲: 所谓RAID5即分布式奇偶校验的独立磁盘结构。 其特点是将它的奇偶校验码存在于全部磁盘上,RAID5的读出效率非常高,写入效率一般,块式的集体訪问效率不错。由于奇偶校验码在不同的磁盘上,所以提高了可靠性,同意单个磁盘出错。 这样,不论什么一个硬盘损坏,都能够依据其他硬盘上的校验位来重建损坏的数据. 三、raid5 几块硬盘? 做RAID5 几块硬盘?