最重要的数据通常存储在服务器上,部分单位,几万几十万的服务器买了,存储了几年十几年的数据,却在某一日,服务器发生故障之后,由于处置不当,导致数据全部丢失,造成了难以挽回的损失。
下面我们以某医院的一台服务器为例,看看是哪些误操作导致数据烟飞灰灭的。
某医院HIS系统Sql Server数据库服务器,四块300G SAS硬盘做RAID5,某日停电后服务器宕机。
我们这台数据库服务器,据客户描述,机房在一次停电之后,服务器再也无法启动,服务器前面板显示,有一块硬盘亮黄灯。
但是事实并不是这样的!
服务器是在停电后宕机的,但是停电却不是宕机的故障原因,而是------
硬盘在停电之前已经损坏!
服务器前面板显示,有一块硬盘亮黄灯,但是事实上并不是只有一块硬盘损坏,而是----------
有两块硬盘损坏!
首先还原一下客户的操作步骤:
1、首先对阵列rebuild强制上线,发现无效;
2、然后更换亮黄灯的硬盘,rebuild后再次强制上线,发现操作系统无法启动;
3、重新安装操作系统,进入后发现大量文件丢失;
4、使用数据恢复软件进行扫描,没有找到数据库文件。
让我们把经过梳理一下:
宕机之前:四块硬盘,两块好硬盘 + 一块黄灯硬盘 + 一块坏硬盘(我们称之为脏盘)
--> 而坏硬盘早已在数年前损坏并离线,只是由于某种原因没有被发现。
--> 而坏硬盘上的数据,是数年前的数据!(所以我们称之为脏盘)
此时,两块好硬盘 + 一块黄灯硬盘 数据仍然是可以恢复的。
但是,经过一番强制上线之后,脏盘的数据被同步到黄灯硬盘:
此时,表面上看,阵列似乎仍然在运转,但是数据已经完全丢失且不可恢复!
至此,这家医院十余年的HIS数据灰飞烟灭,彻底丢失。
小结:
服务器在经过数年的连续运转之后,硬盘的健康状况已经极不可靠,并且由于某种原因,硬盘在损坏之后并不会被及时发现;
这样在服务器宕机之后,必须通过查看日志或进行数据分析,来采取正确的处置措施,以确保数据安全。
领取专属 10元无门槛券
私享最新 技术干货