苏州某幼儿园,服务器RAID5崩溃,几年来的重要文件都在里面,老师们顿时慌了神。 之前已经有IT公司过去看过了,说是无法恢复,或者说,需要巨额费用。 我们到了之后,打开服务器是图1的样子,服务器无法引导,而且内存还报错,顺便发现前置USB接口全坏。
到现场后,服务器就停留在无法引导的界面,提示:没有发现可启动设备,按任意键重启机器。
图2-1可以说是标准的生产库环境,处处体现了冗余,有效防止了单点故障。这就是HA(高可用)
本次数据恢复案例的背景是一台装有20块硬盘的普通服务器,由于未知原因上层业务突然崩溃,机房管理员对服务器进行检查发现导致服务器崩溃的主要原因是服务器上有3块硬盘离线,管理员将服务器内的所有硬盘按照现有盘序从槽位取出后携带硬盘来到北京某数据恢复中心进行服务器数据恢复操作。
近期再给一个用户更换服务器硬盘时发现,一是RAID配置错误,使用300GB的硬盘给600GB的磁盘做热备,另外是更换的硬盘型号不对导致数据没有同步。新近入职的管理员如果接手的有旧的服务器,有时间应重点检查一下硬盘及RAID信息,看是否有离线的硬盘或配置不合适的地方好及时纠正。
某客户戴尔R730服务器,操作系统为Windows Server 2012,ERP公司的技术人员在运维过程中,经常向我司技术人员反馈:微软自带远程桌面,在输入用户名和密码之后黑屏,无法登录进入桌面,我司技术人员通过anydesk工具发现可以远程操作服务器,但是速度非常,点一下鼠标需要等10秒甚至30秒才有响应,直接远程重启服务器后正常,但是第二天又会黑屏。。。
随着公司测试开发的环境数量需求愈来愈大,原本的服务器资源也愈发紧张。在2020年末之际,公司迎来了新的三台华为RH1288 V2服务器;运维小生在这里记录一下此服务器如何配置RAID卡。
30多公里,驱车前往,到达后发现,无法登录的那台,也自动关机了,两个灯一起闪,按下电源键,没多久就自动断电重启,如此循环,看型号是惠普DL360 Gen9。
我们使用的计算机的全称叫电子计算机,前面有电子两个字,这说的是整个计算机中的核心元器件基本上都是电子单元组成的。但机械硬盘却是一个特殊的例外,它更多是用机械技术做出来的一个产品。当把带有机械技术基因的磁盘搭到计算机,尤其是再应用到服务器领域的时候,暴露出了机械技术的两个严重问题:
RAID是英文Redundant Array of Independent Disks的缩写,中文简称为独立冗余磁盘阵列。简单的说,RAID是一种把多块独立的硬盘(物理硬盘)按不同的方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据备份技术。
1、什么是buffer与cache,它们各自的作用是什么 linux系统会把内存分为两种区域: buffer:缓冲区,攒一大波数据,再刷入硬盘 cache:缓存,把硬盘的数据在内存中缓存好,cpu取的时候可以直接从内存取 2、什么是内核态与用户态 内核态——>操作系统正在控制硬件 用户态-->应用程序正在运行 3、机械磁盘的IO延迟时间=平均寻道时间4ms+平均延迟时间5ms 4、一个7200转的硬盘带来的IO延迟大概是9ms 5、操作系统的启动流程是什么? 1、计算机加电 2、启动BIOS(计算机启动一定会先启动bios系统),扫描启动设备,从某一个启动设备中找到操作系统 3、读取启动设备的第一个扇区的大小(称之为主引导记录mbr) 446 bootloader=》grub程序 64分区信息 2结束标志位 4、grub程序负责将操作系统内核装载入内存,启动操作系统 5、操作系统会让BIOS去检测驱动程序
我在互联网上经常看到这样的说法:RAID很危险,RAID磁盘阵列在重建过程中失败的可能性几乎是100%,因为硬盘驱动器已经变得非常大。
因为众所周知的原因:硬盘总是坏!但是嘛,其实硬盘数据恢复也是那么难,一起来看看! 在一切工作进行之前,请先判断硬盘是否有损坏,以及缺损类型,而往往硬盘出现问题主要集中下以下两个方面: 物理(驱动器故障
---- 新智元报道 编辑:时光 【新智元导读】如何获得数字生活的安全感?小编教你3种有效的备份方法,不要嫌麻烦,3种要同时上,「有备无患」! 备份是非常无聊的,但它可以让你的数据「幸免于难」。 中国有句古话叫「有备无患」,多重备份才能让你的数字生活有安全感。 以下是备份的一些方法,它并不需要特别的设备,几乎不花费任何成本,但需要你提高备份的意识。 移动硬盘手动备份 第1种备份方法最简单! 买一个外置硬盘,定期将你的数据复制到里面。 挑选硬盘不仅要考虑硬盘制造商,还要考虑大小型号适合自己。
大家好,又见面了,我是你们的朋友全栈君。 原标题:服务器数据恢复怎么弄 服务器数据恢复怎么弄?说到服务器数据恢复,很多外行人或许不太明白。所谓的服务器数据恢复,首先需要拆分解释一下。何为服务器数据?小
在一切工作进行之前,请先判断硬盘是否有损坏,以及缺损类型,而往往硬盘出现问题主要集中下以下两个方面:
昨天突然PT主机内存爆炸,母鸡也爆炸了, 经过一番沟通,Hetzner提出了三个选项:
当增大系统的压力(或增加并发用户数)时,吞吐率和TPS的变化曲线呈大体一致,则系统基本稳定。若压力增大时,吞吐率的曲线增加到一定程度后出现变化缓 慢,甚至平坦,很可能是网络出现带宽瓶颈,同理若点击率/TPS曲线出现变化缓慢或者平坦,很可能是服务器响应时间增加,观察服务器资源使用情况,确定是 否是服务器问题。
说到服务器硬件监测,用得最多的自然是Zabbix和prometheus,可是对于一般用户来说,部署要求比较高,而且也没有必要。
服务器数据恢复指的是通过技术手段将原本存储在服务器、存储设备内的,由于误操作、硬件故障、恶意攻击等原因丢失的数据进行修复提取的专业技术。在介绍服务器数据恢复前我们首先需要了解服务器的数据结构、文件存储原理,今天小编通过一起华为s5300服务器数据介绍该型号服务器的数据存储结构和数据恢复原理。
融合存储也叫统一存储,是随着IT信息化发展而来的产物,本质是将NAS存储和SAN存储在功能上做了融合(当然除此以外还有其他方面的融合如主存与备份的融合等),即在融合存储设备上既可以实现NAS存储的功能也可以实现SAN存储的功能,企业通过部署融合存储可以大大降低整体TCO成本,现阶段融合存储在各个行业均大规模部署使用。(小编在这里突然想到“分久必合、合久必分,哈哈,IT产品也逃不了历史的规律”)。
#1 - 错误: 设备上无剩余空间 当你的类UNIX系统磁盘写满了时你会在屏幕上看到这样的信息。本例中,我运行fallocate命令然后我的系统就会提示磁盘空间已经耗尽: $ fallocate -l 1G test4.imgfallocate: test4.img: fallocate failed: No space left on device 第一步是运行df命令来查看一个有分区的文件系统的总磁盘空间和可用空间的信息: $ df 或者试试可读性比较强的输出格式: $ df -h 部分输出内容: Fi
移动硬盘无法访问提示"此卷不包含可识别的文件系统"怎么办?如何修复?移动硬盘里有重要数据,有办法恢复吗?不要着急,小编一一为你解答。
在家里呆了有15天了,空闲时间只有看书,不断充实自己。细致研究,发现简单的事,细细品味,也有新的体会,就像喝葡萄酒细细品尝的感觉相同。
前天的文章开头还提到,年后第一天上班很清静、很悠闲,与往常的经验相悖,其实那都是假象,只是有的客户还没上班而已,这不,今天就接到让人心惊肉跳的报修了。
如果你的诉求非常简单、明确,不需要界面,上一篇内容中的 Ubuntu Server 应该已经能够完成你的诉求了。
服务器汇总:http://www.cnblogs.com/dunitian/p/4822808.html#iis
1.操作系统:就是一个协调、管理、控制计算机硬件资源与应用软件资源的一个控制程序
服务器内有两块硬盘掉线,现在服务器内的lun丢失了,数据恢复工程师开始对故障服务器进行检测发现掉线的硬盘并没有存在物理故障、也没有坏道等其他故障。于是开始对客户的故障服务器进行镜像备份。
RAID(Redundant Array Of Independent Disk,独立磁盘冗余阵列),可以提供比普通磁盘更快的速度、更高的安全性,生产环境中服务器在安装时一般都会做RAID,RAID的创建有两种方式,一种是软RAID(由操作系统来实现,生产环境下一般不采用,因为是基于系统,所以一旦系统挂掉了,数据就挂了),另一种是硬RAID(使用的是RAID卡,也叫阵列卡等的一种独立于系统之外的卡,当系统挂掉之后可以保证磁盘数据的安全性)。
RAID: Redundant Arrays of Inexpensive Disks Independent Berkeley: A case for Redundent Arrays of Inexpensive Disks RAID 提高IO能力: 磁盘并行读写; 提高耐用性; 磁盘冗余来实现 级别:多块磁盘组织在一起的工作方式有所
优势:数据读取写入最快,最大优势提高硬盘容量,比如3块80G的硬盘做raid0 可用总容量为240G。速度是一样。
本次分享的案例是关于HP FC MSA2000存储瘫痪抢救Oracle数据库的案例,故障存储整个存储空间由8块硬盘组成,其中7块硬盘组成一个RAID5的阵列,剩余1块做成热备盘使用。由于RAID5阵列中出现2块硬盘损坏,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用。 由于存储是因为RAID阵列中某些磁盘掉线,从而导致整个存储不可用。因此接收到磁盘以后先对所有磁盘做物理检测,检测完后发现没有物理故障。排除物理故障后对数据全部备份后在进行进一步的分析。 【故障分析】 1、分析故障原因 由于前两个步骤并没有检测到磁盘有物理故障或者是坏道,由此推断可能是由于某些磁盘读写不稳定导致故障发生。因为HP MSA2000控制器检查磁盘的策略很严格,一旦某些磁盘性能不稳定,HP MSA2000控制器就认为是坏盘,就将认为是坏盘的磁盘踢出RAID组。而一旦RAID组中掉线的盘到达到RAID级别允许掉盘的极限,那么这个RAID组将变的不可用,上层基于RAID组的LUN也将变的不可用。目前初步了解的情况为基于RAID组的LUN有6个,均分配给HP-Unix小机使用,上层做的LVM逻辑卷,重要数据为Oracle数据库及OA服务端。 2、分析RAID组结构 HP MSA2000存储的LUN都是基于RAID组的,因此需要先分析底层RAID组的信息,然后根据分析的信息重构原始的RAID组。分析每一块数据盘,发现4号盘的数据同其它数据盘不太一样,初步认为可能是hot Spare盘。接着分析其他数据盘,分析Oracle数据库页在每个磁盘中分布的情况,并根据数据分布的情况得出RAID组的条带大小,磁盘顺序及数据走向等RAID组的重要信息。 3、分析RAID组掉线盘 根据上述分析的RAID信息,尝试通过北亚RAID虚拟程序将原始的RAID组虚拟出来。但由于整个RAID组中一共掉线两块盘,因此需要分析这两块硬盘掉线的顺序。仔细分析每一块硬盘中的数据,发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一样,因此初步判断此硬盘可能是最先掉线的,通过北亚RAID校验程序对这个条带做校验,发现除掉刚才分析的那块硬盘得出的数据是最好的,因此可以明确最先掉线的硬盘了。 4、分析RAID组中的LUN信息 由于LUN是基于RAID组的,因此需要根据上述分析的信息将RAID组最新的状态虚拟出来。然后分析LUN在RAID组中的分配情况,以及LUN分配的数据块MAP。由于底层有6个LUN,因此只需要将每一个LUN的数据块分布MAP提取出来。然后针对这些信息编写相应的程序,对所有LUN的数据MAP做解析,然后根据数据MAP并导出所有LUN的数据。 【数据恢复过程】 1、解析修复LVM逻辑卷 分析生成出来的所有LUN,发现所有LUN中均包含HP-Unix的LVM逻辑卷信息。尝试解析每个LUN中的LVM信息,发现其中一共有三套LVM,其中45G的LVM中划分了一个LV,里面存放OA服务器端的数据,190G的LVM中划分了一个LV,里面存放临时备份数据。剩余4个LUN组成一个2.1T左右的LVM,也只划分了一个LV,里面存放Oracle数据库文件。编写解释LVM的程序,尝试将每套LVM中的LV卷都解释出来,但发现解释程序出错。 仔细分析程序报错的原因,安排开发工程师debug程序出错的位置,并同时安排高级文件系统工程师对恢复的LUN做检测,检测LVM信息是否会因存储瘫痪导致LMV逻辑卷的信息损坏。经过仔细检测,发现确实因为存储瘫痪导致LVM信息损坏。尝试人工对损坏的区域进行修复,并同步修改程序,重新解析LVM逻辑卷。 2、解析VXFS文件系统 搭建环境,将解释出来的LV卷映射到搭建好的环境中,并尝试Mount文件系统。结果Mount文件系统出错,尝试使用“fsck –F vxfs” 命令修复vxfs文件系统,但修复结果还是不能挂载,怀疑底层vxfs文件系统的部分元数据可能破坏,需要进行手工修复。 3、修复VXFS文件系统 仔细分析解析出来的LV,并根据VXFS文件系统的底层结构校验此文件系统是否完整。分析发现底层VXFS文件系统果然有问题,原来当时存储瘫痪的同时此文件在系统正在执行IO操作,因此导致部分文件系统元文件没有更新以及损坏。人工对这些损坏的元文件进行手工修复,保证VXFS文件系统能够正常解析。再次将修复好的LV卷挂载到HP-Unix小机上,尝试Mount文件系统,文件系统没有报错,成功挂载。 4、检测Oracle数据库文件并启动数据库 在HP-Unix机器上mount文件系统后,将所有用户数据均备份至指定磁盘空间。所有用户数据大小在1TB左右。 使用Oracle数据库文件检测工具“dbv”检测每个数据库文件是否完整,发现并没有错误。再使用北亚Oracle数据库检测工具,发现有部分数据库文件和日志文件校验不一致,安排北亚工程师对此类文件进行修复
-f 模拟硬盘损坏 mdadm /dev/md0 -f /dev/sdb 1、查看损坏磁盘阵列的情况 2、将损坏的硬盘设备移除 3、插上新的硬盘(在真机上操作,虚拟机之间将损坏的硬盘删除,然后在添加新的硬盘即可) 4、卸载挂载操作 5、将新的硬盘添加到RAID10磁盘阵列中 6、查看修复成功后的磁盘阵列信息(因为新添加的需要等待一段时间等待系统重新创建) 7、重新挂载
故障预测类似于临震预报,最重要的意义是给用户一个从容的时间段进行数据和业务的迁移或处理,改善用户体验。
一、raid什么意思? RAID是“Redundant Array of Independent Disk”的缩写,raid什么意思了?说白了,中文翻译过来通俗的讲就是磁盘阵列的意思,也就是说RAID就是把硬盘做成一个阵列,而阵列也就是把硬盘进行组合配置起来,做为一个总体进行管理,最关键的是这个阵列的磁盘之间具有冗余容错处理,这样可提高磁盘之间相互的安全性和稳定性,不存在“单点”硬盘现象,也就说不会让某些硬盘读写频繁,其它的硬盘可能数据交换较少的现象,从而提高硬盘的安全性,同一时候磁盘的总体管理会提高读
大家是否遇到过此类问题,当将外部硬盘插入计算机并找到提示该驱动器已成功安装但没有出现在“此PC”上的通知?
一些用户发现自己的XP系统出现蓝屏,屏幕上显示的代码是0x000000ED,遮盖如何解决呢?今天小编就给大家分享一下解决这个问题的方法吧。
可用性指的是系统服务的可用性。一般按全年可用时间除以全年时间来衡量可用性的好坏,平常我们说的 SLA指标就是可用性指标,这里就不展开细说。
"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网络与服务器领域,规划、运营、研发、服务等层面的实战干货,期待与您的共同成长。前言 背景 伴随着腾讯业务的蓬勃发展,近几年服务器数量快速增长,随着时间的推移,现网逐步累积了大批量服役年份时间很长的服务器,服务器运营面临日益凸显的服务器整体老龄化问题。理论上服役时间越长的服务器发生故障的几率也将越大,从腾讯全网服务器的统计结果也表明服务器老龄化的加剧,故
硬盘的物理结构是比较复杂的,这里我们只需要知道最常用到的几个术语即可,也就是chs寻址中所涉及到的结构
做运维的都知道,服务器出点问题,就够我们受的,轻则被骂,重则丢饭碗,所以,每逢节假日,我们恨不得在机房点上三柱香、贴上几张符,给服务器和网络设备跪拜一番,求它们别出问题,也让我们过个清闲的假日。
答:群晖系统跟Windows不同,Windows有个盘要当成系统盘,而群晖会在每个硬盘上自动安装系统。每个硬盘?对,没错,就是每个硬盘。比如你是6盘位,接了6个硬盘,这6个硬盘初始化以后,每个硬盘都有系统了。所以拿一个SSD来做系统盘的这个做法没必要。当然,也有全部用SSD的土豪,那就不是这个话题了。
来源:从零开始学编程 U盘的使用中,都有进行格式化的操作过程,但是在这个操作中有两种不同的模式可以解决问题,那就是快速格式化和正常格式化,但是很多的用户对这两种模式分不清,不知道该选择哪一种比较好,现在和大家分享一下u盘快速格式化与正常格式化区别方法。 一、快速格式化时间非常短,如果硬盘有坏道,不会出现任何提示。正常格式化时间非常的长。但会在格式化的时候全面检测硬盘,如果有坏道会提示。 二、如果不是为了确认存储介质有问题而仅仅是删除文件,用快速格式化就可以了,但是要分析坏扇区,则必须用
存储系统从其与生俱来的使命来说,就难以摆脱复杂系统的魔咒。无论是从单机时代的文件系统,还是后来C/S或B/S结构下数据库这样的存储中间件兴起,还是如今炙手可热的云存储服务来说,存储都很复杂,而且是越来越复杂。 存储为什么会复杂,要从什么是存储谈起。存储这个词非常平凡,存储 + 计算(操作)就构成了一个朴素的计算机模型。简单来说,存储就是负责维持计算系统的状态的单元。从维持状态的角度,我们会有最朴素的可靠性要求。比如单机时代的文件系统,机器断电、程序故障、系统重启等常规的异常,文件系统必须可以正确
作为全球数据存储基础设施解决方案的领导者之一的希捷最近推出了突破性的 Exos CORVAULT 自愈块存储系统。这款智能大容量存储产品的一大特点,就是能够简化数据管理、并减少宏观边缘与数据中心环境的人工干预。除了极高的存储密度,Exos CORVAULT 新品还提供了 SAN 级别的性能,结合第六代 VelosCT ASIC、ADAPT 纠删码数据保护、以及自我修复等功能。
在HP存储RAID5硬盘离线LVM下VXFS文件系统是如何进行恢复的呢?HP存储也是在企业中常用的存储设备了,本次分享的故障设备为:HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,整个存储空间由8块450GB SAS的硬盘组成,其中7块硬盘组成一个RAID5的阵列,剩余1块做成热备盘使用。
领取专属 10元无门槛券
手把手带您无忧上云