系统巡检是对于服务巡检的第一站,所以在这里我们要做好第一班岗,如果系统巡检稀里糊涂,那么后续的数据库服务巡检效果也会大打折扣。
快过春节了,对于巡检工作真是非常重要的一环,也是考验巡检的力度的一种方式,及早发现问题,及时解决,就会避免很多“到时候再说”的问题。 当然公司层面也有一些巡检要求,我自己也总结了一下,发现还是需要写一部分,然后不断完善。主要分为下面的几个部分来阐述。 检查ILO可用性和使用情况... ILO模块没有开启... ILO密码错误... ILO超过最大用户连接数限制... ILO在不同的硬件产品版本和浏览器的兼容性... ILO页面和JAVA的版本关系... 操作系统版本... 操作系
hp ILO可以远程管理服务器,非常方便,但是hp ILO在web管理界面,没有重启的选项,如果需要重启ilo,可以使用以下方法: 一 服务器物理断电再加电,需要现场操作; 二 通过ssh方式重启ILO; 1 通过ssh工具连接; 2 敲命令 cd /map1 3 执行重启命令 reset
由于BIOS开机密码忘记,所以对这台HP DL380 G6服务器进行BIOS清除操作,刚好看到iLO的选项,就顺手配置了一下,方便以后的管理。 首先,先说明一下iLO(2)。iLO是Intergrated Light-Out的缩写,是惠普特有的远程管理功能,目前最新的版本是iLO2。通过iLO2可以实现硬件级别的服务器远程管理,包括开关机、重启、服务器状态的监控、虚拟KVM等。目前在惠普3、5、7系列服务器以及刀片服务器上一般都集成了iLO2控制芯片,我们可以通过Web方式远程进行管理,配置过程和管理过程都
hp的ilo是一个非常方便的带外管理工具,在平时使用的时候,经常有大量的hp服务器需要配置ilo,下面是我下的一个脚本,可以批量的完成hp服务器ilo配置。
据 securityaffairs 12月30日消息,某个首次发现的 rootkit 病毒(也称为 iLOBleed)正针对惠普企业服务器展开攻击,能够从远程感染设施并擦除数据。
备注:C7000上时没DVD光驱的,但是有个转换器,接在刀片服务器前面面板上,转接出两个USB口和两个显示器接口。通过外接USB的光驱方法是惠普官方没经过测试的,官方建议用的是ILO远程装系统。
更好地了解肿瘤免疫微环境 (TIME) 将有助于开发预后生物标志物和更有效的肺癌患者治疗策略。然而,TIME中关于癌细胞、免疫细胞和局部免疫抑制元素之间复杂相互作用的综合评价的报道却很少。
假设一台服务器要从一个机房迁移到另外一个机房,这个过程就好比你去出差,从北京到上海,怎么准备才是最方便,安全,快捷的。 如果出去时间不长,有了银行卡,这些都不是问题,很多小件的东西都可以通过买买买来解决,这里的银行卡就好比服务器的iDRAC模块一样(也常叫ILO),而你的出行又不可避免需要使用有效证件,交通如此,住酒店如此,这里的身份证就好比系统的root密码一样重要。 而在这个基础上,你的出行还需要考虑是否带电脑,是否带拖鞋,是否带行李箱等等,这些都是我们需要考虑的点,对于服务器迁移来说也是
3 使用命令Textcons(表示文本控制台,不需要配置linux ttys1,如果使用vsp命令,需要配置linux ttys1)
上周拿到了几台过保淘汰的HP380G5服务器做测试使用,因为ilo2的固件比较旧,还是1.61,
在本示例中,一台DELL R730 XD服务器安装了ESXi 6.0,ESXi 的IP地址是192.168.100.11,这台DELL服务器iDRAC控制台的IP地址是192.168.100.12。下面简单了解iDRAC的登录以及iDRAC的配置。
对于服务器的一些信息,如果数据量大了之后总是感觉力不从心,需要了解,但是感觉得到的这些信息不够清晰明了。 比如我们得到一台服务器,需要知道最基本的硬件配置,内存情况,磁盘空间情况,哪些磁盘空间问题需要关注,哪些磁盘空间问题可以忽略,swap的使用情况 如何,服务器的操作系统版本,内核版本,上面运行有几个实例,是否启用了ASM,甚至服务器运行了多少天呢,这些信息看起来非常琐碎,也可以通过脚本得 到,但是一直以来感觉都是比较笼统模糊。 今天使用shell脚本进行了简单的改进。 我们来看看基本的效果情况。有了这些
-s0:从每个分组中读取最开始的snaplen个字节,后面可以跟数字指定截取多少个字节,0是指截取所有。 (防止包截断)
在未回放pcap包的情况下,dpdk探针抓包时,会收到LLDP包(0x88cc,链路层发现协议(Link Layer Discovery Protocol,LLDP)是一种数据链路层协议。) 此时,我们可以修改发包服务器的配置,禁用LLDP。
本篇内容,分享一台端午假期折腾的设备,HP Gen10 Plus v2,分享下我的折腾思路,希望能够帮助到有类似需求的你。
服务器搬迁后不是简单能连接上服务器就可以了,还有许多的事情需要考虑,否则服务器不可用还是白搭。 我大体碰到了如下的一些问题,也能够反应出来对于系统的各种潜在隐患。 1 批量检测服务器的可用状态 如果有大批量的服务器搬迁,有些能够连通,有些不可以,使用telnet本身就有硬伤,我们直接设置个超时时间,对于服务是否可用一目了然。这个时候还是推荐使用nc命令。比如测试服务器10.129.128.37的22端口是否可通,超时时间为2秒,则可以使用如下的命令。 nc -z -v -n -w 2 10
颜色为绿色:监控成功 颜色为红色:监控失败。检测失败会有相对应的提示 常见的监控类型:
最近对一个统计库做了计划内的容灾切换,即主备切换。操作的过程其实还是蛮顺利的。但是灾难切换中如果出现在问题,那就是灾难中的灾难了。 按照计划对配置信息做了同步,然后使用DG Broker做了SwitchOver操作。 这一次切换速度还是蛮快,我开了几个窗口看到日志都在不断输出,角色已经替换过来了。DG Broker切换的日志如下: DGMGRL> switchover to test29; Performing switchover NOW, please wait... New primary datab
这篇文章计划了一段时间,本来想写篇心情文字,还是留到周末再放飞心情吧。 今天的内容是关于数据库的备库的思考,当然我们可以自己问自己,我们的备库准备工作做好了吗?扪心自问,其实有些工作我也没有准备好,这是我的建议,其实一个备库的思考点还是有很多值得考量和斟酌的地方。自己也需要后续完善 备库总是在容灾中有着举足轻重的作用,但是故障难免,我们的备机备库是否能够在危机降临的时候顶住压力,这个需要打上一个问号,我会从硬件配置,系统层面,数据库层面,架构层面和网络层面进行一些分析。 硬件配置 备库硬件配置更差
最近使用 iDrac 和 iLO 总是会使用到 .jnlp 文件, 为了方便,今天把设置过程记录下来。
NAS即网络附加存储(Network Attached Storage),通过网络提供数据访问服务。 本人不推荐自攒NAS,稳定性差,迷你主板和家用机电源不是for 24x7的。 本人也不推荐成品N
不进入这个行当,很少会知道,人们对低延时的渴求。专业人士为了低延时,做过各种各样的努力。以往我们将数据库的某些SQL从秒级优化到毫秒级,至少会在心底里欢呼一下,百倍提升!但在这个行业,人们为了减少1毫秒,可以做出什么疯狂的事情呢?
之前分享了第一篇 使用shell批量监控磁盘坏块(一),今天来简单说说这个需求的实现内容 。 首先主要思路是通过中控的机器来发送监控的细节,然后返回结果。 首先就是我们需要有一个服务器列表,里面会
在机房管理中有两个派别,管理派认为要依靠严格的管理,明确和细致的制度,来达到目的;而技术派则认为应通过不断的技术进步来推动管理,提高效率。
大部分程序员见到的服务器也就是云服务器,知名的那几家公司:阿里云、腾讯云…都是著名的云服务器提供厂商。在学校写个网站啥的,学生就可以优惠买买买。不过今天我们介绍的是服务器而非云服务器。在学校的时候,老师会说:“你们用的电脑也是服务器”。是的,那么现在我们来讨论,PC服务器和服务器的区别:
建设绿色数据中心的必要性 中国目前是是全球最大的温室气体排放国,节能减排是“十二五”的重要工作内容。发改委在2013年就明确了首批10个行业的企业温室气体排放核算方法。根据对数据中心测算结果表明,2015年我国数据中心能耗达到1000*100000000kWh左右,相当于三峡电站一年的发电量,而到2020年,这个数据将会是2015年数字的2.5倍。数据中心的高能耗,不仅给企业带来巨大的负担,也造成了全社会能源的巨大浪费。根据国家既定战略,“十三五”期间节能环保方面的投入将是“十二五”期间的两倍以上,
原文链接:http://tecdat.cn/?p=18770 为了用R来处理网络数据,我们使用婚礼数据集。 > nflo=network(flo,directed=FALSE)> plot(nf
最近真是忙的厉害,感觉时间都不是自己的了,大周末的时间都排得满满当当,先是大半夜接到报警电话,接着碰到了让人无奈的硬件问题,一台服务器挂掉,结果上面有两个备库,都是数据量庞大的统计分析库,数据量也不小
前言 类似于VMware这样的服务器虚拟化技术出现以来,极大地提升了企业数据中心的建设效率、运维弹性以及经济效益。回想起十来年前,我们想要部署一个新系统时,首先需要申请采购服务器,到货后还需要自己搬到机房里,找到位置安装到机架上,然后加电、跳网线、安装操作系统,等到最终能够ping通新服务器的IP时,时间往往已经过去了好几个月。而在数据中心全面推进虚拟化之后,这过程变得很轻松:需要多少台机器,我只需要在私有“云”管理平台上提一个申请单,平台管理员审批之后,就开始自动部署你需要的虚拟机,整个过程最快几乎达到
智能平台管理接口(IPMI)提供了一种标准化的方法,用于远程管理和监控服务器系统,独立于操作系统或电源状态。这项技术允许系统管理员远程管理系统,即使系统处于关闭或无响应状态,对于以下情况尤为有用:
本文来自IP Oktoberfest 2020,这期讨论会主题为网络的搭建和设计,主讲人为Robert Welch。
其实对于Failover和Switchover是大家处理灾难时很头疼的一个环节,也是最关键的处理过程。 假设你半夜正在睡觉,被报警电话惊醒,得知某个服务器产生了故障宕机,在这种情况下,我们大体会有下面的处理流程: 1)检查原来的节点是否可用,需要查看ILO和存储,是否存在异常 2)如果原来的节点可以重启,可以尽量马上恢复业务,然后分析根本原因,是否是硬件老化,硬件故障导致,如果发现问题影响较大,可以使用Switchover 3)如果原来的节点无法重启,这个时候需要考虑Failover,如果在同机房可以直接替
User-Agent: Mozilla/5.0 (iPhone; CPU iPhoneOS 8_0 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Mobile/12A365MicroMessenger/6.0 NetType/2GChrome/80.0.3987.149 Safari/537.36
30多公里,驱车前往,到达后发现,无法登录的那台,也自动关机了,两个灯一起闪,按下电源键,没多久就自动断电重启,如此循环,看型号是惠普DL360 Gen9。
很多人购买了服务器之后无法习惯宝塔的操作界面,而更愿意使用kangle的ep界面。 本篇文章就教你如何给自己的服务器安装康乐虚拟主机系统。
作为一个IT工程师,遇到最多的机器就是服务器,装操作系统算是比较基础的操作,本篇文章主要是介绍我装系统的一些方法。进入到系统里面之后的操作,不在本篇文章的讨论范围之内。
缝制简单的衣服是非常典型的重复性劳动密集型工作之一,似乎早在几年前就实现了自动化。但是要让机器人做到这一点却并不容易。衣服面料通常比较柔软,尤其是用来做T-shirt的针织面料。人类可以轻松调整,引导衣服面料移动,以确保缝制线的笔直整齐,但这对机器人来说确实一件很难的事情。 经过多年研究,2015年,SoftWear Automation 推出了缝纫机器人 LOWRY,利用机器视觉识别针织面料的变形并进行调整。尽管时机器人还只能生产浴室垫等简单的产品,时至今日,技术已经足够先进,缝纫机器人已经能够完成
好吧,OCT 代表八进制,八进制的 31,是十进制的 25,而十进制是 DEC。嗯,标准的程序员冷笑话,认真你就输了。
之前写过一篇通过shell来监控磁盘坏块的文章 http://blog.itpub.net/23718752/viewspace-1872978/ 从使用情况来看,也确实发现了一些坏块很多的问题,这也给我们的工作带来一些清晰的指导。不过感觉对于硬件的监控还在隔靴搔痒,还有很多的监控不够到位。或者太细感觉有些鸡肋,或者太粗有感觉有些笼统。而且还有些问题还是说不清道不明。 比如前段时间碰到一个问题,白天刚做过磁盘巡检,没有发现任何坏块,结果到晚上服务器就崩了。也没有任何的前兆,收到一条ICMP的报警之后,服务器
复杂网络分析研究如何识别、描述、可视化和分析复杂网络(点击文末“阅读原文”获取完整代码数据)。
CNA 研究和应用爆炸式增长的突出原因是两个因素 - 一个是廉价而强大的计算机的可用性,使在数学、物理和社会科学方面接受过高级培训的研究人员和科学家能够进行一流的研究;另一个因素是是人类社会、行为、生物、金融和技术方面不断增加的复杂性。
今天处理了一起紧急问题,回过头来看还是有不少需要注意的地方。 首先是收到了报警,有一台DB服务器的负载有一些高,但是会快就恢复了。所以自己也没有在意,但是过了大概40多分钟,又接到一封报警邮件,而且随着报警频繁,感觉真是出了问题,在中控机器上使用ssh连接竟然都抛出了异常。 # ssh 10.127.xxxx Connection timed out during banner exchange 对于这类问题,是因为超出了默认的超时参数,不过我没有纠结在超时的时长,因为这个本身已经不重要,既然中控超时连接,
如下图,PC(192.168.10.1) ping 服务器(192.168.40.1)无响应。这种情况就属于ping不通的情况,此时我们应该怎么排查呢?本文瑞哥教你8个大招,轻松找到问题根源。
最近也在对容灾的切换做一些改进。 目前碰到的问题有 1.灾难切换后备库的内核参数设置不到位,导致切换后又潜在的性能问题 2.灾难切换后在同机房,网络相关的情况下,需要切换备库的IP为主库,但是跨机房,跨IDC可能不行,可以修改IP的情况下,对应用基本是透明,但是如果修改IP就需要应用修改配置。 3.灾难切换之后防火墙信息在主库无法得到的情况,在备库只能关闭防火墙,或者设置最大的访问权限 4.原来主库中的db link可能无法正常解析,如果解析不当或者依赖较多,会有数据库负载成百倍暴涨的可能性 5.原来主库启
转载请注明出处。 如果想远程管理服务器就有远程管理卡,比如Dell idRAC,HP ILO,IBM IMM 查看硬件的温度/风扇转速,电脑有撸大师,服务器就有ipmitool。使用ipmitool实现对服务器的命令行远程管理 yum -y install OpenIPMI ipmitool #->IPMI在物理机可以成功,虚拟机不行 [root@KVM ~]# ipmitool sdr type Temperature Temp | 01h | ns | 3.1 | Disa
公有云,私有云(OpenStack/cloudstack + KVM/XEN,oVirt), 混合云 服务监控 配置管理
数据是企业核心资产,数据对企业而言是最重要的工作之一。稍有不慎,极有可能发生数据无意泄露,甚至被黑客恶意窃取的风险。每年业界都会传出几起大事件,某知名或不知名的公司被脱裤(拖库的谐音,意思是整个数据库被黑客盗取)之类的。
领取专属 10元无门槛券
手把手带您无忧上云