这一年,蓝鲸平台从自动化运维平台,重新定义为研发运营一体化平台,实现了CI、CD、CO的IT管理全生命周期的打通。
在运维中需要对主机业务进行周期巡检,为减少人工巡检频率,降低业务停机风险,利用 shell 脚本对 Linux 系统服务运行状态进行主动巡检,异常服务通过钉钉机器人进行告警消息推送。
这里只列出部分结果,其它的详细内容可以参考:https://share.weiyun.com/5lb2U2M
首先将DB_TiDB_HC_lhr_v7.0.0.sql和pt-summary这2个脚本拷贝到有mysql客户端的Linux环境中,然后执行如下命令:
大卫说:关于构建自动化运维平台的相关内容,此前本公众号已经分享过很多篇文章,如: 大卫的思考 | 金融行业自动化运维的研究和落地 Ansible Tower管理Windows演示 | 自动化运维落地之路 谁说互联网企业IT运维必须DIY? | Github排名第一的自动化运维工具 自动化运维界的独孤九剑 | 尽破各路IT运维难题 我们知道,在金融行业,用户要构建的自动化运维平台,应当是能够跨多种平台的一体化运维,而不是将物理机、虚拟化、各种Linux、各种UNIX、各种网络设备、各种硬件等,单独构
继上两篇巡检相关脚本后,有小伙伴问小编有没有网络设备相关的巡检脚本或工具,今天小编给大家分享个群友给的巡检工具。
3、跨平台,只要有SQL*Plus、mysql、MSSQL客户端(SSMS、Navicat皆可)、psql环境即可运行脚本
全部介绍请参考:https://www.xmmup.com/shujukuxunjianjiaoben.html
#脚本中 ifconfig、mpstat、iostat命令有依赖,需要安装相关依赖包 yum -y install bc sysstat net-tools 巡检项信息,可根据实际需求修改增加 1)、系统基本信息 2)、cpu信息 3)、ip网络信息 4)、cpu使用率 5)、连接数信息 6)、系统限制信息 7)、内存使用信息 8)、磁盘使用信息 9)、网络流量情况/系统资源变化 10)、cpu消耗情况前10排行 11)、cpu消耗按内存情况前10排行 12)、磁盘io情况 13)、系统定时任务列表 1
又到周末了,思前想后不知道写点什么,那就从以前经历的一个线上缺陷说起,聊一下软件质量保障的巡检技术。
目前一共包含7个脚本,若脚本的扩展名为“.sql”则表示该脚本为sql脚本,若脚本的扩展名为“.pl”则表示该脚本为perl脚本。 对于Oracle的SQL脚本而言,脚本DB_Oracle_HC_lhr_vxxx_10g.sql适用于Oracle 10g数据库,脚本DB_Oracle_HC_lhr_v6.0.8_11g.sql适用于Oracle 11g的数据库,脚本DB_Oracle_HC_lhr_v6.0.8_12c.sql适用于Oracle 12c及其以上版本,这3个脚本都是只读版本,这3个脚本只会对数据库做查询操作,不会做DML和DDL操作,这也是很多朋友所期待的功能。 脚本DB_OS_HC_lhr_v6.0.7.pl是perl脚本,执行后会对OS的信息进行收集,并且输出到html中。 脚本DB_MySQL_HC_lhr_v6.0.8.sql是MySQL脚本,执行后会产生MySQL的健康检查html报告,该脚本为只读脚本。 脚本DB_MSSQL_HC_lhr_v3.2.sql是SQL Server脚本,存在部分DDL和DML操作,执行后会产生SQL Server的健康检查html报告。
“不想当将军的士兵不是好的战士”、“不想当CIO的DBA不是好的运维”。在每天面临如此多的来自工作量、运维安全、技术更新挑战的同时,我们还需要不断的成长与思考:
和PostgreSQL数据库相似,需要有psql客户端或者有人大金仓的ksql客户端都可以,运行方式如下:
百度大厦的一名安保人员手机里弹出这样一条信息。发信息的是他的“新同事”,一位近期上岗百度深研大厦的智能助手——小度巡检机器人。
前段时间在GitHub[1]上发现了一个Ansible巡检服务的Roles, 今天给大家分享一下!
首先看 CPU 内存、硬盘 io 的消耗程度,其中重点是硬盘使用率,要做好准备,避免厂家期间业务写入增长,磁盘占满。
运维服务一个项目二十多台(或者多台)服务器,每天要做服务器的性能巡检工作是查看服务器的CPU、内存、磁盘空间是否在正常值范围内。像这样每天或者每个固定时间段都做相同的重复工作,为了简化重复的工作,我写了基于liunx服务器的自动巡检脚本,在crontab中设定一个固定时间进行自动执行即可,以减少人工重复劳动的工作。
在上一期《运维专题第2期:警戒哨兵》中,我们介绍的是运维平台中的监控系统——云哨,今天给大家带来的产品是巡检平台,在运维过程中能够跟监控系统一起为客户带来稳定的保障。
攻防演练建议站在黑客的视角下,审视其攻击流程,再针对性的进行防守,防止出现木桶效应,即攻击者只会从短板攻入,但构建的防守措施却和短板无关。
【系列专栏】:博主结合工作实践输出的,解决实际问题的专栏,朋友们看过来! 《QT开发实战》 《嵌入式通用开发实战》 《从0到1学习嵌入式Linux开发》 《Android开发实战》 《实用硬件方案设计》 长期持续带来更多案例与技术文章分享; 欢迎商业项目咨询,10年+软硬全栈内功,助力解决您的尊贵需求。 —————————————————————————————————— 【需求】: 1)单/三相电可用,检测电压(80~450V)、电流(0~10A)有效值; 2)测量交流输入电压频率,
重剑轻出,大巧不工。本案例中的“天幕安全巡检”小工具依托云开发CloudBase+小程序可视化而打造,旨在改善 toB 售前打单过程中常见的繁琐流程问题,包括面向客户的长时多轮产品 PPT 演示、现场搭建 POC 环境作产品测试等。基于腾讯自研 PaaS 层强大安全算力算法能力,该工具以简驭繁,最终以轻量、便捷“随身小工具”的形式呈现给使用者,帮助加速客户对产品认知体验效率。
2018年12月,经过嘉维蓝鲸项目组近半年的努力奋战,太平集团成功上线了蓝鲸研发运营一体化平台,实现了IT运维全流程标准化和调度自动化,并取得了如下收益:
【系列专栏】:博主结合工作实践输出的,解决实际问题的专栏,朋友们看过来! 《QT开发实战》 《嵌入式通用开发实战》 《嵌入式Linux开发实战》 长期持续带来更多案例与技术文章分享; 欢迎商业项目咨询,10年+软硬全栈内功,助力解决您的尊贵需求。 【需求】: 1)单/三相电可用,检测电压(80~450V)、电流(0~10A)有效值; 2)测量交流输入电压频率,测量范围:45~55Hz; 3)检测有功、无功、视在功率及功率因数; 4)检测电网谐波; 5)RS485通信接口; 6)以太网通信接口;
做云安全运营也有一年多时间了,对云上安全建设和运营有一点粗浅的经验,希望可以抛砖引玉,借此文章能有机会和大佬们交流 安全运营,安全建设方向的经验。
煤炭是我国重要的能源资源,对于煤炭的开采和利用也是我国重要的工业产业部分。得益于5G+物联网技术的发展普及,煤矿场景也迎来智能化升级,实现了包括智能采掘、智能调度、无人运输、无人巡检等新型应用,极大提升了煤矿采运产业的效率和质量。本篇就为大家简单讲讲基于5G工业CPE打造智慧煤矿无人巡检监测应用.
Oushu Database(简称OushuDB)是新一代极速云数仓,让企业用户轻松构建核心数仓、数据集市、实时数仓以及湖仓一体数据平台。OushuDB由国人自主研发,符合国家信创标准;通过计算存储分离架构解决了传统数据仓库高成本、高门槛、难维护、难扩展的问题。同时支持各大公有云和私有云。
大家好,我是乐乐。前面我们详细介绍了Zabbix与乐维监控的架构与性能、Agent管理、自动发现、权限管理、对象管理、告警管理方面的对比分析,相信大家对二者的对比分析有了相对深入的了解,接下来我们将对二者的可视化功能进行对比分析。可视化是当代IT监控的一个创举,让IT监控很大程度摆脱枯燥烦杂的数据,使得监控过程变得更直观。
无数的太阳能面板组成光伏发电的海洋,在烈日下矗立,为了保证它们正常运行,电站必须安排人力巡查,一块块面板全面检查,周而复始。
我姓王,同事都叫我隔壁老王,这是有典故的。 我们技术总监就坐在我隔壁。每次网站挂了,同事们远远就能听见总监的怒吼:“把隔壁老王给我叫来!” 所以大家都知道公司有个隔壁老王,老出Bug。 天知道我已经多久没睡过囫囵觉了,我宁可用再单身十年来换公司系统的一生平安。 我每天比普通员工以及运维早半小时到公司,第一件事就是开始检查数据库的监控,进行数据库巡检,确认没有问题或者及时发现问题并在上班时间之前解决问题。 现在特殊时期,在家远程办公,暂时从同事们的耳朵里消失的我,就再也没和工作分开了。 今天是开工第一天,
巡检平台是一个面向运维人员的开箱即用的巡检产品,提供自动诊断问题的自动化运维能力。产品不仅提供了自动化的巡检能力和巡检报告给运维工程师使用,还针对巡检报告中的问题提供了运维专家经验的优化建议供修复时参考。运维人员也可以根据自己的定制需求,通过多样化巡检原子能力灵活定制个性化巡检项加入到定期巡检任务中,巡检原子能力包括脚本巡检、HTTP(S) 接口巡检和 IP 巡检;该平台还具备覆盖多个垂直产品和多个维度巡检的分类能力,运维人员可以根据产品归属不同人员等方式,让不同用户订阅不同的巡检报告,从而大大减少运维工程师定期手工巡检的工作量。
中国移动通信集团北京有限公司(下称北京移动)成立于1999年,隶属于中国移动通信集团公司,秉承“正德厚生,臻于至善”的企业核心价值观,紧密围绕“做世界一流企业,成为移动信息专家”的战略定位,以卓越品质锻造一流信息服务,用创新精神努力实现从优秀向卓越的新跨越,着力推动“移动改变生活”。
据统计,2021年,我国分布式光伏年度新增规模约2900万千瓦,突破新增光伏发电装机的50%,约占55%,发展势头强劲。
脚本(复制粘贴) #!/bin/bash #作者:小韩 a="\033[40;37m" e="\033[0m" b="\033[41;37m" c="\033[42;37m" f="\033[43;37m" g="\033[44;37m" h="\033[45;37m" q="\033[46;37m" echo -e "$h=========😻本脚本适用K8S主节点&作者:小韩😻======"$e echo -e "$a--------自动巡检开启--请把你的小手拿走--" $e linux=$(cat /
本文根据MOS文章:Oracle Exadata Database Machine EXAchk (Doc ID 1070954.1)整理关键步骤。 注:通常都会要求使用当前最新可用的EXAchk版本进行健康检查。
上次分享了Linux的信息收集脚本,有小伙伴说实际环境中还有不少Windows的机器,今天给大家分享个Windows服务器信息收集脚本以及使用方法,详见下面具体信息。
风电场群规模日益扩大,设备多且分布分散,需要采用对设备集中监控管理的方式,提高对风力发电厂整体的管理效率,保障风电场正常运行。
集群巡检是对集群系统进行定期检查和评估的过程,其主要目的是确保集群的稳定性、性能和安全性。以下是集群巡检的几个主要用途:
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/101846.html原文链接:https://javaforall.cn
以下是一个简单的网络设备巡检自动化程序的 Python 代码示例,可以用于检查网络设备的基本配置和状态信息:
对于数据中心,运维工作的重要性不言而喻,在数据中心生命周期中运维管理是历时时间最长的一个阶段。数据中心运维的工作主要是对数据中心各项管理对象进行 系统的计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称,具体包括对机房环境基础设施部分的维护,系统与数据维护,管理工具的使用,人员的 管理等方面。投资巨大的数据中心,为了能够尽快得到收益,就需要在运维的工作上多下工夫,切勿进入“一流设备、二流设计、三流运维”的不良运营之中,高品 质数据中心运维的工作至关重要。那么如何才能提升数据中心的运维水平,本文提
领取专属 10元无门槛券
手把手带您无忧上云