SCOM支持服务级别的监控,并可针对某些重要服务配置服务停止后自动启动,综合来讲SCOM是一个很强大的平台,除了服务外,还可实现某些基于程序进程的应用自我修复或某些代码级别的自动修复、某些代码程序的自我修复、某些网站的自我修复等,前述章节,我们已经推送了客户端代理Agent,并且相关Agent也都工作正常,可以看到常规的监控视图,本节我们以Printer Spooler打印服务为例,讲述如何配置服务级别的监控,并在监控后如何配置服务意外停止后自动启动。
1、 首先我们定义一下监控规则,自己创建一个服务监控包
1) 使用mscloud\omadmin 账户登录到SCOM服务器
2) 打开开始菜单,然后打开Operations Console
3) 点击“创作”,打开创作视图 , 在此视图中我们可以看到,SCOM可以定义Linux、Windows的进程、日志文件监视,Windos 服务,网络端口,应用程序监视等。 首先点击左侧的 组,然后点击 新建组 为要监控的计算机创建一个集合
4) 输入组名称,管理包处点击 新建
5) 输入管理包名称,然后点击“下一步”
6) 点击 创建
7) 在返回的页面,点击 下一步
8) 成员我们选择明确的组成员,在明确的组成员页面,点击 添加/删除对象
9) 搜索类型选择 计算机 ,输入要添加的计算机名,然后点击 搜索,选择搜索到的几I算机,然后点击 添加 ,添加后点击 确定
10) 在返回的页面,点击 下一步
11) 动态成员主要为通过变量确定监控对象,此处我们不需要,直接点击 下一步
12) 子组为将其他组作为该组的子组,我们不需要,直接点击 下一步
13) 排除成员页保持默认,直接点击 创建
14) 创建完成后,开始创建监控服务策略,点击左侧的 管理包模板,然后在右侧点击 添加监视向导
15) 选择 Windows 服务 然后点击 下一步
16) 输入监视名称,管理包选择我们创建好的管理包Print Monitor
17) 服务名称点击 。。。 选择服务
18) 选择Print Spooler服务,然后点击 确定
19) 在返回的页面,点击目标组后面的… 选择目标计算机组
20) 输入关键字点击 搜索,选择我们创建好的目标组,然后点击 确定
21) 在返回的页面,点击 下一步
22) 性能计数器我们暂时不需要,直接点击 下一步
23) 在摘要页,点击 创建
24) 模拟故障
在监视视图,我们可以看到,当前服务是正常的
25) 到服务器上,手动停止服务
26) 服务停止后,过了一会,我们发现服务器已经处于故障状态了
27) 点到活动警报页面,发现 打印服务已经发出警报,提示服务已停止,如果有配置短信或邮件提醒,会自动收到相关的短信或邮件。
28) 将服务手动启动,服务器自动恢复到正常状态
2、 配置服务停止自启动
1)在创作视图->Windows服务栏,选择我们创建好的 打印服务监控 ,右键点击该服务,然后选择 查看管理包对象->监视器
2) 在打开的页面,展开 可用性,选择隶属于 Print Monitor管理包的监视器,右键点击属性
3) 点击诊断和恢复选项卡,在配置恢复任务栏,点击 添加
4) 诊断任务类型选择,运行命令
5) 定义恢复任务名称,运行状态恢复选择 严重 ,并勾选 自动运行恢复、恢复完成后重新计算监视器状态,然后点击 下一步
6) 输入执行程序,程序执行参数,然后点击 创建
7) 手动停止Print Spooler服务,并观察,等待30秒钟,服务自动恢复