监控已经从简单的最佳实践转变为任何产品发布清单上的必需品。选择满足可观察性需求并确保您为客户提供服务的可靠性的工具至关重要。
多年来,随着 DevOps 和 SRE 实践的采用增加,监控已经从简单的主动实践转变为任何产品发布清单的必需品。我们现在使用不同的工具进行各种监控检查,以确保系统或服务的所有组件始终可用且正常运行。
监控根据被监控的组件进行分段 -网络监控、服务器监控和 APM。每种类型测量的指标提供了有关系统健康状况的不同信息,以及所有这些信息如何与您的最终用户体验相关联。这种深度数据对于主动检测问题和消除任何可能的停机时间至关重要。
业内有许多工具,包括免费的和企业级的,它们专门用于监控另一个或提供多合一的监控解决方案。
根据选项列表,选择监视工具可能会令人生畏。但是,有一些关键问题可以帮助您缩小所需工具的类型。
正如 Datadog 收集正确的数据博客文章:
收集数据很便宜,但在需要时没有它可能会很昂贵,所以你应该检测所有东西,并尽可能收集所有有用的数据。
选择满足您的可观察性需求并帮助您确保您的服务和系统对您的客户可靠的工具至关重要。
因此,我们不分先后,列出了一些最流行的监控工具和一些突出的功能。其中一些工具涵盖了网络监控、服务器监控和应用程序性能监控功能的组合。
DevOps 中的监控工具可用于提供有关系统运行状况的反馈。这些工具监控性能下降或系统不稳定等问题。以下是一些最常用的 Devops 监控工具。
Prometheus 是一个用于事件监控和警报的开源系统监控和警报工具。它在使用 HTTP 拉取模型构建的时间序列数据库中记录实时指标,并具有灵活的查询。
特征:
Pingdom 是针对您的网站、应用程序和服务器的全球性能和可用性监控解决方案。
特征:
Zabbix 是一个 IT 组件和服务的实时监控工具。它是用于网络、服务器、虚拟机和云服务的开源软件,并被多个部门使用。Zabbix 为数字资产的网络利用率、CPU 负载和磁盘空间消耗提供数据指标。
特征:
Site 24x7 是另一个提供网站、服务器和应用程序性能监控的一体化工具。Site24x7 是 ManageEngine 产品套件的一部分,可帮助提供监控健康检查以维持系统正常运行时间。
特征:
Nagios XI,以前称为 Nagios,是一个免费的开源监控工具包,可帮助进行系统、网络和基础设施监控。
特征:
Sensu 是一个开源基础设施和应用程序监控工具,用于监控服务器、服务和应用程序运行状况。Sensu Go 是 Sensu 的最新版本。
特征:
SignalFx 通过收集和分析云环境中每个组件的指标和跟踪,实现对基础架构、微服务和应用程序的实时云监控和可观察性。
特征:
顾名思义,服务器和应用程序监视器 (SAM) 就是这样做的。
特征:
ManageEngine 的 OpManager 是一个网络监控工具,可帮助监控网络设备,例如路由器、交换机、防火墙、负载平衡器、无线 LAN 控制器、服务器、VM、打印机、存储设备,以及所有具有 IP 并连接到网络的设备
特征:
Datadog 是针对云规模应用程序的监控服务,通过基于 SaaS 的数据分析平台提供对服务器、数据库、工具和服务的监控。
特征:
PRTG Network Monitor 是 Paessler AG 的无代理网络监控软件。它可以监控和分类系统状况,如带宽使用或正常运行时间,并从各种主机(如交换机、路由器、服务器和其他设备和应用程序)收集统计信息。
特征:
New Relic 拥有一套监控产品,它们共同提供一体化监控解决方案。New Relic APM、New Relic Browser 和 New Relic Infrastructure 可以单独使用,也可以一起使用。
特征:
WhatsUp Gold 可让您全面了解云端或本地的应用程序、网络设备和服务器的状态和性能。
特征:
Icinga 是一个开源计算机系统和网络监控应用程序。它最初是作为 Nagios 系统监控应用程序的一个分支而创建的
特征:
尽管这不是可用工具和列出的功能的详尽列表,但如前所述,确定您需要监控的指标类型并了解如何在选择监控工具之前使这些数据更具可操作性更加重要。