如何在Hadoop中监视和发送长时间运行的作业的警报

在Hadoop中监视和发送长时间运行的作业的警报，可以通过以下步骤实现：

使用Hadoop的资源管理器（ResourceManager）和作业历史服务器（JobHistory Server）来监视作业的运行情况。ResourceManager负责管理集群资源，而作业历史服务器用于存储和提供作业的历史信息。
通过ResourceManager的Web界面或命令行工具，可以查看正在运行的作业以及它们的状态、进度和资源使用情况。这可以帮助您了解作业的运行情况，但无法提供实时的警报功能。
要实现实时的警报功能，可以使用Hadoop的事件通知机制。Hadoop提供了一个事件通知框架，可以在作业运行过程中触发各种事件，如作业开始、作业完成、作业失败等。
您可以编写一个自定义的事件监听器，用于接收这些事件并触发警报。监听器可以通过订阅ResourceManager和作业历史服务器的事件流来获取作业的状态更新。
在监听器中，您可以设置规则来判断作业是否运行时间过长。例如，如果一个作业在指定的时间内没有完成，您可以触发一个警报。
警报可以通过多种方式发送，如电子邮件、短信或集成到监控系统中。您可以根据自己的需求选择适合的方式。
对于长时间运行的作业，您还可以考虑使用Hadoop的作业调度器来设置作业的最大运行时间。如果作业超过设定的时间仍未完成，调度器可以自动终止作业并触发警报。

总结起来，要在Hadoop中监视和发送长时间运行的作业的警报，您可以使用Hadoop的资源管理器和作业历史服务器来监视作业的运行情况，通过事件通知机制实现实时的警报功能，并编写自定义的事件监听器来触发警报。警报可以通过多种方式发送，如电子邮件、短信或集成到监控系统中。另外，您还可以考虑使用作业调度器来设置作业的最大运行时间并自动触发警报。

腾讯云相关产品和产品介绍链接地址：

腾讯云Hadoop：https://cloud.tencent.com/product/emr
腾讯云事件消息队列CMQ：https://cloud.tencent.com/product/cmq
腾讯云云监控：https://cloud.tencent.com/product/monitoring

如何在Hadoop中监视和发送长时间运行的作业的警报

、、、

我有一个要求，我需要监控运行了很长时间的hadoop作业(Hive/Map Reduce，spark )，比如在集群中持续3小时。我知道我可以在UI中查看所有这些作业，但我需要每小时或30分钟对其进行监控，如果作业运行超过3小时，则发送电子邮件/警报。有没有办法做到这一点。我的环境是HDP 2.6 提前感谢....

浏览 3提问于2017-08-22得票数 0

2回答

日志文件中的时间戳

、

我必须创建一个autosys作业来监视另一个autosys长时间运行的作业。如果另一个作业的运行时间超过10分钟，则监视作业应创建警报。对于ex。A1自动系统作业将运行并创建日志文件。新的监控作业应检查日志文件的时间戳、创建日期和时间，并检查日志文件的<e

浏览 0提问于2012-12-13得票数 0

回答已采纳

5回答

监控服务器、进程、服务、任务计划程序状态

、、、

现在，在我们的生产/QA/开发环境中，我们有大量对应用程序至关重要的服务在运行。我们也有自动的ETLs运行在windows任务调度程序上，在一天中设定的时间。目前，我必须登录到每个服务器，查看是否所有服务都运行正常，或者检查事件日志是否有任何错误，或者检查任务调度程序以查看etc是否运行良好，等等……我必须手动完成所有的工作。我想知道是否有工具可以为我做监控，并仅在需要注意的情况

浏览 2提问于2012-01-04得票数 3

回答已采纳

1回答

如何使用Java -jar命令运行映射减少作业

、、、、

我使用Java编写了一个Map reduce作业。mapreduce.framework.name", "yarn");使用不同的情况运行案例1：“使用Hadoop和Yarn命令”：成功精细工作案例3：“删除所有的-

浏览 2提问于2014-08-14得票数 5

回答已采纳

1回答

如何在oozie中设置作业失败警报？

、、

我在色调界面上的oozie，我想得到任何杀死/失败/长时间运行的作业的电子邮件警报。组件版本Hue 2.6.1 HDP 2.3.6 Hadoop 2.7.1 Oozie 4.2.0 Ambari 2.6.0

浏览 8提问于2019-12-05得票数 1

1回答

如何在伪分布模式下的Hadoop中运行Nutch

、、

我的Ubuntu上安装了Nutch 1.13。我可以在独立模式下运行爬行。它成功地运行并产生了所需的结果，但是我现在不知道如何在hadoop中运行它？我在伪分布式模式下安装了Hadoop，我想用Hadoop运行一个Nutch爬行并监视它。我该怎么做呢？在独立模式下运行它有很多教程，但我找不到任何关于如何在Hadoop中<

浏览 1提问于2017-12-22得票数 0

回答已采纳

1回答

Laravel5.1:事件和邮件的区别:队列？

、、

我有登记表，在那里我想发送电子邮件给用户成功注册后。我想在后台运行电子邮件，这样页面的响应时间会更好一些。对于背景中的电子邮件，我看到我们可以使用：我的问题是，在排队电子邮件的情况下，这两种方法有什么区别？在通过队列发送电子邮件时，一个人的行为与另一个人不同吗？

浏览 1提问于2015-11-03得票数 3

回答已采纳

1回答

如何在Hadoop集群上运行Hadoop* Streaming？*

、、、

目前我有一个有3个节点的Hadoop集群(Ubuntu) 我想运行带有Hadoop流的python /R脚本，但是我不确定仅仅执行HS是否真的能使所有节点工作如果可能，请告诉我在群集上运行流的方向

浏览 21提问于2020-04-25得票数 0

1回答

hive/hadoop中的告警通知

、

我想知道是否有一种方法可以在hive中设置警报，例如，如果作业失败，我想知道我是否可以运行shell脚本或发送电子邮件。我的hive作业通常需要几个小时，如果失败，我希望立即得到通知，这样如果作业失败，我就可以立即采取行动。或者至少请告诉我，我是否可以在hadoop中设置类似的警报？

浏览 3提问于2014-08-31得票数 0

1回答

如何使用CloudWatch或堆栈驱动程序来验证cron作业是否运行？

、、、、

适用于这个问题的一个特殊用例是，我们在AWS、EC2和中都有一些资源，可以通过cron来完成夜间磁盘快照。我认为一种方法是使用“度量缺勤”之类的方法，但我不认为CloudWatch或Stackdriver可以做一些大于24小时的窗口。其他用例将是我们希望监视的任何其他特定于应用程

浏览 0提问于2017-08-10得票数 1

2回答

如何在Google中发送失败作业的警报通知？

、、、

我想知道是否有一种方法可以连接在Dataproc中提交的作业的一些通知。我们计划使用Dataproc运行一个24/7的流式应用程序，但是Dataproc似乎没有一种通知失败作业的方法。

浏览 3提问于2016-07-22得票数 2

2回答

纱线组分

、、、

还想知道为什么上面的链接图的底部框中没有应用程序主程序？我不是在寻找它做了什么，而是它是什么！(像=>一样，不确定容器是否意味着像spring容器(这意味着jar文件的列表？)或者它的服务器就像网络服务器？应用程序母版是否意味着简单的Java类？)

浏览 7提问于2013-12-20得票数 1

回答已采纳

1回答

如何了解Hadoop中任务在各个时间段的处理速度

、、、

当我运行Hadoop程序时，我想知道它每次运行的速度。我如何知道速度，例如在10%的任务完成后？

浏览 0提问于2016-10-28得票数 0

1回答

关于Oracle 11.2中的警报的问题

、、

我想知道在我之前配置它的人是否配置了任何警报，也许可以通知审计事件。我根据https://docs.oracle.com/database/121/SUTIL/GUID-8D62D6A0-99F4-465C-B088-5CCF259B7D80.htm#SUTIL1519中的示例发出以下命令show alertSQL> show alert从命令行有任何方式显

浏览 0提问于2018-09-18得票数 0

回答已采纳

1回答

日志传送-监视服务器下移-复制正在发生但不在辅助服务器上恢复

、、

这个周末发生了一些事情，这是第一次--由于我无法控制的电气问题，日志运输监视器服务器暂时关闭了。在此期间，当我查看主计算机和辅助计算机时，这两台机器都已启动并运行，.trn文件仍在按预期的方式从主计算机复制到辅助计算机。然而，次要实例根本没有恢复.trn文件。我收到通知：这是意料之中吗？主程序和辅助程序都在<e

浏览 0提问于2015-04-13得票数 1

回答已采纳

3回答

如何监视SQL服务器上失败的作业步骤？

、

我们有两台MS服务器(一台2000和一台2005)，在白天和晚上的不同时间运行多个作业。这些作业有许多步骤，这些步骤将从Informix数据库(我们的业务系统)中提取数据，并更新表以供各种报告和生产系统使用。上周末，这些进口产品出现故障，导致许多报告系统提供了错误的数据。由于安全限制，我们无法启用从服务器发送电子邮件，因此，我们如何能够有效地监视这些工作，而不必不断地检查企业经理或MS中的

浏览 0提问于2009-06-22得票数 2

回答已采纳

1回答

我想了解如何在Hadoop中使用KFS作为文件系统来实现mapreduce。 .因此，假设我的输入文件分散在不同的节点(Kosmos服务器)中，我(使用KFS作为文件系统的hadoop客户端)如何发出Mapreduce命令？此外，在发出Mapreduce命令之后，我的hadoop客户端将从不同服务器获取所有数据到本地计算机，然后执行Mapreduce，还是会在输入文件所在的机器上启动TaskTracker守护进程，

浏览 1提问于2013-02-22得票数 0

回答已采纳

1回答

Oozie堆栈跟踪

、、

我正在尝试使用星火的SparkSubmit Java类将星火作业提交给Oozie，如主类org.apache.oozie.action.hadoop.JavaMain，退出代码1是否有任何方法访问执行错误日志/堆栈跟踪，以便我能够看到实际发生的情况？

浏览 5提问于2015-06-01得票数 0

回答已采纳

1回答

Hadoop Cassandra Pig - row count查询运行速度很慢，只有一个map任务

、、

我有一个4节点的Cassandra集群，它也是一个hadoop集群当我运行pig脚本来选择和计算Cassandra表的行数时-它会创建具有1个map任务的hadoop作业-并且需要很长时间才能完成该作业为什么hadoop不创建多个地图作业？

浏览 1提问于2015-02-18得票数 0

1回答

当MapReduce作业运行时，应该查找什么？

、、、、

我正在开始使用Hadoop -我想知道感谢您的见解

浏览 0提问于2015-05-30得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在Hadoop中监视和发送长时间运行的作业的警报

相关·内容

如何在Hadoop中监视和发送长时间运行的作业的警报

日志文件中的时间戳

监控服务器、进程、服务、任务计划程序状态

如何使用Java -jar命令运行映射减少作业

如何在oozie中设置作业失败警报？

如何在伪分布模式下的Hadoop中运行Nutch

Laravel5.1:事件和邮件的区别:队列？

如何在Hadoop集群上运行Hadoop* Streaming？*

hive/hadoop中的告警通知

如何使用CloudWatch或堆栈驱动程序来验证cron作业是否运行？

如何在Google中发送失败作业的警报通知？

纱线组分

如何了解Hadoop中任务在各个时间段的处理速度

关于Oracle 11.2中的警报的问题

日志传送-监视服务器下移-复制正在发生但不在辅助服务器上恢复

如何监视SQL服务器上失败的作业步骤？

关于KFS的Mapreduce是如何发生的？

Oozie堆栈跟踪

Hadoop Cassandra Pig - row count查询运行速度很慢，只有一个map任务

当MapReduce作业运行时，应该查找什么？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐