开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何触发现在预定的oozie作业？

触发现有预定的Oozie作业，可以通过以下步骤完成：

在Oozie中创建工作流程（Workflow）：工作流程是由一系列的动作（Action）组成的有向无环图（DAG），描述了作业的执行流程和依赖关系。可以使用Oozie的工作流程定义语言（Workflow Definition Language）编写工作流程。
配置调度规则：在Oozie中，可以配置调度规则，以决定何时触发预定的作业。调度规则可以基于时间（定时触发）、数据依赖关系等多种条件来进行配置。
提交工作流程：将编写好的工作流程提交给Oozie进行调度和执行。可以通过Oozie的命令行工具、Web界面或API进行提交操作。
监控作业执行状态：可以通过Oozie的监控工具来实时监控作业的执行状态。Oozie会提供作业的执行日志、错误信息等详细信息，便于排查和分析问题。

总结起来，触发现有预定的Oozie作业的步骤包括创建工作流程、配置调度规则、提交工作流程和监控作业执行状态。通过这些步骤，可以实现根据预定的规则自动触发Oozie作业的执行。

请注意，Oozie是Apache软件基金会的开源项目，是一个用于协调和执行大规模数据处理工作流程的工具。如果您需要了解更多关于Oozie的详细信息，可以访问腾讯云文档中有关Oozie的介绍和使用指南： Oozie - 腾讯云文档

相关搜索:oozie工作流触发在特定队列上启动作业如何在提交oozie作业时覆盖oozie.service.WorkflowAppService.WorkflowDefinitionMaxLength属性如何在oozie中删除排队的协调器作业？Oozie抑制shell作业操作的日志记录？自动控制运行类似Oozie作业的数量如何查找由oozie ( hadoop )作业运行的hadoop应用程序当文件夹的大小达到某个阈值时，是否可以通过oozie触发spark作业？如何仅手动触发Helm作业的运行？Jenkins:如何快速列出由特定上游作业触发的下游作业？Oozie协调器-基于文件事件的触发器-多重触发如何列出在我的数据库中运行的预定作业？未触发作业的状态 Jenkins跳过作业的自动触发在prod环境中，Quartz作业间歇性地在预定时间触发未命中如何在引导时触发Jenkins作业 Terratest如何触发和等待胶水作业触发的Webjob作业应该完成吗？如何在Laravel 5.2中触发后续作业 gitlab CI/CD:如何仅触发特定作业如何在Nestjs bull中一次执行预定义数量的作业

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

针对 Hadoop 的 Oozie 工作流管理引擎的实际应用

Apache Oozie 是用于 Hadoop 平台的一种工作流调度引擎。该框架（如图 1 所示）使用 Oozie协调器促进了相互依赖的重复工作之间的协调，您可以使用预定的时间或数据可用性来触发 Apache Oozie。您可以使用 Oozie bundle系统提交或维护一组协调应用程序。作为本练习的一部分，Oozie 运行了一个 Apache Sqoop 作业，以便在 MySQL数据库中的数据上执行导入操作，并将数据传输到 Hadoop 分布式文件系统 (HDFS) 中。可以利用导入的数据集执行 Sqoop合并操作，从而更新较旧的数据集。通过利用 UNIX shell 操作，可从 MySQL 数据库中提取用来执行 Sqoop 作业的元数据。同理，可执行 Java操作来更新 Sqoop 作业所需的 MySQL 数据库中的元数据。

03

Kettle构建Hadoop ETL实践（七）：定期自动执行ETL作业

一旦数据仓库开始使用，就需要不断从源系统给数据仓库提供新数据。为了确保数据流的稳定，需要使用所在平台上可用的任务调度器来调度ETL定期执行。调度模块是ETL系统必不可少的组成部分，它不但是数据仓库的基本需求，也对项目的成功起着举足轻重的作用。

05

OushuDB入门（六）——任务调度篇

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/80408771

01

HAWQ取代传统数仓实践（五）——自动调度工作流（Oozie、Falcon）

一旦数据仓库开始使用，就需要不断从源系统给数据仓库提供新数据。为了确保数据流的稳定，需要使用所在平台上可用的任务调度器来调度ETL定期执行。调度模块是ETL系统必不可少的组成部分，它不

06

基于Hadoop生态圈的数据仓库实践 —— ETL（三）

三、使用Oozie定期自动执行ETL 1. Oozie简介（1）Oozie是什么 Oozie是一个管理Hadoop作业、可伸缩、可扩展、可靠的工作流调度系统，其工作流作业是由一系列动作构成的有向无环图（DAGs），协调器作业是按时间频率周期性触发的Oozie工作流作业。Oozie支持的作业类型有Java map-reduce、Streaming map-reduce、Pig、 Hive、Sqoop和Distcp，及其Java程序和shell脚本等特定的系统作业。第一版Oozie是一个基于工作流引擎的服务器，通过执行Hadoop Map/Reduce和Pig作业的动作运行工作流作业。第二版Oozie是一个基于协调器引擎的服务器，按时间和数据触发工作流执行。它可以基于时间（如每小时执行一次）或数据可用性（如等待输入数据完成后再执行）连续运行工作流。第三版Oozie是一个基于Bundle引擎的服务器。它提供更高级别的抽象，批量处理一系列协调器应用。用户可以在bundle级别启动、停止、挂起、继续、重做协调器作业，这样可以更好地简化操作控制。（2）为什么需要Oozie

02

工作流引擎比较：Airflow、Azkaban、Conductor、Oozie和 Amazon Step Functions

我不是任何这些引擎的专家，但已经使用了其中的一些（Airflow和Azkaban）并检查了代码，对于其他一些产品，我要么只阅读代码（Conductor）或文档（Oozie / AWS步骤函数），由于大多数是OSS项目，我当然可能错过了某些未记录的功能或社区贡献的插件。如果你发现任何错误，我很乐意更新。

03

Oozie 快速入门

设想一下，当你的系统引入了spark或者hadoop以后，基于Spark和Hadoop已经做了一些任务，比如一连串的Map Reduce任务，但是他们之间彼此右前后依赖的顺序，因此你必须要等一个任务执行成功后，再手动执行第二个任务。是不是很烦！这个时候Oozie（驯象人，典故来自评论一楼）就派上用场了，它可以把多个任务组成一个工作流，自动完成任务的调用。简介 Oozie是一个基于工作流引擎的服务器，可以在上面运行Hadoop的Map Reduce和Pig任务。它其实就是一个运行在Java Serv

08

【开源】etl作业调度工具性能综合对比

最近遇到了很多正在研究ETL及其工具的伙伴向我们抱怨：同样都在用 Kettle ，起点明明没差异，但为什么别人ETL做的那么快那么好，自己却不断掉坑？

02

Hadoop数据分析平台实战——180Oozie工作流使用介绍离线数据分析平台实战——180Oozie工作流使用介绍

离线数据分析平台实战——180Oozie工作流使用介绍 Oozie工作流介绍 Oozie的四大组件服务分别是: workflow, coordinator, bundle和sla。其中sla是作为监控服务协议的一个组件， workflow定义oozie的基本工作流， coordinator定义定时(或者是根据其他资源指标)运行的workflow任务， bundle是将多个coordinator作为一个组件一起管理。也就是说workflow是oozie中最基本的一个服务组件。三大服务的的关系

05

进击大数据系列（十一）Hadoop 任务调度框架 Oozie

Oozie 是一个用来管理 Hadoop 生态圈 job 的工作流调度系统。由 Cloudera公司贡献给 Apache。

02

10级商用版Kettle作业调度工具taskctl免费开源

taskctl是一款由成都塔斯克信息技术公司历经10年研发的etl作业集群调度工具，该产品概念新颖，体系完整、功能全面、使用简单、操作流畅，它不仅有完整的调度核心、灵活的扩展，同时具备完整的应用体系。目前已获得金融，政府，制造，零售，健康，互联网等领域1000多家头部客户认可。

04

DAG算法在hadoop中的应用

大学里面数据结构里面有专门的一章图论，可惜当年没有认真学习，现在不得不再次捡起来。真是少壮不努力，老大徒伤悲呀！什么是DAG（Directed Acyclical Graphs），先来看下教科书上的定义吧：如果一个有向图无法从某个顶点出发经过若干条边回到该点。让我们再来看看DAG算法现在都应用在哪些hadoop引擎中。 Tez: Hortonworks开发的DAG计算框架，是从MapReduce计算框架演化而来的通用DAG计算框架，核心思想是将Map和Reduce两个操作进一步拆分，即Map被拆分成In

08

Oozie工作流分析

我们在实际的生成操作中经常需要将一些任务在晚上开启进行定时执行，或者多个作业，例如hive,mapreduce,shell等任务的组合调用。

01

oozie 客户端常用命令

1.提交作业，作业进入PREP状态 oozie job -oozie http://localhost:11000/oozie -config job.properties -submit job: 14-20090525161321-oozie-joe 2.执行已提交的作业 oozie job -oozie http://localhost:11000/oozie -start 14-20090525161321-oozie-joe 3.直接运行作业

07

0498-Hue Sqoop1的编辑器中执行Sqoop作业失败问题分析

Hue做为Hadoop平台的一款UI工具，提供了丰富的功能。可以通过Hue访问Hadoop的文件系统、Hive、Impala、HBase、Solr、Sqoop等。集成了Oozie实现界面化工作流调度流程，同样也可以集成第三方APP及SQL等。本篇文章Fayson主要介绍在使用Hue提供的Sqoop1编辑功能执行Sqoop作业异常问题分析。

01

如何在Oozie中创建有依赖的WorkFlow

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。 Fayson的github： https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 ---- 在使用Hue创建WorkFlow时，单个WorkFlow中可以添加多个模块的依赖，使各个模块之间在WorkFlow内产生依赖关系，如果对于一个WorkFlow被其它多个WorkFlow依赖（如：AWorkFlow执行成功后，BWorkFlow和CWorkFlow依赖AWorkFl

09

【Dr.Elephant中文文档-4】开发者指南

为了在本地部署Dr.Elephant测试，你需要安装Hadoop(version 2.x)或者Spark(Yarn mode, version > 1.4.0)，以及资源管理服务和历史作业服务（可以用伪分布式）。关于伪分布式模式在 YARN 上运行 MapReduce 作业相关说明可以在这里(https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html)[1]找到。

02

oozie 重新提交作业

在oozie的运行过程当中可能会出现错误，比如数据库连接不上，或者作业执行报错导致流程进入suspend或者killed状态，这个时候我们就要分析了，如果确实是数据或者是网络有问题，我们比如把问题解决了才可以重新运行作业。重新运行作业分两种情况，suspend状态和killed状态的，这两种状态是要通过不同的处理方式来处理的。　　（1）suspend状态的我们可以用resume方式来在挂起的地方恢复作业，重新运行，或者是先杀掉它，让它进入killed状态，再进行重新运行。 public sta

09

如何使用Oozie API接口向Kerberos环境的CDH集群提交Spark2作业

前面Fayson介绍了多种方式在CDH集群外的节点向集群提交Spark作业，文章中均采用Spark1来做为示例，本篇文章主要介绍如何是用Oozie API向Kerberos环境的CDH集群提交Spark2作业。

04

Kettle与Hadoop（八）执行Oozie作业

/root/big_data/job.properties文件的内容如下：

02

如何使用Oozie API接口向Kerberos集群提交Java程序

在CDH集群外的节点向集群提交MapReduce作业的方式有多种，前面Fayson介绍了《如何跨平台在本地开发环境提交MapReduce作业到CDH集群》和《如何使用Oozie API接口向非Kerberos环境的CDH集群提交Java作业》，本篇文章主要介绍如何在Kerberos集群使用Oozie API接口向集群提交Java作业。

07

如何使用Oozie API接口向Kerberos环境的CDH集群提交Shell作业

前面Fayson介绍了使用Oozie API向Kerberos和非Kerberos集群提交Spark和Java作业，本篇文章主要介绍如何使用Oozie Client API向Kerberos环境的CDH集群提交Shell Action工作流。

06

0475-如何统一Hue和Oozie的时区

在前面的文章中，Fayson介绍过《如何修改Cloudera Manager的时区》，《如何修改Hue的时区》和《如何修改CDSW会话的时区》。在使用Hue创建调度任务的过程中，我们会发现Hue的时区与Oozie的调度时间不一致。默认Oozie使用的时区为UTC，在创建调度作业时还需要考虑在当前的时间减去8个小时才能达到我们的预期。在使用上非常不方便，这里Fayson主要介绍如何统一Hue和Oozie的时区。

03

oozie java api提交作业

今晚试验用java的api来提交代码，由于代码是在我机器上写的，然后提交到我的虚拟机集群当中去，所以中间产生了一个错误。。要想在任意一台机器上向oozie提交作业的话，需要对hadoop的core-site.xml文件进行设置，复制到所有机器上，然后重启hadoop集群。设置如下： <property> <name>hadoop.proxyuser.cenyuhai.hosts</name> <value>*</value> </property> <property>

07

如何使用Oozie API接口向非Kerberos环境的CDH集群提交Spark作业

在CDH集群外的节点向集群提交Spark作业的方式有多种，前面Fayson介绍了Livy相关的文章主要描述如何在集群外节点通过RESTful API接口向CDH集群提交Spark作业，本篇文章我们借助于oozie-client的API接口向非Kerberos集群提交Spark作业。

07

如何使用Hue创建Spark2的Oozie工作流（补充）

目前Oozie 的 SparkAction 仅支持Spark1.6, 而并不支持Spark2, 这是 CDH Spark2已知的局限性（https://www.cloudera.com/documentation/spark2/latest/topics/spark2_known_issues.html#ki_oozie_spark_action

06

将 Oozie 迁移到 CDP

将 Oozie 数据迁移到 CDP 后，您必须首先配置 Oozie，然后将自定义 ShareLib jar 迁移到您的新集群。

04

如何使用Oozie API接口向Kerberos环境的CDH集群提交Spark作业

在CDH集群外的节点向集群提交Spark作业的方式有多种，前面Fayson介绍了Livy相关的文章主要描述如何在集群外节点通过RESTful API接口向CDH集群提交Spark作业以及《如何使用Oozie API接口向非Kerberos环境的CDH集群提交Spark作业》，本篇文章主要介绍使用Oozie的API接口向Kerberos集群提交Spark作业。

07

如何使用Oozie API接口向非Kerberos环境的CDH集群提交Shell工作流

前面Fayson介绍了《如何使用Oozie API接口向非Kerberos环境的CDH集群提交Spark作业》和《如何使用Oozie API接口向非Kerberos环境的CDH集群提交Java作业》，本篇文章主要介绍如何使用Oozie Client API向非Kerberos环境的CDH集群提交Shell Action工作流。

07

如何使用Oozie API接口向非Kerberos环境的CDH集群提交Java作业

前面Fayson介绍了《如何使用Oozie API接口向非Kerberos环境的CDH集群提交Spark作业》，本篇文章主要介绍如何使用Oozie Client API向非Kerberos环境的CDH集群提交Java作业。

07

「EMR 开发指南」之 Oozie 作业调度

本文将使用oozie组件自带的例子，详细介绍如何在oozie workflow上提交一个MapReduce jar。本文以oozie 4.3.1版本为例。

02

自动化运维时代，运维失去价值了吗？

最近一直在思考，大家又谈到运维苦逼，没有成就感的事情，也促使我更加的想表达一下运维价值方面的东西。

05

【Dr.Elephant中文文档-2】管理员指南

Dr. Elephant依赖于 YARN 的资源管理服务器和历史作业记录服务器，来获取作业详细信息和记录。YARN 作业及其分析的详细信息将存储在当前配置的后端 mysql 中。因此在运行Dr. Elephant前，必须安装好 MySQL 和 hadoop 2。从#162开始，将不再支持JAVA 6。

02

[源码解析]Oozie来龙去脉之提交任务

Oozie是由Cloudera公司贡献给Apache的基于工作流引擎的开源框架，是Hadoop平台的开源的工作流调度引擎，用来管理Hadoop作业。本文是系列的第一篇，介绍Oozie的任务提交阶段。

03

Hadoop的生态系统介绍

Hadoop分布式文件系统是Hadoop项目的两大核心之一，是针对谷歌文件系统（GoogleFileSystem,GFS)的开源实现。是Hadoop体系中数据存储管理的基础。它是一个高度容错的系统，能检测和应对硬件故障，用于在低成本的通用硬件上运行。HDFS简化了文件的一致性模型，通过流式数据访问，提供高吞吐量应用程序数据访问功能，适合带有大型数据集的应用程序。

04

如何使用Hue上创建一个完整Oozie工作流

在使用CDH集群中经常会有一些特定顺序的作业需要在集群中运行，对于需要多个作业顺序执行的情况下，如何能够方便的构建一个完整的工作流在CDH集群中执行，前面Fayson也讲过关于Hue创建工作流的一系列文章具体可以参考《如何使用Hue创建Spark1和Spark2的Oozie工作流》、《如何使用Hue创建Spark2的Oozie工作流（补充）》、《如何在Hue中创建Ssh的Oozie工作流》。本篇文章主要讲述如何使用Hue创建一个以特定顺序运行的Oozie工作流。本文工作流程如下：

06

如何启用Oozie的HA

Oozie是基于Hadoop的作业调度工具，工作流引擎，在实际工作中，遇到对数据进行一连串的操作的时候很实用，不需要自己写一些处理代码了，只需要定义好各个action，然后把他们串在一个工作流里面就可以自动执行了。但Oozie在实际生产过程中，也会有单点故障问题，所以我们也需要考虑部署多个Oozie Server从而实现Oozie的HA。Oozie的HA是Acive-Active的模式，通过负载均衡如HAProxy来实现。本篇文章中主要讲述如何启用Oozie Server的HA。

06

数据调度平台系统二大种类及其实现方法与流程

调度系统，更确切地说，作业调度系统（Job Scheduler）或者说工作流调度系统（workflow Scheduler）是任何一个稍微有点规模，不是简单玩玩的大数据开发平台都必不可少的重要组成部分。

08

Hue中使用Oozie创建Ssh工作流时sudo命令执行失败问题分析

在使用Hue创建Ssh的Oozie工作流，在Shell脚本中执行sudo命令失败，异常如下：

05

Hadoop数据分析平台实战——170Oozie介绍及环境搭建离线数据分析平台实战——170Oozie介绍及环境搭建

离线数据分析平台实战——170Oozie介绍及环境搭建 Oozie介绍 Oozie是一个工作流引擎服务器,用于运行Hadoop Map/Reduce和Hive等任务工作流. 同时Oozie还是一个Java Web程序,运行在Java Servlet容器中,如Tomcat中。 Oozie以action为基本任务单位，可以将多个action构成一个DAG图（有向无环图Direct Acyclic Graph）的模式进行运行。 Oozie工作流通过HPDL(一种通过XML自定义处理的语言)来构造Oozie的

05

CDH——Cloudera’s Distribution Including Apache Hadoop

补充: 为什么在 Hadoop 2.x 中 HDFS 中有 ZKFC 进程，而 yarn 却没有？在 Hadoop 1.x 升级到 Hadoop 2.x 的过程中，考虑到向下兼容的问题， NameNode 进程没有嵌入 ZKFC 中的代码，而另外开辟一个进程 ZKFC 。再者由于 Hadoop 1.x 中没有 yarn 组件，Hadoop 2.x 中才出现的 yarn 组件，所以 yarn 不用考虑向下兼容的问题，即 ResourceManager 进程就直接嵌入 ZKFC 中的代码，只运行一个进程。

03

大数据之Oozie——源码分析（一）程序入口

工作中发现在oozie中使用sqoop与在shell中直接调度sqoop性能上有很大的差异。为了更深入的探索其中的缘由，开始了oozie的源码分析之路。今天第一天阅读源码，由于没有编译成功，不能运行测

07

【20】进大厂必须掌握的面试题-50个Hadoop面试

“大数据”是用于收集大型和复杂数据集的术语，这使得很难使用关系数据库管理工具或传统数据处理应用程序进行处理。很难捕获，整理，存储，搜索，共享，传输，分析和可视化大数据。大数据已成为公司的机遇。现在，他们可以成功地从数据中获取价值，并通过增强的业务决策能力在竞争者中拥有明显的优势。

01

oozie 运行demo

昨晚装好了oozie，能启动了，并且配置了mysql作为数据库，好了，今天要执行oozie自带的demo了，好家伙，一执行就报错！报错很多，就不一一列举了，就说我最后解决的方法吧。 oozie job -oozie http://localhost:11000/oozie -config examples/apps/map-reduce/job.properties –run 这句话需要在oozie的目录里面执行，然后在网上查了很多资料，最后搞定了，需要修改三个配置文件。在说修改配置文件之前，还漏

08

0462-如何在Hue中创建Shell Action工作流续

Fayson在前面的文章《Hue中使用Oozie创建Shell工作流在脚本中切换不同用户》，里面介绍了Shell Action的创建，在文中我们相应的Shell脚本是放在每个Oozie作业对应的WorkSpace的lib目录下。对于一些对于所有用于都公用的Shell脚本可能放在HDFS的公共目录下，那这时创建Shell Action需要注意些什么呢？本篇文章Fayson主要介绍在Hue中创建Shell Action指定工作空间外的Shell脚本。

07

0800-5.16.2-如何禁用Hue中Oozie的部分Action

在CDH集群中是通过Hue中的Oozie来进行作业调度的，同样Oozie也支持多种调度Action。为了防止业务用户使用存在风险的Action（如：Shell Action可以通过编写Shell命令获取操OS的信息问题），现需要将Hue中部分存在风险的Action禁用，本篇文章主要介绍如何禁用Hue中Oozie的部分Action。

03

Hadoop离线数据分析平台实战——430MR和Hive任务Oozie部署Hadoop离线数据分析平台实战——430MR和Hive任务Oozie部署

Hadoop离线数据分析平台实战——430MR和Hive任务Oozie部署参考：oozie\package-info.java 项目进度模块名称完成情况用户基本信息分析(MR)� 完成浏览器信息分析(MR) 完成地域信息分析(MR) 完成外链信息分析(MR) 完成用户浏览深度分析(Hive) 完成订单分析(Hive) 完成事件分析(Hive) 完成 MR程序Oozie workflow部署 MR程序有两种方式进行oozie部署，第一种就是使

09

[源码解析]Oozie来龙去脉之内部执行

Oozie由Cloudera公司贡献给Apache的基于工作流引擎的开源框架，是用于Hadoop平台的开源的工作流调度引擎，用来管理Hadoop作业，进行。本文是系列的第二篇，介绍Oozie的内部执行阶段。

02

hadoop记录

RDBMS Hadoop Data Types RDBMS relies on the structured data and the schema of the data is always known. Any kind of data can be stored into Hadoop i.e. Be it structured, unstructured or semi-structured. Processing RDBMS provides limited or no processing capabilities. Hadoop allows us to process the data which is distributed across the cluster in a parallel fashion. Schema on Read Vs. Write RDBMS is based on ‘schema on write’ where schema validation is done before loading the data. On the contrary, Hadoop follows the schema on read policy. Read/Write Speed In RDBMS, reads are fast because the schema of the data is already known. The writes are fast in HDFS because no schema validation happens during HDFS write. Cost Licensed software, therefore, I have to pay for the software. Hadoop is an open source framework. So, I don’t need to pay for the software. Best Fit Use Case RDBMS is used for OLTP (Online Trasanctional Processing) system. Hadoop is used for Data discovery, data analytics or OLAP system. RDBMS 与 Hadoop

03

如何在HUE上通过oozie调用Pig工作流

执行pig脚本将name_age_comma.txt文件中的逗号,转为竖线|，并输出到/user/hue/learn_oozie/mazy_pig_1/output路径下。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭