前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >oozie 运行demo

oozie 运行demo

作者头像
岑玉海
发布于 2018-02-28 11:12:33
发布于 2018-02-28 11:12:33
1.7K0
举报
文章被收录于专栏:岑玉海岑玉海

昨晚装好了oozie,能启动了,并且配置了mysql作为数据库,好了,今天要执行oozie自带的demo了,好家伙,一执行就报错!报错很多,就不一一列举了,就说我最后解决的方法吧。 oozie job -oozie http://localhost:11000/oozie -config examples/apps/map-reduce/job.properties –run 这句话需要在oozie的目录里面执行,然后在网上查了很多资料,最后搞定了,需要修改三个配置文件。 在说修改配置文件之前,还漏了一些东西,先补上,首先我们需要解压目录下面的oozie-examples.tar.gz,oozie-client-3.3.2.tar.gz, oozie-sharelib-3.3.2.tar.gz,然后把examples和share目录上传到fs上面去。 hadoop fs -put examples examples hadoop fs -put share share 然后在/etc/profile配置oozie-client的环境变量。 接下来说怎么解决的oozie的吧。 1.修改oozie的conf目录下的oozie-site.xml 增加以下内容:

<property> <name>oozie.services</name> <value> org.apache.oozie.service.SchedulerService, org.apache.oozie.service.InstrumentationService, org.apache.oozie.service.CallableQueueService, org.apache.oozie.service.UUIDService, org.apache.oozie.service.ELService, org.apache.oozie.service.AuthorizationService, org.apache.oozie.service.MemoryLocksService, org.apache.oozie.service.DagXLogInfoService, org.apache.oozie.service.SchemaService, org.apache.oozie.service.LiteWorkflowAppService, org.apache.oozie.service.JPAService, org.apache.oozie.service.StoreService, org.apache.oozie.service.CoordinatorStoreService, org.apache.oozie.service.SLAStoreService, org.apache.oozie.service.DBLiteWorkflowStoreService, org.apache.oozie.service.CallbackService, org.apache.oozie.service.ActionService, org.apache.oozie.service.ActionCheckerService, org.apache.oozie.service.RecoveryService, org.apache.oozie.service.PurgeService, org.apache.oozie.service.CoordinatorEngineService, org.apache.oozie.service.BundleEngineService, org.apache.oozie.service.DagEngineService, org.apache.oozie.service.CoordMaterializeTriggerService, org.apache.oozie.service.StatusTransitService, org.apache.oozie.service.PauseTransitService, org.apache.oozie.service.HadoopAccessorService </value> <description> All services to be created and managed by Oozie Services singleton. Class names must be separated by commas. </description> </property> <property> <name>oozie.service.ProxyUserService.proxyuser.cenyuhai.hosts</name> <value>*</value> <description> List of hosts the '#USER#' user is allowed to perform 'doAs' operations. The '#USER#' must be replaced with the username o the user who is allowed to perform 'doAs' operations. The value can be the '*' wildcard or a list of hostnames. For multiple users copy this property and replace the user name in the property name. </description> </property> <property> <name>oozie.service.ProxyUserService.proxyuser.cenyuhai.groups</name> <value>*</value> <description> List of groups the '#USER#' user is allowed to impersonate users from to perform 'doAs' operations. The '#USER#' must be replaced with the username o the user who is allowed to perform 'doAs' operations. The value can be the '*' wildcard or a list of groups. For multiple users copy this property and replace the user name in the property name. </description> </property>

2.修改oozie-env.sh,增加以下内容

export OOZIE_CONF=${OOZIE_HOME}/conf export OOZIE_DATA=${OOZIE_HOME}/data export OOZIE_LOG=${OOZIE_HOME}/logs export CATALINA_BASE=${OOZIE_HOME}/oozie-server export CATALINA_TMPDIR=${OOZIE_HOME}/oozie-server/temp export CATALINA_OUT=${OOZIE_LOG}/catalina.out

3.修改所有节点的hadoop的配置文件core-site.xml,

<property> <name>hadoop.proxyuser.cenyuhai.hosts</name> <value>hadoop.Master</value> </property> <property> <name>hadoop.proxyuser.cenyuhai.groups</name> <value>cenyuhai</value> </property>

然后重启就可以执行了,里面的cenyuhai是我的本机账号。 补充:在进行完上述配置之后,作业可以提交了,但是提交了MR作业之后,在web页面中查看,遇到了一个错误:  JA006: Call to localhost/127.0.0.1:9001 failed on connection exception: java.net.ConnectException: Connection refused  这个问题排查了很久,都没有得到解决 ,最后通过修改job.properties,把jobTracker从localhost:9001改成下面的全称才行,这个可能跟我的hadoop的  jobTracker设置有关,所以遇到有这方面问题的童鞋可以试试。 nameNode=hdfs://192.168.1.133:9000 jobTracker=http://192.168.1.133:9001 接下来我们接着运行hive的demo,运行之前记得修改hive的demo的job.properties,改为上面写的那样。 然后提交,提交成功了,但是在web页面上查看状态为KILLED,被干掉了。。。 错误代码:JA018,错误消息:org/apache/hadoop/hive/cli/CliDriver 然后我就想着可能是jar包的问题,删掉share目录下的hive目录里的所有jar包,然后把自己机器上的hive的所有jar包复制到该目录下。 然后上传到共享目录上: hadoop fs -put share share 再次提交,就可以查看到成功的状态啦! oozie job -oozie http://localhost:11000/oozie -config examples/apps/hive/job.properties -run 但是这个坑爹的玩意儿,其实是把数据插入到了Derby中。。。无语了,虽然现实成功了,但是没有用。。。因为我们配置了外置的mysql数据库,那怎么办呢? 需要修改workflow.xml,把其中的configuration的配置节改成下面的样子。

代码语言:js
AI代码解释
复制

 <configuration>                 
 <property>                     
 <name>mapred.job.queue.name</name>                     
 <value>${queueName}</value>                 
 </property>         
 <property>                 
 <name>hive.metastore.local</name>                 
 <value>true</value>             
 </property>             
 <property>                 
 <name>javax.jdo.option.ConnectionURL</name>                 
 <value>jdbc:mysql://192.168.1.133:3306/hive?createDatabaseIfNotExist=true</value>             
 </property>             
 <property>                     
 <name>javax.jdo.option.ConnectionDriverName</name>                 
 <value>com.mysql.jdbc.Driver</value>        
      </property>      
        <property>                
  <name>javax.jdo.option.ConnectionUserName</name>               
       <value>hive</value>           
    </property>         
           <property>     
                   <name>javax.jdo.option.ConnectionPassword</name>                
            <value>mysql</value>               
                    </property>      
                      <property>                
                     <name>hive.metastore.warehouse.dir</name>                 
                      <value>/user/hive/warehouse</value>        
                      </property>  
                      </configuration>

然后提交之后,在hive中就可以查询到你所建立的表啦,oh,yeah!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2013-08-18 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Oozie4.0.1详细安装教程
1、编译oozie     环境条件: Unix box (tested on Mac OS X and Linux) Java JDK 1.6+ Maven 3.0.1+ Hadoop 0.20.2+ Pig 0.7+
星哥玩云
2022/07/03
7040
什么是Oozie?如何使用Oozie?蒟蒻博主带你快速上手Oozie!
本篇博客,博主为大家介绍的是Oozie,一种运行在hadoop平台上的工作流调度引擎。如果看完后有点收获,不妨给博主一个大大的赞|ू・ω・` )
大数据梦想家
2021/01/27
2.5K0
什么是Oozie?如何使用Oozie?蒟蒻博主带你快速上手Oozie!
Hadoop 2.0 大家族(三)
  Hive是一个构建在Hadoop上的数据仓库框架,它起源于Facebook内部信息处理平台。Hive是一个构建在Hadoop上的数据仓库框架,它起源于Facebook内部信息处理平台。
Francek Chen
2025/01/22
680
Hadoop 2.0 大家族(三)
大数据技术之_14_Oozie学习
  Oozie 英文翻译为:驯象人。一个基于工作流引擎的开源框架,由 Cloudera 公司贡献给 Apache,提供对 Hadoop MapReduce、Pig Jobs 的任务调度与协调。Oozie 需要部署到 Java Servlet 容器中运行。主要用于定时调度任务,多任务可以按照执行的逻辑顺序调度。
黑泽君
2019/03/19
1.1K0
大数据技术之_14_Oozie学习
快速学习-Oozie的使用
目标:使用Oozie调度MapReduce任务 分步执行: 1)找到一个可以运行的mapreduce任务的jar包(可以用官方的,也可以是自己写的) 2)拷贝官方模板到oozie-apps
cwl_java
2020/02/20
1K0
进击大数据系列(十一)Hadoop 任务调度框架 Oozie
Oozie 是一个用来管理 Hadoop 生态圈 job 的工作流调度系统。由 Cloudera公司贡献给 Apache。
民工哥
2023/08/22
8220
进击大数据系列(十一)Hadoop 任务调度框架 Oozie
Oozie工作流分析
我们在实际的生成操作中经常需要将一些任务在晚上开启进行定时执行,或者多个作业,例如hive,mapreduce,shell等任务的组合调用。
Tim在路上
2020/08/04
1.3K0
oozie java api提交作业
今晚试验用java的api来提交代码,由于代码是在我机器上写的,然后提交到我的虚拟机集群当中去,所以中间产生了一个错误。。要想在任意一台机器上向oozie提交作业的话,需要对hadoop的core-site.xml文件进行设置,复制到所有机器上,然后重启hadoop集群。 设置如下: <property> <name>hadoop.proxyuser.cenyuhai.hosts</name> <value>*</value> </property> <property>
岑玉海
2018/03/01
1.5K0
oozie java api提交作业
Oozie多任务串联和定时任务执行?看这篇就懂了!
写在前面: 博主是一名大数据的初学者,昵称来源于《爱丽丝梦游仙境》中的Alice和自己的昵称。作为一名互联网小白,写博客一方面是为了记录自己的学习历程,一方面是希望能够帮助到很多和自己一样处于起步阶段的萌新。由于水平有限,博客中难免会有一些错误,有纰漏之处恳请各位大佬不吝赐教!个人小站:http://alices.ibilibili.xyz/ , 博客主页:https://alice.blog.csdn.net/ 尽管当前水平可能不及各位大佬,但我还是希望自己能够做得更好,因为一天的生活就是一生的缩影。
大数据梦想家
2021/01/27
1.2K0
Oozie多任务串联和定时任务执行?看这篇就懂了!
驭象者之Apache Oozie
(1)Apache Oozie是什么? Oozie在英语中的释义指的是:驯象人,驭象者(多指缅甸那边的俗称),这个比喻相对与它的功能来说,还是很恰当的。 Apache Oozie是一个用来管理Hadoop任务的工作流调度系统,是基于有向无环图的模型(DAG)。Oozie支持大多数的Hadoop任务的组合,常见的有Java MapReduce,Streaming map-reduce,Pig,Hive, Sqoop , Distcp,也可以结合一些脚本如Shell,Python,Java来很灵活的完成
我是攻城师
2018/05/11
1.1K0
Oozie快速入门系列(2) | 一文带你快速了解Oozie的使用(超详细!!!)
一. Oozie调度shell脚本 目标:使用Oozie调度Shell脚本   大体过程如下: 1. 创建工作目录 [bigdata@hadoop002 oozie-4.0.0-cdh5.3
不温卜火
2020/10/28
7010
Oozie快速入门系列(2) | 一文带你快速了解Oozie的使用(超详细!!!)
Oozie如何和安装部署
1、Oozie的简单介绍: 1、Oozie是一个工作流引擎服务器,用于运行hadoop map/reduce和hive等任务工作流,同时Oozie还是一个Java web程序,运行在Java Servlet容器中,如Tomcat中。Oozie以action为基本任务单元,可以将多个action构成一个DAG图,(有向五环图Direct Acyclic Graph)的模式进行运行。Oozie工作流通过HPDL(一种通过XML自定义处理的语言)来构造Oozie的工作流。一个Oozie服务器主要包括四个服务:Oo
别先生
2018/04/16
2.2K0
Oozie如何和安装部署
「EMR 开发指南」之 Oozie 作业调度
本文将使用oozie组件自带的例子,详细介绍如何在oozie workflow上提交一个MapReduce jar。 本文以oozie 4.3.1版本为例。
岳涛
2023/11/30
2050
「EMR 开发指南」之 Oozie 作业调度
数据分析高级教程(三)
oozie job -D inpath=/weblog/input -D outpath=/weblog/outpre-config weblog/job.properties -run
我被狗咬了
2019/09/23
4570
数据分析高级教程(三)
Oozie分布式任务的工作流——邮件篇
在大数据的当下,各种spark和hadoop的框架层出不穷。各种高端的计算框架,分布式任务如乱花般迷眼。你是否有这种困惑!——有了许多的分布式任务,但是每天需要固定时间跑任务,自己写个调度,既不稳定,又没有可靠的通知。 想要了解Oozie的基础知识,可以参考这里 那么你应该是在找——Oozie。 Oozie是一款支持分布式任务调度的开源框架,它支持很多的分布式任务,比如map reduce,spark,sqoop,pig甚至shell等等。你可以以各种方式调度它们,把它们组成工作流。每个工作流节点可以
用户1154259
2018/01/17
1.7K0
Oozie分布式任务的工作流——邮件篇
oozie 重新提交作业
  在oozie的运行过程当中可能会出现错误,比如数据库连接不上,或者作业执行报错导致流程进入suspend或者killed状态,这个时候我们就要分析了,如果确实是数据或者是网络有问题,我们比如把问题解决了才可以重新运行作业。重新运行作业分两种情况,suspend状态和killed状态的,这两种状态是要通过不同的处理方式来处理的。   (1)suspend状态的我们可以用resume方式来在挂起的地方恢复作业,重新运行,或者是先杀掉它,让它进入killed状态,再进行重新运行。 public sta
岑玉海
2018/03/01
1.2K0
spark报错---安装系列八
1.自从spark2.0.0发布没有assembly的包了,在jars里面,是很多小jar包
Dlimeng
2023/06/29
2720
spark报错---安装系列八
oozie 客户端常用命令
1.提交作业,作业进入PREP状态 oozie job -oozie http://localhost:11000/oozie -config job.properties -submit job: 14-20090525161321-oozie-joe 2.执行已提交的作业 oozie job -oozie http://localhost:11000/oozie -start 14-20090525161321-oozie-joe 3.直接运行作业
岑玉海
2018/03/01
1.2K0
基于Hadoop生态圈的数据仓库实践 —— ETL(三)
三、使用Oozie定期自动执行ETL 1. Oozie简介 (1)Oozie是什么 Oozie是一个管理Hadoop作业、可伸缩、可扩展、可靠的工作流调度系统,其工作流作业是由一系列动作构成的有向无环图(DAGs),协调器作业是按时间频率周期性触发的Oozie工作流作业。Oozie支持的作业类型有Java map-reduce、Streaming map-reduce、Pig、 Hive、Sqoop和Distcp,及其Java程序和shell脚本等特定的系统作业。 第一版Oozie是一个基于工作流引擎的服务器,通过执行Hadoop Map/Reduce和Pig作业的动作运行工作流作业。第二版Oozie是一个基于协调器引擎的服务器,按时间和数据触发工作流执行。它可以基于时间(如每小时执行一次)或数据可用性(如等待输入数据完成后再执行)连续运行工作流。第三版Oozie是一个基于Bundle引擎的服务器。它提供更高级别的抽象,批量处理一系列协调器应用。用户可以在bundle级别启动、停止、挂起、继续、重做协调器作业,这样可以更好地简化操作控制。 (2)为什么需要Oozie
用户1148526
2019/05/25
1.1K0
我的 Hive 3.1.2 之旅 【收藏夹吃灰系列】
同样,这部也属于收藏夹吃灰系列。看在写了辣么多字儿,险些把PP坐出ZC的份儿上,各位看官来个三连呗!
Lenis
2021/04/19
2.1K0
我的 Hive 3.1.2 之旅 【收藏夹吃灰系列】
相关推荐
Oozie4.0.1详细安装教程
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档