云计算分布式框架 Hadoop

107课时
3K学过
8分

课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
5分钟

分析 main() 函数

main方法中使用的ToolRunner类是一个运行MapReduce任务的辅助工具类。

//主函数main
public static void main(String[] args) throws Exception {
    if(args.length != 2){
        //输入路径,输出路径
        System.err.println("Usage: WordCount <input path> <output path>");
        System.exit(-1);
        //运用WordCount()
        int res = ToolRunner.run(new Configuration(), new WordCount(), args);
        System.exit(res);
    }
}

在所述的JobConf对象中,程序员可以设定各种参数,定制如何完成一个计算任务。这些参数在很多情况下就是一个Java接口,通过注入这些接口的特定实现,可以定义一个计算任务(job)的全部细节。了解这些参数及其默认设置,才能在编写自己的并行计算程序时做到轻车熟路、游刃有余,明白哪些类是需要自己实现的,哪些类用Hadoop的默认实现即可。