大家好,又见面了,我是你们的朋友全栈君。
def main(args: Array[String]): Unit = {
//设置log级别
Logger.getLogger("org").setLevel(Level.WARN)
val conf = new SparkConf().setAppName("WordCountDemo").setMaster("local")
val sc = new SparkContext(conf)
sc.textFile("hdfs://hadoop001:9000/in/word")
.flatMap(_.split(" ")).map((_,1)).reduceByKey(_ + _).collect().foreach(println(_))
sc.stop()
}
def main(args: Array[String]): Unit = {
val spark = SparkSession.builder()
.config("spark.executor.memory", "2g")
.appName("WordCount")
.master("local[6]")
.getOrCreate()
val sc = spark.sparkContext
val array = Array((1,"a b c d"),(2,"a b c"),(3,"a b"))
/** * 第一种写法 */
val rdd = sc.parallelize(array)
rdd.flatMap(x => {
val sub = ArrayBuffer.empty[(Int, String)]
x._2.split(" ").foreach(e => {
sub.+=((x._1, e))
})
sub.iterator
}).collect().foreach(println)
/** * 第二种写法 */
//rdd.flatMap(x=> x._2.split(" ").map(y =>(x._1,y))).collect().foreach(println)
sc.stop()
spark.close()
}
(1,a)
(1,b)
(1,c)
(1,d)
(2,a)
(2,b)
(2,c)
(3,a)
(3,b)
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/139838.html原文链接:https://javaforall.cn
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有