我有一个星火DataFrame:我必须使用Scala从中计算平均精度。我想,根据文档,我们必须使用RDD而不是DataFrame。/ It gave Array[(Any, Any)]
// df_rdd is org.apache.spark.rdd.RDD[(Any, Any)]
val metrics = new RankingMet
我已经和Scala 2.12一起使用过Spark 3.1.2了。我想在节点之间并行一些键,它们根据接收到的键来读取数据。因此,我必须先使用RDD,然后再将其转换为SparkDataFrame。但是,我无法将RDD转换为SparkDataFrame并收到以下错误: overloaded method value createDataFrame with alternatives:
我是新手/仍在学习Apache Spark/Scala。我正在尝试分析一个数据集,并已将该数据集加载到Scala中。但是,当我尝试执行基本分析时,例如最大值、最小值或平均值,我得到一个错误- error: value select is not a member of org.apache.spark.rdd.RDD我在一个组织的云实验室上运行Spark。代码: // Reading in the csv file
val df = sc.textFile(&qu