我正在尝试教自己Scala,并使用IntelliJ的想法作为我的IDE。我已经启动IntelliJ的shell,运行console,然后输入以下内容:import org.apache.spark.sqlmember of val dataFrames = Seq(df.featuresGroup1(groupBy<
我正在尝试为我的每个用户构建一个向量,其中包含每天每小时的平均记录数。因此,向量必须有24个维度。我最初的DataFrame有userID和hour列,andI从执行groupBy并计算每个用户每小时的记录数开始,如下所示:
val hourFreqDF = df.groupBy("userID","hour").agg(count("*") as "hfreq&q