我正在尝试访问一个hive表,并从表/ dataframe中提取和转换某些列,然后将这些新列放到一个新的dataframe中。但是当我尝试运行它时,我会收到以下错误-
线程"main“中的异常:需求在org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveReferences(DataFrame.scala:133) at
我正在尝试将一些计算列添加到SparkR数据框中,如下所示:(unix_timestamp$$anonfun$resolve$1.apply(DataFrame.scala:159)
at org.apache.spark.sql.DataFrame$$anonfun$resolve$1.apply(DataFrame.sca
在Spark1.6.0中,我有一个包含职务描述的列的数据框架,如:bartenderemployee...我使用以下方法从该列检索唯一值列表:
val jobs = people.select("Description").distinct().rdd.map(r => r(0).asInstanceOf[所以至少应该有一个带有该工作的.任何暗示都欢迎你!<init