由于不能修改sparkscala中的特定列值,我在连接这两个数据框视图时遇到了困难。我想我必须以某种方式做一个转置/连接,但我不能弄清楚它。这是第一个数据帧: var sample_df = Seq(("john","morning","7am"),("john","night","10pm"),("bob&
我正在使用Datastax spark- Cassandra -connector来访问Cassandra中的一些数据。加入后,生成的RDD如下所示 com.datastax.spark.connector.rdd.CassandraJoinRDD[org.apache.spark.sql.Row, CassandraJoinRDD[17] at RDD at Cassandr
我有sparkscala应用程序。我正在尝试使用它内部的Futures来并行化几个独立的操作集。我在期货中调用它们,它们返回给我未来类型的DataFrame,我如何在最后合并它们,并在任何未来类型无法计算的情况下抛出错误。下面是我的代码。当我尝试在onComplete块中应用数据帧的联合时,它显示以下错误
value union is not a member of scala.concurrent.Future[(scal