我正在使用scala的azure-cosmosdb-spark库,并且我试图查询以下内容 select top 1 * from c 但我得到的最终数据帧计数是8而不是1。我怀疑CosmosDBRDDIterator将其拆分成多个分区(在本例中为8)并处理查询。 无论执行的是select查询,结果计数始终是实际结果计数的8倍。有没有什么方法可以避免这种情况,并使我的</em
我有sparkscala应用程序。我正在尝试使用它内部的Futures来并行化几个独立的操作集。我在期货中调用它们,它们返回给我未来类型的DataFrame,我如何在最后合并它们,并在任何未来类型无法计算的情况下抛出错误。下面是我的代码。当我尝试在onComplete块中应用数据帧的联合时,它显示以下错误
value union is not a member
我们如何在一个数据帧中的多个列上进行透视。例如,这里提到的例子,https://spark.apache.org/docs/latest/sql-ref-syntax-qry-select-pivot.html SELECT * FROM person我们不能在Sparkscala的pivot方法中传递多个参数,因为它只需要一个列名作为参数。我们如