我需要遍历列表中的每个元素,对数据库运行此查询,并将结果附加到相同的dataframe (df)中。你能告诉我如何做到这一点吗? PS :我正在使用spark scala来解决这个问题。List((select * from table1 where a=10 ) as rules, (select* from table1 where c=10 ) as rules) 谢谢。
我需要在SparkSQL中传递参数。例如,我有以下查询作为Val时间戳=spark.sql("select timestamp from tablea "),现在,我有另一个查询要在where类Spark.sql中传递这个时间戳(s“selecttimestamp from tableb where timestamp = '$timestamp‘")。
对于某些数据帧,它似乎是持久化的,而对于其他数据帧,则不是,即使我在所有数据帧上都使用了persisting方法// loading csv as dataframe and creatingdataframes using src and test and using persist on all 3 for later useval changed_data= spark.