我被阻止使用spark.sql迁移语句以访问bigQuery表。因为它不工作sql查询,并且提供表/视图没有找到错误。例:df=spark.sql("select a.* from tableA a left join tableB b where a.id=b.id")
我知道spark.read.format('bigquery').option('table'
spark作业中有多个查询,当我开始这个作业时,我发现每个查询都会与kafka建立连接,并且它们之间不共享数据,所以如何缓存数据以避免多次读取相同的数据。我曾尝试使用命令“cache table cache_table;”缓存表,然后 Queries with streaming sources must be executed with writeStream.start();;org.apache.spark.sql.catalyst.analysis