我刚开始使用scala框架,下面是有子查询的查询。根据我有限的知识火花不支持子查询,而且一次支持多个列?select id, email from test1 group by id ,email ;
在spark上面的查询转换成这样,但是问题是我们如何使用来自不同数据帧的哪个条件。我们如何将整个查询转换为spark?
我正在开发一个程序,在该程序中,我需要根据特定条件显示数据集中的特定行。这些条件适用于我为机器学习模型创建的features专栏。这个features列是一个向量列,当我试图通过传递一个Vector值来过滤它时,我得到了以下错误:
Exception in thread "main" java.lang.RuntimeException: Unsupported literal type class org.apache.spark