我在impala中有一个关于数据局部性的问题,假设我有10个数据节点的集群(在每个数据节点上有impalad),如果我在impala SELECT * FROM big_table where dt='假设分区(dt=2017')下的文件在dn 1,3,5中,那么如果我要执行查询,协调器是只使用守护进程1,3,5进行数据定位,还是使用所有的守护进程,而其他守护进程将远程读取此数据?
我刚刚创建了EMR集群,并尝试创建我的第一个Impala表。获取此错误:此Impala守护进程未准备好接受用户请求。状态:正在等待来自StateStore的目录更新。有什么建议吗?d0bf3eae1df0f437bb4d0e44649293756ccdc76c)Query: show tables
ERROR: AnalysisException: This Impala