我目前无法在我们的databricks AWS环境中划分出任何集群。
当我尝试启动一个随需应变的集群时,它在20+分钟内保持在“待定”状态(在相对较小的集群上,通常需要2-3分钟才能启动)。
类似地,我所有的计划作业都失败了,因为它们的工作集群也无法启动。这是一个示例错误消息:
Run result unavailable: job failed with error message Unexpected failure while waiting for the cluster [cluster_name] to be ready. Cause Cluster [cluster_name] is unusable since the driver is unhealthy.当我试图调查这个问题时,驱动程序日志完全是空的。我尝试使用运行时9.1和10.4启动集群,并看到了同样的问题。
有人见过这个吗?这是databricks问题还是AWS问题?
发布于 2022-04-20 19:55:08
,有人见过这个吗?这是databricks问题还是AWS问题?
是的我以前见过这个。几乎在所有情况下,它都是云提供商的问题,在几个小时内就解决了自己的问题。我在一次网络变革之后也看到了这一点,一台新的VPC已经建立起来。除非您的网络已经改变,如果问题仍然存在,我将向databricks注册一张支持票。
https://stackoverflow.com/questions/71941989
复制相似问题