我试图在中间层集群上运行一个PySpark作业,但是我似乎无法让它运行。我知道Mesos不支持PySpark应用的集群部署模式,需要在客户端模式下运行。我相信这就是问题所在。当我尝试提交一个PySpark作业时,我得到了下面的输出。... socket.hpp:107] Shutdown failed on fd=48: Transport endpoint is not connected [107]
我认为在客户端模式下运行的sp
在亚马逊网络服务的文档中,他们指定了如何激活对Spark作业()的监控,但不是python外壳作业。使用原样的代码会给出这个错误:ModuleNotFoundError: No module named 'pyspark'
更糟糕的是,在注释掉from pyspark.context import SparkContextpython shell作业似乎不能访问glue上下文?