我在使用从CircleCI启动的GCP Dataflow runner运行python Apache光束管道时遇到了严重的问题。基本上,我运行的是在数据流中运行并使用google-api-python-client-1.12.3的python Apache光束管道。如果我从CircleCI中运行相同的作业,则会创建数据流作业,但它会失败,并显示一条ImportError: No m
通过调用函数ReadableFile.readFullyAsUTF8String,尝试使用数据流作业中的apache光束FileIO读取大小为10+ GB的CSV文件。而且,它失败了,错误如下。ByteArrayOutputStream.java:93) at org.apache.beam.sdk.util.St