在2.29.0版本上,我有一个已经工作了一年的管道。然而,本周我们不能再构建了,因为这个已经从Redhat回购中删除了。我将管道升级为BeamVersion2.32.0。我们的管道使用SparkRunner,Spark的版本是: 3.2.0。然而,新的梁版本正在抛出一个异常。下面是我收到的错误和堆栈跟踪。有人知道我需要配置/更改什么才能让它再次工作吗?:593)
at org.apache
我有一个有状态的DoFn,它基本上对即将到来的元素进行批处理,当缓冲区达到一定大小时,缓冲区将被清除并将元素插入到BigQuery中。我注意到的是,管道有时会引发异常,该异常并不是停止作业运行。/runners/common.py", line 1213, in apache_beam.runners.common.DoFnRunner.process
File "