在这个中,Apache建议在写入BigQuery时使用死信模式。此模式允许您用'FailedRows'标记从转换输出中获取未能写入的行。/runners/common.py", line 1198,
in apache_beam.runners.common.DoFnRunner.process File "apache_beam"apache</e
我以前在堆栈溢出()上看到过这个问题的答案,但是自从apache为python添加了可拆分的dofn功能之后,我就没有看到这个问题了。当将文件模式传递给gcs桶时,如何访问正在处理的当前文件的文件名?我想将文件名传递到转换函数中:
with beam.Pipeline(options=pipeline_options) as p:最后,当我转换json的每一行时,我要做的是将文件名传递到转换函数中(请参阅,然后使用文件名在另一个BQ<