使用正常的k流,kafka将每个应用程序的偏移量存储在其内部偏移主题上。在重新启动应用程序时,应用程序将根据auto.offset.reset策略重新处理主题。这确实是的解释。我正在使用kafka流的GlobalKTable在应用程序上复制数据。但是,我对应用程序的重新启动有点困惑,因为在重新启动后(由于部署或崩溃) id (**StreamsConfig.APPLICATION_ID_CONFIG**)不更改的应用程序中没有填充。此外,对于支持Glo
我使用Python和Hadoop流,但我无法找到任何方法来配置Hadoop流以获得每一行的偏移量,正如所说,使用TextInputFormat。还有一个在StackOverflow上询问同样的事情,但是对于如何做到这一点没有任何反应。说要抛弃keys of LongWritable class,但我不确定这是否是偏移量。如何配置作业以获得偏移量?是否需要生成从TextInputFormat派生的新类而不</e