yarn.scheduler.maximum-allocation-vcores
值的影响。此处指定的slot数量如果超过yarn的maximum-allocation-vcores,flink启动会报错。在yarn模式,flink启动的task manager个数可以参照如下计算公式:num_of_tm = ceil(parallelism / slot) 即并行度除以slot个数,结果向上取整。
jobmanager.archive.fs.dir
配置的目录,以便history server能够读取到已完成的任务信息。taskmanager.network.memory.max
和taskmanager.network.memory.min
,本配置项会被覆盖。yarn-site.xml
中的yarn.resourcemanager.am.max-attemps
的值。linger.ms
配置项。当数据在缓存中的时间超过linger.ms
时,无论缓存中数据是否达到批量大小,都会被强制发送出去。ack 数据源是否需要kafka得到确认。all表示需要收到所有ISR节点的确认信息,1表示只需要收到kafka leader的确认信息,0表示不需要任何确认信息。该配置项需要对数据精准性和延迟吞吐量做出权衡。
Flink单个task manager的slot数量必须介于这两个值之间
Flink的job manager 和task manager内存不得超过container最大分配内存大小。
yarn.nodemanager.resource.cpu-vcores yarn的虚拟CPU内核数,建议设置为物理CPU核心数的2-3倍,如果设置过少,会导致CPU资源无法被充分利用,跑任务的时候CPU占用率不高。