我正在编写一个Flink应用程序,它使用kafka主题中的时间序列数据。时间序列数据包含指标名称、标记键值对、时间戳和值等组件。我还想检查上面窗口之外是否有任何延迟到达的指标。我想要检查有多少指标延迟到达,并计算与原始指标相比延迟指标的百分比。我正在考虑使用flink的"allowedLateness“功能将延迟指标发送到不同的流。我计划在主"Aggregate the data“操作符中添加一个"MapState”,它将
我在Flink (Java)中创建了一个程序来计算3个不同房间平均9个假传感器。如果启动jar文件,程序运行良好。为什么我不能看到作业在仪表板()上运行,但是如果我看到日志文件(尾-f日志/flink-客户机-*-T430.log),我可以看到正在处理的东西?此外,print()方法正在将输出溢出到控制台。我使用以下命令./bin/flink run examples/explore-flink
我有一个Flink作业,其中一个statefull操作符需要保持一个包含HashMap作为属性的类的状态,因为这个hasMap为用户保留了不同的亲缘关系,例如:*/此hashMap用于跟踪这些亲缘关系,并在特定时刻请求用户的颜色亲和力,并获得最高亲和力值的键,即值9的蓝色。由于hashMaps不是Flink序列化的一部分,所以我需要将implement Seria
我想在流应用程序中使用KLL sketch。问题是KLL草图是有状态的计算,因此不是幂等的。这是否可以使用在波束或Flink中实现,最好是在Python中?Apache Datasketch说是Integration efforts have started with ApacheFlink and Apache Impala.There is also interest from Apa