《Streaming Systems》第二章主要包含了四个问题和五个概念。
《Streaming Systems》第二章总结了构建一个正确、稳定、低时延的流处理系统将会面临的四个问题及其解决办法:
上述的核心概念再深入的了解一下:
第二章相对于第一章难度有所增加,因为第一章的概念(例如事件时间、处理时间和窗口)是自然而然引入的,而第二章提出的四个问题和额外引申的三个概念(触发器、水印和累计类型)需要对业务很强的抽象能力,不易理解。不过这些概念在Flink和Spark 2.X中都有相应的实现,其中以Flink实现的最为完整,因此可以在code过程中加以练习,感触这些概念是如何影响流处理框架构建的。
PS:最后,单纯地阅读纸质书实际是不完备的,因为有很多动画在书中无法体现。建议有机会地话,可以在Safari上查看对应地动画。