但是,Kappa架构无法处理历史数据,也无法保证数据的一致性
区别
主要差异如下:
Lambda架构:
三层架构:
Batch层:离线批处理历史数据
Serving层:在线服务查询和检索
Speed...、Flink 等
消息队列:Kafka
资源调度:YARN
协调服务:Zookeeper
这些框架和技术的组合实现了Lambda架构的三层架构模式
----
Kappa架构:
全流式处理,无批处理层...Kafka:消息队列,用于实时数据收集和传输
Flink:流批一体的计算框架,用于实时数据计算和处理
Spark Streaming:Spark的流式计算组件,用于实时数据计算
Storm:实时流式计算框架...其中,Flink和Spark Streaming作为新一代的流式计算框架,被广泛使用在Kappa架构中。Samza和Beam也具有流计算能力,但使用较少。...Storm作为老牌流计算框架,其使用也在逐渐减少。
Kafka作为消息队列,是整个Kappa架构中最为核心的技术,用于收集和传输实时数据流。