YARN:资源调度平台,用于资源分配和作业调度
所以,Lambda架构 typical 的技术框架主要是:
批处理:Hadoop、Hive、Spark 等
在线服务:HBase、Elasticsearch...:统一批流处理模型,实现无缝切换,由Apache开源
其他:
YARN:资源调度平台,用于在Kappa架构中资源的分配和调度
HDFS:分布式文件系统,用于数据的存储
Zookeeper:协调服务,用于...Kappa架构中各系统的协调
所以,Kappa架构典型的技术框架主要是:
流式计算:Flink、Spark Streaming、Storm、Samza、Beam 等
消息队列:Kafka
资源调度:YARN...其中,Flink和Spark Streaming作为新一代的流式计算框架,被广泛使用在Kappa架构中。Samza和Beam也具有流计算能力,但使用较少。...Storm作为老牌流计算框架,其使用也在逐渐减少。
Kafka作为消息队列,是整个Kappa架构中最为核心的技术,用于收集和传输实时数据流。