----
主要价值
Kafka 为数据管道带来的主要价值在于:
它可以作为一个大型的缓冲区,有效地解耦数据生产者和消费者。
它在安全性和效率方面非常可靠,是构建数据管道的最佳选择。...Connect 会自动重启失败的任务,并继续同步数据而不会丢失。
常见数据源和目的地已经内置。比如 mysql、postgres、elasticsearch 等连接器已经开发完成,很容易就可以使用。...和 Storm 联合,构建实时计算工具。
和 Hadoop 相结合,用于实时和批量计算。
----
构建数据管道时需要考虑的主要问题
及时性:支持不同的及时性需求,能够进行迁移。...Kafka 起buffer作用,生产者和消费者解耦,支持实时和批处理。
可靠性:避免单点故障,能够快速恢复。Kafka 支持至少一次传递,结合外部系统可以实现仅一次传递。...使用 Kafka 构建的数据管道,可以同时服务于实时和批处理的场景,具有高可用、高吞吐、高扩展性等特征。