Java编写不依赖于上层API(DataFrame/RDD)易于扩展,可以添加新的优化,同时保持向后兼容提供物理信息,如大小、分区等支持Streaming Source/Sink灵活、强大和事务性的写入APISpark2.3
Kafka9092TCP消息队列Kafka Connect8083HTTP数据连接器Cerebro RPC8006/9006HTTP/Thrift核心 RPC 服务Cerebro REST8005HTTPREST APISpark