本实战项目使用 Structured Streaming 来实时的分析处理用户对广告点击的行为数据.
一. 数据生成方式
使用代码的方式持续的生成数据, 然后写入到 kafka 中.
...然后Structured Streaming 负责从 kafka 消费数据, 并对数据根据需求进行分析.
二....数据生成模块
模拟出来的数据格式:
时间戳,地区,城市,用户 id,广告 id
1566035129449,华南,深圳,101,2
1....产生循环不断的数据到指定的 topic
创建模块spark-realtime模块
1....先看一下随机生成的数据
// 这时候需要注释MockRealtimeData中的这两行代码
?
?
4. 确认 kafka 中数据是否生成成功
?
本次的分享就到这里了