00:00
呃,那接下来呢,我们来coding啊,来这边呢,写一个data stream的专业测试啊。这个太子一是什么东西啊?啊,之前写的对吧。嗯,叫弗林零一。Data stream。Join。这里边儿我就不写注释了,我直接写了啊。啊,就是搞两个旅游嘛,对吧?啊environment.get。CTR加V得到一个env啊,Env点度为一啊,注意看啊,B度为一啊,然后env点。ADD source对吧?嗯,诶不是a source,我们直接用socket就简单一点啊。Socket,然后呢哈杜甫。102,然后呢,8888端口。
01:04
这样我搞两个招聘啊。第一。String类型,ID。啊,那邓总就是自己学的对吧,优秀啊,给邓总点赞啊,就是该该表扬表扬对吧,你迟到了,该唱歌还得唱歌,这个功过不相抵啊。Name。浪类型,TS。好,这是B1,咱们再来一个B2。
02:02
ID。TS,因为他要一个什么,要一个事件时间还记得吧,所以呢,我们都加了一个TS啊,还是一样的,把这个呢加上。好,那这个呢,我们转化为B1,然后提取这个时间戳可以吧,点。一行数据啊呃,咱们呢,按照逗号分割啊,假如说数据呢,是逗号的。
03:05
是不是列的2OK吧,好,那接下来呢。呃,乱序呢,也不用设置乱序了,对吧,因为本身在关联的时候。啊,他就是要给一个范围,所以呢,我们直接用。增长的这种就行了,对吧。这个呢,是冰一。1000L。好,卡尔威得到一个。B。1DS对吧,好把它呢复制一份啊。来个冰二可以吧?这个呢,用9999端口啊呃,B2。根号。导一下啊。
04:02
然后这边是B2。好,都改过来了吧,这就行了,把这个B1B2,那我们两个理由呢,就已经准备好了,对吧?啊注意一下没有没改的吧,都改了啊,如果没改的话,他肯定会报错。接下来呢,我们叫关联对吧,它是两个监控流进行关联的啊,所以呢,我们叫B1 Ds.K啊,然后呢,用B1。改id.interval join对吧,然后呢,B2。ds.kby,然后呢,是并二里边的get ID啊接下来看啊,这里边能够写的,诶那也就说就有事件时间,处理时间,我选处理时间我不可以可以不提吗?这个没用,你你调用它没用,指定语义指定时间语义没用,你知道吗?因为关文档,那现在告诉你他只是把这个功能放在这儿了,但是呢,不生效。
05:00
没有写功能对吧,他只是说把这个架子放在这,未来呢,可能有这个可以选对吧,那现在呢,官方的告诉你只能应用于实践时间,所以就别选了,直接写这个between对吧?啊给一个时间范围,那我们呢,假如说是负五到五秒可以吧,两个流呢,我们都是五秒啊。五秒钟对吧,接下来点。好,那这两个参数。呃,叫lower bound exclusive,还有一个up bound exclusive,那这里面呢,有个上下边界就是负五到五对吧,本来交易范围默认呢,左臂右臂就是这个点。可以包含对吧,当然呢,你可以加,诶把这个点去掉,两个都加上,就左开右开,就开曲线,一般来说我们就不加了,对吧,直接process啊,没有一个process。状语方式B1B2,然后这个不用想,就是输出吧,前面B1B2输入嘛,输出呢,哦,偷个懒啊,不写招病了TOP2。
06:04
第一。第二。好,那输出数据直接out.connect有一个top two,然后呢。Right,对吧?把它写出去,这就是我们join的结果。Join就这么简单,你看啊,你想想看啊,你之前Spark streaming里边写那么多的代码。还记得吗?啊,又搞什么搞这搞那的对吧,在我们Li里边一行代码给你搞定了。就是以前你在Spark streaming里边写的双流状语写那么多对吧,现在呢一行。结束了。怎么长,这就是有状态的好处,对吧,因为你之前用red那个东西是不是相当于link里面状态的这个作用啊,是不是起到了这个作用,对吧,起到这个作用啊,所以呢,在这边我们fli里边直接一行代码搞定啊,那我们把这个打印一下啊。
07:21
啊,这个不要了吧,行,就叫这个名字。
我来说两句