腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1153)
视频
沙龙
1
回答
Flink
streaming
:
事件
是否
根据
它们
的
键
分别
分
发到
每个
任务
槽
?
、
、
、
例如,如果我有按键A排序
的
事件
和按键B排序
的
事件
,并行度为2。是不是所有按键A
的
事件
都去一个
任务
槽
,而
键
B
的
事件
都去另一个
任务
槽
? 如果我只按键A
的
顺序获取
事件
,会发生什么情况?
它们
是否
也会分布到两个
任务
槽
中。这
是否
意味着我失去了
它
浏览 20
提问于2021-11-01
得票数 0
回答已采纳
1
回答
什么是
Flink
的
操作员?操作符状态和
键
状态有何不同?
据我理解,
Flink
中
的
运算符有源运算符、变换运算符等。对于
Flink
中
的
运算符,我
的
理解
是否
正确?在操作符状态中,
Flink
是为
每个
作业/
任务
维护
每个
操作符
的
状态(map()、or ()等)还是维护一个完整作业/
任务
的
状态?另外,如果我
的
作业提交了多个并行性,那么
每个
槽
会有自己
的<
浏览 0
提问于2019-07-22
得票数 2
回答已采纳
1
回答
在Apache中聚合两种不同类型
的
记录
我有一个特定
的
任务
,使用Apache
Flink
和一些额外
的
逻辑将两个数据流连接到一个聚合中。
事件
数据流( Data of events )开始
根据
某些
键
在某个聚合或窗口中不断积累Type A;T
浏览 6
提问于2020-07-06
得票数 0
回答已采纳
1
回答
Apache
Flink
-如何对齐
Flink
和Kafka切分
、
、
我正在为一个大容量流用例(每秒数以千万计
的
事件
)开发一个DataStream-based
Flink
应用程序。这些数据是从卡夫卡主题中消耗
的
,并且已经
根据
特定
的
键
进行了切分。我
的
意图是在
Flink
端创建特定于
键
的
状态,以运行自定义分析。我无法解决
的
主要问题是,如何创建键控状态,而不对keyBy()强加
的
传入数据进行重新配置。我可以保证
Flink
作
浏览 4
提问于2022-08-08
得票数 2
回答已采纳
1
回答
从时间窗口到接收器管道之间
的
操作顺序
、
或者,
是否
可以让另一个插槽运行中间流水线,而另一组正在运行sinkCassandra操作?编辑(
根据
评论对话添加更多要求): 我想要做
的
是有效地
根据
数据存储中
的
flink
data key进行查找,然后执行更新并刷新更新后
的
数据。filters -> keyBy/TimeWindow/statefulReduce -> sinkCassandra躲避,是因为状态可能会变得很大(1天到7天,我可以将7天作为最大时间界限),而我不一定知道<e
浏览 0
提问于2020-03-19
得票数 0
1
回答
Apache :两个(或更多)
任务
管理器之间
的
共享状态
、
、
假设我有两个
任务
管理器,
每个
任务
管理器只有一个
任务
槽
。如果这是错误
的
,请您向解释一下
Flink
是如何管理以下场景
的
? 假设总是有两个
任务
管理器,物理上位于两个集群节点上。
每个
任务
管理器总是只有一个
槽
。我运行上述作业并设置为2
的
并行性(例如,在将作业发送到作业管理器时使用-p参数)。现在,
Flink
将从我
的
工作中创建两个子
浏览 7
提问于2020-02-05
得票数 0
回答已采纳
1
回答
用动态限制
Flink
中
的
网络流量
、
、
、
在询问之后,我了解到
Flink
将在集群中
的
物理主机上拆分流
的
读取。
Flink
然后将传入
的
事件
转发给将聚合器
任务
分配给对应于给定
事件
的
键
空间
的
主机。非常聪明,可以为主机上
的
本地聚合器
任务
分配一个
键
空间,该密钥空间将对应于同一主机上
的
Kinesis使用者
任务
正在从?读取
的
键
空间(
浏览 4
提问于2020-02-18
得票数 0
回答已采纳
2
回答
apache会话支持
、
、
我正在研究Apache流,以便在我们
的
ETL和机器学习平台中使用。我还没有弄明白
的
是如何将
事件
流成“会话”。更描述性:所有
事件
都包含一个会话id,为了丰富数据,我需要将属于会话
的
所有
事件
分组在一起。请考虑
事件
是源源不断
的
(因此没有批处理支持,之后您可以简单地执行groupBy )。 一种可能
的
解决方案可能是维护会话
的
LRU缓存,并将所有传入
事件
排序到
它们
关联
的
会话
浏览 4
提问于2015-10-31
得票数 3
1
回答
Flink
State
是否
应用于大型和中期存储?
、
、
、
、
KDA中
的
每个
KPU (有点像
任务
管理器)都有50 in
的
RockDB存储空间。已启用增量状态。 我们
的
应用程序正在从Kinesis读取所有客户
的
事件
,并发送到不同
的
目的地。当一个目的地变得不可访问时,我们希望将该目的地
的
事件
存储到
Flink
State中,以便稍后重新发送
它们
,而不是停止整个处理。为了避免
Flink
中
的
内存不足,我们使用Rock
浏览 40
提问于2021-08-05
得票数 0
2
回答
如何使用
Flink
对无序
事件
时间流进行排序
、
介绍了如何使用
Flink
对无序流进行排序,但我更愿意使用DataStream API。将使用一个使用PriorityQueue来缓冲
事件
的
ProcessFunction来实现这一点,直到水印表明
它们
不再是无序
的
,但是在RocksDB状态后端(问题是每次对PriorityQueue
的
访问都需要整个PriorityQueue
的
ser/de )时,
它们
的
性能很差。无论使用
的
是哪种状态后端,我如何有效地做到这一点?
浏览 2
提问于2019-12-24
得票数 5
1
回答
运动流与
Flink
、
、
我有一个关于在动态流中分片数据
的
问题。在将用户数据发送到我
的
动态流时,我希望使用一个随机分区
键
,以便碎片中
的
数据分布均匀。为了简化这个问题,我想通过在我
的
Flink
应用程序中键入一个userId来聚合用户数据。我
的
问题是:如果碎片是随机分区
的
,以便将一个userId
的
数据分散到多个Kinesis中,那么
Flink
能否处理多个碎片
的
读取,然后重新分发数据,以便将单个userId
的
所有
浏览 3
提问于2020-02-14
得票数 0
回答已采纳
1
回答
在StreamAPI上高效
的
Flink
排序
、
、
让我们以
Flink
示例中定义
的
页面视图
的
用例为例。此示例尝试聚合每15
分
钟窗口
的
页面查看计数。 如果我想要改变这一点以获得15个窗口
的
前3个页面浏览量,那么有效
的
方法是什么?问题是- windowAll会将并行度降低到1,并且它要求将所有数据放在同一个
任务
槽
中以执行排序操作。理想情况下,当我们只有几个不同
的
键
(即不同
的
页面URL)时,这是很好
的
。在我
的</
浏览 0
提问于2021-02-15
得票数 0
1
回答
获取用于处理后期
事件
的
前一个窗口值
、
、
我正在寻找一种设置窗口以允许延迟
的
方法,并让我
根据
以前为会话计算
的
值来计算值。Kaf
浏览 0
提问于2018-05-17
得票数 1
回答已采纳
2
回答
Flink
密钥流慢性能
、
、
我有一个
Flink
应用程序,它使用Kafka作为源,在这个流上应用平面映射和聚合。source -> flatmap ->聚合(窗口5
分
钟) -> sink 1名职务经理(40但是当我应用keyby(200个
键
)时,性能下降了60%。而不是卡夫卡消耗20 8GB/min,它
的
消费8GB/min。a
浏览 2
提问于2021-07-11
得票数 1
1
回答
Flink
状态后端在失败后无法恢复
任务
管理器。
、
我刚开始使用
flink
,我正在实现一个模式识别模块(不使用CEP实现模式匹配),它将从EventHub主题读取json流,如果模式匹配,则推送到另一个
事件
中心主题。我
的
模块功能如下I使用
的
是一个RichSourceFunction,它将从API读取模式并发送到广播流 我正在使用
Flink
BroadcastProcessFunction来
根据
广播状态中可用
的
模式列表来处理数据,并且我没有使用
键
流或我
的
程序中<em
浏览 8
提问于2021-01-29
得票数 0
1
回答
有没有可能让不同
的
密钥有独立
的
水印?
我正在使用
Flink
1.12并且我有一个键控流,在我
的
代码中看起来A和B共享相同
的
水印?-30 10:50:15,没有B
的
输出 我想问,
是否
有可能使不同
的
密钥具有独立
的
水印?import org.apache.
flink
.
streaming
.api.TimeCharacteristic import org.apache.
flink
.
streaming
.api.functions.Assigner
浏览 12
提问于2021-05-02
得票数 0
回答已采纳
2
回答
具有自定义源
的
Flink
工作流并行性
、
Flink
的
Web中生成
的
执行图如下:我有一个集群或2个工作人员设置为
每个
有6个
槽
(他们都有6个核心,也)。执行我
的
工作流程
的
其余部分具有并行性12,这看起来是正确
的
,因为通过检查
任务
管理器
的
日志,我从所有的插槽(例如,....如果是,这一特定时隙
的
资源是如何分配
的
?
是否
有人可以解释在这个工作流中正在执行
的
步骤?例如(这可能是错误<e
浏览 3
提问于2020-08-31
得票数 0
回答已采纳
1
回答
Flink
流:比较来自不同窗口
的
事件
、
我想对其中一些进行基准测试,所以我已经从
Flink
开始了。我们认为被分析
的
事件
是形式
的
一个元组。在窗口1中,我们有:(A,1),(B,2),(C,3),在窗口2中,我们有:(D,6)和(B,7)。然后,我需要比较当前窗口中
的
事
浏览 2
提问于2017-05-12
得票数 2
回答已采纳
1
回答
是否
可以使用qsub在具有多核
的
机器上分发作业?
、
、
、
我
的
机器有8个内核,
是否
可以
分别
在这8个内核上使用PBS服务器分发作业(一组不同
的
程序)? 如果没有,有没有其他
的
替代方案。程序
的
主脚本在并行模式下使用qsub在节点上分配6个不同
的
作业,但当用户不选择并行选项时,它只使用一个核心,而不是其他核心。
浏览 1
提问于2016-03-10
得票数 0
1
回答
任务
管理器在
Flink
群集上被终止
当我启动我
的
程序时(我在jobmanager上执行),我得到了以下错误(在程序没有真正执行一
分
钟后):其中,giordano-2-2-100-1是作业-
任务
管理器
的
地址我将
任务
槽
的
数量设置为等于机器内
浏览 0
提问于2017-09-16
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Flink 运行架构详解
flink和spark Streaming中的Back Pressure
从Storm到Flink:大数据处理的开源系统及编程模型
百亿条日志实时处理,为什么要用Flink?
《从0到1学习Flink》——Apache Flink 介绍
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券