腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
PyFlink性能与Scala
的
比较
、
、
、
我们
的
目标是建立冷和热层
的
Lambda
架构
。冷(
批
)层将用Apache (PySpark)实现。但是对于热(
流
)层有不同
的
选择:火花
流
或Flink。因此,Apache是纯
流
的
,而不是Spark
的
微
批
,我倾向于选择Apache。但我唯一关心
的
是PyFlink
的
性能。PySpark
流
的
延迟会更少吗?它比Scala编写
的</e
浏览 3
提问于2021-11-05
得票数 1
回答已采纳
1
回答
箭
流
端到端是免费
的
吗?
我对箭
流
很困惑。描述Arrow
的
许多来源都只是转述了 然而,据我所知, 列式格式
的
序列化数据
的
基本单位是“记录批处理”。从语义上讲,记录
批
是一个有序
的
数组集合,称为其字段,每个数组具有相同
的
长度,但可能具有不同
的
数据类型。记录批处理
的
字段名和类型共同构成批处理
的
架构
。在本节中,我们定义了一种协议,用于将记录
批
序列化为
浏览 1
提问于2019-12-13
得票数 1
回答已采纳
1
回答
移动-消费者集群
我有一个运动
流
,用来排任务队列,比如发送电子邮件。我有一群消费者,他们应该阅读队列,然后发送电子邮件。在这种情况下,如果消费者从队列中读取某一项,则其他消费者不应读取同一项;另一项我将发送重复
的
电子邮件。 我怎样才能做到这一点?
浏览 4
提问于2016-04-08
得票数 0
回答已采纳
1
回答
基于M1苹果硅支持
的
DynamicSDKv9.1-M1模拟器
、
、
、
、
DynamicsSDKv9.0.x
的
提到M1 Mac不支持iOS模拟器。 在苹果M1设备上,SDK不支持在iOS模拟器上构建和调试BlackBerry Dynamic
应用
程序。如果是这样的话,除了通常升级SDK之外,是否还需要任何特殊
的
配置?我已经将SDK升级到了v9.1.x,但是在为iOS模拟器构建时,我遇到了iOS错误。但仍然期待着本土
的
支持。
浏览 7
提问于2021-04-20
得票数 0
回答已采纳
1
回答
火花结构化
流
避免延迟和检查点: startingOffsets最新版本不工作吗?
、
、
、
我正在为一个实时
应用
程序开发一个火花结构化流进程。超过30秒
的
邮件与此项目无关。我猜问题是我写
的
主题
的
HDFS检查点位置.下面是我<em
浏览 3
提问于2021-10-01
得票数 1
3
回答
当使用Spark结构化
流
时,如何才能获得当前批处理
的
聚合结果,如Spark
流
?
、
、
星火结构
流
( SSS )和星火
流
(SS)
的
一个很大
的
区别是SSS可以利用状态。它可以存储以前
批
的
聚合结果,并将当前结果与先前
的
结果一起
应用
。因此,它可以从输入流
的
一开始就得到真正
的
聚合结果。但有一种情况是,我们不希望得到与以前
的
statestore值合并
的
最终结果。我们只想得到(输出)当前批处理
的
聚合结果。在平台和框架方面,我们不能回到党卫军。因此,我
的<
浏览 0
提问于2018-01-23
得票数 3
回答已采纳
1
回答
如何在其中一个作业失败时关闭/杀死火花
流
应用
程序
、
我正在运行一个星火
流
应用
程序。有几次,其中一个作业由于某些运行时异常而失败。streaming将作业标记为失败,并继续处理下一个
流
批
。如果其中一个作业失败,是否有一个参数可以设置为通知Spark关闭
应用
程序(而不是处理下一个
流
批
)?我在独立集群模式上使用Spark1.4.1。
浏览 0
提问于2016-06-10
得票数 0
2
回答
HMVC模式
的
准确使用/消耗?
、
、
我正在努力理解HMVC,以及在我当前
的
MVC
应用
程序中如何或是否应该考虑它。关于这个关于MVC
架构
的
问题, 有时采用分层模型-视图-控制器(HMVC)模式(也称为表示-抽象-控制)是处理更复杂
的
接口和
应用
程序需求
的
好选择。“然而,在控制GUI元素(小部件)方面,传统
的
MVC范围是不够
的
。MVC不处理数据管理、事件管理和
应用
程序
流
的
复杂性。作为MVC三位
一体
浏览 1
提问于2011-08-16
得票数 2
回答已采纳
1
回答
Spark streaming每小时00:00运行处理
我正在尝试使用Spark每小时执行一次
流
数据处理,但我希望它开始时接近xx:00:00 (xx是小时id)。这是可能
的
,还是违背了Spark
的
意识形态?
浏览 1
提问于2018-08-09
得票数 0
4
回答
有哪些编程语言是用于机电
一体
化
的
?
、
有没有专为机电
一体
化编程而设计
的
语言?我知道LabView,这是一种数据
流
语言,但不确定它
的
主要平台。 除了c/c++之外,你能向我推荐一些语言吗?用于机电
一体
化(机器人、传感器编程等)主题
的
任何语言。
浏览 0
提问于2012-11-27
得票数 1
回答已采纳
2
回答
如何避免Lambda体系结构中
的
代码冗余?
、
、
我们有一个正在进行
的
批处理,如下所述。 同一
批
处理系统将消耗卡夫卡主题。新
的
火花
应用
程序将消耗卡夫
浏览 2
提问于2018-09-18
得票数 1
2
回答
运行cron每小时更新100万条记录失败
、
、
、
我们有一个拥有100多万用户
的
电子商务系统,订单表中有400万到500万条记录。我们使用codeigniter框架作为后台,Mysql作为数据库。由于用户和购买
的
数量过多,我们使用cron作业每小时更新订单详细信息和推荐奖励点数,以使事情正常工作。现在我们有这样一种情况,这些数据更新超过一个小时,下一
批
更新在完成前一
批
更新之前到达,从而导致系统死锁和失败。 我想知道不同可能
的
架构
和数据库扩展选项,以及摆脱这种情况
的
建议。我们仅使用单片
架构
来运行此<em
浏览 10
提问于2021-09-16
得票数 0
1
回答
从批处理顺序Mule ESB调用
流
、
、
我创建了一个批处理
流
。从一
批
流
,我调用另一
批
,从第二
批
,我调用简单
的
第三
流
。我
浏览 1
提问于2017-04-05
得票数 1
1
回答
是否有可能实现一个可靠
的
接收器,支持不优雅
的
关闭?
、
我很好奇,如果一个星火
流
应用
程序被优雅地击落是绝对必须
的
,还是它有通过预写日志导致重复数据
的
风险。在下面的场景中,我概述了队列接收器与队列交互时需要确认消息
的
步骤序列。火花队列接收器从队列中提取一
批
消息。 火花队
浏览 3
提问于2015-07-29
得票数 9
1
回答
火花结构化
流
作业如何处理
流
-静态DataFrame连接?
、
、
、
我有一个火花结构化
流
作业,它从cassandra和deltalake读取映射表,并加入流df。我想了解这里的确切机制。星火是否击中了这些数据来源(卡桑德拉和德尔塔雷克)
的
每一个周期
的
微
批
?
浏览 2
提问于2020-12-02
得票数 1
回答已采纳
1
回答
星火结构
流
-动态更新数据帧
的
模式
、
、
、
我有一个简单
的
结构化
流
作业,它监视CSV文件
的
目录,并编写拼花文件--在两者之间没有转换。,我希望始终使用最新
的
模式来构建我
的
数据框架,或者换句话说,从CSV文件中读取数据。虽然buildSchema()可以为我提供最新
的
模式,但我不知道如何定期调用它(或者每个CSV文件一次),然后使用最新
的
模式以某种方式重新生成或修改数据框架。在测试时,我观察到只有query对象在一
批
接一
批
地连续运行;我放置
的
log语句和用于模式
浏览 2
提问于2018-02-12
得票数 11
1
回答
tensorflow验证监视器
流
auc
、
在tensorflow验证监视器
流
auc中,它对流意味着什么?案例1:每次调用验证监视器时,都会重置auc状态,因为在每个验证步骤中,对10个
批
进行
流
处理。案例2: auc状态没有重置,因此
流
auc是从验证监视器
的
第一次调用中计算出来
的
。即,第一输出( 100步)从10<em
浏览 5
提问于2017-06-09
得票数 1
回答已采纳
1
回答
火花
流
缓存和转换
、
我是新来
的
火花,我使用星火
流
与卡夫卡..。假设我在第一
批
中得到100条记录,在第二
批
中得到120条记录,在第三
批
中得到80条记录。--> {sec 1 1,2,...100} --> {sec 2 1,2..120} --> {sec 3 1,2,..80}我想在处理第二
批
时使用
浏览 1
提问于2014-10-20
得票数 3
回答已采纳
2
回答
让一列模型火车进行大量
的
划时代有什么坏处吗?
、
、
、
、
我有一个有限
的
时间序列,我可以用它来训练模型,所以我决定增加数据。我使用
的
数据增强策略是非常基本
的
,但已经证明了提高了我
的
模型
的
准确性。从本质上讲,它接受了我所拥有的整个训练数据集,对所有的时间序列进行洗牌,并且增强过程在每一
批
中具体进行。在每一
批
中,我随机挑选,每批中
的
每个时间序列,开始点和结束点,使每一
批
包含不同长度
的
每个系列在
批
内
的
切片。这显然会创建一个几乎无穷无尽
的
浏览 0
提问于2019-01-27
得票数 2
回答已采纳
0
回答
Spark RDD apend
在Spark中,我以RDD
的
形式加载了一个数据集,并且喜欢不频繁地向其追加
流
数据。我知道RDDs是不可变
的
,因为它简化了锁定,等等。其他处理静态和
流
数据
的
方法是
一体
的
吗? 类似的问题以前也被问过:
浏览 7
提问于2016-12-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
流批一体技术在银行智能运营风控领域的应用(上)
打破数据孤岛,Apache Doris 助力纵腾集团快速构建流批一体数仓架构
Flink on Hive构建流批一体数仓
Flink1.11+Hive批流一体数仓
数据编织Data Fabric:批流一体的数据智能融合平台
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券