腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
同一
csv
进行
结构化
流式
写入
和
读取
、
在我的工作中,我正在将流
写入
CSV
文件,之后我想立即从流中
读取
。但是我的readstream失败了,因为在独立集群中运行时,我可以看到写流创建了一些crc文件
和
空白
csv
文件。# write stream spark.writestream().format("
csv
").option("path","myfile.
csv
").s
浏览 15
提问于2019-08-08
得票数 0
回答已采纳
2
回答
结构化
流式
写入
到不同的拼图文件夹
、
、
、
我正在使用spark structured streaming
从
kafka主题中
读取
事件,并对其
进行
处理并将其
写入
到parquet中。我必须根据我在事件中获得的键将输出
写入
不同的文件夹。我尝试使用
结构化
流式
处理示例始终指向特定的文件夹.Do我需要为每个文件夹启动一个流吗?
浏览 2
提问于2018-08-13
得票数 0
1
回答
Spark结构流作业被卡住数小时而未被杀死
、
、
、
、
我有一个
结构化
的
流式
作业,
从
kafka
读取
,执行聚合
和
写入
hdfs。该作业在yarn中以群集模式运行。我使用的是spark2.4。每隔2-3天,这项工作就会卡住。它不会失败,但会卡在某个微批处理中。当我终止
流式
作业并重新启动时,该作业再次开始正常运行。如何解决这个问题?
浏览 34
提问于2020-10-03
得票数 0
1
回答
spark structured streaming
和
batch的接收器相同吗?
、
、
、
、
一个是批处理作业,另一个是
结构化
流式
作业。两者都
写入
相同的文件接收器。两者具有相同的架构。但是,当
从
该接收器
读取
数据时,spark仅
读取
由
流式
作业创建的文件,并跳过由批处理作业创建的文件。当我删除这个文件夹时,spark开始
读取
所有文件。然而,这并不总是可能的,因为在下一个微批spark中将在那里创建另一个_spark_metadata文件夹。如何在spark中
读取
此接收器中的所有文件。
浏览 13
提问于2020-05-20
得票数 0
2
回答
如何在Mule 4中将大型
CSV
文件
写入
SFTP
、
、
、
我正在尝试将一个大的
CSV
文件
写入
SFTP。用于每个拆分记录并使用SFTP连接器
写入
。但是文件不能到达SFTP。我在这里做错了什么?matcher="filename-regex-filter" doc:id="bbfb12df-96a4-443f-a137-ef90c74e7de1" outputMimeType="application/
csv
浏览 18
提问于2021-08-26
得票数 0
1
回答
Apache Nifi :我想将我的数据
CSV
摄取到Elasticsearch,而不是使用apache nifi将其
流式
传输到其他处理器
、
、
、
我不想在将文件从一个处理器传递到另一个处理器时,在Stdout上
流式
传输我的
CSV
文件。现在,为了完成这个任
浏览 2
提问于2019-08-06
得票数 0
2
回答
JMETER在线程组之间
从
相同的
CSV
文件
进行
读写
在JMeter中,我有一个创建订单的线程组,我捕获了订单的相关细节,并将其
写入
csv
文件。相反,我想检查是否有
从
同一
csv
文件中
写入
和
读取
的选项,以避免提前
进行
数据准备。对如何实现这一点有什么建议吗?在多个用户
从
同一
文件
写入
和
读取
的情况下运行时出现的任何约束。谢谢
浏览 0
提问于2021-10-14
得票数 0
1
回答
如何在JMeter中自动更新有效负载中的行值时测试更新端点
、
、
、
、
对于所有其他端点,我能够在处理之前将ID存储在
CSV
文件中并加载它,但是我希望重用
CSV
中的值以
进行
更新,这需要更新和跟踪ID的Row Version属性。我将使用100个用户
和
100个订单
进行
测试,因此我需要将每个用户匹配到一个订单,这样他们就不会尝试更新
同一
个实体。步骤: 在JMet
浏览 4
提问于2019-10-03
得票数 0
1
回答
从新位置
进行
Spark
读取
保持输出目录不变
、
我有一个spark作业,它从源s3://bucket/ source -1文件夹
读取
(使用
结构化
流式
API),并
写入
s3://bucket/destination-1文件夹。现在,我希望
从
s3://bucket/source-2
读取
具有相同模式的数据(检查点位于s3://bucket/checkpoint-2),但我希望将其附加到相同的s3://bu
浏览 0
提问于2021-05-01
得票数 1
1
回答
如何在每次触发后更新HDFS文件?
、
、
我正在尝试将处理后的数据
写入
HDFS位置。经过长时间的试验
和
错误方法后,我获得了
写入
HDFS位置的数据,但现在的问题是,每当我向我的目录(我指向readStream)添加新文件时,旧文件在HDFS位置得到处理
和
更新。假设我已经开始
流式
传输,我已经添加了文件-1.
csv
在我的directory...nothing中被
写入
到HDFS location..Then我已经添加了文件-2.
csv
..仍然没有
写入
到HDFS,接下来我添加了文件-3
浏览 2
提问于2019-01-12
得票数 0
2
回答
在Android文件中读写大JSONObject
、
我正在尝试在文件中
写入
/
读取
json对象。json结构很复杂,并且是动态生成的。 对于小的json对象,我只需将json转换为字符串,然后
进行
字符串
写入
/
读取
。如何将JSONObject直接
流式
传输到文件,以及如何
从
文件直接
流式
传回JSONObject?
浏览 2
提问于2016-06-22
得票数 0
4
回答
对HDFS文件的一部分运行MR作业
假设您有一个大文件存储在hdtf中,其中包含
结构化
数据。现在的目标是只处理文件中的一部分数据,就像文件中第二列值介于so
和
so之间的所有行一样。是否可以启动MR作业,使hdfs仅
流式
传输文件的相关部分,而不是将所有内容
流式
传输到映射器。 原因是我想通过只处理我需要的部分来加快工作速度。请注意,目标是将数据保存在HDFS中,我不想从数据库中
读取
和
写入
数据。
浏览 0
提问于2012-01-26
得票数 1
回答已采纳
1
回答
未显示
结构化
流式
处理的
流式
处理选项卡
、
、
、
、
我正在使用
结构化
流媒体来
读取
csvs
和
写入
kafka。流选项卡未显示在Spark UI中(未使用流上下文)。csvDF = spark .option("sep", ";") .
csv
("/path/to/directory"
浏览 16
提问于2019-05-09
得票数 1
回答已采纳
1
回答
一个appdomain可以限制在一个目录下吗?
、
、
插件应该有尽可能少的信任,因为他们需要,但我希望有一个插件的可能性,以
读取
和
写入
文件。如果相关:我正在为插件使用MAF基础设施。
浏览 0
提问于2010-05-20
得票数 6
回答已采纳
2
回答
使用Spark Structured Streaming
读取
多个Kafka主题并
写入
不同接收器的最佳方式是什么?
、
、
、
我正在尝试编写一个火花
结构化
流式
作业,
读取
多个卡夫卡主题(可能是100),并根据主题名称将结果
写入
S3上的不同位置。我已经开发了这段代码,它当前
从
多个主题
读取
并将结果输出到控制台(基于循环),它可以按预期工作。然而,我想了解性能的影响是什么。这是推荐的方法吗?不建议有多个readStream
和
writeStream操作吗?如果是这样,推荐的方法是什么?
浏览 1
提问于2020-06-13
得票数 7
1
回答
我们是否需要在Spark Structured Streaming中对Kafka的readStream
和
writeStream都设置检查点?
、
我们是否需要在Spark Structured Streaming中对Kafka的readStream
和
writeStream都设置检查点?
浏览 2
提问于2017-06-16
得票数 3
回答已采纳
1
回答
Spark与Hive的区别
、
、
你能帮我理解星火SQl
和
蜂巢的区别吗?
浏览 2
提问于2017-06-04
得票数 1
2
回答
5分钟Spark批处理作业与流作业
、
由于已经添加了对动态分配spark.streaming.dynamicAllocation.enabled的支持,将其设置为每5分钟
从
源拉取数据的
流式
作业是一个好主意吗?在流/批处理作业之间
进行
选择时,我应该记住哪些事项?
浏览 0
提问于2019-07-24
得票数 0
1
回答
在
结构化
流应用编程接口(pyspark)中使用redshift作为readStream的JDBC源
、
、
我正在寻找一个包,或者使用redshift作为
结构化
数据流的源的以前的实现。'url', redshift_url) \ .load()如果你
从
浏览 2
提问于2020-11-18
得票数 0
1
回答
在哪里找到GTFS实时文件
我一直在对GTFS
和
GTFS-实时
进行
广泛的研究.我想要做的就是弄清楚一辆公共汽车会有多晚。我似乎找不到我可以连接到的地方,以正确地搜索一个特定的巴士号码。我一直在尝试使用下载这个文件,但是我想不出如何正确地打开
csv
文件。
浏览 0
提问于2014-06-13
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
HDFS体系架构
用python玩转csv文件:csv模块
Python 开发中如何进行文件读写操作
卓象程序员:电子表格导入PhpSpreadsheet
每日一模块:csv
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券