腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
spark
中
连续
获取
相同
的
数据
帧
、
我
的
数据
是这样
的
,status是0或1,uid是用户id。|1 | 0 2 |2 | 0 2 |2 | 0 2 |4 | 0 并获得所有
连续
的
相同
状态对不起,我<
浏览 8
提问于2019-01-23
得票数 1
2
回答
如何将
数据
帧
中
的
数据
存储在变量
中
,以用作cassandra
中
select
的
参数?
、
、
、
、
我有一个
Spark
结构
的
流媒体应用程序。应用程序从kafka接收
数据
,并且应该使用这些值作为参数来处理来自cassandra
数据
库
的
数据
。我
的
问题是,我如何使用输入
数据
帧
(kafka)
中
的
数据
,作为cassandra
中
的
"where“参数"select”,而不会出现以下错误: Exception in thread &qu
浏览 25
提问于2021-05-24
得票数 0
回答已采纳
1
回答
Spark
- Naive贝叶斯分类器值错误
、
我得到了这个错误: File "/home/juande/Desktop/
spark
-1.3.0-bin-hadoop2.4/python/pyspark/mllib /classification.py
浏览 0
提问于2015-04-22
得票数 1
1
回答
比较和突出显示了使用
spark
和java
的
两种
数据
格式
的
差异。
、
、
、
我正在使用
spark
和java来尝试比较两种
数据
帧
。它们都有
相同
的
列。
如
您所见,下面的
数据
帧
唯一不正确
的
地方是第二代
数据
帧
中
的
emp_id 4.。Dataset<Row> df1 = <
浏览 6
提问于2021-10-03
得票数 2
2
回答
SparkException:无法及时执行广播
、
、
我正在使用
spark
structured来编写一些使用function
的
转换
数据
帧
: .format("parquet") .start(dataPath)当我在代码
中
调用这个函数
的
次数较少时(编写了1或2个
浏览 7
提问于2018-07-26
得票数 1
1
回答
使用PySpark从Blob存储容器加载CSV文件
、
、
、
我无法使用Jupyter Notebook
中
的
PySpark将CSV文件从Azure Blob Storage直接加载到RDD
中
。我已经通读了几乎所有其他类似问题
的
答案,但我还没有找到关于我想要做什么
的
具体说明。我知道我也可以使用Pandas将
数据
加载到Notebook
中
,但之后我需要将Panda DF转换为RDD。我理想
的
解决方案应该是这样
的
,但是这个特定
的
代码给我
的
错误是它不能推断出CSV<em
浏览 21
提问于2019-04-28
得票数 0
1
回答
如何使用SparkR将MySQL
数据
库连接到Apache
Spark
?
、
、
、
我正在开发
Spark
2.0和SparkR库。我想获得一个关于如
何在
SparkR
中
做以下事情
的
示例代码?我知道使用R来做这件事,但是我需要一些帮助来使用
Spark
Sessions或SparkSQL context。此外,我们如何将这个R代码作为
Spark
批处理提交,以便以固定
浏览 4
提问于2016-08-21
得票数 0
2
回答
什么是Apache
Spark
(SQL)
中
的
Catalyst Optimizer?
、
我想知道更多关于在Apache ( PySpark )中使用Catalyst Optimizer
的
信息,在pyspark
数据
帧
中使用Catalyst Optimizer是可能
的
。
浏览 23
提问于2019-05-18
得票数 1
1
回答
使用Pytest
的
pyspark没有显示星火用户界面。
、
、
我编写了一个pytest用例(
Spark
3.0)来读取文件和
获取
数据
帧
的
计数,但是我无法看到
spark
,而且我得到了一个OOM错误。什么是解决方案,以及如
何在
没有看到
spark
的
情况下进行调试?
浏览 0
提问于2022-06-17
得票数 0
1
回答
spark
json模式元
数据
可以映射到配置单元?
、
、
在使用apache
spark
时,我们可以很容易地生成一个json文件来描述Dataframe结构。此
数据
帧
结构如下所示: "type": "struct", { "type": "stringsap", "business_key": false,
浏览 1
提问于2020-05-14
得票数 0
7
回答
使用哪种查询来获得更好
的
性能,是在SQL中联接还是使用Dataset API?
、
、
在使用
spark
、*
Spark
sql join*和*
spark
dataframe join*从HBASE
获取
和操作
数据
时,哪个更快?
浏览 2
提问于2016-06-01
得票数 2
1
回答
连接两个h2o
数据
帧
我有两个h2o
帧
,我想基于这两个列
中
存在
的
一个
相同
的
列来连接它们,我使用Java API并从
spark
dataframes
中
获取
h2o
帧
。h2oContext.asH2OFrame(train_validation);我可以使用
spark
dataframes来连接<em
浏览 8
提问于2017-06-22
得票数 2
2
回答
柱面全景图
、
、
、
、
我想要创建一个金属(油漆/其他)圆柱对象
的
横向表面的2D全景,它可能有缺陷,
如
划痕或凹痕。我捕获了一段300
帧
的
视频,具有
相同
的
适当ROI。现在我试图缝合两个
连续
的
帧
,但是没有控制点(无法识别),因为表面是均匀
的
,所以你不知道第二
帧
的
第一列在第一
帧
的
哪里。此外,由于金属表面的高反射性质,像素
的
强度值往往在两个
连
浏览 0
提问于2013-09-15
得票数 0
5
回答
如何从配置单元外部表创建
数据
帧
、
、
、
、
我们喜欢在Hive外部表
的
顶部创建
数据
帧
,并使用hive模式和
数据
进行
spark
级别的计算。 我们是否可以从hive外部表
中
获取
模式并将其用作Dataframe模式。
浏览 69
提问于2017-05-11
得票数 1
回答已采纳
2
回答
python,pyspark :
获取
pyspark
数据
帧
列值
的
总和
、
、
假设我有一个这样
的
数据
帧
abc 20 A我想在
数据
帧
的
末尾添加一个汇总行,因此结果将如下所示abc 20AAll 50 Alldata =
spark
.createDataFramenul
浏览 2
提问于2016-09-15
得票数 4
回答已采纳
1
回答
数据
流无法捕获来自源.csv azure
的
行更改
、
、
、
我
的
想法是使用upsert将csv文件作为源& synapse表作为接收器。每当我在
数据
流源预览
中
更改csv文件
的
行时,它都会显示旧
数据
。这是我
的
源文件,我将最后一个指示器更改为FALSE,并将其上传到blob。 我再次运行了源静态指示器
的
预览,它引用了旧
数据
我
的
源设置
数据
集设置-
浏览 0
提问于2021-07-07
得票数 0
5
回答
Spark
Dataframe验证拼接写入
的
列名
、
、
、
、
我正在使用从JSON事件流转换而来
的
Dataframe来处理事件,这些
数据
帧
最终会被写成Parquet格式。但是,一些JSON事件在键
中
包含空格,我希望在将其转换为Parquet之前记录和过滤/删除
数据
帧
中
的
此类事件,因为;{}()\n\t=在拼图方案(CatalystSchemaConverter)中被视为特殊字符,
如
中所列1下面因此不应允许在列名中使用。如
何在
Dataframe
中
对列名
浏览 188
提问于2016-07-05
得票数 17
1
回答
Spark
使用前一行
中
的
值向dataframe添加新列
、
、
、
、
我想知道如
何在
Spark
(Pyspark)
中
实现以下内容+--+---++--+---++--+---++--+---++--+---++--+---++--+---+-------++--+---+-------+|3 |7.0| 3.0
浏览 50
提问于2015-12-16
得票数 38
回答已采纳
1
回答
单元测试
中
的
Spark
Dataframe比较以检查功能
、
、
、
、
我已经创建了一些方法来将
数据
帧
转换为所需
的
格式,并根据错误规则过滤多个错误检查和更新
数据
帧
。 我是一个在intelliJ上用scala编写单元测试
的
新手。我必须编写单元测试来将实际
数据
帧
与预期结果进行比较。 下面是我为
数据
帧
的
pivot功能编写
的
单元测试用例。类似地,我必须将获得
的
数据
集与预期
的
数据
帧<
浏览 4
提问于2021-09-13
得票数 1
1
回答
Spark
问题:如果我不缓存
数据
帧
,它会被多次运行吗?
、
、
如果我不缓存使用带有limit选项
的
spark
SQL生成
的
dataframe,当我编辑得到
的
dataframe并显示它时,我会得到不稳定
的
结果吗? 描述。我有一个类似下面的表格,它是通过使用带有limit选项
的
spark
SQL生成
的
: +---------+---+---+---+---++--1| 0| 0| 10| 17|+-
浏览 6
提问于2021-04-21
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在Spark中处理结构化流式数据,如日志文件或传感器数据?
【WPS神技能】如何在WPS-Excel表格中的两列数据里快速找相同内容?
【WPS神技能】如何在WPS-Excel表格中快速批量计算不连续区域的数据?
如何从Pandas迁移到Spark?这8个问答解决你所有疑问
从Storm到Flink:大数据处理的开源系统及编程模型
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券