腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Spark
:
将
数据
帧
的
列
映
射到
不同
元素
的
ID
、
、
、
我有以下两个字符串类型为A和B
的
列
的
数据
帧
: val df = ( .createDataFrame( ("a1", "b1"a1", "b2"), ("a2", "b3")
浏览 14
提问于2021-01-26
得票数 0
回答已采纳
1
回答
Apache
Spark
中DataFrame写格式JDBC中
的
列
映射
、
、
我可以
将
数据
帧
记录加载到Oracle
数据
库中,没有任何错误,但我想知道如何
将
Df中
的
列
映
射到
Oracle 我想以JDBC write格式
将
Employee_
id
字段从DataFrame映
射到
oracle中
的
ID
列
。
列
映射: df ---------- Oracle Employee_
id
--
浏览 21
提问于2020-11-27
得票数 0
1
回答
spark
json模式元
数据
可以映
射到
配置单元?
、
、
在使用apache
spark
时,我们可以很容易地生成一个json文件来描述Dataframe结构。此
数据
帧
结构如下所示: "type": "struct", { "type": "string"business_key": false, "priv
浏览 1
提问于2020-05-14
得票数 0
3
回答
如何在Scala中将DataFrame转换为RDD?
、
、
、
有人能分享一下如何
将
dataframe转换为RDD吗?
浏览 99
提问于2015-09-12
得票数 45
回答已采纳
3
回答
为什么
Spark
的
重新分区没有
将
数据
平衡到分区中?
、
、
7, 8, 9]][[], [0, 1, 2, 3, 4], [5, 6, 7, 8, 9]] >>> 第一个分区是空
的
?
浏览 34
提问于2019-04-23
得票数 2
回答已采纳
3
回答
为什么下面这行代码在
spark
中失败了,我该如何修复它?
、
=> if(i % 2 == 0) Some(i) else null)).toDF()java.lang.ClassCastException: org.apache.
spark
.sql.types.IntegerType$ cannot be cast to org.apache.
spark
.sql.types.StructType
浏览 0
提问于2019-05-06
得票数 0
2
回答
在PySpark中将标识符保留在exceptAll中
、
我很好奇是否有一种简单
的
方法可以在PySpark
的
exceptALL命令中保留标识
ID
。例如,假设我有两个
数据
帧
(DF1,DF2),它们都有一个
ID
列
和另一个
列
“A”。我希望
将
值为"A“
的
行保留在DF1中,而不是保留在DF2中,因此基本上我尝试使用exceptAll
的
常规输出来保留标识符。我附上了一张具有理想输出
的
图像。 ? 干杯!
浏览 48
提问于2020-01-16
得票数 1
2
回答
如何在
Spark
Udf中传递map?
、
、
我有一个
spark
数据
帧
,有几列,如下所示:1红色、蓝色、黑色3蓝色、黄色、绿色红色,0绿色,2黄色,4 我需要做
的
是
将
颜色名称映
射到
不同
的
I,例如
将
"Red,Blue,Black“映
射到
一个由1,1,0,1,0组成
的
数组。,COLOR_MAP是包含string->
i
浏览 0
提问于2018-05-17
得票数 3
2
回答
Spark
dataframe:使用第二个dataframe查找数组
元素
、
、
我有一个
spark
dataframe,其中每一行都有一个I列表:1 [3,4,5]3 [2]
id
desc3 "bb"5 "dd" 6
浏览 18
提问于2017-12-16
得票数 2
1
回答
如何将带有键
的
值映
射到
Spark
DataFrame中
的
列
、
、
、
我正在用Scala在
Spark
2.3中做一些功能工程。我在
Spark
DataFrame
的
一
列
中有IP地址,如下所示 现在,我希望
将
这些频率中
的
每个频率映
射到
原始
数据
帧
。在那里我会-- | |567 | 7
浏览 0
提问于2018-04-03
得票数 0
2
回答
使用
spark
连接器从snowflake自定义
数据
类型映射
、
、
、
使用snowflake
spark
连接器从snowflake复制表时,默认行为是
将
结构化
数据
映
射到
spark
字符串:https://docs.snowflake.net/manuals/user-guide/
spark
-connector-use.html#from-snowflake-to-
spark
-sql 例如,给定snowflake中
的
一个表: create table schema.table
浏览 26
提问于2019-05-30
得票数 1
2
回答
有没有办法在pyspark中根据索引对
数据
帧
进行切片?
、
、
例如,在熊猫中:在pyspark中有没有类似的方式来根据行
的
位置对
数据
进行切片?
浏览 3
提问于2018-10-13
得票数 4
回答已采纳
1
回答
对partitionBy创建
的
一个输出目录中
的
数据
进行排序
、
、
、
我有一个很大
的
地理空间
数据
集partitionBy qk5
的
level 5。在每个quadkey级别的目录中,大约有1-50 Gb
的
数据
,所以它不适合放在一个文件中。因此,我希望一个qk5分区中
的
文件按更高
的
qk分辨率排序(比方说四键级别10)。问:有没有一种方法可以在partitionBy批处理中对
数据
进行排序?part30000.parquet part40000.parquet 我想让part1.parquet,part2.parquet
浏览 19
提问于2021-09-23
得票数 2
回答已采纳
1
回答
pyspark中
的
结构化流媒体
、
、
我尝试从另一个服务器流
数据
到HBase,并能够在Python语言中定义
不同
的
列
族。我看了看
Spark
文档,只看到:如何使用相同
的
实现直接写入HBase,并能够
将
数据
映
射到
不同
的
列
族?
浏览 0
提问于2017-04-24
得票数 0
1
回答
统一
Spark
中具有
不同
列
数
的
两个表
、
如何联合包含
不同
列
数
的
两个
数据
帧
A和B,并为
数据
帧
A和B中不常见
的
列
获取空值?我可以看到
spark
的
unionAll不支持此操作,并抛出以下错误 org.apache.
spark
.sql.AnalysisException: Union can only be performedon tables with the same number of columns, but the l
浏览 0
提问于2016-08-04
得票数 0
4
回答
在ApacheSpark1.3中
将
一
列
附加到
数据
帧
中
、
、
在
数据
帧
中添加
列
的
最有效
的
方法是什么?var dataDF = sc.textFile("path/file").toDF() val rowDF = sc.pa
浏览 4
提问于2015-04-07
得票数 54
回答已采纳
1
回答
使用
Spark
标记文本内容?
、
、
、
、
在我
的
场景中,我有一个mongo集合,其中每个文档都有一些文本类型字段以及一个文档所有者
的
字段。这样做
的
目的是根据用户
的
文档在用户界面中输入文本框时提供特定于用户
的
自动建议。我使用了mongo火花连接器,并且能够使用
spark
将
集合文档加载到
数据</em
浏览 0
提问于2017-05-07
得票数 0
2
回答
Spark
选项: inferSchema vs header = true
、
、
、
、
对
的
引用 我认为我需要.options("inferSchema" , "true")和.option("header", "true")来打印我
的
标题,但显然我仍然可以打印我
的
csv
的
标题。我真的不理解"inferSchema:自动推断
列
类型。它需要额外传递一次
数据
,默认情况下为false“
的
含义。
浏览 0
提问于2019-07-08
得票数 13
回答已采纳
1
回答
在执行dropDuplicates()之后,我在计数时得到了
不同
的
计数
、
、
、
我在一个包含Region,store和
id
子集
的
数据
帧
中进行了dropDuplicates。该
数据
帧
包含一些其他
列
,如latitude, longitude, address, Zip, Year, Month...当我对派生
数据
帧
进行计数时,我得到
的
是一个常量值,但当我对选定年份进行计数时,比如2018年,我在运行df.count()时会得到
不同
的
计数 有人能解释一下为什么会发生
浏览 18
提问于2021-01-24
得票数 0
1
回答
如何
将
spark
数据
帧
的
列
移动到同一
数据
帧
中
的
嵌套
列
?
、
、
、
、
我
将
spark
数据
帧
的
列
移动到同一
数据
帧
中
的
嵌套
列
的
方法如下所示: .appName("SparkByExamples.com") .getOrCreate() val data = Seq((&quo
浏览 19
提问于2021-02-05
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
MyBatis之Mapper XML 文件详解 四-JDBC 类型和嵌套查询
pandas系列学习(五):数据连接
MyBatis之Mapper XML 文件详解(四)-JDBC 类型和嵌套查询
深入机器学习系列10-ALS
《算法图解》读书笔记 Chapter 5
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券