腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
pyspark
中
,
可以用
另一
列
填充
In
吗
?
、
32| Tom|+----+--------------+-----+该怎么做呢?
浏览 2
提问于2018-08-21
得票数 5
回答已采纳
2
回答
派火花:使用过滤器进行特征选择
、
、
使用
pyspark
中
的筛选器操作,我想选择
列
,这些
列
列
在
第一行. Ex: if的
另一
个数组
中
。然后选择
列
1、2和3以及所有行。这
可以用
filter命令来完成
吗
?如果是,有人能给出一个例子或语法
吗
?
浏览 1
提问于2015-06-15
得票数 1
回答已采纳
1
回答
Pyspark
:如果其他列为空,则在
pyspark
列
中
填充
固定值
、
我有一个有两
列
的
pyspark
dataframe。如果
另一
列
中
的行值为空,我想用固定值
填充
一
列
。因此,
在
customer_df
中
,如果customer_address为null,则将城市
列
填充
为“unknown” 我
在
试这个 customer_df = customer_df.withColumn
浏览 172
提问于2020-09-26
得票数 0
回答已采纳
1
回答
用均值
填充
pyspark
中所有
列
的缺失值
、
、
我正在尝试使用mean来
填充
我的
pyspark
3.0.1数据帧
中
的缺失值。我正在寻找像fillna函数这样的熊猫。例如 df=df.fillna(df.mean()) 但到目前为止,我发现在
pyspark
中
,正在使用单个
列
的均值来
填充
缺失值,而不是整个数据集。你能建议我如何在
pyspark
中
实现像fillna这样的熊猫
吗
?
浏览 31
提问于2021-03-08
得票数 1
回答已采纳
2
回答
pyspark
withColumn,如何改变列名
、
、
有没有办法用
pyspark
2.1.0创建/
填充
列
,其中
列
的名称是
另一
个
列
的值?你知道如何让
列
的名称来自
另一
个
列
,而不仅仅是值
吗
?我还尝试使用UDF函数定义作为变通方法,但同样没有成功。from
pyspark
.sql import functions as f
浏览 0
提问于2018-09-13
得票数 1
1
回答
用
另一
列
的连续编号
填充
Excel
列
?
、
、
在
Excel
中
,如果存在
另一
列
的50个连续数字,如何
填充
该
列
, 有一个函数或者公式我
可以用
吗
?
浏览 2
提问于2015-12-15
得票数 1
回答已采纳
1
回答
PySpark
MLLib:将数字转换为范畴
、
、
、
我从一个数据回购
中
获得了一个数据文件,它有一些基于日期的特性,例如问题1:为了训练一个模型,我应该把这些日期相关的
列
转换成分类
吗
?问题2:我如何在<em
浏览 1
提问于2020-04-02
得票数 0
2
回答
AssertionError: col应该是
列
、
、
、
如何在
PySpark
中
创建一个新
列
并用今天的日期
填充
该
列
?= datetime.datetime.now()我知道这个错误: AssertionError: col应该是
列
浏览 4
提问于2017-12-20
得票数 30
回答已采纳
1
回答
不同DataGridColumns的ItemsSources
、
、
、
、
我想要创建一个包含两个
列
(X和Y)的DataGrid,即每个
列
都可以由不同的集合
填充
。Y
列
总是使用来自ObservableCollection(NPoint),的Y数据
填充
,其中NPoint是一个具有X和Y属性的类。X
列
开始使用在其他地方定义的“默认值”
填充
( ObservableCollection(double)). )这个“默认”集合属于一个单例类。但是,根据附近的.IsChecked CheckBox,X
列
可能与Y数据相同的集合
中</e
浏览 1
提问于2014-05-13
得票数 1
回答已采纳
1
回答
使用pt-online模式更改添加新
列
并
填充
该
列
、
我需要向现有的MySQL表
中
添加一个新
列
,并使用从
另一
列
中计算出来的值
填充
。有什么方法
可以用
pt-online-schema-change来完成
吗
? 谢谢
浏览 5
提问于2019-10-16
得票数 2
回答已采纳
2
回答
使用列作为
PySpark
生成并
填充
period_range数据
、
、
、
| 5 |C |2018-09-19|2018-10-17|从这一点出发,我想创建并
填充
另一
个
Pyspark
,它的n
列
范围从min(d1)到max(d2),每一
列
都是该范围内的日期。我希望为每一行
填充
1和0的数据。 对于第1行,我希望
在
最小(第1行的d1)到最大(第1行的d1)范围内的所有日子都
填充
1,并用0
填充
rest
浏览 0
提问于2019-07-17
得票数 1
回答已采纳
1
回答
如何在Android
中
根据网格位置
填充
网格视图?
、
我想用一些用户控件
填充
网格视图,这些控件基于java代码
在
Android
中
的位置。例如,
在
一个8行8
列
的网格
中
,假设我想在Row1 X Column1
中
填充
用户控件,假设我想在Row3 X Col4
中
填充
用户控件,这意味着一些行X
列
我想
填充
为空,而
另一
些
列
则
填充
控件。或者我们
可以用
另一
种方式来
浏览 1
提问于2011-09-06
得票数 0
3
回答
在
单个
列
中计算跨列表的值的实例
、
、
、
我有一个
PySpark
dataframe,其中1
列
由字符串列表组成。我想在所有行中计算每个字符串列表
中
每个元素的实例数。伪码:for attr_list in df['attr_list']:
另一
种方法是将所有行的所有列表连接起来,并从单个庞大列表
中
构建一个计数器。
在
PySpark
中
是否有一种有效的方法来做到这一点?正确的输出将是
浏览 6
提问于2020-05-08
得票数 1
回答已采纳
2
回答
如何在Palantir Foundry
中
的
PySpark
架构上创建空数据集?
、
我有一个
PySpark
模式,它描述数据集的
列
及其类型(我可以手工编写这些数据集,也可以从现有的数据集获取,然后转到“
PySpark
”选项卡,然后“复制
PySpark
模式”)。我想要一个包含此架构的空数据集,例如,它
可以用
作只写回写的本体对象的支持数据集。我怎样才能在铸造
中
创造这个呢?
浏览 16
提问于2022-08-18
得票数 3
回答已采纳
1
回答
Pyspark
:将所有数据帧的字符串转换为foat
、
、
我有一个包含多个
列
(1000)的数据框,它们具有字符串类型。我希望将它们转换为不是一
列
一
列
地浮动,而是一次浮动所有数据帧。此外,我知道这是存在的: from
pyspark
.sql.types import IntegerType data_df = data_df.withColumn("column_name",data_df["columns_name"].cast(IntegerType())) 但我正在研究这样的东西: data_df = data_df.cast(In
浏览 17
提问于2021-04-15
得票数 0
回答已采纳
1
回答
如何根据
PySpark
数据帧的
另一
列
中
的值修改一
列
?F.when边缘情况
、
、
、
、
我想遍历
pyspark
dataframe
中
的每一行,并根据
另一
列
的内容更改
列
的值。我要将其更改为的值也基于要更改的
列
的当前值。具体地说,我有一
列
包含DenseVectors,
另一
列
包含我需要的向量的索引。 或者,我也
可以用
DenseVector
中
两个值
中
较大的一个替换DenseVector。我主要尝试将F.when()与withColumn结合使用,但F.when()的第二个元素
浏览 11
提问于2019-04-25
得票数 2
回答已采纳
2
回答
从行
中
的多个值计算一个值
、
我有一个
PySpark
Dataframe,我想添加一个从其他
列
的多个值计算出来的
列
。l = [('Ankit',25),('Jalfaizy',22),('saurabh',20),('Bala',26
浏览 1
提问于2019-11-29
得票数 1
回答已采纳
1
回答
如何将所有的日期格式转换为日期
列
的时间戳?
、
、
、
我使用的是
PySpark
版本3.0.1。我正在将csv文件读取为具有2个日期
列
的
PySpark
数据帧。但是,当我尝试打印模式时,两
列
都被
填充
为字符串类型。 ? ? 如何使用
pyspark
将date
列
中
的行值转换为时间戳格式? 我已经尝试了很多东西,但所有的代码都需要当前的格式,但如何转换为正确的时间戳,如果我不知道什么格式的csv文件。我也尝试过下面的代码,但这是
在
创建一个空值的新
列
df1 = df.
浏览 16
提问于2020-12-30
得票数 2
1
回答
将两
列
串接在
pyspark
中
&
在
两者之间添加一个文本
、
、
嗨,我
在
Databricks中使用了3.0.1
中
的火花。我的
pyspark
df包含一个
列
年份,其值类似于2012,
另一
个
列
季度的编号为1,2,3和4。我想加入year_qtr并创建
另一
列
2012 Quarter-1 &它应该包含类似于下面代码的2012 Quarter-1值col_listQuarter-','Quarter'
浏览 2
提问于2021-01-27
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Excel如何查找一列数据是否在另一列数据中
在df的一列中 有None和Nan 我想把这些空值都填充为-1 应该怎么操作呢
一个Python大数据处理利器:PySpark入门指南
一文读懂PySpark数据框
一文读懂 PySpark 数据框
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券