腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
根据
条件
从
spark
数据
帧
中
删除
行
我想
根据
条件
从
列表的
spark
数据
帧
中
删除
行
。
条件
是列表的长度是一定长度。我曾尝试将其转换为列表列表,然后使用for循环(如下所示),但我希望在
spark
内的一条语句中完成此操作,并基于此
条件
从
原始df创建一个新的不可变df。是一个单列dataframe,而该列被命名为sequences,则它看起来如下所示: sequences[1,
浏览 25
提问于2019-04-30
得票数 0
回答已采纳
0
回答
Spark
- Scala -
根据
条件
从
数据
帧
中
删除
列
、
我们有一个特定的需求,其中我将不得不从dataframe
中
drop列,该列
中
只有一个唯一的值。下面是我们正在做的事情随后,为了在所有列中找到唯一值,我们使用了
spark
中支持的HyperLog++算法 val c
浏览 7
提问于2017-06-06
得票数 3
回答已采纳
1
回答
基于多列
条件
从
pandas
中
删除
/选择
行
、
从
pandas
数据
帧
中
,我需要
根据
应用于
数据
帧
的两列的
条件
删除
特定的
行
。
数据
帧
是 0 1 2 31 0.0313920.336522 0.787792 6 1.499040 0.195022 0.387194 0.95
浏览 13
提问于2019-05-08
得票数 1
回答已采纳
2
回答
可以
根据
python
中
特定
行
的值来命名
数据
帧
的列吗?
、
、
可以
根据
python
中
特定
行
的值来命名
数据
帧
的列吗?所附数字显示了我如何修改
数据
框架的一个例子: 理想输出列名应该与以下模式相匹配: condition3condition2、condition1和报告
条件
值的前三
行
应该与顶部索引一起
从
数据
帧
中
删除
浏览 2
提问于2022-04-27
得票数 0
2
回答
Spark
数据
帧
过滤器问题
、
、
来自这里的SQL背景..我正在使用df1 =
spark
.read.jdbc将
数据
从
Azure sql加载到
数据
帧
中
。我正在尝试筛选
数据
,以排除满足以下
条件
的
行
:dataframe最终是空的,但是当我运行等价的SQL当我将其更改为 df2 = d
浏览 2
提问于2020-06-26
得票数 2
1
回答
在
spark
/scala
中
迭代一个巨大的
数据
帧
、
、
、
、
我有一个有5亿
行
的
数据
帧
。我想遍历每一
行
并修改列名/
删除
几列,并
根据
几个
条件
更新列值。我在collect中使用下面的方法。
行
(df.collect.foreach => mycustomeMethod()) 由于collect将把所有的
数据
带到驱动程序,我面对的是内存不足,errors.Can你可以建议任何替代的方法来实现同样的目的我们使用的是datastax的
spark
-cassandra连接器。我
浏览 3
提问于2017-03-15
得票数 2
2
回答
优化PySpark与pandas DataFrames之间的转换
、
、
、
、
我有一个13M
行
的pyspark
数据
帧
,我想把它转换成pandas
数据
帧
。然后,将
根据
其他参数以不同的频率(例如1秒、1分钟、10分钟)对
数据
帧
进行重新采样以进行进一步分析。
从
文献[,]
中
,我发现使用以下任何一
行
都可以加快pyspark到pandas
数据
帧
之间的转换:
spark
.conf.set("
spark
.sql
浏览 11
提问于2021-11-19
得票数 0
1
回答
在分流之前在
spark
中进行缓存
、
、
evaluation yet* // Write out subdf2 假设我
从
主
数据
帧
开始(我懒惰地
从
CSV
中
读取),对这个
数据
帧
做一些操作(过滤,分组,连接),然后到了一个点,我
根据
一个
条件
(例如,id >0和id < 0)拆分这个df1。然后,我继续对这些子
数据
帧
进行操作(让我们将它们命名为subdf
浏览 23
提问于2021-02-12
得票数 1
回答已采纳
1
回答
根据
列
条件
从
数据
帧
中大量
删除
行
我想
根据
列的
条件
删除
所有
行
。下面的代码生成一个示例测试
数据
。test_data <- data.frame(index = c(1,2,3,4,5), group = c("a", "a", "a", "b", "c"), count = c(1,2,2,3,4))
数据
帧
有如果组
中
的任何一
行
有计数1,我想
删除
属
浏览 2
提问于2020-02-27
得票数 1
回答已采纳
1
回答
Spark
中
的长谱系(DAG)问题
、
、
我们通常使用
Spark
作为存储在S3或HDFS上的
数据
的处理引擎。我们使用Databricks和EMR平台。我经常面临的一个问题是,当任务规模增长时,工作绩效会严重下降。例如,假设我
从
五个表
中
读取
数据
,这些表具有不同的转换级别(过滤、分解、连接等),并从这些转换
中
获得
数据
的联合子集,然后进行进一步的处理(例如:
根据
需要窗口函数等的
条件
删除
一些
行
),然后是其他一些处理阶段但是,如果我们将临时中间<em
浏览 17
提问于2019-10-26
得票数 0
回答已采纳
1
回答
R:
根据
外部
条件
从
数据
帧
中
删除
行
、
我有两个
数据
框架,df.1和df.2,我想
根据
关于df.1的某些事情是否属实
从
df.2
中
删除
行
。具体来说,我想从df.2
中
删除
与df.2
中
的date对应的feistiness的df.1值具有NA值的所有
行
。怎样才能做到这一点?(我已经看过其他问题了,但仍然找不出答案。)第一
数据
帧
的可再现代码:dates <- rep(as
浏览 2
提问于2017-07-31
得票数 0
回答已采纳
2
回答
根据
条件
或值
从
数据
帧
中
删除
行
、
、
、
、
有没有一种方法可以
从
已经
根据
列值进行分组和排序的df
中
删除
数据
?1 004 2019-03-01 02:34:21.134 tof 1例如,如果004不是秩0的mdf,我想
删除
所有004,如
浏览 0
提问于2019-03-06
得票数 0
3
回答
PySpark:如何转置
数据
帧
中
的多个列
、
、
、
、
我是
Spark
的新手,需要使用PySpark或
Spark
Sql将以下输入
数据
帧
转置为所需的输出df (
从
行
到列)的帮助。输入
数据
帧
-......A 1 ......如果我可以
根
浏览 1
提问于2020-11-27
得票数 3
1
回答
如何
删除
星火(SCALA)
中
的整个
数据
帧
?
有一些函数可以
删除
Spark
(SCALA)
中
的列和
行
,但是却找不到任何函数来
删除
整个
数据
frame.Is,有一种方法可以
删除
Spark
(SCALA)
中
的
数据
帧
吗?
浏览 0
提问于2016-10-15
得票数 3
2
回答
如何用JAVA实现
Spark
SQL
中
基于单列的重复
行
删除
、
我需要了解如何使用Java在
Spark
SQL
中
基于single
从
数据
框
中
删除
重复
行
。如何将此步骤转换为Java
中
的
Spark
SQL?
浏览 11
提问于2017-07-25
得票数 1
1
回答
以一种不危险的方式基于布尔值选择
行
、
、
请看-在R
中
,当您想要
根据
某个
条件
从
数据
帧
中切片行时,您只需编写
条件
,它就会选择相应的
行
。例如,如果您有一个
条件
,即只有dataframe
中
的第三
行
满足该
条件
,则它将返回第三
行
。很简单。在python
中
,你必须使用loc。如果索引与行号匹配,那么一切都很好。如果您出于任何原因一直在
删除
行
或重新排序它们,您必须记
浏览 13
提问于2021-07-23
得票数 1
1
回答
基于列值高效地从宽
Spark
数据
帧
中
删除
列
、
、
如果我有一个只包含IP地址的宽
数据
帧
(200m cols),并且我想
删除
包含空值或格式不佳的IP地址的列,那么在
Spark
中
执行此操作的最有效方法是什么?我的理解是
Spark
并行地执行基于
行
的处理,而不是基于列的处理。因此,如果我尝试在列上应用转换,将会有大量的混洗。首先转置
数据
帧
,然后应用筛选器
删除
行
,然后重新转置是利用
spark
并行性的好方法吗?
浏览 11
提问于2019-10-31
得票数 1
2
回答
Azure Synapse -如何
从
同一集合
中
包含多个类型的Azure Cosmos DB容器
中
读取
数据
?
、
因此,
根据
类型,密钥对会发生变化。我正在尝试使用以下代码
从
Synapse的这个容器
中
读取
数据
: cfg = {"
spark
.cosmos.accountKey": accountKey,"
spark
.cosmos.con
浏览 58
提问于2021-10-28
得票数 0
回答已采纳
2
回答
删除
符合
条件
的
数据
帧
行
的一半
、
、
我希望
根据
条件
提取
数据
帧
的子集。在Col2
中
为负(如果有)的条目中,我想
删除
最大的一半。因此,如果values2 = -5,10,13,-3,-1,-2,那么我想
删除
与值-5和-3对应的
行
。如果我想在排序后简单地丢弃整个
数据
帧
的一半,我(认为)可以做到不确定如何引入只去掉一半负值的
条件
。我的大部分经验是在numpy -仍然习惯
浏览 2
提问于2018-01-20
得票数 2
回答已采纳
1
回答
动态
删除
r
中
的
行
、
我需要
根据
日期
条件
动态地
从
数据
帧
中
删除
行
。 如果开始日期晚于上次读取的开始日期,而结束日期早于上次读取的结束日期,则我希望
从
数据
集中
删除
该行。 有人能想出一个解决方案吗?它不需要使用for循环。
浏览 11
提问于2020-10-28
得票数 0
点击加载更多
相关
资讯
在列表、字典、集合中根据条件筛选数据
php实例根据ID删除mysql表中的数据
Python奇技淫巧—1—在列表、字典、集合中根据条件筛选数据
解决access多表删除查询中 无法从指定的数据表中删除 的错误提示
重要数据丢失?如何根据指定条件在 Linux 系统中查看 MySQL 的二进制日志文件找回丢失的数据?
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券