腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9270)
视频
沙龙
1
回答
Scala
:
如何
按
行号
拆分
数据
帧
?
、
、
、
、
我想要将一个270万行的
数据
帧
拆分
为100000行的小
数据
帧
,这样最终得到大约27个
数据
帧
,我也想将其存储为csv文件。我正在尝试编写自己的代码来实现这一点,但是如果你知道一些我可以使用的
Scala
(Spark)函数,那就太好了! 感谢大家的建议!
浏览 10
提问于2019-03-14
得票数 2
回答已采纳
2
回答
在R中将一个大型
数据
帧
逐行
拆分
为多个
数据
帧
、
、
、
我有一个包含超过1m条记录和超过40个变量的大型
数据
帧
,我希望通过一个循环来更新这些记录,以防止出现故障,并且文件的大小每次都不同。我想将这100多万行
拆分
成n个较小的集合,每个集合都有一个新的
数据
帧
名称,例如以1,2,...,n,newdf1,newdf2,newdf3,...结尾。R中
拆分
函数只
拆分
向量,但它仍然在
数据
帧
中,而不是创建
数据
帧
的多个子集,我需要这些子集来保留40个变量中的
数
浏览 1
提问于2020-08-26
得票数 0
2
回答
火花DataFrame/DataSet分页或一次迭代N行的块
、
、
我需要为我的
数据
集实现分页(在星火
scala
中)。请
如何
将火花
数据
集/
数据
集
拆分
为N个
行号
? -NS
浏览 0
提问于2018-10-02
得票数 2
回答已采纳
2
回答
拆分
数据
帧
、
如何
在
scala
中
拆分
数据
帧
? {code}---
浏览 12
提问于2019-11-22
得票数 0
1
回答
拆分
数据
帧
并有新的
行号
、
当我将
数据
分割成两个新的
数据
帧
时,两个新
数据
帧
的
行号
将索引原始
数据
帧
。 例如,如果dfA有
行号
1、2、3、4;我想创建两个基于交替行的新
数据
帧
(因此,行1和3转到dfB,行2和4转到dfC)。但是我希望
行号
在dfB和dfC中有新的索引,这样实际上dfB和dfC都有1&2作为行索引。这是一个问题,因为当我将我的(实际上要大得多的df)
拆分
为A和B时,每当我试
浏览 5
提问于2016-03-16
得票数 0
回答已采纳
1
回答
按
行号
将
数据
帧
拆分
成
数据
帧
列表
、
我有一个
数据
帧
与一个可变的数字或行,并希望将其
拆分
成一个列表的
数据
帧
(或只是多个dfs)的组附近的行。应该组合在一起的邻近行可以通过由数值上彼此相邻的样本组成的每个组的可变列来理解。可变列中的内容的确切身份将不是一致的b/w
数据
集。
浏览 11
提问于2020-10-27
得票数 2
回答已采纳
3
回答
按
行
拆分
R中的
数据
帧
我有一个很长的
数据
帧
,如下所示: 1 2.5 A 3 4.6 Bset.seed(10)我不想被任意的数字
拆分
案例2:
按</em
浏览 1
提问于2012-10-30
得票数 13
回答已采纳
2
回答
在R中
按
行号
拆分
数据
帧
、
这可能真的很简单,但我找不到解决方案:有没有一种很好的方法将这个
数据
帧
分成三个元素(一个列表的元素),在v中指定的
行号
?
浏览 2
提问于2014-11-26
得票数 7
2
回答
在R中,
如何
按
日期
拆分
数据
帧
、
、
、
我想将此
数据
帧
拆分
为仅
按
日期部分
拆分
的
数据
帧
列表。因此,每个
数据
帧
都将包含当天的所有
数据
。我研究了
拆分
函数,但不确定
如何
使用列值的一部分?
浏览 8
提问于2013-05-31
得票数 4
回答已采纳
2
回答
SPARK dataframe错误:在使用UDF
拆分
列中的字符串时,无法强制转换为
scala
.Function2
、
、
当我使用udf
按
分隔符
拆分
列中的字符串时,我总是得到一个错误。我正在使用
Scala
不知道这是什么,也不知道
如何
修复它。这是我的udf和
数据
帧
: val rsplit = udf((refsplit: Stri
浏览 1
提问于2016-05-24
得票数 8
2
回答
d[n:m][n:m]和df[n:m][m]有什么区别?
、
,我得到了输出 045 5print(df[2:5][2])我正在使用以下
数据
帧
浏览 0
提问于2020-06-17
得票数 0
1
回答
子集:另一列中每个组的固定值数。
、
、
、
我有一个
数据
框架,由一列中的多个物种和另一列中的程序集名称组成。
浏览 5
提问于2020-04-15
得票数 0
回答已采纳
1
回答
如何
根据
行号
列表
拆分
pyspark
数据
帧
的行?
、
、
、
我已经创建了一个pyspark
数据
帧
,形象化地看起来像这样: >>> df ------------------------------30 | 50 | ... |300 | 350 | 50 | ... |500 | 5 然后我还创建了随机的
行号
列表,如下所示: my_list = [[2, 5],[4, 1, 3]] 根据这个列表的结构,我希望创建pyspark<
浏览 16
提问于2019-04-18
得票数 0
回答已采纳
2
回答
如何
从R中的
数据
帧
列表中选择行
、
、
、
我有10个
数据
帧
的列表,我想
按
名称选择每个
数据
帧
的一行。该列的名称为name。我想要选择name=Ready所在的每一行。 我尝试了一些方法。如果我声明了确切的
行号
(这里是2),这就行了: lapply(list, `[` ,c(2),) 但由于
数据
帧
中的
行号
不同,我将应用类似于name=Ready的内容: lapply(list, `[`
浏览 6
提问于2021-07-26
得票数 0
回答已采纳
2
回答
R:
按
行
拆分
拼接的
数据
帧
我想将该文件读入R,然后将其
拆分
。 "Global" = c(.4345, .1256, .8754, .9923, .7124, .2999))
数据
帧
11 337.0
浏览 14
提问于2017-06-20
得票数 1
回答已采纳
1
回答
如何
在pandas中
拆分
数据
帧
、
、
我有下面的
数据
框0 a h0 c j1 e l2 g nA B C0 b i 和 A B
如何
将
数据
帧
拆分
成多个
数据
帧
?
浏览 0
提问于2017-01-24
得票数 2
回答已采纳
2
回答
按
行数
拆分
数据
帧
、
、
我有一个由400'000行和大约50列组成的
数据
帧
。由于此
数据
帧
如此之大,因此处理它的计算量太大了。我想将这个
数据
帧
分割成更小的
数据
帧
,之后我将运行我想要运行的函数,然后在结束时重新组装
数据
帧
。没有我想用来
拆分
这个
数据
帧
的分组变量。我只想将它
按
行数
拆分
。例如,我想将这个400‘000行的表
拆分
为400
浏览 0
提问于2011-08-15
得票数 33
回答已采纳
1
回答
如何
在每一列中转换DataFrame以在pyspark中创建两个新列?
、
、
、
我有一个
数据
帧
"x",其中有两列"x1“和"x2”kv,true 45mp,true 75bm,null 550我想将此
数据
帧
转换为根据其状态和值过滤
数据
的格式kv 45 450
浏览 0
提问于2016-11-18
得票数 1
1
回答
如何
分割
数据
帧
,然后应用inner_join
、
、
、
我有三个
数据
帧
,每个
数据
帧
大约有64,000行和相同数目的794列。我需要通过一个公共列对所有3个
数据
帧
执行inner_join。由于此错误“无法分配大小为163 Mb的向量”,因此我理解需要将
数据
帧
按
行
拆分
。在执行inner_join时,为了不耗尽内存,要
拆分
的最佳段数是多少?如果我必须将它们分割成10个片段,我
如何
循环这些段来对所有3个
数据
帧
浏览 1
提问于2020-11-05
得票数 0
回答已采纳
1
回答
使用日期时间戳对
数据
进行聚类
、
、
、
我有一个时间序列
数据
集,其中除了“时间戳”列(
数据
帧
的索引)之外还包含10个特征。缩放这些特征的值并实现k-means聚类后,我得到了np.array形式的结果。
如何
在不使用时间戳索引的情况下保留时间戳索引?
浏览 106
提问于2021-09-29
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python如何按pair拆分英中句子
合众首创——按业务维度的水平数据拆分
如何让SPSS根据自身数据库行号产生ID特征变量
如何将 Excel 合并单元格内容按换行符拆分成多行?
微服务:如何拆分共享数据库?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券