腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我们
如何
对
列
的
每个
值
中
的
pandas
数据
帧
进行
子
采样
、
、
、
我有一个dataframe,其中有一
列
给出了集群,我想在
每个
集群中使用相同
的
片段
进行
训练和测试。X_eval, Y_eval = X.drop(X_train.index), Y.drop(Y_train.index) 但我想知道是否有一个scikit学习包装器,因为这做了一个有替换
的
绘制,我可以使用一个没有替换
的
绘制。
浏览 6
提问于2017-08-27
得票数 1
回答已采纳
4
回答
基于
列
中
的
值
的
Pandas
数据
帧
示例
、
我有一个很大
的
数据
帧
,我想根据target
列
值
上
的
值
对
其
进行
采样
,该
值
为binary : 0/1 我想提取在"target“
列
中有0和1
的
相同数量
的
行。我在考虑使用
pandas
采样
函数,但不确定
如何
根据target列为
数据
帧
声明我想要<e
浏览 52
提问于2019-05-18
得票数 10
回答已采纳
1
回答
如何
根据
列
的
不同
值
对
数据
框行
进行
统一
的
下
采样
?
、
、
、
我正在尝试对
数据
帧
行
进行
下
采样
,以便创建更小
的
数据
帧
。让
我们
假设
我们
的
dataframe有几列,并且每一
列
都有预定义
的
分类
值
。
如何
确保
每个
不同
的
类别
值
都有机会出现在新
的
重
采样
数据
帧
中
?'B
浏览 3
提问于2019-09-03
得票数 1
1
回答
如何
分别处理具有多个测量时间
列
和多个测量变量
的
数据
帧
、
我是Python
的
新手,我正在处理
pandas
中
机器学习
的
数据
预处理问题。我想要预处理
的
数据
由n个测量变量组成,其中
每个
变量都有自己
的
“时间戳”。此外,
每个
测量变量
的
列
长不同(例如,变量a
的
50个测量值和变量b
的
1000个测量值)。对于机器学习,我需要对
数据
进行
插
值
。我希望
每个</em
浏览 15
提问于2019-08-06
得票数 1
回答已采纳
1
回答
Scala Spark :在Spark中有没有datafu.pig.sampling.SampleByKey
的
替代品?
、
、
、
SampleByKey
的
采样
方法是将键转换为散
列
,从中派生一个双精度
值
,然后根据提供
的
概率
对
其
进行
测试。密钥派生
的
双精度
值
在0到1之间均匀分布,代码为。具有相同键
的
所有行都以这种方式
进行
采样
。我有一个Dataframe,它是通过
对
多个dataframe执行联合操作而形成
的
(它们都有相同
的
模式)。我感兴趣
的
是,<
浏览 0
提问于2020-06-03
得票数 0
2
回答
基于分位数
的
采样
数据
帧
(
pandas
)
、
我有一个
数据
帧
,我想基于参数num_samples
对
其
进行
采样
。我想基于年龄跨分位数
进行
均匀
采样
。例如,如果我
的
数据
帧
有1000行和num_samples = .5,我将需要
采样
500行,但从
每个
分位数
采样
125行。我
的
数据
帧
的
前几条记录如下所示: Age x1 x2 x3 12 1
浏览 22
提问于2021-04-23
得票数 1
回答已采纳
1
回答
如何
将函数应用于R
中
的
子
列表
、
、
、
我正在尝试将sample_n()函数应用于R
中
的
子
列表。不知怎么
的
,经过几次尝试,我还是不能正确地使用它。 我
的
数据
结构是一个包含27个列表
的
列表(我称它们为27个元素)。
每个
元素是
数据
帧
的
列表。> test2[[1]][[1]]
数据
帧
的
一个示例 ? 对于这个
数据
框,outdegree_within_or1变量<
浏览 9
提问于2020-07-05
得票数 0
回答已采纳
1
回答
pandas
中使用概率
列
的
随机抽样行
、
、
我正在使用python和
pandas
从
数据
帧
中
随机抽取样本。我
的
数据
帧
如下所示: 第一
列
包含时间,第二
列
是平均速率,第三
列
是1-sigma,第四
列
是与该行描述
的
事件相关
的
概率。 ? 我知道我可以使用下面的代码来绘制加权样本: random=df.sample(n=100000, replace=True, weights='P>0'
浏览 24
提问于2020-04-24
得票数 1
回答已采纳
2
回答
随机
采样
两个
数据
帧
中
的
同一位置
、
考虑各自具有N
列
和M行
的
两个
数据
帧
df1和df2。 我想随机
采样
两个
数据
帧
中
的
相同位置。要在df1
中
对
一个位置
进行
采样
,我使用 df1.sample(1,axis=1).sample(1,axis=0) 我想在另一个
数据
帧
中
采样
相同
的
位置。这种
采样
会发生k次
浏览 20
提问于2019-04-15
得票数 0
回答已采纳
1
回答
熊猫每30分钟填充一次时间序列
中
缺失
的
日期
、
、
、
我
的
数据
集中有这样
的
情况: timestamp value 2020-05-02 20:05:05 13.85
数据
集来自传感器
对
温度
的
检测我应该通过在我
的
数据
集中
浏览 25
提问于2021-02-09
得票数 0
1
回答
AMR -
如何
上
采样
、
、
、
如何
对
AMR音频
数据
进行
上
采样
。amr文件由6个字节
的
头文件- "!#AMR".getBytes()组成,之后有32个字节
的
帧
,
每个
帧
有1个字节
的
头和31个字节
的
音频。我该怎么
对
它
进行
上样呢?我读过关于线性插
值
的
文章,但我不确定
如何
在这里应用它。我应该在不同
的</e
浏览 2
提问于2011-03-06
得票数 1
回答已采纳
1
回答
重复行
的
随机抽样
、
、
我有一个包含2
列
的
数据
帧
:
列
1是ID,
列
2是与
每个
ID关联
的
值
(总共59行)。ID] [value] [2] b 167 [4] d 117 我假设我可以从第1
列
随机
采样
并将关联
值
保留在第2
列
的
唯一方法是
对
行<
浏览 1
提问于2018-06-04
得票数 0
7
回答
是否同时
对
列
和索引
值
对
pandas
数据
帧
进行
排序?
、
、
、
按
列
的
值
和索引
对
pandas
dataframe
进行
排序是否可行? 如果按
列
的
值
对
pandas
数据
帧
进行
排序,则可以得到按
列
排序
的
结果
数据
帧
,但不幸
的
是,您会看到
数据
帧
的
索引顺序与排序列
的</em
浏览 2
提问于2013-11-29
得票数 59
1
回答
Pandas
从重
采样
中
检索添加行
的
索引
、
、
、
我有一个缺少行
的
数据
帧
,我
对
其
进行
插
值
和重新
采样
。我想知道是否有一种方法可以在重
采样
数据
帧
时获取添加到
数据
帧
中
的
行
的
索引?这就是我创建/重
采样
/插
值
数据
帧
的
方式: import numpy as np import <e
浏览 25
提问于2021-10-29
得票数 2
回答已采纳
1
回答
在eval
中
预测错误(expr,环境,附件):在R
中
找不到对象
、
我试着用前面的函数来预测几个模型,但是我得到了“eval
中
的
错误(expr,envir,enclos):object 'var.1‘not”。这很奇怪,因为var.1不在dataframe
中
。
浏览 3
提问于2015-05-27
得票数 2
回答已采纳
1
回答
熊猫抽样组
、
假设我想从
Pandas
中
的
数据
中
抽取一个分层
的
样本,以便为给定
列
的
每个
值
获取行
的
5%。我怎么能这么做? 例如,在下面的dataframe
中
,我希望
对
与
列
5%
的
每个
值
相关联
的
行
进行
5%示例。有任何方法从加载在内存
中
的
浏览 3
提问于2014-08-08
得票数 12
2
回答
pandas
,尝试
每个
movie_id仅
采样
5行,来自
数据
帧
,其中有太多行
、
、
我需要以一种合理
的
方式限制行数,同时仍然保持每部电影在
数据
帧
中有相同数量
的
评论(目前差异很大)
数据
帧
的
形状如下所示 第一
列
是userID,第二
列
是animeID (本质上是movieID)第三
列
是用户自己
对
该电影
的
评分在animeID
列
中
应该有大约300个movieIDs。在movieID
中
,我需要做
的
是限制
浏览 28
提问于2019-03-11
得票数 1
回答已采纳
2
回答
通过将一
列
的
所有
值
与另一
数据
帧
的
列
的
所有
值
进行
比较来对
数据
帧
进行
切片
、
、
、
,它索引到halo_field是切片
的
数据
帧
光环中(因此
我们
有这样
的
halo_field索引)-这是subhalo.halo_index
的
打印输出(在右边):1subhalo_field
中
,以便它只包含具有halo_index
列
值
的
行,该
列
的
值
也包含在halo_field.index
中
。问题是,这两
浏览 1
提问于2018-10-29
得票数 0
1
回答
如何
从不规则
数据
中
每分钟生成一个
值
?
、
、
、
我有一些被划分为event-related.
的
值
所以并不是每分钟都有相同数量
的
数据
。为了能够更好地处理这些
数据
,我
的
目标是只有每分钟取第一行
值
。我尝试了不同
的
选择组合和重
采样
。如果没有这种转换,我还会得到消息<
pandas
.core.groupby.generic.DataFrameGroupBy object at 0x0000026938A74850> 然后,当我尝试调用我
的
data
浏览 5
提问于2022-01-04
得票数 0
2
回答
Pandas
数据
帧
每第n行重新
采样
一次
我有一个脚本,可以将系统日志文件读取到
pandas
数据
帧
中
,并从这些
数据
帧
生成图表。图表适用于较小
的
数据
集。但当我面对更大
的
数据
集时,由于更长
的
数据
收集时间框架,图表变得太拥挤而无法辨别。我计划对
数据
帧
进行
重
采样
,以便如果
数据
集超过一定大小,我将对其
进行
重
采样</em
浏览 2
提问于2013-01-30
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在Excel表格中快速的进行两列数据的互换?
Excel综合应用:如何显著标记出两列数据中的不同值?
如何对 dataframe中的某一列数据 开根号呢?
如何对单元格中的数据进行强制换行
如何对单元格中的数据进行强制换行
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券