腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
0
回答
从
原始数据
的
随机样本
创建
新
数据
框
、
、
我
从
原始数据
帧中随机抽样参与者,然后我想
创建
新
的
数据
帧,排除一个样本并保留其余
的
(只需注意
数据
帧要大得多,每个id有更多
的
变量和更多
的
观察值)。3 12 4df.new2:1 10 154 9 10我尝试了一些类似的方法,但我
的
语法似乎有一些问题如果有dplyr
的
实
浏览 11
提问于2017-06-13
得票数 0
回答已采纳
1
回答
从
现有
数据
帧
的
某些列
创建
新
的
pandas
数据
帧
、
、
我已经阅读了将csv文件加载到pandas
数据
帧中,并希望对该
数据
帧进行一些简单
的
操作。我不知道如何根据
从
原始数据
框
中选择
的
列来
创建
新
的
数据
框
。我
的
尝试是:dataset = pandas.read_csv('file.c
浏览 1
提问于2017-07-11
得票数 24
回答已采纳
2
回答
从
现有
数据
框架
的
每一行
创建
新
数据
框架
的
Pythonic方法
、
请推荐一种
从
现有
数据
框
的
每一行
创建
新
数据
框
的
pythonic方法。 该建议必须考虑到现有
数据
帧
的
行数是随机
的
,因此提供
的
解决方案必须考虑到这一点。(对于下面的示例,
原始数据
帧包括3行,但是,
原始数据
帧中
的
实际行数将是随机
的
。)
原始数据
框
的
列
浏览 20
提问于2021-09-28
得票数 1
回答已采纳
3
回答
如何使用R
创建
唯一
的
样本(每个元素只出现在一个样本中)?
、
、
、
、
不幸
的
是,由于mcmc方法
的
使用,我无法在我
的
整个客户(数十万)
的
基础上运行预测,因此我不得不在多个
随机样本
中拆分这个库,并在每个样本上执行该模型
的
几次运行来检索预测。
从
整个
数据
库中检索长度为10,000
的
随机样本
(让我们将此
数据
帧称为“
数据
”)将结果存储在一个名为"sample1“
的
对象中,现在我们必须返回”
数据
“,将”
数据<
浏览 1
提问于2019-11-09
得票数 2
回答已采纳
4
回答
如何
从
R中
的
特定群体中提取大量样本?
、
我有这样的人口: MyPopulation <- c(1:100) 我想
创建
一个40列5行
的
数据
框
。每一列都必须是MyPopulation
的
随机样本
,所以我尝试这样做: MySample <- data.frame(NoSample = c(1:5)) MySample$i <- sample(MyPopulation,5) } 结果是一个只有1列(名为i)
的
数据
框
,并以<e
浏览 31
提问于2020-10-19
得票数 0
回答已采纳
1
回答
如何将大
的
数据
帧复制到小
的
数据
帧?
、
学习Pandas和我认为学习曲线不会那么陡峭-我错了=)我正在导入一个超过2000万行
的
csv文件。问题是,由于它
的
大小,它使得它很难使用。仅仅修改一列以使用适当
的
dateTime就需要很长时间。所以我
的
第一个想法是跟踪最后100行-然而,当我尝试检查某些列
的
类型时,这给了我一些奇怪
的
KeyError这会产生错误- type(shortDataFrame['Time'][
浏览 1
提问于2019-01-06
得票数 0
2
回答
如何避免在
数据
帧中进行永久替换?
、
不确定这是否是正确
的
提问方式。请参阅下面的示例代码。这段代码
的
缺点是我不能在不重新下载
原始数据
集
的
情况下多次运行计算单元。有没有什么办法可以让我不用把它设置成等于一个
新
的
DataFrame呢?
浏览 18
提问于2019-03-24
得票数 0
4
回答
从
其他
数据
帧
的
子集中获取
随机样本
、
、
我有一个100,000行
的
大
数据
框
,我想添加一个列,其中值是基于
数据
框
中常见名称
的
另一个
数据
框
的
子集
的
样本。用例子来解释可能更容易。colB = c('x','x','y','y','x','y','y','y','y','y
浏览 24
提问于2017-05-24
得票数 1
回答已采纳
1
回答
用另一个字符串替换pandas
数据
帧中不匹配列表
的
字符串
、
我需要
创建
一个接受名称标题列表
的
函数,如果熊猫
数据
框
列(标记为'Title')没有这些标题,则将这些字符串替换为"Uncommon“并返回
新
的
df我尝试
从
preserved_titles (给定列表)
创建
一个
新
的
数据
框
,并将其连接到
原始
浏览 1
提问于2019-05-18
得票数 0
2
回答
创建
维度与
原始数据
框
不同
的
新
数据
框
、
我在尝试获得这个期望
的
输出时遇到了很多麻烦。所以我有一个像下面这样
的
数据
框
,其中有两列,其中有一个数字列表和一个标识符。不过,数字列表是以字符形式存储
的
。基本上,我只需要为列表中
的
每个数字使用正确
的
标识符。我尝试使用apply,对于每一行,我能够
创建
数字列表和标识符
的
等长列表,但是apply返回
的
是包含这两个列表
的
列表列表,我不知道如何轻松地将其转换为dataframe。任何帮助都将不胜感激。
浏览 9
提问于2020-02-26
得票数 0
1
回答
循环
数据
帧列时出现Keyerror
、
、
、
、
我有一个
数据
集,我想从
原始数据
框
中
的
列
创建
一个
新
的
数据
框
。Chessdata是
原始数据
框架,而hizlisatranc是我试图
创建
的
框架。但是,它会引发一个键错误。我修不好它。有人能帮帮忙吗?
浏览 17
提问于2021-02-09
得票数 0
回答已采纳
1
回答
如何根据atoti中已有的变量
创建
存储桶?
、
、
、
、
我在atoti有一个商店,在那里我想
创建
基于连续变量
的
存储桶。 这是商店
的
截图: ? 我正在尝试
创建
基于年龄
的
存储桶。我能想到
的
一种解决方案是,在
原始数据
框
中
创建
一个
新
列,然后将其连接到现有存储。 有没有一种更聪明
的
方法可以基于另一列动态
创建
一列,而无需返回到
原始数据
框
?
浏览 15
提问于2021-02-04
得票数 1
1
回答
最终模型拟合-子集与整个训练
数据
、
、
如果我将整个可用培训
数据
的
子集用于模型优化和超级参数选择,那么是否应该将最终模型与子集培训
数据
集或整个可用
的
培训
数据
相匹配?例如,如果我有1万个可用
的
样本,并且我将一个100 K
的
随机样本
作为测试保留,而200 K
的
随机样本
作为模型调优
的
训练
数据
集,那么用于在1) 200 K训练
数据
集上拟合最终模型
的
调优超级参数,还是2)900 K可用
数
浏览 0
提问于2020-06-24
得票数 0
回答已采纳
1
回答
将groupby均值统计信息映射为pandas中
的
新
列
、
、
、
我遇到了一个问题,为了生成一个
新
的
列,我将groupby均值统计
数据
映射到一个
数据
帧列。
原始数据
如下: ? 我开始
创建
一个
新
的
数据
框架,它将显示‘品牌起源’2018年
的
平均销售额。 然后,我继续将
新
数据
帧转换为字典,以完成映射过程。我尝试将
数据
映射到
原始数据
框
,但获得了NaN值。 我做错了什么?
浏览 11
提问于2020-10-18
得票数 1
回答已采纳
2
回答
即使使用了.loc,熊猫仍然可以获得SettingWithCopyWarning
、
、
complete['Age'] > 15但是,我仍然收到相同
的
警告
浏览 62
提问于2016-08-07
得票数 21
回答已采纳
6
回答
在Pandas
数据
帧中
创建
value_counts
的
列
、
我想从我
的
一个Pandas
数据
框
列中
创建
一个唯一值
的
计数,然后将具有这些计数
的
新
列添加到我
的
原始数据
框
中。我试过几种不同
的
方法。我
创建
了一个pandas序列,然后使用value_counts方法计算计数。我尝试将这些值合并回我
的
原始数据
帧,但我希望合并
的
键在Index(ix/loc)中。
浏览 0
提问于2013-07-18
得票数 71
2
回答
迭代列和示例
我是R
的
新手。我需要对
数据
框
中
的
每一列采样10,000次,然后
创建
包含选择1
的
概率
的
新
行(我猜它是平均值),然后将其绑定到日期
框
。我知道如何
创建
另一行并将其绑定到
原始数据
框
。 但是如何分别对列和样本(包括均值)进行迭代,然后相应地修改
新
行呢?语法对我来说有点棘手。
浏览 3
提问于2020-10-26
得票数 2
1
回答
python中本地
数据
帧和全局
数据
帧之间
的
链接是如何实现
的
?
、
、
、
我正在修改函数中
的
数据
帧,但我不希望它更改全局变量。 我使用两种不同
的
方法来更改我
的
数据
帧,它们对全局变量
的
影响是不同
的
。通过分配不存在
的
列来添加
新
列
的
第一种方法是修改全局
数据
帧。通过连接
新
列,全局
数据
帧保持不变。
浏览 10
提问于2019-07-08
得票数 0
回答已采纳
3
回答
使用直方图
数据
在scipy中生成
随机样本
、
、
假设我有一个按下按钮
的
流程,在一段时间(
从
1分钟到30分钟)之后,发生了一个事件。然后,我运行了大量
的
试验,并记录每个试验发生事件所需
的
时间。然后,这些
原始数据
被缩减为一组30个
数据
点,其中x值是事件发生所需
的
分钟数,y值是落入该桶中
的
试验
的
百分比。我没有访问
原始数据
的
权限。我如何使用这组30个点来识别适当
的
概率分布,然后我可以使用该分布来生成具有代表性
的
浏览 2
提问于2015-09-10
得票数 3
1
回答
在另一个data.frame中
创建
一个列
的
100个随机采样
的
data.frame
我正在处理一个
数据
框
b = c(10, 20, 30我想
创建
一个由100列组成
的
新
数据
框
,每列包含
从
原始数据
框
的
列a中随机选择
的
250个基因。这是我到目前为止尝试过<e
浏览 2
提问于2017-06-17
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Meta:但是这个可以从音频文件创建图像的新 AI 是什么?
新的基于Golang的Skuld恶意软件从Windows 窃取数据
物理学中的机器学习:从数据到发现的新范式
数据:1万枚ETH从 Bitfinex 转移到未知的新钱包
数据:136971 枚SOL从 FTX Estate 账户转移到未知的新钱包
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券