从原始数据的随机样本创建新数据框

、、

我从原始数据帧中随机抽样参与者，然后我想创建新的数据帧，排除一个样本并保留其余的(只需注意数据帧要大得多，每个id有更多的变量和更多的观察值)。3 12 4df.new2：1 10 154 9 10我尝试了一些类似的方法，但我的语法似乎有一些问题如果有dplyr的实

浏览 11提问于2017-06-13得票数 0

回答已采纳

1回答

从现有数据帧的某些列创建新的pandas数据帧

、、

我已经阅读了将csv文件加载到pandas数据帧中，并希望对该数据帧进行一些简单的操作。我不知道如何根据从原始数据框中选择的列来创建新的数据框。我的尝试是：dataset = pandas.read_csv('file.c

浏览 1提问于2017-07-11得票数 24

回答已采纳

2回答

从现有数据框架的每一行创建新数据框架的Pythonic方法

、

请推荐一种从现有数据框的每一行创建新数据框的pythonic方法。该建议必须考虑到现有数据帧的行数是随机的，因此提供的解决方案必须考虑到这一点。(对于下面的示例，原始数据帧包括3行，但是，原始数据帧中的实际行数将是随机的。)原始数据框的列

浏览 20提问于2021-09-28得票数 1

回答已采纳

3回答

如何使用R创建唯一的样本(每个元素只出现在一个样本中)？

、、、、

不幸的是，由于mcmc方法的使用，我无法在我的整个客户(数十万)的基础上运行预测，因此我不得不在多个随机样本中拆分这个库，并在每个样本上执行该模型的几次运行来检索预测。从整个数据库中检索长度为10,000的随机样本(让我们将此数据帧称为“数据”)将结果存储在一个名为"sample1“的对象中，现在我们必须返回”数据“，将”数据<

浏览 1提问于2019-11-09得票数 2

回答已采纳

4回答

如何从R中的特定群体中提取大量样本？

、

我有这样的人口： MyPopulation <- c(1:100) 我想创建一个40列5行的数据框。每一列都必须是MyPopulation的随机样本，所以我尝试这样做： MySample <- data.frame(NoSample = c(1:5)) MySample$i <- sample(MyPopulation,5) } 结果是一个只有1列(名为i)的数据框，并以<e

浏览 31提问于2020-10-19得票数 0

回答已采纳

1回答

如何将大的数据帧复制到小的数据帧？

、

学习Pandas和我认为学习曲线不会那么陡峭-我错了=)我正在导入一个超过2000万行的csv文件。问题是，由于它的大小，它使得它很难使用。仅仅修改一列以使用适当的dateTime就需要很长时间。所以我的第一个想法是跟踪最后100行-然而，当我尝试检查某些列的类型时，这给了我一些奇怪的KeyError这会产生错误- type(shortDataFrame['Time'][

浏览 1提问于2019-01-06得票数 0

2回答

如何避免在数据帧中进行永久替换？

、

不确定这是否是正确的提问方式。请参阅下面的示例代码。这段代码的缺点是我不能在不重新下载原始数据集的情况下多次运行计算单元。有没有什么办法可以让我不用把它设置成等于一个新的DataFrame呢？

浏览 18提问于2019-03-24得票数 0

4回答

从其他数据帧的子集中获取随机样本

、、

我有一个100，000行的大数据框，我想添加一个列，其中值是基于数据框中常见名称的另一个数据框的子集的样本。用例子来解释可能更容易。colB = c('x','x','y','y','x','y','y','y','y','y&#

浏览 24提问于2017-05-24得票数 1

回答已采纳

1回答

用另一个字符串替换pandas数据帧中不匹配列表的字符串

、

我需要创建一个接受名称标题列表的函数，如果熊猫数据框列(标记为'Title')没有这些标题，则将这些字符串替换为"Uncommon“并返回新的df我尝试从preserved_titles (给定列表)创建一个新的数据框，并将其连接到原始

浏览 1提问于2019-05-18得票数 0

2回答

创建维度与原始数据框不同的新数据框

、

我在尝试获得这个期望的输出时遇到了很多麻烦。所以我有一个像下面这样的数据框，其中有两列，其中有一个数字列表和一个标识符。不过，数字列表是以字符形式存储的。基本上，我只需要为列表中的每个数字使用正确的标识符。我尝试使用apply，对于每一行，我能够创建数字列表和标识符的等长列表，但是apply返回的是包含这两个列表的列表列表，我不知道如何轻松地将其转换为dataframe。任何帮助都将不胜感激。

浏览 9提问于2020-02-26得票数 0

1回答

循环数据帧列时出现Keyerror

、、、、

我有一个数据集，我想从原始数据框中的列创建一个新的数据框。Chessdata是原始数据框架，而hizlisatranc是我试图创建的框架。但是，它会引发一个键错误。我修不好它。有人能帮帮忙吗？

浏览 17提问于2021-02-09得票数 0

回答已采纳

1回答

如何根据atoti中已有的变量创建存储桶？

、、、、

我在atoti有一个商店，在那里我想创建基于连续变量的存储桶。这是商店的截图： ? 我正在尝试创建基于年龄的存储桶。我能想到的一种解决方案是，在原始数据框中创建一个新列，然后将其连接到现有存储。有没有一种更聪明的方法可以基于另一列动态创建一列，而无需返回到原始数据框？

浏览 15提问于2021-02-04得票数 1

1回答

最终模型拟合-子集与整个训练数据

、、

如果我将整个可用培训数据的子集用于模型优化和超级参数选择，那么是否应该将最终模型与子集培训数据集或整个可用的培训数据相匹配？例如，如果我有1万个可用的样本，并且我将一个100 K的随机样本作为测试保留，而200 K的随机样本作为模型调优的训练数据集，那么用于在1) 200 K训练数据集上拟合最终模型的调优超级参数，还是2)900 K可用数

浏览 0提问于2020-06-24得票数 0

回答已采纳

1回答

将groupby均值统计信息映射为pandas中的新列

、、、

我遇到了一个问题，为了生成一个新的列，我将groupby均值统计数据映射到一个数据帧列。 原始数据如下： ? 我开始创建一个新的数据框架，它将显示‘品牌起源’2018年的平均销售额。然后，我继续将新数据帧转换为字典，以完成映射过程。我尝试将数据映射到原始数据框，但获得了NaN值。我做错了什么？

浏览 11提问于2020-10-18得票数 1

回答已采纳

2回答

即使使用了.loc，熊猫仍然可以获得SettingWithCopyWarning

、、

complete['Age'] > 15但是，我仍然收到相同的警告

浏览 62提问于2016-08-07得票数 21

回答已采纳

6回答

在Pandas数据帧中创建value_counts的列

、

我想从我的一个Pandas数据框列中创建一个唯一值的计数，然后将具有这些计数的新列添加到我的原始数据框中。我试过几种不同的方法。我创建了一个pandas序列，然后使用value_counts方法计算计数。我尝试将这些值合并回我的原始数据帧，但我希望合并的键在Index(ix/loc)中。

浏览 0提问于2013-07-18得票数 71

2回答

迭代列和示例

我是R的新手。我需要对数据框中的每一列采样10,000次，然后创建包含选择1的概率的新行(我猜它是平均值)，然后将其绑定到日期框。我知道如何创建另一行并将其绑定到原始数据框。但是如何分别对列和样本(包括均值)进行迭代，然后相应地修改新行呢？语法对我来说有点棘手。

浏览 3提问于2020-10-26得票数 2

1回答

python中本地数据帧和全局数据帧之间的链接是如何实现的？

、、、

我正在修改函数中的数据帧，但我不希望它更改全局变量。我使用两种不同的方法来更改我的数据帧，它们对全局变量的影响是不同的。通过分配不存在的列来添加新列的第一种方法是修改全局数据帧。通过连接新列，全局数据帧保持不变。

浏览 10提问于2019-07-08得票数 0

回答已采纳

3回答

使用直方图数据在scipy中生成随机样本

、、

假设我有一个按下按钮的流程，在一段时间(从1分钟到30分钟)之后，发生了一个事件。然后，我运行了大量的试验，并记录每个试验发生事件所需的时间。然后，这些原始数据被缩减为一组30个数据点，其中x值是事件发生所需的分钟数，y值是落入该桶中的试验的百分比。我没有访问原始数据的权限。我如何使用这组30个点来识别适当的概率分布，然后我可以使用该分布来生成具有代表性的

浏览 2提问于2015-09-10得票数 3

1回答

在另一个data.frame中创建一个列的100个随机采样的data.frame

我正在处理一个数据框 b = c(10, 20, 30我想创建一个由100列组成的新数据框，每列包含从原始数据框的列a中随机选择的250个基因。这是我到目前为止尝试过<e

浏览 2提问于2017-06-17得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从现有数据帧的某些列创建新的pandas数据帧

从现有数据框架的每一行创建新数据框架的Pythonic方法

如何使用R创建唯一的样本(每个元素只出现在一个样本中)？

如何从R中的特定群体中提取大量样本？

如何将大的数据帧复制到小的数据帧？

如何避免在数据帧中进行永久替换？

从其他数据帧的子集中获取随机样本

用另一个字符串替换pandas数据帧中不匹配列表的字符串

创建维度与原始数据框不同的新数据框

循环数据帧列时出现Keyerror

如何根据atoti中已有的变量创建存储桶？

最终模型拟合-子集与整个训练数据

将groupby均值统计信息映射为pandas中的新列

即使使用了.loc，熊猫仍然可以获得SettingWithCopyWarning

在Pandas数据帧中创建value_counts的列

迭代列和示例

python中本地数据帧和全局数据帧之间的链接是如何实现的？

使用直方图数据在scipy中生成随机样本

在另一个data.frame中创建一个列的100个随机采样的data.frame

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐