在Python Pandas数据集中保留每行的随机最低值

、、

我有一个数据框架，其中每一行都在几个属性上进行排序，而不是所有其他行。单行可以在两个属性中具有相同的排名(这意味着一行可以是几个属性中最好的)，如下面的第2行和第3行所示： att_1 att_2 att_3 att_4984 53 1 466471 20 2 3 2 每一行，我希望保留索引(ID)和具有最低值的单元格-如果有超过

浏览 14提问于2019-03-20得票数 1

回答已采纳

4回答

在Python数据集中只保留每行的最低值

、

在Pandas数据集中，我只想保持每行的最低值。所有其他值都应删除。我需要完整的原始数据集。只需删除不是最小值的所有值(用NaN替换)即可。谢谢罗伯特

浏览 2提问于2014-11-11得票数 1

回答已采纳

2回答

pandas rank函数2列表示高值和低值

、

下面是组成一个包含两列的pandas数据帧的代码，一列名为data，另一列名为hours。data列是从-150到250的随机整数。hours列是从.5到15.5.的随机浮点数。import randomimport pandas as pd dfData']) #generate rando

浏览 3提问于2021-01-08得票数 0

2回答

Python:如何将数据采样到测试和培训数据集中？

、、

我一直在使用CSV数据来实现我的脚本，并希望将数据采样到两个数据集中：我希望在85%和15%的分区中对数据集进行采样，并希望输出两个CSV文件Test.csv和Train.csv我希望在基本Python中这样做，并且不想使用任何其他外部模块，如Numpy、SciPy、Pandas或Scikitlearn。有人

浏览 5提问于2016-03-15得票数 3

回答已采纳

1回答

随机选择Python中不同百分比的数据

、、、

这里是Python初学者。我有一个有101行的数据集，我使用Pandas将其导入Python (作为csv文件)。实际上，我想要在0到1之间随机生成一个数字，并根据结果从数据集中随机选择等效百分比。因此，例如，随机生成的0.89个数字将需要选择89%的数据。我还想说明不同的百分比，例如，我有89%、8%和3%的随机</

浏览 1提问于2018-09-18得票数 1

回答已采纳

1回答

在scikit-learn中平均多个随机森林模型

、、、

我有一个非常大的数据集，我想在数据集的分区上训练几个随机的森林模型，然后对这些模型进行平均，以得出我的最终分类器。由于随机森林是一种集成方法，这是一种直观上合理的方法，但我不确定是否可以使用scikit-learn的随机森林分类器。有什么想法吗？我也会开放使用来自另一个包的随机森林分类器，只是不确定去哪里找。

浏览 0提问于2017-12-23得票数 1

1回答

python:从数据集中删除比较两个直方图的记录

、、、

我有两个具有不同长度(每行都是记录)的多列(order 10)数据集，它们必须成为相同的行数:条件是对多个列(从2到4 )进行绑定，然后删除其中一个数据集中的超出记录(在该垃圾箱中的所有记录之间随机选择既然我事先知道一个数据集比另一个数据集小--我(天真地说)--我的想法是先计算两个直方图(先小一点)，从另一个中减去另一个在每个垃圾箱中有差异，遍

浏览 0提问于2017-02-04得票数 0

回答已采纳

1回答

如何准备熊猫的纵向数据，然后从学习算法中使用？

、、

我正在使用Pandas清理和准备我的数据集，以供学习算法使用，例如用于分类的随机森林或用于聚类的K-means。我曾经有过这样的数据集(举例说明)：然而，在我的数据集中，我面对的是一种不同的类型:纵向数据，如下图所示：正如您所看到的，对于每个单独的实例(人员或汽车)，同

浏览 3提问于2015-03-29得票数 1

1回答

如何使用Python查找基于数据集的列的动态函数的根

、、、、

我是Python的初学者，我需要把R中的一些代码翻译成python。我需要在基于动态函数的数据集中找到每行一个根，R中的代码是：library(dplyr) dataset = data.frame(parse(text=as.character(FX),dataset))),lower = -10000, upper = 10000, tol = 0.00001)

浏览 7提问于2019-11-12得票数 3

回答已采纳

1回答

如何在原始索引的同时从数据帧中采样？

、、

我有一个pandas数据框架，我想使用.sample(frac=0.1)并创建数据集的子集。但是，我希望在子集中保留原始索引。这个是可能的吗？

浏览 13提问于2021-01-18得票数 0

1回答

Pandas dataframe -将N行从一个数据帧移动到另一个数据帧

、、

我有一个用于机器学习的训练集和测试集，但是训练集包含的数据行太多，而测试集包含的数据太少。我计算出我需要将245行从训练集中移动到测试集中，以产生更好的拆分。我该怎么做呢？我在训练集中总共有5116行。首先，我使用下面的代码随机化训练集的行 train_df = train_df.sample(n = len(train_df)).reset_index(drop=True) 然后

浏览 13提问于2020-12-24得票数 0

回答已采纳

2回答

熊猫数据中的“随机行”

、、

在熊猫数据中，我如何丢弃随机子集中的服从条件的行Label A0 31 11 1 121 13 我很想知道一种最简单，也是最像熊猫的方法我仍然

浏览 2提问于2018-06-19得票数 4

回答已采纳

2回答

1000个整数GroupBy -出现

、、、

我在1到100之间创建了100万个随机整数&将结果写入一个文本文件。但我希望在整个数据集中找到每个整数的出现情况。 df = pd.read_csv('RandomN

浏览 1提问于2018-10-09得票数 1

回答已采纳

1回答

使用apply()加速数据帧上的嵌套循环

、、、

我有一个在Python中使用Pandas的dataframe，它包含每行上的纬度和经度坐标。我的目标是添加另一个名为"close_by“的列，其中包含使用半正弦计算数据集中1英里以内的其他条目的数量。我见过类似问题的其他指南，比如：https://engineering.upside.com/a-beginners-guide-to-opti

浏览 23提问于2019-04-16得票数 0

1回答

读取包含单词“.dat”的上层文件会导致问题

、、

这是我用来读入.dat文件的代码：import matplotlib.pyplot as plt plt.xlabel('yh_center')plt.savefig('name.pdf')当dat中没有单独的单词center upper 0.0000

浏览 1提问于2018-03-06得票数 0

1回答

不正确排序的SQLite随机()

、、、、

我的SQLite查询似乎是从指定的"ORDER“子句返回结果。当我运行以下内容时，第三列给出了我想要的随机值，但是它的顺序看起来被忽略了。结果集似乎是随机排序的。-- 4 Jack 023 Bob 3 4 Jack "A9" 2

浏览 0提问于2014-02-23得票数 6

回答已采纳

1回答

使用min()获取最小值或排序数组，然后在实现A (A星)算法中的打开集时，在Python中弹出第一个值？*

、、

我正在用Python实现A* (星型)算法。在该算法中，我们从开放集中得到F(n)值最小的节点(估计总成本)。我们经常使用PriorityQueue，但出于某些原因，我不明白为什么PriorityQueue没有得到值最低的节点。因此，我创建了一个名为"frontier“的数组列表(Python中的常规列表)，并将”打开集“保留在那里。有两

浏览 3提问于2020-11-14得票数 3

回答已采纳

1回答

pandas.errors.ParserError:应为第3行中的5个字段，实际为6

、、

我正在尝试使用pandas读取数据文件， import pandas as pddf = pd.read_csvcall last): File "/usr/local/lib/python3.

浏览 34提问于2021-10-11得票数 0

2回答

随机丢弃重复

、

在Pandas中，我们可以使用dataframe.drop_duplicates()删除重复数据，默认情况下保留重复数据的第一行。如果是keep_last = True，则保留最后一行。我们如何保持随机行，并使用熊猫drop_duplicate删除重复行？

浏览 3提问于2014-04-04得票数 5

回答已采纳

1回答

基于重复值的列值替换

、、

在我的数据集中，我有OrderID列和OrderTotal列。我有重复的OrderIDs，我不想删除重复项，相反，我希望用OrderID的第一个实例保留order总计的值，并在有其他重复的OrderID时将OrderTotal的值替换为0。以下是我所做的：df['OrderTo

浏览 0提问于2020-06-27得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在Python数据集中只保留每行的最低值

pandas rank函数2列表示高值和低值

Python:如何将数据采样到测试和培训数据集中？

随机选择Python中不同百分比的数据

在scikit-learn中平均多个随机森林模型

python:从数据集中删除比较两个直方图的记录

如何准备熊猫的纵向数据，然后从学习算法中使用？

如何使用Python查找基于数据集的列的动态函数的根

如何在原始索引的同时从数据帧中采样？

Pandas dataframe -将N行从一个数据帧移动到另一个数据帧

熊猫数据中的“随机行”

1000个整数GroupBy -出现

使用apply()加速数据帧上的嵌套循环

读取包含单词“.dat”的上层文件会导致问题

不正确排序的SQLite随机()

使用min()获取最小值或排序数组，然后在实现A (A星)算法中的打开集时，在Python中弹出第一个值？*

pandas.errors.ParserError:应为第3行中的5个字段，实际为6

随机丢弃重复

基于重复值的列值替换

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐