Pandas value_counts组sum依赖于groupby.agg函数中的另一列

、、

我目前正在聚合一组按变量var1 and var2分组和聚合的变量。让我们假设我确实有连续变量var3, var4, var5，其中我可以很容易地计算聚合组中的平均值、标准差、最小值、最大值和中位数。var6和var7进行分组，并将它们作为新列放在聚合旁边。下面是我喜欢做的事情：1 a

浏览 21提问于2021-05-21得票数 0

1回答

Pandas GroupBy聚合不保留数据类型

我通过使用sum、max和min等函数将Pandas GroupBy和Groupby.agg用于我的数值列，但我注意到以前强加给我的列的数据类型(如np.int8、np.int16、np.int32)在GroupBy聚合后不会保留，实际上每一列都被覆盖为int64。Pandas版本1.1.5 我目前的解决方案是在完成groupby聚合后重新转换，这是一个已知的问题

浏览 19提问于2021-03-16得票数 1

回答已采纳

2回答

获取count_values(normalize=True)结果中的每个值，在每一组熊猫GroupByDataframe

、、

Audi","Volvo","Volvo","VW","Audi","Volvo"]}) ratio count现在应用在每个car组中，而不是每个id组中，否则几乎就会出现这种情况。仅仅解析"value_counts"不起作用(

浏览 12提问于2022-09-19得票数 1

回答已采纳

2回答

我有一个包含ID和标签两列的dataframe。标签只能为0或1。下面的代码生成这样的数据帧 data = [[10105, 1], [10105, 1], [10105, 0], [20205, 0], [20205, 0], [20205, 1], [20205,这个 test.groupby('ID') 我将按ID对条目进行分组，但是我想看看有多少ID为10105的条目的标签为1，有多少条目的标签为0。我还想计算一下0的百分比。这将是理想的输出。，但同时我需要一

浏览 24提问于2019-08-27得票数 2

回答已采纳

2回答

如何查找在另一列的不同行中有多个值的列值的总长度

、、、、

有没有办法找到同时包含Apple和Strawberry的Is，然后找到总长度？只有苹果的IDs和只有草莓的IDS呢？

浏览 30提问于2020-10-23得票数 2

回答已采纳

3回答

使用pandas GroupBy.agg()对同一列进行多个聚合

、、、、

pandas有没有一种内置的方法，可以在同一列df["returns"]上应用两个不同的聚合函数f1, f2，而不必多次调用agg()？示例数据帧：import datetime as dtdf = pd.DataFrame"returns" : 0.05 * np.random.randn(10),

浏览 0提问于2012-09-26得票数 190

回答已采纳

2回答

对熊猫群的结果进行索引是做什么的？

、

在这里，['y']是做什么的？我理解('x')。提前感谢！

浏览 0提问于2019-12-15得票数 0

回答已采纳

1回答

如何用Python求出数据集各列的熵？

、、、、

我想找出每个特征(列)的熵。我写了以下代码，但它有很多错误：import math df.loc[:,"val1":"val5&quo

浏览 0提问于2018-04-06得票数 0

7回答

如何计算熊猫DataFrame中的nan值？

、、、、

在熊猫DataFrame中说明(而不是数字) nan值的最佳方法是什么？以下代码：import pandas as pddfv = dfd.a.value_counts().sort_index()print("1: %d"

浏览 13提问于2015-12-30得票数 27

回答已采纳

1回答

根据列中的值，有条件地聚合具有不同函数的分组数据框

、

", "sum", "mean", "mean", "mean", "mean"]}) 我想在df["val"]中聚合数据，方法是对group_id进行分组，然后对每个组应用不同的聚合函数。为了确定使用哪个聚合函数，我想设置一个条件，该条件引用df中的另一个列，即condition。具体

浏览 21提问于2021-01-24得票数 1

回答已采纳

3回答

访问pandas value_counts的第一列

、

我尝试使用Python的pandas包中的value_counts()函数来查找列中条目的频率。63053 21768 88其中第一列是项，而右列是它在该列中的频率。从那里开始，我想访问第一

浏览 1提问于2016-05-02得票数 16

回答已采纳

6回答

如何检查某个值在特定pandas数据框列中是否唯一

、、、、

我需要检查一个特定的值在pandas dataframe列中是否多次存在。这是基本的代码； try: # if row

浏览 1提问于2019-07-12得票数 1

1回答

如何最好地将两个数据集的分类值的频率与Pandas进行比较？

、、、

我试图比较两组数据，每组数据都使用Pandas和Matplotlib列出的分类变量。我希望通过对每个数据集使用value_counts()方法来获取并以某种方式存储每个变量的值频率，以便以后比较这两个变量在这些频率上的显著差异。到目前为止，我只使用一个函数将数据帧中每一列的值和计数显示为饼形图，给出了在函数外部定义的列列表(cat_columns)： def ge

浏览 7提问于2022-10-23得票数 0

1回答

将列中的值替换为excel/sql/ same中同一列中出现的频率

、、、

我有一个包含超过600000条记录的表和一个名为implementer_userid的列，其中的值可能被重复用于多个记录。现在，我想在该列中存储特定的不同值出现的次数。COUNTIF(Excel)、GroupBy(sql)和类似的函数不能工作，因为我不想要一个特定值的计数，而是用它们的频率替换所有不同的值。在这三个框架中的任何一个框架中<

浏览 3提问于2020-02-20得票数 1

回答已采纳

1回答

在Pandas中有等同于GraphLab SFrame.show()的东西吗？

、、、

Graphlabs SFrame.show()显示SFrame中每一列的综合视图，我想知道Pandas中是否有对应的列？ df.describe()只是不能提供sf.show()所能提供的细节级别。

浏览 1提问于2016-10-15得票数 5

1回答

如何将DataFrame列作为参数传递到函数中？

、、、、

enter image description here在给定列中检查特定值的分布，如天气确切多云的次数。请随意检查其他值。您可以通过使用相应的参数调用clear函数来检查它。#Importing the modulesimport numpy as npdf - Pandas datafr

浏览 27提问于2020-07-24得票数 0

8回答

计数数据栏中真假的发生

、、、、

有没有一种方法可以在不需要循环遍历DataFrame的情况下计算列中布尔值的出现数？做一些类似的事情不工作，因为False的值为0，因此零和将始终返回0。显然，您可以通过遍历列并检查来计算发生的次数，但是我想知道是否有一种节奏式的方法来做到这一点。

浏览 0提问于2018-11-21得票数 17

回答已采纳

1回答

模块“海运”没有属性“distplot”

、、

我有一些代码，比如：import numpy as npimport seaborn assns data['average']

浏览 1提问于2019-07-01得票数 1

5回答

Python :将".value_counts“输出转换为数据

、、

嗨，我想得到数据的唯一值的计数。count_values实现了这一点，但是我想在其他地方使用它的输出。如何将.count_values输出转换成熊猫数据。下面是一个示例代码：df = pd.DataFrame({'a':[1, 1, 2, 2, 2]})print(value_c

浏览 9提问于2017-11-06得票数 129

回答已采纳

1回答

熊猫DataFrame value_counts在存储DataFrame的专栏上

、

我正在尝试在一个存储另一个value_counts()的熊猫DataFrame专栏上使用DataFrame。是否有可能使value_counts()函数工作(或类似的东西)，而不必将DataFrames转换为字符串、散列或类似的东西？我试着计算内部DataFrames (完全破坏)，然后尝试使用数组，这似乎也无法进行正确的比较：import pandas as pd import numpy(

浏览 2提问于2022-05-18得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Pandas GroupBy聚合不保留数据类型

获取count_values(normalize=True)结果中的每个值，在每一组熊猫GroupByDataframe

熊猫分组并做一个总结

如何查找在另一列的不同行中有多个值的列值的总长度

使用pandas GroupBy.agg()对同一列进行多个聚合

对熊猫群的结果进行索引是做什么的？

如何用Python求出数据集各列的熵？

如何计算熊猫DataFrame中的nan值？

根据列中的值，有条件地聚合具有不同函数的分组数据框

访问pandas value_counts的第一列

如何检查某个值在特定pandas数据框列中是否唯一

如何最好地将两个数据集的分类值的频率与Pandas进行比较？

将列中的值替换为excel/sql/ same中同一列中出现的频率

在Pandas中有等同于GraphLab SFrame.show()的东西吗？

如何将DataFrame列作为参数传递到函数中？

计数数据栏中真假的发生

模块“海运”没有属性“distplot”

Python :将".value_counts“输出转换为数据

熊猫DataFrame value_counts在存储DataFrame的专栏上

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐