pandas: groupby和aggregate，不会丢失已分组的列

、、、

对于每个Id，我可以有多个名称和子Id。A 5933276956 C 5935我希望压缩数据帧，使每个id只有一行，并且每个id下的所有名称和，然后聚合所有其他列。df.groupby('Id').agg(lambda x: set(x)) 但是在这样做的时候，得到的数据帧没有Id列。当您执行groupby时，

浏览 4提问于2016-09-12得票数 24

回答已采纳

3回答

Python:如何仅在Pandas中完全相似的情况下才合并重复行？

、、、

我有一个包含列Items和Ranges的数据帧。Items Ranges1 A 303 B 20 我想合并重复的行并添加范围值，但只针对完全相同的行生成的数据帧应如下所示： RangesA 60B 20 我尝试了df2 = df1.groupby([&

浏览 19提问于2021-04-05得票数 1

回答已采纳

1回答

pandas groupby aggregate用于具有项目列表的列，返回string和not list

、、、

考虑以下数据帧： sample_DF.tsv 我想按这个数据帧分组，所以我应用了以下逻辑： df = pd.read_csv('sample_DF.tsv',sep='\t') df.groupby('col3',as_index=False).aggregate(lambda x:list(x)).reset_index(drop=True) 但是输出不会作为列4和列5的列表的</e

浏览 11提问于2019-09-24得票数 0

回答已采纳

1回答

熊猫:将数组求和为具有多个组比列的聚合

、、

我正在使用Python3.5.1和Pandas 0.18.0。pandas.core.base.DataError: No numeric type

浏览 3提问于2016-10-03得票数 3

回答已采纳

1回答

dataframe.groupby.agg TypeError：_agg_2dim()接受1个位置参数，但给出了2个

、、、

我正在尝试按部门分组，并将具有相应经度和纬度的列保留到部门内人口最多的城市。你知道为什么这不管用吗？popDEP = pop.copy().groupby("dep", as_index=False)[["dep","lon","lat","total"]].agg({'total': ['max']/core/group

浏览 0提问于2021-04-01得票数 0

1回答

熊猫-多栏群

、

我试图按多个列进行分组，并将它们聚合，使它们在分组后成为一个列表。(lambda x: list(x)) /usr/local/lib/python2.7/dist-packages/<

浏览 0提问于2015-11-13得票数 3

回答已采纳

1回答

熊猫数据帧分组失去分组功能

、

我有一只熊猫数据(glob_df)，我试图按lga_abbreviated_name字段分组如下：lga_abbreviated_name objectcounts int64dtype: object >>> dg=glob_df.groupby('lga_abbreviated_name').aggregate({'cou

浏览 3提问于2022-11-07得票数 0

回答已采纳

4回答

在熊猫中无法通过DataFrame在组上执行平均聚集

、、

我下面有数据集我想在“马力”栏上进行平均操作，然后用熊猫对“圆柱体”和“模型年”进行分组。我在jupyter笔记本上运行代码。下面是我的代码：df.groupby(['cylinders','model year']).agg({'horsepower':'mean'}) 基本上，我执行第一组的列‘柱体’<em

浏览 6提问于2021-11-13得票数 0

回答已采纳

1回答

dask groupby* agg加权平均“未知聚合lambda”错误*

、

在Dask中，我需要基于第三列从两列的分组值计算加权平均值。我正在这样做： dask_df = dd.from_pandas(df, npartitions = 10) wm = lambda x: np.average(x, weights=dask_df.loc() 在Pandas中，我耗尽了内存。File "/anaconda3/lib/python3.7/site-packages/dask/dataframe

浏览 35提问于2019-08-27得票数 2

1回答

如何实现熊猫群对象的聚合功能？

、

对象，其中组由df的第一列中的值确定。/pandas/core/groupby.py", line 1757, in _aggregate_generic>>> impo

浏览 0提问于2014-09-04得票数 2

1回答

熊猫分组和可视化

、

我必须使用Python3和pandas对一个数据集做一些分析，如玩具示例所示- data location importance agent count 0 London，然后计算每个位置的低、中和/或高“重要性”列的数量。到目前为止，我想出的代码是- data.groupby(['location', 'importance']).aggregate

浏览 17提问于2021-02-04得票数 1

回答已采纳

1回答

使用Apply和Groupby的Lambda

、、、、

我正在尝试计算由第二列分组的pandas数据帧的列中的唯一值，并将结果作为数据帧中的新列返回。当我在下面的dataframe上测试这个操作时，它返回空值。pandas和unique，它不再是一个有效的转换函数。_selected_obj) File "C:\ProgramData\Anaconda3\lib\site-packages\pandas</em

浏览 37提问于2020-11-24得票数 1

回答已采纳

1回答

如何按一列分组并对另一列的值进行排序？

、、、

这是我的数据框df = pd.DataFrame({'A': ['one', 'one', 'two', 'two', 'one'] ,', '11/11/2001', '08/30/2015', '07/3/1999','03/03/200

浏览 0提问于2016-11-18得票数 9

回答已采纳

4回答

在pandas中过滤GroupBy之后的组，同时保留这些组

、、

在pandas中，我想要做的是：df.groupby('A').filter(lambda x: x.name > 0) - group by列A，然后过滤名称为non positive的组。但是，当GroupBy.filter返回DataFrame时，这会取消分组，从而丢失分组。我想按这个顺序来做，因为它应该对计算要求较低，因为filter后面跟着groupby会遍历DataFrame两次

浏览 3提问于2018-04-14得票数 12

1回答

通过GroupBy获取DataError的熊猫平均值:没有要聚合的数值类型-

、、

我知道有很多关于这方面的问题，比如和，但我得到了一个奇怪的错误。In [74]: df.head().groupby(lambda x: x.month).groups{1: [Timestamp('2008-().groupby(lambd

浏览 4提问于2014-08-20得票数 5

回答已采纳

1回答

Pandas Groupby，用于整数值的Group Concat

、、

我的pandas dataframe看起来像这样，我希望按键对它进行分组，并连接id的逗号分隔，然后创建一个新的dataframe。现在这里的问题是id列是整数。id 1 abcd 5025923,5096021,5032121df.groupby</

浏览 5提问于2017-12-17得票数 4

1回答

python group by，传入列以聚合函数参数

、、、、

当我将几个列传递给聚合函数时，我希望了解如何在pandas中进行聚合。我习惯了在R中使用dplyr，这是非常简单的。grouped_data.

浏览 81提问于2018-06-17得票数 2

回答已采纳

1回答

如何在Pandas中创建多索引

、

问题1 sasha 14 0.724720 two 2 asa 76 0.77432

浏览 0提问于2016-10-25得票数 10

回答已采纳

1回答

列中的重复行- python/pandas

、、、、

我最近开始使用python和现在的pandas来读取excel文件。我有点纠结于一个问题，我没有找到任何类似的例子。假设我有来自不同机器的不同分钟的数据。发生的情况是，一台机器有多个信息。例如，在下图中，如果考虑机器13.5，则在5 5分钟内有5个关于成本和温度的信息。我需要成本、温度和分钟信息的平均值，也就是说，每个machine.Considering只有一行。下面是我的代码。import

浏览 14提问于2021-11-03得票数 0

1回答

在列和索引上使用groupby和aggregate with pandas

、、、、

87 242 1 88 30 3 23 323 1 33 40如果我想按索引上的结果分组我还想对这一列应用一个函数，但显然这失败了： >>> roll_table = pd_table.groupby("A").aggregate({"B": max, "C": min, "D": max\

浏览 6提问于2020-08-01得票数 5

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python:如何仅在Pandas中完全相似的情况下才合并重复行？

pandas groupby aggregate用于具有项目列表的列，返回string和not list

熊猫:将数组求和为具有多个组比列的聚合

dataframe.groupby.agg TypeError：_agg_2dim()接受1个位置参数，但给出了2个

熊猫-多栏群

熊猫数据帧分组失去分组功能

在熊猫中无法通过DataFrame在组上执行平均聚集

dask groupby* agg加权平均“未知聚合lambda”错误*

如何实现熊猫群对象的聚合功能？

熊猫分组和可视化

使用Apply和Groupby的Lambda

如何按一列分组并对另一列的值进行排序？

在pandas中过滤GroupBy之后的组，同时保留这些组

通过GroupBy获取DataError的熊猫平均值:没有要聚合的数值类型-

Pandas Groupby，用于整数值的Group Concat

python group by，传入列以聚合函数参数

如何在Pandas中创建多索引

列中的重复行- python/pandas

在列和索引上使用groupby和aggregate with pandas

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐