为每个groupby df运行一个函数，并使用该函数生成的值(没有df返回)

、、

我有一个或多或少简单的问题，因为我目前的解决方案正在困扰着我。请注意，提供的代码只是一个简单的例子，我并不真的需要组的长度，但希望在未来做一些其他的事情。因此，我当前的代码如下所示： mylist = [] #do stuff with group e.g. return len df_.<em

浏览 11提问于2021-07-20得票数 0

回答已采纳

1回答

选择.groupby()以外的列

、、、

我正在使用Python中的dataset，该数据集有三列: state (ST)、city (City)和证书数量(CERT)。我必须为每个州找到最低数量的证书，这是我用以下代码完成的：但是，当我还需要输出城市时，它只返回州和证书的数量。我需要每个州的城市都

浏览 4提问于2022-04-05得票数 0

回答已采纳

3回答

按字段填充以前的值- Pandas应用功能不填充

、、、

我试图用特定子集的前一行的值填充新列(前一次)中的每一行(满足条件时)。问题是，如果我中断内核并检查值，就可以了。但是，如果它运行到末尾，那么新列中的所有行都没有填充。如果上一行不存在，我将用第一个值填充它。3 4 5Runner 2 5 8

浏览 2提问于2020-05-16得票数 0

回答已采纳

1回答

循环通过Dataframe以按城市删除异常值(调用函数)

、、、

我有一个异常值函数- def detect_discrete_outliers(data): threshold=3 if np.abs(z_score) > threshold: return outliers 现在，我想使用这个离群值函数从df中删除离群值 detect_discr

浏览 25提问于2021-08-11得票数 1

回答已采纳

1回答

Dataframe创建列，包含总销售额

、、、、

当一个游戏被卖出几次时，它的ID会出现好几次。游戏/购买日期/客户/价格/游戏类型/销售总数更新：非常感谢您高效而详细的回答！

浏览 1提问于2022-04-01得票数 0

1回答

与单独运行相比，具有多个聚合的吡火花旋转数据要长/冻结得多。

、、

我使用的是电火花pivot函数。我做错了什么？该命令看起来如下： df_groupby = df.groupby('user_id

浏览 1提问于2021-01-28得票数 1

1回答

如何在Pandas中通过分区计数

、、

下面窗口函数的pandas等效项是什么我可以得到row_number或排名但是，像示例中那样按城市计算分区是我要查找的内容

浏览 1提问于2019-09-11得票数 4

2回答

在使用groupby应用生成系列时保留DataFrame的索引

、、

当使用groupby + apply调用函数时，我想从DataFrame转到Series groupby对象，将一个函数应用到每个以Series作为输入并返回Series作为输出的组，然后将groupby+ apply调用中的输出分配为DataFrame中的字段。默认行为是将来自groupby + apply的

浏览 2提问于2017-02-11得票数 4

回答已采纳

2回答

Pandas groupby操作返回对象，但没有可视对象

、

刚接触Pandas (2天)，并在我的学院奖数据集上运行了以下groupby命令。df[(df.Award == 'Best Actress') & (df.Winner == 1.0)].groupby('Name')我期

浏览 1提问于2017-04-26得票数 1

0回答

Pandas-基于另一列的行和创建新列的正确方法(尝试在副本上设置的值)？

、、、

我有一个包含日期、名称和值的dataframe，我要做的就是创建一个列，该列是每个日期的值的总和的输出，然后用该日期的每个名称的值减去这个和。我已经能够做到这一点，但我得到了常见的错误：A value is trying to be set on a copy of a slice from a DataFra

浏览 0提问于2017-12-01得票数 0

回答已采纳

4回答

每一独特值取样一条记录(熊猫、蟒蛇)

、、、、

我使用python-大熊猫的dataframes，我有一个包含用户和他们数据的大数据。每个用户可以有多个行。我想要每个用户一行的示例。我目前的解决方案似乎没有效率： df1 = pd.DataFrame({'User': ['user1', 'user1', 'user2', 'user3', 'user2&

浏览 4提问于2016-07-15得票数 20

回答已采纳

1回答

如何使用自定义熊猫群聚合函数将数据帧中的行组合起来

、、

我想将这些重复序列平分到一行中，并将不同(唯一)的部门值组合到一个列表中。因此，取每个组的第一行，只需将department值更改为该组中唯一的department值的列表即可。因此，生成的dataframe应该有完全相同的列，但是name列中没有重复，而department列现在至少有一个元素的列表。我想使用

浏览 1提问于2016-11-20得票数 2

回答已采纳

1回答

创建转置和GroupBy矩阵数据帧Python Pandas

、、、

有了每一行的PUSH值(在本例中，我只有一个ID，但表中包含更多ID)，我想创建第二个表(图片中的黄色表)。然后目标是:为每个商店创建新的列(列出7个adh，ayc，maeg，rot，witz，mar，bud)，其中每个商店将接收来自PUSH列的值。预期的结果是黄色的表，我将在用于生成ID、STORE、PUSH表的相同数据帧中添加该</e

浏览 35提问于2021-09-29得票数 1

1回答

群函数的系列查询

、、

我有一个名为active的数据框架，它有10个唯一的POS列值。 df2 = pd.DataFrame({'X'

浏览 3提问于2015-01-21得票数 1

回答已采纳

2回答

比较或区分两个熊猫栏元素

、

Eins我的假设是，当A列中的值为1时，B列中的值总是One。其次，我还假设，如果我的第一个假设是不正确的，这不是一个错误，但这是有效的(人为的)原因。例如，请参见行索引4，其中A-value与B列中的Eins (而不是One)相关。正因为如此，我还需要看到和探索我的假设不正确的情况。更新问题：这个数

浏览 5提问于2021-05-25得票数 1

回答已采纳

1回答

使用sklearn查找每组数据帧的系数

、、

我有一个包含一些值和多个组的数据帧(df1)。我想对每个组执行线性回归，这样我就可以使用系数来完成df2，然后将它们连接起来(df3)。到目前为止，我还在处理我的整个数据帧import pandas as pd return linear_model.LinearRegression, df2]) 这是可行<

浏览 2提问于2019-05-03得票数 0

1回答

定义一个函数来播放CSV数据中的图形- Python熊猫

、

我试着玩数据分析，从我创建的带有随机值的简单CSV文件中获取数据。 print type(x) df1=dataFrame df2=df1[['currencyPair','amount']]<e

浏览 1提问于2016-01-08得票数 2

回答已采纳

2回答

使用自定义函数操作熊猫数据

、、、

我在将客户函数应用于数据访问时遇到了困难。该函数工作正常，并返回正确的数据。然而，在应用了它之后，我的数据仍然是旧的。(data = d) 我为分组编写了一个小的测试函数，并为每个组找到了col2中的最高值：x = x.<e

浏览 7提问于2022-04-12得票数 1

1回答

查找具有最大行数的索引

、、

我的任务：问题5 哪个州有最多的县？(提示:仔细考虑sumlevel密钥！你将来的问题也需要这个.)这个函数应该返回一个字符串<e

浏览 0提问于2019-07-04得票数 0

回答已采纳

3回答

群唯一的组过滤器

、、

在组内执行过滤器并遇到麻烦。过滤器用于groupby的每个dataframe中的元素；对于groupby的dataframe来说是唯一的。我想按ID上的第一个df进行分组，然后在conditions_df中显示的条件下返回一个过滤后的值。该条件与第一个groupby<

浏览 1提问于2018-08-02得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

选择.groupby()以外的列

按字段填充以前的值- Pandas应用功能不填充

循环通过Dataframe以按城市删除异常值(调用函数)

Dataframe创建列，包含总销售额

与单独运行相比，具有多个聚合的吡火花旋转数据要长/冻结得多。

如何在Pandas中通过分区计数

在使用groupby应用生成系列时保留DataFrame的索引

Pandas groupby操作返回对象，但没有可视对象

Pandas-基于另一列的行和创建新列的正确方法(尝试在副本上设置的值)？

每一独特值取样一条记录(熊猫、蟒蛇)

如何使用自定义熊猫群聚合函数将数据帧中的行组合起来

创建转置和GroupBy矩阵数据帧Python Pandas

群函数的系列查询

比较或区分两个熊猫栏元素

使用sklearn查找每组数据帧的系数

定义一个函数来播放CSV数据中的图形- Python熊猫

使用自定义函数操作熊猫数据

查找具有最大行数的索引

群唯一的组过滤器

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐