如何通过Python中的groupby函数获取均值来创建列？

、、

Sector, TSR_15_16Americas Telecom 15% ...so on 7000 rows 我已经计算了按行业和地区分组的平均X = CGdf_2004.groupby(['Region', 'Sector']).mean() 现在，我想在CGdf_2004中创建一个新列，其中包含基于扇区和区域的均值。因此，我希望将(欧洲和消费者)的</em

浏览 11提问于2019-04-05得票数 2

回答已采纳

2回答

如何查找和添加ID的频率列？

、、、、

我是python的初学者，请耐心听我说！dfcount = dfxyz.groupby(["ID", "Date"])dfcount1 = dfcount.mean() 我得到的<

浏览 0提问于2018-04-20得票数 0

3回答

从数据帧中获取价值

、、、

在Scala中，我可以使用get(#)或getAs[Type](#)从数据帧中获取值。在pyspark中我应该怎么做呢？我有一个两列的DataFrame：item(string)和salesNum(integers)。我做了一个groupby和mean来获得这些数字的平均值，如下所示：而且

浏览 2提问于2016-06-28得票数 21

回答已采纳

2回答

计算Spark DataFrame中分组数据的标准差

、、

为了利用SparkSQL查询功能，我从csv中获取了用户日志，并将其转换为DataFrame。单个用户每小时将创建多个条目，我想为每个用户收集一些基本的统计信息；实际上只是用户实例的计数、平均值和许多列的标准差。我能够通过使用groupBy($"user")和带有用于计数和平均的SparkSQL函数的聚合器快速获得平均值和计数

浏览 1提问于2015-08-03得票数 22

回答已采纳

1回答

获取大熊猫群中的所有值

、

熊猫群比提供first和last来获取组中的第一个和最后一个值。是否有一种方法可以将一个组中的所有值作为列表？我想为某些列计算平均值，但通过操作获取熊猫组中其他列的所有值。df_points = df_points.groupby(['field_id', 'Year']).agg({'Added_by'

浏览 2提问于2019-12-05得票数 2

回答已采纳

1回答

如何求和并将一个DataFrame表示为创建另一个DataFrame

、、

DataFrame，其中合并了Name列中的重复值，没有留下重复的值。()命令将求和函数应用于DataFrame中的每一列，因此也会处理 command (以分钟为单位)列。相反，我希望获得工期列的平均值。所以我需要使用mean()方法，如下所示： df_mean = df.groupby('Name', axis=0).mean().rese

浏览 2提问于2016-09-03得票数 6

回答已采纳

1回答

如何在DataFrame中创建和使用新函数？

、、、、

如何在我的DataFrame中创建新函数并使用这个新函数，以便在聚合时添加新列？从我的DataFrame中，我获得了“风向”和“温度”，对于这些列，我想将它聚合起来，并创建具有“风向”平均值和所有城市的值与平均值"aa“之间的差值以及”温度“的平均值的表。然而，在我

浏览 6提问于2019-10-21得票数 1

1回答

熊猫在默认选项中的集合功能？

、、、、

我想用groupby作为我的索引，获取员工和价值列的平均值，以及提供者列的第一次计数。456 lukeLevi 789 12 chrisdf = df.groupby'value', 'provider'].agg({'workers': mean,

浏览 1提问于2018-07-09得票数 6

回答已采纳

1回答

我正在使用case类，创建一个RDD并为数据分配一个模式，然后将其转换为一个DataFrame，这样我就可以使用SparkSQL来通过满足特定条件的统计数据来选择玩家组。一旦我有了我感兴趣的球员的子集，我想找到一个列的平均值；例如打击平均数或打点。从那以后，我想根据所有球员的平均表现，把他们分成百分位组；前10%，最低10%，40-50%。但是，我已经能够使用DataFrame.describe()

浏览 0提问于2015-07-22得票数 14

回答已采纳

1回答

修改agg函数以使用降序Python* Pandas显示值？*

、

我如何修改下面的代码，以便通过从最大值到最低值的降序来表示例如“均值”？data.groupby(["Duration"]).agg({'Credit amount':[min, max, np.mean, np.median, sum]})我想通过降序来排序，比如，均值。因此，我想将此表按照从最大到最低的均值<em

浏览 0提问于2020-03-02得票数 0

2回答

Pandas:合并数据框行并取第二列值的平均值

、

我有一个两列的数据框，第一列包含一个日期(yyyy-mm-dd)，第二列是5个级别中的一个，即'1‘或'2’等。df是按日期排序的，日期从第一行开始下降。我正在寻找一种方法来合并包含相同日期值的行-即所有2021-05-05，然后取该给定日期的所有评级值的平均值，以提供该日期的相应评级平均值。例如，如果我的d

浏览 28提问于2021-05-06得票数 2

回答已采纳

2回答

与熊猫的情节:群体与平均

、、

我来自“combos”数据框架的数据如下所示：ax.set_ylabel('pred')我得到了这个阴谋：当保持对(lmi，pr)不变时，我如何为每个"lmi“数据点绘制"pred”的意思？

浏览 5提问于2017-04-10得票数 1

回答已采纳

1回答

如何通过创建的列来groupBy？

、、、

u.id = a.user') ->groupByI收到通知:未定义索引:月份如何将记录按这两个变量分组？如果没有->groupBy(‘月份’)，它将100%正确地工作

浏览 7提问于2021-12-14得票数 -2

2回答

如何在Pandas中应用NaN时忽略groupyby值

、

我有一个由多列组成的数据集，我想使用Python中的groupby函数来计算平均值。但是，由于其中一些值是NAN，因此当存在NAN值时，我得到该特定组的平均值为NAN。你知道我该如何做到这一点吗？提前感谢！

浏览 1提问于2017-04-05得票数 0

3回答

使用np.vectorize在数据帧中创建列

、、、、

我有一个data，包含两个带有数字的列和一个带有重复字母的第三列。columns=list('xy'))df['letters'] = letters 我想要创建两个新列，它将列'x‘和'y’中</em

浏览 1提问于2020-06-04得票数 1

回答已采纳

1回答

以群体为手段

、、、

我有一个有几个列和几行。我想按一个名为"A“的栏目分组。我可以通过df.groupby('A')来完成这个任务。现在，我想采用每个组中称为"C“的列的方法，这是我可以用df.groupby('A').C.mean()做的。最后，我想取C栏中每一组的平均值。我怎样才能做到这一点(最后<em

浏览 0提问于2018-06-14得票数 0

回答已采纳

2回答

通过排除四列值的离群值(四列中位数的+-25%)来计算中位数。

、、、

我有四栏，里面有过去四年的销售量。我想要计算中位数，然后根据条件(中位数的+-25%)排除列值来计算平均值。+- 25%的四列的值来计算平均值。如何通过避免Year_Lag2值来计算平均值。我希望对数据文件中的所有行都这样做。(另外，如果有人能通过避免离群值来帮助更好地计算

浏览 2提问于2019-08-25得票数 0

回答已采纳

2回答

基于字符串条件填充缺失值

、、、

我试图编写一个函数，根据文本列中的字符串条件，从数字列中提取一些空值。'] = df['NumericColumn'].fillna(value=val)ValueError: The truth value of a Series is ambiguous.我试图找到可以针对我的情况进行

浏览 11提问于2021-12-06得票数 2

回答已采纳

2回答

熊猫群句法解释

、、、

我不明白为什么Pandas函数可以用以下两种方式编写，并产生相同的结果。具体的代码并不是真正的问题，两者都给出了相同的结果。我希望有人能分析一下这两种语言的语法。df.groupby(['gender'])['age'].mean() 在第一个实例中，它看起来像是在特定地调用age

浏览 4提问于2022-04-04得票数 0

回答已采纳

1回答

创建一个客户用户定义的函数，用于使用平均中值模式替换丢失的行

、、、

我尝试在python中创建一个自定义用户定义的函数，通过使用平均值、中值和模式值来替换dataset中缺少的值。但我无法获得所需的输出。当数据集中的列不倾斜时，将用它的平均值替换空值。当数据集中的列被倾斜时，空值将被它的中值所取代。当dataset中</em

浏览 7提问于2022-07-17得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何查找和添加ID的频率列？

从数据帧中获取价值

计算Spark DataFrame中分组数据的标准差

获取大熊猫群中的所有值

如何求和并将一个DataFrame表示为创建另一个DataFrame

如何在DataFrame中创建和使用新函数？

熊猫在默认选项中的集合功能？

如何计算dataframe列的平均值并找到前10%

修改agg函数以使用降序Python* Pandas显示值？*

Pandas:合并数据框行并取第二列值的平均值

与熊猫的情节:群体与平均

如何通过创建的列来groupBy？

如何在Pandas中应用NaN时忽略groupyby值

使用np.vectorize在数据帧中创建列

以群体为手段

通过排除四列值的离群值(四列中位数的+-25%)来计算中位数。

基于字符串条件填充缺失值

熊猫群句法解释

创建一个客户用户定义的函数，用于使用平均中值模式替换丢失的行

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐