Pandas:显示数据为groupby的汇总统计数据

、

我正在尝试向我的数据框添加一个新列，该列显示每个用户的平均购买金额。数据框被称为trainDf，下面的代码行生成用户的平均值。我正在尝试学习如何将其添加为列，以显示与上图相似的内容。AveragePurchaseAmountUser = trainDf.groupby(by='User_ID')['Purchase_Amount'].mean() 提前谢谢你！

浏览 0提问于2017-12-05得票数 1

1回答

计算每小时csv中列的平均值

、、、、

我有一个csv文件，它包含以下格式的数据。11.6 None BMSG 我想在这个csv文件中读取并计算每个小时的平均我的csv文件相当大，大约2000值。然而，这些值并不是平均分布在每一个小时。例如：我有237 samples from hour 3 and only 4 samples from hour 6。正因为如此，它给出了一个扭曲的结果。对于每一个小时，我计算那个

浏览 5提问于2015-11-18得票数 0

1回答

如何比较来自多个csv的数据

、、、

我有25个csv文件，每个文件有4列，我必须比较所有25个csv中名为City的1列，然后在csv中写入输出，说明哪个城市存在于多少个文件中。例如：目前，我最初检查了两个csv，但这也不起作用。我的要求是25个CSV文件。import pandas as pd Data1 = pd.read_csv('C:/Users

浏览 0提问于2020-08-01得票数 2

2回答

Pandas python将列表转换为dataframe并计算出现的次数

、、、

这是一个如此简单的问题，这就是为什么我做不到它让我恼火不已的原因。我有一系列列表，我已经将它们转换为扁平化的列表： myList= [] for j in i: frequency = pd.DataFrame(myList).reset_index().sort_values(0).groupby(0).count() 这是让我失望的

浏览 13提问于2020-07-07得票数 0

2回答

熊猫显示三个变量之间的相关性

、、、、

我有一个熊猫数据框架，看起来像这样：0 Murder 90210 Mark我如何使用熊猫和海运来做到这一点？

浏览 0提问于2020-11-20得票数 0

1回答

巨蟒熊猫。Describe()按日期

、、

我想绘制一段时间内面板数据的汇总统计数据。X轴是时间，Y轴是感兴趣的变量，带有平均值、最小/最大值、P25、P50、P75等的线条。这基本上是循环和计算所有单个观察值的每个日期的统计数据，然后绘制它们。我正在尝试做的类似于下面，但y轴将是日期而不是1-10。import numpy as np# Create random data rd = p

浏览 20提问于2020-11-06得票数 2

1回答

如何计算与给定csv/psv混合文本文件的不同字段？

、、、

下面是Linux中来自文本格式数据源的示例：DIAN每一行包含三个或多个由|分隔的集合，每个集合都有由,分隔的字段。我需要弄清楚我有多少种产品在档案里。总之，在这两条线上，我们可以看到有三种独特的产品。非常感谢。任何有启发性<

浏览 3提问于2020-01-23得票数 1

2回答

仅显示定义组的Pandas组结果

、、、

我有以下基本格式的熊猫数据：tempGroup = tempDF.groupby('status')...and为“状

浏览 4提问于2015-07-09得票数 1

回答已采纳

2回答

按周数对数据进行分类

、、、、

给出了Python 2.7中的列表：一般情况下如何打印列表的平均值；然后根据一周中的每一天的平均值。例：其中： 1.5、4.5、7.5、5是自本周二出现两次以来的平均值。2.5、6.5、10.5、

浏览 2提问于2015-11-06得票数 2

回答已采纳

1回答

在不知道DF列是什么的情况下，如何在保留所有列的同时，在dataframe上执行"groupby“和"size”？

、、、

我在windows事件日志源中搜索字符串，而不知道字符串是什么(它作为用户的输入接收)，因此我无法预测Dataframe的列( windows事件日志中的每个事件都有不同的字段，除了字段event_id

浏览 5提问于2021-12-28得票数 -1

1回答

多索引数据帧，熊猫

、、、

我正在尝试操作excel文件中的数据，但是它合并了列的标题，我设法将它们转换为pandas。请参考下面的原始数据示例。所以我转换成了这种格式。 import pandas as pd df = pd.read_excel(&

浏览 4提问于2021-03-10得票数 0

1回答

为什么这个追星族不能计算出价格呢？

Pandas groupby为item_prices返回多个值，因为我正在尝试对它们求和？df.groupby(['order_id']).agg({'item_price':'sum'}) 这个聚合给了我一个所有item_prices的列表，而不是汇总它们： df output original

浏览 9提问于2019-04-12得票数 0

3回答

计算数据帧中列的汇总统计信息

、、、、

我有一个如下形式的数据帧(例如)10,FALSE,2,0,MX,12,FALSE,13,0,MX,14,FALSE,0,0,US, 如何使用Pandas计算每列的汇总统计数据(列数据类型是可

浏览 2提问于2014-03-07得票数 48

回答已采纳

2回答

如何为分组中的每一列创建多个汇总统计信息？

、、

使用groupby().agg()可以计算指定列的汇总统计信息。但是，如果我想为每组数据帧的每一列计算“min”、“max”和“mean”，该怎么办？有没有办法让pandas自动为每个列名附加一个前缀？我不想枚举agg()函数中的每个基本列名。

浏览 8提问于2021-07-20得票数 0

2回答

在熊猫中使用groupby时恢复分级列索引

、

我在熊猫中使用groupby来计算熊猫的一些汇总统计数据，在这些数据中，数据框架中的列是用分层索引组织的。对于计算出来的统计数据，最后我想回到一个表表单，其中组被重新转换为具有组值的列，例如： index = pd.MultiIndex.from_tuples([('A', 'a'), ('B', 'b')计算统

浏览 0提问于2016-05-13得票数 4

回答已采纳

1回答

如何获取一个列表中附加的多个数据帧的均值、标准差和mad？

、、、

我有几百个数据帧被附加到一个列表中。所有数据帧的列数相同，但行数不同。列名也是相同的。所以我想取每一列的列值的均值、mad、std，我这样做：lst = [] df = df.rename(columns = lambda

浏览 1提问于2018-09-25得票数 2

1回答

最后一段未在Kapacitor记录/重放数据中输出

、

我试图每小时汇总数据，并计算汇总统计数据，如中位数、平均值等。profiling_metrics"''') .every(1h) .align()record batch -task medians -past 30d最后一段时间(本例中<e

浏览 1提问于2017-10-13得票数 0

回答已采纳

1回答

将Pandas应用于多列

、、

我有一组数据，其中有几个不同的列，每天的数据可以追溯到几年前。变量对于每一列都是完全相同的。我已经计算了每一列的日、月和年统计数据，并希望这样做，但将所有列合并在一起，为每一天、每个月和每一年获得一个统计数据，而不是我之前计算的几个不同的统计数据。到目前为止，我一直在使用Pandas组，使用这样的方法： sum_daily_files = dai

浏览 3提问于2021-06-04得票数 0

1回答

pandas Groupby Aggregate添加摘要行

喜欢熊猫--尤其是groupby的功能。目前，它可以很好地对原始数据进行分组和汇总，并嵌套细分(如Cat1，猫，品牌如下)import pandas as pdsalesdata = pd.read_csv("data/junk.csv") dfa=salesdata.groupby.aggreg

浏览 1提问于2019-01-26得票数 0

2回答

让单独的UI组件进行自己的webservice调用是个好主意吗？

、、、

每个显示数据基于相同的输入。其中一个显示的是根据时间周期计算的统计数据。另一些则显示了所有这些统计数据在给定时间内的每日进度图表。有一些计算，我必须对日常数据，以获得汇总信息。这也可以在前面完

浏览 0提问于2015-08-28得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

计算每小时csv中列的平均值

如何比较来自多个csv的数据

Pandas python将列表转换为dataframe并计算出现的次数

熊猫显示三个变量之间的相关性

巨蟒熊猫。Describe()按日期

如何计算与给定csv/psv混合文本文件的不同字段？

仅显示定义组的Pandas组结果

按周数对数据进行分类

在不知道DF列是什么的情况下，如何在保留所有列的同时，在dataframe上执行"groupby“和"size”？

多索引数据帧，熊猫

为什么这个追星族不能计算出价格呢？

计算数据帧中列的汇总统计信息

如何为分组中的每一列创建多个汇总统计信息？

在熊猫中使用groupby时恢复分级列索引

如何获取一个列表中附加的多个数据帧的均值、标准差和mad？

最后一段未在Kapacitor记录/重放数据中输出

将Pandas应用于多列

pandas Groupby Aggregate添加摘要行

让单独的UI组件进行自己的webservice调用是个好主意吗？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐