我想做两件事,这样我就可以取数据帧中每组144列的平均值。
我有144列用于不同的压力读数,然后还有一列用于“循环”。大约有70个周期。我想按“循环”对数据帧进行分组,然后计算每个循环中每列的平均值。
我已经使用以下命令成功地对数据进行了分组:
cycles = df.groupby('cycle')
我也遇到了将剩余列的平均值取为下面所有列的平均值的逻辑上的问题,这不是我想要的:
for cycle, group in cycles:
cycles.mean()
如果有更简单的方法做这件事,我将非常感激。
我有一个pandas数据帧,我想在数据帧的末尾添加一行以显示每列的平均值;但是,由于Col2、Col3和Col4中的平均值,NaN函数无法返回列的正确平均值。如何解决此问题? Col1 Col2 Col3 Col4
1 A 11 10 NaN
2 B 14 NaN 15
3 C 45 16 0
4 D NaN 16 NaN
5 E 12 23 5 附注:这是取平均值
我看了这个问题的变体,但没有找到worked...so在这里的答案。我有很多数据框,每个数据框代表一个心理指数(他们问几个问题,它们的平均值给你一个关于你正在测量的东西(愤怒,焦虑,等等)的分数)。在本例中,我将选择其中的三个: SA、SE、GT
我想创建一个for循环来自动计算每个数据帧中列的平均值,然后使用该平均值添加一个新列。
我可以为一个数据帧创建一个for循环来做这件事,但是我该如何循环这个循环来为我所有的数据帧(比3多得多)做这件事呢?
#This is the for loop to do it for just one data frame (SA)
avg <- c()
我希望在数据帧上执行滚动平均值,但滚动平均值必须覆盖时间戳中的列的长度。 例如,在time1中,计算所有列行(1)的滚动平均值,然后在time2上,对所有行(2)执行相同的计算,依此类推。随着时间戳的进展而对窗口进行进展。 此外,这是按组完成的。因此,如果它在组A上执行此操作,则必须进行某种重置,因为它会转到组B 它有点像这个主题:Computing rolling mean in data.table with adaptive window lengths 但是在python上,考虑到时间戳。 此外,数据集很大,因此它必须是最优的,迭代和循环将需要数年时间
我有一个大小为20x20 (类型为pandas.core.frame.DataFrame)的数据帧。数据框中的400个单元格中的每个单元格都包含一个带有值的列表。我想分别计算每个列表(单元格)的值的平均值。数据帧如下所示:
x y z ...
x [1,2,4,3] [1,2,4,3] [1,2,4,3]
y [8,2,6,4] [1,2,4,3] [1,2,4,3]
z [1,2,4,9] [1,2,4,3] [1,2,4,3]
.
.
.
我想要得到这样的结果:
x y z ...
这是我拥有的数据帧的一个片段:
Title | Age
------+--------
Mr. | 30
Mr. | NaN
Mr. | 32
Mrs. | 28
Mrs. | 16
Mr. | 34
Mrs. | NaN
编辑:我添加了最后一行,以澄清问题
我想推算NaNs (第二行和最后一行),对于第二行,它应该使用另一个“先生”的平均值。在数据帧中,因此在本例中,应该是32,在最后一行中它应该使用另一个“夫人”的平均值,所以应该是22
计算平均值和计算平均值一样简单
value = df.loc[df["Title"] == "Mr
我正在尝试从女性和男性的角度来获取一些数据,并将其放入新的数据框架中。我可以使用dplyr对两列执行此操作,但不能对整个数据帧执行此操作。我使用: df2 <- df1 %>% group_by(Genul) %>%摘要(平均值=平均值(Apreciez că în condițiile actuale de pandemie, compania (Hotelul) în cadrul căreia sunt angajat a luat măsuri eficiente și suficiente de prevenție împotriva răspândirii vir
我在计算pandas数据帧中列的一部分的平均值时遇到问题。我需要将我的数据框分成子窗口,并且我需要每个较小窗口的平均值。
目前,我的代码如下所示:
array2 = np.array([[x[:,0].mean()]
for x in np.array_split(array1, 10)])
因此,目前我将array1划分为10个子数组。现在我的问题是:出于某种原因,我将"nan“作为某些方法的解决方案。这可能是由于array1中必须有一些NaN值的原因。我怎么能只计算非nan值的平均值,而根本不从array1中删除nan呢?这个是可能的吗?非常感谢!: