我有一个csv文件,它包含以下格式的数据。11.6 None BMSG 我想在这个csv文件中读取并计算每个小时的平均我的csv文件相当大,大约2000值。然而,这些值并不是平均分布在每一个小时。例如:
我有237 samples from hour 3 and only 4 samples from hour 6。正因为如此,它给出了一个扭曲的结果。对于每一个小时,我计算那个
这是一个如此简单的问题,这就是为什么我做不到它让我恼火不已的原因。我有一系列列表,我已经将它们转换为扁平化的列表: myList= [] for j in i:
frequency = pd.DataFrame(myList).reset_index().sort_values(0).groupby(0).count() 这是让我失望的
我想绘制一段时间内面板数据的汇总统计数据。X轴是时间,Y轴是感兴趣的变量,带有平均值、最小/最大值、P25、P50、P75等的线条。这基本上是循环和计算所有单个观察值的每个日期的统计数据,然后绘制它们。 我正在尝试做的类似于下面,但y轴将是日期而不是1-10。import numpy as np# Create random data
rd = p
我有一组数据,其中有几个不同的列,每天的数据可以追溯到几年前。变量对于每一列都是完全相同的。我已经计算了每一列的日、月和年统计数据,并希望这样做,但将所有列合并在一起,为每一天、每个月和每一年获得一个统计数据,而不是我之前计算的几个不同的统计数据。到目前为止,我一直在使用Pandas组,使用这样的方法:
sum_daily_files = dai