使用group by值创建新的pandas DataFrame可以通过以下步骤实现:
import pandas as pd
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'John'],
'Subject': ['Math', 'Science', 'Math', 'Science', 'Math'],
'Score': [90, 85, 92, 88, 95]}
df = pd.DataFrame(data)
grouped_df = df.groupby('Name').mean().reset_index()
上述代码中,我们使用groupby('Name')
将DataFrame按照Name
列进行分组,然后使用mean()
计算每个分组的平均值,最后使用reset_index()
重置索引,得到新的DataFrame grouped_df
。
print(grouped_df)
输出结果如下:
Name Score
0 John 93.5
1 Nick 85.0
2 Tom 89.0
新的DataFrame grouped_df
包含了每个姓名(Name)的平均分数(Score)。
在这个例子中,我们使用了groupby
函数将DataFrame按照Name
列进行分组,还使用了mean
函数计算每个分组的平均值。你可以根据实际需求使用其他的聚合函数,如sum
、count
等。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云