可以使用pandas
库中的Series
对象的value_counts()
方法。该方法可以统计数据框中某一列中各个值出现的频次,并返回一个新的Series
对象,其中包含了每个值及其对应的计数。
以下是创建一列计数的步骤:
pandas
库:import pandas as pd
data = {'Name': ['John', 'Mike', 'Sarah', 'John', 'Mike', 'John'],
'Age': [25, 30, 28, 25, 30, 25]}
df = pd.DataFrame(data)
value_counts()
方法统计某一列的计数,并将结果赋值给新的列:df['Count'] = df['Name'].value_counts()
完整的代码如下:
import pandas as pd
data = {'Name': ['John', 'Mike', 'Sarah', 'John', 'Mike', 'John'],
'Age': [25, 30, 28, 25, 30, 25]}
df = pd.DataFrame(data)
df['Count'] = df['Name'].value_counts()
print(df)
输出结果为:
Name Age Count
0 John 25 3
1 Mike 30 2
2 Sarah 28 1
3 John 25 3
4 Mike 30 2
5 John 25 3
在这个例子中,我们统计了Name
列中每个值的计数,并将结果存储在新的Count
列中。可以看到,John出现了3次,Mike出现了2次,Sarah出现了1次。
领取专属 10元无门槛券
手把手带您无忧上云