--MORE-->
背景:统计重复值
在一个Series数据中经常会出现重复值,我们需要提取这些不同的值并且分别计算它们的频数:
import numpy as np
import pandas as...category
Categories (4, object): ['地理', '数学', '英语', '语文']
cat\_data3.cat.remove\_unused\_categories() # 删除未使用的分类...中不同的类别都是它的一列,看下面的例子:
data4 = pd.Series(["col1","col2","col3","col4"] \* 2, dtype="category")
data4
0...Categories (4, object): ['col1', 'col2', 'col3', 'col4']
pd.get\_dummies(data4) # get\_dummies:将一维的分类数据转换成一个包含虚拟变量的...,不改变分类的数量
reorder_categories:类进行排序
set_categories:用指定的一组新类替换原来的类,可以添加或者删除