分类
分类的目的是提高性能和内存的使用率
用整数表示的方法称为分类或者字典编码表示法,不同值的数组称为分类、字典或者数据集。...两个属性值codes 和 categories
# 分类对象有categories和codes属性
print(c.categories) # categories是具体的分类
print(c.codes...中的Categorical类。...= pd.qcut(draws, 4, labels=['Q1', 'Q2', 'Q3', 'Q4'])
bins
[Q2, Q3, Q2, Q2, Q4, ..., Q3, Q2, Q1, Q3,...10000272
labels.memory_usage() # 非分类占用内存多
80000080
%time _ = labels.astype('category')
Wall time: