大家好,又见面了,我是你们的朋友全栈君。
今天在做特征工程时,考虑给某列的缺失值,填充为该列的众数。按照之前填补均值和最大最小值的方法:
import pandas as pd
df.Mer_min_discount.fillna(df.Mer_min_discount.mode(), inplace=True)
结果发现缺失值怎么都填充不上,查阅资料后,恍然大悟,原来由于众数可能存在多个,所以pandas返回的是一个Series,而不像mean()返回的是一个值:
IN: print(type(df.id.mode()))
<class 'pandas.core.series.Series'>
IN: print(type(df.id.mean()))
<class 'numpy.float64'>
解决办法:
df.Mer_min_distance.fillna(df.Mer_min_distance.mode()[0], inplace=True)
默认取第一个众数。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/170003.html原文链接:https://javaforall.cn