数据的许多列包含大量的空值和单一数据,当这些数据超过一定量时,对模型来说是无效的,因此先将这一部分数据进行删除。...,
'轴距(mm)', '前轮距(mm)', '后轮距(mm)', '车门数', '油箱容积(L)',
'整备质量(kg)', '最小离地间隙...", np.nan).replace("未知", np.nan)
# 空值填充
mean_fill_col = ['排量(L)', '最高车速(km/h)', '官方0-100km/h加速(s)',...】
数据中包含许多日期数据,我将它们转换成天数差,即用数据获取的时间减去对应的时间。..., 0)
data[c].fillna(0, inplace=True)
【Step 6:One-Hot型数据处理】
当一列值可以被分成多个类别时,我们可以将数据处理成独热编码(One-Hot)