我的问题是:我有8列分类特征,有些列有多达40种不同类型的唯一值和20,000个实例。我应该使用什么方法来转换分类数据以用于决策树回归?有没有办法自动输入唯一的值,而不是手动输入?我尝试使用LabelEncoder来转换分类值,但由于某些原因,df.values的数组(宝马,阿库拉...)即使在我对其进行转换之后,第一列中的内容也没有改变。import numpy as np
在使用LabelEncoder之后,我尝试使用OneHotEncoder将我的数据编码到一个矩阵中,但得到了这个错误:预期是2D数组,而是1D数组。在错误消息的末尾(包括在下面),它说“重塑我的数据”,我以为我做到了,但它仍然不起作用。如果我理解重塑,那是不是就是你想要将一些数据重塑成不同的矩阵大小的时候?# Data Preprocessing
import numpy as np
import matplotlib.pyplo
我有一个混合了int、float、categorical和bool数据类型的DataFrame,我正在尝试使用LabelEncoder.fit_transform将categorical和bool数据类型转换为当在单个列上执行时,它工作得很好,但是当我尝试在DF中执行for循环时,我得到了以下错误:for i in first_buyer.columns和MultiColumnLabelEncoder类,但它们都抛出了相同<e