我遇到了一种情况,我需要在管道中做一些列特定的处理,但是由于变压器返回的是numpy数组,而不是熊猫数据格式,所以我没有列名来做我的特性工程。import numpy as npfrom sklearn.imputeimport SimpleImputer
from sklearn.pipeline import Pi
我一直用熊猫做一些有趣的过滤CSV文件,但遇到了一个障碍。我正在尝试检查我的索引列中的乱码文本(非整数)数据,并删除这些行。在导入时,我尝试使用条件将它们从dataframe中删除,然后尝试迭代它们,但没有成功。text in "numbers" column that I am 另外,我必须更改pd函数的编码,