到目前为止,我所理解的是transform()给出的值在质量上类似于X(您的特性),而predict()给出的值在质量上类似于y(您的标签)。但我想要澄清的是,为什么只有几个类同时拥有这些方法,例如KMeans、PLSRegression等等。
为什么要么将这两个方法放在每个类中,要么不让这两个方法发生在同一个类中?例如,如果KMeans需要一个返回欧氏点的方法,为什么不让它有一个单独的方法呢?为实现此功能而实现transform(),我认为消除了这两种方法之间的明显区别。类似地,在PLSRegression中,我无法理解这两种方法之间的区别。
发布于 2021-01-27 07:34:10
偏最小二乘回归是一种监督学习技术,它也进行维数约简。PLSRegression类需要transform
和predict
接口来正确地实现偏最小二乘回归的行为。transform
方法是降维的接口。predict
方法是从经过训练的回归模型中生成目标的接口。
在scikit中,并不是所有的估计器都同时进行特性操作和预测(通常是针对对象),因此并不是所有的类都有转换和预测接口。
https://datascience.stackexchange.com/questions/75726
复制