首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >标准定标器、PCA和lasso管道上的GridSearchCV

标准定标器、PCA和lasso管道上的GridSearchCV
EN

Stack Overflow用户
提问于 2014-06-03 16:18:09
回答 1查看 2.2K关注 0票数 1

假设我正在使用GridSearchCV、PCA和Lasso在管道上执行StandardScaler,其中网格搜索的PCA参数超过2个值,Lasso参数超过3个值(因此,有6个可能的参数组合)。在进行CV时,对于给定的折叠,该算法是否只标准化该折叠中的训练集(即不包括该折叠的用于确定标准化器均值/方差的测试集),还是对折叠外的整个数据集进行标准化(在这种情况下,对整个网格搜索过程只进行一次标准化)?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-06-03 18:22:40

如果您使用的是包含sklearn.pipeline.Pipeline对象的sklearn.preprocessing.StandardScalersklearn.decomposition.PCAsklearn.linear_model.Lasso,并使用这个管道使用GridSearchCV进行交叉验证的估计,那么StandardScaler将估计仅在内部火车折叠上对单元方差进行对中和重标度的参数。

在测试折皱上对管道进行评价时,StandardScaler将使用存储的方法和标准偏差,从测试集中减去列车均值,并将结果除以列车标准差。

所以答案是:NoStandardScaler不会以任何方式使用测试集来确定数据的均值和方差。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24020095

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档