我使用随机森林来预测数据集中的标签。我的问题是:使用随机森林进行10倍交叉验证是否有意义?从直觉上讲,我可以说,随机森林可以单独进行交叉验证--那么在每次分割中进行交叉验证和构建随机森林分类器会有什么好处吗?
发布于 2014-03-12 10:22:15
事实上,您需要进行交叉验证来断言您的模型的选择(例如,比较两个不同k的RF )。这与RF在学习集合上学习不同的树方面所做的并不是一回事。
在实践中,你只会做k折叠简历,当你的培训集是小的,你负担不起把它分成培训/验证。
如果您的数据集很小,那么使用kf断言它是一件好事,但否则我只会调整参数(为了避免过度拟合,获得更好的准确性),使用单独的验证集(大约相当于您LS的20% )。
https://stackoverflow.com/questions/22346203
复制相似问题