在特定情况下,当训练集小于测试集时会发生什么情况。在使用这些类型的数据集进行预测时,什么是合适的方法。谁能给我一些关于管理这些情况的介绍,以及每种学习算法将如何执行。
发布于 2013-06-21 17:15:27
你担心的是什么?你认为这会带来什么不好的结果?验证太多了吗?过度验证?
测试集不涉及训练分类器。
它只用于允许您为将来的数据预测分类器的质量。
因此,如果你有一个大的测试集,你可能会对分类器的质量有一个更好的预测,仅此而已。
发布于 2013-06-24 16:44:55
当你有一个小的训练集和大的测试集时,一种解决方案是将这些集组合起来,并使用k折交叉验证。但是,理想情况下,您应该积累更大的训练集。注意不要在不合适的问题上使用开箱即用的机器学习。
https://stackoverflow.com/questions/17236900
复制相似问题