考虑到随机森林中的单个树使用cart算法(或者可以配置为),如果cart不能预测任何东西(空树),那么为什么随机森林在相同的数据集中表现得更好。编辑:我使用的是R (rpart vs randomForest),数据是股票的每日财务数据。CART给出了空树,但随机森林即使在看不见的数据上也获得了相当的准确性。
我使用randomForest包在R中拟合随机森林模型。我想要拟合两个模型,一个具有协变量a、b和许多其他协变量(x1 to xn),另一个具有协变量a、b和a * 1/b ( a和b的交互作用)加上其他协变量x1 to xn。然而,在第一次拟合中,如果我在随机森林模型中同时具有a和b,并且如果a和b最终都在同一棵树中,则该模型将本质上考虑a和b之间的交互。 有没有可能告诉随机森林模型永远不要在同一