我对随机森林是否需要显式交叉验证感到困惑?在随机森林中,我们有现成的样本,这可以用于计算测试精度。是否需要显式交叉验证。在随机森林中显式使用CV有什么好处吗?基于下面的代码,我发现很难理解随机森林中的CV是如何工作的:
model = BaggingClassifier(base_estimator=cart, n_estimators=num_trees,
我想用一个不同的随机数替换所有nan值。我可以很容易地用np.random.randn()生成随机数。我可以用面具来找出和数出他们的名字。mx = ma.masked_array(X,mask=np.isnan(X)) //locate nans
mx.mask.sum() // count nans so I know howmany random values to generat