我使用R中的randomForest包,它允许计算邻近矩阵(P)。在对包的描述中,它将参数描述为:“如果调用proximity=TRUE,则输入之间的邻近度量矩阵(基于数据点对位于同一终端节点上的频率)。”我得到随机森林的邻近矩阵如下:
P <- randomForest(x, y, ntree = 1000, proximity=TRUE)$proximi
我很难理解哪些数据集需要用于模型选择阶段和最终的模型测试阶段:培训、验证和测试。我试图在下面详细解释它,同时在底部张贴可重复的代码。谢谢您的建议和建议!,我们首先从原始的数据集led中划分一个训练和测试集led_train和led_test。接下来,我们用y= Life expectancy和x= GDP建立了一个具有led_train =数据的线性模型,并对随机