改变randomForest R代码中节点特征子集选择的采样方法

文章/答案/技术大牛

发布

1回答

、、、

我正在开发"randomForest“R包，以更改森林中树节点上特征子集选择的采样方法。目前，随机森林使用简单的随机采样来实现这一点。我尝试使用以下命令查看R代码getAnywhere(randomForest.default) 但是找不到选择了"mtry“

浏览 12提问于2017-07-26得票数 1

回答已采纳

3回答

如何在R中使用包装器特征选择算法？

、、

我有几种算法: rpart，kNN，logistic回归，randomForest，朴素贝叶斯和支持向量机。我想使用前向/后向和遗传算法选择来找到用于特定算法的最佳特征子集。我如何在R中实现包装器类型的向前/向后和特征的遗传选择？

浏览 2提问于2016-04-20得票数 1

1回答

在scikit-learn中如何控制随机森林中的特征子集？

、、

我正在尝试改变随机森林算法在为每个节点设置特征时所使用的方式。在Scikit-learn方式中实现的原始算法是随机子集。我想从几个子集的几个选项中为每个新节点定义哪个子集。有没有直接的方法来控制这样的方法呢？如果没有，有没有办法更新Scikit-learn的相同代码？如果是，

浏览 0提问于2015-07-02得票数 2

1回答

从R中的ggplot中过滤geom_lines？

、

我有一个绘图，显示了多次绘制的geom_line。下面显示了一个玩具示例。我想知道是否有可能从ggplot中过滤掉其中的一些行。我已经尝试在绘制之前对数据进行子集设置，但因为我试图绘制的(即下面代码中的ice1 )是一个奇怪的R6对象，所以我不确定如何对其进行子集或采样。并且我不能从主数据集(在本例中是波士顿数据)中提取子集。基本上，我试图找出

浏览 32提问于2020-11-11得票数 0

1回答

R随机森林:当要素表中的列顺序发生变化时，OOB错误率会发生变化

、

我对RandomForest的以下“行为”感到困惑，并想知道其他用户是否也经历过这种情况--以及我可以做些什么来避免这种情况:在其他条件相同的情况下(并且使用相同的OOB值)，randomForest模型的结果(例如，它对错误率的OOB值估计)只能通过改变数据表的特征(=列)的顺序来改变。在以下代码中，i 1)运行randomForest

浏览 48提问于2020-04-27得票数 1

1回答

随机森林分类weka

、、

属性已保存在csv文件中的11列中。如果列的顺序改变，Randomforest & RandomTree是否可以在每个时间给出不同的精度？

浏览 1提问于2013-09-18得票数 0

1回答

学习随机森林以查找所选要素的分数

、、、

我正在尝试理解每个选择的特征所获得的相关分数。

浏览 17提问于2020-05-05得票数 1

3回答

特征选择是否可能保留相关特征？

、、、、

我的目标是找到区分两个类的最重要的特性。使用多种特性选择方法中的一种来实现这一点是有意义的。通常，特征选择的目标是消除这些冗余的特征。因此，如果一组相关特性对类变量具有很强的预测能力，我希望它们都被确认为重要。(额外的问题是:如果我在我的

浏览 3提问于2017-03-22得票数 1

8回答

R中的随机森林(y中的空类和参数legth 0)

、

我第一次与随机森林打交道，我遇到了一些我无法解决的问题..当我对我的所有数据集(大约3000行)运行分析时，我没有得到任何错误消息。但是当我在我的数据集的一个子集(大约300行)上执行相同的分析时，我得到一个错误：names(dataset2) data.rforest <- randomForest(da

浏览 0提问于2012-11-21得票数 14

1回答

使用R语言进行机器学习特征选择①？

、、、、

“自动特征选择用于构建不同子集的许多模型，识别哪些特征有助于构建准确模型，哪些特征没什么帮助。特征选择的一个流行的自动方法称为递归特征消除（Recursive Feature Elimination）或RFE。下例在Pima Indians Diabetes数据集上提供RFE方法例子。随机森林算法用于每一轮迭代中评估模型的

浏览 709提问于2020-09-03

1回答

对一组特征向量进行采样，以获得每个特征的“统一”直方图。

、、、

我有一个m向量(样本)的n个值(特征)的矩阵，其中m~ 10^6，n= 20，所有特征的值都在0,1。如果我计算每个特征的直方图，它们是完全不同的。我计算了一个简单的10桶直方图，我可以看到，对于一些直方图，只有几个桶(甚至两个)包含所有样本，一些是倾斜高斯的，另一些是近似均匀的。我想对这些向量中的一个子集进行采样，以便对所有

浏览 1提问于2016-11-02得票数 1

回答已采纳

1回答

Spark MLLib如何在训练分类器时忽略特征

、、

我想仅使用每个LabeledPoint中的特征子集在RDDLabeledPoint上训练分类器(这两个都是为了快速调整模型，并在每个LabeledPoint中包括不属于特征的项，如I或评估指标)。我已经搜索了文档，但找不到一种方法来指定应该包括或忽略哪些列。代码如下，我使用的是Spark和MLLib 1.3.1，Scala2.10.4。如果不可能排除特定的特征，那么在训练过程<em

浏览 1提问于2015-06-10得票数 3

1回答

R:在randomForest()调用中将foreach()与sample()过程一起使用

、、、

我有一个大的数据帧(~700n x 36000 p)，并计划在R中进行randomForest分析。(子采样包括两个步骤:通过首先对行进行采样来创建平衡的数据集(在结果类上)(此部分有效)，然后选择列的子集。)期望的结果仍然是dim(p+3，Nrun)的数据帧，但每列将仅包含在该列表示的运行中随机选择的变量的结

浏览 2提问于2015-01-01得票数 0

1回答

randomForestSRC抽样方案

、

我正在使用R中的randomForest包对不平衡数据进行建模。结果是一个二元变量，结果(no，yes)的相对频率为(2249(88% )，318 (12%) )。我改变了RF中的采样设计，强制使用所有318个yes结果和318个no结果，使用以下代码从可能的2249中随机采样。OOB错误率变为合理的44%为否，12%为是。rf1 <- <

浏览 0提问于2017-11-06得票数 2

1回答

如何理解RandomForestExplainer输出(R包)

、、

我有下面的代码，它基本上尝试使用Species从iris数据中预测。我真正介入的是找出解释物种分类的最佳特征(变量)。我发现包装是最好的服务目的。library(randomForest)forest <- randomForest::randomForest(Species ~ .forest) randomForestExplainer::plot_multi_

浏览 0提问于2018-04-19得票数 12

回答已采纳

2回答

R中的随机子空间法

、、

对于如何实现(Ho,1998)在R中描述的“随机子空间法”(一种集成方法)，有什么想法吗？找不到包裹何天锦(1998年)。"“。模式分析和机器智能的IEEE事务。

浏览 1提问于2019-09-25得票数 0

4回答

如何提高randomForest性能？

、、

我有一个38 MB大小的训练集(包含420000行的12个属性)。我正在运行下面的R片段，使用randomForest来训练模型。这对我来说需要几个小时。rf.model <- randomForest( data=newdata,有人能告诉我怎样才能提高我的表现吗？我的</em

浏览 2提问于2014-04-15得票数 19

回答已采纳

1回答

随机森林中树中每个结点变量的随机选取

、、

在随机森林方法中，对于每棵树，我们随机选择一组固定大小的变量(特征)。但是，一旦为该特定树冻结了该集合，该树的行为是否与常规决策树算法类似？我假设随机森林只是生成一堆经典的“决策树”，并将它们的投票推向最终的分类。真的是这样吗？这是否意味着在树中的每个节点，我们从为该树固定的变量集中随机选择m个变量？还是来自训练数据集的全局变

浏览 1提问于2017-04-08得票数 1

3回答

去除噪声和冗余特征

、、、、

我已经从视频序列中提取了基于面部标记的特征，作为这些标记在视频序列上的均值和标准差。需要根据这些标记将它们分为四个不同的类别。总而言之，我有一个大约260个特征的特征集。我应该如何确定我的集合中哪些特征是嘈杂和冗余的。我在一些研究论文中读到了这一点，其中一些使用了我发现非常合适的加l取走r算法，但在这样的算法中，他们总是将一个

浏览 6提问于2013-10-24得票数 1

3回答

weka对轮换森林方法中的分类属性做了什么？

、

我的期望是忽略分类属性，但是当我使用整个数据集进行分类时和从数据集中删除分类属性时，性能结果是不同的。 weka对轮换森林方法中的分类属性做了什么？

浏览 4提问于2015-04-24得票数 0

点击加载更多