使用随机森林时的时间加权样本

文章/答案/技术大牛

发布

0回答

random-forest

我想知道是否有按时间对随机森林的训练样本进行指数加权的最佳实践(对较新的样本赋予更多权重)？我能想到的一种方法是根据给定时间的权重对整个数据集进行采样和替换。有没有其他我应该考虑的方法？任何帮助都是非常感谢的！

浏览 2提问于2018-07-18得票数 1

回答已采纳

1回答

sampsize和classwt随机森林之间的差异

r、random-forest

有人能在R包的随机森林部分解释一下sampsize和classwt的区别吗？这两个参数之间有什么关系(假设问题是一个分类问题) 谢谢

浏览 1提问于2015-05-14得票数 3

1回答

通过增加更多的单决策树，在线随机森林

random-forest、online-learning

随机森林(RF)是由决策树的集合(DT)产生的。通过使用套袋，每个DT被训练成一个不同的数据子集。因此，是否可以通过对新数据增加更多的决策树来实现在线随机森林？例如，我们有10K样本，训练10DT样本，然后得到1K样本，而不是重新训练完全RF，我们添加了一个新DT。现在用10+1 DT的贝叶斯平均进行预测。此外，如果我们保留所有以前的数据，新<e

浏览 0提问于2014-10-20得票数 15

2回答

如何平衡某个类的样本数量非常多的训练数据集？

machine-learning、dataset、scikit-learn、random-forest、sampling

我一直在使用烂番茄电影评论数据集进行情绪分析预测。数据集具有5个类别{0,1,2,3,4}，其中0是非常负的，而4是非常正的。数据集是高度不平衡的，'0': 7072 (4.5%), '1': 27273 (17.4%), '2': 79583 (50.9%), '3': 32927(21%), '4': 9206 (5.8%) 如你所见，2类有近50%的

浏览 5提问于2014-11-19得票数 1

2回答

随机森林技术/模型

machine-learning、data-mining、random-forest、machine-learning-model、self-study

有人能知道随机森林的不同技术/算法吗？我知道，随机森林本身就是一个算法/模型，但我正在寻找它的另一个版本，就像我们在决策树中一样。基于随机森林的算法列表？谢谢

浏览 0提问于2019-04-24得票数 1

3回答

渐进随机森林？

machine-learning、classification、random-forest

我正在考虑使用随机森林来解决分类问题。数据是按顺序来的。我计划使用前N(500)来训练分类器。然后，使用分类器对数据进行分类。它会犯错误，错误有时可以被记录下来。我的问题是:我可以使用这些错误分类的数据来重新训练原始分类器吗？如果我简单地将错误分类的样本添加到大小为N的原始训练集中，那么错误分类样本的重要性将被夸大，因为更正后的

浏览 1提问于2013-07-08得票数 1

2回答

如何在RandomForest实现中对类进行加权？

scikit-learn、random-forest

据我所知，只对某些整体样本进行加权(假设我有50个正在训练的文件，第一个样本的权重是其他所有样本的两倍)，而不是类。我找到了一些关于平衡随机森林和加权随机森林的论文。但是我还没有看到任何关于如何在scikit中

浏览 2提问于2013-07-17得票数 7

2回答

random.sample的时间复杂度

python、time-complexity

在另一个线程中，我看到二进制堆加权随机样本的时间复杂度等于O(n * log(m))，其中n是选择的数量，m是要选择的节点的数量。我想知道一个未加权的随机样本的时间复杂度，它被Python用作random.sample。时间复杂度是简单的O(n)，还是完全不同？

浏览 5提问于2012-05-07得票数 11

回答已采纳

1回答

随机森林算法中随机状态参数的重要性是什么？

python-3.x、machine-learning、random-forest

随机森林有几个参数，其中一个是随机状态。我不知道它是做什么的，以及它对RF算法有多重要。

浏览 61提问于2019-06-25得票数 1

1回答

随机森林中的out - of - bag错误是什么？

language-agnostic、machine-learning、classification、random-forest

随机森林中的out - of - bag错误是什么？它是在随机森林中找到正确数量的树的最佳参数吗？

浏览 1提问于2013-08-31得票数 71

回答已采纳

1回答

元随机森林分类器是如何确定最终分类的？

machine-learning、classification、random-forest

我正试图确切地了解元随机森林分类器是如何确定最终预测的，我知道存在一个投票系统，并且使用决策树的聚合来找到最终的预测，我从这里读到：Python中的随机森林分类：我阅读了RFC源代码：合奏/森林：输

浏览 0提问于2019-04-30得票数 5

回答已采纳

2回答

scikit学习中节点的重要性

scikit-learn、feature-importances

我正试图确切地理解feature_importances在scikit-learn的RandomForestClassifier中是如何工作的。关于ni_j的方程，我有两个问题(节点重要性方程，第一个方程在特性重要性一节中)：我们能从数学上确定ni_j >= 0吗？，然后取所有树的<

浏览 0提问于2021-05-04得票数 2

1回答

Python中rpart.plot的等价物是什么？我想要可视化我的随机森林的结果

python、scikit-learn、visualization、random-forest、decision-tree

在[R]中，你可以像这样可视化你的随机森林的结果(无耻地从互联网上窃取图像)。Python中的等价物是什么？我可以使用feature_importances_获得我的sklearn随机森林分类的结果，但我想知道他们将结果发送到哪个方向。我意识到，对于一个深森林，我不能检查每一个分支，但也许它可以加权概率？

浏览 10提问于2015-06-18得票数 4

1回答

欠采样与class_weight在ScikitLearn随机林中的应用

python、scikit-learn、random-forest

我正在一个极不平衡的数据集( 1:10 000的比例)上应用ScikitLearn的随机森林。我可以使用类_weigth=‘balanced’参数。我看过，这相当于抽样过少。然而，这种方法似乎适用于样本的权重，不改变实际的样本数。由于随机森林的每一棵树都是建立在训练集的随机抽取子样本上的，所

浏览 4提问于2017-04-14得票数 3

回答已采纳

1回答

随机森林:平衡测试集？

python、random-forest、imblearn

我试图在一个不平衡的数据集中运行一个随机森林分类器(~1:4)。我使用imblearn的方法如下：rf.fit(train_features,train_labels) 在培训和测试集中

浏览 0提问于2019-02-27得票数 0

回答已采纳

1回答

R中使用H2O的平衡随机森林

r、random-forest、h2o、multiclass-classification

由于我目前正在研究一个高度不平衡的多类分类问题，我正在考虑平衡随机森林()。您是否有使用H2O实现平衡随机森林的经验？若有，可否请你详述以下问题：是否有可能改变在H2O中创建引导样本的默认过程，以得出平衡子样本(对于随机森林中的每次迭代，从少数类中提取一个引导样本。从大多数类中随机抽取相同数量的案例(通过替换

浏览 16提问于2018-08-23得票数 0

2回答

是否有可能从类概率中学习分类器(在sklearn中)

machine-learning、scikit-learn

我有(多类)培训数据，其中的课程是通过聚合手工标记的数据来学习的，因此一些行的值将为0、0、0、0.4、0.6。是否可以直接将其用作分类器的训练数据。我知道这应该是可能的逻辑回归，但似乎没有api支持它。(此外，我更喜欢使用比这更好的分类器。)

浏览 3提问于2013-10-29得票数 0

回答已采纳

3回答

scikit中的样本权重-在交叉验证中学习失败

python、machine-learning、scikit-learn

在训练随机森林分类器时，我一直在尝试使用scikit-learn中的加权样本。当我直接将样本权重传递给分类器时，它工作得很好，例如RandomForestClassifier().fit(X,y,sample_weight=weights)，但当我尝试网格搜索为分类器找到更好的超参数时，我遇到了麻烦：grid_sear

浏览 1提问于2014-02-20得票数 16

4回答

学习随机森林分类器能按树调整样本大小，处理类不平衡吗？

python、r、scikit-learn、classification、random-forest

关于滑雪板随机森林的简单问题：在随机森林的R实现(称为randomForest )中，有一个选项sampsize()。这允许您根据结果来平衡用于训练每棵树的样本。例如，如果

浏览 2提问于2013-11-27得票数 6

回答已采纳

2回答

你能解释一个支持向量机的输出概率吗？

machine-learning

我正在尝试使用不同的分类算法，比如随机森林，支持向量机，AdaBoost来构建一个二进制分类系统。我想使用这些分类器的输出来可视化一个分数。例如，在使用随机森林时，我想使用属于A类的样本的概率来构建一个从0到100的分数。假设随机森林输出一个概率(从0到1)，使用它，因为得分

浏览 0提问于2016-12-07得票数 5

回答已采纳

点击加载更多