如何衡量随机森林分类器的准确性？

、、、

我使用了以下分类器及其准确性：支持向量机- 78 %Logistic回归- 80% 当我使用上述分类器进行最终分类时，我获得的准确性低于仅使用随机森林的情况当单独使用时，所有的分类器都提供了多少相同的精度，那么随机森林<

浏览 0提问于2015-10-06得票数 6

回答已采纳

1回答

、、

因此，我使用随机森林分类器通过以下代码进行预测： # Import Random Forestclf_two.fit(emb_train, ytrain.ravel()) y_pred_two=clf_two.predict(emb_test) 我想找出我的分类器的准确性，而ytrain是一个大

浏览 51提问于2021-05-03得票数 1

1回答

递归特征消除结合scikit中的嵌套(略去一组)交叉验证

、、

我想对30组受试者进行二进制分类，这些受试者有230个样本和150个特征。我发现它很难实现，特别是在进行特征选择时，通过嵌套的参数调整留下了一组交叉验证，并使用两个分类器SVM和随机森林报告准确性，并查看选择了哪些特征。我是新手，我确信下面的代码是不正确的：我不知道在上面的哪里设置“随机森林分类器”，因为我想比较S

浏览 13提问于2018-12-17得票数 0

1回答

如何在回归树中计算特征重要性？

、、、

在使用决策树算法或随机森林进行分类的情况下，我们使用基尼杂质或信息增益作为衡量标准，以确定首先选择哪个特征来分割父节点/中间节点，但如果我们使用决策树或随机森林进行回归，那么如何计算特征重要性或选择特征

浏览 62提问于2020-10-22得票数 1

1回答

使我的逻辑回归测试精度更接近使用Python的训练精度

、、

我有一个包含656个因子的篮球统计数据集。我正在使用逻辑回归分类器通过从团队2的统计数据中减去团队1的统计数据来预测胜利者和输家(团队1的胜利或团队2的胜利)。除了标准化之外，我如何提高我的测试集的准确性，使其更接近训练集的准确性，或者只是提高总体的准确性？我认为归一化是一种可能的解决方案，但由于我在做统计数据

浏览 16提问于2019-04-03得票数 0

回答已采纳

1回答

类加权分类

、、

我正在进行我的多类分类项目，我有一个问题：我有三个班级比例: 50%，47%和3%。我决定在随机森林分类器中使用class_weight="balanced"参数。现在我要计算精度。我应该使用平衡的准确性还是可以使用普通的准确性？

浏览 0提问于2022-05-08得票数 2

2回答

如何用1000种估计量可视化集合模型(随机森林)

、、、、

我正在处理分类问题，我需要在购买/非购买类别中对用户进行分类。我有大约100 +特性或预测器来预测用户的行为。我还提取了重要的特性，负责我的预测，但我不能完全可视化模型。一些随机森林是如何<

浏览 0提问于2018-10-09得票数 1

3回答

R随机森林变量的重要性

、、、

我正在尝试使用随机森林软件包进行R.所列的各种重要衡量标准如下：我真正想知道的是，这些值的含义只有在它们有多精确，什么是好的价值，什么是坏的价值，什么是最大值和最小值

浏览 8提问于2009-04-10得票数 46

回答已采纳

1回答

如何用Python逐个计算每个预测值的准确性？

、

我目前正在研究一个使用随机森林分类器的疾病预测机器学习模型。我输入症状，然后程序应该预测疾病。预测没有问题，但我想计算每个预测值“一个一个”的准确性。例如，该项目预测“结核病”为一种疾病。然后，我要计算这个预测的准确率。(只有预测值结核病的准确性。)如何逐个计算每个预测值的准确性？

浏览 2提问于2021-05-12得票数 2

回答已采纳

1回答

R随机森林的敏感性

、

是否有可能运行监督分类随机森林最大灵敏度(TP/(TP+FN))？据我所知，准确性或卡帕是衡量标准。下面是一个实际的例子，在这个例子中，Kappa和准确度都没有按照需要来评估模型。正如答案和评论(@Hanjo和@Aaron)所指出的那样，仅凭敏感性并不是一个好的衡量标准。0.653"[1] "predicted

浏览 0提问于2016-05-14得票数 0

2回答

我怎样才能做到两个估计量之间的相关性？

、、

我和几个各种各样的估测师一起工作。然后，我想堆叠这些估计量，最好是它们之间的相关性很低。我假设关联方法取决于因变量的类型，如果它是范畴的或数值的。在我的例子中，它是绝对的，估计器是分类器。我怎样才能做到两个估计量之间的相关性？

浏览 0提问于2019-09-18得票数 2

1回答

如何根据随机值测试分类器的准确性？

、

我已经建立了我的第一个科学工具包-学习的例子来玩，我正试图衡量我的预测的准确性。我已经设置了很好的训练和测试列表，但是即使我给出了随机值，我也能得到0.95的准确性。这看起来是因为我正在检查0/1标签，95%的标签是零的，所以它在0上猜测，得到0.95的准确性(我想？)。显然这不是我想要的。我如何决

浏览 4提问于2017-12-19得票数 0

回答已采纳

2回答

合奏模型过配？

我正在尝试一个分类项目。我已经把我的20000号数据分成了训练和测试集。在训练集上，我进行了分类选择，包括knn、随机森林和gbm。这些给我大约20%-30%的准确性在最好。对于每个样本，我生成每个类的概率，并建立一个新的模型。在此基础上，我运行了一个随机森林分类

浏览 0提问于2015-08-16得票数 1

1回答

其他分类器的“随机林”变体

、、、、

本文将线性核支持向量机应用于多类文本分类问题之一，分类精度为0.78。我也试过兰登森林，但我能得到的最佳精度是0.72。这让我想，如果我可以模拟随机森林，但使用支持向量机分类器，而不是决策树。我不知道这是否会提高准确性。在我实现这一点之前，我想得到一些东西的青睐，而快速的谷歌搜索也没有帮助。对此有什么想法吗？

浏览 0提问于2017-06-10得票数 1

1回答

来自Scikit Learn的关于RandomForestClassifier参数的快速问题

、、

我正在尝试最大限度地提高使用GridSearchCV对负面和正面客户评论进行分类的RandomForestClassifier的准确性。但是，我不确定RandomForestClassifier中的大多数超参数是做什么的。哪些参数对模型的精度影响最大？提前感谢！

浏览 13提问于2021-05-07得票数 0

回答已采纳

2回答

分类编码后处理不平衡数据

、、、、

在运行logistic、knn、决策树、随机林等算法时，即使不进行任何特征选择，数据的准确率也很高，除“朴素偏倚分类器”外，准确率大多在94%以上。这似乎是奇怪的，甚至有任意两个随机特性->这提供了超过94%的准确性，这似乎是不现实的。此外，还提供了94%以上的精度，即使是上述任何算法的基线模型，如logistic，knn，决策树，随机森林，删除前20个特

浏览 1提问于2019-08-20得票数 1

回答已采纳

1回答

分类器总是错误地预测相同的样本是正常的吗？

、

我试图提高分类器的准确性，一个随机森林分类器。我用相同的超参数和不同的随机种子建立了不同的模型，用相同的训练数据训练它们，用同样的测试数据进行预测，并对结果进行比较。我发现50%的错误总是发生在相同的样本上。因此，这些总是被错误预测的样本是否值得特别关注，还是某种逻辑？我希望问题足够清楚。

浏览 0提问于2019-07-31得票数 2

回答已采纳

1回答

如何精确计算出的错误，以及它的含义是什么？

、、、

我找到了几个解释，说明了什么是“泄露错误”，包括堆栈溢出的一个：。错误分类的概率是多少？这仅仅是外泄数据的准确性吗？精度= (TP + FP) / (P+N) 那么，简单地说，所有真正分类的实例与集合中的所有实例的比率？如

浏览 1提问于2015-11-17得票数 3

回答已采纳

1回答

如何在gridsearchSV (多类问题)中计算AUC

、、、、

我正在研究一个多类分类问题，比较支持向量机和随机森林分类器的结果。我想使用gridsearchCV进行超参数优化，并发现AUC是解决这类问题的最常用的度量标准。我知道如何使用其他评分标准，如准确性等，但默认的ROC_AUC只适用于二进制类。有什么方法可以在gridsearchCV中使用AUC来处理多类问题？

浏览 0提问于2020-04-04得票数 1

回答已采纳

2回答

机器学习算法的统计比较

、、、

我从事机器学习的工作。我被困在其中一个东西里了。我想在10个数据集中比较4种机器学习技术。经过实验，我得到了曲线下面积的值。现在我的问题是，与其他算法相比，哪个测试会得出特定算法表现良好的结论，并且我只想在机器学习技术中选择一个获胜者。

浏览 2提问于2015-07-06得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

不同分类器的投票组合结果的准确性很差。