腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
不同
分类
器
的
投票组合结果
的
准确性
很差。
、
、
、
我使用了以下
分类
器
及其
准确性
:支持向量机- 78 %Logistic回归- 80% 当我使用上述
分类
器
进行最终
分类
时,我获得
的
准确性
低于仅使用
随机
森林
的
情况当单独使用时,所有的
分类
器
都提供了多少相同
的
精度,那么
随机
森林
<
浏览 0
提问于2015-10-06
得票数 6
回答已采纳
1
回答
如何
衡量
随机
森林
分类
器
的
准确性
?
、
、
因此,我使用
随机
森林
分类
器
通过以下代码进行预测: # Import Random Forestclf_two.fit(emb_train, ytrain.ravel()) y_pred_two=clf_two.predict(emb_test) 我想找出我
的
分类
器
的
准确性
,而ytrain是一个大
浏览 51
提问于2021-05-03
得票数 1
1
回答
递归特征消除结合scikit中
的
嵌套(略去一组)交叉验证
、
、
我想对30组受试者进行二进制
分类
,这些受试者有230个样本和150个特征。我发现它很难实现,特别是在进行特征选择时,通过嵌套
的
参数调整留下了一组交叉验证,并使用两个
分类
器
SVM和
随机
森林
报告
准确性
,并查看选择了哪些特征。我是新手,我确信下面的代码是不正确
的
:我不知道在上面的哪里设置“
随机
森林
分类
器
”,因为我想比较S
浏览 13
提问于2018-12-17
得票数 0
1
回答
如何
在回归树中计算特征重要性?
、
、
、
在使用决策树算法或
随机
森林
进行
分类
的
情况下,我们使用基尼杂质或信息增益作为
衡量
标准,以确定首先选择哪个特征来分割父节点/中间节点,但如果我们使用决策树或
随机
森林
进行回归,那么
如何
计算特征重要性或选择特征
浏览 62
提问于2020-10-22
得票数 1
1
回答
使我
的
逻辑回归测试精度更接近使用Python
的
训练精度
、
、
我有一个包含656个因子
的
篮球统计数据集。我正在使用逻辑回归
分类
器
通过从团队2
的
统计数据中减去团队1
的
统计数据来预测胜利者和输家(团队1
的
胜利或团队2
的
胜利)。除了标准化之外,我
如何
提高我
的
测试集
的
准确性
,使其更接近训练集
的
准确性
,或者只是提高总体
的
准确性
?我认为归一化是一种可能
的
解决方案,但由于我在做统计数据
浏览 16
提问于2019-04-03
得票数 0
回答已采纳
1
回答
类加权
分类
、
、
我正在进行我
的
多类
分类
项目,我有一个问题: 我有三个班级比例: 50%,47%和3%。我决定在
随机
森林
分类
器
中使用class_weight="balanced"参数。现在我要计算精度。我应该使用平衡
的
准确性
还是可以使用普通
的
准确性
?
浏览 0
提问于2022-05-08
得票数 2
2
回答
如何
用1000种估计量可视化集合模型(
随机
森林
)
、
、
、
、
我正在处理
分类
问题,我需要在购买/非购买类别中对用户进行
分类
。我有大约100 +特性或预测
器
来预测用户
的
行为。我还提取了重要
的
特性,负责我
的
预测,但我不能完全可视化模型。一些
随机
森林
是
如何<
浏览 0
提问于2018-10-09
得票数 1
3
回答
R
随机
森林
变量
的
重要性
、
、
、
我正在尝试使用
随机
森林
软件包进行R.所列
的
各种重要
衡量
标准如下: 我真正想知道
的
是,这些值
的
含义只有在它们有多精确,什么是好
的
价值,什么是坏
的
价值,什么是最大值和最小值
浏览 8
提问于2009-04-10
得票数 46
回答已采纳
1
回答
如何
用Python逐个计算每个预测值
的
准确性
?
、
我目前正在研究一个使用
随机
森林
分类
器
的
疾病预测机器学习模型。我输入症状,然后程序应该预测疾病。预测没有问题,但我想计算每个预测值“一个一个”
的
准确性
。例如,该项目预测“结核病”为一种疾病。然后,我要计算这个预测
的
准确率。(只有预测值结核病
的
准确性
。)
如何
逐个计算每个预测值
的
准确性
?
浏览 2
提问于2021-05-12
得票数 2
回答已采纳
1
回答
R
随机
森林
的
敏感性
、
是否有可能运行监督
分类
随机
森林
最大灵敏度(TP/(TP+FN))?据我所知,
准确性
或卡帕是
衡量
标准。下面是一个实际
的
例子,在这个例子中,Kappa和准确度都没有按照需要来评估模型。正如答案和评论(@Hanjo和@Aaron)所指出
的
那样,仅凭敏感性并不是一个好
的
衡量
标准。0.653"[1] "predicted
浏览 0
提问于2016-05-14
得票数 0
2
回答
我怎样才能做到两个估计量之间
的
相关性?
、
、
我和几个各种各样
的
估测师一起工作。然后,我想堆叠这些估计量,最好是它们之间
的
相关性很低。 我假设关联方法取决于因变量
的
类型,如果它是范畴
的
或数值
的
。在我
的
例子中,它是绝对
的
,估计
器
是
分类
器
。我怎样才能做到两个估计量之间
的
相关性?
浏览 0
提问于2019-09-18
得票数 2
1
回答
如何
根据
随机
值测试
分类
器
的
准确性
?
、
我已经建立了我
的
第一个科学工具包-学习
的
例子来玩,我正试图
衡量
我
的
预测
的
准确性
。我已经设置了很好
的
训练和测试列表,但是即使我给出了
随机
值,我也能得到0.95
的
准确性
。这看起来是因为我正在检查0/1标签,95%
的
标签是零
的
,所以它在0上猜测,得到0.95
的
准确性
(我想?)。显然这不是我想要
的
。 我
如何
决
浏览 4
提问于2017-12-19
得票数 0
回答已采纳
2
回答
合奏模型过配?
我正在尝试一个
分类
项目。我已经把我
的
20000号数据分成了训练和测试集。在训练集上,我进行了
分类
选择,包括knn、
随机
森林
和gbm。这些给我大约20%-30%
的
准确性
在最好。对于每个样本,我生成每个类
的
概率,并建立一个新
的
模型。在此基础上,我运行了一个
随机
森林
分类
浏览 0
提问于2015-08-16
得票数 1
1
回答
其他
分类
器
的
“
随机
林”变体
、
、
、
、
本文将线性核支持向量机应用于多类文本
分类
问题之一,
分类
精度为0.78。我也试过兰登
森林
,但我能得到
的
最佳精度是0.72。这让我想,如果我可以模拟
随机
森林
,但使用支持向量机
分类
器
,而不是决策树。我不知道这是否会提高
准确性
。在我实现这一点之前,我想得到一些东西
的
青睐,而快速
的
谷歌搜索也没有帮助。 对此有什么想法吗?
浏览 0
提问于2017-06-10
得票数 1
1
回答
来自Scikit Learn
的
关于RandomForestClassifier参数
的
快速问题
、
、
我正在尝试最大限度地提高使用GridSearchCV对负面和正面客户评论进行
分类
的
RandomForestClassifier
的
准确性
。但是,我不确定RandomForestClassifier中
的
大多数超参数是做什么
的
。哪些参数对模型
的
精度影响最大? 提前感谢!
浏览 13
提问于2021-05-07
得票数 0
回答已采纳
2
回答
分类
编码后处理不平衡数据
、
、
、
、
在运行logistic、knn、决策树、
随机
林等算法时,即使不进行任何特征选择,数据
的
准确率也很高,除“朴素偏倚
分类
器
”外,准确率大多在94%以上。这似乎是奇怪
的
,甚至有任意两个
随机
特性->这提供了超过94%
的
准确性
,这似乎是不现实
的
。此外,还提供了94%以上
的
精度,即使是上述任何算法
的
基线模型,如logistic,knn,决策树,
随机
森林
, 删除前20个特
浏览 1
提问于2019-08-20
得票数 1
回答已采纳
1
回答
分类
器
总是错误地预测相同
的
样本是正常
的
吗?
、
我试图提高
分类
器
的
准确性
,一个
随机
森林
分类
器
。我用相同
的
超参数和不同
的
随机
种子建立了不同
的
模型,用相同
的
训练数据训练它们,用同样
的
测试数据进行预测,并对结果进行比较。我发现50%
的
错误总是发生在相同
的
样本上。因此,这些总是被错误预测
的
样本是否值得特别关注,还是某种逻辑? 我希望问题足够清楚。
浏览 0
提问于2019-07-31
得票数 2
回答已采纳
1
回答
如何
精确计算出
的
错误,以及它
的
含义是什么?
、
、
、
我找到了几个解释,说明了什么是“泄露错误”,包括堆栈溢出
的
一个:。错误
分类
的
概率是多少?这仅仅是外泄数据
的
准确性
吗?精度= (TP + FP) / (P+N) 那么,简单地说,所有真正
分类
的
实例与集合中
的
所有实例
的
比率?如
浏览 1
提问于2015-11-17
得票数 3
回答已采纳
1
回答
如何
在gridsearchSV (多类问题)中计算AUC
、
、
、
、
我正在研究一个多类
分类
问题,比较支持向量机和
随机
森林
分类
器
的
结果。我想使用gridsearchCV进行超参数优化,并发现AUC是解决这类问题
的
最常用
的
度量标准。我知道
如何
使用其他评分标准,如
准确性
等,但默认
的
ROC_AUC只适用于二进制类。有什么方法可以在gridsearchCV中使用AUC来处理多类问题?
浏览 0
提问于2020-04-04
得票数 1
回答已采纳
2
回答
机器学习算法
的
统计比较
、
、
、
我从事机器学习
的
工作。我被困在其中一个东西里了。 我想在10个数据集中比较4种机器学习技术。经过实验,我得到了曲线下面积
的
值。现在我
的
问题是,与其他算法相比,哪个测试会得出特定算法表现良好
的
结论,并且我只想在机器学习技术中选择一个获胜者。
浏览 2
提问于2015-07-06
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于随机森林的分类与回归
数据挖掘之七——基于随机森林的分类实验
用随机森林分类算法进行Iris 数据分类训练,是怎样的体验?
Python众筹项目结果预测:优化后的随机森林分类器可视化|数据代码分享
【视频讲解】CatBoost、LightGBM和随机森林的海域气田开发分类研究|数据分享
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券