腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4294)
视频
沙龙
1
回答
为什么
随机
森林
或
决策树
不能
提供
100
%
的
精度
?
以及
如何
处理
中间
的
巨大
噪音
?
如果
决策树
试图根据属于相似类
的
最大数量
的
数据来确定拆分,
为什么
它
不能
拆分这些特定
的
数据,直到每个拆分中只有1个元素,这将导致
100
%
的
精度
? ?
浏览 44
提问于2019-12-30
得票数 0
回答已采纳
1
回答
利用可视化垂直线对数据点进行分类
、
、
、
我目前正在做硕士论文,在毕业后,我
的
导师提出了一些问题。我已经回答了大部分
的
问题,但只剩下一个问题,我不知道
如何
回答。我
的
硕士论文是将给定
的
医学数据分类为癌症
或
免疫,预
处理
后
的
数据点
的
可视化看起来如下所示,现在,我已经使用支持向量机与核、
决策树
和
随机
森林
算法对数据点进行分类,它们获得了很好
的
精度
和F1评分,但我
的
主管提出了
浏览 0
提问于2022-10-30
得票数 1
2
回答
利用
决策树
对图像进行分类
、
我是机器学习和阅读
的
新手,我想知道是否可以(也方便)使用
决策树
对图像进行分类。 例如,对人脸进行分类
浏览 0
提问于2019-12-05
得票数 1
回答已采纳
2
回答
如何
用1000种估计量可视化集合模型(
随机
森林
)
、
、
、
、
我正在
处理
分类问题,我需要在购买/非购买类别中对用户进行分类。我有大约
100
+特性
或
预测器来预测用户
的
行为。我还提取了重要
的
特性,负责我
的
预测,但我
不能
完全可视化模型。一些
随机
森林</em
浏览 0
提问于2018-10-09
得票数 1
2
回答
我们
如何
在XGBoost、RandomForest和
决策树
之间做出决定?
、
、
、
在决定在
处理
特定数据集时应该使用哪种技术时,我们应该考虑什么?我知道这没有任何硬性规定。在其他情况下,我们是否只在数据集和RandomForest中有很多特性时才使用RandomForest?还是我们应该打和试验,并找到谁给我们带来更好
的
结果,每次?
浏览 0
提问于2020-07-30
得票数 5
回答已采纳
1
回答
决策-tree回归以避免回归模型
的
多重共线性?
、
、
、
当数据集具有许多相关特征时,我在评论中看到了一条关于
决策树
S
的
建议,而不是像神经网络这样
的
线性模型。因为为了避免多重共线性。一个类似的问题已经提出,但没有得到真正
的
回答。questions/137573/do-classification-trees-need-to-consider-the-correlation-between-attributes 或者在这里在监督学习中,
为什么
有相关
的
特征是不好
的
我
的
问题是:我有一个大约30列
浏览 0
提问于2020-07-13
得票数 1
回答已采纳
2
回答
分类编码后
处理
不平衡数据
、
、
、
、
在运行logistic、knn、
决策树
、
随机
林等算法时,即使不进行任何特征选择,数据
的
准确率也很高,除“朴素偏倚分类器”外,准确率大多在94%以上。这似乎是奇怪
的
,甚至有任意两个
随机
特性->这
提供
了超过94%
的
准确性,这似乎是不现实
的
。此外,还
提供
了94%以上
的
精度
,即使是上述任何算法
的
基线模型,如logistic,knn,
决策树
,
随机
<e
浏览 1
提问于2019-08-20
得票数 1
回答已采纳
4
回答
为什么
我们需要XGBoost和
随机
森林
?
、
、
、
、
随机
森林
使用来自树
的
各种样本来创建树。这种方法
的
优点是什么而不是仅仅使用一棵单数树?
浏览 0
提问于2017-10-14
得票数 40
回答已采纳
2
回答
我需要强制我
的
随机
森林
模型来学习一个关键
的
特征之间
的
关系。我怎样才能做到这一点?
、
假设给我
的
RF模型输入10个独立
的
特征,当特征1和特征3是
100
(
或
更少)时,我
的
模型输出必须是5,尽管有其他特性
的
值。我怎样才能教我
的
射频模型
的
关系-所以它将永远服从这一点?我尝试在训练集中添加重复的人工数据点,其中特征1和3小于
或
等于
100
,并且输出总是为零,但是RF模型似乎只是基于这一点来理解/学习这种关系。我正在使用R中
的
mlr库来创建我
的
RF模型。谢谢。
浏览 0
提问于2018-10-24
得票数 3
2
回答
当信息在点与点之间而不是点本身之间
的
关系中时,
如何
处理
问题?
、
、
、
我试图分析车辆
的
移动模型,在那里我试图了解一个特定
的
车辆是
如何
移动
的
,然后从测试数据中检测出类似的模式。下面是我现在所做
的
工作:我为9个用户
提供
了移动数据,每个用户在2秒
的
频率下收集了超过5分钟
的
移动数据。对于每一点,我都有一个userID值,我使用
的
特征是速度和距离,2点作为特征。当我使用类似的结构来测试数据(没有每个用户
的
用户I
的
5分钟数据组合成一个数据)时,我得到了非常奇怪
的
浏览 0
提问于2019-07-30
得票数 -1
2
回答
随机
森林
分类器中
的
单热编码
、
、
是否需要对python中
的
随机
森林
分类器进行一次热编码?我想从逻辑上理解,
随机
林中是否可以用标签编码来
处理
分类特性,而不是单热编码。
浏览 4
提问于2021-01-14
得票数 0
1
回答
为什么
不能
在
决策树
中
随机
启动根节点?
、
、
、
我刚开始学习
决策树
。所以这些问题可能有点傻。 选择根节点
的
想法有点混乱。
为什么
我们
不能
随机
选择根节点?唯一
的
不同似乎是,它将使
决策树
更长和更复杂,但最终会得到同样
的
结果。同样,作为
决策树
中特征选择过程
的
扩展,
为什么
不能
使用像特征和目标之间
的
相关性这样简单
的
东西,或者用卡方检验来确定应该从哪一个特征开始呢?
浏览 11
提问于2020-07-05
得票数 1
回答已采纳
1
回答
随机
林在期望下
的
表现
、
、
、
、
我正在学习
决策树
算法,并在Weka中实现了一个参考RF
的
随机
森林
。我用相同
的
数据集测试了我
的
实现和weka实现(在默认设置下)。而矿井
的
精度
比Weka版本3.8 (由“训练-首
100
. and”训练集和“dev- about
100
.and”测试集获得)
的
精度
低5%左右。 我使用
的
arff格式数据集是来自IMDb
的
电影评论。对于每一个例子,它包含
浏览 5
提问于2016-12-18
得票数 1
2
回答
Swift中金融变量
的
正确数字类型是什么?
、
、
、
我习惯于用Java编程,因为在计算中指定舍入规则是最适合存储金融值
的
类型。 在最新
的
快速版本(2.1在撰写这篇文章时),哪一种本机类型更支持正确
的
计算和财务值
的
四舍五入?有任何与java
的
BigDecimal等价
的
东西吗?或者其他类似的东西?
浏览 0
提问于2016-03-17
得票数 2
回答已采纳
7
回答
我
的
测试集
的
准确率是
100
%,有什么问题吗?
、
、
、
、
当使用
决策树
algorithm.but训练时,我在测试集上
的
准确率为
100
%,在
随机
森林
中只有85%
的
准确率。predictions = clf.predict(x_test)混淆矩阵:
随机
森林
浏览 0
提问于2018-07-19
得票数 11
回答已采纳
1
回答
生产环境中
的
时间序列分类.疑问
、
、
、
我
的
问题(怀疑)是:由于我
的
数据是标准化和标准化
的
,关于时间序列长度
的
建议是什么,因为这对于生产环境中模型中输入数据
的
标准化很重要。在培训期间,我将每日时间戳上
的
值除以(例
浏览 0
提问于2022-11-11
得票数 0
回答已采纳
2
回答
随机
森林
特征与数据
的
选择
、
、
首先,我感到困惑
的
是,在所有树
的
每个节点上,我们是
随机
地从所有的树中挑选出要进行最佳分割
的
特征,还是每棵树都有一个
随机
的
特征子集,然后该树中
的
所有节点都必须与这些特征一起工作?现在,不管我们是在树还是节点级选择
随机
特征,
为什么
要为每棵树选择
随机
子集
的
数据呢?因为如果在树/节点级别的特征是不同
的
,树将是不同
的
。
为什么
我们需要添加另一个层次
浏览 0
提问于2019-04-25
得票数 1
7
回答
RandomForestClassifier中
的
feature_importances是
如何
确定
的
?
、
、
我有一个以时间序列作为数据输入
的
分类任务,其中每个属性(n=23)表示一个特定
的
时间点。除了绝对分类结果之外,我还想找出哪些属性/日期对结果有多大
的
影响。但是,我想知道它们是
如何
计算出来
的
,
以及
使用了哪种度量/算法。不幸
的
是,我找不到任何关于这个主题
的
文档。
浏览 1
提问于2013-04-04
得票数 134
2
回答
除了
随机
森林
和
决策树
外,哪个预测航班延误
的
模型是合适
的
?(蒙特卡罗?)
、
、
、
、
目标和交付成果,在项目结束时,我们希望开发一个模型,根据航班、机场、飞行时间等变量,准确地(基于大于
随机
机会
的
AUC )确定一次航班是否会延误,
以及
所
提供
的
变量(航空、机场、飞行时间等)。它不依赖于天气预报
的
知识,也不依赖先前航班
的
状况。本项目的范围将是利用蒙特卡洛
或
随机
森林
建立一个模型,以便根据周数、航空公司、机场、飞行时间等自变量预测一次航班是否会延误。其次,导入和删除/预
处理
数据,以
浏览 0
提问于2022-06-13
得票数 2
2
回答
Tensorflow决策
森林
自定义指标与树
的
数量
、
、
、
、
我已经使用tensorflow决策
森林
创建了一个分类模型。我正在努力评估非默认指标(在本例中为PR-AUC)
的
性能与树
的
数量之间
的
变化。 下面是我尝试
的
一些代码。train = load_diabetes()X['target'] = (pd.Series(train['target']) >
100
0.9005518555641174, loss=0.56
浏览 46
提问于2021-10-22
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
泰坦尼克号海滩幸存者状况分析
选择最佳机器学习模型的10步指南
使用随机森林进行因果推断
达观数据:5分钟带你理解机器学习及分类算法
应用于地物识别的改进轮转森林算法-莱森光学
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券