腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用R语言进行机器学习
特征
选择
①?
、
、
、
、
“自动
特征
选择
用于构建不同子集
的
许多
模型
,识别哪些
特征
有助于构建准确
模型
,哪些
特征
没什么帮助。
特征
选择
的
一个流行
的
自动方法称为
递归
特征
消除
(Recursive Feature Elimination)或RFE。 下例在Pima Indians Diabetes数据集上提供RFE方法例子。
随机
森林
算法用于每一
浏览 681
提问于2020-09-03
1
回答
如何从科学学习
中
的
拟合
模型
中
获取属性列表?
、
、
、
是否有任何方法从Scikit中使用
的
模型
中
获取特性(属性)列表--学习(或整个使用过
的
培训数据表)?我正在使用一些预处理,如
特征
选择
,我想知道
的
特征
,
选择
和删除
的
特征
。例如,我使用
随机
森林
分类器和
递归
功能
消除
。
浏览 6
提问于2015-08-27
得票数 6
回答已采纳
1
回答
随机
森林
模型
中
递归
特征
消除
的
特征
选择
错误
、
、
、
、
我有上百个样本,我已经把它们分成四个不同
的
类(簇)。现在,我感兴趣
的
是找出将样本划分为不同类别的最佳基因集。 我想应用具有
递归
特征
消除
的
随机
森林
,并检测基因(
特征
)。我
的
数据如下所示。上面的数据只是一个例子:我
的
原始数据在dataframe df
中
,第一列有100个样本,第二列有4个类,第3列到第1002列总共有1000个基因有表达值。我正在使用下面的代码,但是我发现有一个
浏览 65
提问于2020-02-21
得票数 1
回答已采纳
2
回答
如何表示最终
模型
(例如
随机
森林
)?
、
、
、
、
我在dataset上运行了
随机
森林
(不平衡
的
二进制目标类),并使用交叉验证来调优参数,并使用
递归
特征
消除
和交叉验证来获得
特征
子集。但是概率阈值呢?作为最终
模型
的
重要部分,我如何得出阈值?如果这个阈值在CV
的
倍数
中
不稳定,下一步怎么办?
浏览 0
提问于2017-01-18
得票数 1
1
回答
滑雪板中使用
递归
特征
消去法
选择
特征
时出现
的
错误
我试图在sklearn中使用
递归
特征
消除
对该特性进行排序。但是,在使用RFE时,我得到了这个
错误
。以下是
错误
和代码信息。mean accuracy on the given test data and labels %10.9f'% clf.score(DEAP_x_test, DEAP_y_test)) 有人知道这个
错误
的
原因吗有人认为,只有当内核被
选择
为线性时,
递归
特征
消除
(RFE)
浏览 0
提问于2018-08-01
得票数 0
回答已采纳
1
回答
增加TF IDF矩阵项
的
权重
、
、
我有文件
的
tf idf矩阵。在TFIDF矩阵
中
,我有一些项
的
权重要加倍。
浏览 4
提问于2017-03-02
得票数 0
1
回答
使用两个
特征
选择
步骤是否合理?
、
、
、
我正在构建一个
模型
来识别
特征
的
子集,以对对象属于哪个组进行分类。具体来说,我有一个包含11个对象
的
数据集,其中5个属于A组,6个属于B组,每个对象都被表征为19,000个基因
的
突变状态,值是二进制、突变或无突变。我
的
目标是在这19,000个基因
中
识别一组基因,这样我就可以预测对象属于A组还是B组。例如,如果对象有基因A,B,C突变,D,E基因没有突变,那么它属于A组,如果不是,它属于B组。由于我有大量
的
特征
(19,000个),我将需要
浏览 4
提问于2021-11-15
得票数 0
3
回答
Scikit学习
模型
对
随机
变量赋予权重?我应该删除不太重要
的
功能吗?
、
、
、
、
我通过删除相关变量和反向
消除
来进行一些
特征
选择
。然而,在所有这些都作为测试完成之后,我抛出了一个
随机
变量,然后训练了逻辑回归、
随机
森林
和XGBoost。所有3个
模型
的
随机
特征
的
特征
重要性都大于0。其次,所有型号都将其排在底部,但它不是最低
的
功能。这是另一轮
特征
选择
-i.e
的
有效步骤吗?删除所有得分低于
随
浏览 0
提问于2020-06-25
得票数 0
1
回答
如何使用varImp函数为
随机
森林
选择
特征
?
、
、
我已经应用
随机
森林
的
训练数据,其中有大约100个
特征
。现在,我想应用
特征
选择
技术,以便在对数据应用
随机
森林
模型
之前减少
特征
的
数量。如何使用varImp函数(从插入符号包)来
选择
重要
的
特性?我读到varImp本身使用一些分类方法来
选择
特性(我发现这非常违背直觉)。如何应用varImp来获取重要
的
特征
子集,然后在应
浏览 0
提问于2015-05-04
得票数 0
回答已采纳
1
回答
具有调整和交叉验证
的
随机
森林
优化
、
、
、
我正在处理一个大型数据集,所以希望删除无关
的
变量,并调整为每个分支
的
最佳m个变量。在R
中
,有两个方法可以帮助完成这两个任务: rfcv和tuneRF。我正在尝试将它们结合起来以优化参数。rfcv
的
工作原理大致如下:while (nvar > 1) { remove我
的
问题是,这有多大
的
必要性(使用玩具数据集很难得到一个想法),以及是否有其他方
浏览 2
提问于2012-08-14
得票数 3
2
回答
为什么我们在
随机
森林
中
选择
随机
特征
?
、
据我所知,
随机
森林
是树木套袋
的
程式化版本。我们
选择
随机
数据点和
随机
特征
来构造
随机
森林
。但是,如果我们只使用普通版本
的
套袋,只
随机
选择
数据点,那么我们就有了树,它们已经训练了更多
的
特征
,不像样式化版本
中
的
随机
森林
。由于学习具有更多
的
特征
,每个
浏览 0
提问于2017-07-10
得票数 4
回答已采纳
2
回答
用于查找训练
模型
所需
的
最小
特征
的
问题
、
、
、
我有一个问题,要求我找到可能
的
特征
的
最小子集(最小数量
的
特征
列),使得
模型
的
得分超过0.4 现在,我
的
想法是逐个删除
特征
列,看看
模型
的
得分何时最接近0.4。是那么回事吗?如何在dataframe
中
逐个删除列?
浏览 12
提问于2019-05-02
得票数 1
回答已采纳
2
回答
决策树与
特征
选择
、
在应用
特征
选择
之前和之后,我尝试对不同机器学习算法
的
性能进行实验。利用sklearn提供
的
函数(SelectFromModel),对SVM、
随机
森林
、KNN、线性回归以及决策树作为
特征
选择
方法进行了测试。 除决策树算法外,所有算法在应用
特征
选择
后都有了明显
的
改进。这是否意味着决策树需要大量
的
特性才能生成一个好
的
模型
?
浏览 0
提问于2020-04-19
得票数 3
1
回答
来自sklearn
的
SelectFromModel在
随机
森林
和梯度提升分类器上提供了显着不同
的
特征
、
、
、
、
正如标题中所提到
的
,我正在使用sklearn
中
的
SelectFromModel为我
的
随机
森林
和梯度提升分类
模型
选择
特征
。names of the selected featuresselected_feat
随机
森林
和梯度提升
模型
返回
的
布尔数组完全不同
浏览 33
提问于2021-05-10
得票数 0
1
回答
哪些
模型
隐含地考虑了特性之间
的
交互?
、
我想更多地了解不同
的
模型
(特别是NN和RF,但还有其他
模型
)如何考虑表格数据
中
的
特性之间
的
交互?例如,在训练时,
模型
是否能得出这样
的
结论:“虽然特性1可能与响应不直接相关,但当
特征
1较低时,功能2在预测响应方面非常有效”。因此,经过训练
的
模型
将利用这两个
特征
之间
的
相互作用,并对它们进行相应
的
加权。在本例
中
,当
特征</em
浏览 0
提问于2020-05-30
得票数 2
1
回答
机器学习中统计分析(统计重要
特征
)与
特征
消除
的
目的是什么?
、
、
我正在为covid19症状(生病后)开发一个分类
模型
,我不理解统计分析
的
重要性(其中一些部分)。https://www.sciencedirect.com/science/article/pii/S0010482522000762#bib27 它会给我什么样
的
洞察力此外,他们还进行了统计检验,如X-平方,以寻找有统计学意义
的
特征
。假设
浏览 0
提问于2022-05-01
得票数 1
回答已采纳
1
回答
随机
森林
分类
、
我是克尼姆
的
初学者,我需要预测属性,我有一些问题:2-我可以
随机
选择
属性,然后比较准确性吗? 3-我可以使用名义属性还是只使用数字属性?
浏览 0
提问于2019-06-01
得票数 0
1
回答
如何预测以列表为输入
的
总时数?
、
、
我正在努力解决我面临
的
问题:我有一个不同产品(汽车)
的
数据集,这些产品(汽车)在给定
的
时间内有特定
的
工作订单。我从历史数据中知道,这项工作总共造成了多少时间。现在我想预测另一辆车(例如第3辆)。📷我
的
想法是将基于行
的
数据集转换为基于二进制值
的
列,例如Brake: 0/1,屏幕0/1。但是我会有很多输入,因为可能
的
输入数是100-200..
浏览 0
提问于2023-01-27
得票数 -1
1
回答
选择
最佳
的
特征
子集
、
、
我想
选择
最好
的
特征
子集,它区分了两个类,这些类被输入到我构建
的
统计框架
中
,在这个框架
中
,特性是不独立
的
。通过对机器学习
中
的
特征
选择
方法
的
研究,发现机器学习
的
特征
选择
方法可分为三大类:过滤器、包装器和嵌入式方法。滤波方法可以是单变量
的
,也可以是多元
的
。使用过滤器(多元)或包装方法确实有意义,因为
浏览 2
提问于2016-11-04
得票数 0
回答已采纳
1
回答
随机
森林
“
特征
重要性”
、
我目前正在研究
随机
森林
分类器。
随机
森林
分类器
的
参数之一是“准则”,它有两个选项:基尼系数或熵。基尼系数越低越好,熵值越高越好。默认情况下,gini是
随机
森林
分类器
的
标准。sklearn提供了一个名为feature_importances_
的
属性,我们可以在其中获取所提供
的
属性/特性
的
值。通过使用,我们可以
选择
一些
特征
,并使用"threshold
浏览 1
提问于2021-02-05
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Scikit-Learn中的特征排名与递归特征消除
在机器学习中,如何找到最有用的那个特征?——自动化特征选择
精简模型,提升效能:线性回归中的特征选择技巧
特征选择算法在微博应用中的演进历程
特征选择算法在微博业务应用中的演进历程
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券