腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何实现分类变量的
特征
选择
?
、
、
我在
选择
重要功能时遇到了问题。数据集的
特征
是分类的和数值的。目标变量为False或True。数据集的
特征
大约是100个,所以我需要删除一些与目标变量无关的
特征
。除了随机森林
特征
重要性之外,还可以使用哪种方法?我使用的是
Python
。在R中,我可以使用Boruta包来
选择
重要的特性。但我不知道如何在
Python
中做到这一点。
浏览 46
提问于2019-03-22
得票数 1
回答已采纳
1
回答
基于tensorflow的
特征
选择
、
、
、
、
我使用了tensorflow 0.11的
python
3.5。在内部,DNNClassifier似乎执行
特征
选择
(或
特征
提取)。有什么方法可以用tensorflow来进行
特征
选择
吗?或者,是否有一些功能来提取
特征
的权重?(有一个函数DNNClassifier.weights_,但它似乎被废弃了)
浏览 4
提问于2016-11-08
得票数 0
回答已采纳
1
回答
scikit adaboost feature_importance_
、
、
在
python
中实现的adaboost算法是如何为每个特性分配特性重要性的?我正在使用它进行
特征
选择
,我的模型在基于feature_importance_值的
特征
选择
方面表现得更好。
浏览 4
提问于2016-04-16
得票数 4
回答已采纳
1
回答
连续Y的随机
特征
选择
算法
、
、
、
目前,我一直在努力寻找一些很好的算法来进行
特征
选择
。使用相关性或其他非随意类型的方法将不是进行
特征
选择
的正确方法。我在
python
或库中搜索使用临时效果进行特性
选择
的算法。因果关系导向型
特征
选择
浏览 0
提问于2021-11-08
得票数 1
1
回答
回归与分类的
特征
选择
、
、
、
、
因此,在应用机器学习算法之前,我希望对我的训练数据进行
特征
选择
。我将使用相同的数据集在许多不同的ML算法上运行,以决定什么是最好的,所以如果我只需要进行一次
特征
选择
并将新的数据集传递给不同的算法,那么效率就会更高。注意:我正在
Python
3中编码,我将使用BorutaPy进行特性
选择
。在执行
特征
选择
之前,我需要知道我使用的是什么算法吗?或者,我可以只执行我的
特征
选择
,然后使用任何算法,即
特征</e
浏览 1
提问于2018-02-28
得票数 1
回答已采纳
1
回答
基因表达数据集的
特征
选择
、
、
我正在搜索一种
特征
选择
算法,该算法
选择
以下
特征
:所有样本的差异都很大基于随机森林分类器
特征
重要性结果的
特征
选择
然而,我不知道哪一个可能是最好的,或是否有更好的候选人为此目的。如果该算法是用
Python
实现
浏览 0
提问于2016-06-28
得票数 1
回答已采纳
1
回答
从
特征
集中
选择
集成
特征
、
、
、
我有一个关于集合
特征
选择
的问题。 我的数据集由1,000个样本和大约30000个
特征
组成,它们被分类为标签A或标签B。我想做的是挑选一些可以有效地对标签进行分类的
特征
。我使用了三种方法,单变量方法(皮尔逊系数),套索回归和SVM-RFE(递归
特征
消除),所以我从它们中得到了三个
特征
集。我使用
python
scikit-learn进行特性
选择
。然后我在考虑集成
特征
选择
方法,因为
特征
的大小太大了。在这种
浏览 2
提问于2015-12-11
得票数 3
1
回答
数据少、稀疏、不平衡时的
特征
选择
、
、
、
当我有较少、稀疏和不平衡的数据时,有什么方法来
选择
这些特性吗?
特征
数量:200个样本数:约1000个
浏览 1
提问于2017-02-01
得票数 0
1
回答
python
中多类logistic回归的
特征
选择
、
、
、
我正在使用使用
python
.Now的多项Logistic回归来执行
特征
选择
(在一个有1,00000行和32个特性的数据集上),为了为多类目标变量(1,2,3,4,5,6,7)建立模型,
选择
特征
的最有效方法是什么
浏览 1
提问于2017-07-04
得票数 0
4
回答
如何比较
特征
选择
方法的性能?
、
、
有几种特性
选择
/变量
选择
方法(例如,请参见Guyon和Elisseeff,2003年,年;刘等人,2010年年):包装方法(例如,前向搜索、爬山搜索),以及比较不同的
特征
选择
算法和为给定的问题/数据集
选择
最佳方法的合适方法是什么?另一个问题是,是否有任何度量
浏览 0
提问于2016-12-06
得票数 15
1
回答
没有类标签列的
特征
选择
、
、
我想在我所拥有的52个特性列表上执行功能
选择
。但是,我的数据集中没有类标签列。那么,如何
选择
不依赖于类标签的特性。 例如:
选择
,根据
特征
与类标签之间的关系
选择
特征
。
浏览 1
提问于2020-03-16
得票数 2
1
回答
为什么套索不能进行
特征
选择
?
、
、
、
我在一个只有15个
特征
试图预测二进制结果的数据集上拟合逻辑拉索。我知道LASSO应该做
特征
选择
和消除不重要的
特征
(系数= 0),但在我的分析中,它已经
选择
了所有的
特征
,而没有消除其中的任何一个。我的问题是: 这是因为我的
特征
太少,或者
特征
之间没有关联(对于分类模型来说,低co-linearity?)Is是一件坏事还是好事?所选的
特征
系数小于0.1,我能把它们解释为对模型不重要或不重要吗?附注:我使用
python
中的s
浏览 2
提问于2021-12-15
得票数 0
1
回答
如何在顺序
特征
选择
中获得正确的
特征
名?
、
我在
python
中运行顺序特性
选择
,该模型由10个预测器组成,准确率为80%。但是,我无法获得
特征
名,相反,特性id作为名称重复。此外,我无法理解
特征
id,因为它们显示的数字大于数据中的
特征
数。如何像在我的数据集中一样获得
特征
名并理解特性id?
浏览 3
提问于2022-01-12
得票数 0
1
回答
Python
中文本分类的
特征
选择
、
、
、
我正在使用scikit-learn库中的Random Forest解决
python
中的一个文本分类问题。我想尝试不同的
特征
选择
方法,例如信息增益(IG)或双正态分离(BNS),如本中所述。似乎scikit中唯一可用的
特征
选择
方法(使用CountVectorizer类)是基于文档频率的。其他库中有其他方法吗?
浏览 1
提问于2014-09-10
得票数 0
1
回答
基于机器学习的数据集
特征
的重要性?
如何利用机器学习来计算数据集中
特征
的重要性?哪种算法会更好,为什么?
浏览 2
提问于2017-08-02
得票数 0
回答已采纳
2
回答
在应用Lasso之前,应该省略高度相关的
特征
吗?
、
、
、
、
如果您能让我知道在使用Lasso logistic回归(L1)进行
特征
选择
之前是否应该省略高度相关的特性,我将非常感激。正则化是处理共线性(
特征
间高度相关)的一种非常有用的方法。然而,这个内核 (通过引用维基百科)指出,保持模型中的相关特性会对
特征
选择
产生不利影响,但它不会影响预测。
浏览 0
提问于2018-08-20
得票数 1
1
回答
在Tensorflow中执行
特征
选择
、
、
我正在从事一个涉及回归的
Python
项目,以预测一些值。输入是一个由70特性组成的数据集,它是、分类和序数变量的混合。因变量是连续。我有一些问题在下面提到。1]在Tensorflow中,是否有一种使用前向
选择
技术进行
特征
选择
的方法? (2)是否有alternatives进行
特征
选择
?
浏览 0
提问于2018-04-15
得票数 3
回答已采纳
4
回答
对于无监督的机器学习问题,可以进行
特征
选择
吗?
、
我开始寻找在机器学习中进行
特征
选择
的方法。通过快速查看这个帖子,我假设只有在有监督的学习问题上才能进行特性
选择
:尽管如此,我还是要问:是否有方法可以在没有已知变量的情况下进行
特征
选择
,从而解决分类/回归问题?
浏览 0
提问于2018-03-27
得票数 7
回答已采纳
1
回答
RandomForestRegressor特性作为类别处理吗?
、
、
、
、
在我的项目中,我使用了RandomForestRegressor (来自
python
的伟大的Scikt学习库),它给了我很好的结果,但我认为我可以做得更好。当我给“fit(.)”赋予
特征
时函数,是否更好地将分类
特征
作为二进制
特征
?| 0 | 1 |因为它作为一棵树工作,也许第二种
选择
更好,或者对于第一种
选择
,它也是一样的吗?
浏览 3
提问于2015-07-12
得票数 1
回答已采纳
2
回答
Python
机器学习,
特征
选择
、
、
我正在做一个与书面文本相关的分类任务,我想知道为了提高分类结果,执行某种“
特征
选择
”过程有多重要。如果a混合了相关和不相关的
特征
,我想我得到的分类结果会很差。我应该在分类前执行“
特征
选择
程序”吗?Scikits有使用基于树的RFE对
特征
进行排序以
选择
最重要的
特征
并使用SVM (非线性)或LDAC执行实际分类是否有意义?或者我是否应该使用相同的分类器来实现某种包装器方法来对
特征
进行排序(尝试使用不同的
特征
组进行分类将非
浏览 0
提问于2012-03-12
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习小窍门:Python 帮你进行特征选择
特征工程:特征缩放、选择
特征选择与特征抽取
使用Python实现机器学习特征选择的4种方法
一个可以进行机器学习特征选择的Python工具
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券