腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
特征
选择
中
选择
卡
方
阈值
、
、
、
、
which_ones_to_keep = np.repeat(which_ones_to_keep ,axis=0,repeats=which_ones_to_keep.shape[1]) 此代码计算
卡
方
检验,并应将最佳
特征
保持在选定的
阈值
内。我的问题是如何
选择
卡
方
测试分数的分数?
浏览 34
提问于2020-03-27
得票数 0
回答已采纳
1
回答
将文档转化为向量空间表示,如何生成字典?
、
将文档转换到向量空间的方法有很多种,
如
词袋(BOW)模型、潜在语义分析(LSA)模型、n- gram模型等。但我认为所有这些方法都需要一个关键字字典。(100万)如何确定文档
中
的重要单词?
浏览 2
提问于2015-04-28
得票数 0
1
回答
面向文本分类的词性标注
特征
选择
、
、
、
(亦可使用xml格式) 谁能解释一下如何从这个词性标签句子中进行
特征
选择
,并将它们转换为
特征
向量,以便使用机器学习方法进行文本分类。
浏览 2
提问于2011-03-31
得票数 5
2
回答
特征
选择
滤波方法
、
、
我对何时使用哪种过滤方法进行
特征
选择
感到困惑。我试图通过在线资源来学习它们,并找到了一些方法,
如
卡
方法、方差
阈值
法、F检验法、互信息法等。当我阅读这些方法时,我对该使用哪一种方法感到困惑。我如何知道该方法是否真的
选择
了最相关的特性,并且没有删除任何实际上是导致输出的特性?
浏览 0
提问于2019-08-14
得票数 1
1
回答
垃圾邮件过滤
中
的降维方法
、
、
、
、
特征
选择
:
卡
方
,InfoGain,GainRatio等. 我知道如何使用weka、链式过滤器和分类器等。我面临的问
浏览 3
提问于2014-04-09
得票数 0
回答已采纳
1
回答
滑雪板实现
中
决策树
中
的分割器
、
对于决策树如
何在
每个特性中
选择
特征
和
阈值
来进行拆分,我感到非常困惑。我完全理解所使用的不同的分裂度量(基尼指数等)以及它们是如何工作的。但我的问题是sklearn如何
选择
特性和
阈值
来计算这些指标。我仍然不明白如果设置splitter="best"会发生什么:这是否意味着该算法将考虑所有的特性及其所有值,以获得最佳
阈值
?在这种情况下,max_features属性不会产生任何影响?如果我设置了splitter="random",算法会
浏览 0
提问于2022-10-18
得票数 0
回答已采纳
1
回答
对同时具有连续和分类
特征
的数据进行
特征
选择
?
、
当我同时拥有数字和分类
特征
时,如何执行
特征
选择
?划分
特征
并单独探索相关性是否很常见(例如,
选择
我的分类
特征
并使用
卡
方
图,然后
选择
我的连续
特征
并使用方差分析?)
浏览 18
提问于2020-06-03
得票数 0
1
回答
如何计算数据的理想方差
阈值
?
、
我会使用无监督的
特征
选择
算法(方差
阈值
)。如何计算
阈值
?
浏览 0
提问于2020-11-13
得票数 0
1
回答
如果我只关心
特征
重要性,我是否应该将我的数据分成测试和训练?
、
基本问题,但我有一些数据,并试图了解在预测目标变量的结果时,哪些
特征
是最重要的。我没有计划用这些数据进行预测。鉴于此,我是否应该将数据划分为训练和测试,如果是,为什么?谢谢!
浏览 16
提问于2020-02-09
得票数 0
1
回答
问题理解
卡
方
特征
选择
、
、
、
我在理解
卡
方
特征
选择
时遇到了问题。我有两个类,正的和负的,每个类都包含不同的术语和术语计数。我需要执行
卡
方
特征
选择
,以提取每个类别的最具代表性的术语。下面是我用来
选择
特性的Python代码: #!
浏览 1
提问于2011-02-22
得票数 5
回答已采纳
1
回答
用于
特征
选择
的互信息文本分类
、
如何使用互信息度量进行
特征
选择
来提高算法的准确性?
浏览 4
提问于2014-07-20
得票数 1
2
回答
使用
卡
方
检验进行
特征
选择
、
、
我总是很难理解
卡
方
检验的意义,以及如何使用它进行
特征
选择
。我试着阅读维基页面,但我没有得到一个实际的理解。有谁能解释一下吗?
浏览 3
提问于2014-02-05
得票数 1
1
回答
如何使用支持向量机将
卡
方
值用于文本分类?
、
、
我计划为每个文档
中
的每个
特征
计算
卡
方
值。有了这个值,我如何使用SVM进行分类?分类的
阈值
是多少?
浏览 0
提问于2016-10-27
得票数 0
2
回答
方差
阈值
与VIF之差
我在sklearn
中
遇到了一个叫做VarianceThreshold()的函数。这与状态模型
中
的variance_inflation_factor()函数有关吗?
浏览 0
提问于2022-07-06
得票数 1
1
回答
如何使用weka删除冗余特性
、
、
、
我有大约300个
特征
,我想通过使用weka
中
的
特征
选择
技术来找到最好的
特征
子集。请有人告诉我用什么方法删除weka
中
的冗余特性:)
浏览 3
提问于2015-11-25
得票数 0
回答已采纳
1
回答
为什么我们使用相关系数进行
特征
选择
?
、
我正在学习
特征
选择
。我已经找到了,并且看到许多内核在检查相关系数矩阵。(在上面的链接
中
,他们介绍了三种
特征
选择
方法,第一种是滤波器方法,包括相关系数和
卡
方
检验。)为什么我们可以使用相关系数进行
特征
选择
?因此,我想知道相关系数是否适合于
特征
选择
。为什么以及如何将其用于
特征
选择</em
浏览 15
提问于2017-08-28
得票数 1
回答已采纳
1
回答
为什么不能在决策树
中
随机启动根节点?
、
、
、
选择
根节点的想法有点混乱。为什么我们不能随机
选择
根节点?唯一的不同似乎是,它将使决策树更长和更复杂,但最终会得到同样的结果。同样,作为决策树
中
特征
选择
过程的扩展,为什么不能使用像
特征
和目标之间的相关性这样简单的东西,或者用
卡
方
检验来确定应该从哪一个
特征
开始呢?
浏览 11
提问于2020-07-05
得票数 1
回答已采纳
1
回答
如何通过使用R语言中的FSelector信息增益设置
阈值
来
选择
最佳的
特征
?
、
、
我使用R
中
的FSelector软件包在R中进行了信息增益
特征
选择
。0.9652070现在,我需要基于attr_importance.从中
选择
最好的特性如何根据
阈值
选择
R中最优的
特征
,以及如何设置
阈值
?
浏览 6
提问于2017-01-04
得票数 0
1
回答
需要关于sift功能的建议--有好的特性吗?
、
、
、
我正在试用vlfeat,从图像数据库
中
获得了大量的功能,我正在测试平均平均精度(MAp)的地面真相。总的来说,我得到了大约40%。虽然我看到还有其他实现,
如
SURF和其他什么的,让我们继续使用标准Lowe的SIFT和这个问题中标准的单词包。 所以事情是这样的,我看到vl_sift有了
阈值
,允许您对特性
选择
更加严格。目前,我知道更高的
阈值
可能会给你带来更小、更有意义的“好”
特征
列表,并可能减少一些噪音
特征
。的“好”
特征
意味着,给定相同的图像具有不同的变化
浏览 3
提问于2013-02-16
得票数 0
回答已采纳
1
回答
如何使用
卡
方
检验从文档中计算关键字?
、
、
、
、
我想用
卡
方
检验从文档中提取关键术语,因此我尝试了以下方法:from sklearn.feature_selectionvectorizer.get_feature_names()TypeError: fit() missing 1 required positional argument: 'y' 有没有办法使用
卡
方
检验来提取最
浏览 22
提问于2018-07-28
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
特征选择算法在微博应用中的演进历程
在机器学习中,如何找到最有用的那个特征?——自动化特征选择
特征选择算法在微博业务应用中的演进历程
如何在PCBA加工中根据需求选择合适的基材?
中欣卡(易付卡)回收选择什么平台靠谱
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券