如何在特征选择中选择卡方阈值

、、、、

which_ones_to_keep = np.repeat(which_ones_to_keep ,axis=0,repeats=which_ones_to_keep.shape[1]) 此代码计算卡方检验，并应将最佳特征保持在选定的阈值内。我的问题是如何选择卡方测试分数的分数？

浏览 34提问于2020-03-27得票数 0

回答已采纳

1回答

将文档转化为向量空间表示，如何生成字典？

、

将文档转换到向量空间的方法有很多种，如词袋(BOW)模型、潜在语义分析(LSA)模型、n- gram模型等。但我认为所有这些方法都需要一个关键字字典。(100万)如何确定文档中的重要单词？

浏览 2提问于2015-04-28得票数 0

1回答

面向文本分类的词性标注特征选择

、、、

(亦可使用xml格式) 谁能解释一下如何从这个词性标签句子中进行特征选择，并将它们转换为特征向量，以便使用机器学习方法进行文本分类。

浏览 2提问于2011-03-31得票数 5

2回答

特征选择滤波方法

、、

我对何时使用哪种过滤方法进行特征选择感到困惑。我试图通过在线资源来学习它们，并找到了一些方法，如卡方法、方差阈值法、F检验法、互信息法等。当我阅读这些方法时，我对该使用哪一种方法感到困惑。我如何知道该方法是否真的选择了最相关的特性，并且没有删除任何实际上是导致输出的特性？

浏览 0提问于2019-08-14得票数 1

1回答

垃圾邮件过滤中的降维方法

、、、、

特征选择:卡方，InfoGain，GainRatio等. 我知道如何使用weka、链式过滤器和分类器等。我面临的问

浏览 3提问于2014-04-09得票数 0

回答已采纳

1回答

对于决策树如何在每个特性中选择特征和阈值来进行拆分，我感到非常困惑。我完全理解所使用的不同的分裂度量(基尼指数等)以及它们是如何工作的。但我的问题是sklearn如何选择特性和阈值来计算这些指标。我仍然不明白如果设置splitter="best"会发生什么:这是否意味着该算法将考虑所有的特性及其所有值，以获得最佳阈值？在这种情况下，max_features属性不会产生任何影响？如果我设置了splitter="random"，算法会

浏览 0提问于2022-10-18得票数 0

回答已采纳

1回答

对同时具有连续和分类特征的数据进行特征选择？

、

当我同时拥有数字和分类特征时，如何执行特征选择？划分特征并单独探索相关性是否很常见(例如，选择我的分类特征并使用卡方图，然后选择我的连续特征并使用方差分析？)

浏览 18提问于2020-06-03得票数 0

1回答

如何计算数据的理想方差阈值？

、

我会使用无监督的特征选择算法(方差阈值)。如何计算阈值？

浏览 0提问于2020-11-13得票数 0

1回答

如果我只关心特征重要性，我是否应该将我的数据分成测试和训练？

、

基本问题，但我有一些数据，并试图了解在预测目标变量的结果时，哪些特征是最重要的。我没有计划用这些数据进行预测。鉴于此，我是否应该将数据划分为训练和测试，如果是，为什么？谢谢!

浏览 16提问于2020-02-09得票数 0

1回答

问题理解卡方特征选择

、、、

我在理解卡方特征选择时遇到了问题。我有两个类，正的和负的，每个类都包含不同的术语和术语计数。我需要执行卡方特征选择，以提取每个类别的最具代表性的术语。下面是我用来选择特性的Python代码： #!

浏览 1提问于2011-02-22得票数 5

回答已采纳

1回答

用于特征选择的互信息文本分类

、

如何使用互信息度量进行特征选择来提高算法的准确性？

浏览 4提问于2014-07-20得票数 1

2回答

使用卡方检验进行特征选择

、、

我总是很难理解卡方检验的意义，以及如何使用它进行特征选择。我试着阅读维基页面，但我没有得到一个实际的理解。有谁能解释一下吗？

浏览 3提问于2014-02-05得票数 1

1回答

如何使用支持向量机将卡方值用于文本分类？

、、

我计划为每个文档中的每个特征计算卡方值。有了这个值，我如何使用SVM进行分类？分类的阈值是多少？

浏览 0提问于2016-10-27得票数 0

2回答

方差阈值与VIF之差

我在sklearn中遇到了一个叫做VarianceThreshold()的函数。这与状态模型中的variance_inflation_factor()函数有关吗？

浏览 0提问于2022-07-06得票数 1

1回答

如何使用weka删除冗余特性

、、、

我有大约300个特征，我想通过使用weka中的特征选择技术来找到最好的特征子集。请有人告诉我用什么方法删除weka中的冗余特性:)

浏览 3提问于2015-11-25得票数 0

回答已采纳

1回答

为什么我们使用相关系数进行特征选择？

、

我正在学习特征选择。我已经找到了，并且看到许多内核在检查相关系数矩阵。(在上面的链接中，他们介绍了三种特征选择方法，第一种是滤波器方法，包括相关系数和卡方检验。)为什么我们可以使用相关系数进行特征选择？因此，我想知道相关系数是否适合于特征选择。为什么以及如何将其用于特征选择</em

浏览 15提问于2017-08-28得票数 1

回答已采纳

1回答

为什么不能在决策树中随机启动根节点？

、、、

选择根节点的想法有点混乱。为什么我们不能随机选择根节点？唯一的不同似乎是，它将使决策树更长和更复杂，但最终会得到同样的结果。同样，作为决策树中特征选择过程的扩展，为什么不能使用像特征和目标之间的相关性这样简单的东西，或者用卡方检验来确定应该从哪一个特征开始呢？

浏览 11提问于2020-07-05得票数 1

回答已采纳

1回答

如何通过使用R语言中的FSelector信息增益设置阈值来选择最佳的特征？

、、

我使用R中的FSelector软件包在R中进行了信息增益特征选择。0.9652070现在，我需要基于attr_importance.从中选择最好的特性如何根据阈值选择R中最优的特征，以及如何设置阈值？

浏览 6提问于2017-01-04得票数 0

1回答

需要关于sift功能的建议--有好的特性吗？

、、、

我正在试用vlfeat，从图像数据库中获得了大量的功能，我正在测试平均平均精度(MAp)的地面真相。总的来说，我得到了大约40%。虽然我看到还有其他实现，如SURF和其他什么的，让我们继续使用标准Lowe的SIFT和这个问题中标准的单词包。所以事情是这样的，我看到vl_sift有了阈值，允许您对特性选择更加严格。目前，我知道更高的阈值可能会给你带来更小、更有意义的“好”特征列表，并可能减少一些噪音特征。的“好”特征意味着，给定相同的图像具有不同的变化

浏览 3提问于2013-02-16得票数 0

回答已采纳

1回答

如何使用卡方检验从文档中计算关键字？

、、、、

我想用卡方检验从文档中提取关键术语，因此我尝试了以下方法：from sklearn.feature_selectionvectorizer.get_feature_names()TypeError: fit() missing 1 required positional argument: 'y' 有没有办法使用卡方检验来提取最

浏览 22提问于2018-07-28得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

将文档转化为向量空间表示，如何生成字典？

面向文本分类的词性标注特征选择

特征选择滤波方法

垃圾邮件过滤中的降维方法

滑雪板实现中决策树中的分割器

对同时具有连续和分类特征的数据进行特征选择？

如何计算数据的理想方差阈值？

如果我只关心特征重要性，我是否应该将我的数据分成测试和训练？

问题理解卡方特征选择

用于特征选择的互信息文本分类

使用卡方检验进行特征选择

如何使用支持向量机将卡方值用于文本分类？

方差阈值与VIF之差

如何使用weka删除冗余特性

为什么我们使用相关系数进行特征选择？

为什么不能在决策树中随机启动根节点？

如何通过使用R语言中的FSelector信息增益设置阈值来选择最佳的特征？

需要关于sift功能的建议--有好的特性吗？

如何使用卡方检验从文档中计算关键字？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐