如何使用XGB进行TargetEncoder后训练，以获得特征重要性？

、、、、

我在我的数据集中的所有分类的名义特征上使用了TargetEncoder。在将df拆分为训练和测试之后，我在数据集上拟合XGB。在模型训练之后，我希望绘制特征重要性，然而，特征以“编码”的状态显示。我如何反转这些特征，使重要性图是可解释的？import category_encoders as ce encoder=ce.TargetEncoder</em

浏览 112提问于2021-11-15得票数 0

回答已采纳

1回答

nlp多标签分类tf vs tfidf

、、、、

我解决这个问题的方法是，在清理文本、停止单词删除、标记化等之后，执行以下操作：为了创建特征矩阵，我查看了每个文档中术语的频率分布，然后创建了这些术语的表(其中删除了重复的术语)，然后计算了每个单词在其相应文本中的术语频率然后我使用selectKbest将它们缩小到490左右。在对它们进行缩放之后，我使用OneVsRestClassifier(SVC)进行分类。我是否需要使用tfidf vectorizer而不是tf，以及如何使用？我对NLP非常陌生

浏览 29提问于2019-02-12得票数 4

回答已采纳

1回答

特征重要性绘图使用xgb和护林员。最好的比较方法

、、

我正在编写一个脚本，它既训练了游侠随机森林，又训练了xgb回归。根据基于rmse的最佳性能，其中一种或另一种用于针对搁置数据进行测试。> xgb.importance(model = regression_model) Feature(model = regressi

浏览 2提问于2020-01-13得票数 0

回答已采纳

3回答

预处理后的Names特征重要性图

、

在构建模型之前，我像这样进行缩放并在构建特征重要性图之后plt.ylabel('features', fontsize = 20)问题是，我们得到的不是特性的名称，而是f0、f1、f2、f3等……如何返回功能名称

浏览 18提问于2016-07-27得票数 13

回答已采纳

1回答

如何在python中根据xgboost的变量重要性来绘制前k个变量？

、、

在python中，如何根据variableI重要性绘制前k个变量？我知道我可以从xgb_model.get_score()中提取变量重要性，它返回一个存储对(特征，重要性)的字典。但我不知道如何创建具有相同样式的图片(直方图)，如果

浏览 128提问于2018-04-27得票数 0

回答已采纳

7回答

XGBoost plot_importance不显示功能名称

、、、

我正在使用XGBoost和Python，并且已经使用在DMatrix数据上调用的XGBoost train()函数成功地训练了一个模型。该矩阵是从Pandas数据帧创建的，该数据帧具有列的特征名称。(Xtrain, label=ytrain) model = xgb.train(xgb_params, dtrain, num_boost_round=60, \(model, max_num_features=5, ax=ax) 现在，我希望使用xgboost.plot

浏览 458提问于2017-10-26得票数 27

回答已采纳

2回答

如何查找和使用XGBoost的顶级特性？

、、、

由于这是一个分类问题，所以我想使用XGBoost。我在网上发现，有一些方法可以找到重要的功能。但由于我有很多特点，这引起了一个问题。 gbm = xgb.XGBClassifier(max_depth=3, n_est

浏览 0提问于2018-01-18得票数 4

1回答

具有多个特征的分类？

、、、、

我有：2)针对每个特征的一组特征。谢谢

浏览 0提问于2019-01-20得票数 0

1回答

支持向量机的特征选择

、、、

我正在训练一个SVM分类器。目前，我有大约4000个特性，但其中很多都是冗余的/无信息的。我想将模型中的特征减少到大约20-50个。我想使用贪婪爬山，每次减少1个特征。删除的功能应该是最不重要的功能。训练支持向量机后，如何获得特征重要性的排名？如果我在R中使用libsvm，我如何获得每个特征的权重，或者其他一些类似类型的重要指标？谢谢!

浏览 1提问于2013-03-03得票数 4

3回答

XGBoost plot_importance中的打印编号格式()

、、、、

我训练了一个XGBoost模型，并使用plot_importance()绘制了训练后的模型中最重要的特征。尽管如此，plot中的数字有几个十进制值，这会淹没plot，不适合plot。我已经搜索了绘图格式选项，但我只找到了如何格式化轴(尝试格式化X轴，希望它也能格式化相应的轴)xg_reg = xgb.XGBClassifier( objective = &

浏览 0提问于2019-05-09得票数 1

1回答

分类变量的xgboost特征重要性

、、

我正在使用XGBClassifier进行python训练，在我的训练数据集中有一些分类变量。最初，我计划在添加数据之前将它们每个都转换为几个虚拟对象，但随后将计算每个虚拟对象的特征重要性，而不是原始的分类对象。由于我还需要按重要性对所有原始变量(包括数字+分类)进行排序，因此我想知道如何获得原始变量的重要性？这是简单的累加吗？

浏览 1提问于2018-11-16得票数 0

11回答

如何在xgboost中获取特性重要性？

、

我正在使用{}构建模型，并尝试使用xgboost查找每个特性的重要性，但它返回xgboostdtrain = xgb.DMatrix(X, label=Y)param = {'max_depth': 6, 'learning_rate': 0.03}bst = xgb.train(param如何在xgboost中

浏览 1提问于2016-06-04得票数 52

1回答

XGB回归器特征选择

21 23 2530 23 25 45 以下代码用于对回归问题进行XG boost拟合，并获得重要特性。特征选择方法是使用F分数来赋予重要性。clf = xgb.XGBRegressor(n_estimators=100, gamma=1) sorted_idx = clf.feature_impor

浏览 41提问于2021-03-16得票数 0

3回答

如何在不重新训练模型的情况下获得XGBoost特征重要性图中的实际特征名称？

、、

我在Stackoverflow上遇到了几个问题，其中大众面临的问题是他们在使用例如拟合/训练XGBoost模型之前对训练数据进行预处理，例如使用中心和尺度等 scaler = MinMaxScaler因此，当我尝试使用plot_importance(my_model_name)时，它会导致绘制特征重要性图，但只有f0、f1、f2等特征名称，而不是数据集中的实际特征名称，这一点必须很明显。大多数关于SO

浏览 1提问于2019-03-01得票数 17

3回答

如何在XGBOOST中获得正确的特征重要性图？

、

使用两种不同的方法在XGBOOST特性的重要性，给我两个不同的最重要的特性，哪一个应该相信？# fit the model model_xgb_pandas = xgb.XGBRegressor(n_jobs=-1,o

浏览 3提问于2019-11-21得票数 6

回答已采纳

1回答

如何在MultiOutputRegressor中使用plot_importance函数？

、

我使用blow代码来获得多个输出。"ValueError:树必须是Booster、XGBModel或dict实例“import xgboost as xgb X = np.array([[0,1,2,3,4],[2,3,4,5,

浏览 17提问于2020-03-11得票数 2

3回答

转换为XGBoost后列车和测试特性的DMatrix差异

、、、、

只是想知道下一种情况是怎么可能的： xgtrain = xgb.DMatrix(train, label=target, missing=np.nan) d

浏览 2提问于2016-08-03得票数 4

回答已采纳

3回答

分类后的特征重要性

、

我有时间序列数据，每个样本或多或少都有200个特征，我使用递归神经网络进行二值分类任务。分类之后，我想知道哪些特性对目标贡献最大(比如target=1)。有什么建议吗？谢谢

浏览 0提问于2020-09-16得票数 8

回答已采纳

1回答

随机森林的特征重要性

、、

我有一个有11个特征的数据集，我注意到操作这些特征(例如删除其中一个或一些)不会影响训练和测试数据的错误分数，所以我不得不检查这些特性的重要性。因此，我尝试只使用第一个特性来运行模型。预期成绩分数不会显着下降，因为其余10个下降的特征具有很低的特征重要性。然而，在只使用第一个特性进行实验后，测试数据的abs错误百分比从14.13010%显著提高到22.96036%。为什么会发生这种事？当我使

浏览 0提问于2021-02-23得票数 1

1回答

随机森林中要素的每个级别的重要性顺序

、、

在使用SciKitLearn的随机森林分类器对模型进行拟合后，我得到了特征重要性列表，但我能否获得特征级别的重要性。例如，如果我得到以下功能重要性的系列，我如何才能看到哪个day_of_week是最重要的？

浏览 15提问于2021-02-20得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

nlp多标签分类tf vs tfidf

特征重要性绘图使用xgb和护林员。最好的比较方法

预处理后的Names特征重要性图

如何在python中根据xgboost的变量重要性来绘制前k个变量？

XGBoost plot_importance不显示功能名称

如何查找和使用XGBoost的顶级特性？

具有多个特征的分类？

支持向量机的特征选择

XGBoost plot_importance中的打印编号格式()

分类变量的xgboost特征重要性

如何在xgboost中获取特性重要性？

XGB回归器特征选择

如何在不重新训练模型的情况下获得XGBoost特征重要性图中的实际特征名称？

如何在XGBOOST中获得正确的特征重要性图？

如何在MultiOutputRegressor中使用plot_importance函数？

转换为XGBoost后列车和测试特性的DMatrix差异

分类后的特征重要性

随机森林的特征重要性

随机森林中要素的每个级别的重要性顺序

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐