决策树回归器中的网格交叉验证问题_决策树回归器中网格交叉验证问题_R中logistic回归的交叉验证函数 - 腾讯云开发者社区

、、、、

让我们假设我定义了一个这样的回归器tree.fit(X_train, y_train)ValueError: Invalid parameter ccp_alpha for estimator

浏览 24提问于2021-02-25得票数 0

回答已采纳

1回答

决策树回归与交叉验证在学习中的应用

、、

当使用sklearn的决策树回归(例如DecisionTreeRegressor和RandomForestRegressor)时，我在理解交叉验证的执行过程中遇到了问题。我的数据集有多个预测器(y =单因变量；X=多个自变量)，也有单个预测器，包含足够的情况(> 10k)。以下解释适用于所有情况。基本KFold交叉验证指南中给出的<

浏览 0提问于2017-06-21得票数 5

回答已采纳

2回答

sklearn中的网格搜索交叉验证

可以使用网格搜索交叉验证来提取决策树分类器的最佳参数吗？

浏览 3提问于2015-07-01得票数 6

1回答

随机森林太合适了

、、、

我正在使用scikit学习一个分层的简历来比较一些分类器。我在计算:准确，回忆，auc。敏感度: 0.79 (回归(所以他们看上去不太合适)。所以也

浏览 2提问于2015-11-27得票数 5

回答已采纳

2回答

我的数据是高度重叠的，但当我应用逻辑回归，它是一个令人印象深刻的准确性79%。为什么？

、、、

Logistic回归应该只在线性可分的数据上才能很好地工作。正如我们在对图中看到的，数据点有很大的重叠。logistic回归模型比决策树法、KNN法、随机森林法(适用于重叠数据的方法)具有更好的精度。即使交叉验证得分较高，我的logistic回归模型。 📷

浏览 0提问于2021-09-26得票数 4

1回答

扫描所有机器学习分类器？

、、

我正在使用Weka对一些大型数据集执行分类、聚类和一些回归。我目前正在尝试所有的分类器(决策树、SVM、朴素贝叶斯等)。有没有办法(在Weka或其他机器学习工具包中)扫描所有可用的分类器算法，以找到产生最佳交叉验证精度或其他度量的算法？我也想为我的其他聚类问题找到最好的聚类算法；也许可以找到最低的误差平方和？

浏览 0提问于2013-10-12得票数 1

1回答

多个分类算法总是以相同的分数准确地预测。这正常吗？如果没有，我应该怀疑什么？

、

对于交叉验证，我使用重复的K-交叉验证.对支持向量机、Logistic回归、随机森林、决策树、K-邻域和朴素贝叶斯等方法进行了实验，并采用了二值相关、分类链和标签幂集变换等方法。我注意到，对于分类链，支持向量机，Logistic回归，随机森林，和K-邻居总是达到相同的子集准确性和hamming损失。对于标签Powerset，SVM，Logistic回归和随机预测都取得了相同的分数。然而，对于二元关联

浏览 0提问于2018-12-03得票数 0

1回答

在对回归算法进行特征选择时，我选择了多少个特征？R2和RMSE是衡量过度适应成功的好方法吗？

、、、、

我比较随机森林回归，决策树回归和线性回归。我可以看出存在一些过度拟合的情况，因为我的初始值与交叉验证值之间的关系如下：我已经对RF和D

浏览 0提问于2021-01-14得票数 0

4回答

简历在sklearn.linear_model.LogisticRegressionCV中代表什么？

scikit学习具有两个逻辑回归函数： sklearn.linear_model.LogisticRegressionCV我在ML中唯一知道的与"CV“匹配的缩略语是交叉验证，但我猜不是这样，因为这将在带有包装器函数的scikit中实现，而不是逻辑回归函数本身的一部分(我认为)。

浏览 19提问于2017-09-30得票数 25

回答已采纳

1回答

如何处理目标偏斜且只有少数高值的回归问题？

、、、

我目前正在处理一个带有倾斜目标变量的回归问题(如下所示)。当然，我的第一个想法是用自然对数变换目标，因为它可能会帮助线性回归或基于决策树的算法。第二种思想是准备一个类似于分层k-折叠交叉验证的验证方案，目标被绑定为n个组。然而，我担心的是，我只有很少的最高价值：因此，我的测试集和所有验证集错误都是高度依赖的<

浏览 0提问于2020-08-17得票数 2

1回答

优化模型超参数模块:同时优化和交叉验证

、

假设我将以下配置与Tune Model Hyperparameters模块和增强的决策树回归一起使用：这种配置是否允许我调整超参数，从而获得最佳的确定系数，同时保证最低的交叉验证平均误差？

浏览 2提问于2017-06-04得票数 0

1回答

客户行程的二分类

、、、、

我想开发一个模型，它可以对客户旅程的二元性质进行分类(1表示购买完成，0表示没有购买("jrn_type“列)。行程由通道组成，如下图所示(从1到7列)。 ? 哪个模型最适合数据？

浏览 4提问于2019-01-14得票数 0

回答已采纳

4回答

我应该使用决策树或逻辑回归来进行分类吗？

、、

我正在研究一个分类问题。我有一个包含相同数量的分类变量和连续变量的数据集。如何在决策树和逻辑回归之间决定使用哪种技术？假设logistic回归更适合连续变量，决策树更适合连续变量和范畴变量，这是否正确？

浏览 0提问于2015-06-09得票数 17

回答已采纳

1回答

如何在随机森林回归中提高回归模型的精度

、、、、

想要提高我的成绩更多。不知道这些结果有什么问题。已完成移除异常值，转换字符串->数值，规范化。想知道我的输出有什么问题吗？如果我没有正确地问这个问题，请问我任何事情。这只是我对堆栈溢出的开始。2152.7 1542.3 962.0 311.3 20 这是我输出的直方图我不是专业的回归需要超级帮助从你<em

浏览 2提问于2022-05-23得票数 3

回答已采纳

1回答

包含范畴变量的LASSO子集选择

、、

我在有多个分类变量的数据集上运行了LASSO算法。当我在自变量上使用model.matrix()函数时，它会自动为每个因素级别创建虚拟值。其他一些分类变量有或多或少的因素水平。当我输出拉索的系数时，我注意到worker_typecontr和worker_typeother的系数都是零的。我该如何解释结果呢？在这种情况下，FTE的系数是多少？我应该把这个变量从公式中取出来吗？

浏览 1提问于2018-09-07得票数 2

回答已采纳

2回答

K-折叠交叉验证的应用与部署

、、、

K折叠交叉验证是一种用于将数据分割成K个Folds数的技术，用于测试和培训。目的是估计机器学习模型的可拓性。该模型被训练K次，每列折叠一次，然后在相应的测试褶皱上测试。假设我想对任意数据集上的决策树和Logistic回归模型与10个Folds进行比较。假设对每个模型进行10倍的训练，并得到相应的检验精度，Logistic回归具有较高的平均精度，说明该模型是较好的数

浏览 6提问于2022-05-20得票数 3

回答已采纳

2回答

如何使用cross_validation_scores使用的分类器

、、

我正在尝试训练一个交叉验证的支持向量机模型(用于一个学校项目)。Call 'fit' with appropriate arguments before using this method.的异常(我希望它返回类似于[scores, predictor]的东西，或者可能返回有predict方法的CrossValidationPredictor，但事实并非如此)。当然，我可以调用classifier = clf.fit(X, y)，但这不能给我一个交叉

浏览 0提问于2019-09-06得票数 3

回答已采纳

1回答

Scikit学习中的二叉决策树

我有一个我不明白的简单问题：有人知道答案吗？请告诉我，非常感谢。

浏览 2提问于2015-04-16得票数 0

3回答

如果有的话，机器学习算法被认为是可解释性和预测之间的一个很好的权衡？

、

描述梯度增强机器或神经网络等算法的机器学习文本经常评论说这些模型擅长预测，但这是以失去可解释性或可解释性为代价的。相反，单决策树和经典回归模型被标记为善于解释，但与更复杂的模型(如随机森林或支持向量机)相比，预测精度(相对)较差。是否有普遍接受的机器学习模型代表两者之间的良好权衡？是否有任何文献列举了算法的特点，使它们可以解释？(这个问题以前是在交叉验证时提出的)

浏览 0提问于2016-05-22得票数 9

回答已采纳

1回答

分类问题的RandomForestRegressor

、、、

我一直在做Python课程中的应用机器学习，在第四周的课程和作业中，我发现了一些有趣的东西。在我第一次尝试完成这个任务时，我尝试使用sklearn的RandomForestClassifier来预测标签，但是模型过于贴切，测试的准确性也很差。作为一个实验，我转向了RandomForestRegressor，并且，你猜怎么着，它不仅不过分合适，而且测试的准确性也要高得多。那么，为什么RandomForestRegressor在二进制分类问题</e

浏览 2提问于2020-01-06得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

决策树回归器中网格交叉验证问题

决策树回归与交叉验证在学习中的应用

sklearn中的网格搜索交叉验证

随机森林太合适了

我的数据是高度重叠的，但当我应用逻辑回归，它是一个令人印象深刻的准确性79%。为什么？

扫描所有机器学习分类器？

多个分类算法总是以相同的分数准确地预测。这正常吗？如果没有，我应该怀疑什么？

在对回归算法进行特征选择时，我选择了多少个特征？R2和RMSE是衡量过度适应成功的好方法吗？

简历在sklearn.linear_model.LogisticRegressionCV中代表什么？

如何处理目标偏斜且只有少数高值的回归问题？

优化模型超参数模块:同时优化和交叉验证

客户行程的二分类

我应该使用决策树或逻辑回归来进行分类吗？

如何在随机森林回归中提高回归模型的精度

包含范畴变量的LASSO子集选择

K-折叠交叉验证的应用与部署

如何使用cross_validation_scores使用的分类器

Scikit学习中的二叉决策树

如果有的话，机器学习算法被认为是可解释性和预测之间的一个很好的权衡？

分类问题的RandomForestRegressor

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐