用于交叉验证的h2o形状值/ predict_contributions

、

我研究了从xgb和gbm模型中公开Shap值的h2o.predict_contributions函数。此函数是否也提供来自交叉验证预测的这些指标？我好像找不到他们。library(h2o)data(Sonar) mdl = h2o.xgboost(x=names(Sonar

浏览 20提问于2019-05-07得票数 1

回答已采纳

1回答

R H20 -分层抽样和非I.D.交叉验证。行

、、

我正在使用H2O来分析数据集，但我不知道如何正确地对数据集执行交叉验证。我有一个不平衡的数据集，所以我希望执行分层交叉验证(如果输出变量用于平衡每个分区上的组)。然而，最重要的是，我还有一个问题，就是我的许多行都是重复的(一种实现权重而不实际拥有权重的方法)。除了这个问题的来源之外，我以前也看到过，在某些情况下，如果某些行必须保持在一起，则可以进行交叉</

浏览 2提问于2019-01-02得票数 0

回答已采纳

1回答

从网格搜索中获取模型的cross_validation_holdout_predictions()

我正试图用一种不同的方式来计算性能，它现在是如何为模型内置的。 rrc[m.model_id] = m.cross_validation_holdout_predictions() 我可以用数据集上的模型运行预测我是否可以对同一数据集进行新的预测，并使用它来计算性能？

浏览 2提问于2017-09-16得票数 2

回答已采纳

1回答

保留h2o.automl的交叉验证预测和折叠分配

、、

我看不到设置参数的选项和用于h2o R包中的h2o.automl是否有其他方法可以访问h2o.automl()调用中使用的交叉验证数据集？之所以需要这样做，是因为模型中使用的响应变量是对数转换的，并且计算的交叉验证误差可能具有误导性。

浏览 4提问于2018-01-18得票数 4

回答已采纳

1回答

h2o中的可自定义交叉验证(依赖于培训集的特性)

、、

我有一个模型，其中一些输入特征是从训练数据集(例如，值的平均值或中值)计算出来的。我试图在这个模型上执行n折叠交叉验证，但这意味着这些特性的值将根据为每个折叠选择的训练/验证样本而有所不同。在h2o (我在R中使用它)中是否有一种方法可以传递一个函数，一旦确定了训练集，就可以计算这些特性？这似乎是一个相当直观的功能，但我一直未能找到任何类似的文件，这是现成的。它存在吗？

浏览 0提问于2018-02-22得票数 2

回答已采纳

3回答

R H2O轮询错误消息

、、

我试图通过R在H2O中运行gbm模型，并得到以下错误之一：Error in tail(res$cms, 1)[[1]] : subscript out of bounds # , n.minobsinnode = 2 ) 对于导致这个错误的原因有什么建议吗最

浏览 0提问于2015-02-28得票数 3

1回答

交叉验证指标中的默认阈值- h2o* R包*

、、、

我使用R中的h2o包创建了GBM的笛卡尔网格，并将每个模型的交叉验证指标保存在数据帧中。在model@model$cross_validation_metrics_summary中，用于计算F1和F2分数、精确度、召回率和特异性的阈值是什么？是否有默认值？

浏览 9提问于2019-09-18得票数 0

回答已采纳

1回答

H2O交叉验证所选择的折叠是否改变了所使用数据的百分比？

、、、

H2O手册描述了如何分割数据以进行k-折叠交叉验证.给出的例子是一个5倍交叉验证。参见：，它声明： “前5种模型(交叉验证模型)建立在80%的培训数据基础上，而对于5种模型中的每一种，分别提供了不同的20%。”。如果选择了不同的折叠值，这些百分比会不会不同--例如，假设选择10作为折叠数，以下是否为真？‘前10个模型(交叉验证模

浏览 1提问于2020-05-04得票数 0

回答已采纳

1回答

Python中H2O中使用predict_contributions的负值

、、、

我一直试图为H2O模块中的梯度提升分类器计算SHAP值。下面是predict_contibutions方法文档中的改编示例(来自)。import h2ofrom h2o.estimators.gbm import H2OGradientBoostingEstimator from h2o import H2OFrameCAPSULE", x=["AGE","RACE","PSA","

浏览 7提问于2020-06-18得票数 4

回答已采纳

1回答

H2O -从python代码中获取交叉验证结果

、

我正在尝试使用python访问一些H2O模型的结果。import h2o def get_model_det

浏览 15提问于2020-05-14得票数 1

回答已采纳

1回答

h2o.ensemble和h2o.stack在封装h2oEnsemble中有什么不同？

、

根据对功能的描述： h2o.stack:这个函数使用用户指定的现有H2O基本模型列表创建一个“超级学习者”(叠加)集成。h2o.ensemble:这个函数使用用户指定的H2O基础学习算法创建一个“超级学习者”(叠加)集成。

浏览 4提问于2017-02-23得票数 6

回答已采纳

1回答

在H2O中指定阻塞因子

、

在R版本的H2O中，在训练/验证/测试集中拆分数据和/或进行交叉验证时，是否可以指定阻塞因子？谢谢!

浏览 1提问于2017-09-19得票数 0

3回答

如何阻止h2o将大量的.ERR、.OUT和其他日志文件保存到本地驱动器

、、

我目前正在运行一个脚本，其中正在为蒙特卡罗交叉验证的几个迭代生成多个h2o、glm和深度学习模型。当运行完成(大约需要半天)时，h2o会将大量文件保存到本地驱动器(大小可达8.5GB)。当RStudio或我的计算机重新启动时，这些文件不会被擦除(正如我最初想的那样)。有办法阻止h2o保存这些文件吗？

浏览 1提问于2017-10-26得票数 2

回答已采纳

1回答

H2O Python:提取具有最高验证数据集的网格搜索模型

、

我正在使用H2O Python使用网格搜索构建一个随机森林模型。我在训练和验证中对数据进行分割，并使用k折叠交叉验证来选择网格搜索中的最佳模型。我能够用训练集上最好的MSE检索模型，但我想检索验证集上具有最高AUC的模型。我可以用Python编写所有代码，但我想知道是否有一种H2O方法来解决这个问题。对我怎么做有什么建议吗？

浏览 2提问于2016-10-23得票数 2

回答已采纳

1回答

如何返回每个交叉验证预测的结果？

、、、

我有一个任务，要求我分析一个模型，但我需要每个交叉验证步骤的输出预测-以及交叉验证在该步骤中使用的数据。这是我的代码：但没起作用results= cross_val_predict(MLPClassifier, X_train, y_train, cv=5) 这两种方法都不起作用，但是第二

浏览 1提问于2022-03-29得票数 -2

2回答

交叉验证中的平衡类

、、、、

我想用H2O建立一个基本的模型。我的数据集是不平衡的，所以我使用balance_classes参数。对于网格搜索(参数调整)，我想使用5折交叉验证。我想知道在这种情况下H2O是如何处理类平衡的。

浏览 6提问于2018-02-15得票数 2

1回答

指定用于交叉验证的nfolds时发生h2o深度学习错误

、、

我遇到了相同的错误消息。指定用于交叉验证的nfolds参数时会出现此问题。有趣的是，我可以为nfolds指定较低的值，一切都会正常进行。在这些值之上，REST API给出了

浏览 7提问于2018-08-24得票数 0

回答已采纳

1回答

H2o交叉验证不对应于单列/测试

、、、

我试图了解在H2o中交叉验证是如何工作的，当指定了传递'fold_column‘参数的折叠时。图书馆说： fold_column选项指定数据集中的列，该列包含每个观察的交叉验证折叠索引分配。我假设在每次交叉验证迭代中，使用带有fold_column =i的行作为测试集，其余的行用作列车集。但是，如果我用这些分裂来分别训练和测试模型，就会得到不同

浏览 2提问于2020-07-28得票数 1

1回答

lambda = 0, compute_p_values = TRUE, nfolds = 10, keep_cross_validation_predictions= TRUE) 对于模型的一些cv迭代，在AUC的交叉验证度量摘要中存在NaNs。例如： print(mod@model$cross_validation_metrics_summary["auc",]) 交叉验证指标摘要： mean sd cv_=7时，

浏览 89提问于2019-02-15得票数 0

回答已采纳

1回答

h2o随机林的置信区间

、、

我注意到，有几个函数设计用于计算使用randomForest包构建的模型的置信区间，例如rfPredVar in RFinfer。我想知道是否有人知道像rfPredVar这样的函数可以计算使用h2o包构建的RF模型的置信区间。在此之前，非常感谢您。

浏览 1提问于2017-11-01得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R H20 -分层抽样和非I.D.交叉验证。行

从网格搜索中获取模型的cross_validation_holdout_predictions()

保留h2o.automl的交叉验证预测和折叠分配

h2o中的可自定义交叉验证(依赖于培训集的特性)

R H2O轮询错误消息

交叉验证指标中的默认阈值- h2o* R包*

H2O交叉验证所选择的折叠是否改变了所使用数据的百分比？

Python中H2O中使用predict_contributions的负值

H2O -从python代码中获取交叉验证结果

h2o.ensemble和h2o.stack在封装h2oEnsemble中有什么不同？

在H2O中指定阻塞因子

如何阻止h2o将大量的.ERR、.OUT和其他日志文件保存到本地驱动器

H2O Python:提取具有最高验证数据集的网格搜索模型

如何返回每个交叉验证预测的结果？

交叉验证中的平衡类

指定用于交叉验证的nfolds时发生h2o深度学习错误

H2o交叉验证不对应于单列/测试

h2o交叉验证预测中AUC值的解释总结

h2o随机林的置信区间

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐