腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用于
交叉
验证
的
h2o
形状
值
/
predict_contributions
、
我研究了从xgb和gbm模型中公开Shap
值
的
h2o.predict_contributions函数。此函数是否也提供来自
交叉
验证
预测
的
这些指标?我好像找不到他们。library(
h2o
)data(Sonar) mdl = h2o.xgboost(x=names(Sonar
浏览 20
提问于2019-05-07
得票数 1
回答已采纳
1
回答
R H20 -分层抽样和非I.D.
交叉
验证
。行
、
、
我正在使用
H2O
来分析数据集,但我不知道如何正确地对数据集执行
交叉
验证
。我有一个不平衡
的
数据集,所以我希望执行分层
交叉
验证
(如果输出变量
用于
平衡每个分区上
的
组)。然而,最重要
的
是,我还有一个问题,就是我
的
许多行都是重复
的
(一种实现权重而不实际拥有权重
的
方法)。除了这个问题
的
来源之外,我以前也看到过,在某些情况下,如果某些行必须保持在一起,则可以进行
交叉</
浏览 2
提问于2019-01-02
得票数 0
回答已采纳
1
回答
从网格搜索中获取模型
的
cross_validation_holdout_predictions()
我正试图用一种不同
的
方式来计算性能,它现在是如何为模型内置
的
。 rrc[m.model_id] = m.cross_validation_holdout_predictions() 我可以用数据集上
的
模型运行预测我是否可以对同一数据集进行新
的
预测,并使用它来计算性能?
浏览 2
提问于2017-09-16
得票数 2
回答已采纳
1
回答
保留h2o.automl
的
交叉
验证
预测和折叠分配
、
、
我看不到设置参数
的
选项和
用于
h2o
R包中
的
h2o.automl是否有其他方法可以访问h2o.automl()调用中使用
的
交叉
验证
数据集? 之所以需要这样做,是因为模型中使用
的
响应变量是对数转换
的
,并且计算
的
交叉
验证
误差可能具有误导性。
浏览 4
提问于2018-01-18
得票数 4
回答已采纳
1
回答
h2o
中
的
可自定义
交叉
验证
(依赖于培训集
的
特性)
、
、
我有一个模型,其中一些输入特征是从训练数据集(例如,
值
的
平均值或中值)计算出来
的
。我试图在这个模型上执行n折叠
交叉
验证
,但这意味着这些特性
的
值
将根据为每个折叠选择
的
训练/
验证
样本而有所不同。在
h2o
(我在R中使用它)中是否有一种方法可以传递一个函数,一旦确定了训练集,就可以计算这些特性? 这似乎是一个相当直观
的
功能,但我一直未能找到任何类似的文件,这是现成
的
。它存在吗?
浏览 0
提问于2018-02-22
得票数 2
回答已采纳
3
回答
R
H2O
轮询错误消息
、
、
我试图通过R在
H2O
中运行gbm模型,并得到以下错误之一:Error in tail(res$cms, 1)[[1]] : subscript out of bounds # , n.minobsinnode = 2 ) 对于导致这个错误
的
原因有什么建议吗最
浏览 0
提问于2015-02-28
得票数 3
1
回答
交叉
验证
指标中
的
默认阈值-
h2o
R包
、
、
、
我使用R中
的
h2o
包创建了GBM
的
笛卡尔网格,并将每个模型
的
交叉
验证
指标保存在数据帧中。在model@model$cross_validation_metrics_summary中,
用于
计算F1和F2分数、精确度、召回率和特异性
的
阈值是什么?是否有默认
值
?
浏览 9
提问于2019-09-18
得票数 0
回答已采纳
1
回答
H2O
交叉
验证
所选择
的
折叠是否改变了所使用数据
的
百分比?
、
、
、
H2O
手册描述了如何分割数据以进行k-折叠
交叉
验证
.给出
的
例子是一个5倍
交叉
验证
。参见:,它声明: “前5种模型(
交叉
验证
模型)建立在80%
的
培训数据基础上,而对于5种模型中
的
每一种,分别提供了不同
的
20%。”。如果选择了不同
的
折叠
值
,这些百分比会不会不同--例如,假设选择10作为折叠数,以下是否为真?‘前10个模型(
交叉
验证
模
浏览 1
提问于2020-05-04
得票数 0
回答已采纳
1
回答
Python中
H2O
中使用
predict_contributions
的
负值
、
、
、
我一直试图为
H2O
模块中
的
梯度提升分类器计算SHAP
值
。下面是predict_contibutions方法文档中
的
改编示例(来自)。import
h2o
from h2o.estimators.gbm import H2OGradientBoostingEstimator from
h2o
import H2OFrameCAPSULE", x=["AGE","RACE","PSA","
浏览 7
提问于2020-06-18
得票数 4
回答已采纳
1
回答
H2O
-从python代码中获取
交叉
验证
结果
、
我正在尝试使用python访问一些
H2O
模型
的
结果。import
h2o
def get_model_det
浏览 15
提问于2020-05-14
得票数 1
回答已采纳
1
回答
h2o.ensemble和h2o.stack在封装h2oEnsemble中有什么不同?
、
根据对功能
的
描述: h2o.stack:这个函数使用用户指定
的
现有
H2O
基本模型列表创建一个“超级学习者”(叠加)集成。h2o.ensemble:这个函数使用用户指定
的
H2O
基础学习算法创建一个“超级学习者”(叠加)集成。
浏览 4
提问于2017-02-23
得票数 6
回答已采纳
1
回答
在
H2O
中指定阻塞因子
、
在R版本
的
H2O
中,在训练/
验证
/测试集中拆分数据和/或进行
交叉
验证
时,是否可以指定阻塞因子?谢谢!
浏览 1
提问于2017-09-19
得票数 0
3
回答
如何阻止
h2o
将大量
的
.ERR、.OUT和其他日志文件保存到本地驱动器
、
、
我目前正在运行一个脚本,其中正在为蒙特卡罗
交叉
验证
的
几个迭代生成多个
h2o
、glm和深度学习模型。当运行完成(大约需要半天)时,
h2o
会将大量文件保存到本地驱动器(大小可达8.5GB)。当RStudio或我
的
计算机重新启动时,这些文件不会被擦除(正如我最初想
的
那样)。有办法阻止
h2o
保存这些文件吗?
浏览 1
提问于2017-10-26
得票数 2
回答已采纳
1
回答
H2O
Python:提取具有最高
验证
数据集
的
网格搜索模型
、
我正在使用
H2O
Python使用网格搜索构建一个随机森林模型。我在训练和
验证
中对数据进行分割,并使用k折叠
交叉
验证
来选择网格搜索中
的
最佳模型。我能够用训练集上最好
的
MSE检索模型,但我想检索
验证
集上具有最高AUC
的
模型。 我可以用Python编写所有代码,但我想知道是否有一种
H2O
方法来解决这个问题。对我怎么做有什么建议吗?
浏览 2
提问于2016-10-23
得票数 2
回答已采纳
1
回答
如何返回每个
交叉
验证
预测
的
结果?
、
、
、
我有一个任务,要求我分析一个模型,但我需要每个
交叉
验证
步骤
的
输出预测-以及
交叉
验证
在该步骤中使用
的
数据。这是我
的
代码:但没起作用results= cross_val_predict(MLPClassifier, X_train, y_train, cv=5) 这两种方法都不起作用,但是第二
浏览 1
提问于2022-03-29
得票数 -2
2
回答
交叉
验证
中
的
平衡类
、
、
、
、
我想用
H2O
建立一个基本
的
模型。我
的
数据集是不平衡
的
,所以我使用balance_classes参数。对于网格搜索(参数调整),我想使用5折
交叉
验证
。我想知道在这种情况下
H2O
是如何处理类平衡
的
。
浏览 6
提问于2018-02-15
得票数 2
1
回答
指定
用于
交叉
验证
的
nfolds时发生
h2o
深度学习错误
、
、
我遇到了相同
的
错误消息。指定
用于
交叉
验证
的
nfolds参数时会出现此问题。有趣
的
是,我可以为nfolds指定较低
的
值
,一切都会正常进行。在这些
值
之上,REST API给出了
浏览 7
提问于2018-08-24
得票数 0
回答已采纳
1
回答
H2o
交叉
验证
不对应于单列/测试
、
、
、
我试图了解在
H2o
中
交叉
验证
是如何工作
的
,当指定了传递'fold_column‘参数
的
折叠时。图书馆说: fold_column选项指定数据集中
的
列,该列包含每个观察
的
交叉
验证
折叠索引分配。我假设在每次
交叉
验证
迭代中,使用带有fold_column =i
的
行作为测试集,其余
的
行用作列车集。但是,如果我用这些分裂来分别训练和测试模型,就会得到不同
浏览 2
提问于2020-07-28
得票数 1
1
回答
h2o
交叉
验证
预测中AUC
值
的
解释总结
、
、
、
、
lambda = 0, compute_p_values = TRUE, nfolds = 10, keep_cross_validation_predictions= TRUE) 对于模型
的
一些cv迭代,在AUC
的
交叉
验证
度量摘要中存在NaNs。例如: print(mod@model$cross_validation_metrics_summary["auc",])
交叉
验证
指标摘要: mean sd cv_=7时,
浏览 89
提问于2019-02-15
得票数 0
回答已采纳
1
回答
h2o
随机林
的
置信区间
、
、
我注意到,有几个函数设计
用于
计算使用randomForest包构建
的
模型
的
置信区间,例如rfPredVar in RFinfer。我想知道是否有人知道像rfPredVar这样
的
函数可以计算使用
h2o
包构建
的
RF模型
的
置信区间。在此之前,非常感谢您。
浏览 1
提问于2017-11-01
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python基础——6 交叉验证法
机器学习的心腹大患:数据泄漏
算法研习:机器学习中的K-Fold交叉验证
选择参数优化 Azure 机器学习中的算法
OneDayOnePyModel之岭回归
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券