R h2o:如何为GBM实现自定义stopping_metric

R h2o是一个开源的机器学习平台，可以在云计算环境中进行大规模数据分析和建模。它提供了丰富的机器学习算法和工具，包括GBM（Gradient Boosting Machine）。

GBM是一种基于梯度提升的机器学习算法，用于解决回归和分类问题。它通过迭代地训练多个弱学习器，并将它们组合成一个强学习器。在每一轮迭代中，GBM通过计算损失函数的负梯度来训练下一个弱学习器，以最小化损失函数。GBM的优势在于能够处理大规模数据集和复杂的非线性关系。

在R h2o中，可以通过设置参数来实现自定义的stopping_metric。stopping_metric是用于决定何时停止训练的度量指标。常见的stopping_metric包括RMSE（均方根误差）、logloss（对数损失）等。通过设置不同的stopping_metric，可以根据具体问题的需求来优化模型的训练过程。

以下是一个示例代码，演示如何在R h2o中为GBM实现自定义的stopping_metric：

library(h2o)

# 初始化h2o集群
h2o.init()

# 导入数据
data <- h2o.importFile("data.csv")

# 将数据集划分为训练集和测试集
split <- h2o.splitFrame(data, ratios = 0.8)

train <- split[[1]]
test <- split[[2]]

# 定义GBM模型
gbm <- h2o.gbm(
  x = 1:10,  # 特征列的索引
  y = 11,    # 目标列的索引
  training_frame = train,
  stopping_metric = "custom",  # 设置自定义的stopping_metric
  stopping_rounds = 5,         # 连续5轮没有改进时停止训练
  stopping_tolerance = 0.001   # 停止训练的容忍度
)

# 在测试集上评估模型
predictions <- h2o.predict(gbm, newdata = test)

# 关闭h2o集群
h2o.shutdown()

在上述代码中，我们通过设置stopping_metric = "custom"来实现自定义的stopping_metric。同时，我们还设置了stopping_rounds和stopping_tolerance参数来定义停止训练的条件。具体的参数设置可以根据实际情况进行调整。

腾讯云提供了一系列与机器学习和数据分析相关的产品和服务，例如腾讯云机器学习平台（https://cloud.tencent.com/product/tcmlp）和腾讯云数据分析平台（https://cloud.tencent.com/product/dp）。这些产品和服务可以帮助用户在云计算环境中高效地进行机器学习和数据分析任务。

R h2o:如何为GBM实现自定义stopping_metric

、、

我发现现在可以在h2o v3.22.1.1中使用stopping_metric = custom (在v3.10.0.9中没有)，但是我没有找到如何在R中实现它的地方。library(h2o)x <- data.frame( z = rnorm(1000), )h2o.gbm

浏览 23提问于2019-01-30得票数 0

回答已采纳

1回答

H20:如何在文本数据上使用梯度增强？

、、、、

我正在尝试实现一个非常简单的ML学习问题，其中我使用文本来预测一些结果。在R中，一些基本的例子是：library(caret)library(text2vec) 非常感谢！！

浏览 1提问于2017-06-14得票数 2

回答已采纳

1回答

保持常数列h2o

、、、

我试图用R的h2o包来实现梯度助推机模型。但是，该模型不断删除我从其他模型构建中知道的某一列，该列非常重要。h2o.startModelJob(algo, params, h2oRestApiVersion) :如何阻止h2o以下是我尝试过的：

浏览 0提问于2018-11-08得票数 0

回答已采纳

1回答

R和python中的h2o包

、、、

R和python中的所有函数都能在h2o包上工作吗？它们是否有一些限制，比如一些函数可以工作，而其他函数不能工作？

浏览 2提问于2016-11-29得票数 3

1回答

我正在通过R使用H2O，我试图建立随机森林，XGBoost，GBM模型来解决多类问题。H2O提供的模型性能洞察力很好，但作为成功的标准之一，我有自己的自定义函数，当模型用于对一组用户进行评分时，该函数可以对模型精度进行评分。一般来说，这个函数奖励预测，惩罚错误预测。该自定义函数的逆也可以被认为是损失函数。我想知道在训练模型时，是否以及如何将这种自定义损失函数插入到H2O中。

浏览 0提问于2018-09-08得票数 5

1回答

我应该使用EC2虚拟机中的哪些参数来优化H2O的XGBoost性能？

、、、、

我正试着在r4.8x的大小上运行H2O xgboost。但运行时间太长(15+小时，而相同超参数网格大小的GBM需要4小时)。知道XGBoost使用缓存优化，有什么特定的实例类型最适合H2O的XGBoost实现吗？我的训练数据有28K行，150个二进制列。我正在进行网格搜索。

浏览 4提问于2021-05-21得票数 1

3回答

H2O R api:从网格搜索中检索最优模型

、、

我在R中使用h2o包(v3.6.0)，并构建了一个网格搜索模型。现在，我正在尝试访问在验证集上最小化MSE的模型。在python的sklearn中，使用RandomizedSearchCV很容易实现这一点grid = RandomizedSearchCV(model, params下面是一个您可以重新创建的示例：## assume you got h2o initialized..._10.hex_11_model_R_145

浏览 8提问于2016-02-26得票数 8

回答已采纳

2回答

用于r中回归的r中h2o集成实现的代码

、、

我已经搜索了不同的门户网站，甚至在h2o集成文档中，我得到的只是分类问题二进制的集成示例，但没有一个示例显示如何在r中为简单的回归问题实现通用堆栈或h2o集成。我请求任何人分享如何实现h2o集成或堆叠的工作代码，仅用于R中的回归问题简单的集成仅用于R中的回归。只想知道如何为具有不同权重的回归实现集成/堆叠。

浏览 2提问于2018-01-29得票数 1

2回答

Python/H2o :绘制树/从H2ORandomForestEstimator模型中提取规则

、、

有没有什么“简单”的方法来绘制H2O随机森林模型中的树？我对提取结果规则也很感兴趣？

浏览 0提问于2018-05-18得票数 5

1回答

使用r将压缩csv导入“h2o”

、、、、

'h2o‘包是一个有趣的ML工具，可以通过R访问。访问'h2o’的R包称为"“。有没有办法指出一个文件夹的"gzip“或"bzip”csv文件，并获得'h2o‘来导入它们？根据这个链接()，h2o

浏览 1提问于2015-02-07得票数 1

1回答

H2O Flow: H2O flow UI如何区别对待数据类型

、

具体来说，与“int's”和“numerical”类型相比，H2O对待enum和string数据类型的方式有什么不同？在将数据上传到h2o Flow UI时，我可以选择将某些数据类型(如enum)转换为'numerical.‘’。

浏览 20提问于2017-07-11得票数 0

回答已采纳

1回答

如何将h2o模型导出为MOJO从scala中的汽水中导出，以便由EasyPredictModelWrapper加载

、、

我的目标是导出一个使用scala进行星火培训的h2o模型(使用闪闪发光的水)，这样我就可以在没有Spark的应用程序中导入它。因此： val_distribution = DistributionFamily.multinom

浏览 1提问于2018-03-27得票数 1

1回答

h2o GBM:叶预测

、、

我在h2o中对GBM执行网格搜索，以获得具有连续预测器的连续结果。我使用交叉验证进行训练，然后在测试集上进行预测。我使用的是函数.predict_leaf_node_assignment： best_gbm.predict_leaf_node_assignment(test_frame_h2o) ( best_gbm编辑:如本页所述，尝试下载python，以便查看不同的树。在“步骤2:编译并运行MOJO”中，该步骤的第2部分仅在R中给出：“通过创建一个名为main.java的新文件(例如

浏览 0提问于2018-02-06得票数 1

回答已采纳

2回答

改进多节点集群上的h2o DRF运行时

、、

我目前正在运行h2o的DRF算法，一个3节点的EC2集群( h2o服务器跨越所有3个节点)，我的数据集有1m行和41列(40个预测器和1个响应)。我使用R绑定来控制集群，RF调用如下所示 y=y, stopping_rounds=3, s

浏览 0提问于2017-08-03得票数 1

回答已采纳

2回答

是否在R中并行执行GBM？

、、、

我在R中使用gbm库，我想使用我所有的CPU来适应一个模型。 offset = NULL, misc = NULL,...

浏览 4提问于2015-11-20得票数 3

回答已采纳

1回答

H2O如何比R或SAS更快？

、、、、

我试图理解抽象的细节，解释h2o是如何比R和SAS更快的数据科学计算。

浏览 0提问于2015-08-24得票数 3

回答已采纳

1回答

R H20 -分层抽样和非I.D.交叉验证。行

、、

我正在使用H2O来分析数据集，但我不知道如何正确地对数据集执行交叉验证。我有一个不平衡的数据集，所以我希望执行分层交叉验证(如果输出变量用于平衡每个分区上的组)。然而，最重要的是，我还有一个问题，就是我的许多行都是重复的(一种实现权重而不实际拥有权重的方法)。除了这个问题的来源之外，我以前也看到过，在某些情况下，如果某些行必须保持在一起，则可以进行交叉验证。如果没有H2O解决方案，我如何先验地计算折叠并在H2O上使用它？

浏览 2提问于2019-01-02得票数 0

回答已采纳

1回答

H2o MOJO实现R问题？

、、

在实现了运行在本地安装上的MOJO预测之后，我们将代码迁移到Centos 7，现在代码出现了问题，尽管本地窗口和centos之间唯一的真正区别是java版本。代码如下。集群版本:3.16.0.2R版本： R版本3.4.3 (2017-11-30)本地- Windows 7 64位java版本"1.8.0_151“Java(TM) SE运行时环境(build 1.8.0_151-b12) Java HotSpot(TM) 64位服务器VM (build 25.151-b12，混合模式) H2O集群版本: 3.16.

浏览 0提问于2018-04-11得票数 0

2回答

如何使用h2o.predict预测时间序列的未来值

、、

我正在阅读“使用R进行动手时间序列分析”这本书，并且我被困在使用机器学习h2o包的示例中。我不知道如何使用h2o.predict函数。在本例中，它需要newdata参数，在本例中是测试数据。如果我只是忽略newdata参数，我会得到:缺少newdata参数的预测还没有实现。library(h2o) test_h <- as.h2o(test_df)ntrees = 50

浏览 0提问于2019-06-19得票数 2

1回答

将自定义推送行迁移到Eureka 4.1

我很难将自定义行从Eureka的早期版本(大约3.0)迁移到Eureka 4.1。自定义行是自定义推送行，因此标签可以有多行，因此被推送的视图控制器可以有一个自定义节头。可能有更好的方法来实现这一点，而不是有一个自定义行，所以这是一个可能的解决方案，但我不确定这是否可能。open class _StackedPushRow: SelectorRow<Stack

浏览 2提问于2018-03-27得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R h2o:如何为GBM实现自定义stopping_metric

相关·内容

R h2o:如何为GBM实现自定义stopping_metric

H20:如何在文本数据上使用梯度增强？

保持常数列h2o

R和python中的h2o包

H2O中的自定义损失函数

我应该使用EC2虚拟机中的哪些参数来优化H2O的XGBoost性能？

H2O R api:从网格搜索中检索最优模型

用于r中回归的r中h2o集成实现的代码

Python/H2o :绘制树/从H2ORandomForestEstimator模型中提取规则

使用r将压缩csv导入“h2o”

H2O Flow: H2O flow UI如何区别对待数据类型

如何将h2o模型导出为MOJO从scala中的汽水中导出，以便由EasyPredictModelWrapper加载

h2o GBM:叶预测

改进多节点集群上的h2o DRF运行时

是否在R中并行执行GBM？

H2O如何比R或SAS更快？

R H20 -分层抽样和非I.D.交叉验证。行

H2o MOJO实现R问题？

如何使用h2o.predict预测时间序列的未来值

将自定义推送行迁移到Eureka 4.1

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐