腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在类
不平衡
模式下使用
h2o
AutoML
我有一个非常
不平衡
的
数据
集
的
用例,我对训练
数据
集进行了欠采样,并尝试在
h2o
中
运行自动机,但它给了我很好
的
AUC值(超过0.99),但aup_pr结果很差(0.09)。是否与
不平衡
问题有关?我使用weight_column选项(http://docs.h2o.ai/
h2o
/latest-stable/h2o-docs/data-science/al
浏览 13
提问于2019-05-02
得票数 0
1
回答
h2o
中
的
不平衡
数据
我在
H2o
中使用高度
不平衡
的
二进制响应变量运行glm模型,我
的
问题是,当设置参数balance_classes为真时,它不起作用,我得到
的
结果与假相同。谢谢
浏览 16
提问于2020-06-25
得票数 1
1
回答
如何用
H2O
AutoML处理类
不平衡
、
、
我使用
H2O
AutoML进行二进制分类,而且类是
不平衡
的
。我在balance_classes = TRUE函数
中
设置了max_after_balance_size = 100和h2o.automl()函数,以对少数类进行过采样。然而,领导者模型
的
“精确召回曲线下面积(AUCPR)”不是很好,~ 0.10。请问,是否有任何技巧(例如,预处理步骤、h2o.automl()
中
的
参数设置)来处理
H2O
AutoML
的
类
不平衡</em
浏览 11
提问于2022-11-18
得票数 0
2
回答
交叉验证
中
的
平衡类
、
、
、
、
我想用
H2O
建立一个基本
的
模型。我
的
数据
集是
不平衡
的
,所以我使用balance_classes参数。对于网格搜索(参数调整),我想使用5折交叉验证。我想知道在这种情况下
H2O
是如何处理类平衡
的
。
浏览 6
提问于2018-02-15
得票数 2
1
回答
R中使用
H2O
的
平衡随机森林
、
、
、
由于我目前正在研究一个高度
不平衡
的
多类分类问题,我正在考虑平衡随机森林()。您是否有使用
H2O
实现平衡随机森林
的
经验?若有,可否请你详述以下问题: 是否有可能改变在
H2O
中
创建引导样本
的
默认过程,以得出平衡子样本(对于随机森林中
的
每次迭代,从少数类中提取一个引导样本。从大多数类
中
随机抽取相同数量
的
案例(通过替换)为每个树增长原始
数据
集?
浏览 16
提问于2018-08-23
得票数 0
1
回答
R H20 -分层抽样和非I.D.交叉验证。行
、
、
我正在使用
H2O
来分析
数据
集,但我不知道如何正确地对
数据
集执行交叉验证。我有一个
不平衡
的
数据
集,所以我希望执行分层交叉验证(如果输出变量用于平衡每个分区上
的
组)。然而,最重要
的
是,我还有一个问题,就是我
的
许多行都是重复
的
(一种实现权重而不实际拥有权重
的
方法)。除了这个问题
的
来源之外,我以前也看到过,在某些情况下,如果某些行必须保持在一起,则可以进行交叉验证。这个接缝是fold_co
浏览 2
提问于2019-01-02
得票数 0
回答已采纳
1
回答
EasyPredictModelWrapper给出错误预测
0.82333,0,276666 labelIndex =1 label = true domainValues = false,true 这个labelIndex表示什么,类概率顺序与域值顺序相同,如果顺序相同,那么这里
的
假概率是
浏览 1
提问于2017-11-03
得票数 0
1
回答
阶级
不平衡
的
H2O
深度学习
、
、
、
我正在使用
H2O
深度学习前馈深度神经网络进行二值分类。我
的
类是高度
不平衡
的
,我想使用以下参数 有谁能给我一个可重复
的
例子,说明如何将这些参数具体化以处理类
不平衡
问题。
浏览 0
提问于2016-08-29
得票数 4
回答已采纳
2
回答
h2o
xgboost
不平衡
数据
的
糟糕性能
、
、
我有一个大约100万行
的
数据
集,具有很高
的
不平衡
(743 / 1072780)。我正在用以下参数在
h2o
中
训练xgboost模型,它看起来太合适了Total 202224 417 0.0025 (505.0/202641.0)我使用
浏览 12
提问于2022-08-19
得票数 -1
1
回答
如何在
H2O
的
Auto ML函数中平衡类?
、
、
有没有人可以告诉我,在使用
H2O
的
Auto ML函数进行分类时,是否可以指定方法来平衡类?
浏览 0
提问于2017-11-24
得票数 3
1
回答
在
H2O
随机林和xgboost中使用权重列
、
、
我正在尝试最大限度地提高二进制分类问题
的
精度(误报
的
成本很高)。
数据
集也非常
不平衡
。运行DRF或XGBOOST模型两次,第二次使用权重列以对抗误报是否有意义?除了这种潜在
的
方法之外,在这些
H2O
算法
中
是否还有其他方法来最大化精度(而不是对数损失)?我还将使用集成(这似乎确实增加了精度)。交叉验证似乎没有帮助。
浏览 15
提问于2017-08-03
得票数 3
1
回答
H2o
问题:分类模型梯度boost和随机Forrest
、
、
、
我正试图预测哥斯达黎加家庭贫困水平
的
预测。在“目标”列中有4个级别,我已经将其转换为因子。但是,我无法查找我
的
AUC或进行网格搜索。我经常遇到这个错误 错误信息: 指定
的
sort_bymean_per_class_accuracy,max_per_class_error,err,total_rows,rmse,准确性,err_count,log损耗,ms
浏览 1
提问于2018-12-06
得票数 0
回答已采纳
1
回答
h2o
gbm
中
多项式模型预测概率
的
比较
、
、
、
、
我建立了一个
h2o
梯度增强分类器模型来预测0、1和2类
的
概率。训练
数据
中
存在严重
的
类
不平衡
(93:5:2)。虽然在混淆矩阵
中
没有正确地预测单个类别1和2(如预期
的
那样),但AUC是适合这些类单独使用
的
。我
的
理解是,得到
的
概率(P0,P1和P2)被校准,并被归纳为1。由于
h2o
中
的
多项式模型本质上是一对
浏览 1
提问于2021-03-25
得票数 0
回答已采纳
1
回答
在选择响应列后无法设置blance_class参数
我从使用表单Web开始使用
H2O
,我试图使用分布式随机森林来拟合模型。当我在构建模型部分中选择分布式随机森林时,我可以看到高级部分下
的
参数:balance_classes。 我
的
决策变量是两个值:0、1和1值
不平衡
(15%)。 我做错什么了吗?
浏览 2
提问于2017-04-19
得票数 1
回答已采纳
1
回答
如何在SQL上运行H2O.ai
H2O.ai
的
同事在一些幻灯片和文档中提到,H2O.ai可以在SQL之上运行。如何将H2O.ai实例连接到Server?到目前为止,我唯一能找到
的
建议看起来相当令人失望: 是否有更优雅
的
方法直接连接到Server?
浏览 1
提问于2016-03-18
得票数 3
回答已采纳
1
回答
如何将稀疏矩阵引入
H2O
?
、
、
我试图在
中
得到一个稀疏矩阵,我想知道这是否可能。假设我们有以下内容:假设我
的
本地
H2O
是localH2O,我似乎不能做以下工作这似乎很符合逻辑,但是假设测试太大,我无法将其转换为
数据
格式,我如何将它加载到
H2O
中
呢?使用稀疏矩阵表示,它仅为500 so左右。 如何将稀疏矩阵加载到
H2O
中
?
浏览 7
提问于2015-09-29
得票数 7
回答已采纳
1
回答
R中使用h2o.glm
的
错误
、
我是R
中
h2o
实现
的
新手,我有这样一个
数据
框架(Df1):1.6966559037L, 78810L, 88619L, 21564L, 我想用
h2o
所以我有下面的代码: library(
h2o
浏览 1
提问于2016-04-23
得票数 0
回答已采纳
1
回答
H2O
在并行上不起作用
、
、
我已经创建了一个DF,并希望将其转换为
H2O
帧。要做到这一点,我需要:h2o.init(nthreads=-1)df<-as.h2o(df) 当我在comand行上执行htop时,我看到4个可用
的
处理器
中
只有一个在工作。
浏览 3
提问于2017-08-22
得票数 0
3
回答
在处理VotingClassifier或网格搜索时,Sklearn
中
的
GradientBoostingClassifier是否有类权重(或替代方法)?
、
我正在为我
的
不平衡
标签
数据
集使用GradientBoostingClassifier。在Sklearn
中
,类权重似乎并不是这个分类器
的
参数。我知道我可以在合适
的
时候使用sample_weight,但在处理VotingClassifier或GridSearch时就不能使用它了。有人能帮帮忙吗?
浏览 3
提问于2016-02-22
得票数 10
1
回答
H2O
性能指标: AUCPR不可用?
、
、
我正在处理一个二进制分类问题,并且我尝试在
H2O
中使用性能指标AUCPR,因为我有一个
不平衡
的
数据
集。谢谢你
的
帮助
浏览 6
提问于2019-07-16
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何处理数据中的“类别不平衡”?
Python中的不平衡数据遍历与处理技巧
机器学习中的数据不平衡解决方案大全
机器学习中如何处理不平衡数据?
处理不平衡数据的技巧总结
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券