腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(553)
视频
沙龙
1
回答
带有
mlr3
::
autoplot
()
的
Roc
曲线
,
用于
基准
测试
和
“
保持
”
重
采样
、
我正在使用
mlr3
软件包,我想为不同
的
模型绘制
ROC
曲线
。如果我使用交叉验证,就像documentation中解释
的
那样,它工作得很好,但是如果我使用"holdout“进行
重
采样
,那么我会得到一个错误
的
Error: Invalid show_cb.代码如下: library("
mlr3
")library("mlr3viz&qu
浏览 114
提问于2020-10-19
得票数 3
回答已采纳
1
回答
关于如何处理不平衡数据
的
主要选项
、
、
、
、
对于每一个折叠分别在“训练”
和
“
测试
”集上应用一种
重
采样
技术(上
采样
、下
采样
或两者
的
组合)。使用“替代”度量来评估:例如,精确召回
曲线
的
AUC或类似F分数(精确
和
回忆
的
调和平均值)之类
的<
浏览 0
提问于2020-06-07
得票数 2
1
回答
R:尝试用
roc
引导时出错“矩阵上不正确
的
下标数”。
、
、
、
我正在使用Rstudio,并尝试使用来自包
roc
的
pROC
和
boot进行引导。我正在遵循上
的
代码。该链接中
的
代码使用了boot
的
另一个函数,它工作得很好。但是当我尝试
roc
时,它会产生错误。下面是我
的
代码:(在输出中,我正在打印样本
的
尺寸,以查看重
采样
完成了多少次。在这里,R=5,
采样
做了6次,然后出现错误)。如果我用其他函数(如
roc
)代替sum,那么它工作得很完美(它没有任何
浏览 3
提问于2016-06-28
得票数 3
回答已采纳
1
回答
mlr3
:在优化模型(即AutoTuner对象)中使用benchmark()
、
、
我想比较几种机器学习算法
的
性能(例如,rpart、xgb、.
的
决策树)。包括他们使用
mlr3
进行
的
超参数调整。换句话说,我想比较已经调优
的
不同算法
的
实例,而不是算法
的
默认超参数值。
mlr3
提供自动调谐器对象来执行嵌套
重
采样
和
超参数调优.还有一个
基准
()函数来对几个学习者进行比较。benchmark()函数依次使用benchmark_grid()来设置
基准
测
浏览 10
提问于2021-08-17
得票数 0
回答已采纳
1
回答
mlr3
、
基准
测试
和
嵌套
重
采样
:如何从
基准
对象中提取调优模型以计算特性重要性
、
、
、
、
我正在使用
mlr3
中
的
benchmark()函数来比较几种ML算法。其中之一是
带有
超参数调优
的
XGB。因此,我有一个外部
重
采样
来评估总体性能(
保持
样本)
和
内部
重
采样
用于
超参数调整(5倍交叉验证)。除了对所有ML算法
的
准确性进行估计外,我还希望看到调优
的
XGB特性
的
重要性。为此,我必须访问调优模型(在
基准
测试
对象
浏览 5
提问于2021-11-03
得票数 0
回答已采纳
3
回答
基于插入符号中
的
训练数据
的
ROC
曲线
、
、
使用R包插入符号,如何根据train()函数
的
交叉验证结果生成
ROC
曲线
?., data=Sonar, trControl=ctrl)注意:如果
用于
采样
的
方法是LOOCV,那
浏览 1
提问于2015-06-30
得票数 30
回答已采纳
1
回答
基准
测试
多个AutoTuning实例
、
、
我一直试图使用
mlr3
为xgboost做一些超参数调优。我想比较三种不同
的
型号: hyperparameterxgboost只对α进行调整,而lambda hyperparametersxgboost则调整到alpha、lambda
和
the深度hyperparameters在阅读了
mlr3
的
书之后,我认为使用AutoTuner进行嵌套
重
采样
和
基准
测试
是最好
的
方法。由于某种原因,在运行
基准</
浏览 1
提问于2021-03-24
得票数 2
回答已采纳
2
回答
用C++将
曲线
重
采样
成偶数段
、
、
使用C++将
曲线
重归为偶数长度段
的
最佳方法是什么?我所拥有的是一组点,它代表一条2d
曲线
。在下面的例子中,我有一个
带有
x
和
y分量
的
点结构
和
一个
带有
测试
位置
的
点向量。每一对点代表
曲线
上
的
一段。
重
采样
曲线
的
例子是下面的图像。红圈是原来
的
位置,绿圈是
重
采样
后<em
浏览 1
提问于2017-05-01
得票数 7
回答已采纳
1
回答
绘制自举插入符号模型
的
ROC
曲线
、
我有一个类似如下
的
模型:data(Sonar) set.seed(998) Class ~ ., method = "xgbTree", metric = "
ROC
"如何绘制此模型
的
ROC
曲线
?据我所知,必须保存概
浏览 1
提问于2018-01-27
得票数 5
回答已采纳
2
回答
如何在使用并行化进行
mlr3
重
采样
时获得可重复
的
结果
、
、
、
最近,我正在学习如何使用
带有
并行化
的
mlr3
包。作为
mlr3
图书()
和
教程()
的
介绍,
mlr3
使用未来
的
后端进行并行化。我使用以下代码运行一个简单
的
测试
:library(future)library(
mlr3
) # set the但是,我已经发现了许多关于未来包
的
教程,获得未来结果
的<
浏览 10
提问于2021-02-17
得票数 0
回答已采纳
1
回答
在每个调优评估中
重
采样
是否重新运行?
、
、
、
函数(X)
和
( 0 (is.infinite(X) %>%
和
1但我
的
思维过程可能是错
浏览 1
提问于2021-08-11
得票数 2
1
回答
了解随机森林博客
的
几个问题
、
、
、
、
我试图用随机森林
和
logistic回归模型来理解关于敏感性
和
特异性之间
的
权衡
的
好博客。我有几个问题: 1)博客在ranger包中使用了10倍
的
交叉验证(参见模型mod_rf),并将度量设置为
ROC
。3) caret包在R中允许过
采样
来调整数据
的
不平衡。他们尝试logistic回归(见sim_glm模型)进行过抽样,并指定repeats = 2
重
复10倍交叉验证2次。它怎麽工作?我不太清楚。在每一次交叉验证之前,创造出男女比例为50-5
浏览 0
提问于2018-12-03
得票数 1
2
回答
不平衡数据集评价指标的解释
、
、
我目前正在处理一个严重不平衡
的
数据集
的
分类问题。更具体地说,它是一个包含大约290 k行数据
的
欺诈检测数据集,0类(非欺诈)
的
分布率为99.8%,1类(欺诈)
的
分布率为0.17%。我一直使用XGBoost,随机森林
和
LightBGM作为我
的
预测模型。我还尝试以不同
的
方式运行这些模型,方法是调优类权重并重新对数据集进行
重
采样
,以使其达到平衡
的
规模。此外,我使用F1评分、
ROC
-AUC
浏览 0
提问于2023-04-04
得票数 0
1
回答
K折交叉验证
ROC
曲线
的
绘制
、
、
、
、
我正在处理一个不平衡
的
数据集。在应用ML模型之前,我将数据集分成
测试
集
和
训练集,然后应用SMOTE算法来平衡数据集。我想应用交叉验证,绘制每个褶皱
的
ROC
曲线
,显示每个褶皱
的
AUC,并在图中显示AUC
的
平均值。我将
重
采样
的
训练集变量命名为X_train_res
和
y_train_res,代码如下:classifie
浏览 6
提问于2019-08-29
得票数 2
回答已采纳
2
回答
不平衡分类数据
的
精度度量
、
、
、
、
但我没有足够
的
声誉,也就是50,可以对这些帖子发表评论。因此,我正在创造这个。 谢谢!
浏览 6
提问于2022-06-22
得票数 1
1
回答
如何在nnet中使用大小
和
衰减
、
我对神经网络世界还很陌生,所以我请求您
的
理解。我正在生成一些
测试
,因此我有一个关于参数size
和
decay
的
问题。我使用caret包
和
nnet方法。首先,这是使用插入符号使用nnet方法
的
最好方法吗?),但我不明白如何在实践中使用它们。有人能帮上忙吗?
浏览 1
提问于2017-02-23
得票数 9
回答已采纳
3
回答
为什么平衡
测试
数据集可以提高查全率
曲线
?
、
、
我有一个相当不平衡
的
数据为违约风险信用评分(2:98)。这两种成本都是相当重要
的
,即虚假负数意味着违约造成
的
损失,而假阳性则是一种损失
的
收入机会。我试着在不平衡
的
集合上训练一些模型,并尝试过/不抽样
的
方法,以及基于课堂
的
重量平衡。所有这些办法都促成了一个像样
的
ROCAUC。然而,精确召回
曲线
在整体上看上去很糟糕。但如果我要平衡
测试
集,精确召回
曲线
看起来要好得多。这一切为什么要发生?在数据分
浏览 0
提问于2018-10-29
得票数 5
3
回答
随机森林分类器- KFold CV调很深
的
树->过配?
、
、
、
我正在对python中
的
随机森林进行调优,并想知道我
的
模型是否/为什么过于合适。数据集描述如下:50个数字特征,~450标签/热编码特征(后数据缩减)分类度量=AUC或F1 (由于数据不平衡) 我得到
的
结果倾向于建议使用非常深
的
树,即深度18,不限制每次分割
的
样本数=2(默认)。在这种情况下,列车AUC
浏览 0
提问于2018-06-19
得票数 3
1
回答
如果我使用“
保持
”
重
采样
,如何访问列车集
的
度量(例如:“classif.acc”或其他度量)?
、
我正在学习R中
用于
机器学习
的
mlr3
包。我使用“
保持
”
重
采样
将数据分成训练集
和
测试
集,我如何才能获得训练集
的
度量?即使我将"predict_set“指定为"train”,它似乎也只给出了
测试
集
的
度量。> library(
mlr3
)> learner <- lrn(&q
浏览 30
提问于2020-10-22
得票数 1
1
回答
Caret分类阈值
、
、
、
我一直在使用gbm在Rstudio中
的
caret包中查找出现故障
的
概率。 我用Youden
的
J找到了最佳分类
的
阈值,即0.63。我现在如何使用这个阈值?我认为最好
的
方法是在gbm模型中加入caret
的
阈值,以获得更准确
的
预测,然后在训练数据上重新运行模型?目前,它默认为0.5,我找不到一个明显
的
方法来更新阈值。或者,阈值是否仅
用于
将
测试
数据预测分离为正确
的
类?这看起来更直截了当,但是假设概率应该根据
浏览 1
提问于2021-01-22
得票数 8
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Bootstrap方法在Python中绘制带有置信带的ROC曲线
R语言梯度提升机 GBM、支持向量机SVM、正则判别分析RDA模型训练、参数调优化和性能比较可视化分析声纳数据
机器学习中如何处理不平衡数据?
预测模型锦上添花技能:两模型比较的ROC分析
不平衡数据下的机器学习(上)
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券