腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4062)
视频
沙龙
0
回答
Tensorflow
:
使用
SMOTE
进行
过
采样
会
产生
高度
倾斜
的
结果
我有一个2类(1 & 0)
的
不平衡数据集。1
的
可能性大约是0
的
6倍。因此,我
使用
SMOTE
通过过
采样
来平衡数据集。
使用
SMOTE
会给出一个非常扭曲
的
结果
。output of test with all labels = 1当我没有对数据集
进行
<em
浏览 0
提问于2017-06-10
得票数 0
2
回答
用
smote
和OSS解决多类不平衡分类问题
、
、
我试图解决一个多类不平衡
的
分类问题。为此,我
使用
SMOTE
表示
过
采样
,而OSS用于
过
采样
.但我有一个疑问,因为我正在研究多类,所以我必须把它转换成二进制分类。所以我们可以用OVA/OAA来转换它。那么,如何
使用
OVA/OAA同时对同一数据集
进行
过
采样
和欠
采样
?
浏览 0
提问于2019-01-28
得票数 2
1
回答
如何在嵌入之后或之前执行
过
采样
?
、
、
我在here
的
工作(句子分类
的
卷积神经网络)
的
tensorflow
link中遇到了丹尼·布里茨
的
实现,我想对每个句子
的
嵌入向量执行
SMOTE
(
过
采样
),不确定如何获得嵌入,或者是否可以在嵌入之前
进行
过
采样
,以下是丹尼
的
嵌入部分: with tf.device('/cpu:0'), tf.name_scope("e
浏览 34
提问于2019-04-08
得票数 0
回答已采纳
3
回答
Smote
无法
进行
过
采样
我刚刚
使用
DMwR包中包含
的
Smote
在我
的
数据集中
进行
了
过
采样
。newData <-
SMOTE
(Score ~ ., data, k=3, perc.over = 400,perc.under=150) 现在,分布是60对72。然而,当我显示'newData‘数据集时,我发现
浏览 5
提问于2014-06-08
得票数 2
3
回答
表演后
的
训练/测试分裂
、
、
、
我正在处理一个
高度
不平衡
的
数据集,所以我
使用
SMOTE
重
采样
它。有人有类似的经验吗?信息真
浏览 0
提问于2016-12-09
得票数 18
回答已采纳
1
回答
较少是(6%)和较多(94%)
的
数据集。所有的分类算法(ANN,C4,CART)在SPSS中都能预测出测试集中
的
所有值为No。我做什么好?
、
、
、
、
较少是(6%)和较多(94%)
的
数据集。所有的分类算法(ANN,C4,CART)在SPSS中都能预测出测试集中
的
所有值为No。我做什么好? 数据大约有2500行和85列。
浏览 0
提问于2016-08-06
得票数 0
回答已采纳
1
回答
not NC无助于对我
的
混合连续/分类数据集
进行
过
采样
。
、
、
当我
使用
SMOTE
对四类分类问题中
的
三类
进行
过
采样
时,针对少数类
的
Prec、Recall和F1度量仍然很低(~3%)。我
的
数据集中有32个分类变量和30个连续变量。所有的分类变量已被转换为二进制列
使用
一热编码。此外,在
进行
过
采样
处理之前,我将
使用
Iterativeimputer计算所有缺失
的
值。关于分类器,我
使用
的</e
浏览 0
提问于2019-08-09
得票数 0
1
回答
平衡XGboost仍然倾向于多数类
、
、
、
对于多类分类,我有不平衡
的
数据集,我尝试在XGboost中
使用
类权重选项,而分类器仍然倾向于支持大多数类。我不确定我是否需要调整其他
的
东西,或者我应该如何处理这个问题。如果阿尔戈预测
的
地方到处都是,我仍然能理解,但不确定为什么它仍然偏向于多数阶级。有什么指示吗? 更新:我
的
意思是大部分
的
预测仍然是针对主修班
的
,在测试和训练中,这个比例大约是30%。
浏览 0
提问于2019-03-11
得票数 2
1
回答
过
采样
和
过
采样
与over_sampling.
SMOTE
的
区别?
、
、
、
、
这个问题有点偏执,比如在谷歌,搜索
结果
会被音频和傅里叶变换等混合在一起。 从imblearn.over_sampling进口sm =
SMOTE
(random_state=12,ratio = 1.0) x_train_res,y_train_re
浏览 1
提问于2018-01-26
得票数 0
回答已采纳
1
回答
随机森林模型
的
训练误差小于测试误差
、
、
我一直在研究机器学习模型,我很困惑该选择哪种模型,或者是否有其他我应该尝试
的
技术。我正在
使用
随机森林来预测
使用
高度
不平衡
的
数据集
进行
转换
的
倾向。目标变量
的
类平衡如下所示。UpSampling,然后
使用
欠
采样
。下面是我用于上
采样
和欠
采样
的
代码 train_initial, test = new_data.randomSplit([0.7, 0.3], seed =
浏览 3
提问于2018-11-22
得票数 1
1
回答
使用
SMOTE
对二进制类
进行
过
采样
;为什么它返回0到1之间
的
随机浮点值?
、
、
我正在
使用
SMOTE
对包含值0和1
的
二进制类TARGET_FRAUD
进行
重
采样
。0有大约900条记录,而1只有大约100条记录。我想对1类
进行
过
采样
,使其达到800左右。#fix imbalanced data sns.countplot('T
浏览 41
提问于2019-09-27
得票数 0
2
回答
不平衡分类:
过
采样
与缩放特征
的
顺序?
、
、
当
使用
不平衡
的
数据集(例如,欺诈检测)执行分类(例如,逻辑回归)时,是最好在过度
采样
少数类之前对特征
进行
缩放/zscore/标准化,还是在缩放特征之前平衡类?其次,这些步骤
的
顺序是否
会
影响最终如何解释特性(当
使用
所有数据scaled+balanced来训练最终模型时)?下面是一个例子:
使用
所有培训(不平衡)数据计算平均值/std;
使用
这些计算来缩
浏览 0
提问于2018-01-21
得票数 7
1
回答
过量取样
的
允许限度是多少?
、
、
、
、
是否有理由用16个样本对类
进行
过度抽样,使其有435个样本?还是用435个样本对这类学生
进行
低
采样
比较好?如果是的话,在
进行
了不充分
的
抽样后,应该有多少个样本?
浏览 0
提问于2018-02-08
得票数 3
回答已采纳
3
回答
在Auto-Sklearn中处理多类分类
的
不平衡数据集
的
最佳方法
、
、
、
我正在
使用
Auto-Sklearn,并且有一个包含42个严重不平衡
的
类
的
数据集。处理这种不平衡
的
最好方法是什么?据我所知,在机器学习中存在两种处理不平衡数据
的
方法。要么
使用
重
采样
机制,如
过
采样
或欠
采样
(或两者
的
组合),要么在算法级别上通过选择需要深入了解Auto-Sklearn中
使用
的
算法
的
归纳偏差来解决它。我不太确定如何处理这个问题。有没有可能
浏览 2
提问于2020-02-21
得票数 2
4
回答
SMOTE
初始化预期n_neighbors <= n_samples,但n_samples < n_neighbors
、
、
、
、
但是,我初始化了imblearn
的
类(以执行
过
采样
).[IN]
smote
_pipeline = make_pipeline_imb(
SMOTE
(), classifier(random_state=42))
smote
_prediction =
smote
_model.predict(X_tes
浏览 1
提问于2018-03-20
得票数 14
回答已采纳
2
回答
如何在机器学习中对不平衡数据建模?
、
、
我
使用
的
数据集具有
高度
不平衡
的
数据(Y=5%和N=95%),该数据集具有3000条唯一记录。为了选择特征,我
使用
了信息增益。然后应用随机森林,百分比分割为66。分类正确
的
实例96.1698 %分类错误
的
实例3.8302 %A-b <--分类为26 28 |b=Y 此外,我已经尝试了
SMOTE
过滤器,但这并没有太多
的
改变(得到非常相似的
结果
)。我将
SMOT
浏览 2
提问于2017-11-21
得票数 1
1
回答
将过
采样
和cross_validation函数一起
使用
的
方法是什么?
、
、
、
、
我正在尝试在分类问题中同时
使用
cross_validate函数和
SMOTE
函数,我想知道如何正确
使用
它。这是我用来在机器学习分类算法中调用cross_validation
的
简单函数: # trainning, scoring = statistic) 我访问了来搜索是否可以在调用cross_validate函数之前确定训练数据集和测试数据集,而不是发送完整
的
浏览 3
提问于2019-08-02
得票数 1
1
回答
SMOTE
技术不过度
采样
图像数据集
、
、
、
我
使用
tensorflow
flow.from目录函数加载图像,并
使用
smote
函数
进行
重
采样
。batch_size = batch_size, #,color_mode='grayscale'
smote
=
SMOTE
() X_sm, y_sm =
smote
.fit_resamp
浏览 2
提问于2021-07-12
得票数 1
回答已采纳
3
回答
在数据集上应用随机
过
采样
的
时间
、
、
、
、
我翻阅了笔记本
的
乳腺癌- EDA,平衡和ML。在这个笔记本中,Random Oversampling已经实现。然而,当该人
进行
过度抽样时,他会在整个数据集上
进行
。我知道
过
采样
只能应用于训练数据集。在我
的
例子中,在将数据分割成训练和测试集之后,我对训练数据
进行
了过度
采样
。精确性,以及我所得到
的
回忆都不如Kaggle笔记本好。Kaggle
结果
precision recall f1-score sup
浏览 0
提问于2022-09-05
得票数 4
2
回答
如何稳定机器学习模型?
、
、
、
、
我有一个训练模型
的
数据。此外,我还有另一个数据来测试每周模型
的
性能。然而,该模型似乎并不稳定。训练分数和每周测试分数之间存在一些差异。另一方面,这是一个欺诈问题,我
使用
的
是XGBoosting方法。我可以
使用
不同
的
算法和参数。
浏览 26
提问于2020-06-10
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
处理不平衡数据的过采样技术对比总结
样本不平衡数据集防坑骗指南
过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比
当训练样本不平衡时还怎么学习
机器学习之非均衡数据处理
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券