腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
python
中
MLP
分类
器
中
的
不平衡
数据
集
、
、
、
我正在处理
不平衡
的
数据
集
,我试图建立一个
使用
MLP
分类
器
的
预测模型。不幸
的
是,该算法将所有观察值从测试
集
分类
到"1“类,因此
分类
报告
中
的
f1评分和回忆值为0。有人知道怎么处理吗?
浏览 0
提问于2017-06-18
得票数 8
回答已采纳
0
回答
python
中
使用
MLP
分类
器
的
不平衡
数据
集
、
、
我正在处理
不平衡
的
数据
集
,并尝试
使用
MLP
分类
器
建立预测模型。不幸
的
是,该算法将从测试
集
到类"1“
的
所有观察
分类
,因此
分类
报告
中
的
f1分数和召回值为0。有谁知道怎么处理它吗?
浏览 18
提问于2017-06-18
得票数 3
2
回答
当存在
数据
不平衡
时,拆分
数据
以测试训练
数据
、
我有一个
不平衡
的
数据
集
,它有两个
分类
值。一个有大约500个特定类别的值,另一个只有一个
数据
点和另一个class.Now,我想将这些
数据
分成80-20比率
的
测试序列。但由于这是
不平衡
的
,我希望第二类出现在测试和训练
数据
中
。我尝试
使用
sklearn
中
的
test-train-split,但它没有给出在它们中都存在
的
第
浏览 1
提问于2018-05-28
得票数 0
1
回答
向下采样
数据
集
以创建神经模型
的
平衡
数据
集
、
、
、
我有一个10k实例和4个类
的
分类
数据
集
,它是
不平衡
的
。其中7000个属于一级,2000个属于第二类,800个属于三级,其余实例属于四级。我有一个基于
MLP
的
神经网络。(我甚至可以进一步降低前3个类
的
样本,直到我从每个类
中
得到200个实例,但我不想将
数据
集
的
大小减少那么多)。我
的
问题是:如果我为N个时代训练我
的
MLP</e
浏览 0
提问于2018-09-26
得票数 -1
2
回答
不平衡
、半监督、稀疏问题
的
一般策略
、
、
我正在寻求一些关于从哪里开始这个问题
的
一般性建议。有350个稀疏(低正整数)特征。我有2000个阳性,1000个负数和无限个未标记
数据
,其中未标记
数据
中
估计
的
真实阳性率为1%(但这还不确定)。目的是预测一个例子为正
的
概率。如果你有更多
的
时间呢?
浏览 0
提问于2016-12-28
得票数 5
1
回答
有没有办法使样品平衡?
、
、
、
我有一个由machines.The分解
的
属性组成
的
数据
集
,目标变量是机器状态,由0和1填充。0和1
的
分布如下所示 1 - 225我说的人工排行是什么意思?填充一些随机
数据
,目标变量为1
浏览 0
提问于2018-11-08
得票数 0
回答已采纳
1
回答
如何从PySpark MultilayerPerceptronClassifier获得
分类
概率?
、
、
、
、
我在
python
中
使用
Spark2.0.1,我
的
数据
集
在DataFrame
中
,所以我
使用
ML (而不是MLLib)库来进行机器学习。我有一个多层感知
器
分类
器
,我只有两个标签。我
的
问题是,是否有可能不仅得到标签,而且(或仅仅)得到该标签
的
概率?不只是0或1对每个输入,而是像0.95为0和0.05为1。如果这是不可能
的
MLP
,但其他
分类</e
浏览 3
提问于2017-04-26
得票数 10
回答已采纳
2
回答
不平衡
和有序
分类
的
评价度量
、
、
、
我正在寻找一个ML评估指标,它可以很好地处理
不平衡
和有序
的
多类
数据
集
: 假设你想预测一种疾病
的
严重程度,它有4级严重程度,其中1级是轻微
的
,4级代表更糟
的
结果。现在,这个
数据
集
实际上将使绝大多数患者处于轻度区(1或2级),而在3和4级(
不平衡
/
不平衡
的
数据
集
)
中
则更少。现在,在示例
中
,将4级预测为1级
浏览 0
提问于2022-02-03
得票数 1
1
回答
将多类简化为二进制
分类
问题
、
、
、
、
我正在用著名
的
做一个实验,但没有显示出好
的
结果(大约58%)。 这个
数据
集
有5个序数类,“心脏病
的
存在程度”从0到4,其中0表示没有心脏病,4表示心脏问题
的
高度存在。问题是,这个
数据
集
非常
不平衡
,
分类
为0
的
对象比其他对象多得多。将此
数据
集
提供给
MLP
的
准确率为58%,这是非常低
的
。因此,我希望将从1-4
浏览 1
提问于2019-07-22
得票数 0
回答已采纳
1
回答
分类
器
的
选择
对于我所读到
的
5x2cvt测试是。我目前正在用一个
不平衡
的
数据
集
做一些实验,我用SCUT进行平衡,并训练了一组不同
的
分类
器
。问题是有三个不同类可供选择
的
多类。:
MLP
和D
浏览 0
提问于2019-08-02
得票数 2
1
回答
召回值与查准率-召回曲线
的
关系
、
、
在精确回忆曲线下,我迷失在召回值与面积之间
的
关系
中
。我
使用
二进制
分类
器
对
不平衡
的
数据
集
进行
分类
。我通过默认
的
sklearn
python
包记录了查准率-召回曲线下
的
召回值和区域。在我
的
例子
中
,1类是罕见
的
类,0类是另一类。 我训练了两个模特。第二个模型我
使用
过采样方法来平衡训练
数据</
浏览 1
提问于2021-02-16
得票数 0
3
回答
在多类文本
分类
中
,是否需要缓解类
的
不平衡
问题?
、
、
、
我正在
使用
python
中
的
BERT执行多类文本
分类
。用于重新培训我
的
模型
的
数据
集
非常
不平衡
。现在,我非常清楚
的
是,班级
不平衡
导致了一个糟糕
的
模式,在模型培训之前,我们应该平衡低采样、过抽样等所设置
的
培训。 然而,培训
集
的
分布应与生产
数据
的
分布相似,这也是事实。现在,如果我肯定
浏览 5
提问于2022-07-14
得票数 2
1
回答
改进小型
不平衡
数据
集
的
机器学习性能
、
、
我是机器学习
的
研究员。在我
的
项目中,我一直在将ML应用于一个小
的
不平衡
数据
,其中包括8个特性和297个实例,其中44个为正实例,253个为负实例。首先,我
使用
分层抽样将整个
数据
集
分成一个训练
集
(80%)和一个测试
集
(20%)。其次,将训练
集
过度采样为均衡训练
集
,采用随机抽样替换或平滑,并应用信息增益特征选择来减少均衡训练
集
的
特征。再次,对训练<e
浏览 0
提问于2022-01-02
得票数 1
2
回答
如何提高
分类
器
的
准确性?
、
、
、
、
我正在
使用
OpenCV letter_recog.cpp示例在随机树和其他
分类
器
上进行实验。这个例子有六个
分类
器
的
实现-随机树,Bayes,
MLP
,kNN,朴素贝叶斯和支持向量机。
使用
了20000个实例和16个特征
的
UCI字母识别
数据
集
,我将该
数据
集
分成两部分进行训练和测试。我有支持向量机
的
经验,所以我很快将它
的
识别错误设置为3
浏览 0
提问于2014-07-16
得票数 22
回答已采纳
1
回答
支持向量机和
MLP
分类
器
的
选择
、
、
、
、
我必须训练一个
分类
器
,它能够识别6种可能
的
输入样本。我也有一个成本矩阵来评估
分类
器
的
性能,有和不考虑拒绝选项。到目前为止,
使用
交叉验证(请假一出),我将
数据
集
分成训练
集
和验证
集
,这样我就可以测量
分类
器
的
性能。我已经从精度
的
角度得出了这些结果 MultiLayer感知
器
:57%,69%没有拒绝选项,48%,2
浏览 7
提问于2014-09-06
得票数 0
1
回答
如何为
不平衡
的
数据
设置多类
分类
中
的
权重?
、
、
从这个职位
中
,我知道您可以为
不平衡
的
数据
集
设置scale_pos_weight。然而,对于
不平衡
数据
集中
的
多
分类
问题,我不太明白如何在dmatrix
中
设置权重参数。如何对多
分类
问题中
的
不平衡
数据
集
使用
XGBoost?
浏览 0
提问于2017-08-22
得票数 4
1
回答
检测类
的
sigmoid输出返回不正确
的
性能。
、
、
、
我
的
问题总结:我有一个检测(二进制
分类
,
不平衡
问题)。我用乙状结肠
分类
样本。更长
的
解释:在我
的
实验
中
,我有关于个人的人口统计
数据
,我必须预测他们是否购买了产品。我
使用
PCA将初始特征减少到4个,
数据
存储在csv文件
中
(第一列有类标签'0‘和'1')。因此,我
的
第一个想法是
使用
带有单个乙状结肠层
的
MLP</em
浏览 2
提问于2015-04-11
得票数 0
2
回答
多类
分类
的
评价方法
、
、
、
、
我正在寻找
的
单一数字评估方法,可以用于考虑
不平衡
的
数据
集
的
多类
分类
任务。例如,由二进制
分类
器
定义
的
ROC-AUC是单个数字,并考虑了
不平衡
的
数据
集
.另一方面,精度是单个数字,定义为多类
分类
器
,不考虑
不平衡
的
数据
集
。最后,定义了多类
的
浏览 0
提问于2018-05-05
得票数 3
回答已采纳
2
回答
如何
使用
Python
对图像
数据
集
进行过采样?
、
、
、
、
我正在研究一个具有
不平衡
图像
数据
集
(不同类)
的
多类
分类
问题。我尝试过imblearn库,但它不适用于图像
数据
集
。 我有一个三类
的
图像
数据
集
,即A,B,C。A有1000个
数据
,B有300个,C有100个。我想对B类和C类进行过采样,以避免
数据
不平衡
。请让我知道如何
使用
python
过采样图像
数据
集
浏览 2
提问于2018-01-30
得票数 3
1
回答
Python
中
不平衡
类
的
欠采样
、
、
我目前有超过80万个
数据
点
的
不平衡
数据
集
。这种
不平衡
是严重
的
,因为这两个类
中
只有3719个
数据
点。在
使用
Python
中
的
NearMiss算法对
数据
进行欠采样并应用随机森林
分类
器
时,我可以获得以下结果: 特异性: 83.4%然而,当
浏览 10
提问于2019-11-14
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python中的不平衡数据遍历与处理技巧
在Python中构建可部署的ML分类器
Python教程(27)——如何使用Python中的上下文管理器
使用Python更改数据框中的指定列
二分类、多分类、回归任务,一个项目get竞赛必备模型
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券