Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >低损失和相同预测等级的原因?

低损失和相同预测等级的原因?
EN

Data Science用户
提问于 2018-03-01 10:20:58
回答 1查看 149关注 0票数 0

我正在为二进制分类训练一个cNN。我使用了128批大小,损失正在减少,准确度随着时间的推移而增加。最终精度达到0.99以上,损失小于0.3。但再过几个年代,该模型收敛到了0.6,精度下降了0.5。对模型的检验表明,它总是预测0.5。我用二元交叉熵作为损失函数。对于每一个时代,所有的数据点都会被洗牌。我用的是SGD,学习率是0.01。

我是否以较低的准确率,但相当好的损失值,达到了局部最小值?建议采取什么办法来处理这一问题?此外,为什么有可能有一个低损失函数与一个单一的预测类?

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-03-03 12:57:01

根据你的描述,这可能是一个学习率过高的问题。当发生这种情况时,重量不能接近最小值,损失也不会下降。

因此,我建议将学习率降低到0.001,并使用Adam。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/28481

复制
相关文章
胚胎DNA含量低的原因
Low fetal fraction has been linked to very early gestations, high maternal BMI, maternal medications, smoking and factors which lead to a smaller placenta, such as trisomies 13 and 18 (Kuhlmann-Capek et al. 2019)
用户7625144
2021/01/05
6370
胚胎DNA含量低的原因
在Kubernetes中定义低数据丢失和停机容忍度
定义恢复点目标 (RPO) 和恢复时间目标 (RTO) 容限至关重要,但更重要的是构建一个能够支持您最严格 SLA 的环境。
云云众生s
2024/12/23
1660
视频高清低损压缩命令行实现方案推荐
所以需要转换,压缩,但是不能降低太多的分辨率。 这里我的御用视频编辑师推荐了一款非常轻量级的命令行工具FFmpeg可以做到,下面是FFmpeg的简短介绍: FFmpeg 是一个自由软件,可以运行音频和视频多种格式的录影、转换、流功能,包含了libavcodec——这是一个用于多个项目中音频和视频的解码器库,以及libavformat——一个音频与视频格式转换库。 “FFmpeg”这个单词中的“FF”指的是“Fast Forward”。
生信技能树
2019/05/14
1.8K0
梯度消失和梯度爆炸原因及其解决方案
当我们需要解决一个非常复杂的问题,例如在高分辨率图像中检测数百种类型的对象,我们可能需要训练一个非常深的DNN,可能需要几十层或者上百层,每层包含数百个神经元,通过成千上万个连接进行连接,我们会遇到以下问题:
狼啸风云
2020/09/18
3.1K0
低延迟分块流中的带宽预测
本文整理自Mile High Video 2019上Ali.C.Begen的演讲。Ali目前是Ozyegin大学的计算机科学教授,也是Comcast视频架构,战略和技术小组的技术顾问。此前,他是思科的研发工程师。Ali于2006年获得佐治亚理工学院电气和计算机工程博士学位。迄今为止,他获得了多项学术和行业奖项,并获得了30多项美国专利。
用户1324186
2019/10/10
1.4K0
低延迟分块流中的带宽预测
源目的IP和端口都相同的连接出现的原因
线上遇到了一个比较特殊的连接,它的源目的IP和端口完全相同,复现的场景是:同一个机器上的两个模块A和B通信,A模块会向B模块的监听套接字发起连接请求,B模块重启的时候就很容易出现这样的问题。下图是在线
李海彬
2018/03/22
2.7K0
源目的IP和端口都相同的连接出现的原因
权威数据中心低碳等级评估结果重磅发布
日前,中国互联网大会在京召开,由ODCC(开放数据中心委员会)组织的“绿色低碳数据中心论坛”精彩纷呈,工信部通信发展司政策标准处处长张寰到会致辞,来自中国信通院、全国环境管理标委会、阿里巴巴、数据港、浪潮、中金数据、OPPO、万国数据等业内领先数据中心企业的专家们济济一堂,共话绿色低碳数据中心。本论坛由中国信通院云大所数据中心研究部副主任王月主持。 在我国2030碳达峰、2060碳中和的总体目标和数据中心相关政策文件的指引下,数据中心作为能耗大户,加快绿色低碳发展刻不容缓。ODCC联合业界各方持续开展低碳
云头条
2022/03/18
3790
Python中应用决策树算法预测客户等级
机器学习越来越多地在企业应用,本文跟大家分享一个采用python,应用决策树算法对跨国食品超市顾客等级进行预测的具体案例。
阿黎逸阳
2021/01/11
1.4K0
Python中应用决策树算法预测客户等级
LogBack 日志等级设置无效,原因竟然是因为这个?!
好了,回到正题,今天来讲下最近调试项目的时候发现的一个 Logback 日志级别设置不生效的问题。
andyxh
2021/06/01
4.8K0
LogBack 日志等级设置无效,原因竟然是因为这个?!
训练深度神经网络,使用反向传播算法,产生梯度消失和梯度爆炸问题的原因?
反向传播是神经网络训练的精髓。它是根据上一个迭代获得的误差(即损失)对神经网络的权重进行微调的做法。权重的适当调整可确保较低的误差,从而通过提高模型的泛化能力使其变得可靠。反向传播算法的核心思想和工作原理可分为以下几个方面:
叶庭云
2024/05/25
3360
高效寻找缺失和重复的数字
东哥带你搞定算法~ 作者:labuladong 公众号:labuladong 若已授权白名单也必须保留以上来源信息
labuladong
2021/09/23
6460
程序员:一定提前预防,这11个微服务失败的原因,及时止损!
微服务“很香”,它有许多优势,比如更快的开发、更好的可扩展性、更小的独立团队等等。但是,很多团队却在微服务上举步维艰,没有很好利用其优势。原因到底是什么?
秃顶的Java程序员
2020/04/01
5330
OFC 2025:低插损硅光端面耦合器(旭创/GF/台积电)
收集了OFC 2025上的三篇关于硅光端面耦合器的工作,分别来自旭创/Global Foundries/TSMC,都是采用SiN材料来做的,这是因为SiN实现低插损无需很小的线宽(130nm工艺就绰绰有余),工艺容差大,厚度/位置灵活,并且在CPO等潜在应用中能够承受高功率,以上这几点都是Si材料难以实现的。这几篇文章的结果虽然比不上台积电去年所报道的COUPE,不过也都基本达到了1 dB/facet的水平。
光芯
2025/04/08
1020
OFC 2025:低插损硅光端面耦合器(旭创/GF/台积电)
币圈的盈利止损
在我短短的三个月的虚拟货币投资历史中,已经有两次因为刹不住车而导致赢利巨幅减少的悲惨经历,说起来都是泪,不说了......擦干眼泪,痛定思痛,继续前行。
凌帅出口
2018/08/17
5520
如何破解止损难题
第一篇《币圈的盈利止损》分析了止损的本质是价格进入下降通道,为避免损失扩大而退出,与买入成本无关,并进一步把止损分为盈利止损和亏损止损。
凌帅出口
2018/08/17
4240
资损防控体系介绍
随着有赞支付体量的增大,资产部门承担的资金管理,风险把控的责任也越大。我们一方面要小步快跑,快速支撑业务,又要稳住底盘,守好底线。支付业务底线就是守护用户的每一分钱,不能有资金损失。在我们搭建这套体系前,有赞支付资金类的线上监控是个盲区,缺乏自我发现的能力。业务成功了,但内部对用户的资金操作可能是错误的,导致资损。而且故障发生到发现的时间很长,且大部分是用户上报,导致故障的影响面扩大,用户的信任度降低。
有赞coder
2020/08/25
3K0
资损防控体系介绍
防损层模式
在不共享相同语义的不同子系统之间实施外观或适配器层。 此层转换一个子系统向另一个子系统发出的请求。 使用此模式可确保应用程序的设计不受限于对外部子系统的依赖。 此模式最先由 Eric Evans 在 Domain-Driven Design(域驱动的设计)中描述。
只喝牛奶的杀手
2019/08/26
4540
防损层模式
梯度消失和梯度爆炸
yhat=wLwL−1wL−2...w3w2w1xy^{hat}=w^{L}w^{L-1}w^{L-2}...w^{3}w^{2}w^{1}xyhat=wLwL−1wL−2...w3w2w1x
Steve Wang
2019/05/26
7720
[WCF安全系列]消息的保护等级[上篇]
到目前为止,对于WCF安全传输的三个方面,我们已经对认证进行了详细的介绍,现在我们来关注另外两个话题:消息的一致性和机密性,两者又统称为消息保护(Message Protection)。消息的安全等级指的是对整个消息或者消息的某个部分事实安全保护采用的等级。按照级别的由低到高,WCF支持如下三种不同的安全等级。在WCF的应用编程接口中,消息保护级别通过如下定义的ProtectionLevel枚举表示。 None:不采用任何措施来保护消息的一致性和机密性; Sign:通过对整个消息或者消息的某个部分进行数字
蒋金楠
2018/02/07
9040
[WCF安全系列]消息的保护等级[上篇]
单细胞测序中影响建库浓度低的原因有哪些?
哟哟的养乐多
2024/02/18
3521

相似问题

低训练和验证损失,但预测错误

10

哪种算法能很好地预测销售预测,以及选择特定算法的原因?

10

概率乘积规则用于误差预测的原因

10

用递归神经网络预测样本的原因

20

损失和损失太大

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档