我正在为二进制分类训练一个cNN。我使用了128批大小,损失正在减少,准确度随着时间的推移而增加。最终精度达到0.99以上,损失小于0.3。但再过几个年代,该模型收敛到了0.6,精度下降了0.5。对模型的检验表明,它总是预测0.5。我用二元交叉熵作为损失函数。对于每一个时代,所有的数据点都会被洗牌。我用的是SGD,学习率是0.01。
我是否以较低的准确率,但相当好的损失值,达到了局部最小值?建议采取什么办法来处理这一问题?此外,为什么有可能有一个低损失函数与一个单一的预测类?
发布于 2018-03-03 12:57:01
根据你的描述,这可能是一个学习率过高的问题。当发生这种情况时,重量不能接近最小值,损失也不会下降。
因此,我建议将学习率降低到0.001,并使用Adam。
https://datascience.stackexchange.com/questions/28481
复制相似问题