一个好的起点是从0.01尝试起 可选的几个常用值:
判断依据:验证集的误差(validation error)
常用策略:
可选的常用值:1,2,4,8,16,【32】,64,128,256
推荐32比较常用。32、64、128、256都比较合适
256比较大,一次性计算的多,速度会快,但因为矩阵计算量较大,内存可能超过
小的mini batch size可能因为收敛的抖动比较厉害反而不容易卡在局部最低点 但是mini batch也不能太大,反而准确率下降。
要选择合适的Epochs,就可以用early stopping的方法:
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有