首页
学习
活动
专区
圈层
工具
发布

学习率调度器和自适应优化器简史

第一个流行的学习率调度器: ReduceLROnPlateau 所有优化器都有一个学习率超参数,这是影响模型性能的最重要的超参数之一。 在最简单的情况下,学习率是固定的。...这一发现使得第一个著名的学习率调度器 ReduceLROnPlateau (Pytorch 中的 torch.optim.lr_scheduler.ReduceLROnPlateau)流行开来。...ReduceLROnPlateau 需要一个步长(step_size),一个耐心值(patience)和一个冷却期(cooldown)作为输入。在完成每一批次训练之后,检查模型性能是否有所提高。...因此,直到2015年,早期停止(EarlyStopping),ReduceLROnPlateau,和随机梯度下降(stochastic gradient descent)的组合都是最先进或接近最先进的。...与 ReduceLROnPlateau 相比,Adam 有两个引人注目的优势。 第一,模型性能。这是一个更好的优化器,句号。简单地说,它训练出了更高性能的模型。 第二,Adam 几乎没有参数。

2.7K32
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到
    领券