前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >过拟合

过拟合

作者头像
hotarugali
发布2022-03-11 17:52:41
1.6K0
发布2022-03-11 17:52:41
举报
文章被收录于专栏:hotarugaliの技术分享

1. 简介

机器学习的目标是提高泛化能力,即便是没有包含在训练数据里的未观测数据,也希望模型可以进行正确的识别。而机器学习问题中经常会出现过拟合的问题,即只能拟合训练数据,但不能很好地拟合不包含在训练数据中的其他数据的状态。

2. 原因

发生过拟合的原因,主要有以下两个。

  • 模型拥有大量参数、表现力强。
  • 训练数据少。

3. 解决

3.1 权值衰减

该方法通过在学习的过程中对大的权重进行惩罚,来抑制过拟合。即在原来的损失函数中添加一项正则惩罚项来抑制过拟合:

\begin{array}{c} \hat{L} \leftarrow L - \frac{1}{2} \lambda \boldsymbol{W}^2 \end{array}

其中,\lambda 是控制正则化强度的超参数。

【注】这里采用的是常用的 L_2 范数,也可以根据具体题目使用其他范数(比如 L_1L_\infty 范数等)。

3.2 Dropout

Dropout 是一种在学习的过程中随机删除神经元的方法。训练时,随机选出隐藏层的神经元,然后将其删除;被删除的神经元不再进行信号的传递。

【注】可以将 Dropout 理解为,通过在学习过程中随机删除神经元,从而每一次都让不同 的模型进行学习,即 Dropout 将集成学习的效果(模拟地)通过一个网络实现了。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-10-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 简介
  • 2. 原因
  • 3. 解决
    • 3.1 权值衰减
      • 3.2 Dropout
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档