前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >正则化对算法偏差/方差的影响

正则化对算法偏差/方差的影响

作者头像
讲编程的高老师
发布2021-03-03 11:18:32
8580
发布2021-03-03 11:18:32
举报
文章被收录于专栏:讲编程的高老师

本文是吴恩达《机器学习》视频笔记第63篇,对应第6周第5个视频。

“Advice for applying machine learning:——Regularization and bias/variance”

01

笔记

在第三周的视频中我们学过如何使用正则化防止过拟合,

机器学习中的正则化是怎样进行的?——ML Note 41

线性回归的正则化—ML Note 42

那这个正则化和算法的偏差/方差又有什么关系呢?本节视频有深入介绍。

正则化后线性回归的代价函数

为了防止过拟合,线性回归的代价函数被叠加了一个正则化部分。如下图:

上节视频我们知道,多项式拟合的阶数选择不合理会加大偏差、方差。那正则化式中,\lambda取值不合适也会对偏差、方差造成影响。如下图:

看两种极端情况:

(1)\lambda非常大,那代价函数的取值受正则化项影响过大,最后得到的拟合公式就会产生严重的欠拟合,如上图最左边。

(2)\lambda非常小,正则项对代价函数影响不大,容易产生过拟合,如上图右边。

(3)只有当\lambda取值适中时,才会有较好的拟合效果,如上图中间。

如何选择合适的\lambda呢?

我们的模型以及对应的正则化后的代价函数如下图。

那我们根据这个模型公式,找到训练集上的优化目标:

与之类似的,验证集、测试集的平方误差和的用法和前面的优化目标用法相同。

与找多项式阶数类似的方法,我们设置一个\lambda可能的取值区间,然后以一定的步长去试最好的那个\lambda。

针对上图案例的算法步骤如下:

Step1:使用训练集训练出12个不同程度的正则化模型,每个\lambda一个;

Step2:使用12个模型分别对交叉验证集计算出验证误差;

Step3:得出交叉验证误差最小的那个模型;

Step4:使用Step3中得到的模型计算测试集上的误差,看是否能够推广。

\lambda和偏差/方差的关系曲线

当改变\lambda时,误差肯定会跟着变化,具体的训练误差、验证误差随着\lambda的变化趋势是怎样的呢?以\lambda为横轴,以误差为纵轴,得到的曲线如下图右侧:

如上图,只有\lambda取值适中的时候才会同时得到相对较小的训练误差和交叉验证误差。

当然,在我们实际的实验中得到的曲线肯定会比上图中画的曲线波动要大得多,会有很多噪声干扰。

02

视频

http://mpvideo.qpic.cn/0bf2fqbz6aadbuanqofoarpvglgdt4wahhya.f10004.mp4?dis_k=5d212affed0c88783f2b8add28fef3ca&dis_t=1614741485&spec_id=MzAxMDYwMTc4Nw%3D%3D1614741485&vid=wxv_1603888203718000645&format_id=10004

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-02-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 讲编程的高老师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 正则化后线性回归的代价函数
  • 如何选择合适的\lambda呢?
  • \lambda和偏差/方差的关系曲线
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档