前面对于已知的数据点,我们一直使用一次函数来进行拟合,一次函数的图形为一条直线。
不过,对于这些添加的数据点,曲线可能比直线的拟合效果更好。
如果想要表示更加复杂的曲线,还可以使用更高的次数。
我们可以随便决定
是什么样的函数,不过对于要解决的问题,找到合适的表达式之前,需要不断地去尝试。更高次数的曲线能够更好的拟合所有数据点,甚至能够完全拟合所有的数据点,但是数据点中包含很多的噪声。
类比于考试,我们平时练习的题目对应到机器学习中的学习阶段(找到合适的参数),而考试对应到机器学习中的测试阶段(验证找到的参数是否能够解决实际的问题),更高次数的曲线相当于我们将平时练习的题目死记硬背了下来,没有学习到题目中的规律和技巧,虽然平时练习能够得到好成绩,但是我们的目的是为了和平时练习题目不同的考试,自然考试的成绩不会太高,相对应的找到的参数并不能解决实际的问题。这也是机器学习中非常重要的 过拟合问题。
前文已知
,只需要求出
。
对于
的参数更新表达式为:
References:
《白话机器学习的数学》
本文分享自 AI机器学习与深度学习算法 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!