Author:AXYZdong 李宏毅《机器学习》系列 参考视频地址:https://www.bilibili.com/video/BV1Ht411g7Ef 参考文档:DataWhale文档
应用举例
▲ 损失函数(Loss Function)
▲ w 和 b 在二维坐标中展示
▲ 定义f*
步骤2:计算微分,也就是当前的斜率,根据斜率来判定移动的方向
步骤3:根据学习率移动
重复步骤2和步骤3,直到找到最低点
▲ 梯度下降过程
▲ 两个参数偏微分过程
梯度下降算法在现实世界中面临的挑战
▲ 梯度下降面临的问题
在线性模型里面都是一个碗的形状(山谷形状),梯度下降基本上都能找到最优点,但是再其他更复杂的模型里面,就会遇到 问题2 和 问题3 。
验证模型好坏
使用训练集和测试集的平均误差来验证模型的好坏。
在简单的模型基础上,可以进行优化,选择更复杂的模型(一元N次线性模型),或者说使用多项式来拟合。
如果我们选择较高次方的模型,在训练集上面表现更为优秀的模型,在测试集上效果可能反而变差了。这就是模型在训练集上过拟合的问题。
▲ 过拟合(Overfitting)的问题
对于更多特征,但是权重
可能会使某些特征权值过高,仍旧导致overfitting,可以加入正则化。
▲ 正则化(Regularization)
▲调节 λ 获得最好的模型
Datawhale组队学习,李宏毅《机器学习》Task2. Regression(回归),主要包括回归的定义、创建模型的步骤、如何优化模型、优化模型过程中可能出现的问题以及使用正则化来解决过拟合的问题。
—— END ——