1.模型:,其中,是自变量x对因变量y的估计值,是回归直线在Y轴上的截距,是样本的回归系数,即回归直线的斜率,表示当x变动一个单位时,y平均变动个单位。
2.应用:主要应用于预测连续型变量,如根据房子面积预测房价、根据父母身高预测孩子身高、根据身高预测体重,根据广告费用预测销售费用等等
3.原理:简单线性回归主要估计和,采用的是最小二乘法,使得观测点与直线方程上对应点的纵向距离差的平方和最小,即要使残差平方和最小。
4.估计参数:估计和,采用求偏导数的方法,即
5.模型检验:
(1)参数检验:t检验,p值
(2)模型整体检验:F检验,R2
6.实例:运用python中的sklearn模块,根据工作年限来预测薪资
(1)读取数据
(2)分离出训练集和测试集
(3)运用简单线性回归来拟合训练集
(4)用简单线性回归预测测试集
(5)模型检验:R2较大,拟合结果较为理想
(6)训练集可视化
(7)测试集的可视化
领取专属 10元无门槛券
私享最新 技术干货