回归的数据分析是已知X和Y数据之间的关系,然后未来发生的X来预测Y值数据的这样一种关系,这种以过去数据为依据来预测未来数据的方式就叫做回归分析。
就比如我们上一个章节在讲数据相关性的时候讲到的孩子身高和体重的数据,孩子的身高和体重是一个正相关的关系,在我们的数据图表中我们记录了1-12岁的孩子的身高和体重的数据,如果我们对这组数据做一个回归分析,我们就可以预测出12岁以后任意一个身高所对应的体重数据,比如我想知道160CM对应的标准身高,我就可以根据回归函数计算对应的体重
2、单击图表 – 图表元素 – 趋势线 – 指数
3、点击趋势线 – 选择“显示公式”,“显示R平方”,在回归函数的线上会出现回归函数和R平方值,回归函数是一个指数函数,在EXCEL里我们可以通过函数来输入X值预测计算Y值。如果我想计算160CM对应的体重,我们就可以用的函数
Y= EXP(0.0192*160)*2.27 = 47.45KG
R² 决定系数,衡量的是回归直线在多大程度上准确呈现了数据的走向。数据范围为0-1,越接近1,数据的拟合度精准度越高。比如我们看到的上图的这组数据,拟合度达到了0.99,说明这组数据里的身高和体重是一个标准的数据值。
再看下面这个案例,这是历年来双十一的营业额的数据,然后我们做了一个回归分析,发现每年的数据都神奇的落在了回归函数上,拟合度有0.99,我们根据这条回归函数做了2020年的双十一的营业额的预测为3284.94亿,最后实际的双十一成交的数据为3724亿左右。
在人力资源模块里回归函数被大量的应用在薪酬数据分析里,在薪酬的数据分析里我们需要对各个层级进行薪酬曲线的绘制,再对薪酬曲线进行数据的分析,判断职级和薪酬的拟合度,对各个职级进行薪酬的预测,都是可以通过回归函数来进行数据分析。