我们在做问卷分析时,由于因变量多为连续的线性变量,多半会采用线性回归分析来研究变量之间的关系。此时,一般资料或者人口学变量中,就会含有很多分组或分类的变量,比如性别,学历等等。
如果因变量在这些人口学变量上存在显著的差异,那么做回归分析时候,就需要将这些存在显著差异的人口学变量作为控制变量纳入线性回归分析。
但多分类变量在线性回归中不能直接作为自变量进行运算,这就需要使用我们今天讲解的虚拟线性回归分析了。下面就通过实际案例来详细讲解。
我们搜集了558名样本的压力、心理、STS及一般资料数据,想研究压力及心理是否会显著影响STS,此前已经算出,受伤、身体、加班、认同为STS差异显著的因素,因此这4个变量将作为控制变量纳入回归分析(图1)。可以看到这4个变量都为分组分类变量,不能直接作为自变量进行回归分析,必须先进行虚拟化,下面就来讲解如何虚拟化的spss操作步骤。
图1
虚拟化操作步骤:
以数据中“身体”为例子,身体分为“差”“一般”“良好”3个类,我们要将每一个类单独虚拟成一列变量,并以0否1是的形式重新赋值,但是3个类,我们需要选择一类作为参考类别,所以只用虚拟2个类别即可。
点击“转换”--“重新编码为不同变量”(图2),将“身体”选入右侧数字变量框中,再填入新生成的变量名,这里就为第一类“身体差”,写好后,点击变化量,表示将原来的“身体”变量重新转码为“身体差”变量(图3)
图2
图3
再点击“旧值和新值”进行转码赋值,原来的“身体”变量中“身体差”的编码为1,这里转换为新的“身体差”变量后就为“是=1”,而原来的身体一般和身体良好则全部编码为“非身体差”也就是“否=0”,因此我们将旧值1赋为1,旧值的其余值全部赋值为0(图3-图5)后,点击确定,即完成对“身体差”这一新变量的虚拟化。
图4
图5
图6
接下来,同理将“身体一般”的一类虚拟化出来,区别就是将旧值的2类赋值为新的1,其余为0(图7)
图7
而第3类 身体良好则不用虚拟化,作为默认参考类别即可,则得到“身体”的虚拟变量2个,“身体差”和“身体一般”(图8)
图8
同理,我们将其余3个控制变量进行虚拟化(图9)
图9
再进行常规的线性回归操作,分别以STS为因变量,压力、心理、及受伤、身体差、身体一般、加班数≤1,加班数2-3,认可为自变量,进行回归分析(图10)
图10
分析结果
图11
由以上分析结果可以看出:压力4、压力5、心理1能显著负向影响STS,P
以上就是今天讲解的SPSS虚拟线性回归分析的应用与操作详解,今后还会有更多SPSS统计分析文章更新,敬请大家关注!
本期课程就到这里哦,感谢大家耐心观看!每日更新,敬请关注!
【杏花开生物医药统计】微信公众号(xhkdata)
点赞!
领取专属 10元无门槛券
私享最新 技术干货