作者:陈汝男 审核:云航 封面:自己想吧
二元逻辑回归介绍
定义
Logistic回归主要用于因变量为分类变量(如是否等)的回归分析,自变量可以为分类变量,也可以为连续变量。它可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。而因变量为二分类的称为二项logistic回归,通常再解释变量为0和1二值品质变量的时候采用。
Logistic 回归模型的假设检验——常用的检验方法有似然比检验(likelihood ratio test) 和 Wald检验)
似然比检验的具体步骤如下:
1:先拟合不包含待检验因素的Logistic模型,求对数似然函数值INL0
2:再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InL1
3:最后比较两个对数似然函数值的差异,若两个模型分别包含l个自变量和P个自变量, 似然比统计量G的计算公式为 G=2(InLP - InLl). 在零假设成立的条件下,当样本含量n较大时,G统计量近似服从自由度为 V = P-l 的 x平方分布,如果只是对一个回归系数(或一个自变量)进行检验,则 v=1.
wald 检验,用u检验或者X平方检验,推断各参数βj是否为0,其中u= bj / Sbj, X的平方=(bj / Sbj), Sbj 为回归系数的标准误。
小提示:
这里的“二元”主要针对“因变量”所以跟“曲线估计”里面的Logistic曲线模型不一样,二元logistic回归是指因变量为二分类变量是的回归分析,对于这种回归模型,目标概率的取值会在(0-1),但是回归方程的因变量取值却落在实数集当中,这个是不能够接受的,所以,可以先将目标概率做Logit变换,这样它的取值区间变成了整个实数集,再做回归分析就不会有问题了,采用这种处理方法的回归分析,就是Logistic回归。
二元逻辑回归模型 :Logit P=in(( p / 1-p ) )
设因变量为y, 其中“1” 代表事件发生, “0”代表事件未发生,影响y的 n个自变量分别为 x1, x2 ,x3 xn等等,记事件发生的条件概率为 P,那么P= 事件未发生的概理为 1-P,事件发生跟”未发生的概率比 为( p / 1-p ) 事件发生比,经过对数转换,即可得到Logistic回归模型的线性模型。
二元逻辑回归的适用条件
因变量为二分类的分类变量或者某事件的发生率(一个研究对象重复计数现象指标不适用)
自变量与logit(p)之间有线性关系
残差合计为0,且服从二项分布
各观测变量相互独立
二元逻辑回归操作
二元逻辑回归在SPSS里可以通过对话框直接操作,也可以通过句法编辑器实现。本节主要从对话框操作入手,介绍如何在spss里使用对话框进行二元逻辑回归分析
操作演示
1.选择数据文件《少先队组织认同》(以此为例下不重复) 。
2.打开spss统计软件,依次点击[分析]——[回归]——[二元logistic],数据集少先队认同为因变量,社会评价、性别、年级、家庭支持、同伴关系等为自变量,将因变量和自变量依次放入指定的选项框中。
3点击[分类],将为分类变量的自变量放入右侧[分类协变量]框中,本案例的自变量性别、年级等为分类变量,将这些分类的自变量选入右侧框中。
4.[参考类别]选择[最后一个]或[第一个]均可,这里选择默认的[最后一个],点击[继续]。
5.点击[保存],勾选[概率]、[组成员],然后[继续]。
6.点击[选项],勾选[霍斯默-莱梅肖拟合优度]和[95%的置信区间],然后[继续]。
7.自变量进入模型方式选择输入,也就是全部进入。然后点击[确定],输出结果。
本节提示:
对于N个分类的品质变量,当确定了参照类后,只需设置N-1个虚拟变量即可。
注意将Hosmer 和 Lemeshow 检验 和“随机性表” 结合一起来分析。
“Hosmer 和 Lemeshow 检验”表中的“卡方”统计量,是通过“Hosmer 和 Lemeshow 检验随即表”中的数据得到的(即通过“观测值和”预测值“)得到的,计算公式如下所示:
x²(卡方统计量) = ∑(观测值频率- 预测值频率)^2 / 预测值的频率
以上就是本节的全部内容,请大家多多练习~
领取专属 10元无门槛券
私享最新 技术干货