正态性检验
一般来说,若影响某一数量指标的随机因素很多,而每个因素起的作用均不是太大,那么这个指标服从正态分布(可以自己直观地判断一下)。另外,当样本量足够大时(通常N>100),任意分布的数据,其样本均数的分布近似于正态分布(不是小编瞎说的,这可是有数理统计理论证明的哟)。当然最客观地就是做个正态性检验了,正态性检验的SPSS操作如下(采用相关中例1的数据,判断age、x变量是否服从正态分布):
(1)依次点击:分析、描述统计、 探索,打开探索框,下图①。
(2)将age,x选入因变量列表,点击:统计量,勾选描述性,点击:继续,如下图②。
(3)点击:绘制,按照下图③勾选(仅供参考,也可根据自己兴趣选择),点击:继续。
(4)其他都默认,点击:确定,结果就出来了。
结果如下:
下面就开始接着上次的继续介绍统计分析方法了。
1、相关(适用于两个变量的相关关系)
相关一般可分为:线性相关(计量资料)、秩相关(等级资料)、分类变量的相关分析(计数资料)、非线性相关。今天我们就说一下最常见的简单线性相关(Pearson积矩相关),要做线性相关就需要满足二元正态分布,所谓二元正态分布,就是要分析的两个变量必须服从正态分布,否则就要用秩相关。现在就看例题吧(上面的正态性检验已表明:年龄和尿肌酐含量都服从正态分布)。
SPSS的操作如下:
(1)依次点击:分析、相关、双变量,如下图①。
(2)将age、X选入变量框,相关性勾选Pearson,显著性检验勾选双侧检验,勾选标记显著性相关,点击:选项,统计量勾选均数和标准差,缺失值选默认即可,点击继续,如下图②,点击:确定,结果就出来了。
结果如下:
2、多元线性回归
多元线性回归是探索一个连续型变量(因变量Y)和其他多个变量(自变量X)(计量、计数、等级均可)间线性关系。此时,仅需因变量Y满足正态分布即可。
SPSS的操作如下:
(1)依次点击:分析、回归、线性,如下图①。
(2)将Y选入因变量框,X1、X2、X3、X4均选入自变量框,方法选择进入(也可以选择其他进入方法),如下图②。
(3)点击:统计量,按下图②勾选,点击:继续。其他都选默认就可。点击:确定。结果就出来了。
结果如下:
3、Logistic回归
Logistic回归与多元线性回归类似,只是Logistic回归的因变量Y变成了分类变量,而多元线性回归的因变量Y必须是数值变量。
SPSS的操作如下:
(1)操作前,需要先对f进行加权。依次点击:分析、回归、二元logistic,将Y选入因变量框,X1、X2均选入自变量框,如下图①。
(2)点击:选项,按下图②勾选,点击:继续。其他都选默认就可。点击:确定。结果就出来了。
结果如下:
4、COX回归
cox回归与多元线性回归、Logistic回归类似,只是cox回归的因变量Y有两个因素,一个是生存结局,一个是生存时间,主要分析生存资料。
SPSS的操作如下:
(1)依次点击:分析、生存函数、cox回归,将t选入时间框,将y选入状态框,将X1、X2、X3、X4、X5、X6均选入自变量框,方法选择进入,如下图①。
(2)点击:定义事件,在单值处写1,如下图②,点击:继续。
(3)点击:绘图,勾选生存函数,点击:继续。点击:选项,按下图②勾选,点击:继续。其他都选默认就可。点击:确定。结果就出来了。
结果如下:
讲到这,本次分享就要结束了,小编又想起了临床常见的生存分析还没有给大家说,现在就补一下吧。我们就还用上面例4生存资料的数据。
寿命表法求生存时间
SPSS的操作如下:
(1)依次点击:分析、生存函数、寿命表,将t选入时间框,显示时间间隔可根据自己数据生存时间选择,将y选入状态框,点击:定义事件,在单值处写1,点击继续。如下图①。
(2)点击:选项,勾选寿命表、生存函数。如下图②,点击:继续。点击:确定。结果就出来了。
结果如下:
Kalan-Meier法比较两组生存率的差异
SPSS的操作如下:
(1)依次点击:分析、生存函数、Kalan-Meier,将t选入时间框,将y选入状态框,点击:定义事件,在单值处写1,点击继续。将x2(性别)选入因子框,如下图①。
(2)点击:比较因子,按下图②勾选。
(3)点击:选项,按下图③勾选。点击:继续。点击:确定。结果就出来了。
结果如下:
参考资料:
《卫生统计学》第7版,方积乾主编,人民卫生出版社,2014年5月
《SAS统计软件应用》,贺佳主编,人民卫生出版社,2014年4月