方差分析的基本思想
一、检验目的
多组数值变量比较的假设检验常用方差分析(Analysis of Variance,简称为ANOVA)。检验目的是推断多个总体均数是否相等。
二、离均差平方和的分解
总变异三组所有人的载脂蛋白测定值大小不等,此变
异称为总变异。用总离均差平方和SS总表示。
SS总 =åå( Xij-`X)2 n总=N -1
组间变异三组人的载脂蛋白样本均数也大小不等,它们之间的变异称为组间变异。用组间离均差平方和SS组间表示。
SS组间 =åni(Xi- `X)2 n总=N -1
MS组间= SS组间/ n组间
组内变异三组人内部的载脂蛋白也大小不等,这种处理组内部的变异称为组内变异。用组内离均差平方和SS组内表示。
SS总 =åå( Xij-`Xi)2 n总=N -k
可以证明以上三种变异有如下关系: SS总=SS组间+SS组内n总=n组间+n组内 总变异可以分解为组间变异和组内变异两个部分, 总自由度也分解为组间自由度和组内自由度
三、检验统计量F
F= MS组间/ MS组内
在H0成立时,F值在理论上应等于1。反之,若 H1成立时,F值也将明显大于1。
四、总结方差分析的基本思想就是根据研究设计的类型及研究目的,将总变异分解成两个或多个部分。除随机误差外,其余部分的变异可由某因素的作用来解释,通过比较可能由某因素所致的变异与随机误差的均方(如组内变异),从而了解该因素有无作用。
完全随机设计的单因素方差分析
单因素方差分析适用于只有一个处理因素的完全随机设计,这个处理因素可以有两个或者两个以上的处理水平。
单因素方差分析的总变异可以分解为组间变异和组内变异两个部分,总自由度分解为相应的两个部分: SS总=SS组间+SS组内n总=n组间+n组内 若检验处理组间是否有差别,检验统计量F为: F= MS组间/ MS组内
方差分析的F检验,当P £ 0.05,按a=0.05,拒绝H0,接受H1,故可以认为各组总体均数不等或不全相等。这并不意味着任何两组总体均数都有差别。要想确定哪些组间有差别,必要时应该进一步作均数之间的多重比较在处理组数大于2时,均数之间的多重比较若仍用t 检验对任意两两均数之间进行比较,则会增大犯第一类错误的概率。因此,均数之间的多重比较不宜再用前述t检验方法
探索性研究中均数之间多重比较的方法:多重比较(Multiple Comparisons)如LSD、 Bonferroni、Dunnett方法等。亚组同质性检验(Homogeneous Subsets)如SNK、 Tukey HSD方法等。
随机区组设计的两因素方差分析
随机区组设计在医学科研中比较常见,例如在实验研究中,将动物按窝别配伍,再随机分配到各个处理组;在观察性研究中按年龄、性别或地区配伍来抽取和组成研究因素的各个水平组等。
随机区组设计方差分析的总变异可以分解为处理组间变异、区组间变异和误差三个部分: SS总=SS处理+SS区组+SS误差总自由度也可以分解为相应的三个部分:n总=n处理+n区组+n误差
方差分析的注意事项
一、方差分析与t 检验的联系两个独立样本均数比较的t检验,可以用单因素方差分析代替;配对设计的t检验,可以用随机区组设计的两因素方差分析代替。两者的计算结果有如下关系: F = t2
二、两种类型的方差分析比较由于区组内的个体特征比较一致,减少了个体间差异对研究结果的影响;与完全随机设计的单因素方差分析相比,随机区组设计更容易检验出处理组间的差别,提高了统计效率
三、参数统计与非参数统计
(一)Kruskal-Wallis秩和检验
(二)Friedman秩和检验
SPSS应用