1. 为什么不用ANOVA?
因为它局限!
ANOVA(Analysis of variance)是Fisher在1918年发明的一种方差分析方法。因为我们多数人在数理统计入门时重点学习过,所以最常使用。ANOVA有三大要求,使用前要逐一检验:
编者著, 也有表示为: 独立性, 齐次性, 正态性. 独立性是指不同处理之间是独立的. 动植物育种中, 不独立可以定义关系, 比如系谱构成的A矩阵, 比如基因组构成的G矩阵, 这样可以解决不独立的问题.
一旦不满足条件需要:
举例,下图中, 前3列是一个处理的3个水平,单独时都服从正态分布,但放在一起(第4列)就不是正态分布,方差不齐很常见,但一般线性模型中, 似乎没有合适的方法来解决。
如果方差分析的3个条件都满足,那么用ANOVA是没有问题的,得到的结果和混合线性模型的是一致的。这里我总结了ANOVA和线性模型的关系(图2)。ANOVA在最小枝,可见有多么局限。
从这张图中, 可以看到, 使用范围最广的是广义线性混合模型(GLMM), 广义线性模型(GLM)可以处理非正态数据, 混合线性模型(LMM)可以处理非齐次和非独立数据, GLM中的一般线性模型包括ANOVA.
2. 为什么要用混合线性模型?
下面说一下线性模型的相对优势,它是怎么解决ANOVA的3大局限的。线性模型一般写成这样:
是响应变量,
是固定效应,
和
是随机的随机效应和残差;X和Z是固定和随机效应的关联矩阵。
线性模型的条件是
和
服从均值为0的正态分布。看见没,没有对
有任何限制。针对ANOVA的第2条。
方差不齐怎么办?把效应
结构化。什么意思呢?比如ANOVA要求水平1和水平2的方差相等:
,如果不等的话就用一个对角矩阵
分别估计出每个水平的方差,这就是对效应
的结构化。这样就解决了ANOVA的第3条限制。
这是解决了非齐次的问题, 如果可以定义处理间的关系, 比如通过系谱A矩阵, 基因组G矩阵, 那么也可以处理非独立的情况.
3, 哪些软件能拟合线性模型?
如发现问题欢迎指正!
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有