前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >孟德尔随机化之MendelianRandomization包(第三讲)

孟德尔随机化之MendelianRandomization包(第三讲)

作者头像
生信与临床
发布2022-08-21 17:31:24
1.9K0
发布2022-08-21 17:31:24
举报
文章被收录于专栏:生物信息与临床医学专栏

在前两期推送中,我和大家分别介绍了“MendelianRandomization”的IVW和median-based方法,并详细介绍了这两种方法的参数以及使用建议。在这一期的内容中,我将和大家一起学一下“MendelianRandomization”包的MR-Egger法Maximum likelihood法,后者我们通常译作极大似然估计法。

第一部分:MR-Egger方法

代码语言:javascript
复制
library(MendelianRandomization) #加载R包
MRInputObject <- mr_input(bx = ldlc,bxse= ldlcse,by = chdlodds,byse = chdloddsse) #指定输入文件
EggerObject1 <-mr_egger(MRInputObject,robust = FALSE,penalized = FALSE,correl =FALSE,distribution = "normal",alpha = 0.05)

在mr_egger()函数中,所有的参数都和IVW方法中的类似,这里就不赘述了,忘记的小伙伴请看“MendelianRandomization”包的第一讲内容孟德尔随机化之MendelianRandomization包(第一讲)。

代码语言:javascript
复制
EggerObject1 #查看结果

从上述结果,我们可以看出,MR的效应估计值是3.253,并且具有统计学显著性,另外由于截距项和0无显著差异,可以认为MR-Egger的结果不存在水平多效性。这里需要注意I^2_GX这一项,它是一个0到1之间的数,其值越大,说明MR估计的结果越准确,弱工具变量的偏倚就会越小【1】。

考虑到上述结果有很强的异质性,因此我们考虑采用稳健回归,并对异常的SNP(outlier)进行“惩罚”:

代码语言:javascript
复制
EggerObject2 <-mr_egger(MRInputObject,robust = TRUE,penalized = TRUE,correl =FALSE,distribution = "normal",alpha = 0.05) 
EggerObject2 #查看结果

可以看出,使用稳健回归后,MR估计值的误差变小了,但显著性并未改变。这也充分说明,LDL的升高可以增加CHD的发病风险。

第二部分:Maximum likelihood方法(极大似然估计法)

总的来看,极大似然估计法和IVW法并没有本质上的区别,因此在实际的文献中,大家通常都在使用IVW法,很少去报道极大似然估计法的结果。不过,相对于IVW方法,极大似然估计法也有着自身的两点优势:(1)它充分考虑了SNP-exposure关联的不确定性,这一点在IVW的简单加权中是被忽略的;(2)它考虑了双样本MR研究中样本重叠的情况,主要是通过参数psi来控制,在样本完全不重叠的情况下(传统的独立双样本MR研究),psi为0;如果样本完全重叠的话,psi等于观察性研究中暴露和结局的相关性(相关系数)【2】。

代码语言:javascript
复制
MaxLikObject1 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi =0,distribution = "normal",alpha = 0.05)

在mr_maxlik()函数中,它的参数和IVW的类似,这里就不赘述了。

代码语言:javascript
复制
MaxLikObject1 # 查看结果
代码语言:javascript
复制
MaxLikObject2 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi = 0.3,distribution= "normal",alpha = 0.05)
MaxLikObject2 # 查看结果
代码语言:javascript
复制
MaxLikObject3 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi = 0.6,distribution= "normal",alpha = 0.05)
MaxLikObject3 # 查看结果
代码语言:javascript
复制
MaxLikObject4 <-mr_maxlik(MRInputObject,model = "default",correl = FALSE,psi = 0.9,distribution= "normal",alpha = 0.05)
MaxLikObject4 # 查看结果

在4次极大似然估计中,米老鼠逐渐增加psi的值,我们不难发现,随着psi的增加,MR估计值的误差也在不断增加,其实也说明在样本重叠的情况下,如果exposure和outcome有较强的关联的话,所带来的误差就会比较大,因此我们提倡尽量避免样本的重叠,如果重叠了的话,建议可以使用这个极大似然估计法计算样本完全重叠的情况下的MR估计值,如果仍然显著的话,说明结果还算可靠(这个方法不提倡)。

关于使用“MendelianRandomization”包进行MR-Egger分析和Maximum Likelihood分析的内容就讲到这里,大家要注意:(1) MR-Egger有助于辅助判断水平多效性和弱工具变量偏倚;(2)Maximum Likelihood有助于判断样本重叠带来的偏倚。咱们下期见!

参考文献:

【1】I-squared statistic: Jack Bowden and others. Assessing the suitabilityof summary data for Mendelian randomization analyses using MR-Egger regression:The role of the I2 statistic. Int J Epidemiol 2016

【2】Stephen Burgess, Adam S Butterworth, Simon G Thompson. Mendelianrandomization analysis with multiple genetic variants using summarized data.Genetic Epidemiology 2013; 37:658-665. doi: 10.1002/gepi.21758.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信与临床 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档