孟德尔随机化(Mendelian Randomization, MR)是近几年流行起来的用来进行因果推断的有效方法,它以遗传变异为工具变量来推导结局和暴露的因果关系,能有效避免传统流行病学研究的混杂偏倚。如图所示,它的研究建立在三个假说之上:1)工具变量和暴露因素强相关;2)工具变量和混杂因素不相关;3)工具变量与结局不直接相关,它对结局的作用只能通过暴露来体现。
随着大量全基因组关联分析结果被发布和共享,现在的孟德尔随机化(主要是双样本孟德尔随机化)研究的文章数目也是逐年攀升,下面我将以‘TwoSampleMR’这个R包为例简单介绍孟德尔随机化的实施步骤。
1. 安装相关R包
install.packages('devtools')
library('devtools')
install_github("MRCIEU/TwoSampleMR")
2. 获取MR base的表型ID,将结果保存为pheno_info.csv这个文件
ao <-available_outcomes(access_token=NULL)
write.csv(ao,'pheno_info.csv',row.names=F)
3. 查看pheno_info.csv文件,获取与暴露相关的工具变量的信息以及结局信息。这里选择暴露为obesity class 2 (ID = 91), 结局为 type 2 diabetes (ID = 1090)
exp_dat <- extract_instruments(outcomes=91,access_token=NULL)
obesity_exp_dat <- clump_data(exp_dat)
t2d_out_dat <- extract_outcome_data(snps=obesity_exp_dat$SNP, outcomes=1090, access_token=NULL)
dat <- harmonise_data(exposure_dat =obesity_exp_dat, outcome_dat= t2d_out_dat)
4. 计算MR
res <- mr(dat)
下图是MR的计算结果
从上面的结果看,obesity class 2 与二型糖尿病之间并无因果关联
以上就是孟德尔随机化研究的第一部分,后续将为大家带来更深入和详细的探讨。如有问题,欢迎留言!
参考文献