既往研究显示,通过全基因组关联研究(GWAS)分析鉴定出的疾病风险变异主要位于基因组的非编码区域中。因此,全基因组图谱的深度学习模型在预测DNA序列的调控作用方面存在着巨大的潜力。然而,目前深度学习尚未能完全解析人类复杂疾病的信息。
该研究主要使用两个已有的深度学习模型:DeepSEA和Basenji,基于一系列编码、保守和监管注释,针对应用分层连锁不平衡(LD)评分回归划分的41种疾病和性状评估全基因组的SNP位点注释。研究人员通过对所有(11个血液样本和8个大脑样本)性状的荟萃分析汇总了所有组织或细胞类型的功能注释。
深度学习模型等位基因效应分析
研究人员发现这些注释高度富集于疾病的遗传学层面,与非组织特异性的等位基因效应分析相似,血液特异性和脑特异性等位基因效应的分析Basenji模型注释通常优于DeepSEA模型,能够产生更高的富集度和唯一的有条件意义的注释。
综上,该研究结果显示,深度学习模型目前仍未充分发挥其潜力,该模型可以为复杂的疾病提供可观的独特信息,然而目前还无法从预测的监管注释中推断出该信息的准确。
原始出处:
Dey, K.K., van de Geijn, B., Kim, S.S. et al. Evaluating the informativeness of deep learning annotations for human complex diseases. Nat Commun 11, 4703 (17 September 2020).
领取专属 10元无门槛券
私享最新 技术干货