在表观遗传中,DNA甲基化修饰具有非常重要的地位,甲基化修饰方式多种多样,其中胞嘧啶杂环5号位的甲基化修饰较为常见,又称为5-甲基胞嘧啶(5mC)。
DNA的启动子甲基化是表观遗传学调控的一种重要形式,主要发生在基因组的CpG岛区域。
何为CpG岛DNA链上的CG位点能够被甲基化酶的修饰下在胞嘧啶上添加甲基从而发生甲基化,如果一DNA片段富含CG序列的密度比平均密度高1020倍,GC含量大于50%,长度大于200bp的区域,称为CpG岛(CpG island)。
如果某一区域高度甲基化,一般认为在顺式调控元件部位(包括启动子、增强子等部位)甲基化,将影响DNA的结构,从而阻遏该部位基因的转录。
如上图所示:
我们需要注意几点,有助于我们理解DNA甲基化测序的原理
1)CpG岛通常含有内切酶切点,可以被切除
2)没有甲基化的C不稳定,特定条件下可以转换成U,经DNA复制后,转换成T。
3)相对于组织特异性表达的基因,全基因组组成型基因中的CpG的含量为100%。
DNA甲基化测序有助于发现在特定的病理状态下,DNA甲基转移酶等DNA修饰酶负调节重要靶基因转录从而导致疾病的线索(高甲基化水平往往代表对启动子的抑制作用),并对基因的功能和调节机制进行深入研究。
如图所示:(B)肿瘤细胞gene1的启动子由于CpG岛的高甲基化水平而发生了转录沉默,而gene2的启动子由于CpG岛的甲基化水平的降低而发生了异常的转录。(A)为正常细胞正常的启动子CpG岛的甲基化水平。
今天为大家主要介绍三种常见研究DNA甲基化的高通量测序技术:
全基因组甲基化测序(WGBS)、
简化甲基化测序(RRBS)、
甲基化DNA免疫共沉淀测序(MeDIP-Seq)。
三种技术在检测范围、检测精度及适用范围各不相同,且都有各自的优势,可结合具体研究情况进行选择。
WGBS
重亚硫酸盐(Bisulfite)处理能够将未甲基化修饰的C碱基转化为U,而甲基化修饰C碱基将保持不变,因此成为表观遗传学研究的经典实验方法。(通过处理组和无处理组之间的比对,发现真正甲基化的C)
WGBS(Whole Genome Bisulfite Sequencing,全基因组甲基化测序)将Bisulfite处理与高通量测序技术相结合,能够绘制全基因组高分辨率DNA甲基化图谱,可用于研究物种特定DNA区域甲基化与特定表型之间的关联。
优点:WGBS具有单个碱基分辨率,研究的是全基因组甲基化
缺点:测序费用相对来说比较高。
RRBS
RRBS(Reduced representation bisulfite sequencing,简化甲基化测序)是利用限制性内切酶MspⅠ酶对基因组进行酶切,富集CpG片段,再进行Bisulfite测序,从而对富集片段的甲基化展开分析。
优点:准确、高效、经济,可以极大幅度地提高CpG区域的测序深度,还能通过酶切位点过滤部分降解片段对结果的影响。并且由于RRBS主要关注CpG富集区域的甲基化,能够避免过多的数据浪费,可以更有针对性地研究覆盖区域的甲基化状态。
MeDIP-Seq
MeDIP-Seq (Methylated DNA Immunoprecipitation Sequencing,甲基化DNA免疫共沉淀测序)是一种基于富集方法研究DNA甲基化的测序技术,针对不同甲基化类型选择不同抗体。
目前主要是利用5mC抗体特异性富集基因组上发生甲基化的DNA片段,在高CpG密度、高DNA甲基化水平区域具有很好的抗体亲合性,然后通过高通量测序可以在全基因组水平上进行高精度的CpG密集的高甲基化区域研究。
MeDIP-Seq的覆盖范围主要是高CpG密度、高DNA甲基化水平区域,和RRBS相似,适用于大样本量的甲基化研究。
一分析结果呈现一
1:差异甲基化位点火山图、热图、GO/KEGG富集分析、聚类图
举例:DNA methylation signature of human fetal alcohol spectrum disorder
产前酒精暴露是导致行为和认知缺陷的主要原因,2-5%的北美地区儿童可能受其影响。酒精对发育影响的潜在机制仍是未知的。新的证据表明,表观遗传机制介导了胎儿酒精谱系障碍(FASD)儿童所观察到的一系列症状。因此,本文研究了在FASD队列中产前酒精暴露对全基因组DNA甲基化的影响。
结果解释:在FASD病例中,658个DM CpG位点发生显著改变(与对照组相比,356个低甲基化位点和302个高甲基化位点)
结果解释:上调甲基化基因列表显示与其神经发育过程相关的基因富集。
结果解释:用高甲基化的基因集和收集了282个额外的实验数据进行共表达网络构建,图中节点代表甲基化基因,边缘代表共表达链。橙色、绿色和青色的节点分别是与自闭症谱系障碍、癫痫和焦虑相关的基因。该网络的一个小簇显示了与自闭症/癫痫相关的几个基因(NRXN1、CACNA1A、CDH10等)的共表达。综上所述,这些发现表明DNA甲基化模式的改变可能与FASD患儿的神经生物学缺陷有关。
2:差异甲基化区域鉴定及可视乎
举例:
结果解释:对照组之间相同位点甲基化的不同。
3:甲基化位点与mRNA表达相关性分析
举例:
结果解释:展现远端探针(distal probe)的甲基化水平与上游和下游附近10个基因表达水平的相关性散点图。
4:差异甲基化位点与生存分析
举例:
结果解释:利用Lasso回归模型、Boosting算法等建模验证甲基化标签可预测两对照组的overall survive。
参考内容:
[1]Auclair G, Guibert S, Bender A, etal. Ontogeny of CpG island methylation and specificity of DNMT3methyltransferases during embryonic development in the mouse[J]. Genomebiology, 2014, 15(12): 545.
[2]Heller G, Topakian T, Altenberger C,et al. Next-generation sequencing identifies major DNA methylation changesduring progression of Ph+ chronic myeloid leukemia[J]. Leukemia, 2016,30(9):1861-1868.
[3]Yan H, Bombarely A, Xu B, et al. siRNAsregulate DNA methylation and interfere with gene and lncRNA expression in theheterozygous polyploid switchgrass[J]. Biotechnology for Biofuels, 2018, 11(1):208.
https://www.sohu.com/a/275444467_278730
http://www.mianfeiwendang.com/doc/a89b814c65ab23f817e864af/2
临床样本组学研究系列往期