首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >MSP甲基化引物设计

MSP甲基化引物设计

原创
作者头像
sheldor没耳朵
发布2025-09-19 14:53:31
发布2025-09-19 14:53:31
3550
举报
文章被收录于专栏:数据挖掘数据挖掘

MSP甲基化引物设计

1.前置知识点

1.1 实验原理

  • DNA 甲基化是发生在CpG二核苷酸位点胞嘧啶上的一种重要表观遗传修饰,启动子区域的CpG甲基化通常与基因转录沉默密切相关。然而,甲基化修饰并不会改变DNA的碱基配对,因此需要借助亚硫酸氢盐处理将这种修饰转化为可检测的序列差异。
  • 其原理是:在亚硫酸氢盐作用下,未甲基化的胞嘧啶会发生脱氨基反应并最终被转化为尿嘧啶,在随后的PCR扩增中被识别为胸腺嘧啶;而甲基化的胞嘧啶(5-甲基胞嘧啶)对亚硫酸氢盐处理稳定,不发生转化,仍保持为胞嘧啶。这样,同一DNA区域在经过处理后,如果处于甲基化状态则保持“C”,若未甲基化则变为“T”。基于这一差异,可以设计两组特异性引物进行甲基化特异性PCR(MSP):甲基化引物(M引物)保留“C”,仅能扩增甲基化模板;非甲基化引物(U引物)将该位点视作“T”,仅能扩增未甲基化模板。
  • 通过PCR产物的有无即可判断样本的甲基化状态:若仅M扩增则为甲基化,仅U扩增则为未甲基化,二者皆扩增则提示部分甲基化或样本混合。由此,亚硫酸氢盐处理结合MSP技术,成功地将不可见的表观遗传修饰转化为可检测的序列差异,实现对基因甲基化水平的敏感检测。

1.2 CpG位点及CpG岛概念

  • CpG 的含义
    • C = Cytosine(胞嘧啶),p = 磷酸二酯键(phosphodiester bond,连接 C 和 G 的“—p—”),G = Guanine(鸟嘌呤)
    • 所以 CpG 就是指:在 DNA 双链序列里,5'—C—p—G—3' 这种 线性相邻 的碱基组合
  • CpG 的甲基化
    • 在哺乳动物基因组里,CpG 中的 C 常常会被修饰成 5-甲基胞嘧啶(5-mC)。这种修饰叫 DNA 甲基化,是一种重要的表观遗传修饰
    • 大部分基因组 CpG 位点都是甲基化的,但在启动子区域的 CpG 岛,甲基化状态对基因转录活性非常关键
  • CpG 岛 vs CpG 位点
    • CpG 位点:就是单个 "CG" 二核苷酸位置
    • CpG 岛:指富含很多 CpG 位点的区域(>100bp,GC% > 50%,Obs/Exp > 0.6)。启动子常常含有 CpG 岛,甲基化状态决定基因是沉默还是表达

1.3 转录起始位点(TSS)和起始密码子

  • TSS(转录起始位点):RNA聚合酶开始合成mRNA前体(pre-mRNA)的第一个核苷酸位置。所在位置:在基因的5’非翻译区(5’UTR)中,标志着转录开始,不一定和蛋白编码序列的ATG重合,决定mRNA的起始位置
  • ATG(起始密码子):mRNA上用作翻译的第一个密码子,编码蛋白质的第一个氨基酸(甲硫氨酸,Met)。在mRNA的编码区(CDS)起始处,通常位于TSS下游若干碱基(距离可从几十到几百bp不等),决定蛋白的起始位置
代码语言:r
复制
…---[启动子]---TSS(+1)---5’UTR---ATG(起始密码子)---…

1.4 为什么引物设计要在启动子区域?

  • 在真核基因中,启动子区域是RNA聚合酶及多种转录因子结合的关键位点,直接决定了基因能否被转录。
  • 当启动子区域存在CpG岛时,其甲基化状态对基因表达具有重要的调控作用:如果CpG岛甲基化,甲基结合蛋白会招募组蛋白去乙酰化酶等抑制复合物,使染色质结构紧密,从而阻止转录因子和RNA聚合酶结合,导致基因沉默;而未甲基化状态则有利于开放染色质结构,促进转录活性。
  • 因此,启动子甲基化与基因是否“开关”直接相关。相较之下,如果在基因编码区或其他区域检测甲基化,其结果未必直接反映基因的转录水平,对功能解释意义有限。
  • 基于此,研究基因的甲基化调控作用时,通常优先选择启动子区域,特别是靠近转录起始位点(TSS)附近的CpG位点进行引物设计和检测。

2.实际案例

2.1 启动子区域获取

  • 本次以ESR1基因为例
  • 关于如何获取基因的启动子区域,我先前在这篇文章中数据挖掘—NCBI中获取某基因序列和转录起始位点已经详细说明,之前的做法是找到起始密码子,然后把前2000bp左右的基因组序列作为启动子候选区,这种做法基本上可以覆盖到启动子
  • NCBI中,检索ESR1基因,可以发现其存在多个转录本,一般以NM开头的为主
    • NM_000125.4:NM 开头 → mRNA参考序列(RefSeq mRNA),代表 ESR1 基因的成熟mRNA序列(含5’UTR、CDS、3’UTR)
    • NP_000116.2:NP 开头 → 蛋白质参考序列(RefSeq Protein)由上面的NM_000125.4 mRNA翻译而来的蛋白质序列
  • 反应在基因组中的位置如下图,所以更为合理的做法找主转录本,如NM_000125.4 fasta序列,位于Ch6号染色体151,807,682bp位置,将其向前延伸2000bp位置作为ESR1候选启动子区域,即6号染色体151805682~151807682区域

2.2 使用MethPrimer预测引物

  • 使用 MethPrimer(http://www.urogene.org/methprimer/),输入取到的2000 bp启动子序列,查看是否存在 CpG 岛(CpG dinucleotide 高密度区域),优先选择 靠近 TSS 的 CpG 岛作为检测区,因为甲基化通常在TSS附近最有功能意义:
    • 导入的2000 bp 序列中,1606–1861 bp 之间存在一个 CpG 岛
    • MethPrimer给出了两对引物:
      • M 引物对:用于扩增甲基化DNA模板(CpG 中的 C 保持不变)
      • U 引物对:用于扩增 非甲基化DNA模板(CpG 中的 C 被转化为 T)
代码语言:r
复制
#预测结果
Sequence Name: 
Sequence Length: 2001

CpG island prediction results
Criteria used: Island size > 100, GC Percent > 50.0, Obs/Exp > 0.60
 1 CpG island(s) were found in your sequence
            Size	(Start - End)
 Island 1   256 bp	 (1606 - 1861)

Primer picking results for methylation specific PCR (MSP)
   
   Primer            Start Size  Tm      GC%   'C's  Sequence
1  Left  M primer    1640   28   56.89   46.43   4  TAAATAGAGATATATCGGAGTTTGGTAC
   Right M primer    1811   25   53.18   56.00   8  CTAAATAAAAACTAAATTTCACGAC
   Product size: 172, Tm: 64.3
  
   
   Left  U primer    1639   30   57.19   46.67   4  ATAAATAGAGATATATTGGAGTTTGGTATG
   Right U primer    1812   26   52.13   57.69   9  ACTAAATAAAAACTAAATTTCACAAC
   Product size: 174, Tm: 63.3
  • 位置:在你导入的2001 bp 序列中,1606–1861 bp 之间存在一个 CpG 岛。大小:256 bp(符合 CpG 岛的常见标准:长度 > 200 bp,GC% > 50%,Obs/Exp > 0.6)。意义:这个 CpG 岛靠近 TSS(通常功能相关),所以被 MethPrimer 选作引物设计区域。
  • MethPrimer给出了两对引物:
    • M 引物对:用于扩增 甲基化DNA模板(CpG 中的 C 保持不变)
    • U 引物对:用于扩增 非甲基化DNA模板(CpG 中的 C 被转化为 T)

3.甲基化后序列

  • 转换后的序列在snapgene中打开,可以完全匹配M引物对

参考教程:https://www.bilibili.com/video/BV1Nh4y1577V/?spm_id_from=333.337.search-card.all.click&vd_source=7e83cb2510516bdff59ccf808d022aa0

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • MSP甲基化引物设计
    • 1.前置知识点
      • 1.1 实验原理
      • 1.2 CpG位点及CpG岛概念
      • 1.3 转录起始位点(TSS)和起始密码子
      • 1.4 为什么引物设计要在启动子区域?
    • 2.实际案例
      • 2.1 启动子区域获取
      • 2.2 使用MethPrimer预测引物
    • 3.甲基化后序列
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档