声明:非常感谢Carina投稿,全文由Carina撰写,主要对生信的可变剪切相关内容作了一定的梳理。
检索TCGA中可变剪切的相关文献,虽然总数量并不多,但是其在2019年猛增为49,在2020年的上半年发文数量也超过了2019年的一半。这说明可变剪切研究在生物信息学中的热度有上升的趋势。
1.基础知识 1.1 可变剪切的定义与生物学意义
①定义:可变剪切(Alternative Splicing) 是指转录形成的前体mRNA通过去除内含子、保留外显子形成成熟mRNA的过程。
②生物学意义:可变剪切是维持蛋白质多样性的主要机制[1]。在不同组织或者发育的不同阶段,可变剪切不是一成不变的,在特定的组织或者条件下,会产生特定的剪切异构体(isoform),这说明不同异构体具有特定的时间与空间作用,从而将可变剪切与正常的生命活动和疾病相关联,有大量的研究发现,可变剪切的变化与癌症等多种疾病相关,所以研究可变剪切在不同组织中的作用是非常有意义的。
1.2可变剪切的类型
可变剪接以细胞类型和发育阶段特异性方式调控[2],这是通过广泛的RNA-蛋白相互作用来协调调控实现的。
最保守的顺式剪接元件包括分别界定内含子与其上游和下游外显子的边界的5'和3'剪接位点,以及3'剪接位点上游的分支位点和聚嘧啶束。
除了这些核心元件外,外显子或侧翼内含子中的辅助顺式元件还可以作为剪接增强子或沉默子元件,通过它们与反式剪接调节子,特别是RNA结合蛋白(RBP)的相互作用来促进或抑制外显子剪接。
例如,特定于细胞类型的剪接调节剂,例如ESRP,CELF,MBNL,RBBFX和PTB家族成员,存在不同的mRNA亚型,通过与它们在细胞中的同源顺式元件相互作用,来控制上皮,肌肉和神经元细胞的替代剪接模式和细胞身份[2]。
可变剪切通常受人类遗传变异和疾病突变的影响。很多突变会破坏前体mRNA中的剪接位点信号或剪接增强子或沉默子元件,从而导致异常mRNA和蛋白质产物的产生。
据估计,这种顺式剪接突变占人类疾病突变的15%–60%。另外,破坏反式作用的剪接调节子的突变通过全面破坏许多下游靶基因的剪接而引起疾病。
上左图展示的是经过spliceseq算法处理得到的可变剪切矩阵。
在可变剪切分析中,首先需要在软件中输入待分析的RNA-seq数据(这里指的应该是RNA-seq raw data),然后软件利用其已经配置好的参考基因组数据库进行RNA测序数据的注释和比对,接着构建每个基因的剪切图谱,进行可变剪切事件的量化(这些识别的基因可变剪切模式,有些是在已有的数据库(如GENECODE=ensemble,refseq=NCBI,UCSC)中注释过的,但是有些是未注释过的)。
最后,就是将识别的可变剪切事件与临床意义联系起来,探究可变剪切在疾病发展、治疗和预后中的作用。
参考文献
1. Li Y, Sun N, LuZ, Sun S, Huang J, Chen Z, et al. Prognostic alternative mRNA splicingsignature in non-small cell lung cancer. CancerLett 2017; 393:40-51.
2. Kalsotra A, Cooper TA. Functionalconsequences of developmentally regulated alternative splicing. Nat Rev Genet 2011; 12(10):715-729.
3. Xiong Y, Deng Y, Wang K, Zhou H, Zheng X,Si L, et al. Profiles of alternative splicing in colorectal cancer and theirclinical significance: A study based on large-scale sequencing data. EBioMedicine 2018; 36:183-195.
4. Zhu J, Chen Z, Yong L. Systematicprofiling of alternative splicing signature reveals prognostic predictor forovarian cancer. Gynecol Oncol 2018;148(2):368-374.