导语
GUIDE ╲
今天为大家介绍2013年Nature Methods、SCIENTIFIC REPORTS、nature structural & molecular biology、Nature Genetics发布的几项关于泛癌网络模块分析的研究。
背景介绍
细胞网络是复杂的系统,在癌症中受到干扰。因此,将突变数据与稳健的基因相互作用网络整合起来,是建立癌症细胞工作中的logic逻辑模型的关键一步。
细胞网络由相互调节的基因组成。因此,一个基因的基因组改变可能会传播破坏系统所编码的一系列不同分子过程的功能。网络可以帮助将看起来非常不同的事件联系在一起,就像电路图可以让人们理解,当两个电灯开关打开时,如何打开房间另一边的一盏灯。两个患有同一亚型癌症的患者可能携带完全不同的突变,但了解基因转换的工作方式可以确定导致两个人患同一种疾病的潜在因果机制。
除了以通用的方式建立数据库外,癌症特异性基因组改变的发现也可以用来了解recurrent突变发挥作用的背景。可以通过将突变数据连接到数据库中来实现,这些数据库对基因产物之间已知的功能关系进行分类,例如蛋白质间的相互作用、转录调节和基于通路的关系。
然而,目前对控制细胞网络的功能交互的表述充满了假阳性和假阴性,并且一般不能解释实验系统、细胞背景和观测的可重复性。因此,合并网络信息的算法必须评估解决方案的鲁棒性,并应设计成在面对不确定性时表现良好。识别和整合明确的基因相互作用网络是建立能够代表扰动的癌细胞基因调节系统的计算模型的关键一步。
01
突变在基因-基因互作网络上的传播效应
Network-based stratification of tumor mutations[1]
该工作通过将新数据与之前构建的基因-基因互作网络相结合,实现网络集成。如果这两个数据集之前都在文献中被报道参与相同的生物过程,例如蛋白-蛋白相互作用、生化反应或共享的信号,则通过偶联基因(基于相关的置信度统计)实现整合。
对于每个独立的患者,从公共数据库中获得了人类基因互作网络,并将突变谱投射到该网络上。接下来,应用网络传播技术来传播每个突变谱对其网络邻居的影响(图1b)。其结果是一个“网络平滑”的谱,其中每个基因的状态不再是二进制的,而是反映了其网络与该患者中突变基因的连续范围[0,1]。在“网络平滑”之后,使用非负矩阵分解(NMF)的无监督技术,患者谱被聚类到一个预定义的子类型(k = 2,3,…12)(图1 c)。最后,为了使聚类的分配具有鲁棒性,使用一致性聚类分析1000次重复抽样(图1d)。
02
确定改变的癌症基因组对蛋白质磷酸化信号传导的影响
The mutational landscape of phosphorylation signaling in cancer[2]
通过蛋白激酶酶磷酸化蛋白底物是一种中枢信号转导机制,用于调节许多癌症相关过程。该工作发现大量的突变可以消除磷酸化位点,从而消除磷酸化信号。另外,发现体细胞突变影响到邻近磷酸化位点的残基,也导致了激酶信号网络重组。通过对激酶靶序列的详细研究,作者预测了突变导致kinase-based的信号转导网络中致癌的信号获得或丢失。也分析了癌症网络中反复发生的突变和富集的信号通路,以及在已知的癌症基因以及新的候选癌症基因和通路中发现了影响信号传导的突变。
该工作为了研究磷酸化信号通路中的癌症突变,收集了10185个人类蛋白中实验测定的87060个磷酸位点,并将其与TCGA pan-cancer中的241701个错义单核苷酸变异进行整合。其中查磷酸化位点侧翼区有±7个残基,覆盖了7%的蛋白序列。发现5859个基因中有16840个磷酸化相关的SNVs (pSNVs),占所有样本的89%,是之前发现的pSNVs的17倍以上。根据另一项衡量pSNV重要性的指标,1427个直接pSNV取代了中心磷酸化残基,从而破坏了磷酸化;尽管在已知的癌症基因如TP53和CTNNB1中经常出现,但这些突变在总体上并不多见。总的来说,预测有29%的pSNVs(4800)通过直接pSNVs或激酶网络rewiring的特定信号机制。
high-confidence网络包括534个互作中的392个pSNVs,仅包括用于信号获得和实验确定的激酶底物信号损失的最高得分激酶结合位点(图2a)。
03
将癌症driver映射到功能基因相互作用的网络中
Comprehensive identification of mutational cancer driver genes across 12 tumor types[3]
通过结合四种计算方法的结果,该工作提供了一份291个高可信度癌症driver基因(high confidence cancer driver genes,HCDs)的列表,这些基因作用于12种不同癌症类型的3205个肿瘤,旨在发现基因中反映肿瘤发生和进化过程中细胞阳性选择的信号。当将HCDs映射到一个功能互作网络时,它们似乎在5个大的调节范围内的生物学过程富集——染色质重塑、mRNA加工、细胞信号/增殖、细胞粘附和DNA修复/细胞周期——这与已建立的和出现的癌症特征大致相符(图3)。
这些新的候选driver基因与其他已经确定的癌症基因一起出现。可以假设,随着更多的肿瘤基因组测序,这些模块中将出现新的低复发性突变driver。图4a进一步说明了这一观点,图示细胞周期通路中显著的癌症基因与构建不良的HCDs。新的细胞周期driver候选包括ATR,一种磷酸化p53和其他蛋白的激酶,以及PIK3-AKT信号通路中的PIK3CG和PIK3CB,似乎补充了PIK3CA的致瘤作用。
04
癌症突变对调控RNA网络的影响
Analysis of microRNA-target interactions across diverse cancer types[4]
MicroRNAs (miRNAs)通过与转录本上的互补位点结合,调节转录本(mRNA)的稳定性和转译。miRNA和它们的靶mRNA形成了一个多对多网络。因此,扰乱miRNA-mRNA网络成分的基因组突变可能导致细胞调控网络的复杂破坏。
假设个体miRNA-target关系在多种癌症类型中活跃,并可能调节常见癌症,为了验证该假设,该工作开发了一rank-based的统计评分种方法,即REC评分。该方法将miRNA- mRNA表达相关性按照miRNA和癌症类型进行排序,并评估所有癌症类型中miRNA- mRNA对不存在相关性的原假设(图5)。
为了进一步分析复发泛癌miRNA-mRNA的关联是否捕获miRNA调控关系,评估了REC评分在预测miRNA在体外被实验干扰所引起的mRNA表达变化程度。在所有的miRNA扰动实验,发现这些REC靶点mRNAs在miRNA表达降低或抑制后,表现明显表达下调或上调(图3)。假设一致的是,复发pan-cancer miRNA-mRNA关联捕获microrna的监管关系
microrna的摄动分析的实验,我们发现,这些矩形目标mrna明显表达下调或调节microrna的表达降低或抑制后,分别(图3,P值范围:0.06 - -1.9×10 - 13,单侧Wilcoxon rank-sum测试7 < n < 179),与假设一致的是,复发性pan-cancer miRNA-mRNA关联能够识别miRNA 的调控关系。
143种假定的recurring靶点相互作用形成了一个由40个进化保守的miRNA和72个靶标mRNA组成的网络(图7b)。
05
测试网络分配的鲁棒性
Emerging landscape of oncogenic signatures across human cancers[5]
将突变模式和结构重排分类为彼此显著不同的模块,对所使用的输入数据很敏感。该工作进行了一些对照来测试模块分类的稳健性。在两个特征良好的数据集上测试了该方法,这些数据集经常用作网络模块化检测的基准。第一个网络称为Southern Women Event Participation网络,它反映了美国南方腹地女性参加社会活动的情况,使用的数据是Davis和他的同事在20世纪30年代收集来的,用以研究社会分层情况。对于这个网络,该工作的方法能够识别出网络的两模块结构,该结构与Guimerá和他同事们提出的解决方案一致,除了一名女性外,与进行这项研究的人种学家提出的主观解决方案是一致的。
通过去除不同百分比的样本和重新分类减少的数据集来评估亚型的稳健性。在每次运行时,通过将约简后的分类中的每个模块映射到最大重叠的原分类中的模块,将约简后的数据集得到的层次分层映射到原分类。发现分配给每个子类的样本是稳健的,因为它在系统的子抽样上变化很小。
06
用独立数据集验证结果
Emerging landscape of oncogenic signatures across human cancers[5]
对所选功能事件分布的进一步检查显示,在基因组不稳定的极端情况下,拷贝数改变和体细胞突变之间存在显著的反向关系,特别是在高度改变的肿瘤中(图8c)。这样的肿瘤要么有大量的体细胞突变,要么有大量的拷贝数改变,不会有两者都大量出现的情况。把这种趋势称为癌症基因组双曲线。
C类和M类肿瘤沿双曲线的两个轴定位。虽然个别肿瘤类型(由起源组织定义)有不同比例的拷贝数改变和突变,但没有一个是高数量的拷贝数改变和突变。通过添加6额外的肿瘤类型的907个肿瘤样本到3299个样本的pan-cancer 数据集,来验证这近似的逆向关系。在这个更大的数据集里又发现了两个主要的类,一种主要由突变决定,另一主要由拷贝数变异决定,一组非常相似的特征功能事件。
小编总结
对于样本网络的研究,是生信分析中非常重要的一部分,而突变产生的影响可以由网络进行传播破坏正常的分子功能,了解这种因果机制在研究中非常重要。今天向大家介绍了几个关于网络的泛癌研究,有基于网络研究突变的传播效应,有识别能够对蛋白质磷酸化信号传导产生影响的基因组变异,有构建driver基因的互作网络,突变对调控RNA网络的影响等等。网络的分析方法维度很广,大家可以多多学习借鉴哦~
引用:
[1] Hofree M, Shen JP, Carter H, Gross A, Ideker T. Network-based stratification of tumor mutations. Nat Methods. 2013;10(11):1108-1115. doi:10.1038/nmeth.2651
[2] Reimand J, Wagih O, Bader GD. The mutational landscape of phosphorylation signaling in cancer. Sci Rep. 2013;3:2651. Published 2013 Oct 2. doi:10.1038/srep02651
[3] Tamborero D, Gonzalez-Perez A, Perez-Llamas C, et al. Comprehensive identification of mutational cancer driver genes across 12 tumor types. Sci Rep. 2013;3:2650. Published 2013 Oct 2. doi:10.1038/srep02650
[4] Jacobsen A, Silber J, Harinath G, Huse JT, Schultz N, Sander C. Analysis of microRNA-target interactions across diverse cancer types. Nat Struct Mol Biol. 2013;20(11):1325-1332. doi:10.1038/nsmb.2678
[5] Ciriello G, Miller ML, Aksoy BA, Senbabaoglu Y, Schultz N, Sander C. Emerging landscape of oncogenic signatures across human cancers. Nat Genet. 2013;45(10):1127-1133. doi:10.1038/ng.2762