S1PR1-associated Molecular Signature Predicts Survival in Patients with Sepsis
S1PR1相关的特征基因预测败血症患者的预后
败血症(Sepsis)是在感染情况下可能产生的威胁患者生命的一种并发症,而研究表明磷酸-1-鞘氨醇(Sphingosine-1-phosphate,S1P)及其受体S1PR1是败血症可能的治疗靶点以及分子标志物。基于以上背景,作者在本文中通过GEO数据库中研究败血症患者的外周血芯片数据去识别S1PR1相关的特征基因并以此预测败血症患者的预后状况。
作者从GEO数据库获取了GSE54514和GSE33118这两个研究败血症患者的外周血芯片数据集,样本组成如下,分为存活者和未存活者两类情况。其中GSE54514样本量多作为探索数据集,GSE33118则作为验证集。
表1. 数据集信息 1. 关于S1PR1相关基因的识别,作者通过两种方法
在找出两种方法的S1PR1相关基因后,分别于败血症患者的生存相关基因取交集(图1C,图2B),分别得到62个特征基因和16个特征基因。之后对两种方法得到的基因(图1A,图2B),生存相关基因(图1.B),以及取交集后的基因(图1.D,图2.C)做KEGG通路分析得到图一和图二的结果。图2D是在Cytoscape中用MCODE插件对STRING中获得的蛋白质相互作用网路做富集分析。
图1.第一种方法选出的62个特征基因
图2.第二种方法选出的16个特征基因
图3.62个特征基因的预后分析
图4. 16个特征基因的预后分析
作者在用生存分析确定S1PR1特征基因有预后价值后,下一步构建风险得分公式,如下,作者通过对各组样本特征基因的表达量做z分数标准化,风险得分就是各特征基因z分数的线性加和,权重仅考虑该基因和S1PR1表达量上的相关性,即正相关Wi就取1,负相关Wi就取-1。(用Cox回归分析会不会更好呢?)
风险得分计算公式
根据两类特征基因的风险得分公式分别计算样本的风险得分后,在探索集和验证集中观察两类样本在风险得分上的差异(图5A.图6A)。之后用ROC(受试者功能曲线)法去检验两类风险得分在探索集和验证集中对败血症患者预后的区分能力(图5B.图6B)。
图C做的是从全部基因组中抽出相同数量的特征基因(10000次),用相同方法去构建风险得分公式并用ROC曲线法去检验其能力,通过核密度图去和前文得到的两类特征基因的分类能力做比较,相当于做了置换检验。从图中可以看出作者两类特征基因的分类能力确实要比随机产生的特征基因的预测能力好。意义在于检验是否存在随机的特征基因会有更好的预测能力(David Venet et al 2011年的一篇文章中提到过此方法)。
图5.62个特征基因的分类能力
图6.16个特征基因的分类能力
最后作者还用PCA法去检验两类特征基因在探索集和验证集中的分类能力。作者选了三个维度,可以看到两类特征基因在探索集中的分类能力较好,但在验证集中仍存在一些非存活样本和存活样本混合的情况。
图7. 62个特征基因的分类能力PCA
图8.16个特征基因的分类能力PCA
小结
那么今天的文献分享到这里就结束了,本文所作的工作并不多,无非是选了两个带有预后信息的败血症样本的芯片数据集,通过两种方法找到已知预后标志基因S1PR1的相关基因与差异分析得到的败血症患者预后相关基因取交集,通过线性加权做风险得分,最后直观比较两组在风险得分的差异,ROC法,PCA法检验分类能力。中间还有必须的对基因的功能富集分析,表达量热图等。文章通过生信手段对非肿瘤疾病预后的分析步骤清晰,适合我们学习。
还是和以前一样,后台回复[20f]即可获取我们今天分享的文献啦!