前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >非肿瘤单基因纯生信文章如何发3分+

非肿瘤单基因纯生信文章如何发3分+

作者头像
百味科研芝士
发布于 2020-06-24 10:05:50
发布于 2020-06-24 10:05:50
2.5K0
举报
文章被收录于专栏:百味科研芝士百味科研芝士

大家好,今天和大家分享的是今年3月份发表在Shock(IF:3.083)的一篇非肿瘤生信文章,“S1PR1-associated Molecular Signature Predicts Survival in Patients with Sepsis ”,本文作者通过生信手段去分析败血症患者的预后与已知预后相关基因S1PR1的相关基因的关系,快来学习一下吧!

标题:S1PR1-associated Molecular Signature Predicts Survival in Patients with Sepsis

S1PR1相关的特征基因预测败血症患者的预后

一.文章背景

败血症(Sepsis)是在感染情况下可能产生的威胁患者生命的一种并发症,而研究表明磷酸-1-鞘氨醇(Sphingosine-1-phosphate,S1P)及其受体S1PR1是败血症可能的治疗靶点以及分子标志物。基于以上背景,作者在本文中通过GEO数据库中研究败血症患者的外周血芯片数据去识别S1PR1相关的特征基因并以此预测败血症患者的预后状况。

二. 文章思路

三. 结果解析

1.识别生存相关基因和S1PR1相关基因

作者从GEO数据库获取了GSE54514和GSE33118这两个研究败血症患者的外周血芯片数据集,样本组成如下,分为存活者和未存活者两类情况。其中GSE54514样本量多作为探索数据集,GSE33118则作为验证集。

表1. 数据集信息 1. 关于S1PR1相关基因的识别,作者通过两种方法

  • 第一种方法是基因共表达分析(通过E-MTAB-4421数据集去分析,含265名败血症患者的芯片数据),作者通过分析基因表达量间相关性,找到557个与S1PR1有共表达关系的基因(表达量上调或下调的基因都被认为是S1PR1相关基因,|r|>0.4,FDR<0.05)。
  • 第二种方法是用STRING数据库从蛋白质互相作用角度去分析和S1RP1相关的基因,一共找到233个基因与S1PR1之间在蛋白质层面有较高的互作分数(interaction score>0.7)。
  1. 关于与败血症相关的生存相关基因,通过在败血症非存活者样本(n=9)和存活者样本(n=26)间的差异分析寻找与寻找。一共分析出1078个表达量上调的基因和1134个表达量下调的基因(limma包,FC>1.2,FDR<0.05)。

在找出两种方法的S1PR1相关基因后,分别于败血症患者的生存相关基因取交集(图1C,图2B),分别得到62个特征基因和16个特征基因。之后对两种方法得到的基因(图1A,图2B),生存相关基因(图1.B),以及取交集后的基因(图1.D,图2.C)做KEGG通路分析得到图一和图二的结果。图2D是在Cytoscape中用MCODE插件对STRING中获得的蛋白质相互作用网路做富集分析。

图1.第一种方法选出的62个特征基因

图2.第二种方法选出的16个特征基因

2.用S1PR1特征基因预测败血症患者的预后
  • 图3E图4E是分别做探索集中存活者和非存活者,其结果1中得到的两种S1PR1特征基因的表达量热图,可以看到两类型样本在特征基因的表达量上有很大差异。
  • 而图3.4中的生存曲线则是根据样本在特征基因总表达量上的中位值将样本分为高低表达组后进行生存分析。两类S1PR1特征基因都有显著的预后价值。低表达组有更差的预后水平。

图3.62个特征基因的预后分析

图4. 16个特征基因的预后分析

3.构建风险得分公式并评估效果

作者在用生存分析确定S1PR1特征基因有预后价值后,下一步构建风险得分公式,如下,作者通过对各组样本特征基因的表达量做z分数标准化,风险得分就是各特征基因z分数的线性加和,权重仅考虑该基因和S1PR1表达量上的相关性,即正相关Wi就取1,负相关Wi就取-1。(用Cox回归分析会不会更好呢?)

风险得分计算公式

根据两类特征基因的风险得分公式分别计算样本的风险得分后,在探索集和验证集中观察两类样本在风险得分上的差异(图5A.图6A)。之后用ROC(受试者功能曲线)法去检验两类风险得分在探索集和验证集中对败血症患者预后的区分能力(图5B.图6B)。

图C做的是从全部基因组中抽出相同数量的特征基因(10000次),用相同方法去构建风险得分公式并用ROC曲线法去检验其能力,通过核密度图去和前文得到的两类特征基因的分类能力做比较,相当于做了置换检验。从图中可以看出作者两类特征基因的分类能力确实要比随机产生的特征基因的预测能力好。意义在于检验是否存在随机的特征基因会有更好的预测能力(David Venet et al 2011年的一篇文章中提到过此方法)。

图5.62个特征基因的分类能力

图6.16个特征基因的分类能力

最后作者还用PCA法去检验两类特征基因在探索集和验证集中的分类能力。作者选了三个维度,可以看到两类特征基因在探索集中的分类能力较好,但在验证集中仍存在一些非存活样本和存活样本混合的情况。

图7. 62个特征基因的分类能力PCA

图8.16个特征基因的分类能力PCA

小结

那么今天的文献分享到这里就结束了,本文所作的工作并不多,无非是选了两个带有预后信息的败血症样本的芯片数据集,通过两种方法找到已知预后标志基因S1PR1的相关基因与差异分析得到的败血症患者预后相关基因取交集,通过线性加权做风险得分,最后直观比较两组在风险得分的差异,ROC法,PCA法检验分类能力。中间还有必须的对基因的功能富集分析,表达量热图等。文章通过生信手段对非肿瘤疾病预后的分析步骤清晰,适合我们学习。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 百味科研芝士 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
细胞焦亡基因构建预后模型,发表7分+SCI!
今天小编为大家带来一篇细胞焦亡构建预后模型+实验验证发表高分文章的例子。文章发表在Journal of Translational Medicine,题目为Systemanalysis based on the pyroptosis-related genes identifies GSDMC as a novel therapy target for pancreatic adenocarcinoma。
作图丫
2022/12/14
4930
细胞焦亡基因构建预后模型,发表7分+SCI!
非肿瘤研究如何利用公共数据库发表文章
目前很多对于公共测序数据的分析,很多都是集中在肿瘤数据当中,主要原因还是在于,肿瘤有一个TCGA的数据库。倒不是说TCGA数据库有多大的样本,而是在于TCGA数据库可以获得每个患者的临床数据。基于这些内容,我们在分析的时候,除了做基本的差异,同时可以看预后等等的。
医学数据库百科
2020/11/23
1.8K0
非肿瘤研究如何利用公共数据库发表文章
7+:最新的单基因单肿瘤分析思路!
EVA1B是一种蛋白质编码基因,是EVA1A基因的关键同源基因。本研究探讨EVA1B在结直肠癌(CRC)进展和预后中的作用。
作图丫
2022/03/28
1.1K0
7+:最新的单基因单肿瘤分析思路!
纯生信公共数据分析怎样才能发到11分+?
癌旁组织在肝细胞癌(HCC)患者中的预后作用仍不清楚。癌旁与癌症组织发挥作用的基因集可能存在差异。
作图丫
2022/03/29
3370
纯生信公共数据分析怎样才能发到11分+?
就这?也能发4+分?!!!
今天和大家分享的是2019年9月发表在Front Oncol(IF:4.137)上的一篇文章,“Genomic Signatures of Immune Activation Predict Outcome in Advanced Stages of Ovarian Cancer andBasal-Like Breast Tumors”。作者利用已建立的转录组免疫特征来识别预后良好的晚期卵巢癌和晚期基底样型乳腺癌患者;组合其中的4个基因,作为整体预测晚期患者的生存期,并进行肿瘤免疫浸润分析。
科研菌
2020/07/15
5240
就这?也能发4+分?!!!
深度解读5分+纯生信文章:都是方法,但还是有“贵贱”之分
无监督学习方法通常用于分析基因组平台数据。然而这些方法忽略了前列腺样本中的大量的异质成分。那么这篇文章的研究的目的就是使用更复杂的分析方法对前列腺癌转录组数据的结构进行反卷积,为该疾病提供新颖的临床可行信息。其发表在British Journal ofCancer上,影响因子5.416。
百味科研芝士
2020/06/24
1.3K0
深度解读5分+纯生信文章:都是方法,但还是有“贵贱”之分
灵活选择基因集,你也能发6分+!
范可尼贫血(FA)通路是一种典型的、多酶调节的DNA损伤修复剂,它影响着包括癌症在内的疾病的发生和发展。关于FA相关基因(FARGs)的作用及其在癌症中的预后价值的综合分析报道很少
作图丫
2022/03/29
4580
灵活选择基因集,你也能发6分+!
生信文章思路不够清晰?学学这篇文章
今天和大家分享的是2020年1月发表在AGING(IF:4.831)上的一篇文章,“Prediction of hepatocellular carcinoma prognosis based on expression of an immune-related gene set”,作者结合多因素cox回归分析,ssGSEA富集分析等方法开发了基于免疫的HCC预后预测模型(IPSHCC),并用4个训练集对模型的准确性进行验证;此外,作者还将IPSHCC模型与年龄、分期等临床特征相整合,使其预后价值进一步增强。
科研菌
2020/07/09
7330
生信文章思路不够清晰?学学这篇文章
8分+的肿瘤免疫浸润和预后模型的文章思路!
头颈鳞状细胞癌(HNSCC)是全球人类最常见的第六大恶性肿瘤,每年约有60万例新诊断病例。超过50%的HNSCC的患者被诊断时处于晚期,晚期HNSCC预后较差,治疗方法有限。免疫治疗由于其安全性和不良反应较少,可能会对晚期HNSCC患者产生更好的治疗效果
作图丫
2022/03/29
1.4K0
8分+的肿瘤免疫浸润和预后模型的文章思路!
如何筛选单基因进行诊断发3+分
今天和大家分享的是19年12月发表在OncoTargets and Therapy (IF:3.34)杂志上的一篇文章,“Potential Prognostic and Diagnostic Values of CDC6,CDC45, ORC6 and SNHG7 in Colorectal Cancer”,作者在R中使用了Affy和Limma包对四个GEO数据集和TCGA进行DEGs和DELs差异分析,然后采用了GO和KEGG富集分析,KM生存曲线和COX回归分析寻找与结直肠癌(CRC)患者生存结果相关的异常表达基因,并结合了实时PCR对CRC样品中异常表达的基因进行检测。
科研菌
2020/08/31
8570
如何筛选单基因进行诊断发3+分
值得借鉴!公开数据库加点湿实验就发了7分+SCI!
今天和大家分享的是2020年7月发表在cancer letters(IF=7.36)的一篇文章 "Identification of a nomogram based on long non-coding RNA to improve prognosis prediction of esophageal squamous cell carcinoma ", 作者使用多个数据集确定了9个与早期LUAD病人RFS和OS相关的IBRS。
科研菌
2020/11/23
7470
值得借鉴!公开数据库加点湿实验就发了7分+SCI!
6+超简单的单基因分析套路!快来学习吧~
肝细胞癌 (HCC) 是一项全球性的健康挑战。早期诊断需要有效的生物标志物,以提高 HCC 患者的存活率。核酸外切酶 1 (EXO1) 在 DNA 修复和重组机制中起重要作用。
作图丫
2022/12/14
7980
6+超简单的单基因分析套路!快来学习吧~
【生信文献200篇】68 使用深度学习对多组学数据找预后标记物
英文标题:Deep Learning-Based Multi-Omics Integration Robustly Predicts Survival in Liver
生信菜鸟团
2021/10/12
1.9K0
进来抄作业 | 蹭诺奖热点,7分+基因集肿瘤分型思路
缺氧,作为19年诺奖,毫无疑问是近年来的研究热点。但是作为热点,意味着相关的研究或者文章肯定不会少。想要找到合适的,并且别人没做过的思路就显得比较难了。
用户6317549
2022/04/09
7560
进来抄作业 |  蹭诺奖热点,7分+基因集肿瘤分型思路
单基因肿瘤生信分析依然可以发表6分+
小编今天为大家带来一篇单基因单肿瘤的生信分析文章,发表在Front. Oncol上,影响因子6分+,题目为Identification of the novel prognostic biomarker, MLLT11, reveals its relationship with immune checkpoint markers in glioma。
作图丫
2022/12/14
9530
单基因肿瘤生信分析依然可以发表6分+
细菌性败血症的免疫细胞特征
当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步。不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长。
生信技能树jimmy
2020/04/08
1.4K0
细菌性败血症的免疫细胞特征
选对基因,单基因单癌仍然可以发高分!
IL27在肿瘤免疫微环境中具有双重作用,既可以诱导免疫反应,又可以通过抑制免疫功能刺激肿瘤扩张。然而,IL27是否可以作为预测生存和免疫治疗反应的生物标志物尚不清楚。此外,IL27对肿瘤的双重作用机制尚不清楚。
作图丫
2022/03/29
8700
选对基因,单基因单癌仍然可以发高分!
看似平平无奇的癌症分型怎样才能发8分+?
使用免疫相关通路对癌症分类,有助于早期肝癌的鉴别和有效治疗,提高预后评估的准确性。
作图丫
2022/03/29
4010
看似平平无奇的癌症分型怎样才能发8分+?
利用WGCNA识别肺鳞状细胞癌关键基因巧妙发4分+
今天解读的这篇文章是2020年发表在International Journal of Molecular Sciences杂志上(影响因子4.183)。题目是Identification of Key Genes Related to Lung Squamous Cell Carcinoma Using Bioinformatics Analysis.本文使用生物信息学分析,确定了一些重要的生物标志物,用于进一步研究肺鳞状细胞癌的治疗方法和预后方法。
DoubleHelix
2020/07/03
1.5K0
利用WGCNA识别肺鳞状细胞癌关键基因巧妙发4分+
利用代谢相关基因构建列线图是如何发4分+SCI的?
大家好!今天跟大家分享的文献是2020年9月发表在Molecular Therapy-Oncolytics(IF=4.115)杂志上的一篇文章。文章利用TGCA数据库中肺癌患者的转录组数据,使用代谢基因特征建立预测模型,预测患者的生存时间。构建列线图预测患者的3年和5年生存率。
百味科研芝士
2021/01/06
1.1K0
利用代谢相关基因构建列线图是如何发4分+SCI的?
推荐阅读
相关推荐
细胞焦亡基因构建预后模型,发表7分+SCI!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档