目前,纯生信分析发文依然是如火如荼,但随着审稿人的审美疲劳,其口味也越来越挑。纯生信文章不再那么容易满足审稿人的味蕾了,所以,“生信分析+实验验证”也是目前生信类高分文章的整体套路。到底怎样将生信分析与实验验证完美的整合呢?今天,一起学习一篇6.68分的文章,看看 “别人家的套路吧”!
文章的题目是:Identification of AUNIP as a candidate diagnostic and prognostic biomarker for oral squamous cell carcinoma.
下面,和大家一起分解作者的套路:
一、研究材料
1
临床样本
包含89个口腔鳞状细胞癌(OSCC)样本和16个正常对照样本(癌旁组织) 组织微阵列芯片。另外是4对OSCC和相匹配的正常口腔组织样本。这些临床样本均含有临床病理特征的数据。
2
生信数据
从GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)中选择了GSE30784,GSE3524,GSE78060,GSE41613四张芯片,然后下载原始文件(.CEL文件)和平台文件(GPL文件)。使用R/Bioconductor中的“affy包”和“impute包”对每个GEO数据集的矩阵数据进行背景校正,归一化,log2转换和缺失值补充。GEO数据就处理完了。通过TCGA数据库(https://www.cancer.gov)和FireBrowse数据库(http://www.firebrowse.org)中下载与OSCC相关的相关文件(.count文件)和临床信息。
二、上调差异表达基因(DEG)的筛选
以log2FoldChange(FC)>1且adjusted P-value<0.01作为上调差异基因的筛选标准,筛选GSE30784, GSE3524,and GSE78060三张芯片中上调的差异基因,然后求三张芯片的交集,最终筛选出来了90个重叠的上调的DEG,再利用TCGA数据库对这90个上调的DEG进行验证,结果是一致的。
上调的DEG交集的韦恩图:
TCGA数据库验证的热图:左边是正常组织,右边是肿瘤组织。
三、鉴定诊断OSCC的关键基因
通过ROC曲线分析,并比较AUC值,以评估上述90个候选基因在TCGA数据库中诊断OSCC的敏感性和特异性。根据其AUC值(<0.940)列出了TOP10基因,表明这些基因对OSCC的诊断意义最高。为了验证这10个基因对OSCC的诊断意义,再次在GSE30784数据集中进行了ROC曲线分析。
AUNIP在癌症中的表达和功能不明确,因此,作者提出了AUNIP作为本研究的目标基因。确定了目标基因后,建立Logistic回归模型,以进一步评估AUNIP在诊断OSCC中的有效性。通过构建五倍交叉验证的AUNIP的ROC曲线和混淆矩阵,结果明确了AUNIP在OSCC样本中的诊断价值。
四、AUNIP的高表达与OSCC的进展和
肿瘤纯度的分析
利用TCGA数据,首先是正常样本与肿瘤样本的差异比较(a);其次分析了AUNIP的不同表达水平与OSCC患者临床病理特征之间的相关性,HPV感染、基质评分、免疫评分、组织学分级、肿瘤T分期这五个特征均得出了有统计意义的差异。
通过分析,AUNIP的表达与ESTIMATE得分(使用TCGA样本的表达数据估计恶性肿瘤组织中的基质细胞和免疫细胞的值)呈负相关,表明AUNIP与OSCC的肿瘤纯度呈正相关。
最后,再通过Western blotting和IHC染色检测AUNIP的蛋白表达,其结果与OSCC组织中的mRNA表达一致。Western显示了OSCC患者中AUNIP过表达(图a)。在IHC染色中,与正常对照(图b-c)和成对的相邻正常口腔组织(图d)相比,OSCC组织中的AUNIP过表达。通过IHC染色的ROC曲线分析获得的AUC值为0.725,且具有统计学意义,支持AUNIP对OSCC的诊断价值(图f),并且AUNIP蛋白表达随着恶性肿瘤的进展而增长(通过组织学等级的改变来反映:图c;图e)。以上实验得出了AUNIP在OSCC中的潜在致癌作用的结论。
五、WGCNA网络构建和关键模块的识别
还记得之前剩下的一个GEO芯片GSE41613吗?GSE41613数据集包括97名OSCC患者,并提供详细的总体生存信息,适合于WGCNA的构建。所以可以将模块特征基因与OSCC患者的生存数据联系起来。通过WGCNA,发现黄色模块与OSCC患者的生存时间最相关,而AUNIP是MM>>0条件下的基因之一,因此,AUNIP被认为是黄色模块中的中枢基因之一。
六、基因功能注释和GSEA
为了进一步探索AUNIP在OSCC中的潜在生物学功能,作者基于WGCNA中的拓扑重叠构建了与AUNIP正相关的134个基因的网络(图b),发现这些基因在306个来自TCGA数据库的OSCC样本中的表达谱数据相似(图c)。
对这些基因进行GO和KEGG的分析。
AUNIP在OSCC中的GSEA分析。
鉴于关键分子在OSCC的细胞周期调控,DNA修复和HPV感染中起着至关重要的作用。通过相关分析来评估TCGA数据库的OSCC样本中的AUNIP与几个基因之间的关系。最终推断AUNIP可以调节有丝分裂细胞周期的进程,与OSCC中的HPV感染有关,并在肿瘤发生过程中起重要作用。
七、细胞实验验证
为了验证上述生物信息学分析的结果,在SCC-9和SCC-15两株OSCC细胞系中将AUNIP敲减(图a,b)。AUNIP完全敲出后,OSCC细胞中的集落形成显着减少(图 c)。
流式细胞仪分析细胞周期,如图d。观察到AUNIP敲减后的OSCC细胞停滞在G0/G1期,证实了AUNIP在控制细胞周期进程中的重要作用。
八、AUNIP的高表达与OSCC的预后的关系
AUNIP具有潜在的致癌能力,值得探讨AUNIP在OSCC中的预后价值。GSE41613和TCGA数据中,将AUNIPmRNA表达与临床预后数据结合,进行Kaplan-Meier生存分析和Log-Rank检验,均发现AUNIP的高表达与OSCC的预后不良相关。
最后,分别进行单因素和多因素分析。单因素分析发现具有统计学意义的7个指标是AUNIP表达,放疗,淋巴管浸润,神经侵犯,肿瘤分期,肿瘤T期和肿瘤N期。多因素分析表明,AUNIP可被视为OSCC的独立预后的指标。
套路总结
1、TCGA和GEO数据的下载和上调的差异基因的筛选,及两个数据库相互验证;
2、通过ROC曲线分析及AUC的比较,鉴定出诊断OSCC的关键基因,确定候选的目标基因;
3、目标基因的表达与肿瘤纯度和肿瘤进展的生信分析,WB和免疫组化检查蛋白表达与基因表达的一致性;
4、WGCNA识别关键模块及鉴定中枢基因;
5、与目标基因相关的基因的功能注释(GO/KEGG)和目标基因的GSEA;
6、细胞实验验证:主要是针对目标基因功能的验证,包括基因敲减和流式检测。
7、预后的分析:生存曲线绘制、单因素和多因素分析。
8、得出实验结论:肿瘤诊断及预后的标记物。
生信分析还是常规的生信分析,实验也是常规的实验,当它们结合时候,必然会擦出高分SCI的火花,难道这不是套路吗?关注百味科研芝士,一起学习科研套路!如需生信分析服务也可以与小编联系哦。原文获取方式,后台回复关键词:20200214