生信论文的套路
生信论文36是单基因分析的生信论文,单纯生信数据库的数据分析,没有湿实验验证,但是可以发表在接近5分的期刊上,很多分析做得很棒,值得借鉴。我们对文章数据进行复现。
第一部分,差异分析,已经复现。
第二部分,临床意义,已经复现。
第三部分,免疫浸润(TIMER数据库),复现如下。
免疫浸润结果分析是生信分析的难点之一,也是果友们沟通交流最多的地方,因为免疫学涉及的内容原理性强,需要理解和积累。我们重点介绍本次重点分析TIMER数据库的使用。
在差异分析和临床意义部分的基础上,作者进行免疫浸润分析。前面的差异分析和临床意义是做筛选,筛选后的免疫浸润分析,是升华。TIMER旧版本是按照类型逐个列出,分7个模块,其中前6个模块是对TCGA数据库的分析展示,第7个模块是对免疫细胞浸润比例进行评估,需要上传数据。在生信论文36实际分析过程中,主要用Gene module(基因表达与免疫浸润细胞丰度的关系),Diff Exp(转录水平的差异分析)和Correlation(基因表达与基因表达的相关性)。
TIMER2.0版本则将分析内容归类,分为免疫关联(immune association)、肿瘤探究(cancer exploration)和免疫评估(immune estimation)。TIMER2.0数据更全面,结果多以热图形式展示,对于免疫浸润分析,反而不如旧版本直观。
-----------复现-----------
登陆TIMER网站,在基因模块,数据基因名称和肿瘤类型,基因只能输入一个,但肿瘤类型可以输入多个。
然后点击submit,生成图片如下。因数据库有更新,所以目前得出的分析结果跟论文展示的数据稍有差别,但是整体趋势,包括相关性和p值等基本一致。
相关性模块,可以对肿瘤中两种基因表达的相关性做分析。我们可以根据作者提供的相应免疫细胞的maker,去做兴趣基因与这些分子表达的相关性。
在相关性模块下,选择肿瘤类型,输入基因名称,待分析的基因,并选择相关性矫正选项(None或者Tumor purity)。
在None,无矫正的条件下,得出cor数值和p值。
在tumor purity矫正的条件下,得出cor数值和p值。
利用word表格形式,编辑相关性分析的结果(数据太多,PPT放不开)。
在相关性分析模块,输入基因名称和免疫细胞的maker(以单核细胞为例,CD86和CSF1R)。
点击submit即可。
然后依次做分析,最后在PPT里面编辑。即可得到类似的结果图。
至于最后用GEPIA数据库的相关性分析功能,确认LAYN基因表达与免疫细胞分子标记表达的相关性,这是一种非常好的数据库结合分析,属于双确认。
这样,关于生信论文36的复现就全部完成了。