RNA-seq数据进行差异基因鉴定后,通常会进行GO、KEGG或者GSEA分析。这些都是较为常见的分析流程。此外差异基因集还可以进行更广泛的富集分析,如人类疾病、人类表型、药物等富集分析。这些富集分析较为个性化,网上教程也比较少。为了让更多人能够利用好转录组数据,在此以实操截图的方式讲解RNA-seq中级分析内容。
这个网站同时收录在本站的生物网站导航页面下的富集转录中。可以直接点击WebGestalt图标即可跳转到网址页面,也可以输入其网址(https://www.webgestalt.org/)
第一步.进入网址后,1.选择Over-representation Analysis ;2物种选择人类(homo spapiens);3Fuctinoal Database 富集选项选择DIsease疾病,4:数据库有两个,DIsgenet和OMIM两个数据库,选择任一,后续可以选择第二种。5.在对应位置输入基因名字或者ID。如下是选择的基因名。6.选择参考基因组,一般选择genome。
第二步:在高级参数下需要自主选择的就是显著水平(significance level)可以先选FDR 输入0.05(筛选FDR<0.05),第二次选TOP,输入 20(筛选前20的terms),然后点击submit提交分析。
第三步:通常1-2分钟便可出现结果。首先是Job summary 任务概况(确认关键信息是否正确。标记为3的地方是基因转换为Entrezgen ID的数量。4是富集筛选条件。5是富集的数量。
第四步:看GO条目的总结。这个也是任何在这个网址进行基因富集分析都会出现的GO条目总结。包括生物学过程、细胞组分、分子功能三个图。
第五步:查看富集结果:1是选择是否要减少重复类似的条目。由于富集的数据集太少,所以没有选择Weighted set cover选项。标记为2或3是富集结果的不同展示。表格形式还是柱状图。 4是富集的疾病及相关富集倍数,数量与统计显著性。
可选:当选择Bar chart时候,会出现如下所示图,点击图片,跳出下载方式,选择SVG格式就可以后续矢量图进行编辑。
第六步是查看单个富集的条目详情:1是选择需要查看的富集条目,2是查看富集显著性;3是哪些差异基因富集到这个类风湿关节疾病中。
第七步:下载富集结果。点击页面右上角的Result Download按钮,下载压缩文件到本地电脑中并解压。
第八步:下载的文件类型解读:1是富集的条目,如果没有选择Weighted set cover,将会是所有富集到的疾病类型。2是富集结果。就是在第六步表格与第7步基因信息的汇总。3是第四步所展示的GO 三组图。4是具体每一个基因在这三组类型中的分布。5,6分别是基因从gene symbol转化为entregene DI信息。6是Unmap的基因。7是第3-7步页面的网页文件。
第九步:富集文件解析:这个文件是txt格式,可以用电子表格excel打开。我们关注下面4个参数。1是富集的疾病类型;2是富集的基因数量。3.富集的倍数;4.显著性FDR值。
2.利用在线网站微生信进行差异基因疾病富集图绘制
步骤1:打开生物网站导航,在科研绘图栏点击“微生信”(网址是:http://www.bioinformatics.com.cn/),进行注册使用。
步骤2:该网站许多图制作大部分是免费的。而收费项目一般是高级绘图项目(做一次图大概0.4元)。整个网站设计比较人性化,便于操作。因此自己即便会R语言,也会用这个网站来作图。方便快捷,不用调整代码来优化图片。如下图所示,选择转录组绘图中的GO,Pathway图选项。
步骤3.选择合适的图形进行绘制。如果只有一组数据选择多类型气泡图。如果是多个基因集进行差异比较,选择2 矩阵点图气泡图。
步骤4.当我们选择多类型气泡图后,弹出新页面下,这个绘图是免费的。随后熟悉关键部分:1是必需输入框选项。可以点击示例输入示例数据,了解数据格式。也可以直接从电子表格中复制数据粘贴到数据框中。绘图的参数省略过。2是P或者FDR是否需要取-log10.一般选默认取。3是颜色选项。选红绿或者红蓝的比较多。输入数据调整参数,直接点击提交,结果出现在新页面中。
步骤5:数据的准备:了解到绘图输入数据格式后。将之前在WebGestalt进行的疾病富集分析文件进行数据提取。需要提前的数据列包括 Description(对应Descrtiption)、Overlap(对应Count)、enrichmentRatio(对应Enrichment)、FDR(对应Pvalue)四列信息。而绘图数据有5列。还有一列Class选项自定义。我们定义为UP(上调基因组)
步骤6.将上述整理后的数据从电子表格直接复制粘贴到网站必要输入数据框中,并点击输入检查,查看数据格式是否有误。
步骤7.提交数据进行图片在线绘制。根据步骤4的说明进行提交,跳转页面后,在页面右侧出现图片结果。选择PDF或者SVG格式保存。
后记:本系列专题将多次在webgestalt网站(https://www.webgestalt.org/)进行多种个性化富集分析, 以及在“微生信”(网址是:http://www.bioinformatics.com.cn/)进行绘图。因此作为本系列第一篇文章,对两个网站上进行了相对详细的介绍。在后续文章中会省略两个网站分析结果中与主题无关内容介绍(如富集分析结果概括、差异基因在GO三个条目上的分布等,第一部分的第3-4步)。