对RNA-seq差异基因进行转录因子富集分析较为常见,对研究转录调控的重要环节,有大量的文章、数据及数据库来研究整理不同的转录因子的调控作用。而这里我们不作过于广泛的去研究转录调控的作用,只从几个在线数据网站进行简单分析。
1.在线分析网站:WEBGestalt,KnockTF2.0 ChIP-altas.这三个网站在生物网站导航页面中都有直接的跳转链接。
2.在线作图网站:微生信
步骤1:打开网站,如下进行选择。关键是3选择Network,4选择Transcription factor target. 5在所位置粘贴基因集,6选择genome 选项。8选择FDR<0.05或者选择Top20。9提交分析。
步骤2:分析结果:我们选择了Top20的富集结果,如下图所示,只有前8个是FDR小于0.05。然后点击3处,下载文件。
步骤3:富集文件解释:在文件中第一列是转录因子motif名称。2是这个转录因子集与差异基因集的交集基因数量。3是富集倍数。4是P值。5所在位置是差异基因名称。
这个数据库是专门研究敲除或者敲掉转录因子后的基因表达数据库。可以分析哪些基因收到哪些TF敲除敲低影响最大。同时也可以进行转录因子富集分析
步骤1:打开网站,点击界面上方的分析Analysis中T(co)F enrichment选项。然后将基因输入到3所在位置。4所在位置Homo sapiens。 5所在位置P-value选默认。6点击提交。
步骤2:结果所示:点击1进行下载。
步骤3:富集结果文件说明:第一是转录因子,2是转录因子互作基因数量。3是p值。4是转录因子互作基因(是我们提交的差异基因中)
三、ChIP-Altas进行转录因子富集分析
步骤1:登录ChIP-Altas网站。点击Enrichment Analysis。在2所在位置CHIP-TF and others. 3是选择细胞类型。根据RNA-seq数据细胞类型进行特定选择。这里选择了Blood。 4所在位置选择阈值,越低Peaks数量越多。在5所在位置输入基因集。6选择默认值。7可以调整基因启动子范围。一般选默认。最后提交。
步骤2:等待分析结果:一般在5-10分钟完成分析。
步骤3:分析结果后,会显示结束字样。2复制下载链接,直接复制到下载工具进行下载。或者点击页面后,复制页面内容粘贴到电子表格。3.打开页面结果。
步骤4:页面富集结果:1是转录因子信息。3是细胞类型。4是交集基因数量。 6是log10(p值)结果。7是log(Q(FDR)值)。8是富集倍数。
步骤5:在电子表格中。通过筛选特定细胞类型进行后续可视化分析。
作图:与GO,KEGG图相同操作。参考前几篇文章相关作图步骤。