GEO2R 是一个交互式网络工具,允许用户比较GEO系列中的两组或多组样品间鉴定在实验条件下差异表达的基因。GEO2R 使用 DESeq2 、GEOquery 和 limma 对 NCBI 计算的原始计数矩阵进行差异表达分析。生信技能树公众号就介绍过:作者仅提供了fpkm格式表达量矩阵的转录组测序数据集该如何重新分析呢
它可以处理各种实验设计和数据类型,并可以对P值进行多次测试校正,以帮助纠正错误的发生。因此,对于不熟悉利用R进行分析的小伙伴非常友好!这里,我们有必要带领大家熟悉一下该在线工具的使用:
1. 以数据集为例,其包含60个经典细胞系,15个药物处理组,数据量信息较大。
2. 使用GEO2R进行分析 ,只有显示"Analyze with GEO2R"的数据集才可以进行此分析。
3. 在“Set”处可以选择需要展示的列表信息。
4. 这里,我们仅以其中一个细胞系为例进行分析,这样分组比较清晰,就是不同浓度的cisplatin药物处理不同时间,两个变量的不同梯度,差异分析的组合还是在合理范围。在“Define groups”处对组别进行定义。
5. 定义组别,点击enter键保存分组。然后,把相应的样本归属到不同组别中。直接选中相应的样本,点击对应的组别即可。
6. 设置分析参数,平台最多可以进行5个比较组的分析。
7. 点击Analyze分析即可。但是,因为我选择的样本每组只有一个生物学重复,因此结果报错了。
当重新选择分组,每组包含多个生物学重复后,再次分析就可以生成相应的火山图,底下是所有的差异基因信息。
8. 结果文件包括基因探针名、校正的P值、P值、T检验、logFC值、基因名,直接下载就可以得到所有的差异基因的信息了。
9. 对结果进行解读(详情查看:https://www.ncbi.nlm.nih.gov/geo/info/geo2r.html#interpret )
是不是看起来跟自己写代码一模一样的差异分析一条龙啊!