前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GEO2R:对GEO数据库中的数据进行差异分析

GEO2R:对GEO数据库中的数据进行差异分析

作者头像
生信修炼手册
发布2020-05-08 17:12:09
4K0
发布2020-05-08 17:12:09
举报
文章被收录于专栏:生信修炼手册

欢迎关注”生信修炼手册”!

GEO数据库中的数据是公开的,很多的科研工作者会下载其中的数据自己去分析,其中差异表达分析是最常见的分析策略之一,为了方便大家更好的挖掘GEO中的数据,官网提供了一个工具GEO2R, 可以方便的进行差异分析。

从名字也可以看出,该工具实现的功能就是将GEO数据库中的数据导入到R语言中,然后进行差异分析,本质上是通过以下两个bioconductor上的R包实现的

  1. GEOquery
  2. limma

GEOquery用于自动下载GEO数据,并读取到R环境中;limma是一个经典的差异分析软件,用于执行差异分析。

一组样本在GEO数据库中用series表示,比如GSE25724, 包含了case和control两组样本,case组包含6个生物学重复,control组包含7个生物学重复,共13个样本,链接如下

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE25724

在网页上可以看到GEO2R的按钮,点击这个按钮就可以进行分析了, 除了差异分析外,GEO2R还提供了一些简单的数据可视化功能。

1. Value distribution

该选项用箱线图展示所有样本中表达量的分布,结果示意如下

2. Profile graph

该选项用于展示某个探针/基因在所有样本中的分布,结果示意如下

点击Sample values, 可以看到对应的表达量值,示意如下

GEO2R进行差异分析的步骤如下

1. 定义样本分组

通过Define groups按钮定义样本分组,首先输入一个group的名字,然后选择对应的样本,示意如下

2. 参数调整

通过页面下方的Options菜单,可以调整差异分析时的参数,示意如下

第一个参数用于选择多重假设检验的P值校正算法,第二个参数表示是否对原始的表达量进行log转换,第三个参数调整最终结果中展示的对应的platfrom的注释信息,是基于客户提供的supplement file中的信息, 还是使用soft文件中的信息。

3. 执行

点击如下所示的Top 250按钮,执行差异分析。

结果示意如下,在页面上只显示最显著的250个差异基因

全部基因的结果可以通过Save all results导出,通过GEO2R, 可以在没有任何编程基础的情况下,顺序的完成差异分析。

·end·

—如果喜欢,快分享给你的朋友们吧—

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Value distribution
  • 2. Profile graph
  • 1. 定义样本分组
  • 2. 参数调整
  • 3. 执行
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档