前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >gpl16699平台的探针注释到基因名(十一月学徒投稿)

gpl16699平台的探针注释到基因名(十一月学徒投稿)

作者头像
生信技能树
发布2019-11-09 19:00:12
2.2K0
发布2019-11-09 19:00:12
举报
文章被收录于专栏:生信技能树

生信技能树jimmy大神分享过芯片探针注释到基因名的3种方法:

  • 1金标准当然是去基因芯片的厂商的官网直接去下载
  • 2一种是直接用bioconductor的包
  • 3一种是从NCBI里面下载文件来解析

我作为11月学徒马上就收益了,也总结一下,分享广大粉丝!

现在我完成作业就遇到了gpl16699平台,它并没有bioconductor的包,所以需要下载gpl平台的soft文件,进行注释,官网https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL16699 可以看到信息如下:

image-20191104214410497

现在使用r代码完成这个步骤

方法一:使用GEOquery包

代码语言:javascript
复制
rm(list = ls())  ## 魔幻操作,一键清空~
options(stringsAsFactors = F)
library(GEOquery)
gpl=getGEO("GPL16699",destdir = '.')
names(Meta(gpl))
Table(gpl)[1:10,1:2]
ids=Table(gpl)[,c("NAME","GENE_SYMBOL")]
head(ids)
colnames(ids)=c('probe_id','symbol')
head(ids)

这一个方法需要网速保障,并且确保下载的GPL完整,不然会影响后面的操作。

方法二:下载txt文件

在官网https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL16699 下载txt文件

image-20191104214744842

读取它的代码如下:

代码语言:javascript
复制
rm(list = ls())  ## 魔幻操作,一键清空~
options(stringsAsFactors = F)
gpl=read.table("GPL16699-15607.txt",
               header = TRUE,fill = T,sep = "\t",
               comment.char = "#",
               stringsAsFactors = FALSE,
               quote = "")
head(gpl)
colnames(gpl)
ids=gpl[,c("NAME","GENE_SYMBOL")]
head(ids)
colnames(ids)=c('probe_id','symbol')
head(ids)

这个就是gpl16699的探针ID与基因名

image-20191104214939037

对比一下,方法一里面的getGEO函数下载后使用Table提取到的内容,就是方法二的txt文件,后续处理一致。

大功告成!

后续挖掘见生信技能树B站系列教学视频

需要细读表达芯片的公共数据库挖掘系列推文 ;

然后看B站的GEO数据挖掘技巧,基本上该分享的都在B站和GitHub了,目录如下:

  • 第一讲:GEO,表达芯片与R
  • 第二讲:从GEO下载数据得到表达量矩阵
  • 第三讲:对表达量矩阵用GSEA软件做分析
  • 第四讲:根据分组信息做差异分析
  • 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析
  • 第六讲:指定基因分组boxplot指定基因list画热图
  • 第七讲:根据差异基因list获取string数据库的PPI网络数据
  • 第八讲:PPI网络数据用R或者cytoscape画网络图
  • 第九讲:网络图的子网络获取
  • 第十讲:hug genes如何找
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 现在使用r代码完成这个步骤
    • 方法一:使用GEOquery包
      • 方法二:下载txt文件
        • 后续挖掘见生信技能树B站系列教学视频
        相关产品与服务
        数据库
        云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档