你现在看到的是随机投稿栏目!
大家都想学单细胞转录组数据处理,可是如果你不会R语言,没玩过GEO数据库挖掘,没有这些背景知识点,你会学的很辛苦,所以这里接受大家的投稿带领大家一起学习R及bioconductor技能!!!
首先来一个简单的GEO数据库挖掘吧!
前言
今天在技能树学徒班听了一节关于GEO数据库的课,GEO是什么,又是一头雾水,强迫基因受环境影响出现短暂的表达,赶紧搜索了解下,GEO(Gene Expression Omnibus database)是由NCBI负责维护的一个数据库,设计初衷是为了收集整理各种表达芯片数据,但是后来也加入了甲基化芯片,lncRNA,miRNA,CNV芯片等各种芯片,甚至高通量测序数据,从文章拿到了GSE的study ID号,登录GEO网站,输入GSE的study ID,就可以看到关于该study的所以描述信息,是用的什么测序平台,测了多少个样本,数据分析等等(GEO的解释摘自于生信菜鸟团的整理:http://www.bio-info-trainee.com/tag/geo)
GEO2R分析
但是有些GSE序列在GEO网站没有提供GEO2R分析(如GSE111229)。
利用GEO数据库的GEO2R工具分析一个GSE的study ID,操作如下:
结语
今天感谢生信技能树齐老师的授课与指导。