差异基因分析思路
bing搜索GEO进入官网出现如下界面
数据集编号开头代表:
GPL 平台(platforms)
GSE 系列(series)
GSM 样本(samples)
点击Series进入搜索相关数据集,在Series type一栏
基因芯片表达矩阵就是探针表达矩阵,因为序列不变,基因会更新
基因表达芯片的原理:探针的表达量代表基因的表达量
#探针是根据截取的基因片段设计出来,与靶基因反向互补的核苷酸短序列
点array就是筛选芯片数据
进入一个系列,点击GPLxxxx(platforms)
需要ID 和Gene_symbol 这两列
在GSMxxx样本里看一下数据范围是否正常
ID_REF与VALUE value在0-24范围内正常(取过log)
芯片数据在Series Matrix Files里面
转录组和单细胞数据在Supplementary file
options("repos"="https://mirrors.ustc.edu.cn/CRAN/")
if(!require("BiocManager")) install.packages("BiocManager",update = F,ask = F)
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
cran_packages <- c('tidyr',
'tibble',
'dplyr',
'stringr',
'ggplot2',
'ggpubr',
'factoextra',
'FactoMineR',
'devtools',
'cowplot',
'patchwork',
'basetheme',
'paletteer',
'AnnoProbe',
'ggthemes',
'VennDiagram',
'tinyarray')
Biocductor_packages <- c('GEOquery',
'hgu133plus2.db',
'ggnewscale',
"limma",
"impute",
"GSEABase",
"GSVA",
"clusterProfiler",
"org.Hs.eg.db",
"preprocessCore",
"enrichplot")
for (pkg in cran_packages){
if (! require(pkg,character.only=T,quietly = T) ) {
install.packages(pkg,ask = F,update = F)
require(pkg,character.only=T)
}
}
for (pkg in Biocductor_packages){
if (! require(pkg,character.only=T,quietly = T) ) {
BiocManager::install(pkg,ask = F,update = F)
require(pkg,character.only=T)
}
}
#前面的所有提示和报错都先不要管。主要看这里
for (pkg in c(Biocductor_packages,cran_packages)){
require(pkg,character.only=T)
}
#没有任何提示就是成功了,如果有warning xx包不存在,用library检查一下。
#library报错,就单独安装。
引用自生信技能树
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。