_,所以将第一个下划线改为///,方便后续的切割
str_split("///",simplify = T) # 这一步骤很重要
k = !...duplicated(b[,2]);table(k) # 如果重复,则返回false,不重复则返回true
exp = exp[k,] # 表达矩阵中筛选只返回ture的行
b = b[k,]...过滤之前基因数量:
nrow(exp)
常用过滤标准1:
仅去除在所有样本里表达量都为零的基因
exp1 = exp[rowSums(exp)>0,]
nrow(exp1)
常用过滤标准2(推荐):...Group = str_remove(colnames(exp),"\\d") # 将列名中的数字删除,成为了两个分组
Group = factor(Group,levels = c("Mock",..."Cov")) # 对照组在前,实验组在后
table(Group)
6.保存数据
save(exp,Group,proj,file = paste0(proj,".Rdata"))
7.三大R包差异分析