回顾
我们的CNS图表复现之旅已经开始,前面5讲是;
如果你也想加入交流群,自己去:你要的rmarkdown文献图表复现全套代码来了(单细胞)找到我们的拉群小助手哈。
前面我们得知文章把Macrophage和Monocyte合并起来,把B_cell区分成为两群。而我们的T_cells和NK_cell也需要被合并起来。
而 common myeloid progenitor (CMP) 这群细胞呢,在文章并没有出现,不知道是不是会被命名为 Mast-cells,需要相应的生物学背景。
这个时候,根据CellMarker网站进行人工校验,如下所示:
# Human Kidney Mast cell
# http://biocc.hrbmu.edu.cn/CellMarker/search.jsp?quickSearchInfo=mast
genes_to_check = c('ENPP3', 'KIT', 'SLC18A2')
# All on Dotplot
p <- DotPlot(sce, features = genes_to_check,group.by = 'seurat_clusters') + coord_flip()
p
发现就是第7群高表达这些基因,而前面我们的singleR的自动注释步骤把第7群细胞命名为了 common myeloid progenitor (CMP) ,所以它就文章里面的Mast-cells,出图如下:
文章把B_cell区分成为两群,所以我们也区分一下:
前面的singleR的自动注释步骤的B_cell涵盖了Seurat流程的第3,10,13,15,19,21群细胞。
同样的,根据CellMarker网站进行人工校验,如下所示:
genes_to_check = c('CD19', 'CD27','SDC1', 'CD38')
# All on Dotplot
p <- DotPlot(sce, features = genes_to_check,group.by = 'seurat_clusters') + coord_flip()
p
# CD138( SDC1), CD38 # Plasma cell
# CD19, CD27 # memory B cell
出图:
可以看到, 第3和21群高表达CD138( SDC1)基因,所以是Plasma cell,其它B细胞就归类为memory B cell吧,毕竟作者的文章就只有这两个B细胞亚群。
文章把Macrophage和Monocyte合并起来,但是数量是四千五百个细胞左右,但是我们的Macrophage和Monocyte加起来近5000了,所以里面理论上可以拆出来一些给DC细胞,所以我在CellMarker网站进行人工校验,基因如下:
# CLEC4C, IL3RA, NRP1 # Dendritic cell
# CD1C, CST3, FCER1A # Monocyte derived dendritic cell
genes_to_check = c('CLEC4C', 'IL3RA', 'NRP1','CD1C', 'CST3', 'FCER1A')
# All on Dotplot
p <- DotPlot(sce, features = genes_to_check,group.by = 'seurat_clusters') + coord_flip()
p
确实看到:
第9和13亚群,可以重新被划分为DC细胞,之前属于Monocyte和B细胞。
可以看到,即使是singleR的自动注释后给每个亚群命名了,仍然是需要耗费时间和精力去细致看每个亚群。
# 9,13 Dendritic
# 3,12, Plasma cell
# 7, CMP --> Mast-cells