这个数据集是经过FACS分选的:
单细胞分离方法:包括有限稀释法(Limiting dilution technique)显微操作法(micromanipulation)、流式细胞分选(FACS)、激光捕获显微分离(LCM)、微孔(microwell)、微流控(microfluidics)和微滴(droplet)
在读取数据集时,直接用read.csv
读取csv文件,可见CreateSeuratObject
函数中counts参数得到表达矩阵列表就可以
基本流程还是:
从上一期推文开始我们开始接触到”重新降维和细分亚群“
这里是上皮细胞的细分:
刚开始只找了一些基础marker分不太开 因此又多找了一些marker 除了上述情况我在找乳腺上皮细胞的marker的时候看到之前单细胞天地发的 ” 乳腺上皮细胞单细胞亚群“ 的推文乳腺上皮细胞单细胞亚群 (qq.com)
看图也能发现初步定义的epi混合了几种一开始的cluster
这是一个很自然从粗定义到细分的过程,后面我们会频繁遇到
需要提醒一下的是:
我这里的epi对应的并不是原推文中的c(0,1,2)而是c(0,1,4)
因为原推文没有提供很多过程图,这在进行复现学习的时候需要格外注意
除了基本流程外,原推文还顺带看了一下harmony去除批次效应前后对比:
可以发现harmony前lung和primary还不是很好地混在一起
harmony后混的就比较均匀
关于是否需要harmony,什么时候需要harmony,harmony对单细胞表达分布的影响,我们将在下一期学习【flag】
这里需要注意是,Seurat对象在使用harmony去除批次效应前后,相同分辨率下UMAP降维分组的组数可能会发生变化
所以我个人感觉,看harmony前后的变化情况,单单看细胞在不同分组的数量变化并不好看,还是要看最后定义好的细胞亚型的分布情况
往期回顾