我在 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则 提到了,肿瘤单细胞测序通常是按照下面的4个基因表达量分布进行初步分群 :
也仅仅是,如果不经过事先挑选,这样不同的实验条件不同的癌症病人不同的癌症进展情况拿到的这3群细胞比例肯定是不一样的。
但是我最近读文献的时候,看到2020年10月发表在cancer cell杂志的文章《Senescence Reprogramming by TIMP1 Deficiency Promotes Prostate Cancer Metastasis》,链接是:https://doi.org/10.1016/j.ccell.2020.10.012 里面提到了一个有意思的操作:
也就是说,我前面的 肿瘤单细胞数据第一次分群通用规则 就这样被吊打了,因为他们在还没有做单细胞的时候,就已经预分选好了,而且还配平了细胞比例。
在 https://www.ebi.ac.uk/ena/browser/view/PRJEB40397 可以看到作者上传的单细胞转录组数据集,是10X技术的,4只小鼠,两个不同的 genetically engineered mouse models (GEMMs) 。关于单细胞的质控降维聚类分群和细胞亚群注释后的的图如下所示:
肿瘤单细胞的第一次分群
图例是:(A) t-Distributed stochastic neighbor embedding (t-SNE) plots of Ptenpc-/- and Ptenpc-/- ; Timp1-/- tumors showing epithelium, stroma and immune cells compartments.
可以看到,绝大部分都是免疫细胞,还有少量的上皮细胞,以及及其微量的基质细胞。确实好奇怪了哦,研究者在做这个单细胞的时候,明明是进行了这3种细胞的配平啊!
另外,我有一个疑问,欢迎大家留言讨论,帮我解惑!
很久以前我在《单细胞天地》公众号分享过一个教程:FACS挑选前后会改变细胞亚群比例组成吗,那个时候提出来的问题是:两次不同的筛选策略(CD3和CD45),拿到的单细胞转录组数据,分群后一些细胞的比例会发生变化吗?
这次我想更进一步,这个FACS筛选过程中,单细胞悬浮液肯定是饱经风霜,不可能筛选前后它的基因表达状态不被修改?
因为我发现有一些研究更夸张,比如 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE159354 这个数据集,虽然是 48个10X样品,但是实际上就10个病人(4 IPF, 3 SSc-ILD and 3 normal control lungs.),每个病人的样品分成了5份,分别是:digest and sorted via FACS into separate preparations of EPCAM+, CD31+, CD45+, and triple negative (EPCAM- CD31-, CD45-) cells.
GSM4827186 IPF F18555 Triple-
GSM4827187 IPF F18555 EPCAM+
GSM4827188 IPF F18555 CD31+
GSM4827189 IPF F18555 CD45+
GSM4827190 IPF F18555 Unsorted
也是让人很头疼啊,该数据集对应的文章是:Osteopontin Links Myeloid Activation and Disease Progression in Systemic Sclerosis. Cell Rep Med 2020 Nov 17;1(8):100140. PMID: 33294861