前面我们介绍的单细胞亚群主要是肿瘤微环境里面的3大亚群,就是上皮细胞和免疫细胞,以及间质细胞。而且绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的 fibro 和endo进行细分,并且编造生物学故事的。
但并不是所有人都是研究肿瘤的,也有一些其它领域的单细胞亚群值得整理和分享,比如软骨相关的单细胞亚群。目前主要是在腰椎间盘和骨关节相关的疾病研究看到它。而且腰椎间盘和骨关节中的细胞异质性相当丰富,它们由多种不同的细胞亚群组成,这些细胞亚群在椎间盘和骨关节的发育、功能以及疾病的发生发展中发挥着重要作用。
让我们看看2021的文章:《Spatially defined single-cell transcriptional profiling characterizes diverse chondrocyte subtypes and nucleus pulposus progenitors in human intervertebral discs》,它的数据集是GSE160756,可以看到这里面绝大部分都是软骨相关的单细胞亚群:
绝大部分都是软骨相关的单细胞亚群
但是这个研究的作者并没有给出来 软骨相关的单细胞亚群的生物学名字,前面我们分享了在单细胞转录组降维聚类分群的第一层次降维聚类分群后的,每个单细胞亚群细分的时候,是有 单细胞亚群的生物学命名的4个规则,如下所示 :
这个文章就是简简单单的给每个软骨相关的单细胞亚群一个编号而已,所以它的结果基本上没办法在后续的文章里面引用。因为如果你读取这个GSE160756数据集然后降维聚类分群,甚至都没办法复现它的软骨相关的3个单细胞亚群,仅仅是能从文章里面的拿到文章给出来的基因列表而已。
读取这个GSE160756数据集然后降维聚类分群
虽然说文章也确实是很努力的在对这个软骨相关的3个单细胞亚群进行再次细分亚群,但是可以看到的是细分之后仍然是顺序编号而已 :
再次细分亚群,仍然是顺序编号
比如2024年1月的文章:《Unveiling inflammatory and prehypertrophic cell populations as key contributors to knee cartilage degeneration in osteoarthritis using multi-omics data integration》,它对应的数据集是: GSE255460 ,这个时候给出来了比较清晰的亚群,而且每个亚群的有生物学功能的基因列表都清晰可见:
每个亚群的有生物学功能的基因列表都清晰可见
但是,值得注意是的,虽然这个GSE255460数据集的研究者们降维聚类分群后可以指出来了他们的单细胞数据分析结论是:
33 cell population-specific marker genes that define 11 chondrocyte populations, including 9 known populations and 2 new populations, that is, pre-inflammatory chondrocyte population (preInfC) and inflammatory chondrocyte population (InfC).
不过,如果大家下载它的数据集进行同样的分析,你会发现InfC其实就是巨噬细胞为主的免疫细胞,而preInfC其实是内皮细胞和周细胞或者说平滑肌细胞的干扰。从这两个单细胞亚群的细分也可以看到, InfC其实就是各种免疫细胞(淋巴细胞和髓系)啦,而preInfC其实是间质细胞啦(内皮细胞和周细胞)
这两个单细胞亚群的细分后可以证明它应该并不是软骨细胞
前面我们分享了在单细胞转录组降维聚类分群的第一层次降维聚类分群后的,每个单细胞亚群细分的时候,是有 单细胞亚群的生物学命名的4个规则,如下所示 :
一般来说,第一层次降维聚类分群应该是使用第一个规则,但是很明显这个骨的单细胞亚群就很难保证泾渭分明的生物学亚群,仅仅是follow了2019的单细胞文章(2019-GSE104782-10个OA病人)的命名规则。 如下所示:
很难保证泾渭分明的生物学亚群
cg='CYTL1 IBSP CRYAB IL17B NEAT1 MALAT1 CHI3L2 CAPS NDUFA4L2'
celltype.markers = str_split(cg,' ')[[1]]
celltype.markers = c('C11orf96','BMP2','HMGA1','CHRDL2','FRZB',
'CYTL1','CHI3L1','CHI3L2','CILP2','CILP','OGN',
'HSPA1B','HSPA1A','HSPA6','DDIT3','JUN','PRG4','ABI3BP',
'CRTAC1','SPP1','IBSP','COL10A1','COL27A1','PLCG2',
'WWP2','MMP2','COL1A2','COL1A1',
'IFI16','IFI27','CXCL8','CD74','GPR183','')
DotPlot( sce.all.int, features = celltype.markers,
group.by = 'RNA_snn_res.0.1') +
theme(axis.text.x = element_text(angle = 45, vjust = 0.5, hjust=0.5))
这个软骨细胞亚群的细分基本上都遵循了2019的汤富酬课题组的文章:《Single-cell RNA-seq analysis reveals the progression of human osteoarthritis》的分类模式,数据集是 GSE104782 :
数据集是 GSE104782
其实这个2019的单细胞文章(2019-GSE104782-10个OA病人)的命名规则是很难被推广开,似乎这个问题在所有单细胞亚群细分的时候都会出现,比如t细胞的细分亚群,因为历史遗留原因,T细胞主要是区分成为CD8+ T cell 和 CD4+ T cell 两个大类,也可以是按照功能进行划分,naive, memory ,effector,cytotoxic,Exhaustion。但是如果你自己在针对t细胞细分的时候,就会发现功能分类模式其实是没有完全泾渭分明的界限,不像是第一层次降维聚类分群那样的t细胞和b细胞之间那样没有过渡。
大家都知道,单细胞转录组算是革命性技术,出现以及爆火也就是这些年,很难有权威知识体系建立完善,上面的软骨相关单细胞亚群的标记基因仅仅是来源于两个文献而已,谈不上金标准。如果你也是做类似的疾病领域研究,你会发现降维聚类分群的结果跟文献其实是会天差地别!
而且,哪怕是你重新分析作者的数据,都不可能一模一样的复现。。。
不过,我仅仅是读了一些骨相关研究文献而且,梳理了文献里面的结论,并不是这方面领域的专家,所以大家还是也不要偏听偏信我的观点哈,我汇总的有数据集公开的文献如下所示:
2018-GSE109450-RA和OA的fibo差异.pdf
2019-SDY998-RA的免疫细胞细分亚群.pdf
2019-挖掘GSE109449里面的OA和RA.差异pdf.pdf
2020-GSE118236-软骨修复
2020-挖掘-GSE109449-只看2个OA病人.pdf
2020-挖掘-GSE109449.pdf
2020-挖掘GSE104782 and GSE109449.pdf
2020-挖掘GSE104782-3个OA病人单细胞.pdf
2020-骨组织-单细胞-人鼠对比.pdf
2021-GSE160756-骨单细胞.pdf
2021-GSE165722-6种骨髓核细胞亚群.pdf
2021-GSE172500-小鼠模型.pdf
2021-GSE172500-小鼠骨疾病模型.pdf
2021-GSE184360-两个10x单细胞骨细胞细分.pdf
2021-HRA000155-类风湿性关节炎单细胞.pdf
2021-挖掘-GSE109449-看具体某个细胞亚群差异.pdf
2021-挖掘GSE114007和GSE104782,.pdf
2022-GSE193742-软骨细胞细分亚群
2022-GSE214544-人骨骼肌.pdf
2022-HRA002569-骨关节炎.pdf