最近交流群小伙伴提到了一个很有意思的问题,想知道感兴趣的疾病的单细胞数据集里面的巨噬细胞是否表达某个他感兴趣的基因,但是他吃不准这个是否表达某个他感兴趣的基因的阳性阈值问题。我们之前给出来了的简化的演示代码是:
# install.packages('devtools')
# devtools::install_github('satijalab/seurat-data')
library(SeuratData) #加载seurat数据集
library(Seurat)
getOption('timeout')
options(timeout=10000)
#InstallData("pbmc3k")
data("pbmc3k")
sce <- pbmc3k.final
colnames(sce@meta.data)
gplots::balloonplot(table(Idents(sce),sce@assays$RNA@counts['CD4',]>0))
上面的代码仅仅是一个测试,因为采取的是粗暴的阈值,就是看每个细胞是否在CD4这个基因什么的count是大于0就代表阳性,但是很明显是有问题的。在单细胞测序中,"drop-out"现象是一个常见的问题。我问了一下chatGPT关于它的介绍:
在单细胞测序中,"drop-out"现象是一个常见的问题。这个现象指的是某些基因在某些单细胞中未被检测到,但这并不意味着这些基因在这些细胞中不表达。这种现象的原因可能是技术的限制,例如RNA分子在制备测序文库的过程中的损失,或者是测序深度不足等。
"Drop-out"现象会对单细胞数据的解析带来挑战。例如,如果一个基因在某个细胞中未被检测到,我们不能确定这是因为这个基因在这个细胞中不表达,还是因为"drop-out"现象。因此,在分析单细胞数据时,需要使用适当的统计方法来处理"drop-out"现象。为了减少"drop-out"现象的影响,科研人员已经开发出了多种策略。例如,可以通过增加测序深度,改进文库制备方法,或者使用更敏感的检测方法来减少"drop-out"现象。此外,也有一些计算方法被开发出来,用于在分析阶段纠正"drop-out"现象的影响。
总的来说,"drop-out"现象是单细胞测序中的一个重要问题,需要通过各种策略来解决。
不出意外的,chatGPT还是喜欢说正确的废话,但是意思就是这么个意思啦。让我们看看一个去年发表的文章:《Androgen receptor-mediated CD8+ T cell stemness programs drive sex differences in antitumor immunity》,该研究的作者分析了一个公共数据:We next analyzed AR expression in the intra-tumoral T cell sub- sets from an integrated single-cell transcriptomic database and found that Ar was highly transcribed in stem cell-like CD8+ T cells (Figures 4A and 4B).
所以就得到了一个假设:these data suggest that the AR expressed in stem cell-like CD8+ T cells may drive a differentiation program toward terminal exhaustion.
如下所示,如果是使用肉眼看,确实是极少量的T细胞是有AR基因的表达阳性,而且细分T细胞亚群后,得到的结论是 stem cell-like CD8+ T cells 是统计学显著的有AR基因的表达阳性。
统计学显著的有AR基因的表达阳性
文章的图例:(A) Tumor-infiltrating T cells from an integrated single-cell transcriptomic database of 21 murine melanoma and colon adenocarcinoma tumors were annotated to nine unsupervised functional clusters.
实际上,这个结论是比较让人费解的,照例我也问了一下chatGPT,免疫细胞能表达AR基因吗
雄激素受体(Androgen Receptor,AR)是一种核受体,主要在男性生殖器官如睾丸和前列腺中表达,但也在其他许多组织中找到,包括肌肉、骨骼、肾脏、心脏、肝脏、皮肤和大脑。AR在这些组织中的功能主要与雄激素的生理效应有关,包括性别决定、生殖器官的发育和性功能、骨骼肌的生长和维持、以及行为和认知功能。
至于免疫细胞是否表达AR,这取决于具体的免疫细胞类型。一些研究已经发现,AR在某些免疫细胞中是有表达的,包括T细胞和B细胞,而且AR的活性可以影响这些细胞的功能。例如,AR信号可以影响T细胞的激活和增殖,以及B细胞的抗体生产。然而,这些研究的结果并不一致,可能受到实验条件、细胞类型和动物模型的影响。
总的来说,虽然AR主要在男性生殖器官中表达,但它也在其他许多组织中找到,包括一些免疫细胞。然而,AR在免疫细胞中的具体功能和重要性仍需要进一步研究。
当然了,这个时候不能把chatGPT的回答当做是金标准,这个已经是学术前沿,理论上chatGPT仅仅是资料整理以及上下文关联的提词器,不应该是权威回答。如果你继续追问chatGPT上面它提到的一些研究已经发现,AR在某些免疫细胞中是有表达的,包括T细胞和B细胞。里面的一些研究指的是哪些sci文献,它就会开始瞎编乱造。
但是最近(Adv. Sci. 2023,)发表的一个单细胞转录组数据挖掘文章《 IL-1𝜷 Is an Androgen-Responsive Target in Macrophages for Immunotherapy of Prostate Cancer 》,文章是重新分析了公共数据集 GSE137829,得到了很明显的大范围的表达AR基因的T细胞和巨噬细胞亚群,就有点让人唏嘘:
大范围的表达AR基因的T细胞和巨噬细胞亚群
前面的小鼠肿瘤单细胞数据集里面的肿瘤浸润T细胞里面表达AR基因比例极低,其数据分析结果是需要多次检验的,而且是小鼠数据。但是这个公共数据集 GSE137829是人类肿瘤,里面的大范围的表达AR基因的T细胞和巨噬细胞亚群就有点诡异了。