文章标题:《Single-cell analysis reveals new evolutionary complexity in uveal melanoma》
发表日期和杂志:2020年发表在Nature Communications上
在线阅读链接:https://doi.org/10.1038/s41467-019-14256-1
葡萄膜黑色素瘤(UM)是一种高度转移性癌症,与皮肤黑色素瘤不同,它对检查点免疫治疗基本没有反应。
让BioinfoArk提供的中国区chatGPT简单介绍了一下这个疾病
葡萄膜黑色素瘤(Uveal melanoma,UM)是一种罕见但具有高度转移性的眼部肿瘤。它起源于葡萄膜,即眼球的中层组织,通常发生在虹膜、睫状体和脉络膜。与皮肤黑色素瘤不同,UM的发病机制和治疗方法有所不同。
UM通常在中年人中发病,尤其是白种人。其病因尚不完全清楚,但一些遗传和环境因素可能与其发生有关。常见的症状包括视力模糊、眼球疼痛、眼球红肿、视野缺损等。早期诊断和治疗对于预防UM的转移至其他器官至关重要。
UM的治疗方法包括手术切除、放疗和局部治疗。然而,UM对传统的化疗和放疗方法不太敏感,且易于转移至肝脏等远处器官,导致预后不佳。近年来,免疫疗法和靶向治疗等新的治疗方法也在UM的研究中得到关注。
使用单细胞RNA测序技术对8个原发性和3个转移性样本中的59,915个肿瘤和非肿瘤细胞进行了单细胞分辨率的肿瘤微环境研究
数据链接是:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE139829
可以看到是11个样品:
GSM4147091 BSSR0022_single cell RNAseq
GSM4147092 UMM041L_single cell RNAseq
GSM4147093 UMM059_single cell RNAseq
GSM4147094 UMM061_single cell RNAseq
GSM4147095 UMM062_single cell RNAseq
GSM4147096 UMM063_single cell RNAseq
GSM4147097 UMM064_single cell RNAseq
GSM4147098 UMM065_single cell RNAseq
GSM4147099 UMM066_single cell RNAseq
GSM4147100 UMM067L_single cell RNAseq
GSM4147101 UMM069_single cell RNAseq
作者给出来的数据是每个样品都是标准的10X单细胞的数据格式,有barcodes.tsv.gz、genes.tsv.gz和matrix.mtx.gz三个文件:
下载数据之后我们可以按照不同的样品名进行一个简单的整理,然后再读取它们:
#按样品名整理数据
fs=list.files('./','genes.tsv.gz')
fs
samples1=gsub('genes.tsv.gz','',fs)
samples1
library(stringr)
samples2=str_split(samples1,'_',simplify = T)[,2]
samples2
lapply(1:length(samples2), function(i){
#i=1
x=samples2[i]
y=samples1[i]
dir.create(x,recursive = T)
file.copy(from=paste0(y,'genes.tsv.gz'),
to=file.path(x, 'features.tsv.gz' ))
file.copy(from=paste0(y,'matrix.mtx.gz'),
to= file.path(x, 'matrix.mtx.gz' ) )
file.copy(from=paste0(y,'barcodes.tsv.gz'),
to= file.path(x, 'barcodes.tsv.gz' ))
})
#加载R包读取数据
rm(list=ls())
options(stringsAsFactors = F)
library(Seurat)
library(stringr)
library(data.table)
samples=list.files('outputs/')
samples
# Should show barcodes.tsv.gz, features.tsv.gz, and matrix.mtx.gz
sceList = lapply(samples,function(pro){
#pro=samples[1]
folder=file.path('outputs',pro )
print(pro)
print(folder)
print(list.files(folder))
print( Sys.time() )
sce=CreateSeuratObject(counts = Read10X(folder),
project = pro )
print( Sys.time() )
return(sce)
})
as.data.frame(sce.all@assays$RNA@counts[1:10, 1:2])
head(sce.all@meta.data, 10)
table(sce.all@meta.data$orig.ident)
后面就是标准分析啦,对读取进来的数据进行质控、harmony整合以及细分亚群等。
使用t分布随机相邻嵌入(t-SNE)的降维分析揭示了肿瘤和非肿瘤细胞类型的多样性
文章中给出来的分群主要也是:
所以文章针对这些细胞进行了一个细胞亚群分类,我们通过BioinfoArk提供的中国区chatGPT查询到各个细分亚群的解释:
在包含经过验证的GEP临床预后测试的12个基因中,有5个基因在肿瘤细胞中主要表达(EIF1B、HTR2B、ECM1、CDH1和ROBO1),但1个主要表达于T细胞(SATB1),其余6个基因在肿瘤细胞和免疫细胞中均表达
基因表达谱
使用Monocle 2分析了scRNA-seq数据,该数据重建了假定的分支转录轨迹,以确定计算状态之间的潜在关系。发现所有肿瘤细胞的伪时间排序产生了总共16个状态,组织成两个主要分支,根据GEP 1类和2类进行自分类。
文章发现浸润肿瘤的免疫细胞包括以LAG3为主要表达检查点标记物的CD8+ T细胞,而不是PD1或CTLA4。V(D)J分析显示克隆扩增的T细胞,表明它们能够产生免疫应答。来自1B类UM的慢性肝转移病例中浸润有克隆扩增的浆细胞,表明存在抗体介导的免疫。肿瘤和免疫细胞之间的这种复杂生态系统为我们提供了对UM生物学的新见解,并确定LAG3作为高危UM患者免疫检查点阻断的潜在候选药物。