每个人的时间精力有限,必须优先阅读相关文献,开设这个栏目也是希望为大家推荐高质量的单细胞相关文献。如果大家对单细胞转录组感兴趣可以关注一下,哪怕每天只学一点点,积土成山,积水成渊。
当然一个人的力量终归是小的,我也希望汇聚一群人,形成一个场,这里头最重要的生产力不是单个人多聪明,多厉害,而是每个人相互作用,形成的那个氛围。
希望大家能有所收获!
文章信息
这一篇是免疫相关,美国Fred Hutchinson癌症研究中心于2018年9月发表在NC的Acquired cancer resistance to combination immunotherapy from transcriptional loss of class I HLA,本文的重点在于单细胞数据的分析部分

1
背景知识

2
研究背景
癌症免疫治疗在临床上前景巨大,但是目前有许多使用这种技术的患者后来出现复发的状况。
本文团队在研究Merkel细胞时发现,20%的患者对免疫治疗有初步反应,但后来存在复发的情况,预后不理想。为了提高预后,理解后期/获得性免疫治疗耐受性的机理是有必要的。利用细胞免疫治疗临床试验,可以表征T细胞《=》抗原的相互作用,进而了解复杂的肿瘤细胞-免疫细胞之间的关系,并且为避免肿瘤复发应采取何种免疫联合疗法提供帮助。
3
研究方法
大体思路就是:癌症患者免疫治疗=》发现抗性复发=》scRNA-Seq=》研究获得性抗性机理
最初采用联合疗法对两名Merkel患者进行治疗,发现肿瘤逐渐缩小,他们出现的显著的肿瘤消退都与活化的CD8+T细胞浸润到消退的肿瘤组织有关。
这两例患者分别为:
取了患者的血液和肿瘤,做了免疫组化、分选、外显子测序、10X scRNA-Seq、qPCR
4
外显子测序
两个患者2586-4 (discovery) and 9245-3 (validation),从外周血单核细胞(peripheral blood mononuclear cell,PBMC)中分离DNA作为germline对照,然后取出肿瘤免疫治疗前以及获得性抗性的样本。
患者2586-4采用Agilent SureSelect Human All Exon V6 芯片+HiSeq 2500,annovar比对hg19,MuTect检测somatic突变;
患者9245-3采用xGen建库+Hiseq4000(100X),BWA比对到hg19,GATK call variants
如果大家对WES数据分析感兴趣,出门左转去B站学习群主的视频:
https://www.bilibili.com/video/av28030610
本文重点解读单细胞转录组部分!

5
单细胞测序【重头戏】
◆ ◆ ◆ ◆ ◆
患者2586-4:利用10X 3' Chromium v2.0平台建库 + Hiseq2500 "rapid run"模式;
GSE117988
ID Description
GSM3330559 Tumor Disc Pre
GSM3330560 Tumor Disc AR
GSM3330561 PBMC Pre
GSM3330562 PBMC Disc Early
GSM3330563 PBMC Disc Resp
GSM3330564 PBMC Disc AR患者9245-3:利用10X 5' V(D)J 进行cell washing, barcoding and library prep+ NovaSeq 6000(gene expression) + Hiseq4000 (V(D)J)
GSE118056
ID Description
GSM3317833 PBMC Relapse - L001
GSM3317834 PBMC Relapse - L002
GSM3317835 Tumor Relapse - L001
GSM3317836 Tumor Relapse - L002◆ ◆ ◆ ◆ ◆
患者2586-4(discovery) 利用Cell Ranger v2.0.0, 9245-3 (validation)利用Cell Ranger v2.1.0,进行sample demultiplexing, barcode processing and single-cell gene counting。
首先,利用mkfastq流程将原始的BCL文件转为fastq;然后,利用count流程整合了STAR将每个fastq与hg38和Merkel cell polyomavirus序列(HM011556.1)比对,比对后的reads根据cell barcode以及UMIs进行过滤
Cell barcodes with 1-Hamming-distance from a list of known barcodes were considered;UMIs with sequencing quality score >10% and not homopolymers were retained.
接着利用aggr流程将Tumor与PBMC样本整合,生成两个gene-barcode表达矩阵(tumor和PBMC的),同时进行了测序深度的校正!
后面我们会直播这个数据的全部分析流程,复现文章的全部分析图表,欢迎大家持续关注!!!
当然,如果你迫不及待想自行学习,也可以关注我们的视频课程:全网第一个单细胞转录组数据分析实战视频教程(预售第二波通知)
◆ ◆ ◆ ◆ ◆
根据这篇文献的方法:Miller, N. J. et al. Tumor-infiltrating Merkel cell polyomavirus-specific T cells are diverse and associated with improved patient survival. Cancer Immunol. Res 5, 137–147 (2017).
利用Seurat包中的ScaleData 函数进行校正和标准化:
corrected-normalized gene-barcode matrix 文件将作为下游降维、聚类的输入文件;
normalized gene-cell barcode matrix文件将进行MAST analysis
◆ ◆ ◆ ◆ ◆
过滤得到了7431 tumor cells (2243 cells before and 5188 cells afterT cell therapy),然后利用corrected-normalized gene-barcode matrix进行PCA、tSNE
首先,利用Seurat挑出了873个表达量变化最大的基因进行PCA
根据:log-mean expression values > 0.0125 and dispersion(variance/mean) >0.5
接着,挑出前10个PCs进行tSNE
One thousand iterations of tSNE using a perplexity value of 30 were performed
然后利用MCC tumor markers(NCAM1, ENO2, CHGA and KRT20 and TILs)细胞分群、聚类,得到T细胞免疫治疗前的1984个癌细胞和治疗后获得抗性的5131个细胞;
又利用MAST的R包对前后的细胞进行差异分析,利用的是normalized gene-cellbarcode,其中利用了cellular detection rate (CDR) 作为协变量,校正可能影响细胞中检测到基因数的生物和技术偏差。差异基因定义为FDR为5%,fold change>1.3
◆ ◆ ◆ ◆ ◆
PBMC涉及到了4个时间点:pre-treatment、early post treatment day+27、responding post treatment day +37、replace/acquired resistance post treatment day +64

过滤后总共得到12,874个细胞,也是利用corrected-normalized gene-barcode matrix进行PCA、tSNE分析。
首先,选择1203个变化最大的基因;然后选10个PCs进行tSNE(同上);细胞聚类使用Seurat的FindCluster函数,得到13个不同的细胞群(参数:neighborhood size of 40 and resolution of 0.6),根据分群的结果,移除了三个在red blood cell and megakaryocyte markers中富集的cluster,总共剩下11,021个细胞;之后利用FindMarkers函数根据marker的富集情况,给细胞群加标签,结果有9个不同的cluster:CD4+ T cells, CD8+ T cells, CD8+ effector T cells, B cells, NK cells, CD14+ monocytes, CD16+ monocytes, myeloid cells and dendritic cells;CD8+与CD8+ effector T细胞的在第三个时间点(responding阶段)差异基因分析也是利用MAST。代码见Supplementary Data 3.
◆ ◆ ◆ ◆ ◆
利用corrected-normalized gene-barcode matrix去做PCA、tSNE,方法同上=》19个不同的clusters。代码见Supplementary Data 4.
6
单细胞部分研究结果
重点关注单细胞部分,免疫原理部分这里不做深入研究。
先是PBMC细胞


(从b-i都是为了辅助细胞分群鉴定,蓝色表示基因表达,且颜色越深表达量越高)

其中响应免疫疗法的激活的CD8+淋巴细胞簇是箭头指的红色部分,将不同时间点的CD8+对比发现Day +376(response时间点)的CD8+细胞簇最多
继续将Day +376(response时间点)的red activated cluster (n =170) 与 blue effector/EM cluster (n = 429) 进行差异分析,得到45个差异基因,热图展示一部分:

接下来是肿瘤组织,时间点和PBMC不同,它只有两个治疗前的原位癌pre-treatment、复发癌 late relapse/acquired resistance

首先可以看到的是,这个组织中肿瘤细胞占比较大,并且治疗前后分的还是很开的,意味着治疗前(蓝色)与复发后(橘色)差别还是很大的,为了看这个差异是由哪些基因导致的,又做了差异分析+热图,得到255个差异基因

其中箭头标出的位置是HLA-B,它在复发瘤中表达量降低,那么下降的趋势如何呢?

发现与HLA-A相比,MCC在获得性抗性中显著下调HLA-B
之后在另一个患者那里进行验证(11267个细胞):也发现类似的情况,只不过是HLA-A表达量降低

7
讨论
晚期/获得性免疫抗性是免疫治疗治愈的障碍,本文对两名接受T细胞免疫治疗与ICI的患者,他们都有持续的免疫治疗反应,之后是抗性产生。观察到CD8+ T细胞浸润到萎缩的MCC肿瘤中,支持T细胞介导的消退,当肿瘤复发的时候,存在着明显的选择性转录下调HLA。
肿瘤能够通过沉默能够被T细胞识别的蛋白的编码基因进而实现肿瘤的免疫躲避。HLA的三组基因通常全部同时关闭或打开,HLA三组基因只要其中一个被关闭,那么肿瘤细胞就能逃避T细胞
单个或所有的I类HLAs基因缺失导致的免疫逃避被描述为对细胞免疫治疗产生细胞免疫抗性机制和抗pd -1检查点抑制剂机制。第I类基因座的转录抑制也许也是其他免疫治疗产生耐药性的原因(包括免疫检查点治疗),这项发现将为设计新型免疫治疗手段带来积极影响。