分享是一种态度
今天介绍的文献于2020年5月26号发表在PNAS。文章题目是:Putative regulators for the continuum of erythroid differentiation revealed by single-cell transcriptome of human BM and UCB cells.
了解成年人类造血干细胞(HSC)参与红细胞生成的的精细分化轨迹对于理解人类红细胞生成的动态发育变化至关重要。使用原代人类终末红系细胞对直接从成人骨髓(BM)和脐带血(UCB)中分离出来的细胞进行单细胞RNA测序(scRNA-seq)(CD34 - CD235a +),本研究以前所未有的分辨率记录了最终分化的人类成红细胞的转录组。这些见解使我们能够区分处于发育早期和晚期的多色成红细胞(PolyEs),以及正色成色细胞(OrthoEs)的不同发育阶段。本研究通过监测细胞分化和凋亡,进一步鉴定出一套终端红系分化调节剂,并在功能上验证了已鉴定的三个基因AKAP8L,TERF2IP和RNF10。本研究记录了AKAP8L的敲低抑制了造血干细胞对红系谱系和细胞增殖的命运,并抑制了红系集落(CFU-E)到成红细胞期(ProE)的分化。相比之下,敲低TERF2IP和RNF10延迟PolyE分化为OrthoE阶段。总而言之,在单细胞分辨率下转录连续体的收敛和发散突显了人类胎儿和成人终末红系分化基础的转录调控网络。
从六个年轻的健康男性供体中收集了10毫升的BM样品,从六个健康的新生儿脐带中收集了20毫升的UCB样品。基于10x Genomics Chromium协议构建单细胞测序文库,并在Illumina X 10平台上生成转录组数据。经过严格的质量控制(QC),最后获得了来自三个BM样品的8,668个细胞和来自三个UCB样品的17,692个细胞的数据。在这项研究中生成的scRNA-seq原始数据集存放在Gene Expression Omnibus(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE150774)中。
测序后,使用Cell Ranger通过基因条形码矩阵获得了基因表达的UMI计数。为了访问无偏倚的基因表达,即使转录组数据不受称为零丢失事件(过量零或接近零计数)的影响,应用了由Li描述的R软件包scImpute((https://github.com/Vivianstats/scImpute))恢复可进行下游分析的基因表达数据。研究假设根据先验知识有五个亚群,并设置k= 5估算。假设后,使用scanner包的cyclone函数进行细胞周期阶段的判断。基因表达值≥0并且≥10个细胞中表达的基因被保留,表达200个基因的细胞被保留。此外,线粒体基因表达的百分比低于0.05,且2个SDs内的细胞文库大小均在平均值附近。下一步,对过滤后的数据执行全局缩放归一化方法“ LogNormalize”。在基因动力学分析中,将标准化的细胞表达数据输入到CellRouter中,以构建复杂的单细胞轨迹,并鉴定参与红系末端分化的调节子和基因。可从Github(https://github.com/SMU-medicalgenetics/Single_cell)获得代码。
平均而言,本研究在每个BM细胞中检测到377个表达基因和5,870个mRNA分子。相比之下,在每个UCB红细胞中都记录了602个表达基因和8,133个mRNA分子,研究者们根据先前描述的标准( De novo prediction of stem cell identity using single-cell transcriptome data. Cell Stem Cell 19, 266–277 (2016).)对每种细胞类型进行了注释,并排除了非类红细胞单核细胞。使用R包scImpute对缺失数据进行了插补,然后进行了Pearson相关分析。这三个BM样品的表达模式高度一致(Pearson系数R > 0.97,P <0.01),但具有高异质性的UCB样品却有显着差异(Pearson系数R <0.76,P <0.01; 图S3 AB)。无监督聚类表明,三个样本中的人BM细胞均匀分布在大多数细胞集群中,除了BM1样本特有的一个集群(图 S3 C),UCB1细胞簇、UCB2和UCB3细胞群体,是高度一致不同的簇,表示人类胎儿红细胞生成(的样本间异质性特征 图 S3D)。在进行生物信息学分析之前,研究者将三个BM派生的数据集或三个UBC派生的数据集合并在一起。
通过CellRanger软件包,研究者鉴定出284个签名基因[簇之间的log 2(UMI计数变化的倍数),称为log 2 FC,> 1.0;FDR <0.05],可将8668个细胞分类为7个群,包括6个群(群1–6)和一个单独的群7;(图1A),群7的细胞大部分来自BM1样品。基于簇之间的差异表达基因(DEG)和图1 B中所示热图分析,群集3、4和5与其他群集不同,而群集1、2和6共享相似的DEG(图 1 B).因此,群1、2和6被识别为同一组细胞。为了确定细胞分化进程的顺序,研究者用Monocle(19)(https://www.pnas.org/content/117/23/12868#ref-19)重构了细胞分化轨迹,结果表明簇中细胞分化的顺序为:3→4→5→(1,2,3 6)→7(图1 C)。即群3在分化的最早阶段属于一组细胞,而群7在分化的很晚期属于细胞。此外,GYPA的 mRNA表达,是成红细胞的独特标志物,沿着细胞的成熟途径被下调。比较这些簇中GYPA mRNA 的表达水平时,簇7的值最低(图1 D),这表明簇7最有可能代表分化的最后阶段(OrthoE或晚网状细胞)。
研究者,基于之前的研究鉴定的人终端红细胞分化各细胞的分化阶段(基于以前报道的基因,找到对应的ProE的,BasoE,PolyE和OrthoE分化阶段的细胞)。研究者们注意到,67.1%的细胞属于OrthoE,24.9%的细胞属于PolyE,而ProE和BasoE细胞也很少被识别到(图 1 E)。细胞在不同分化阶段的分布与先前报道的结果一致,并且符合人类在骨髓中的类红细胞发育计划。当将不同簇中细胞的基因表达模式映射到先前报道的不同发育阶段的成红细胞表达谱时(图 1 A和E),ProE和BasoE细胞都属于簇3,而不是分成两个不同的簇。这可能是由于属于这两个阶段的细胞数量不足和/或在这两个发育阶段的基因表达模式高度相似所致。因此,研究者选择不专注于这两个早期细胞阶段,以免过度解释关于这些特定发育阶段的发现。PolyE细胞分为群4和5以及群3(其中的一部分),我们将这3个群分别指定为transit-PolyE(群3的一部分),early-PolyE(群4)和late-PolyE(群5)。研究者们还注意到,核内MALAT1基因在OrthoE晚期的表达水平低于其他阶段(图1D)。因此,研究者推测OrthoE晚期将是一个过渡状态,具有高度致密的核,并准备去核。综上所述,这些发现表明,常规定义的分化阶段,PolyE和OrthoE,可以基于基因表达模式沿其成熟状态进一步细分。
研究基于四组(ProE / BasoE / transit-PolyE,early/late-PolyE,early-OrthoE和late-OrthoE)中差异表达的基因进行了基因本体论(GO)分析,并确定了相关的GO富集术语以深入了解生物过程(图1 BF)。在群3中鉴定出一组207个签名基因,分别代表ProE,BasoE和transit-PolyE细胞,并且该簇的GO术语显着富集(FDR <0.01)在表达与核糖体发生,蛋白质靶向和RNA分解代谢过程。early/late 的PolyE细胞共享相似的差异表达基因,其中只有13个差异表达基因(| logFC |> 0.5,FDR <0.01)被识别出来(图 1B),GO 术语富集在细胞分裂,细胞器裂变和细胞周期。
研究者们注意到,在所分析的8,668例BM成红细胞中,S期为1,103个细胞,G2 / M期为1,712个细胞,G0 / G1期为5,853个细胞。进一步的分析表明,ProE / BasoE细胞主要处于S期,early/late-PolyE细胞主要处于G2 / M期,early/late-OrthoE细胞主要处于G0 / G1期(图1 G)。由于early/late-OrthoE细胞的核浓缩,我们推测这些细胞处于G0期而不是G1期。
使用与之前相同的分层策略,在UCB的红系细胞中还鉴定出七个细胞群及其分化阶段和细胞周期阶段。当与BM成红细胞相比时,它们之间最显着的差异是细胞的分化阶段。UCB样品中的大多数是OrthoE细胞(87%),而BM样品中OrthoE的比例为67%。通过流式细胞仪分析验证了这一显着的发育阶段差异(图 S5 C)。注意到的另一个差异是γ-和β-血红蛋白基因的表达水平。虽然HBB和HBG1 / G2在UCB成红细胞中均高表达,但只有HBB在BM成红细胞中表达(图S4 B)。有趣的是,对三个UCB样品的scRNA-seq分析显示,在OrthoE阶段,细胞周期具有复杂的异质性,其中大部分处于G0 / G1阶段,而S期则占一小部分。
研究者通过单细胞转录组解析人类末端红系分化不同阶段的基因表达动力学,把基因表达模型分为了三组(图2 A).第一组包括一组1,145个基因,它们的表达在红系分化的非常早期就很高,但随着红系分化的进行而迅速下调。该组包括编码转录因子KLF1和BCL11A的基因,这在类红细胞分化的早期至关重要。第二个小组包括一组647个基因,它们的表达始于分化的早期阶段,并随着分化的进行而持续,随后在很晚的阶段被下调。第三组是一组674个基因,它们在红系终末分化阶段的早期以低水平表达,而在分化后期则表达逐渐增加。有趣的是,研究者在第三组中注意到了不同的基因表达模式:在PolyE阶段特异富集的基因第一子集,在OrthoE早期阶段高表达的第二子集和标志OrthoE晚期的第三子集。为了验证从的scRNA-seq分析中的差异基因表达模式,进行了成年BM CD34 +细胞的体外培养,以在分化的各个阶段生成成红细胞,并使用定量PCR(qPCR)监测TERF2IP,SOX6,IFIT1B,CFL1和ARL4A基因的表达模式,其验证涵盖了这三种的表达模式(图2 A)Wright's-Giemsa染色后的形态学检查显示,ProE在第7天占主导地位,BasoE在第9天和第11天占据优势,PolyE在第13天和第15天占据优势,而OrthoE在第17天占据优势(图 2 B)。有趣的是,研究观察到NFE2L1,NDEL1,EPB41,USO1,MARK2,LGALS9,NEK1和AXIN1的表达下降(图 S6 B);然而,最近的一项研究使用CD34培养的细胞直至OrthoE阶段,细胞表现出增加的表达。因此,原代分离细胞的基因表达谱似乎可能与体外分化实验不同。
研究者应用CellRouter来重建单细胞轨迹,其中可以通过降维来构建k近邻(kNN)细胞网络。CellRouter的关键算法利用一种计分方案(称为基因调控网络评分(GRN)),通过其对预测靶基因的激活状态来识别转录调控因子。通过计算GRN(从ProE到OrthoE晚期),研究者可以记录出在晚期红系分化过程中的连续调节网络,包括正调节和负调节靶基因的表达;图3。基于的GRNs,研究者确定了一组排名第一的基因包括已知红细胞的调控因子,NFE2,HMGB2,YBX1,SOX6,FOXO3,和SNCA以及其他的候选调节基因目前,关于它们在终末红系分化中的作用的信息很少(表S2)。要注意的是GATA1和KLF1 在研究者的预测性调节剂列表中,但具有较低的预测能力,这可能是由于它们在红系分化后期的mRNA表达下降。
在终末红细胞分化,研究者指出,对于GRN分数SNCA,FOXO3,NFE2,NFIX,RNF10,TERF2IP和AKAP8L大幅上升,同时的GRN分数SOX6和YBX3持续下降。终末红系分化过程中GRN分数增加的基因可能比GRN分数降低的基因与调节红细胞分化更相关。此外,研究者注意到,不同的正调控子在终末红系分化的不同阶段增加了它们的表达水平,这意味着它们将在分化过程中的特定阶段起作用。为了验证这一假设,研究者选择了TERF2IP,AKAP8L和RNF10进行使用CD34 +细胞的敲低实验,因为以前尚未鉴定它们在红系分化过程中的功能。选择这些调节因子的依据是它们的高GRN评分和它们在不同分化阶段的上调表达模式
为了探索AKAP8L,TERF2IP和RNF10在不同发育阶段调节红系分化中的作用,研究者使用shRNA介导的敲低方法,并通过流式细胞术监测体外细胞分化。在分化的所有阶段对敲低效率进行了定量。在培养的第7天,AKAP8L -shRNA,TERF2I P-shRNA和RNF10 -shRNA 的敲低效率分别为58%,79%和72%(图 4A和SI附录,图S7)(https://www.pnas.org/lookup/suppl/doi:10.1073/pnas.1915085117/-/DCSupplemental))。红细胞生成可以在功能上分为两个阶段:早期红细胞生成,这包括从HSC到CFU-E的转变,以及ProE到OrthoE的终末红系分化。使用基于流式细胞术的策略,根据CD34和CD36的表面表达水平比较了对照组和基因敲低组之间的BFU-E和CFU-E群体。在第7天,对照组的BFU-E群体为19%,而在AKAP8L -shRNA组中,其BFU-E群体显着更高,为37%(P <0.01)。相反,对照组中的CFU-E群体为46%,高于AKAP8L -shRNA的13%(P <0.01)。因此,AKAP8L敲低导致红系祖细胞延迟成熟。敲低TERF2IP和RNF10后,在BFU-E或CFU-E中均未见到此类影响*。在TERF2IP -shRNA和RNF10* -shRNA中,BFU-E群体分别为27%和28%(对照组为19%),而CFU-E细胞分别为40%和41%(对照组为46%)(图4 B)。这些发现表明,敲除AKAP8L会延迟HSC先红系谱系发育,而敲除TERF2IP和RNF10不会影响该过程。
接下来,研究者验证了AKAP8L,TERF2IP和RNF10敲低对最终红系分化的影响。已有文献证明,CFU-E向ProE的转变以GYPA(CD235a)的表达为特征。流式细胞仪显示,在培养的第7天,AKAP8L敲低细胞中只有22%的是CD235a阳性,而对照组的43%的细胞是CD235a阳性,这表明AKAP8L的敲低将延迟CFU-E向ProE的分化。敲低RNF10或TERF2IP后未观察到此类延迟。(图 4 C).此外,监测细胞表面α4整合素和带3的表达水平,以评估终末红细胞分化表明AKAP8L敲低延迟红系细胞分化的第13天的进展,TERF2IP在第15天击倒,和RNF10第17天敲低( 图4 D) 。用Wright's-Giemsa在不同时间点培养的细胞染色表明,BasoE是第11天的优势种群,第13天是早期PolyE,第15天是晚期PolyE,第17天是OrthoE(图 2 B)。因此,敲除AKAP8L可以抑制细胞增殖,并延缓CFU-E分化为末期成红细胞阶段,而敲除TERF2IP延迟了PolyE早期到晚期PolyE的分化,而敲低的RNF10延迟了PolyE晚期到OrthoE早期的分化。
研究者还检查了AKAP8L,TERF2IP和RNF10敲低对细胞生长的影响。生长曲线显示,对照组和基因敲除组之间的细胞数只有很小的差异,直到第7天,AKAP8L基因敲除的细胞数显示从9天开始减少,一直持续到培养期结束。研究者还注意到,在第9天,TERF2IP和RNF10*敲低组的细胞数量略有减少,然后在第11天出现了激增([图4 E])。在培养结束时,类红细胞最终输出的减少很可能是由于凋亡引起的。
使用scRNA测序,确定了在红细胞分化末端过程中的动态基因表达谱。最近的研究揭示了源自人类胎儿脐带血和成年骨髓的人类干细胞的造血分化过程中各个发育阶段的表达特征。然而,红细胞生成的转录动力学仍然难以捉摸。在这里,研究者通过对从人脐带血和骨髓细胞中分离出的成红细胞的scRNA-seq分析了从ProE到OrthoE的基因表达动力学。研究者将人类红细胞生成分为PolyE和OrthoE分别分为early/late-PolyE和early/late-OrthoE。研究者还预测了红系分化末期过程中的调控因子,并进行了体外分化实验验证调控因子作用。