首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >数据库 | scImmOmics:一个人工编纂的单细胞多组学免疫数据资源

数据库 | scImmOmics:一个人工编纂的单细胞多组学免疫数据资源

作者头像
生信菜鸟团
发布2025-05-09 10:27:39
发布2025-05-09 10:27:39
2800
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

025年05月06日 09:12

图片
图片

Basic Information

  • 英文标题:scImmOmics: a manually curated resource of single-cell multi-omics immune data
  • 中文标题:scImmOmics:一个人工编纂的单细胞多组学免疫数据资源
  • 发表日期:04 November 2024
  • 文章类型:Database Issue
  • 所属期刊:Nucleic Acids Research
  • 文章作者:Yan-Yu Li | Chun-Quan Li
  • 文章链接:https://academic.oup.com/nar/article/53/D1/D1162/7874851

Abstract

  1. 单细胞测序技术已经能够发现和表征具有独特功能的免疫细胞亚群,这对于揭示健康或疾病条件下的免疫反应至关重要。
  2. 已经做出了收集和整理单细胞RNA测序(scRNA-seq)数据的努力,但仍然缺乏一个具有标准化元数据的特定于免疫系统的单细胞多组学图谱。
  3. 在这里,我们介绍了scImmOmics(https://bio.liclab.net/scImmOmics/home),这是一个基于高质量且已知免疫细胞标签的手动整理的单细胞多组学免疫数据库。
  4. 目前,scImmOmics记录了来自七种单细胞测序技术的超过290万种细胞类型标记的免疫细胞,涉及131种免疫细胞类型、47种组织和4个物种。
  5. 为了确保数据一致性,我们标准化了免疫细胞类型的命名,并以分层树结构呈现它们,以便清晰地描述免疫系统内的谱系关系。
  6. scImmOmics还提供了全面的免疫调控信息,包括T细胞/B细胞受体测序克隆型信息、细胞特异性调控信息(例如在已知细胞类型中的基因/染色质可及性/蛋白质/转录因子状态)、细胞间通讯和共表达网络以及免疫细胞对细胞因子的反应。
  7. 总的来说,scImmOmics是一个综合而有价值的平台,用于揭示免疫细胞的异质性和多样性,并阐明单细胞水平上的特定调控机制。
图片
图片

Introduction

Para_01
  1. 免疫细胞作为免疫系统的核心组成部分,在维持免疫功能、应对病原体以及调节疾病和癌症中的炎症方面发挥着至关重要的作用(1,2)。
  2. 对免疫细胞的研究已成为全面探索生理和病理状态的关键切入点。
  3. 大量证据表明,各种免疫细胞亚群伴随着复杂的分子和细胞变化,在不同的组织微环境中执行特定的功能(3,4)。
  4. 单细胞免疫谱分析技术的快速发展使得深入探索不同生理和病理状态下免疫细胞的具体亚群成为可能(5-7)。
  5. 例如,基于单细胞分析,已证明特定巨噬细胞和常规树突状细胞(cDCs)是肿瘤微环境中细胞交流的关键介质(8)。
  6. 然而,单细胞测序数据的高维度和免疫细胞的复杂性给这类数据的管理和下游分析带来了挑战,特别是在细胞类型注释方面,这通常需要深厚的免疫学专业知识。
  7. 研究人员利用先进的方法,如流式细胞术分选和手动标注免疫标记,来精确分类其出版物中的免疫细胞。
  8. 尽管这种方法劳动强度大,但它不仅有助于建立可靠的细胞类型,还揭示了更多种类的免疫细胞亚型。
  9. 准确注释免疫细胞类型是理解免疫细胞多样性和功能性的基本前提。
  10. 因此,全面整理和有效处理具有已知细胞标签的单细胞免疫数据集是一个迫切的需求。
Para_02
  1. 几年前开发了几种与免疫相关的资源,如SPICA(9)、ImmCluster(10)、huARdb(11)和JingleBells(12),这些资源被广泛使用。
  2. 这些数据库提供了关于单细胞水平免疫调节机制的宝贵见解。
  3. 尽管ImmCluster和SPICA提供了带有注释细胞标签的单细胞免疫数据,但它们主要关注scRNA-seq,这限制了对免疫景观的全面绘制和对免疫系统的深入探索。
  4. 其他单细胞多组学技术的到来,如scTCR-seq、scBCR-seq、scATAC-seq、CITE-seq和scCUT&Tag,使通过捕捉转录组学、表观遗传学和功能方面来解释细胞异质性和研究免疫系统成为可能。
  5. 例如,一项先前的研究通过整合单细胞RNA和抗原受体测序(13),阐明了健康和溃疡性结肠炎(UC)样本中外周和胃肠道粘膜免疫系统的组成部分、细胞状态和克隆关系。
  6. 另一项研究利用多组学分析详细绘制了胸腺上皮细胞(TEC)区室图,揭示髓质TEC有助于诱导中枢耐受,并调节其他胸腺驻留群体的稳态(14)。
  7. 这些研究通过结合单细胞转录组学、表观基因组学和蛋白质组学的数据,增强了我们对免疫系统复杂性的理解。
  8. 然而,这些细胞往往分散在各种平台和出版物中,突显出挖掘和分析高质量单细胞多组学数据以应对不同疾病情景和发育阶段的需求。
  9. 此外,诸如免疫克隆型和对细胞因子的反应等免疫特异性调控信息,将显著有助于揭示免疫特异性的调控机制以及免疫细胞亚群的功能多样性。
  10. 鉴于此,迫切需要开发一个具有已知细胞标签的专业且全面的免疫单细胞多组学数据库。
Para_03
  1. 在这里,我们开发了一个手动整理的单细胞免疫特异性数据库,scImmOmics(https://bio.liclab.net/scImmOmics/home),旨在记录大量的可用单细胞免疫多组学数据资源,并结合高质量的细胞类型注释和免疫特异性调控信息。
  2. 当前版本的scImmOmics记录了来自七种单细胞测序技术(scRNA-seq、scTCR-seq、scBCR-seq、scATAC-seq、CITE-seq、ECCITE-seq和scCUT&Tag-pro)的超过290万标记细胞类型的免疫细胞,涉及131种免疫细胞类型、47种组织和4个物种。
  3. 此外,scImmOmics提供了全面的细胞/簇特异性调控信息,如聚类、基因表达、差异表达基因(DEGs)、通路/基因本体论(GO)术语/标志物/免疫特征注释、分化轨迹、细胞间通讯、共表达网络及其标志性基因、蛋白质表达、组蛋白修饰状态、差异染色质可及性区域和转录因子(TFs)的z分数。
  4. 特别是,scImmOmics提供了对免疫克隆丰度、不同细胞类型之间免疫克隆型分布以及对细胞因子的免疫反应的分析,从而有助于更深入地理解免疫细胞多样性、克隆扩增、抗原特异性和功能亚群。
  5. 总之,scImmOmics将作为一个有价值的平台,帮助用户获得对免疫细胞异质性的更全局视角,并深入探究免疫系统的复杂因果关系。

Materials and methods

Data pre-processing

数据预处理

Para_04
  1. 我们使用‘(单细胞)或(单细胞测序)或(单细胞表观基因组)或(scRNA-seq)或(scTCR-seq)或(scBCR-seq)或(scATAC-seq)或(CITE-seq)或(ECCITE-seq)或(scCUT&Tag)’作为关键词在PubMed上进行了查询,并获得了超过7000篇最近的出版物。
  2. 在文献中,‘数据可用性’部分通常记录了数据存储资源,主要包括NCBI GEO(15)、单细胞表达图谱(EMBL-EBI/SCEA)(16)、GitHub、Zenodo、人类细胞图谱门户(HCA)(17)和CellTypist(18),其中处理后的文件存储在各种格式中,例如MatrixMarket、RDS和H5。
  3. 我们首先下载并保留了包含元数据的数据,这些数据通常从原始文章继承了UMAP坐标和细胞/组织类型信息。
  4. 根据细胞类型信息提取并过滤了免疫细胞。
  5. 然后,我们手动调整并扩展了元信息,包括物种、组织、健康/疾病状态、数据来源、平台、PMID、文章名称、期刊和年份。
  6. 为了生成详细的分层免疫细胞结构,我们通过以下步骤进一步标准化了多样的元信息:(i)将缩写细胞类型转换为其全名,(ii)将细胞类型映射到细胞本体(19),(iii)向我们的细胞类型层次结构中添加细胞本体中不存在的新细胞亚型,(iv)统一组织名称。
  7. 最后,我们收集了来自不同平台的超过290万种免疫细胞,共计131种免疫细胞类型,包括10x Genomics、MARS-seq、Seq-Well、Smart-seq2、inDrop和Microwell-seq。

Differential gene and functional annotation

差异基因与功能注释

Para_05
  1. 基于已知的免疫细胞类型,我们使用了R包Seurat中的‘FindAllMarkers’函数来识别每种细胞类型的DEGs(差异表达基因)(20),并使用Wilcoxon检验来确定显著的P值。
  2. 基因的对数值变化(|logFC| >= 0.25)和P值小于0.01被认为是差异表达的。
  3. 接下来,我们使用R包clusterProfiler(21)对每个DEG集进行了功能富集分析。
  4. 这些GO术语、通路、标志物和免疫特征(来自MSigDB)经过调整后的P值小于0.05被认为显著富集,并使用条形图和气泡图进行可视化(22-25)。

Differentiation trajectories

分化轨迹

Para_06
  1. 轨迹分析有助于理解各种细胞类型之间的转换和相互作用,揭示免疫系统内的复杂动态变化。
  2. 在这里,我们使用了R包Monocle3(26)来推断免疫细胞的轨迹及其发育伪时间,采用‘get_earliest_principal_node’策略设置默认根节点。
  3. R包CytoTRACE2被用来通过量化基因多样性来评估分化潜力和细胞状态(27)。

Co-expression modules

共表达模块

Para_07
  1. 我们使用高维加权基因共表达网络分析(hdWGCNA)构建了基因共表达网络模块,并在不同组中鉴定了关键调节因子(28)。
  2. 对于每个模块,使用‘ModuleConnectivity’函数计算基于特征基因的连接性(kME)和高度连接的枢纽基因。

Cell–cell communications

细胞间的通讯

Para_08
  1. 为了评估不同免疫细胞类型之间在信号通路水平上的细胞-细胞相互作用(CCIs),我们基于CellChatDB数据库进行了CellChat(29)分析。
  2. 每个与信号通路相关的配体-受体相互作用都被赋予了一个概率值,并进行了置换检验来推断细胞间的通信。
  3. 所有P值小于0.01的CCIs都基于权重或计数在圆形图中可视化了。

Identification and statistics of clonotypes

克隆型的识别和统计

Para_09
  1. 映射免疫细胞的克隆型景观可以帮助用户理解抗原受体识别和免疫系统内功能多样性的工作机制。
  2. 基于来自单细胞T细胞受体测序(scTCR-seq)或单细胞B细胞受体测序(scBCR-seq)数据中的CDR3序列,我们计算了每个细胞的克隆频率,当前细胞类型中具有该克隆型的细胞比例以及不同细胞类型之间的克隆型分布。
  3. 此外,使用R包scRepertoire可视化克隆网络,并使用源自(1)的Startrac生成多样性指数,包括克隆扩增、跨组织迁移和状态转换。
  4. 最后,scImmOmics提供了关于免疫细胞类型、V(D)J基因注释和CDR3序列的详细信息。
  5. 对于没有耦合scTCR-seq或scBCR-seq数据的scRNA-seq样本,我们进一步下载了它们的FASTQ或BAM格式文件,并应用TRUST算法进行从头组装免疫受体库,从而实现T细胞受体(TCR)和B细胞受体(BCR)的重建。

Differential accessibility regions (DARs) and functional annotation (scATAC-seq)

差异可及区域(DARs)和功能注释(scATAC-seq)

Para_10
  1. 研究不同细胞类型的差异可及区域(DARs)对于理解免疫细胞的异质性和多样性至关重要。
  2. 对于单细胞ATAC测序样本,我们使用scATAC-pro(34)的runDA模块计算了每种细胞类型的DARs,并使用assignGene2Peak函数来识别最近关联的基因。
  3. 最近的基因被定义为距离峰中心100kb范围内的最接近的基因。
  4. 基于DARs的最近基因,我们使用R包clusterProfiler进行了GO术语、通路、标志和免疫特征富集分析,以进一步阐明每种细胞类型的DAR功能。

Co-accessibility and gene activity scores (scATAC-seq)

共可及性和基因活性评分(scATAC-seq)

Para_11
  1. 为了阐明免疫细胞功能和多样性的调控机制,我们利用Cicero软件(35)基于相关方法计算了可及区域对的共可及性评分。
  2. 使用0.25的阈值来确定显著的共可及性相互作用。
  3. 随后,通过考虑这些共可及性区域与转录起始位点(TSS)的接近程度以及它们与基因启动子区域的共可及性,将这些共可及性区域与附近的基因联系起来。
  4. 最后,通过将与基因启动子共可及的连接区域的可及性加权求和,确定了基因活性评分。

TF/motif enrichment scores and differential TFs (scATAC-seq)

TF/基序富集评分和差异TF(scATAC-seq)

Para_12
  1. 富集的TFs通过R包chromVAR(36)确定,TF基序来自JASPAR CORE 2022数据库(37)和chromVARmotifs(36)。
  2. 每种细胞类型的差异TFs/基序使用P值<0.05的Wilcoxon检验来识别。
  3. 最后,我们分别使用散点图和热图可视化了TF/基序z分数和差异TFs/基序。

Database implementation

数据库实现

Para_13
  1. scImmOmics的当前版本是使用MySQL 5.7.17(http://www.mysql.com)开发的,并运行在一个基于Linux的Apache Web服务器(http://www.apache.org)上。
  2. SpringBoot(https://spring.io/projects/spring-boot)用于服务器端脚本编写。
  3. 交互界面是使用Bootstrap v5.3.0(https://v5.bootcss.com)和JQuery v3.7.1(http://jquery.com)设计和构建的。
  4. ECharts(https://www.echartsjs.com/)和Plotly(https://plotly.com/javascript/)被用作图形可视化框架。
  5. 我们推荐使用支持HTML5标准的现代网络浏览器,例如Firefox、Google Chrome、Safari、Opera或IE 9.0+以获得最佳显示效果。
  6. 此外,scImmOmics是由基于Docker(https://hub.docker.com/)的强大基础设施提供支持的,这使得可扩展性和可移植性成为可能。

Description of the database

数据库的描述

Overview of scImmOmics

scImmOmics概述

Para_14
  1. scImmOmics的主要框架和功能如图1所示。
  2. scImmOmics目前支持来自多种单细胞测序技术的免疫数据,这些数据具有已知的细胞标签,包括scRNA-seq、scTCR-seq、scBCR-seq、scATAC-seq、CITE-seq、ECCITE-seq和scCUT&Tag-pro(补充表S1)。
  3. 这些数据集涵盖了多种模态,包括‘scRNA-seq + scTCR-seq + scBCR-seq’、‘ECCITE-seq + scTCR-seq + scBCR-seq’、‘scRNA-seq + scTCR-seq + scATAC-seq’、‘CITE-seq + scTCR-seq’和‘scRNA-seq + scTCR-seq’。
  4. 我们进一步对这些数据集进行了统一归一化和下游分析,例如基因/蛋白质/转录因子活性计算、差异表达基因鉴定、通路/GO术语/免疫特征富集分析、细胞间通讯、共表达网络分析、差异可访问性区域鉴定、共可及性预测、免疫克隆丰度、不同细胞类型中的免疫克隆型分布以及对细胞因子的免疫反应。
  5. 对于这些数据集和下游分析结果,scImmOmics支持三种搜索模型、两种分析工具和一个用户友好的浏览器和下载界面。
  6. scImmOmics还提供了标准化命名和详细的层次树,用于免疫细胞类型(图1,左下角面板)。
图片
图片

图片说明

◉ 图1。平台内容和构建。scImmOmics 手动收集了大量具有已知细胞标签的单细胞免疫多组学数据。◉ 其中包括捕捉每个细胞多种模式的数据集,包括‘ECCITE-seq + scTCR-seq + scBCR-seq’、‘scRNA-seq + scTCR-seq + scATAC-seq’、‘scRNA-seq + scTCR-seq + scBCR-seq’、‘CITE-seq + scTCR-seq’ 和 ‘scRNA-seq + scTCR-seq’。◉ 例如,‘scRNA-seq + scTCR-seq + scBCR-seq’ 表示捕捉每个细胞三种模式(scRNA-seq、scTCR-seq 和 scBCR-seq)的数据集,使人们能够更全面地理解个体细胞中的转录调控、免疫受体多样性和表观遗传特征。◉ scImmOmics 支持浏览、搜索、分析、可视化和下载与免疫相关的信息。

Search interface for retrieving scImmOmics datasets

检索scImmOmics数据集的搜索界面

Para_15
  1. scImmOmics使用户能够搜索、浏览、分析、可视化和下载感兴趣的免疫细胞(图2)。
  2. 在‘搜索’界面,我们提供了三种查询方法来搜索与免疫相关的样本:‘按组织类型搜索’、‘按疾病搜索’和‘按细胞类型搜索’(图2B)。
  3. 返回样本的基本信息显示在结果页面的表格中,包括样本ID、来源、已知细胞类型、组织、文章名称和PMID(图2A)。
  4. 用户可以点击感兴趣的样本ID访问详细页面,在该页面上,参与的免疫细胞类型的统一分层结构在树状图中突出显示(图2E)。
  5. 关于可视化面板中的scRNA-seq数据,我们展示了根据已知细胞标签、基因表达活性、细胞间通信、共表达网络、差异表达基因、功能注释、分化潜力和伪时间着色的UMAP投影(图2C)。
  6. 同时,每个免疫细胞的克隆频率、各种细胞类型中具有克隆型的细胞比例以及单个免疫细胞的详细克隆型信息也被显示出来(图2C)。
  7. 对于CITE-seq和ECCITE-seq数据,我们展示了每个细胞中感兴趣蛋白质的活性(图2C)。
  8. 对于scATAC-seq数据,scImmOmics提供了UMAP投影、基因/转录因子的活性评分、转录因子活性热图以及差异染色质可及性区域和转录因子的表格(图2D)。
  9. 此外,还可以在scCUT&Tag-pro的详细页面上显示在同一免疫细胞中测量的组蛋白修饰活性和蛋白质表达信息。
图片
图片

图片说明

◉ 图2.scImmOmics的主要功能和使用方法。(A)scImmOmics的浏览页面。◉ (B)提供了三种查询模式,包括‘按组织类型搜索’、‘按疾病搜索’和‘按细胞类型搜索’。◉ (C)单细胞RNA测序样本的详细信息。◉ (D)单细胞ATAC测序样本的详细信息。◉ (E)分层免疫细胞类型树。◉ (F)四个在线分析工具:‘比较两个样本’、‘基因富集分析’、‘综合分析’和‘免疫反应富集分析’。

A user-friendly interface for browsing scImmOmics datasets

用于浏览 scImmOmics 数据集的用户友好界面

Para_16
  1. 浏览器表格描述了每个样本的信息,包括物种、组织类型、细胞类型、数据类型、疾病状态、数据来源、平台、文章、期刊、年份和PMID(图2A)。
  2. 用户可以根据‘CellType’、‘TissueType’、‘DataType’、‘DiseaseStatus’和‘Species’查看数据集并自定义过滤器。
  3. 例如,在浏览器界面中的‘DiseaseStatus’过滤器可以帮助用户快速定位感兴趣的疾病。
  4. 用户还可以通过选择‘DataType’来筛选具有多种模态的数据样本,包括‘scRNA-seq + scTCR-seq’、‘scRNA-seq + scATAC-seq’、‘ECCITE-seq + scTCR-seq + scBCR-seq’等。
  5. 点击‘Sample ID’后,可以进一步查看给定数据集的免疫细胞信息。
Online analysis tool

在线分析工具

Para_17
  1. 我们实现了四种在线工具用于免疫相关分析,包括‘免疫反应富集分析’、‘基因富集分析’、‘综合分析’和‘比较两个样本’。
  2. 在‘免疫反应富集分析’工具中,scImmOmics 基于基因表达数据评估细胞因子活性和免疫细胞极化,给定感兴趣的细胞因子输入。
  3. 具体来说,我们获得了包含来自1400种细胞因子-细胞类型组合差异表达基因(DEGs)的细胞因子特征词典(22)。
  4. R 包 homologene 用于跨物种同源基因转换。
  5. 使用这些细胞因子特征的差异表达基因,我们在给定的数据上使用 AUCell 方法进行了富集计算(38)。
  6. 免疫细胞中感兴趣细胞因子的 AUCell 富集分数的分析结果通过多种可视化方法显示,包括(i)细胞和细胞因子富集分数,(ii)细胞类型和细胞因子富集分数,以及(iii)不同免疫细胞类型的细胞因子响应特异性(图2F)。
  7. 在‘比较两个样本’分析工具中,用户可以选择两个感兴趣的样本集,scImmOmics 将显示每个样本集的详细信息。
  8. 通过检查两个样本之间的相似性和差异,我们可以更深入地了解免疫细胞特性、聚类模式以及多个数据集或平台上的基因表达动态(图2F)。
  9. ‘基因富集分析’允许用户输入感兴趣的基因集,并基于超几何检验灵活评估其与各种免疫细胞类型差异表达基因的相关性(图2F)。
  10. 输出表包含了识别出的免疫细胞的基本信息(例如SampleID、Species、TissueType、Disease Status、DataType和CellType)、P值和调整后的P值。
  11. ‘综合分析’允许用户选择感兴趣的单细胞RNA测序和单细胞ATAC测序样本,scImmOmics 将显示整合结果和每个数据集的详细信息。
  12. 这一功能促进了对基因表达和调控元件之间联系的探索,增强了我们对免疫细胞状态和功能的理解(图2F)。
  13. 该功能促进了对基因表达和调控元件之间联系的探索,增强了我们对免疫细胞状态和功能的理解(图2F)。
Data download

数据下载

Para_18
  1. ‘rds’格式的数据和每个样本的元数据可以在‘下载’页面(图2)下载。用户可以快速下载感兴趣的數據。
  2. 我们还支持在‘搜索结果’页面导出查询结果。
  3. We also support exporting query results on the ‘Search Result’ page.

Case study

案例研究

Case study of PBMC dataset

PBMC数据集案例研究

Para_19
  1. 为了说明scImmOmics的使用和优势,我们在搜索页面输入了‘PBMC’并选择了样本‘PBMC_0001’以访问详细页面(图3A)。
  2. 该样本被标记为‘scRNA-seq + scTCR-seq + scBCR-seq’,表明它包含了从每个细胞捕获的三种不同类型的测序数据。
  3. 如UMAP模块所示,免疫细胞被分类为十大主要类别(39)(图3B)。
  4. 我们首先通过点击‘表达’模块观察相应细胞类型中已知细胞标记物的表达水平(图3C)。
  5. 与现有的生物学知识一致,B细胞簇表现出较高水平的CD19和CD22这两种已知的B细胞标记物(40,41)。
  6. 随后,CD19和CD22被识别为B细胞特异性差异表达基因(DEGs),这表明了我们下游分析的可信度(图3D)。
  7. 功能富集分析进一步证实了这些DEGs与B细胞之间的关联,因为它们显著富集于与B细胞相关的GO术语和通路中,例如‘B细胞凋亡过程的调节’和‘B细胞受体信号通路’(图3D)。
  8. 这些发现证明了scImmOmics中数据和分析结果的可靠性。
  9. 随后,在‘共表达模块’中鉴定出几个关键基因(图3E),包括IL7R(42,43)、ACTB(44)和JUND(45)。
  10. 其中,IL-7R已被表征为炎症性免疫反应的标志物(42,46),表明scImmOmics能够深入探究免疫调节的复杂机制。
  11. 同时,我们可以通过点击‘样本相关性’模块检查不同样本之间免疫细胞类型的关联(图3F)。
  12. 此功能允许用户评估不同条件下免疫细胞的相似性和多样性。
  13. 此外,‘scBCR-seq’模块还帮助用户探索不同生物背景下的B细胞受体(BCRs)的多样性和克隆扩增,揭示了它们在免疫反应和疾病进展中的作用(图3G)。
图片
图片

图片说明

◉ 图3。PBMC数据集的案例研究。(A) scImmOmics的搜索页面。(B) scRNA-seq样本的UMAP投影。(C) 基因表达(scRNA-seq)。(D) 差异表达基因和功能注释(scRNA-seq)。(E) 共表达网络(scRNA-seq)。(F) 样本相关性(scRNA-seq)。(G) scBCR-seq信息。(H) '基因富集分析'工具的输入和分析结果。(I) CITE-seq样本的UMAP投影。(J) 蛋白质活性(CITE-seq)。(K) '综合分析'工具。(L) scRNA-seq样本‘PBMC_0001’和scATAC-seq样本‘PBMC_0010’的综合分析结果,UMAP投影按已知细胞标签着色。(M) 综合结果中的基因活性。(N) 差异可及染色质区域和功能注释(scATAC-seq)。

Para_20
  1. 为了进一步评估scImmOmics的实用性,我们使用了‘PBMC_0001’样本中的B细胞差异基因作为输入,在‘基因富集分析’中设置了严格的阈值(图3H)。
  2. 结果显示在包含B细胞的样本中显著富集,突显了scImmOmics平台捕捉免疫差异和特异性的能力。
  3. 值得注意的是,我们在其他组学样本中也观察到了显著富集,例如CITE-seq样本‘PBMC_0016’和scATAC-seq样本‘PBMC_0010’(图3H)。
  4. 通过点击样本ID‘PBMC_0016’进入详细页面,我们注意到B细胞中CD19和CD22的高蛋白活性,这与来自scRNA-seq样本的基因表达水平一致(图3I和J)。
  5. 这种一致性增强了我们数据库的可靠性,表明在免疫细胞中结合蛋白质活性和基因表达的可行性。
  6. 为了更全面地了解scImmOmics在揭示免疫调节复杂性方面的功能和优势,我们通过选择上述提到的scRNA-seq样本‘PBMC_0001’和scATAC-seq样本‘PBMC_0010’进行了‘整合分析’(图3K)。
  7. 如图3L所示,我们在染色质可及性和基因表达数据中观察到了一致的调控特征,突显了scImmOmics在结合多个组学维度方面的优势。
  8. 在‘基因活性’模块中,CD19在来自scRNA-seq和scATAC-seq样本的B细胞中表现出更高的表达和基因活性评分(图3M)。
  9. 这里,基因活性评分是使用Cicero(35,47)量化得出的,允许用户进一步探索驱动基因表达的复杂调控机制(见‘材料和方法’部分)。
  10. 通过点击‘差异可及染色质区域’模块,我们发现CD19和CD22均被鉴定为B细胞差异可及染色质区域(DARs)的最近基因(图3N)。
  11. 同时,这些与DAR相关的基因在B细胞相关通路中显著富集(图3N),反映了数据的可靠性和揭示细胞类型特异性免疫调控特征的稳健性。
  12. 总体而言,这些结果展示了表观基因组学、转录组学和蛋白质组学之间的一致性,突显了scImmOmics在多组学层面上研究复杂免疫机制的能力和优势。
Case study of BoneMarrow dataset

BoneMarrow 数据集案例研究

Para_21
  1. 在搜索页面输入‘BoneMarrow’后,检索到了与骨髓相关的样本,包括单细胞RNA测序样本‘BoneMarrow_0002’和单细胞ATAC测序样本‘BoneMarrow_0011’(补充图S1A和B)。
  2. 我们首先点击了单细胞RNA测序样本的样本ID‘BoneMarrow_0002’以访问其详细的转录水平信息。
  3. 在‘表达’模块中,我们观察到已知标记物(CD86、CD33和CD69)以及相应细胞类型中的关键转录因子(IRF4)的高表达(补充图S1C和D)。
  4. 这些结果与已建立的生物学知识一致,为后续在scImmOmics中的发现提供了可靠性支持(48–58)。
  5. 为了展示scImmOmics的应用潜力,我们进一步结合多个组学维度深入研究了骨髓内免疫细胞的转录调控机制。
  6. 具体来说,我们选择了单细胞ATAC测序样本‘BoneMarrow_0011’以访问其详细页面(补充图S1E)。
  7. 点击‘基因活性评分’模块后,我们观察到这些标记物和转录因子的预期基因活性水平,这与来自单细胞RNA测序样本的基因表达数据一致(补充图S1F)。
  8. 基于Cicero(35)估算的基因活性,有效地揭示并解读了通过结合特定细胞环境中的染色质可及性而形成的复杂的基因调控图谱。
Para_22
  1. 为了阐明scImmOmics捕捉多种重要调控信息的能力,我们在scRNA-seq样本页面点击了'共表达模块',发现大多数枢纽基因也被识别为不同细胞类型的差异表达基因(DEGs),例如SRGN、S100A9、HSP90B1和PRDX4(补充图S1H)。文献(59-63)报道了它们在免疫系统中的特定功能,证实了我们下游分析的可靠性和实用性。
  2. 通过整合染色质可及性信息(scATAC-seq样本页面上的'差异染色质区域'模块),我们进一步发现多个差异可及区域(DARs)在相应细胞类型中靠近这些枢纽基因富集(补充图S1I)。例如,在单核细胞中,S100A9作为最近的基因之一,与单核细胞的关键标记物共表达,包括CD68(64)、CLEC12A(65,66)和CEBPD(67)(补充图S1H-I)。
  3. 其中,标记物CEBPD通过点击scATAC-seq样本页面上的'TF z_score'模块显示了更高的转录因子活性,这与其在此特定细胞类型中的关键作用一致(补充图S1G-I,参见"材料和方法"部分)。共表达基因和与S100A9相关的DAR都强调了它在单核细胞功能中的重要性,突显了scImmOmics在解析复杂免疫细胞调控机制方面的可靠性和适用性。
  4. 此外,我们注意到作为差异转录因子基序的POU2F2在成熟B细胞中显示出比前体B细胞更高的转录因子活性,这与其在B细胞分化中的关键作用一致,特别是在向浆细胞过渡的过程中(68)(补充图S1G和J)。使用scRNA-seq样本页面的'共表达模块'和'差异表达基因',我们进一步发现几个POU2F2共表达枢纽基因,如HSP90B1和PRDX4,在浆细胞中显著差异表达。
  5. 总体而言,scImmOmics一致地捕捉到了免疫细胞在转录和表观遗传景观上的特征,提供了对免疫细胞功能和调控机制的全面综合视图。
Para_23
  1. 最后,我们在单细胞RNA测序样本上进行了‘免疫反应富集分析’,发现几种关键的免疫细胞因子对应于相应的细胞类型(补充图S1K)。
  2. 例如,白细胞介素-12(IL-12)、白细胞介素-23(IL-23)、干扰素-α(IFN-α)和白细胞介素-1β(IL-1β)细胞因子在cDCs中的AUCell评分存在差异,这与其在免疫调节和炎症中的既定作用一致(69–73)。
  3. 总之,scImmOmics的能力和生物学价值在上述案例结果中得到了充分体现,涵盖了基因表达、不同的可及染色质区域、共表达、基因活性评分和转录因子活性等多个方面。

Discussion

Para_24
  1. 单细胞测序技术的出现促进了对免疫分化和激活过程以及免疫细胞类型的异质性的理解。
  2. 最近的研究开发了几个与免疫相关的数据库,为分析单细胞水平的免疫微环境提供了机会,例如ImmCluster(10),JingleBells(12),SPICA(9)和huARdb(11)。
  3. 虽然这些现有的数据库推动了对免疫系统的研究,但在多组学数据整合、手动细胞类型注释、更广泛的免疫细胞亚型、丰富的调控信息和免疫特异性功能分析方面仍存在一些限制。
  4. 在现有资源中,huARdb和JingleBells使用计算软件自动预测低覆盖率的细胞类型。
  5. ImmCluster和SPICA提供了具有已知细胞标签的单细胞免疫数据,但它们主要关注scRNA-seq。
  6. 上述局限性促使我们建立了scImmOmics,这是一个高质量的免疫单细胞多组学数据的综合资源,具有已知细胞标签和全面的调控分析。
Para_25
  1. scImmOmics 不仅是一个用户友好的数据库,可以查询、浏览和可视化与免疫细胞相关的数据,而且与现有的数据库相比,它具有多个亮点和优势,如下所述:
  2. (i) scImmOmics 支持来自多种单细胞测序技术的免疫数据,包括 scRNA-seq、scTCR-seq、scBCR-seq、scATAC-seq、CITE-seq、ECCITE-seq 和 scCUT&Tag-pro。整合更多样化的实验技术类型将为解释细胞异质性和研究免疫系统提供新的视角;
  3. (ii) scImmOmics 目前版本涵盖了 131 种免疫细胞类型和 46 种不同的组织,代表了广泛的免疫细胞和组织类型;
  4. (iii) scImmOmics 中收录的免疫细胞经过精心策划和手动注释,引用了原始文章;
  5. (iv) scImmOmics 具有详尽的免疫细胞层次结构,提供了统一命名和免疫细胞类型的层级树;
  6. (v) scImmOmics 为用户提供了一系列与免疫相关的分析,如细胞对细胞因子的免疫反应、克隆型信息识别、功能注释(GO术语、通路和免疫特征基因)、分化轨迹、细胞间通讯和共表达网络以及染色质可及性/蛋白质/转录因子/组蛋白修饰状态。
Para_26
  1. 总的来说,scImmOmics 是一个全面的手动整理的单细胞免疫数据资源。
  2. 当前版本的 scImmOmics 记录了来自七种单细胞测序技术的超过290万种带有细胞类型标签的免疫细胞,涉及131种免疫细胞类型和四个物种。
  3. 在未来,我们将致力于通过定期更新数据来持续维护和优化数据库,以纳入最新的高质量单细胞测序数据集。
  4. 通过覆盖更广泛的免疫细胞类型、物种、疾病状态、测序技术和平台,增强我们数据库的实用性。
  5. 我们还计划通过整合额外的免疫组学数据(如scChIP-seq和空间转录组学)来扩展 scImmOmics 的范围,从而实现更全面和多维度的分析。
  6. 此外,我们将继续探索更高效的分析工具,以提高数据分析的速度和可用性,从而增加 scImmOmics 的整体应用价值。
  7. 最终,我们相信 scImmOmics 将成为一个有用且高质量的平台,用于探索免疫细胞在疾病和各种生物过程中的潜在功能和调控作用。

Data availability

Para_27
  1. scImmOmics 可免费在线访问 https://bio.liclab.net/scImmOmics/home,并且无需登录。
  2. 详细代码可在 https://github.com/chunquanlipathway/scImmOmics 和 https://doi.org/10.5281/zenodo.13918587 获取。

Supplementary data

Para_28
  1. 补充数据可在NAR在线获取。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Basic Information
  • Abstract
  • Introduction
  • Materials and methods
    • Data pre-processing
    • Differential gene and functional annotation
    • Differentiation trajectories
    • Co-expression modules
    • Cell–cell communications
    • Identification and statistics of clonotypes
    • Differential accessibility regions (DARs) and functional annotation (scATAC-seq)
    • Co-accessibility and gene activity scores (scATAC-seq)
    • TF/motif enrichment scores and differential TFs (scATAC-seq)
    • Database implementation
    • Description of the database
      • Overview of scImmOmics
      • Search interface for retrieving scImmOmics datasets
      • A user-friendly interface for browsing scImmOmics datasets
      • Online analysis tool
      • Data download
    • Case study
      • Case study of PBMC dataset
      • Case study of BoneMarrow dataset
  • Discussion
  • Data availability
  • Supplementary data
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档