首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >数据库 | SPathDB:空间通路活性图谱综合数据库

数据库 | SPathDB:空间通路活性图谱综合数据库

作者头像
生信菜鸟团
发布2025-04-18 13:05:09
发布2025-04-18 13:05:09
2740
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

2025年04月10日 10:29

图片
图片

Basic Information

  • 英文标题:SPathDB: a comprehensive database of spatial pathway activity atlas
  • 中文标题:SPathDB:空间通路活性图谱综合数据库
  • 发表日期:15 November 2024
  • 文章类型:Database Issue
  • 所属期刊:Nucleic Acids Research
  • 文章作者:Feng Li | Yanjun Xu
  • 文章链接:https://academic.oup.com/nar/article/53/D1/D1205/7901280

Abstract

  1. 空间转录组测序技术加深了我们对复杂组织中细胞行为、命运和状态多样性的理解,这些通常由调控网络功能活动的精细调节决定。
  2. 因此,表征组织空间内的功能活动有助于揭示驱动空间异质性的功能特征,并理解复杂的生物过程。
  3. 在此,我们描述了一个数据库 SPathDB(http://bio-bigdata.hrbmu.edu.cn/SPathDB/),旨在解析在功能活动背景下由通路介导的多维空间异质性。
  4. 我们从公共数据资源中手动整理了空间转录组数据集和生物通路。
  5. SPathDB 包含来自 84 个人类和小鼠空间转录组数据集的 695 个切片中的 1,689,868 个空间点,涉及 36 种组织,还包括癌症等疾病,并提供跨这些空间点的 114,998 条通路的功能活动的交互分析和可视化。
  6. SPathDB 提供五个灵活的界面,用于检索和分析跨空间点具有高度可变功能活动的通路,通路功能活动沿伪空间轴的分布,通路介导的空间细胞间通讯以及空间通路功能活动与细胞类型发生之间的关联。
  7. SPathDB 将作为一个基础资源,用于识别功能特征并阐明空间异质性背后的机制。
图片
图片

Introduction

Para_01
  1. 空间转录组技术在量化单个细胞/点的分子特征的同时,保留了组织中每个细胞/点的物理位置信息。
  2. 这对于深入理解由精细调节网络功能活动驱动的细胞行为、组织复杂性、疾病发生和药物耐受具有重要意义。
  3. 通路中的基因构成了重要的功能调控网络,通路活性分析可以提供更强大的方法来剖析和解释细胞和空间异质性。
  4. 因此,有必要在空间分辨率上研究通路功能活动。
Para_02
  1. 空间转录组测序技术对于阐明基因表达、功能活动和细胞相互作用在空间维度上的特性具有重要意义,从而加深我们对组织和器官发育、疾病发生、肿瘤形成和药物耐药机制的理解。
  2. Starfysh 整合了空间转录组数据,以表征组织特异性细胞状态并揭示异质性。
  3. 对人类胰腺癌的空间和单细胞转录组数据分析揭示了与不良预后相关的癌细胞群。
  4. Cang 等人在皮肤发育过程中捕捉到了局部高活性信号通路以及细胞间通讯的信号方向。
  5. Hwang 等人基于胰腺癌的空间转录组数据,识别出与新辅助治疗相关的多细胞动态变化。
  6. 随着空间转录组数据的不断积累,研究人员已经开发了许多由研究需求驱动的空间组学数据库。
  7. 例如,CROST 和 STOmicsDB 存储了人工整理的空间转录组数据,并提供了下游分析和可视化工具。
  8. SORC 特别为癌症的空间转录组数据提供可视化和分析。
  9. SODB 数据库存储了来自各种空间组学技术的数据集,并提供了交互式分析模块。
  10. 这些数据库有助于空间组学数据的分析。
  11. 而细胞在空间组织结构中表现出的行为和状态的多样性主要由基因之间的调控相互作用及其共同执行的功能活动决定。
  12. 因此,一个专门用于表征复杂细胞空间功能景观的数据库对于揭示空间异质性和阐明潜在的生物学机制至关重要。
Para_03
  1. 我们开发了 SPathDB(http://bio-bigdata.hrbmu.edu.cn/SPathDB/),一个用于解析功能活动背景下通路介导的多维空间异质性的综合数据库。
  2. SPathDB 数据库的当前版本包含以下元素:(i) 来自 84 个人类和小鼠空间转录组数据集的 695 个切片的总计 1,689,868 个空间点,涉及 36 种组织(其中一部分切片来自 30 种癌症类型/亚型);(ii) 总计 114,998 条生物功能通路;(iii) 展现出在不同空间切片和不同点群中多样功能活动的空间变异通路(SVP);以及 (iv) 空间点和通路活动的轨迹分布。
  3. SPathDB 提供用户友好的界面,用于探索 114,998 条通路在空间点上的功能活动,并提供了五种灵活的工具来检索和探索基因表达及通路活动的空间分布、伪时间轨迹上的空间通路功能活动、通路介导的空间细胞-细胞通信以及空间通路活动与细胞类型出现之间的相关性,从而揭示复杂关系。
  4. 总之,SPathDB 将为研究导致空间异质性的驱动功能特征提供重要见解,并作为一个综合数据库,用于识别适用于空间异质性分析的通路激活特征。

Materials and methods

Data collection and processing

数据收集和处理

Data collection

数据收集

Collection of spatial transcriptome data
Para_04
  1. 人类和小鼠的空间转录组数据集从Gene Expression Omnibus (GEO)数据库、10× Genomics、Mendeley Data和CROST收集。
  2. 我们保留了包含空间位置坐标、表达谱和组织学图像的空间转录组数据。
  3. 空间组织图像可以直观地显示组织切片的整体实际图像,这使得可以根据坐标恢复对点的空间可视化图像进行比较和校正,还可以将组织图像与不同空间位置的分子特征(如通路活性和基因表达)进行比较和分析。
  4. 为了确保数据的可靠性并进一步方便数据库的使用,在收集空间转录组数据时,仅保留具有组织学图像信息的数据。
  5. 此外,我们还从PubMed收集了与空间转录组学相关的文献,以提取包含上述信息的空间转录组数据。
Collection of single-cell RNA sequencing datasets
Para_05
  1. 我们首先在 GEO 数据库中查找每个空间转录组数据集的同一批次测序的单细胞表达数据。
  2. 如果某些空间转录组数据集没有相应的同一批次的单细胞 RNA 测序(scRNA-seq)数据,我们将根据相应的物种、组织或癌症类型,在 GEO 和 TISCH 数据库中查找可用的 scRNA-seq 数据集以匹配空间转录组数据。
Collection of biological pathway data
Para_06
  1. 我们利用 R 包 graphite 获取了人类和小鼠的生物通路数据。
  2. 我们从七个通路数据库中获得了总计 100,364 条人类生物通路:KEGG、Panther、PathBank、PharmGKB、Reactome、SMPDB 和 WikiPathways。
  3. 此外,我们从四个通路数据库中获得了 14,634 条小鼠生物通路:KEGG、PathBank、Reactome 和 WikiPathways,并提取了每个通路中基因之间的相互作用网络。

Processing and clustering spatial transcriptome and scRNA-seq data

处理和聚类空间转录组及单细胞RNA测序数据

Para_07
  1. 对每个切片分别进行了空间点的降维和聚类。
  2. 对于每个空间切片的表达数据,我们使用 Seurat R 包中的‘NormalizeData’和‘ScaleData’函数来规范化空间转录组表达谱。
  3. 然后,我们进行了主成分分析(PCA)以进行降维。
  4. 在聚类过程中,选择不同的分辨率参数会导致聚类数量不同。
  5. 为了确定最佳聚类分辨率,我们在随机选择的切片中设置了不同的分辨率值进行聚类,并评估了不同分辨率下获得的聚类结果的一致性。
  6. 我们还探索了不同分辨率值下聚类数量的变化。
  7. 我们发现,当分辨率值设置为 1.1 时,聚类一致性较高且获得的聚类数量适中。
  8. 然后,我们使用‘FindNeighbors’(dims = 1:50)和‘FindClusters’(resolution = 1.1)函数对空间转录组数据进行聚类。
  9. 最后,我们使用‘FindAllMarkers’函数为每个聚类识别标记基因,选择平均 log2FC 最高的前 10 个基因作为每个聚类的特征基因。
Para_08
  1. 对于收集的单细胞 RNA 测序数据集,我们使用 Seurat R 包过滤掉在少于 3 个细胞中表达的基因,并排除表达基因少于 500 个的细胞。
  2. 然后,我们根据组织类型合并样本,并使用‘NormalizeData’函数标准化表达谱。
  3. 接下来,对单细胞 RNA 测序数据进行了降维和聚类分析。
  4. 使用‘FindAllMarkers’函数鉴定了每个聚类的标记基因。

Annotation of cell types in scRNA-seq data

单细胞 RNA 测序数据中的细胞类型注释

Para_09
  1. 我们结合了两种自动方法和手动标注策略来标注细胞类型。对于每个单细胞 RNA 测序数据集,具体步骤如下:
  2. (i)使用 scMayoMap 和 SingleR 方法进行自动标注。scMayoMap 能够准确识别并标注不同组织背景下的细胞类型。我们以上游分析的标准聚类结果作为输入,选择特定的组织类型,并根据 scMayoMap 中的细胞标记为每个聚类注释相应的细胞类型。对于 SingleR,我们使用 ‘GetAssayData’ 函数提取表达矩阵,选择合适的参考数据集,并基于参考数据集中已知的细胞类型标签使用 ‘SingleR’ 函数注释细胞类型。
  3. (ii)手动审查两种自动标注结果的一致性。如果两种方法的结果一致,则采用这些一致的注释结果。对于注释结果不同的聚类,我们从 CellMarker 2.0 数据库收集细胞类型标记基因,并将这些标记基因与上游分析中获得的特征基因结合,手动纠正自动注释结果。
  4. (iii)对于只能通过 SingleR 自动注释的数据集(一些数据集在 scMayoMap 中没有对应的组织类型),我们进一步基于手动注释审查和纠正结果。在上述步骤之后,使用 ‘infercnv’ R 包进一步区分恶性细胞。每个数据集中的所有免疫细胞被用作参考正常细胞。随后,我们计算了细胞的推断拷贝数变异(CNV)得分。然后,我们将每个聚类中的细胞推断 CNV 得分与参考细胞的得分进行比较。与参考细胞相比,显著较高的推断 CNV 得分的细胞聚类(Wilcoxon 秩和检验 P 值 <0.05)被定义为恶性细胞。

Spatial pathway activity

空间路径活动

Para_10
  1. 我们使用 R 包 Gene Set Variation Analysis (GSVA) 评估空间转录组数据中每个点的生物通路活性。
  2. 根据每个组织切片对应的空间基因表达谱,我们构建了空间通路活性谱型。
  3. 我们使用 ‘Poisson’ 分布参数对计数表达谱进行了归一化,并采用 ‘GSVA’ 方法评估各点的通路活性。

Clustering spatial spots based on pathway activity

基于通路活性的空間點聚類

Para_11
  1. 为了揭示通路活性的空间异质性,我们根据每个切片的通路活性谱型对空间转录组数据中的点进行了无监督聚类。
  2. 使用 PCA 进行了降维。
  3. 然后我们利用‘FindNeighbors’和‘FindClusters’来聚类通路活性谱型,并使用‘FindAllMarkers’来识别不同簇之间差异活跃的通路。
  4. 每个簇中排名前十的通路被选为特征活跃通路。

Spatial cell-type deconvolution

空间细胞类型解卷积

Para_12
  1. 我们使用相同组织类型或癌症类型的单细胞表达谱作为参考,移除了参考单细胞数据中细胞数量少于25个的细胞类型。
  2. 随后,我们使用 R 包 spacexr 和 STdeconvolve 中的 run.RCTD 函数对空间点进行解卷积分析,以获得每个点内不同细胞类型的比例分布。
Para_13
  1. 我们还参考了之前的方法,进一步基于空间点解卷积的结果,以识别富含特定细胞类型的点,并将相应的细胞类型标签分配给这些点,以便于分析空间组织切片上富含不同细胞类型的点的分子特征。
  2. 假设点 A 中细胞类型 C1 的比例最高,比率为 Rmax,第二高的比例为细胞类型 C2,比率为 R。如果 Rmax ≥ 0.5 且 Rmax/R ≥ 2,则定义点 A 为富含细胞类型 C1 的点,并将细胞类型标签 C1 分配给点 A;否则,点 A 被认为是混合细胞类型的点,并分配其细胞类型标签‘混合’。

Pseudo-time analysis

伪时间分析

Para_14
  1. 为了探索空间位点的功能活动和状态转换,我们利用 Monocle 2 R 包根据每个切片的空间转录组谱型构建了空间位点的伪时间轨迹。
  2. 此外,结合基于空间细胞类型解卷积结果获得的空间位点的细胞类型标签,我们分别构建了不同细胞类型对应的位点的伪时间轨迹。

Cell–cell communications

细胞间通讯

Para_15
  1. 为了探索空间细胞类型之间的通讯,我们利用了 iTALK R 包中的‘FindLR’功能(https://github.com/Coolgenome/iTALK)构建了每个空间区域中细胞类型之间的受体-配体介导的相互作用图。

Spatial variable pathway

空间变量路径

Para_16
  1. 识别在不同空间点上活性具有高变异性的通路,可以更好地揭示和表征空间区域内功能状态的异质性。
  2. 因此,我们基于空间点的通路活性谱型识别了空间可变通路。
  3. 首先,我们标准化了每个空间区域对应的通路活性谱型,具体如下:
Para_17
  1. 这里,actmax 和 actmin 分别表示通路活性谱的最大值和最小值;acti,j 表示通路 i 在点 j 处的活性值;而 acti,j′ 则表示通路 i 在点 j 处的标准化活性值。
Para_18
  1. 然后,我们使用 Seurat R 包中的‘FindSpatiallyVariableFeatures’函数来识别空间可变通路(selection.method=‘moransi’),并根据 moransi.spatially.variable.rank 按照活动的空间变异性程度对通路进行排名。
  2. 空间可变通路的识别基于以下阈值:MoransI_observed > 0.1 和 MoransI_p.value < 0.05。

Spatial variable gene

空间变量基因

Para_19
  1. 我们使用 Seurat R 包中的 ‘FindSpatiallyVariableFeatures’ 函数来识别具有空间表达变异性的基因(selection.method=‘moransi’),并根据 moransi.spatially.variable.rank 按照空间表达变异性的程度对基因进行排序。
  2. 基于阈值 MoransI_observed > 0.1 和 MoransI_p.value < 0.05,识别出具有空间变异性的基因。

Database construction

数据库建设

Para_20
  1. SPathDB 可在 http://bio-bigdata.hrbmu.edu.cn/SPathDB/ 免费获取。
  2. 该数据库是在 Linux 服务器上使用 Tomcat 软件 (v6) 的 Java Server Pages 开发的。
  3. MySQL (v5.6) 数据服务器用于管理数据集。
  4. 结果数据创建和可视化实现了包括 jQuery、Datatables 和 ECharts 在内的 JavaScript 包。
  5. 所有数据处理和统计分析均使用 R 软件 (v4.1.0) 进行。

Results

Database contents and usage

数据库内容和使用

Overview of SPathDB

SPathDB 概述

Para_21
  1. SPathDB的设计和构建如图1所示。
  2. 当前版本的SPathDB数据库包含来自84个人类和小鼠空间转录组数据集的695个切片(截面)中的1689868个空间点,涵盖36种组织。
  3. 此外,这些切片部分来源于30种不同类型的癌症。
  4. 经过质量控制后,每个空间切片的平均点数为2431个。
  5. SPathDB使用‘GSVA’方法评估这些切片中空间点的通路功能活性。
  6. SPathDB还存储了114998条通路的空间功能活性,其中包括100364条人类通路和14634条小鼠通路。
  7. 这些SPathDB的切片包括基因表达、通路活性和点的空间位置以及图像文件。
  8. 此外,作为数据库的重要补充,SPathDB还提供了几个灵活的接口以促进数据检索和分析(图1)。
  9. 工具SVP和空间变异基因(SVG)允许用户探索具有空间变异的通路功能活性分布,跨越空间点、簇和细胞类型。
  10. 空间伪时间提供沿伪时间轨迹的空间通路活性,细胞-细胞通信允许用户探索由空间活跃通路介导的细胞相互作用,空间解卷积提供跨空间点的细胞类型比例分布以及通路活性与细胞类型出现之间的空间相关性分析。
图片
图片

图片说明

◉ 图1. SPathDB 数据内容和功能概述。左侧面板包含数据库内容,其中包括空间转录组数据集和通路数据内容,以及空间通路活性谱的构建。右侧面板包含 SPathDB 的工具,用于检索、分析和可视化空间通路活性。

User interface

用户界面

Data search and browse

数据搜索和浏览

Para_22
  1. 在‘主页’上,SPathDB 为用户提供了一个‘搜索’界面,以探索通路的空间功能活动,用户需要输入他们希望探索的物种、组织、数据来源和数据集(图2A)。
  2. 用户还可以通过浏览页面灵活访问 SPathDB 数据库中存储的所有数据(图2B)。
  3. 他们可以通过点击浏览树不同级别的条目来筛选感兴趣的数据,包括特定的物种、组织、数据来源和数据集。
  4. 作为‘搜索’和‘浏览’页面的结果,SPathDB 返回一个数据表,其中每一行提供了相关空间切片的描述,描述内容包括物种、组织、数据来源、数据集和切片名称等(图2C)。
  5. 在结果页面上,用户可以通过进行关键词搜索进一步筛选结果条目。
  6. 对于每个空间切片,SPathDB 提供了多特征界面以进行进一步分析。
图片
图片

图片说明

◉ 图2. SPathDB的功能和用途。(A) SPathDB主页上的搜索界面。(B) SPathDB的浏览页面。(C) 搜索和浏览的结果数据表,以及链接分析工具的输入。(D–H) SPathDB中的五个用户友好的分析工具。

Exploration of SVP

SVP的探索

Para_23
  1. SVP 指的是在空间切片内不同空间位置上表现出显著功能活性变化的通路。
  2. 关注 SVP 有助于理解不同空间位点或组织邻域之间功能状态的差异和异质性。
  3. SVP 工具提供了两个子功能页面,包括 SVP-Cluster 和 SVP-Cell Type。
  4. 在这两个子功能页面中,通过选择感兴趣的空间切片和通路,用户可以分别探索 SVP 活动在空间点(富集特定细胞类型的点)的聚类和细胞类型中的分布(图 2D)。
  5. SVP-Cluster 还提供了基于基因和基于通路的聚类选择。
  6. 此外,在 SVP-Cluster 和 SVP-Cell Type 结果页面的通路活动分布图中,单击单个点可以可视化通路内基因之间的相互作用网络。
  7. 相互作用网络中基因节点的颜色反映了基因在空间点中的表达水平。
  8. 在结果页面底部,SPathDB 提供了一个可视化的热图,显示与感兴趣通路的空间活动正相关和负相关的前 30 条通路(图 2D),这有助于进一步探索空间区域中的功能串扰和协同作用。
  9. 此外,点击热图可以查看这些相应通路之间空间活动相关性的散点图。
Exploration of SVG

SVG 的探索

Para_24
  1. SPathDB 还提供了 SVG 工具,该工具包含 SVG-Cluster 和 SVG-Cell Type 子功能页面,使用户能够探索空间基因表达的空间分布,以及基因表达在空间点的聚类和细胞类型中的分布(图 2E)。
  2. 此外,SPathDB 数据库还为输入基因提供通路注释信息。
Spatial pathway activity along the pseudo-time trajectory

沿着伪时间轨迹的空间路径活动

Para_25
  1. 轨迹分析有助于解释空间细胞的分化相关性,识别推动疾病进展的细胞亚群及其相关的活跃通路。
  2. 何等人基于空间转录组数据推断出轨迹(伪空间轴),揭示了该轨迹与通路基因表达相关。
  3. SPathDB 提供了空间伪时间工具,用户可以利用该工具探索沿伪时间轨迹的空间通路活动。
  4. 在输入感兴趣的空间切片和通路后,空间伪时间构建空间点的发展轨迹,并展示了空间位置的伪时间以及沿轨迹的通路活动分布。
Pathway-mediated spatial cell–cell communication

通路介导的空间细胞-细胞通信

Para_26
  1. 细胞间的通讯常常驱动细胞状态的异质性和转变。
  2. SPathDB 提供了细胞间通讯工具,允许用户在空间切片上探索不同细胞类型之间的通讯,并识别介导细胞通讯的关键活跃通路(图 2G)。
  3. 用户输入空间组织切片和细胞通讯类型后,细胞间通讯工具会可视化不同细胞类型之间详细的受体-配体介导的通讯。
  4. 通过点击可视化地图上的特定受体-配体连接曲线,用户可以获得相应受体/配体表达的空间分布、不同细胞类型的空间分布以及相应受体/配体的通路注释信息。
Correlation between spatial pathway activity and the occurrence of cell types

空间路径活动与细胞类型发生之间的相关性

Para_27
  1. 组织细胞中调控网络的功能活动可以驱动细胞的身份和状态。
  2. 为了更好地表征空间区域的功能和异质性,SPathDB 中的 Spatial Deconvolution 工具允许对空间点进行解卷积。
  3. 用户可以可视化更高分辨率的细胞类型和通路活性的空间分布,并分析通路活性与空间背景下细胞类型出现之间的相关性。
  4. 这使得进一步结合在空间区域内比例较高的细胞类型及其正相关的高活性通路来探索空间异质性和空间区域的功能成为可能,有助于识别驱动空间异质性的活跃通路特征。
PAI module

PAI模块

Para_28
  1. 个性化分析接口(PAI)模块使用户能够在无需编程技能的情况下,基于 SPathDB 分析他们的空间转录组数据,从而实现空间转录组数据的个性化分析。
  2. 在使用在线分析工具时,用户应遵循三个步骤:
  3. ‘上传文件’:用户需要在输入框中点击‘选择文件’按钮,以上传符合指定格式的数据文件。"}json{"Sentence": "‘电子邮件上传’:在输入框中输入用户的电子邮件地址。数据上传后,点击‘上传’按钮,以便 SPathDB 可以通过电子邮件及时通知用户任务 ID。"}json{"Sentence": "‘任务 ID’:处理完成后,用户可以在此输入框中输入电子邮件通知中的任务 ID,并点击‘搜索’按钮查看上传数据的分析结果。
Para_29
  1. 通过遵循这三个简单步骤,用户可以方便地进行空间转录组学分析并获得所需的结果。
Para_30
  1. 空间去卷积 PAI 在输入数据后,利用空间转录组学数据提供对斑点内细胞类型组成及其与通路活性关系的深入理解。
  2. 通过去卷积分析,结果提供了每个斑点内不同细胞类型的分布、通路活性的空间表示以及通路活性与细胞类型出现之间的相关性分析。
  3. 这有助于用户进一步探索潜在的调控机制。
  4. 文件准备如下:
Para_01
  • 空间转录组原始文件(.h5);空间位置信息文件(.zip);单细胞表达谱文件(.txt);单细胞注释文件(.txt);以及生物通路基因集文件(.gmt)。
Para_31
  1. 空间伪时间PAI可视化了点位的伪时间轨迹,揭示了发育过程中点位内细胞的动态活动及其与通路活性的关系。
  2. 用户可以直观地观察细胞类型的时空分布以及沿伪时间轨迹的通路活性动态变化。
  3. 这有助于理解组织切片中细胞类型与通路活性之间的时空关系。
  4. 文件准备如下:
Para_02
  • 空间转录组原始文件(.h5);空间位置信息文件(.zip);空间转录组表达谱注释文件(.csv);以及生物通路基因集文件(.gmt)。
Para_32
  1. 细胞-细胞通信平台PAI提供了一个直观且交互式的平台。
  2. 它通过桑基图使用配体-受体对来直观显示细胞类型之间的通信关系,帮助用户更好地理解组织内的细胞相互作用。
  3. 文件准备如下:
Para_03
  • 空间转录组学原始文件 (.h5);空间位置信息文件 (.zip);以及空间转录组学表达谱注释文件 (.csv)

Case study

案例研究

Para_33
  1. 为了展示 SPathDB 的潜在应用,我们分析了乳腺癌组织切片的空间通路功能异质性。
  2. 我们在 Browse 页面的 Homo sapiens - 乳腺癌 - 10X Genomics 目录下浏览了名为 ‘Parent_Visium_Human_BreastCancer’ 的乳腺癌切片进行分析。
  3. 首先,我们关注具有空间活性变异的通路。
  4. 我们利用 ‘Spatial Variable Pathway’ 工具下的 SVP-Cell Type 子功能分析组织切片,输入该切片(样本)的相应参数信息,包括:物种、组织/癌症、数据来源和样本。
  5. 在 ‘Pathwaytype’ 选项中选择了 ‘KEGG’。
  6. 在 Pathway 选项下的 SVP 下拉列表中,识别出多个在切片上具有高度可变空间活性的信号通路,包括 ‘MAPK 信号通路’、‘PI3K-Akt 信号通路’、‘mTOR 信号通路’、‘VEGF 信号通路’等。
  7. 这些信号通路已被证实为致癌通路,并与乳腺癌密切相关。
  8. 其中,VEGF 信号通路与肿瘤血管生成有关。
  9. 我们进一步探索了该通路在不同细胞类型中的活性分布,发现 VEGF 信号通路在‘混合’斑点区域表现出更高的活性,而在树突状细胞富集区域则表现出较低的活性。
  10. 此外,使用 Spatial Deconvolution 工具,在更高分辨率下分析了不同细胞类型在斑点中的比例与组织切片上 VEGF 信号通路活性之间的相关性。
  11. 发现在许多混合细胞类型的斑点中存在恶性细胞。
  12. 还发现组织切片上的斑点中树突状细胞(恶性细胞)的比例与 VEGF 信号通路的活性呈负(正)相关趋势。
  13. 这些发现与恶性细胞具有高功能状态的血管生成的事实一致。
图片
图片

图片说明

◉ 图3. SPathDB的应用示例。(A) 细胞类型在各个点的空间分布。◉ (B) VEGF信号通路活性的空间分布。◉ (C) 基于去卷积的不同细胞类型在空间点上的分布。◉ (D–E) 散点图分别显示了VEGF信号通路活性与树突状细胞和恶性细胞之间的相关性。◉ (F–G) VEGF信号通路与细胞因子-细胞因子受体相互作用通路之间活性的空间相关热图和散点图。◉ (H) 细胞因子-细胞因子受体相互作用通路活性的空间分布。◉ (I) ‘Parent_Visium_Human_BreastCancer’切片的细胞-细胞通讯图。◉ (J–L) 配体/受体对CCL5-SDC1的空间表达可视化。◉ (M) VEGF信号通路活性的空间分布(隐藏了富含树突状细胞的点)。

Para_34
  1. 接下来,通过通路活性的空间相关性热图(使用‘Spatial Variable Pathway’工具下的 SVP-Cell Type 子功能得出的上述结果),我们发现 SVP 细胞因子-细胞因子受体相互作用通路的活性与 VEGF 信号通路的活性强烈负相关(相关系数:-0.68)(图 3F 和 G)。
  2. 我们进一步探索了细胞因子-细胞因子受体相互作用通路在空间点上的活性分布,发现其活性与 VEGF 信号通路的活性呈现互斥分布。
  3. 具体来说,细胞因子-细胞因子受体相互作用通路在树突状细胞富集区表现出更高的活性,而在‘混合’区域(恶性细胞分布区)表现出较低的活性(图 3H)。
  4. 以上结果表明,在乳腺癌肿瘤组织中,肿瘤来源的细胞因子可能激活树突状细胞的抗肿瘤免疫反应。
  5. 此外,我们使用 Cell–Cell Communication 工具分析了‘Parent_Visium_Human_BreastCancer’切片上树突状细胞和‘混合’细胞类型之间的空间点上的细胞间通讯,发现 CCL5-SDC1 配体/受体对介导了这两种细胞类型之间的通讯(图 3I)。
  6. 点击交互图上的 CCL5-SDC1 连接曲线以可视化配体/受体的空间表达(图 3J–L),发现细胞因子-细胞因子受体相互作用通路中的 CCL5 倾向于在树突状细胞空间区域表达。
  7. 此外,我们观察到位于树突状细胞富集核心区域附近的 VEGF 信号通路的活性相对较低(图 3M)。
  8. 以上分析结果揭示了乳腺癌细胞和树突状细胞之间潜在的空间相互作用模式,以及功能活性的空间异质性。

Discussion

Para_35
  1. 在这里,我们描述了一个数据库 SPathDB(http://bio-bigdata.hrbmu.edu.cn/SPathDB/),该数据库包含来自84个空间转录组数据集、36种组织和疾病(包括癌症)的695个切片的1689868个空间点。
  2. SPathDB 提供用户友好的界面,用于浏览114998条通路在各个空间点的功能活动,并提供灵活的工具来检索、分析和可视化数据。
  3. 用户可以根据 SPathDB 中现有的数据,分析感兴趣的组织或疾病的切片,发现有意义的特征,如高活性通路的空间区域,这可以进一步指导他们对自身组织样本的分析。
  4. 此外,SPathDB 还提供了 PAI,允许用户上传自己的组织样本进行相应的分析。
  5. 用户还可以将自己的组织样本分析结果与存储在 SPathDB 中的组织切片分析结果进行比较,发现共同和独特的特征。
Para_36
  1. 细胞的身份、行为和状态由信号通路调控网络的功能活动微调决定。
  2. SPathDB 计算了细胞类型比例与空间位点上通路活性之间的相关性(即评估了空间通路活性与细胞类型出现的相关性)。
  3. 事实上,通路活性评分代表了斑点内所有不同细胞类型的细胞的平均信号。
  4. 这种相关性分析不能准确揭示空间组织中特定细胞类型的通路活性。
  5. 评估特定细胞类型的通路评分并识别高度活跃的特定细胞类型通路将更具生物学意义。
  6. 因此,在未来的 SPathDB 更新中,我们将考虑整合具有单细胞分辨率的空间转录组数据以改善这一问题。
Para_37
  1. 我们将 SPathDB 与包括 SpatialDB、STOmicsDB、SPASCER、SORC、SCAR、CROST 和 Aquila 在内的公共数据库和基于网络的平台进行了比较,这些平台用于可视化和存储空间转录组数据。
  2. 在数据集数量、空间点、切片和组织类型方面,SPathDB 提供的数据量比大多数这些数据库更多,除了 CROST 和 STOmicsDB。
  3. 在生物通路数量方面,SPathDB 显著优于所有七个数据库。
  4. 与这七个公共数据库相比,SPathDB 提供了更丰富且独特的下游分析工具和功能。
Para_38
  1. 对于一些与其他数据库共享的功能,SPathDB也展示了独特的特性。例如,SVP检测功能也可以在SpatialDB和CROST数据库中实现。
  2. 这种既定的方法,首先识别SVGs,然后进行富集分析以获得空间可变通路,有助于解释空间特征基因。
  3. SPathDB在以下方面有所不同并可能改进这一既定方法:(i)在既定方法中,需要设定一个阈值来确定SVG,而这个阈值的选择通常是任意的。
  4. (ii)如果同一通路k内的两个SVG基因在空间点上的活性呈负相关,则这些基因的平均信号可能会导致空间点上的通路活性不变。
  5. SPathDB直接基于点级别的通路活性识别SVPs,可以减少上述通路被误识别的可能性。
  6. (iii)统计P值容易受到背景基因集大小选择的影响。SPathDB检测SVPs的方法可以避免计算富集显著性P值。
  7. (iv)SPathDB在点级别评估通路活性并检测SVPs,可以直接获取最相关的通路及其高活性点,用于下游分析。
  8. 空间点聚类是当前空间转录组数据库中的常见功能。除了基于基因表达的聚类外,SPathDB还提供了基于通路活性的聚类功能(位于"空间可变通路"目录下的SVP聚类工具选项),这是SPathDB的一个独特特点。
  9. 细胞的身份和状态通常由基因调控网络的功能活动决定。通路活性可以直接反映细胞在功能水平上的状态,并可以用作稳定的标志。
  10. 组织中含有处于活跃状态转换中的细胞,在肿瘤或发育数据集中这是一种常见情况。在这种情况下,基于通路功能活性的空间点分辨率的降维和聚类可能更可靠。
Para_39
  1. 总之,SPathDB 展现出相当大的潜力,可以补充现有的公共数据库和平台,用于存储、分析和可视化空间转录组数据。
  2. 我们相信,SPathDB 将成为研究空间转录组的功能资源,并能够发现空间区域和空间异质性的通路激活特征。
  3. 数据库的扩展将继续进行,包括添加新的通路和空间组学数据集,以及在更新版本中添加新的分析工具。

Data availability

Para_40
  1. SPathDB 可在 http://bio-bigdata.hrbmu.edu.cn/SPathDB/ 免费在线获取。

Supplementary data

Para_41
  1. 补充数据可在 NAR 在线获取。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Basic Information
  • Abstract
  • Introduction
  • Materials and methods
    • Data collection and processing
      • Data collection
    • Processing and clustering spatial transcriptome and scRNA-seq data
    • Annotation of cell types in scRNA-seq data
    • Spatial pathway activity
    • Clustering spatial spots based on pathway activity
    • Spatial cell-type deconvolution
    • Pseudo-time analysis
    • Cell–cell communications
    • Spatial variable pathway
    • Spatial variable gene
    • Database construction
  • Results
    • Database contents and usage
      • Overview of SPathDB
    • User interface
      • Data search and browse
      • Exploration of SVP
      • Exploration of SVG
      • Spatial pathway activity along the pseudo-time trajectory
      • Pathway-mediated spatial cell–cell communication
      • Correlation between spatial pathway activity and the occurrence of cell types
      • PAI module
    • Case study
  • Discussion
  • Data availability
  • Supplementary data
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档