


方面 | 直接注释 | Banksy增强后注释 |
|---|---|---|
信息基础 | 仅限细胞自身转录组 | 自身 + 局部微环境的转录组信息 |
聚类依据 | 细胞类型(内在身份) | 细胞生态型(内在身份 + 空间上下文) |
能识别什么 | 主要的细胞类型(如T细胞、B细胞、癌细胞、成纤维细胞) | 1. 相同的细胞类型,不同的空间状态(如:边界 vs 核心的癌细胞;生发中心内 vs 滤泡外的B细胞)。2. 由多种细胞有序组合形成的空间域(如:三级淋巴结构、血管周围生态位、组织分层结构)。 |
结果可视化 | 细胞按类型着色,在空间上可能分散分布。 | 空间上出现连续的、具有明确边界的“区域”,这些区域在生物学上更有意义。 |
生物学洞见 | “有什么细胞?” | “细胞在如何组织?它们如何相互作用?功能单元是什么?” |
对技术噪声的稳健性 | 较低,受单个细胞检测效率影响大。 | 较高,因为空间滞后项起到了局部平滑和去噪的作用,利用了邻居信息来稳定信号。 |
维度 | 依据邻域基因表达差异再分群 | 依据邻域细胞类型差异再分群 |
|---|---|---|
分析对象 | 一个空间单元(细胞/点位)及其周边区域的所有基因表达信号的聚合特征。 | 一个空间单元(细胞/点位)周围邻居的细胞类型标签的组成与结构。 |
核心输入 | 1. 空间坐标2. 所有基因的表达矩阵(或降维后的特征) | 1. 空间坐标2. 预先定义好的细胞类型标签 |
计算方法 | 计算空间滞后项或局部微环境表达谱。如Banksy的 L_i(r)。本质是基因表达的局部平滑与特征提取。 | 计算细胞类型共定位或邻域组成向量。如:构建“在细胞i的50μm半径内,有3个T细胞,5个癌细胞,1个巨噬细胞...”这样的组成向量。 |
回答的问题 | “这个局部区域在转录组功能上处于什么状态?” (例如:免疫激活态、代谢旺盛态、缺氧应激态) | “这个细胞被什么类型的邻居所包围?” 或 “这个局部区域由哪些细胞类型以何种比例组成?”(例如:T细胞-癌细胞混合区、纯上皮区、基质富集区) |
发现的模式 | 功能/状态域:基于转录活性的空间连续区域。能发现相同细胞类型在不同微环境下的状态亚群(如同为癌细胞,处于侵袭前沿和核心的基因表达谱不同)。 | 细胞生态位/邻域类型:基于细胞社会结构的离散单元。能发现反复出现的、稳定的多细胞组合。 |
优点 | 1. 更敏感,揭示潜在状态:能捕捉细胞对环境响应的细微变化,即使细胞类型未变。2. 无监督,无需预先定义:直接从数据中发现模式,可能找到全新的、未预期的功能区域。3. 包含更丰富信息:基因表达信息量远大于类别标签。 | 1. 解释直观,易于沟通:结果直接与已知的细胞类型挂钩,生物学家易于理解。2. 稳健:对批次效应和技术噪声相对不敏感,因为细胞类型标签是相对稳定的高阶特征。3. 可直接联系已知生物学:容易与已知的组织结构(如滤泡、生发中心)对应。 |
缺点 | 1. 解释可能复杂:发现的“状态域”需要后续分析才能理解其生物学意义。2. 对技术噪声敏感:基因表达数据本身存在波动。 | 1. 依赖注释质量:结果完全取决于第一步细胞类型注释的准确性。错误的注释会级联放大。2. 信息损失:丢失了细胞状态异质性的信息。两个组成相同的邻域,其内部细胞状态可能截然不同。3. 类别可能僵化:无法识别“新”的邻域类型,除非它由独特的细胞类型组合构成。 |
典型方法 | - Banksy (构建空间滞后特征)- SpatialPCA, MERINGUE (空间平滑与特征提取)- 采用空间约束的聚类 (如BayesSpace) | - Neighborhood analysis (Giotto, Squidpy)- Cell neighborhood composition (CNC) 聚类- Interactions/niche identification (如STELLAR) |
生物学意义 | 空间功能单位:反映组织局部区域的生理、病理或代谢活动的整体状态。 | 空间结构单位:反映组织基本的建筑模块和多细胞互作的基本单元。 |
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。