
DRUGONE
在发育等动态生物过程中,空间转录组技术正在革新对组织空间组织机制的研究。如何从多个时间点的空间转录组数据中推断细胞命运轨迹已成为关键问题,需要新的计算方法。研究人员提出 STORIES,一种基于最优传输(Optimal Transport, OT)的新方法,用以学习具有空间信息的分化势能。STORIES 扩展了 OT 框架,使用 Fused Gromov–Wasserstein(FGW) 距离作为损失函数,从时间序列空间转录组数据中学习细胞分化的因果模型。研究人员在三套大规模 Stereo-seq 空间时间图谱(小鼠发育、斑马鱼发育、墨西哥钝口螈再生)中验证了该方法,显示 STORIES 在空间一致性与生物解释性上均优于现有方法,并能恢复神经再生与胶质生成中的已知基因标志物与潜在驱动因子。

空间转录组技术能够揭示组织内细胞的空间分布及基因表达模式。随着 Stereo-seq 等高分辨技术的出现,研究人员可以在单细胞水平追踪发育或疾病进程中细胞的时空动态。
传统轨迹推断方法(如 Monocle、RNA velocity)主要依赖时间或剪接速率,难以捕捉空间信息。基于最优传输的模型能够刻画细胞间的转变概率或势能变化,为描述分化过程提供了数学基础,但这些方法通常无法有效整合空间坐标,因为组织切片在不同时间点会发生旋转、平移甚至形态变化。
研究人员因此发展出 STORIES,使其能在 FGW 框架下利用空间距离矩阵,而无需对齐切片,从而学习空间一致的分化势能。这一方法自然继承了 Waddington 表观遗传景观的理念,将细胞分化视为势能最小化的动态过程。
方法概述
STORIES 接收多个时间点的空间转录组切片数据输入。神经网络 学习将每个细胞的基因表达映射到一个势能值,用以描述分化潜能。势能的梯度提供细胞状态演化方向,势能本身则可替代伪时间,用于基因趋势与调控因子的研究。
不同于线性 OT,STORIES 使用 FGW 距离来比较时间点间的细胞分布,使模型对旋转、平移等形变保持不变。
此外,该框架通过时间序列数据学习连续的细胞动力学模型,并能预测未来时间点的细胞表达状态。模型在 GPU 上的训练可在20分钟内完成数十万细胞的训练任务。STORIES 提供开源 Python 实现,兼容 Scverse、Scanpy、CellRank 等工具,便于数据预处理与可视化分析。

结果
STORIES 方法性能验证
研究人员在三组大规模 Stereo-seq 数据集上对 STORIES 进行了基准测试:
结果显示:
这些结果表明,引入空间信息能有效提高轨迹推断的生物学一致性。

STORIES 揭示钝口螈神经再生的驱动因子
研究人员在钝口螈脑再生的空间转录组数据中训练 STORIES,聚焦于神经再生相关的细胞类型,包括 EGC、rIPC、IMN 及不同类型的兴奋性神经元。
STORIES 学得的势能景观显示,EGCs 与 rIPCs 处于高势能(前体状态),而 NptxEX、dpEX、mpEX 等成熟神经元处于低势能状态。
通过 CellRank 对势能梯度计算细胞转移,发现 STORIES 自动恢复出三个主要的分化通路:
这一结果无需手动设定起始点或空间区域。
进一步分析发现,空间位置对命运决策存在影响:损伤右侧的 reaEGCs 更倾向分化为 mpEX,而左侧的 reaEGCs 更倾向生成 nptxEX(图3c–d)。
基因趋势分析揭示:
转录因子富集分析表明,CTNNB1、SP1、MYC、SOX6、REST 等在神经再生中具有潜在调控作用。
综上,STORIES 不仅重建了空间-分化景观,还揭示了关键调控网络。

STORIES 识别小鼠中脑胶质生成的调控机制
研究人员进一步在小鼠中脑发育数据中测试 STORIES。
结果显示:

讨论
空间转录组技术的迅猛发展为动态生物过程(如发育与疾病进展)的系统解析提供了新的契机。STORIES 的提出为分析时间序列空间单细胞数据提供了统一、可解释的数学模型。
通过在多个数据集的基准评估与案例分析,研究人员证明:
STORIES 的创新之处在于其能学习空间敏感的势能函数,使得在形态变化显著的发育过程也能保持空间一致性。未来方向包括:
整理 | DrugOne团队
参考资料
Huizing, GJ., Samaran, J., Capocefalo, D. et al. STORIES: learning cell fate landscapes from spatial transcriptomics using optimal transport. Nat Methods (2025).
https://doi.org/10.1038/s41592-025-02855-4
内容为【DrugOne】公众号原创|转载请注明来源