
DRUGONE
胚胎发育等过程中,细胞群体如何自组织形成稳定而复杂的结构,是发育生物学中的核心问题。研究人员提出 MultiCell,一种面向多细胞系统的几何深度学习方法,能够在单细胞分辨率下刻画细胞之间高度复杂的相互作用。该方法将多细胞数据统一表示为一种“双图结构”,同时描述细胞本身及其连接网络,实现了可解释的四维形态序列对齐,并在果蝇胚胎发育过程中,提前预测单细胞层面的行为变化。研究进一步表明,细胞几何形态及细胞连接网络是预测形态发生过程中细胞行为的关键特征,为构建数据驱动的多细胞发育动态图谱奠定了基础。

多细胞生命体的形态来源于大量细胞在时空上的协同行为。尽管近年来自动分割、细胞追踪和组织形态分析取得了显著进展,但在单细胞尺度上预测多细胞结构的演化仍然极具挑战。与蛋白结构预测中深度学习取得的突破相比,多细胞发育涉及更高维度、更强非平衡特性与更复杂的相互作用。
在物理建模层面,多细胞系统通常从两种互补视角理解:
然而,如何在一个统一框架中融合这两种描述,并用于预测未来的细胞行为,一直缺乏通用方法。
方法
MultiCell 采用一种双图(dual-graph)表示来建模多细胞系统:一张图以细胞为节点,描述细胞—细胞邻接关系;另一张图以细胞顶点和边为核心,刻画细胞连接与几何结构。研究人员在此基础上构建几何深度学习模型,通过图编码器整合历史时序信息,并根据任务需求输出细胞级、连接级或组织级预测结果。该框架既能进行整体形态序列对齐,也能在局部尺度上预测未来的细胞行为。
结果
可解释的四维形态序列对齐
MultiCell 可在无需人工标注关键时间点的情况下,对不同胚胎的四维发育序列进行自动对齐。模型学会识别分布式的形态学特征,而非依赖单一结构标志,从而实现稳健、可解释的发育时间对齐。

图 1|MultiCell 方法整体框架。

图 2|基于几何特征的胚胎发育序列自动对齐结果。
单细胞尺度预测未来的细胞连接重塑
在果蝇胚胎原肠胚形成过程中,细胞连接会发生大规模重排。MultiCell 能够在事件发生前,准确预测哪些细胞连接即将消失,预测精度在不同数据集上保持稳定。
模型消融分析显示,仅使用局部连接长度或变化速率不足以达到最佳效果,细胞几何与连接网络的整体结构信息是关键。

图 3|单细胞分辨率下的细胞连接丢失预测结果。
同时预测多种细胞行为的发生时间
研究人员进一步将模型扩展为多任务框架,同时预测细胞内陷、细胞分裂和细胞重排距离当前时刻的剩余时间。结果表明,模型不仅能够准确预测不同类型事件,还在潜在表示空间中自发区分不同组织区域,即使未显式提供区域标签。

图 4|多任务预测:细胞内陷、分裂与重排的时间预测。
讨论
MultiCell 提供了一种将多细胞几何结构与深度学习相结合的通用建模思路,使研究人员能够在单细胞精度下量化和预测形态发生过程。该方法的核心优势在于:
当前的主要限制仍然来自高质量四维多细胞数据的稀缺。未来,随着标准化成像与分析流程的普及,以及多模态数据(如力学、转录组信息)的引入,MultiCell 有望发展为理解发育、疾病及组织工程中多细胞动力学的一类基础模型。
整理 | DrugOne团队
参考资料
Yang, H., Roy, G., Nguyen, A.Q. et al. MultiCell: geometric learning in multicellular development. Nat Methods (2025).
https://doi.org/10.1038/s41592-025-02983-x
内容为【DrugOne】公众号原创|转载请注明来源