与匹兹堡大学医学院合作,麻省理工学院的研究人员开发了一种机器学习框架来定义描述细胞从一种状态到另一种状态的路径的数学方程。
该框架被命名为“Dynamo”,还可以确定驱动细胞变化的潜在机制。研究集中在细胞如何随时间变化,而不是它们如何在空间中迁移。
生物系统通常难以预测。研究人员表示,希望跟踪细胞如何响应调节基因相互作用而发生变化,就像天文学家可以绘制行星对重力反应的运动图一样精确,然后理解和调节这些变化。希望通过研究将单细胞生物学提升到更定量的水平。
Dynamo 通过组合来自许多不同单元格的数据来创建方程。实现这一点需要细胞中几个基因的表达如何随时间变化。由于 RNA 是基因表达的可测量结果,研究人员使用 RNA 量随时间的变化来计算它。研究了 RNA 的初始数量以及这些 RNA 水平如何变化以预测细胞的运动,类似于记录球的初始位置和速度以观察其轨迹。
然而由于测序只测量一次 RNA,因此从单细胞测序数据中估计 RNA 量的变化是一项艰巨的任务。因此团队必须使用测序时生成的 RNA 和 RNA 周转方程等线索来估计 RNA 水平的变化。
该团队基于以前的方法生成足够干净的数据以供 Dynamo 运行。使用了一种最近开发的实验方法,通过复杂的数学模型标记新 RNA 以将其与旧 RNA 区分开来。
接下来,尝试在离散的时刻观察细胞,以连续了解细胞如何变化。用单细胞分辨率全面分析转录组和其他“组学”信息的方法取得了巨大进步。然而探索这些数据的分析方法是描述性的,而不是预测性的。因此使用机器学习来发现描述这些空间的连续函数。通过将这些函数转换为基于数学的地图,Dynamo 可以将它们可视化。目前的基因表达动态决定了细胞在地图上的起始位置。稍后可以跟踪从单元开始的路径以知道它将在哪里结束。
研究人员测试了 Dynamo 对克隆细胞的细胞命运预测。研究结果表明,两个几乎相同的克隆之一的序列将在另一个克隆分化时进行。Dynamo 预测每个测序的细胞都会碰巧与它的克隆发生的事情相匹配。
该团队使用血细胞来评估方法。发现 Dynamo 正确记录了血细胞的发育,并验证了最近的观察结果,即巨核细胞比其他类型的血细胞形成得更早。此外Dynamo 还能够揭示支撑这种早期分化的机制。
研究人员表示,提出的框架不仅有助于理解细胞如何从一种状态迁移到另一种状态,而且还有助于管理这种转变。为此Dynamo 提供了用于模拟细胞如何响应各种扰动而变化的工具。此外它提供了一种机制来确定从一个细胞状态到下一个细胞状态的最有效路径。这些技术为预测如何最好地将任何细胞类型重新编程为另一种细胞类型提供了坚实的基础,这是干细胞生物学和再生医学的一项重大挑战,以及产生有关其他基因修饰如何影响细胞命运的想法。
论文:
https://www.cell.com/cell/pdf/S0092-8674(21)01577-4.pdf
Github:
https://github.com/aristoteleo/dynamo-release
参考:
https://news.mit.edu/2022/new-computational-tool-predicts-cell-fates-genetic-perturbations-0203