第一时间掌握
新鲜的 AI for Science 资讯
编辑 | 萝卜皮
让 AI 来「控制」细胞的分化路径,长成红细胞还是血小板全看 AI 的「旨意」?虽然听起来像是科幻小说里的场景,但是「低配版」的调控已经实现了。
西班牙巴塞罗那基因组调控中心 (CRG) 的研究人员开发了一种人工智能工具,可以构想自然界中从未见过的 DNA 调控序列。该模型可以根据自定义标准创建合成 DNA 片段,例如「在干细胞中开启该基因,使其发育成红细胞而非血小板」。
此外,模型能够预测特定细胞类型所需的基因表达模式所需的 DNA 碱基组合(核苷酸碱基:A、T、C、G)。
为了验证,研究人员化学合成了一系列模型设计的含大约 250 个碱基的 DNA 片段,并将其通过病毒转染到小鼠血细胞中。这些片段能够激活某些细胞中编码荧光蛋白的基因,同时保持基因表达模式不变。转染之后这些序列在随机位置与基因组融合,实验结果与预期完全一致。
「其潜在的应用非常广泛。这就像编写生物学软件,为我们发现了一种新方法,可以向细胞发出指令精确地指导它的发育和行为。」论文的第一作者、CRG 的 Robert Frömel 博士说道。
这可以为基因治疗开发人员提供新途径,为开发微调患者基因、提高治疗效果并减少副作用的新治疗策略铺平了道路。
该研究以「Design principles of cell-state-specific enhancers in hematopoiesis」为题,于 2025 年 5 月 8 日发布在《Cell》。
精准控制细胞分化很难吗?
在细胞分化过程中,转录因子 (TF) 的活性需要转化为谱系特异性基因的高度特异性表达模式。
在血液干细胞分化的背景下,单细胞转录组学和基于成像的研究表明,关键 TF 在整个干细胞和祖细胞群体中以平滑、重叠的梯度表达;相比之下,受这些因子调控的靶基因则表现出细胞状态特异性的表达模式。
类似的重叠转录因子梯度伴随细胞分化,涵盖从多能性退出到器官形成,再到由其他成体干细胞进行的组织再生等各种系统。事实上,转录因子之间的比例改变足以建立特定的基因表达程序。
但是,增强子如何将同一组转录因子中的数量失衡转化为高度特异性的活性模式呢?尽管干细胞中谱系转录因子表达丰富,但谱系和细胞周期基因是如何被沉默的?此外,癌细胞如何在主要依赖相同的核心转录调控因子的情况下实现干细胞和祖细胞程序的共表达?
这个过程中还有诸多问题与需要解决,人工智能的发展带来了解决途径。但是,人工智能模型的开发需要大量高质量的数据,然而 TF 中的增强子数据一直都很稀缺。
「要创建生物学的语言模型,你必须理解细胞的语言。我们着手破译增强子的这些语法规则,以便我们能够创造出全新的单词和句子。」该研究的通讯作者、CRG 研究员 Lars Velten 博士解释说。
借助 AI 的力量调控造血干细胞
基因表达受增强子等调控元件控制,增强子是 DNA 中的微小片段,可以控制基因的开启或关闭。为了修复错误的基因表达,研究人员可以梳理基因组,寻找恰好满足其需求的自然存在的增强子,并将研究范围限制在进化产生的序列上。
在此,CRG 的研究人员研究了 38 个关键 TFBS 在最小合成增强子中造血分化过程中的功能和相互作用。
图示:流程概述。(来源:论文)
具体来说,他们将单个 TF 或 TF 对的结合位点以不同的排列方式、不同的基序亲和力和不同的重复次数放置在随机 DNA 上。利用慢病毒大规模并行报告基因检测(lentiMPRA),在小鼠造血干细胞(HSC)分化的 7 个细胞状态下,测定了 64,400 个此类构建体驱动转录的能力。
获得的数据使他们能够全面表征结合位点的功能及其在分化过程中的成对相互作用。
研究人员发现,含有单个「谱系因子」(例如 Spi1、Cebpa、Gata1 和 Fli1)结合位点的增强子可以激活转录,但这些位点的特定组合处于非活性状态,甚至充当阻遏物,从而产生了对转录因子表达比例敏感且特定于任一因子占主导地位的细胞状态的增强子。
相反,一些「干细胞因子」(例如 Runx1 和 Meis1)的结合位点起着抑制因子的作用,但在特定组合下允许或支持活性。这些相互作用共同作用,将重叠的 TF 梯度转化为高度细胞状态特异性的二元活性模式。
相比之下,在常用于 MPRA 研究的人类白血病细胞系(K562)中,激活因子通常占主导地位,而抑制性相互作用很少。
说明这些规则与天然基因组中增强子的功能相关,并利用它们自动设计出在用户自定义的造血祖细胞状态组合中具有活性的新型增强子。总而言之,这些数据强调了 TFBS 之间的负协同作用是造血过程中细胞状态特异性增强子的设计原则。
论文链接:https://www.cell.com/cell/fulltext/S0092-8674(25)00449-0
相关内容:https://phys.org/news/2025-05-ai-dna-genes-healthy-mammalian.html
人工智能×[ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。