首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Drug Discov. Today|AI赋能的可编程虚拟人:迈向以人体生理为基础的药物发现

Drug Discov. Today|AI赋能的可编程虚拟人:迈向以人体生理为基础的药物发现

作者头像
DrugOne
发布2025-11-17 20:56:46
发布2025-11-17 20:56:46
920
举报
文章被收录于专栏:DrugOneDrugOne

人工智能在药物发现领域引起了广泛关注,但当前方法仅是对现有实验的数字化,无法预测新化合物在临床中的实际效果。设计用于药物开发后期的药理数字孪生体也缺乏跨越转化鸿沟的能力,在药物早期研发阶段价值有限。AI的真正潜力在于使现实世界中无法进行的虚拟实验成为可能,即将新化合物直接在人体内进行测试。

随着AI、高通量检测、单细胞与空间组学的发展,现在能够构建可编程虚拟人(PVH),一种动态的、多尺度的人体模型,为基于生理学的药物发现建立了全新的范式。这一方法为在药物研发流程更早阶段评估和优化药物的有效性与安全性提供了变革性的途径。

为此,美国东北大学、弗吉尼亚大学等机构的研究人员于2025年10月8日在《Drug Discovery Today》上发表文章,题为“AI-powered programmable virtual humans toward human physiologically-based drug discovery”。文章提出一种PVH框架,可模拟新分子在人体内完整的药物过程,旨在构建一种基于可编程人体生理的新范式。随后概述了构建PVH需要面对的机遇、挑战与实现路线图,结合AI、知识工程、系统生物学与生物物理等多学科方法推进该目标。

背景

人工智能在图像与视频生成、自然语言处理以及结构生物学领域的成功,激发了人们对其在药物发现与开发中的应用期待。目前,大多数基于AI的药物研发工作仍聚焦于传统的“单药-单靶点”模式。然而,对于复杂疾病而言,靶点导向的药物发现临床成功率极低,其原因在于疗效不足或出现不可预见的副作用。靶点导向药物发现的高失败率与高成本,使得基于表型的药物发现重新受到关注,这通常利用细胞系或类器官模型进行药物筛选。现有AI在表型筛选中的应用主要集中在提升高通量筛选效率,而对模型与人体之间的本质差异关注不足。

正如Bender等人指出的,靶点导向与表型导向药物研发的核心挑战在于“转化鸿沟”,即从在单靶点结合力或模型中表现良好的分子,到在人体中具备临床疗效和安全性的药物之间存在显著差距。如果不在药物研发范式上进行变革解决疾病复杂性与转化差距的问题,AI在现有药物研发流程的各个环节的成功可能只会带来“更快、更便宜的失败”,而非提高临床成功率。

理想情况下,药物应通过直接优化其在人体内的临床效应来设计或筛选,即使我们对复杂疾病机制了解有限。但在研发早期对人体直接试药显然不道德,因此计算建模成为唯一可行途径。药理数字孪生体作为人体的虚拟复制体,被提出用于模拟药物在体内的作用机制,服务于医疗、临床试验和个体化医疗。然而,现有数字孪生技术主要依赖大量人体数据或对疾病机制和药物反应的详细知识。但对于全新分子而言,既无人体数据,也缺乏药代动力学等药理信息。合成患者数据虽能缓解数据稀缺问题,但在新化学结构与已知药物差异巨大的情况(OOD)下作用有限。因此,当前数字孪生技术主要用于药物开发后期,无法在早期可靠预测新化合物在人体的临床表现。

因此,需要一种新型的可编程虚拟人(Programmable Virtual Human, PVH),用于预测未知新分子对人体生理系统的作用,并实现反向设计药物以将疾病表型恢复至健康状态,即使对疾病病因尚未完全理解。表1展示了PVH与传统药理数字孪生在数据来源、建模层次、主要应用阶段与目标等方面的差异。

表1 传统药理数字孪生与可编程虚拟人比较

基于人体生理的药物发现的PVH框架

一个用于药物发现的计算平台通常由三个关键组成部分构成:流程、数据与方法。PVH的目标是实现一种全新的、基于人体生理的药物发现范式,以克服现有药物研发流程的局限(图1)。这一范式通过直接优化候选药物在患者体内的治疗效果,并最小化其副作用,从而贯通从靶点识别与验证、先导化合物发现与优化、临床前动物实验、临床试验到临床应用的整个链条。这种新方式类似于使用ChatGPT根据文字提示生成图像,如果用患者的疾病虚拟人与健康虚拟人分别表示疾病状态与健康状态,它们作为“提示语”用于生成能够将患者状态从疾病转变为健康的分子。

图1 三种药物发现范式及PVH工作流程

图1a展示了三种药物发现(靶点导向、表型导向,生理导向)范式。每种范式依赖不同的信息来源(如蛋白活性、医学影像或多组学数据),构建不同的计算模型(如QSAR、图像处理模型、数字孪生体),并实现不同目标(如结合亲和力预测、细胞形态变化分析、临床安全性评估)。图1b提出的PVH将数学建模、生物物理学、机器学习与知识工程整合,实现基于人体生理的药物筛选与反向药物设计。其工作流程包括模拟药代动力学(PK)、预测特定细胞类型的靶点占有率、分析扰动条件下的单细胞/空间组学变化,并将分子层面的变化关联至临床表型。PVH打通现有AI驱动药物发现流程中的数据与流程孤岛,实现药物效应的端到端优化。此外,PVH融合数据驱动与机制驱动模型,以解决数据稀缺与领域迁移问题。

PVH的机遇

模拟新分子在人体内的命运

PVH的关键任务之一是预测新化合物在体内的药代动力学(PK)和药效动力学(PD)。传统PBPK/QSP模型依赖机制模型推导的微分方程,难以精准预测未知分子的行为。机器学习增强PBPK/QSP预测成为新趋势,尤其是物理信息神经网络(PINNs)可将物理规律以微分方程或其他数学形式嵌入神经网络中,可显著提升模型的数据效率、泛化能力与可解释性。确定了分子在细胞内的浓度后,下一个关键问题是该分子如何与各种细胞成分(如DNA、RNA、蛋白等)相互作用。绝大多数药物是针对蛋白设计的,因此预测全基因组范围内蛋白-化学分子的结合构象、热力学、动力学及功能选择性至关重要。开发可靠的机器学习力场和构象采样方法,有望提高结合动力学模拟的效率和准确性。此外,基于MD模拟产生的动态特征来训练机器学习模型,也是一个值得关注的发展方向。

模拟细胞状态的多重特征

要准确模拟细胞对外部扰动的反应,就必须整合跨越DNA、RNA、蛋白质、代谢物到细胞表型等不同生物层级的多种组学数据。多模态机器学习是实现这一整合的强大工具。尤其是深度学习,使得可以利用无标签数据开发DNA、RNA及蛋白质的基础模型。它还支持将不同数据模态融合为统一的表征空间,并模拟跨生物层级的信息流动。基于生物启发的端到端深度学习框架在预测基因型-环境-表型关系方面具有巨大潜力。

预测对新型扰动的临床反应

实现PVH的一项令人振奋的进展是扰动功能基因组学和基于图像的表型分析技术的发展,包括perturb-seq、表观基因组编辑、drug-seq、细胞影像分析,以及用于基因和药物响应的人体微生理系统(MPS)。这些技术通过系统性地改变细胞内特定基因或分子通路,观察其表型变化。在获得足够扰动数据的情况下,可以逆向解析人体生理的复杂机制。AI的最新进展带来了多种预测和建模细胞扰动反应的创新方法,如ChemCPA、GEARS、MultiDCP、PDGrapher等。

将疾病模型中获得的知识转化为适用于人类系统至关重要。AI、系统生物学和生物物理学的融合再次展现出巨大潜力。首先,精准的PBPK建模可通过解决体外、动物模型与人体之间药代动力学差异来弥补关键转化鸿沟。其次,多组学分析可提供无偏且全面的表型计数,包含靶点可转移性、药物作用机制和药代动力学信息。最后,基础模型、对比学习、迁移学习及其他生成式AI技术已在基于疾病模型预测临床药物反应方面取得了令人鼓舞的成果。PVH的发展将大大受益于对改进疾病模型、高通量组学分析以及数据高效AI技术的持续投入。

PVH实现路径

药物发现中化学空间、生物分子与表型的OOD范围极为巨大,这对构建具备泛化性、可信度与可解释性的PVH构成重大挑战。因果表征学习旨在寻找数据背后跨环境不变的真实因果因素,使模型在新分布下仍具备良好表现。这也是实现可解释机器学习并能推演至OOD场景的关键。对于成本高、风险大的应用,对模型预测进行不确定性评估至关重要。未来的不确定性量化方法需要改进PVH多模态嵌入空间的指标、采样与聚类方法,结合OOD检测与统计学框架以及区分随机或数据噪声导致的偶然不确定性与模型缺陷或知识不足导致的认知不确定性。

机制驱动的数学建模作为一种有前景的方法,能够应对机器学习所面临的一些挑战。机制模型明确表示系统内部的过程与相互作用,因此能够揭示系统运行的基本原理。由于这种模型能利用现有知识进行推断,即使在数据稀缺或难以获取的情况下,也可以做出预测,因此具有更好的泛化能力,适用于多种场景。此外,其透明性使得预测结果更易解释,有助于理解影响结果的关键因素,这对于PVH在关键任务中的应用至关重要。同时,机制模型能够自然地融入先验知识,从而提高预测的准确性与相关性。由于PVH旨在探索新的化学空间并研究新分子对人体的影响,而数字孪生主要用于评估药物在临床前与临床阶段对患者的影响,两者实际上具有高度互补性。现有的数字孪生模型,特别是机制模型,可以嵌入到PVH中使用。

无论是基于数据驱动还是机制驱动,来自真实世界的数据(如电子健康记录EHR、可穿戴设备数据、生活方式与行为数据等)所建立的模型,都是构建用于药物研发的PVH的重要组成部分,但仅靠这些仍不够。关键在于将微观尺度的分子模型与宏观尺度的人体生理模型融合。目前,微观模型与宏观模型的融合出现了多种可行方向。纯数据驱动方式中,已有跨层级端到端学习框架,可从基因型直接预测扰动后的整体表型。在宏观模型为机制模型的情况下,微观模型的输出(如化合物-蛋白结合参数)可作为输入用于PBPK模型,尤其适用于药物发现早期。基于知识的模型整合是另一种重要方向,可将不同尺度的模型统一起来。

验证PVH的准确性、可重复性和生物学意义至关重要。合理的验证过程有助于证明模型预测能跨越多样的化学与生物空间进行泛化,减少在后续实验或临床阶段发生高成本失败的风险。这也有助于获得监管层的认可,并确保AI能可靠地识别安全有效的候选药物。

总结

制药行业在开发针对复杂疾病的有效疗法时面临前所未有的挑战,尽管技术不断进步,传统的药物研发方式却逐渐显现边际效益递减。PVH的提出是一种范式转变,为连接分子设计与临床疗效之间的关键转换路径提供了潜在解决方案。通过在虚拟人系统中直接优化治疗结果,PVH有望从根本上重塑药物发现与开发方式,尤其是在复杂、多因素疾病领域。

参考链接:

https://doi.org/10.1016/j.drudis.2025.104497

--------- End ---------

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档