前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >Nat. Commun. | 知识引导扩散模型助力3D配体-药效团映射

Nat. Commun. | 知识引导扩散模型助力3D配体-药效团映射

作者头像
DrugAI
发布2025-03-11 20:35:01
发布2025-03-11 20:35:01
390
举报
文章被收录于专栏:DrugAIDrugAI

DRUGAI

药效团是对关键化学相互作用模式的抽象,在药物发现中占据不可替代的地位。尽管已有多种药效团工具可用,但深度学习在药效团引导的药物发现中的应用仍较为罕见。研究人员在此提出了一种知识引导的扩散框架,用于即时(on-the-fly)3D配体-药效团映射,命名为DiffPhore。该框架利用配体-药效团匹配知识来引导配体构象生成,同时采用校准采样以缓解迭代构象搜索过程中的曝光偏差。通过在两个自建的3D配体-药效团配对数据集上进行训练,DiffPhore 在预测配体结合构象方面达到了当前最优性能,超越了传统的药效团工具及多种先进的对接方法。此外,DiffPhore 在先导化合物发现和靶点筛选方面展现出了卓越的虚拟筛选能力。利用 DiffPhore,研究人员成功鉴定出结构迥异的人谷氨酰环化酶(glutaminyl cyclase)抑制剂,其结合模式进一步通过共晶结构分析得到了验证。研究人员认为,该研究将推动人工智能驱动的药效团引导药物发现技术的发展。

人工智能(AI)正在渗透到药物发现的各个关键阶段,展现出变革药物发现流程的巨大潜力,并深刻改变当前的药物发现格局。近年来,AI 在先导化合物发现与优化、靶点识别以及临床前/临床研究等方面取得了显著进展。尤其是在结构引导的药物发现中,深度学习(DL)算法能够高效完成多个核心任务,如结合构象生成、结合亲和力预测以及分子生成。

目前,针对结合构象生成,已有三种主要的深度学习方法结合蛋白结构约束进行研究:(1)预测配体的平移、旋转和扭转以恢复结合模式(如 DiffDock 和 EquiBind);(2)利用梯度下降预测蛋白-配体的距离矩阵(如 TANKBind);(3)采用E(n)-等变图神经网络迭代更新配体原子的运动和位置(如 KarmaDock 和 E3Bind)。在结构引导的分子生成领域,也有多个深度学习算法相继被提出,如 TargetDiff、ResGen、SurfGen 和 PockeFlow,其中部分模型已成功用于新命中/先导化合物发现的验证。这些深度学习方法的学习能力通常通过增加样本数据或融合蛋白-配体识别互补性知识来增强。

药效团作为关键化学相互作用的抽象,提供了一种替代方式来刻画蛋白-配体识别的互补性原则。与结构引导方法相比,药效团具有独特、简洁且包含空间位置信息的特点,同时具备方向匹配模式。因此,药效团在实际药物发现中得到了广泛应用,尤其是在早期药物发现阶段。尽管目前已有多种基于药效团的药物发现工具(如 AncPhore、PhDD、PHASE、Catalyst、Pharao 和 Pharmit),但深度学习驱动的药效团引导药物发现技术仍较为罕见,仅有少数研究报道。例如,PGMG 通过建立潜在变量实现药效团与分子之间的多对多(非3D)映射来进行药效团引导的分子生成,而 PharmacoNet 结合深度学习和图匹配算法,实现了基于药效团的虚拟筛选。深度学习技术在药效团引导药物发现中的发展较为缓慢,主要受到多个因素的制约,包括高质量数据集的缺乏以及难以高效捕捉稀疏药效团特征的算法。

研究人员在优化已有的药效团锚定工具 AncPhore的基础上,构建了两个3D 配体-药效团配对数据集(CpxPhoreSet 和 LigPhoreSet),其中包含10种药效团特征及排斥球。CpxPhoreSet 来源于实验蛋白-配体复合物结构,反映了真实但具有偏倚的配体-药效团映射(LPM) 情景。而 LigPhoreSet 则基于能量最优的配体构象,在兼顾药效团和配体多样性的同时生成了更为理想的配体-药效团配对。两者在数据分布上的互补性使其能够支持高效的深度学习模型开发,并适用于LPM 及其他基于药效团的任务(如去 novo 设计和结构优化)。

基于配体-药效团匹配原则,研究人员提出了 DiffPhore——一种面向“即时”(on-the-fly)3D 配体-药效团映射的知识引导扩散框架。DiffPhore 的核心思想是利用 LPM 领域知识指导构象生成过程,同时采用校准采样来缓解扩散模型固有的曝光偏差。具体而言,DiffPhore 由三个主要模块组成:

  • 知识引导 LPM 编码器——基于类型匹配和方向对齐原则,提取配体-药效团匹配知识,高效地表示3D 配体与药效团的映射关系。
  • 基于扩散的构象生成器——在 LPM 表征的基础上,结合扩散模型的去噪过程,处理配体-药效团匹配信息并估计构象恢复方向。
  • 校准采样器——调整构象扰动策略,缩小训练阶段和推理阶段的分布偏差,提高采样效率。

在本研究中,研究人员在PDBBind 测试集和PoseBusters 数据集上对 DiffPhore 进行了评估,结果表明其在结合构象预测方面超越了传统药效团工具及多种先进的对接方法。进一步在DUD-E 数据库和IFPTarget 资源库上的实验显示,DiffPhore 在先导化合物发现和靶点筛选方面均具有卓越的虚拟筛选能力。此外,研究人员利用 DiffPhore 进行人谷氨酰环化酶(glutaminyl cyclase)的虚拟筛选,该靶点在神经退行性疾病及癌症免疫治疗中具有重要意义。最终,研究人员成功鉴定出结构差异显著的抑制剂,并通过共晶结构分析验证了这些抑制剂的结合模式,其预测构象与实验晶体结构高度一致。

研究人员认为,该研究将推动人工智能驱动的药效团引导药物发现技术的发展,并为结构驱动药物设计和虚拟筛选提供新的方法和工具。

结果

3D 配体-药效团配对的互补数据集

为推动基于药效团的深度学习方法发展,研究人员发布了 CpxPhoreSet 和 LigPhoreSet 两个 3D 配体-药效团配对数据集,涵盖 10 种药效团特征 及 排斥球。CpxPhoreSet 包含 15,012 组 由 实验蛋白-配体复合物结构 提取的配体-药效团配对,而 LigPhoreSet 由 ZINC20 数据库 的 280,096 个代表性配体 及其 840,288 组配对 组成,提供更广泛的化学和药效团多样性。t-SNE 分析表明,LigPhoreSet 在化学和药效团特征上均优于 CpxPhoreSet,并适用于泛化的 LPM 学习;相较之下,CpxPhoreSet 包含 匹配度评分 0.5–1.0 的 非完全匹配配对,可用于建模现实世界 LPM 偏倚及诱导契合效应。因此,研究人员在模型预热阶段 采用 LigPhoreSet,随后利用 CpxPhoreSet 进行精调优化。

DiffPhore 实现高精度配体结合构象预测

研究人员评估了 DiffPhore 在配体结合构象生成方面的能力,并与 AncPhore、MOE 及 OpenBabel(OB)、Conformator(CF) 等方法进行基准测试。在 PDBBind 测试集上,DiffPhore 以 40 个初始构象 实现 73.82% 的 top-1 成功率(RMSD < 2 Å),在仅 10 个初始构象 条件下,成功率仍达 67.13%,显著优于 AncPhore 和 MOE。在 PoseBusters 数据集 上,DiffPhore 同样表现出较高的结合构象预测成功率。此外,即使在未包含于训练集的新蛋白子集中,DiffPhore 依然保持稳定的预测能力,表明其学习了配体-药效团映射的内在规律,而非简单记忆训练样本。

在化学与物理合理性测试中,DiffPhore 生成的结合构象在 PDBBind 测试集上的合理性评分达到较高水平,而在 PoseBusters 数据集上的表现同样优越。此外,DiffPhore 生成的构象在构象能量、键长、键角、二面角等方面更接近真实构象。

在与四款开放源码分子对接工具(AutoDock Vina、Uni-dock、SMINA、GNINA)及 DL 对接工具(KarmaDock、SurfDock)的对比中,DiffPhore 在 结合构象预测 方面表现优越,并能生成更符合化学合理性的构象。进一步分析发现,DiffPhore 在处理高柔性分子 和 复杂药效团 时较 AncPhore 更具优势,在 重原子数较少或可旋转键较少 的分子中,成功率可达较高水平。此外,DiffPhore 对 3–12 个药效团特征 的模型预测效果最佳,且受 分子柔性和药效团复杂性 影响较小。这些结果反映出 DiffPhore 结合高质量数据集与知识引导扩散框架的优势。

DiffPhore 在先导化合物发现和靶点筛选中表现卓越

DiffPhore 生成高精度结合构象的能力,使其成为先导化合物发现和靶点筛选中的核心引擎。在 DUD-E 数据集中,研究人员选取了 28 个结构和机制不同的靶点 进行虚拟筛选测试,结合四种 适配度评分(Dfscore1–Dfscore4) 评估 配体-药效团匹配。在 AUROC 和 BEDROC 指标上,DiffPhore 优于传统药效团工具(AncPhore、MOE),并与 主流对接工具(RFscore-VS、Glide SP、EquiScore)相当。此外,在 富集因子 指标上,DiffPhore 接近 MOE,优于 AncPhore 和大多数对接工具,展现了其精准筛选活性分子的能力。

在 IFPTarget 资源库(2842 个靶点,11,890 组复合结构) 上进行靶点筛选时,DiffPhore 在 4OH-他莫昔芬(4OH-Tamoxifen) 的靶点排名中优于 AncPhore,并与 对接工具(如 AutoDock Vina、GNINA)表现相当。尽管在个别靶点(如人成纤维细胞胶原酶)上表现受限,但整体结果表明,合理的药效团模型对于 DiffPhore 在虚拟筛选中的成功至关重要。

总体而言,DiffPhore 在 结合构象预测、先导化合物发现、靶点筛选 方面均表现卓越,充分展示了其在 基于药效团的虚拟筛选 任务中的潜力。

讨论

药效团和分子对接方法均基于受体-配体识别原理,但实现方式不同。分子对接全面考虑受体-配体相互作用,而药效团提取核心特征,强调关键相互作用的精准匹配,避免对次要相互作用的依赖,提高了筛选效率。此外,药效团可规避传统或深度学习对接方法的靶点偏好问题,因此,开发深度学习驱动的药效团技术具有重要前景。DiffPhore 作为首个用于 LPM 任务的深度学习模型,有望推动该领域的发展。

由于缺乏标准化的 DL 药效团数据集,研究人员构建了 LigPhoreSet 和 CpxPhoreSet,结合 10 种药效团特征和排斥球。结果表明,这两个数据集可有效支持 LPM 任务,并为 分子生成等其他任务 提供数据基础。此外,研究人员提出的配体衍生数据集构建方案,可为更具鲁棒性和广泛适用性的数据集奠定基础,推动药效团引导的药物发现。

在 DiffPhore 中,药效团原理被巧妙融合进神经网络,以实现高效的配体结合构象搜索,有效减少组合爆炸问题,特别适用于高柔性配体。其 知识引导的扩散框架 采用 3D 变换 而非绝对坐标生成,确保生成的构象化学合理、能量稳定。此外,校准采样器 缩小了训练与推理阶段的差异,缓解了扩散模型的曝光偏差。值得注意的是,DiffPhore 在未见过的蛋白上仍能稳定生成结合构象,表明其学习了配体-药效团匹配的本质规律,而非简单记忆训练数据。

在实际应用中,研究人员利用 DiffPhore 采用 底物模拟策略(基于催化反应路径构建药效团模型),成功发现结构差异显著的 sQC/gQC 金属酶抑制剂。共晶分析 证实,所得抑制剂的结合模式与 sQC/gQC 底物高度一致,尤其在锌配位和催化位点氢键等关键药效团特征上。这表明 DiffPhore 可凭借精确定义的药效团模型,高效筛选高质量的先导化合物,并在 金属酶抑制剂发现 方面展现独特优势。

DiffPhore 在结合构象预测与虚拟筛选中的卓越表现,突显了研究人员构建的数据集和知识引导扩散框架的优势。未来,可进一步优化计算效率和精度,改进 键长、二面角 计算,纳入 分子内相互作用(如分子内氢键),并解决 复杂配体(如大环结构) 的构象预测挑战。

整理 | WJM

参考资料

Yu, JL., Zhou, C., Ning, XL. et al. Knowledge-guided diffusion model for 3D ligand-pharmacophore mapping. Nat Commun 16, 2269 (2025).

https://doi.org/10.1038/s41467-025-57485-3

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档