首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nat. Commun. | 基于原子、键协同扩散和性质引导的3D分子生成模型

Nat. Commun. | 基于原子、键协同扩散和性质引导的3D分子生成模型

作者头像
DrugOne
发布2025-09-02 18:25:51
发布2025-09-02 18:25:51
1920
举报
文章被收录于专栏:DrugOneDrugOne

近日,华东师范大学药学院/人工智能新药创智中心李洪林教授团队在 Nature Communications 期刊发表论文 “Target-aware 3D molecular generation based on guided equivariant diffusion”,提出一种靶点感知的新型3D分子生成模型—— DiffGui。该模型通过原子与键协同扩散机制多属性引导策略,显著提升了生成分子的结构合理性、结合亲和力与类药性质,在新药发现与先导化合物优化中展现出强大潜力。

研究背景

1. 传统药物研发的瓶颈

在传统的药物研发中,寻找能够与疾病靶点结合的先导化合物是决定项目成败的关键。目前主流的先导化合物发现方法包括:

(1). 基于靶标结构的药物设计 (SBDD):SBDD包含虚拟筛选和分子生成。其中,虚拟筛选依赖打分函数来评估靶标和配体之间的结合亲和力。然而,该方法需在极大规模的化学空间中进行,计算成本高昂,且易因评分函数的局限性产生大量假阳性结果,效率低下。

(2). 基于已知配体的药物设计 (LBDD):LBDD是根据已知活性配体的结构信息进行分子优化,但由于未充分利用靶蛋白的三维结构信息,难以应用于缺乏已知配体的新型靶点。

2. 新一代3D分子生成模型的挑战

近年来,基于深度学习的3D分子生成模型在SBDD中展现出巨大潜力,但仍面临以下挑战:

(1). 自回归模型:需按顺序生成原子,易忽略分子的全局结构信息,导致生成分子的结构不完整或存在累积误差。

(2). 扩散模型:虽避免了自回归的局限性,但多数仅模拟原子扩散,未显式建模键的生成过程,导致键型推断依赖静态键长,对原子坐标偏差敏感,易产生不合理结构。此外,生成过程缺乏对亲和力、类药性、可合成性等关键属性的显式引导,限制了其实际应用价值。

研究内容

1. DiffGui模型的创新框架

DiffGui提出了一种融合原子-键协同扩散多属性引导的双机制生成框架(图1)。

(1). 双阶段正向扩散过程: DiffGui的独特之处在于其将正向扩散过程分成了两个阶段:

第一阶段:仅对原子施加微量噪声,同时将键型逐渐扩散到无键的先验分布。这使得模型能够基于原子间的动态距离来推断键型,从根本上解决键型-键长不一致问题。

第二阶段:对原子类型与坐标进行扰动,逐步扩散至先验分布。两阶段的分步扩散确保了模型在整个过程中都能准确地学习到键型与真实键长之间的内在规律。

(2). E(3)-等变图神经网络 (GNN): DiffGui采用E(3)-等变图神经网络同时更新原子与键的表征,确保生成过程具有旋转、平移与排列不变性,保证生成构象的几何合理性。

(3). 多属性引导: DiffGui 采用了无分类器的引导策略,在训练与生成过程中融入了多种重要的分子属性。模型引入分子的结合亲和力、类药性 (QED)、合成可及性 (SA)、脂水分配系数 (LogP) 以及极性表面积 (TPSA) 等多属性条件,引导生成兼具高亲和力与优良药物属性的分子。

图1 DiffGui模型框架及扩散-生成过程示意[1]

2. DiffGui生成分子的结构评估

DiffGui 模型在多项评估中都展现出卓越的性能,超越了现有SOTA (State-of-the-Art) 模型。在分子结构合理性方面,DiffGui 生成的分子与真实分子的键长、键角和二面角分布高度相似(表1),其全原子对距离的 Jensen-Shannon (JS) 散度也远低于其他模型。特别是在PDBbind数据集上,DiffGui 的C-C键距离JS散度仅为0.1815,全原子对距离JS散度更是低至0.0486(图2),显示出极高的结构准确性。此外,DiffGui生成的分子中五、六元环占比超过95%,与真实药物分子的环系分布高度吻合。在分子构象准确性方面,DiffGui 生成的分子构象与RDKit优化/预测构象的均方根偏差 (RMSD) 值稳定在1.0 Å左右,这避免了因产生片段化分子或计算简化而导致的伪低RMSD值(分子结构不完整)的问题(图3)。

表1 生成分子与参考分子间的平均JS散度[1]

图2 生成分子与参考分子的全原子对距离分布对比[1]

图3 生成分子与优化/预测构象的RMSD分布[1]

3. DiffGui生成分子的性质评估

DiffGui 在生成分子的性质方面表现优异,这一点在多项评估指标中得到了充分验证。在PDBbind数据集上,DiffGui在原子稳定性 (0.9509)、分子稳定性 (0.4069)、PB-validity (0.9537) 和RDKit-validity (0.8722) 等基础分子指标上均优于其他方法(表2)。同时,该模型在蛋白质-配体相互作用指纹相似度方面取得最高得分 (0.6383),而2D结构相似度最低 (0.3261),表明DiffGui不仅能够有效维持与靶点关键残基的相互作用模式,还能够生成具有新颖骨架结构的分子。此外,DiffGui生成的分子在Vina Score、Vina Min和Vina Dock三项结合亲和力评价中均获得最低分值(分别为-6.700、-7.655和-8.448),显示出优异的结合能力。在类药性方面,DiffGui在定量药物相似性评估 (QED,0.631) 指标上超越所有其他模型,说明其生成的分子具有更理想的类药特性。尽管在可合成性 (SA) 指标上略逊于部分自回归模型,其SA得分 (0.678) 在扩散模型中仍保持最高水平,且其生成的分子还表现出合理的极性表面积 (TPSA,100.49) 和脂水分配系数(LogP为1.977,处于1~3的理想范围内)。

表2 不同方法在PDBbind数据集上生成分子的基本属性[1]

表3 不同方法在PDBbind数据集上生成分子的药物属性[1]

4. DiffGui在全新药物设计与先导化合物优化中的应用

DiffGui已成功应用于全新药物设计与先导化合物优化任务,展现出优异的通用性与实用价值。

(1). 全新药物设计

在全新药物设计任务中,DiffGui 展现出优异的跨靶点泛化能力。针对包括β-分泌酶1 (1w51)、酪氨酸激酶 (3ctj)、G蛋白偶联受体 (7ew4) 及离子通道 (8ju6) 在内的多种蛋白靶点,该模型均能生成充分占据结合口袋、且具有合理三维空间匹配的分子(图4,5)。生成分子不仅结构明确,其对接评分和综合性质也优于活性分子及其他对比方法所产生的分子。特别地,除3ctj外,DiffGui 所生成分子的结合自由能 (ΔG) 均低于参考配体,表明其其能够设计出具有更高亲和力的候选分子。此外,在1w51和3ctj两个靶点中,DiffGui 生成分子与参考配体在三维药效团重叠方面表现最优,凸显其准确模拟关键相互作用的能力。为进一步评估生成分子的多样性,作者在其他靶点(如4b5d、5ni7和5ywy)上也进行了测试,结果表明DiffGui能够生成与不同形状口袋精确匹配的多样化分子,其多样性指数达到0.7256,且对接评分和性质均优于参考配体。

图4 针对靶点1w51和3ctj的生成分子展示[1]

图5 针对靶点7ew4和8ju6的生成分子展示[1]

(2). 先导化合物优化

在先导化合物优化任务中,DiffGui 采用“片段去噪” (fragment denoising) 和“片段条件” (fragment conditioning) 两种采样策略,支持片段生长 (fragment growing)、片段连接 (fragment linking) 和片段合并 (fragment merging) 等多种优化方法(图6)。以PI3K (3l13) 为例,模型以噻吩并嘧啶为初始片段,通过片段生长生成的新分子不仅保持了与关键残基(包括Lys802、Ala805、Asp841、Tyr867、Val882和Asp964)的相互作用,还将原结构中的吗啉环替换为呋喃、吡唑等基团,以及将哌嗪磺酰基替换为吡咯烷磺酰基、环化哌嗪磺酰基和哌嗪羰基等不同结构单元,体现出其对蛋白-配体相互作用模式的深刻理解与多样化学空间的探索能力。此外,当提供两个或三个片段时,DiffGui还能分别通过片段连接和片段合并策略进行骨架跃迁,将活性配体的核心支架转化为具有类似功能的新结构。生成分子在Vina评分、类药性 (QED) 和可合成性 (SA) 等方面均优于或至少与参考配体竞争力相当,表明DiffGui可有效推进先导化合物优化进程。

图6 基于片段的先导化合物优化示例[1]

更重要的是,湿实验验证进一步证明了 DiffGui 在药物发现实际应用中的潜力。针对未参与训练的 RSK4(核糖体 S6 激酶 4)靶点,DiffGui 所生成的两个化合物(化合物 1 和 2)在 HTRF 实验中均表现出强效抑制活性,IC₅₀ 值分别达到 215.0 nM 和 111.1 nM,显示出进一步开发的潜力。结合模式分析表明,这两个化合物均能够与 RSK4 结合口袋中的关键残基(K105、D153、L155 和 K221)发生相互作用。

在对非激酶靶点二氢乳清酸脱氢酶(DHODH)进行先导化合物优化时,DiffGui 在固定片段(图7中橙色标注)基础上生成的分子(化合物 3 和 4)对 DHODH 的抑制活性显著提升:其中一个化合物的IC₅₀从 8.02 μM 降低至 4.27 μM,另一个则从 32.20 nM 进一步优化至 10.45 nM。化合物 3 在噻唑环上同时引入羧基和甲基取代基,其中羧基与 R136 形成盐桥,甲基则插入由 V134、V143 和 Y356 残基形成的疏水子口袋中。与原始配体相比,化合物 4 将羧酸转换为异羟肟酸,扩展了氢键网络,新增了与 Q47 和 T360 的相互作用;苯环上引入的氟原子占据了此前已识别的疏水子口袋,连接子上增加的甲基则填充了由 L46、A55 和 L58 构成的另一个疏水空腔。这些精细的结构修饰显著增强了配体与靶蛋白之间的相互作用,从而大幅提升了结合亲和力(图7)。

图7 DiffGui生成分子的湿实验验证结果[1]

总结

本研究提出的DiffGui模型通过“原子-键协同扩散+性质引导”策略,显著提升了分子生成的结构合理性、结合亲和力、药物属性与可合成性。在多个数据集和靶点任务中,该模型优于现有方法,并在湿实验验证中展现实际应用潜力。DiffGui不仅可用于de novo药物设计,也能辅助先导化合物的优化研究,为人工智能驱动的药物设计和发现提供了新的解决方案。

华东师范大学药学院/人工智能新药创智中心胡乔宇副研究员、上海临港实验室孙长志博士、华东师范大学药学院/人工智能新药创智中心贺欢副研究员、华东师范大学计算机科学与技术学院博士生徐嘉政、华东师范大学药学院/人工智能新药创智中心刘旦麟博士后为本文共同第一作者,华东师范大学药学院/人工智能新药创智中心李洪林教授为本文的最后通讯作者。该工作得到了国家重点研发计划(2022YFC3400501)、国家自然科学基金(82425104/82404518)、上海市科委“计算生物学”专项(24JS2830200)和上海市教委“人工智能促进科研范式改革赋能学科跃升计划项目”(2024AI01014)的资助。

参考文献

[1] Hu, Q., Sun, C., He, H, J. et al. Target-aware 3D molecular generation based on guided equivariant diffusion. Nature Communications. 2025, 16: 7928.

该文章代码已开源:

https://github.com/QiaoyuHu89/DiffGui

供稿:胡乔宇/徐嘉政

校稿:汤荣凡

华东师范大学药学院/人工智能新药创智中心/李洪林教授课题组

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档