前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >ICLR 2025 | 3DMolFormer: 基于结构的药物发现的双通道框架

ICLR 2025 | 3DMolFormer: 基于结构的药物发现的双通道框架

作者头像
DrugAI
发布2025-03-10 20:12:09
发布2025-03-10 20:12:09
980
举报
文章被收录于专栏:DrugAIDrugAI

DRUGAI

今天为大家介绍的是来自清华大学、微软研究院、加拿大麦吉尔大学和Mila人工智能研究院的一篇论文。基于结构的药物发现,包括蛋白质-小分子配体对接(docking)和针对靶点口袋的3D药物设计两个任务,是药物发现领域的核心挑战。然而,现有方法都不能充分利用两个任务之间的对偶性,并且单个任务的方法也面临着3D信息建模困难和训练数据不足的两方面挑战。针对上述问题,作者提出了3DMolFormer,一个统一的双通道transformer框架来解决docking和3D药物设计两个任务,其中通过在药物设计过程中使用docking功能,利用了这两项任务之间的对偶性。3DMolFormer在两项任务的对比实验中均优于此前的基线方法,展示了其在基于结构的药物发现领域的应用潜力。

基于结构的药物发现(SBDD)是实际药物发现中最重要的策略之一,研究对象是蛋白质口袋与小分子配体形成的复合物。SBDD包含了两项任务:

  • 蛋白质-配体对接,即给定蛋白质的3D结构、结合口袋和小分子配体的平面表示,预测小分子结合后的3D构象;
  • 针对靶点口袋的3D药物设计,即设计与给定蛋白质口袋结合良好的3D小分子结构。

这两项任务本质上是对偶的,其中第一个是预测式任务,第二个是生成式任务。然而,截至目前,这两项SBDD任务都还没有得到有效解决,主要原因有三项:

  • 对偶性未利用:此前没有任何工作利用了两项SBDD任务之间的对偶性;
  • 3D信息难以建模:蛋白质序列和小分子平面信息是离散的,而3D坐标是连续的,两种模态的统一面临挑战;
  • 数据稀缺:蛋白质-小分子复合物的ground-truth数据稀缺,目前最常用的PDBBind数据集只包含不到20,000个样本。

针对上述问题,论文提出了3DMolFormer框架。首先,为了满足两项SBDD任务的输入-输出关系并解决3D信息的建模挑战,论文设计了一种平行序列格式来表示蛋白质口袋和小分子配体的3D复合物,其中一个离散tokens序列包含蛋白质的原子信息和小分子的SMILES信息,另一个平行的数值序列包含3D坐标信息。

进一步地,论文提出了基于自回归transformer生成式架构提出了3DMolFormer模型来处理上述平行序列,其中与离散token的embedding层和output head相对应地设计了连续数值的embedding层和output head。为了解决数据稀缺问题,论文采用了“预训练+微调”范式,其中使用了包含蛋白质、配体和复合物三部分数据进行了大规模预训练,然后对两个SBDD任务分别进行了微调:docking任务用少量的ground-truth数据进行有监督微调,3D药物设计任务针对每个靶点进行强化学习微调。特别地,为了利用两个任务之间的对偶性,3D药物设计中利用了docking微调后的功能。

在蛋白质-配体对接和针对靶点口袋的3D药物设计的对比实验中,3DMolFormer方法都表现出了超越此前基线方法的性能。其中在蛋白质-配体对接中,3DMolFormer的对接准确率不仅优于AutoDock Vina等基于启发式搜索的传统方法,也优于Uni-Mol等深度学习方法。在针对靶点口袋的3D药物设计中,3DMolFormer在多性质目标药物设计的成功率上远超基线方法,展示了其在真实世界药物设计中的潜力。

总而言之,3DMolFormer展示了利用SBDD两项任务之间的对偶性的益处,并且实现了在这两项任务中有效建模3D信息和执行大规模预训练的方法。值得一提的是,3DMolFormer没有使用等变网络架构,而是依赖于更为通用的自回归序列建模,这与近期SBDD领域的大部分工作不同。网络通过包含数据增强的大规模预训练中学习到等变性,而不需要强制网络使用等变架构,这与AlphaFold3等近期工作的结论相似。

参考资料

Hu, Xiuyuan, Guoqing Liu, Can Chen, Yang Zhao, Hao Zhang, and Xue Liu. "3DMolFormer: A Dual-channel Framework for Structure-based Drug Discovery." arXiv preprint arXiv:2502.05107 (2025).

代码

https://github.com/HXYfighter/3DMolFormer

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档