首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >从头设计的分子生成模型综述

从头设计的分子生成模型综述

作者头像
DrugAI
发布于 2021-07-05 02:14:10
发布于 2021-07-05 02:14:10
1.7K0
举报
文章被收录于专栏:DrugAIDrugAI

编译 | 罗潇澧 审稿 | 罗晓妍

大家好,今天给大家介绍来自英国伦敦独角兽公司BenevolentAI的Meyers,Fabian和Brown近日发表在Drug Discovery Today上的综述论文。在该综述中,作者回顾了基于原子,基于片段,基于反应的三种范式的分子从头设计与生成的方法,同时对该领域的存在的挑战和机遇做出了阐述。

1

背景介绍

近年来,使用AI生成模型来做分子生成的流行程度日益上升,从头设计的分子生成也被称作是生成式化学。化学空间是十分巨大的,因此,研究人员在通过从头设计来定向的对分子进行生成时,希望能更有效地遍历化学空间,使得需要考虑的分子数量在一个更小的范围内。

分子的化学结构不仅可以通过嵌入原子和键来在原子层级上表征,也可以通过嵌入官能团和子结构来在片段层级上表征,还可以在反应层级上进行表征,这种情况下目标分子被视为反应物与反应条件的产物。实际上,基于原子,基于片段,基于反应的三种范式的方法有着明显的优劣,而很多方法模糊了这之间的区别,如图1所示。

图1. 基于原子的方法需要建立一个包含原子和键的词汇表;基于反应的方法需要有两组反应物和一组反应规则;基于片段的方法需要有一个划分片段的模式和一组可以互换的片段。

2

梯度无关的分子优化

给出一个分子表示,优化算法会根据目标函数来引导其朝着最优分子的方向来优化生成。元启发式的从头设计方法,使用基于种群的随机优化来探索化学空间,如进化算法或群体智能。

基于原子的一些方法目前能够在GuacaMol基准上达到SOTA性能。以基于图的遗传算法(GB-GA)为代表,它使用反应SMARTS对一群候选分子进行变化和交叉,并能够确保种群的最优分子得到保持;

基于片段的方法需要用一组简单的规则或逆合成的断开连接规则来对分子进行解构。以MOARF为代表,它使用了一组逆合成的断开连接规则(SynDiR)和进化算法来进行分子的从头设计;

基于反应的方法是从头设计最实用的策略。以AutoGrow4为代表,它利用遗传算法和反应库来对种群中的分子进行突变。

表1 从头分子设计的范例方法总结

3

基于梯度的分子优化

尽管基于种群的元启发式方法已经被证明在寻找最优分子方面是鲁棒的,但在过去的3年中,分子设计的深度学习方法仍然被广泛采用 。

很多基于原子的的方法使用SMILES字符串作为分子的表征,这使得许多深度学习的序列模型可供使用,然后再通过预训练-微调的思路让模型学习研究人员所感兴趣的化学空间。除此之外,基于分子图表示的模型也越来越受到关注。不同于SMILES字符串,图模型不需要学习SMILES字符串的语法规则,它直接学习分子的拓扑结构,如GraphVAE,MolGAN。近来,与强化学习相结合的图模型方法展现了具有前景的结果。

与基于原子的方法相比,基于片段的生成模型缩小了搜索的化学空间。Jin等人在JT-VAE的工作中,使用了一个两步生成方法来生成分子,首先构建一个描述组成分子的子结构骨架树,再用图消息传递网络解码最终的分子结构。

最近的研究报道了使用强化学习来将正向合成建模为马尔可夫决策过程的方式来探索巨大的可能反应空间。以REACTOR为代表,它使用一套双反应物的反应模板(SMARTS),并根据哪一个反应物将最大限度地提高下一个状态的奖励来选择缺失的反应物。当产生多个反应产物时,与最大奖励相关联的产物被选择。

4

结语

机器学习人工智能方法在药物发现中的作用越来越大,因为它们能够比传统虚拟筛选和人类专家更有效地在巨大的化学空间探寻研究人员所感兴趣的分子。现在,该领域面临的挑战是评估生成器和优化目标是否对当前的任务有用。分子的从头设计和生成化学模型在药物发现领域仍然是一个有争议的话题,但作者认为,从集体经验中还是能够学习到很多有用的方法,并期待将这些方法添加到药物化学工具箱中。

参考资料

Meyers J, Fabian B, Brown N. De novo molecular design and generative models. Drug Discovery Today, 2021.

https://doi.org/10.1016/j.drudis.2021.05.019

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Drug Discov Today综述|分子从头设计和生成模型
2021年6月,来自AI药物发现公司BenevolentAI的Joshua Meyers等人在Drug Discovery Today发表文章,对分子从头设计和生成模型方面的进展、挑战以及未来的机会进行了综述。
智药邦
2021/07/14
9290
Drug Discov Today综述|分子从头设计和生成模型
JMC|用于从头药物设计的生成模型
2021年9月17日,中科院上海药物所的蒋华良和郑明月以及华为健康智能实验室的乔楠等人在Journal of Medicinal Chemistry杂志发表文章,对用于从头药物设计的多个生成模型进行了总结和分析。
智药邦
2021/11/17
9960
JMC|用于从头药物设计的生成模型
JACS|浙江大学侯廷军等:生成式AI助力药物分子结构优化全面综述
2024年11月5日,浙江大学侯廷军等人在Journal of the American Chemical Society期刊上发表了一篇题为“Deep Lead Optimization: Leveraging Generative AI for Structural Modification”的研究文章。
智药邦
2024/12/19
2.5K0
JACS|浙江大学侯廷军等:生成式AI助力药物分子结构优化全面综述
Wires Comput Mol Sci|分子发现的生成模型:最新进展和挑战
2022年3月5日,麻省理工学院化学工程系的Klavs F. Jensen等人在Wires Comput Mol Sci (影响因子25.113) 杂志发表文章,概述了分子发现生成模型的最新进展和挑战。主要内容整理和编译如下。
智药邦
2022/11/16
1.6K0
Wires Comput Mol Sci|分子发现的生成模型:最新进展和挑战
药物发现中的分子设计:深度生成模型的全面回顾
今天给大家介绍湖南大学刘元盛老师团队发表在Briefings in Bioinformatics 2021上的一篇文章“Molecular design in drug discovery: a comprehensive review of deep generative models”。文章回顾了深度生成模型,并根据计算机中的分子表征将这些模型分为两类,详细分析这两种经典类型的模型并讨论其优缺点,同时还指出了de novo分子设计的深度生成模型当前面临的挑战。
DrugAI
2021/09/17
3.5K0
药物发现中的分子设计:深度生成模型的全面回顾
Sci. Advances | 基于深度生成模型和on-chip合成的全新药设计
本文介绍来自苏黎世联邦理工学院、埃因霍温理工大学等机构的F Grisoni、BJH Huisman等人在Science子刊发表的文章“Combining generative artificial intelligence and on-chip synthesis for de novo drug design”。作者提出了基于深度学习和微流体平台进行自动化药物DMTA(design-make-test-analyze)循环的模块化框架,并从头设计了LXR(Liver X Receptor)激动剂,结果显示集成的从头设计平台在药物发现中自动化 DMTA 循环很有前景。
智能生信
2021/06/24
9040
Sci. Advances | 基于深度生成模型和on-chip合成的全新药设计
J.Cheminform| MACCS密钥:在逆合成预测中弥补SMILES的局限性
今天给大家介绍的是韩国江原国立大学Umit V.等人在2021年发表的一篇名为“Substructure-based neural machine translation for retrosynthetic prediction”的文章。随着机器翻译方法的快速改进,神经网络机器翻译开始在逆合成规划中发挥重要作用。作者利用无模板的序列到序列模型,将逆合成规划问题重新转化为语言翻译问题,不像先前的使用SMILES字符串来表示反应物和产物的模型,作者引入了一种新的基于分子碎片的方法来表示化学反应,并使用古本系数进行结果评估。结果表明,与目前最先进的计算方法相比,该方法能获得更好的预测结果。该方法解决了现有的逆合成方法产生无效SMILES字符串等主要缺陷。具体来说,我们的方法预测高度相似的反应物分子的准确率为57.7%。此外,作者的方法得到了比现有方法更稳健的预测。
智能生信
2021/02/04
1.8K0
J. Chem. Inf. Model. | 一种综合遗传/深度学习算法用于多目标定向的分子设计
今天为大家介绍的是来自Giuseppe Felice Mangiatordi团队的一篇论文。此项研究引入了一种名为"GENERA"的全新设计算法,它将自动药物类似物设计的深度学习算法"DeLA-Drug"的能力与生成具有目标定向性质分子的遗传算法相结合。GENERA被应用于血管紧张素转化酶2(ACE2)靶点,该靶点与许多病理条件(包括COVID-19)有关。通过两个分子对接程序,PLANTS和GLIDE,评估了GENERA在为特定靶点全新设计有前景的候选分子的能力。
DrugAI
2023/11/01
3630
J. Chem. Inf. Model. | 一种综合遗传/深度学习算法用于多目标定向的分子设计
Nat. Mach. Intell. | 化学反应预训练和条件分子生成之间的联系
今天为大家介绍的是来自Bo Huang和Zhenming Liu团队的一篇论文。化学反应是制药和有机化学研究中非常重要的部分,但是目前的一些方法还不够完善,无法充分捕捉和利用化学反应的规律。为了解决这个问题,作者提出了一个全新的计算框架。这个框架的独特之处在于,它不仅可以学习和理解化学反应是如何进行的,还能基于这些理解生成新的分子结构,这对于发现新药物特别有用。
DrugAI
2024/01/12
4670
Nat. Mach. Intell. | 化学反应预训练和条件分子生成之间的联系
JMC | 人工智能在药物合成中的当前和未来作用(1)
人工智能和机器学习已经证明了其在预测化学性质和小分子合成设计中的潜在作用。数据驱动的合成路线设计是由MLPDS(Machine Learning for Pharmaceutical Discovery and Synthesis)联盟开发和评估的一部分,该联盟包括MIT和13个化学和制药公司成员。他们一起写了“Current and Future Roles of Artificial Intelligence in Medicinal Chemistry Synthesis”刊登于2020年4月JMC,分享了如何将预测模型整合到药物合成工作流程中,如何在MLPDS成员公司中使用预测模型以及该领域的前景。
DrugAI
2021/02/02
8060
JMC | 人工智能在药物合成中的当前和未来作用(1)
J. Chem. Inf. Model. | 基于Transformer的分子生成模型用于抗病毒药物设计
由于简化分子输入线入系统(SMILES)面向分子的原子级表示,并且在人类可读性和可编辑性方面不友好,然而,IUPAC是最接近自然语言的,并且在人类可读性和分子编辑方面非常友好,我们可以操作IUPAC来生成相应的新分子并产生适合编程的SMILES形式的分子。此外,抗病毒药物设计,特别是基于类似物的药物设计,更适合直接从IUPAC的功能团水平进行编辑和设计,而不是从SMILES的原子级水平进行设计,因为设计类似物仅涉及改变R基团,更接近化学家基于知识的分子设计。在此,我们提出了一种新颖的数据驱动的自监督预训练生成模型,称为“TransAntivirus”,以进行选择性替换编辑,并将有机分子转化为设计抗病毒候选类似物的所需性质。
DrugAI
2023/09/19
7950
J. Chem. Inf. Model. | 基于Transformer的分子生成模型用于抗病毒药物设计
ArXiv|药物设计的分子生成:图学习视角
2022年2月18日,来自上海交通大学的严骏驰、袁野、潘小勇与百图生科的宋乐等人在ArXiv上发表文章,从(深度)图学习角度,基于生成策略将分子生成和优化方式分为三种:一次全部、基于片段和逐节点。概述了最先进的分子设计(和主要用于从头药物设计)和发现的辅助方法。
智药邦
2022/11/16
1K0
ArXiv|药物设计的分子生成:图学习视角
ICLR 2022 under review|化学反应感知的分子表征学习
今天给大家介绍一篇关于分子表征学习的文章。分子表征学习(MRL)旨在将分子嵌入到实向量空间中。然而,现有的基于SMILES(简化分子线性输入系统)或GNN(图神经网络)的MRL方法要么以SMILES字符串作为输入,难以编码分子的结构信息,要么过度强调GNN结构的重要性,而忽视了其泛化能力。因此,作者提出使用化学反应来协助学习分子表征,其核心思想在于保持分子在嵌入空间中的化学反应的等价性,即强制让每个化学方程式的反应物嵌入和生成物嵌入的总和相等,该限制在保持嵌入空间的有序性和提高分子嵌入的泛化能力中被证明是有效的。此外,该模型可以使用任何GNN作为分子编码器,与GNN结构无关。实验结果表明,这种方法在各种下游任务中都达到了最佳性能,超过了最佳基线方法。
DrugAI
2021/12/01
8620
ICLR 2022 under review|化学反应感知的分子表征学习
ICML2020 | PGFS:如何保证生成分子是可合成的?强化学习来帮忙
今天给大家介绍的是来自蒙特利尔算法研究所、克莱姆森大学等联合发表在ICML2020上的文章。在本文中,作者针对目前新型化学结构的生成方法不能确保所提出的分子结构的合成可及性,也不能提供所提出的小分子的合成路线这一问题,提出了一种用于新药设计的强化学习机制:正向合成的策略梯度,简称为PGFS。
DrugAI
2021/02/02
1K0
ICML2020 | PGFS:如何保证生成分子是可合成的?强化学习来帮忙
BIB重磅综述 | 深度学习下的逆合成设计
今天给大家介绍的是近期发表在Briefings in Bioinformatics上有关逆合成的一篇综述。近些年,人工智能驱动的药物合成给社会带来极大的便利。逆合成设计在合成化学中占有重要的地位,因而受到了研究人员广泛的关注。本文详细介绍了深度学习背景下逆合成设计的发展历程,包括数据集、模型及常用工具,并且提出了目前深度逆合成设计面临的挑战。
DrugAI
2021/10/21
3K0
BIB重磅综述 | 深度学习下的逆合成设计
Survey | 基于生成模型的分子设计
今天给大家介绍MIT的Rafeal Gomez-Bombarelli教授发表在arXiv上的综述文章。文章对分子生成模型进行了分类,并介绍了各类模型的发展和性能。最后,作者总结了生成模型作为分子设计前沿工具的前景和挑战。
DrugAI
2021/02/02
1K0
Survey | 基于生成模型的分子设计
Nat. Mach. Intell. | 少量数据的生成式分子设计
今天介绍苏黎世联邦理工大学Gisbert Schneider团队在nature machine intelligence 2020上发表的论文,该论文利用分子语言模型,结合三种优化方法,可以用少量分子作为数据集训练出一个分子生成模型。
DrugAI
2021/02/01
6100
Nat. Mach. Intell. | 少量数据的生成式分子设计
Front Pharmacol|基于图片段分子表示和深度进化学习的多目标药物设计
2022年7月4日,加拿大布鲁克大学Yifeng Li团队在Frontiers in Pharmacology期刊上发表一篇题为《Multi-Objective Drug Design Based on Graph-Fragment Molecular Representation and Deep Evolutionary Learning》的论文。论文将药物设计建模为一个多目标优化问题,将基于片段的连接树变分自编码器这一深度生成模型融入深度进化学习框架中,取得了良好的实验结果。
智药邦
2022/11/16
9480
Front Pharmacol|基于图片段分子表示和深度进化学习的多目标药物设计
AI提高从头设计的新化合物的可合成性
本文为《Artificial Intelligence in Drug Design》一书第17章的内容,作者是来自Biogen公司生物治疗学和药物学部门的Govinda Bhisetti和Cheng Fang。
智药邦
2022/04/13
1.2K0
AI提高从头设计的新化合物的可合成性
Front. Chem.|LigBuilder V3:一种多目标的从头药物设计方法
今天给大家介绍的是北京大学来鲁华课题组在frontiers in Chemistry上发表的文章《LigBuilder V3: A Multi-Target de novo Drug Design Approach》。在文章中,作者提出了第一个从头多靶点药物设计程序LigBuilderV3,可用于设计靶向结合多个受体、一个受体的多个结合位点或一个受体的各种构象的配体。为了证明LigBuilderV3的实用性,作者使用LigBuilderV3,并用三种不同的策略,包括多目标从头设计,多目标增长,和多目标连接,设计了靶向HIV蛋白酶和HIV逆转录酶的双功能抑制剂。设计出的化合物经过MM/GBSA结合自由能估计被验证为计算上有效,有较高的作为HIV蛋白酶和HIV逆转录酶的多靶点药物的潜力。LigBuilderV3程序可以在“http://www.pkumdl.cn/ligbuilder3/”上下载。
智能生信
2021/09/10
1.1K0
Front. Chem.|LigBuilder V3:一种多目标的从头药物设计方法
推荐阅读
相关推荐
Drug Discov Today综述|分子从头设计和生成模型
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档