Relay Therapeutics是著名的AI药物研发公司,本文整理了其在2020-2022年期间发表的13篇AI药物研发相关学术文章的主要内容。
符号密度函数的演化
Ma H, Narayanaswamy A, Riley P, Li L. Evolving symbolic density functionals. Sci Adv. 2022 Sep 9;8(36):eabq0279.
doi: 10.1126/sciadv.abq0279.
系统地开发准确的密度函数一直是科学家们几十年来面临的挑战。
尽管机器学习在近似函数方面的应用不断涌现,但所得到的ML函数通常包含数万个以上的参数,导致与传统的人类设计的符号函数在表述上存在巨大差距。本文提出了一个新的框架,即符号功能进化搜索(SyFES),它能以符号形式自动构建准确的函数,与其他ML函数相比,它更容易被人类解释,评估成本更低,也更容易集成到现有代码中。
SyFES框架的工作流程
本文首先表明,在没有先验知识的情况下,SyFES从头开始重构了一个已知的函数。然后证明,从现有的函数ωB97M-V演化而来,SyFES发现了一个新的函数GAS22(Google Accelerated Science 22),它对Main Group Chemistry Database(MGCDB84)测试集中的大多数分子类型表现得更好。本文的框架为利用计算能力来系统地开发符号密度函数开辟了一个新的方向。
库合成:构建块的选择、处理和跟踪
Billings KJ, Grenier-Davies MC. Library Synthesis: Building Block Selection, Handling, and Tracking. Methods Mol Biol. 2022;2541:1-11.
doi: 10.1007/978-1-0716-2545-3_1.
本文为Springer推出的新书《DNA-Encoded Chemical Libraries》中的一章。
仔细选择和操作小分子构建块对DNA编码库(DNA-encoded library)的成功至关重要。构建块的选择会影响到选择试验所产生的hits的质量,而适当的样品处理和跟踪可以确保后续的合成工作是在适当的合成路线图下完成的。这一章概述了构建块选择的可能策略,以及处理和跟踪用于验证和库合成的样品的最佳做法。
CACHE:一个公私合营的基准倡议,以促进寻找hit的计算方法的发展
Ackloo S, Al-Awar R, Amaro RE,etal. CACHE (Critical Assessment of Computational Hit-finding Experiments): A public-private partnership benchmarking initiative to enable the development of computational methods for hit-finding. Nat Rev Chem. 2022 Apr;6(4):287-295.
doi: 10.1038/s41570-022-00363-z.
计算化学的一个理想目标是预测任何蛋白质的有效和类药的结合物。本文描述了由多家顶尖药企和学术机构发起的CACHE项目(Critical Assessment of Computational Hit-finding Experiments,计算性hit实验的关键评估),这是一个公共基准项目,旨在通过预测和实验测试的循环来比较和改进小分子hit发现算法。
参与者将被要求为新的和生物相关的蛋白质靶点预测小分子结合物。预测的化合物将在一个实验中心进行严格的测试,所有预测的结合物以及所有的实验筛选数据,包括实验测试的化合物的化学结构,都将公开提供,并且不受任何知识产权限制。
CACHE将对一系列计算方法寻找新型结合物的能力进行评估、比较,并公开发表。CACHE每年将启动3个新的基准测试工作。CACHE将得出更好的预测方法、对基础生物学或药物发现具有重要意义的靶点蛋白的新的小分子结合物,以及朝着实现Target 2035的目标迈出的重要技术步骤,这是一个为所有人类蛋白确定药理学探针的全球倡议。
定义化学设计自动化的水平
Goldman B, Kearnes S, Kramer T, Riley P, Walters WP. Defining Levels of Automated Chemical Design. J Med Chem. 2022 May 26;65(10):7073-7087.
doi: 10.1021/acs.jmedchem.2c00334.
药物发现中计算方法的一个应用领域是小分子的自动设计。尽管有大量的出版物描述了各种方法及其在回顾性和前瞻性研究中的应用,但在区分这些不同系统的术语和关键属性方面却缺乏一致意见。
我们引入了自动化化学设计(ACD)等级,以明确定义沿着构思和决策轴的自主水平。为了充分说明这个框架,我们提供了文献案例,并将一些著名的方法和应用归入这些层次。ACD框架为描述自动化小分子设计系统提供了一种通用的语言,使药物化学家能够更好地理解和评估这种系统。
详细内容见本公众号文章 JMC|化学设计自动化的不同等级和相关案例
激酶变构抑制原理和口袋验证
Pan Y, Mader MM. Principles of Kinase Allosteric Inhibition and Pocket Validation. J Med Chem. 2022 Apr 14;65(7):5288-5299.
doi: 10.1021/acs.jmedchem.2c00073.
对于几种已上市的药物,激酶的变构抑制已转化为与正生抑制(orthosteric inhibition)相当的药理作用和临床益处。然而,尽管20多年来付出了很多努力,但与FDA批准的变构药物相关的激酶靶点数量有限,这表明识别和验证变构抑制剂存在挑战。本文综述了变构抑制的原理,总结了变构MEK1/2和BCR-ABL1抑制剂的发现,并讨论了筛选和证明变构口袋配体功能活性的方法。
详细内容见本公众号文章 激酶变构抑制原理及口袋验证
开放式反应数据库
Kearnes SM, Maser MR, Wleklinski M, Kast A, Doyle AG, Dreher SD, Hawkins JM, Jensen KF, Coley CW. The Open Reaction Database. J Am Chem Soc. 2021 Nov 17;143(45):18820-18826.
doi: 10.1021/jacs.1c09820.
期刊文章、专利甚至电子实验室笔记本中的化学反应数据目前以各种格式存储,通常是非结构化的,这对下游应用(包括机器学习模型的训练)构成了重大障碍。
我们介绍了开放式反应数据库(ORD),这是一种开放访问模式和基础设施,用于构建和共享有机反应数据,包括集中式数据存储库。ORD模式支持传统和新兴技术,从台式反应到自动化高通量实验和流动化学。数据、架构、支持代码和基于 Web 的用户界面都在 GitHub 上公开提供。我们的愿景是,支持数据共享的一致数据表示和基础设施将使下游应用程序能够大大改善计算机辅助合成规划、反应预测和其他预测化学任务。
详细内容见本公众号文章 JACS|一种支持机器学习的开源化学反应数据库
计算机辅助化学发现循环
ORD概览
比较分类模型:实用教程
虽然机器学习模型已成为化学信息学的中流砥柱,但该领域尚未就模型评估和比较的标准达成一致。在许多情况下,作者通过执行多次交叉验证并报告评估指标的平均值(例如受试者工作特征下的面积)来比较方法。这些平均值的比较通常缺乏统计严谨性,并可能导致不准确的结论。为了鼓励最佳实践,本教程提供了一个示例,说明如何以统计上严格的方式比较多种方法。
药物发现中人工智能的批判性评估
Walters WP, Barzilay R. Critical assessment of AI in drug discovery. Expert Opin Drug Discov. 2021 Sep;16(9):937-947.
doi: 10.1080/17460441.2021.1915982.
人工智能使药物发现的多个方面成为可能,包括高通量筛选数据的分析,以及新分子的设计和合成。本文概述了人工智能在与药物发现相关的几个领域的应用,包括特性预测、分子生成、图像分析和有机合成规划。
虽然现在常规使用各种机器学习方法来预测生物活性和ADME特性,但分子表征的方法仍在不断发展。分子生成方法相对较新且未经证实,但有可能进入新的、未开发的化学空间领域。人工智能在药物发现中的应用将继续受益于专门的研究,以及其他领域的人工智能发展。随着这种配对算法的进步和高质量的数据的出现,人工智能在药物发现中的影响将在未来几年继续增长。
深度学习在分子生成和分子性质预测中的应用
Walters WP, Barzilay R. Applications of Deep Learning in Molecule Generation and Molecular Property Prediction. Acc Chem Res. 2021 Jan 19;54(2):263-270.
doi: 10.1021/acs.accounts.0c00699.
本文将重点讨论深度学习对分子设计产生影响的两个关键领域:分子特性的预测和新分子的从头生成。在QSARs的发展中,最重要的进展之一是将深度学习方法应用于预测药物发现项目中分子的生物活性和物理特性。研究人员现在不是采用通常用于建立预测模型的专家衍生的化学特征,而是使用深度学习来开发新的分子表征。这些表征,再加上深度神经网络发现复杂的非线性关系的能力,已经推动了最先进的性能。
虽然深度学习已经改变了许多研究人员接近QSARs的方式,但它不是万能的。与其他机器学习任务一样,预测模型的设计也取决于可用数据的质量、数量和相关性。看似基本的问题,如创建训练集的最佳方法,仍然是该领域的公开问题。另一个关键领域仍然是多个研究工作的主题,即开发评估模型信心的方法。
深度学习也促进了新分子生成应用的复兴。深度学习方法不是依靠人工定义的启发式方法,而是学习在现有分子集的基础上生成新分子。最初为图像生成和语言翻译等领域开发的技术已被改编为分子的生成。这些深度学习方法已经与上述的预测模型相结合,并被用来生成具有特定预测生物活性特征的新分子。虽然这些生成算法看起来很有希望,但只有少数关于基于生成模型提出的设计的分子合成和测试的报告。对生成模型产生的分子的多样性、质量和最终价值的评估仍然是一个开放的问题。
虽然该领域已经产生了一些基准,但还没有就如何最终评估算法"发明"的分子达成一致。
用于生成建模的自动编码器架构的示意图
虚拟筛选新趋势
Walters WP, Wang R. New Trends in Virtual Screening. J Chem Inf Model. 2020 Sep 28;60(9):4109-4111.
doi: 10.1021/acs.jcim.0c01009.
本文是New Trends in Virtual Screening特刊的一部分。
在过去的20年里,虚拟筛选已经成为工业和学术界药物发现的一个重要组成部分。尽管文献中包含了许多成功的虚拟筛选活动的例子,但该领域仍在继续发展并应对新的挑战。在这个特刊中,我们介绍了二十多篇文章,包括研究文章、应用笔记、观点和看法,涵盖了虚拟筛选的各个关键方面。一个显著的重点是新方法的开发,作者描述了从机器学习到基于物理学的方法等一系列广泛的方法。还介绍了用于方法验证的新方法和数据集,以及虚拟筛选的案例研究。
评估生成式人工智能对药物化学的影响
Walters WP, Murcko M. Assessing the impact of generative AI on medicinal chemistry. Nat Biotechnol. 2020 Feb;38(2):143-145.
doi: 10.1038/s41587-020-0418-2.
近年来,开发和部署各种计算方法以支持药物发现的尝试已经加速。然而新颖的计算方法需要严格的评估,以确定它们在现实世界药物发现环境中的真正用途。新方法往往在没有足够文件的情况下公开,因此很难或不可能进行这种客观的评估。
在本文中,Relay Therapeutics的Patrick Walters讨论了来自默克和英矽智能的两个分子案例。并建议发表生成模型和相关研究结果的期刊联合起来,为披露人工智能方法产生的分子的论文制定一套指导方针。
D3R Grand Challenge 4:盲目预测蛋白质-配体的位置、亲和力排名和相对结合自由能
Parks CD, Gaieb Z, Chiu M, Yang H, Shao C, Walters WP, Jansen JM, McGaughey G, Lewis RA, Bembenek SD, Ameriks MK, Mirzadegan T, Burley SK, Amaro RE, Gilson MK. D3R grand challenge 4: blind prediction of protein-ligand poses, affinity rankings, and relative binding free energies. J Comput Aided Mol Des. 2020 Feb;34(2):99-119.
doi: 10.1007/s10822-020-00289-y.
药物设计数据资源(Drug Design Data Resource,D3R)旨在通过盲目的配体姿势预测和亲和力挑战,确定计算机辅助药物设计的最佳实践方法。在此,我们报告了Grand Challenge 4(GC4)的结果。GC4的重点是蛋白质β分泌酶1和猫头鹰蛋白酶S,其运行方式与之前的挑战类似。在第一阶段,评估了参与者预测BACE1配体的位置和亲和力的能力。第一阶段结束后,所有的BACE1共晶体结构被公布,第二阶段测试了共晶体结构的亲和力排名。我们对结果进行了分析,并讨论了对确定的最佳实践方法的见解。
重新思考人工智能时代的药物设计
Schneider P, Walters WP, Plowright AT, Sieroka N, Listgarten J, Goodnow RA Jr, Fisher J, Jansen JM, Duca JS, Rush TS, Zentgraf M, Hill JE, Krutoholow E, Kohler M, Blaney J, Funatsu K, Luebkemann C, Schneider G. Rethinking drug design in the artificial intelligence era. Nat Rev Drug Discov. 2020 May;19(5):353-364.
doi: 10.1038/s41573-019-0050-3.
人工智能工具正越来越多地被应用于药物发现。虽然一些主角指出了这些工具可能提供的巨大机会,但其他人仍然持怀疑态度,等待在药物发现项目中显示出明显的影响。
现实情况可能介于这两个极端之间,但很明显,人工智能不仅为相关科学家提供了新的挑战,也为生物制药业及其发现和开发新药的既定流程提供了新的挑战。本文介绍了一组不同的国际专家对利用人工智能进行小分子药物发现的"重大挑战"以及应对这些挑战的方法的看法。