作者 | 罗潇澧 审稿 | 程玉

大家好,今天给大家介绍的是来自匹兹堡大学生物科学系的Green和Durruant近日发表在JCIM2021上的论文。在该论文中,作者发布了一个基于深度学习的小分子配体先导优化开源网页应用——DeepFrag,用户可通过图形化界面进行小分子的先导优化计算,且可以直接在浏览器上运行。
1
背景介绍
药物发现是一个成本高昂且耗时的过程。在药物发现前期,研究人员试图找到能够初步抑制某些疾病关联蛋白的苗头化合物。但这些化合物必须经过先导优化,包括添加或交换某些化学部分,旨在提高化合物的结合亲合力或其他与吸收、分布、代谢、排泄和毒性有关的化学性质(ADMET)。而计算机辅助药物设计(CADD)能够加速前期的这些研究。例如,作者团队最近开发了基于3D卷积神经网络的模型DeepFrag来进行更进一步的先导优化,不幸的是,基于深度学习的模型对于非计算机专业研究者并不友好。
为了追求更高的易用性,作者开发了名为DeepFrag的网页应用,为对编程不太熟悉的研究人员提供了图形化的界面,利用本地资源即可运行DeepFrag进行CADD的研究。
2
DeepFrag模型
(1)数据及处理
训练数据集为Binding MOAD,其中包括38,702个受体/配体复合物的实验结构数据。在预处理步骤中,作者需要将Binding MOAD的受体/配体复合物数据重新划分为由(receptor/parent,fragment)形式的元组组成的新数据集。其中,parent和fragment是配体的拆分形式。
(2)模型架构
DeepFrag模型由数个3D卷积模型块组成,数据流在经过激活函数sigmoid后计算出一个2048位的分子指纹。
(3)实验结果
在对模型进行超参数的调整后,得到下表所展示的实验结果。
表1 DeepFrag实验结果

可以看到DeepFrag在测试集上,Top-64的结果能达到70%以上的精度。作者认为,虽然DeepFrag没有预测到正确的片段,但所预测的片段实际上很可能会是更好的先导优化选择。
3
DeepFrag网页应用
DeepFrag操作步骤主要分为三个部分:设置参数,计算,结果反馈,具体如下图3-1所示。

图3-1 DeepFrag网页操作步骤
a) 设置参数:用户首先需要指定receptor和ligand(如上图3-1-a所示);
b) 分子视图:接下来用户可以对ligand进行进一步的操作和修改,包括可以删除原子以及指定连接节点(如上图3-1-b所示);
c) 预测:点击Start DeepFrag按钮,就可以在本地对新的fragment进行预测了(如上图3-1-c所示);
d) 结果:计算后得到的结果将会以表格的形式反馈到用户界面,用户可以很方便的查看和下载对应文件(如上图3-1-d,e所示)。
参考资料
Green, H.; Koes, D. R.; Durrant, J. D. DeepFrag: A Deep Convolutional Neural Network for Fragment-based Lead Optimization. bioRxiv, 2021.
https://doi.org/10.1039/D1SC00163A
Green, H.; Durrant, J. D. DeepFrag: An Open-Source Browser App for Deep-Learning Lead Optimization. J. Chem. Inf. Model.2021.
https://doi.org/10.1021/acs.jcim.1c00103
DeepFrag网页应用
http://durrantlab.com/deepfrag
应用源代码
http://git.durrantlab.com/jdurrant/deepfrag-app
模型源代码
https://git.durrantlab.pitt.edu/jdurrant/deepfrag