Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Bioinformatics | GraphDTA: 基于图卷积网络预测药物-靶标结合亲和力

Bioinformatics | GraphDTA: 基于图卷积网络预测药物-靶标结合亲和力

作者头像
DrugAI
修改于 2021-02-02 03:30:31
修改于 2021-02-02 03:30:31
2K0
举报
文章被收录于专栏:DrugAIDrugAI

作者 | 马腾飞

1. 研究背景

现有的高通量筛选实验用于确定药物和靶标之间的生物活性是一个昂贵费时的步骤。因此,基于已经在临床实验中测量的相互作用,使用统计学和机器学习模型来估计新的药物-靶标的相互作用的强度是重要的替代方案。澳大利亚Deakin大学的Svetha Venkatesh课题组提出了GraphDTA,一种基于图神经网络的药物-靶标结合亲和力的预测方法。

2. 相关工作

2.1药物表征

发明了SMILES表示计算机可读的分子,开发了多个有效的应用程序,包括快速检索和子结构搜索。根据SMILES可以计算药物描述符用作预测亲和力的特征。可以将SMILES视为字符串使用自然语言处理(NLP)技术来强化药物,也可以视为1D表示,输入卷积神经网络(CNN)以学习模型来预测亲和性。

化学结构到SMILES字符串

SMILES可通过rdkit开源软件生成graph的形式,然后通过图卷积网络表示学习得到药物特征向量。

图形卷积网络(GCN)最流行的深度学习方法可用于药物-靶标结合亲和力的预测,GCN是卷积神经网络(CNN)到图结构数据的推广。GCN可分为两大类:基于谱的方法和基于空间的方法。基于谱的方法中,图首先在谱域中表示,然后在该域中定义卷积运算。相反,基于空间的方法直接在图空间域上执行学习算法。学习过程包括邻域公式,然后通过聚合来自其邻居节点的信息,然后是子采样任务来更新节点的信息。

2.2药物-靶标结合亲和力的预测

2.2.1亲和力相似度(SimBoost)

药物-靶标结合亲和力预测的任务可以被认为是协同过滤问题(CF)。对于药物- 靶标结合预测中可获得的亲和力通常是稀疏的。伴随着药物之间以及靶标之间的相似性,以在SimBoost中建立特征,这些特征是梯度增强机器的输入,以预测未知药物-靶标对的结合亲和力。

SimBoost算法预测过程

2.2.2基于内核(KronRLS)

可以从其他来源建立相似性而不是训练数据中的亲和力。鉴于问题是预测n种药物和m种靶标的亲和力,它们将有n * m种组合,并且核心的大小为(n * m)平方。为了加速模型训练,Cichonska等人建议使用KronRLS。

为了计算内核,可以使用任何相似性度量。药物的核心是基于Tanimoto的相似性构建的; 而对于目标,Smith-Waterman评分用作蛋白质序列的相似性度量。

2.2.3深度学习

提供药物(SMILES)和蛋白质(序列)的1D表示时,深度学习可能是预测亲和力的可能方法。

图中,input_1和input_2分别是药物和靶标。因此使用1D卷积和池的层来捕获输入中的潜在模式。然后将它们连接起来,通过Dropout的正则层发送,最后用训练亲和力回归。

3. 方法(GraphDTA)

通过将药物的特征带入药物-靶标相互作用的模型,研究人员提出了一种新的深度学习模型GraphDTA,用于药物-靶标亲和力预测。GraphDTA中基于药物的SMILES作为输入,通过开源软件RDKit构建药物的分子图并提取原子特征,将该图结构数据输入到GCN层中学习药物图特征表示中的潜在模式。然后将药物-靶标亲和力(DTA)预测问题转换为回归任务,其中输入是一对蛋白质和药物表示,并且输出是反映该对亲和力结合得分的连续值。

3.1化合物的图表示

化合物可描述为原子间相互作用的图。因此,以图表示的形式处理输入化合物,并随后在图上应用学习算法可以很好地适合任务。为此,对于每个输入化合物(SMILES),研究人员构建了反映化合物内原子之间相互作用的相应分子图。

3.2深入学习分子图

化合物以图的形式表示,问题是采用能够有效地从图结构化数据中学习的算法。最近在计算机视觉语音识别和自然语言处理中的深度卷积神经网络的成功导致了将卷积运算扩展到图结构的想法。已经提出了许多工作来处理将CNN概括为图形的两个主要挑战,即在数据点未被布置为欧几里德网格的图中形成感受域,以及用于对图进行下采样的池化操作。

GraphDTA模型

研究人员提出了一种新的DTA预测模型,该模型基于图神经网络和传统CNN的组合。模型采用两个输入:SMILES和蛋白质序列,并且并行地向前馈送它们以学习每个的表示向量,然后将两个潜在的特征向量连接起来并经历几个密集层,以回归层来估计亲和力值。

研究人员为了评估基于图神经网络方法的有效性,采用了多种图神经网络模型。包括GCN、GAT、GIN和GAT-GCN。通过修改图神经网络的模式来测试模型性能。

GAT与GAT-GCN模型图

4. 实验与结果

研究人员主要通过对比非深度学习模型与比较流行的深度学习模型,通过测量计算一致性指数CI(指示预测值与实际值的一致性)与均方误差MSE这两个指标来表示模型的好坏。为了使实验结果具有比较性,分别在Davis与Kiba数据集对模型进行测量。

Davis数据集模型测量结果

KIBA数据集模型测量结果

两种数据集中的测量结果都表示在基于GAT-GCN结合的图表示模型中预测性能最佳。

5. 结论

本项工作中,研究人员提出了一种计算药物-靶标结合亲和力的新方法,称为GraphDTA;旨在降低药物开发的难度,减少发现新药物靶标相互作用在时间与成本上的花费,缩短药物开发周期。该模型使用由SMILES数据重构得来的二维图结构数据,能够表达药物的较完整信息,因此该方法能够获得较好的预测性能。

Code availability

https://github.com/thinng/GraphDTA

参考资料

Thin Nguyen, Hang Le, Thomas P Quinn, Tri Nguyen, Thuc Duy Le, Svetha Venkatesh, GraphDTA: Predicting drug–target binding affinity with graph neural networks, Bioinformatics, , btaa921,

https://doi.org/10.1093/bioinformatics/btaa921

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5395521/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-12-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Bioinformatics丨GraphDTA用图神经网络预测药物靶点的结合亲和力
今天给大家介绍迪肯大学Thin Nguyen教授等人发表在Bioinformatics上的一篇文章 “GraphDTA: predicting drug–target binding affinity with graph neural networks” 。药物再利用可以避免昂贵和漫长的药物开发过程,估计新药物-靶标对相互作用强度的计算模型可加快药物的再利用,然而,以往的模型均是将药物表示为字符串,但这不是分子表示的合理方式,所以作者提出了一种新的GraphDTA模型,将药物表示为图,并使用图神经网络预测药物与靶点的亲和力。结果表明,图神经网络不仅比非深度学习模型更能预测药物靶点的亲和性,而且比其他深度学习方法更有效。
智能生信
2021/06/24
3.4K0
Bioinformatics丨GraphDTA用图神经网络预测药物靶点的结合亲和力
Chem. Sci.|MGraphDTA:基于深层多尺度图神经网络预测药物-靶标亲和力
药物发现和开发对制药业和患者具有巨大的潜在利益。预测药物-靶标亲和力 (DTA) 有利于加速药物发现。图神经网络 (GNN) 已广泛用于 DTA 预测。然而,现有的浅层 GNN 不足以捕捉化合物的全局结构。此外,基于图的 DTA 模型的可解释性高度依赖于图注意力机制,无法揭示分子中每个原子之间的全局关系。
DrugAI
2022/11/28
8190
Chem. Sci.|MGraphDTA:基于深层多尺度图神经网络预测药物-靶标亲和力
南开大学卫金茂团队提出新的药物相似度建模方法,通过药物结构包含相似度(SIS)进行药物靶标结合亲和力预测
探索药物和靶标之间的联系是药物发现和重新利用的必要条件。与传统方法将药物的探索视为一种二元分类任务相比,预测药物与靶标的结合亲和力可以提供更具体的信息。许多研究都是基于类似药物可能与相同靶标相互作用的假设。这些方法根据无向药物相似度或靶标相似度构造对称图。虽然这些相似性可以测量两个分子之间的差异,但无法分析其子结构的包含关系。例如,如果药物A包含药物B的所有子结构,那么在图神经网络的消息传递机制中,药物A应该获得药物B的所有性质,而药物B应该只获得药物A的部分性质。
智药邦
2024/10/29
2540
南开大学卫金茂团队提出新的药物相似度建模方法,通过药物结构包含相似度(SIS)进行药物靶标结合亲和力预测
Brief Bioinform|跨尺度图对比学习预测药物靶点结合亲和力
2024年1月13日,西北工业大学尚学群教授、彭佳杰教授团队,在Briefings in Bioinformatics上发表文章Predicting drug–target binding affinity with cross-scale graph contrastive learning。
智药邦
2024/03/19
4310
Brief Bioinform|跨尺度图对比学习预测药物靶点结合亲和力
Int J Mol Sci|CSatDTA:带自注意力机制的卷积模型预测药物-靶标亲和力
2022年7月14日,韩国全北国立大学电子与信息工程系的Kil To Chong研究团队和美国得克萨斯大学达拉斯分校生物科学系的Zhenyu Xuan研究团队在期刊International Journal of Molecular Sciences上合作发表一篇论文《CSatDTA: Prediction of Drug–Target Binding Affinity Using Convolution Model with Self-Attention》。本论文仅使用药物的SMILES和蛋白质的序列信息、借助注意力机制增强的卷积网络来预测药物-靶标亲和力,得到了较好的效果。作者还提供了一个Web服务器供研究者使用。
智药邦
2022/11/16
5620
Int J Mol Sci|CSatDTA:带自注意力机制的卷积模型预测药物-靶标亲和力
Nat. Mach. Intell. | 利用图网络发现蛋白质与配体相互作用关键点
今天为大家介绍的是来自Jürgen Bajorath团队的一篇论文。图神经网络(GNNs)通过分析蛋白质与配体相互作用的图表示结构来预测配体的亲和力。虽然有一些研究表明GNNs能够详细了解蛋白质与配体的相互作用,但这种预测方法也存在争议。比如,有证据显示GNNs可能并不是真正学习蛋白质与配体的相互作用,而是仅仅记住了训练数据中的配体和蛋白质信息。为此作者对六种不同的GNN架构进行了亲和力预测实验,并使用可解释的人工智能技术对结果进行了分析。
DrugAI
2024/01/17
7700
Nat. Mach. Intell. | 利用图网络发现蛋白质与配体相互作用关键点
BIBM | AttentionDTA -- 使用注意力模型预测药物-药靶结合亲和力
今天给大家带来的是发表在BIBM上的文章“AttentionDTA: prediction of drug–target binding affinity using attention model”。在本文中,作者提出了一种基于深度学习的端到端模型AttentionDTA,该模型将注意力机制与DTI的绑定亲和力相关联,以预测DTI的绑定亲和力。这项工作的新颖之处在于,在预测蛋白质的亲和力时,使用注意机制来考虑蛋白质中的哪些子序列对药物更重要,以及药物中的哪些子序列对蛋白质更重要。从而使模型的表现力更强。该模型利用一维卷积神经网络(1D-CNNs)提取药物和蛋白质的抽象信息,通过注意机制使药物和蛋白质的表征相互适应。
智能生信
2021/03/03
2.5K0
BIBM | AttentionDTA -- 使用注意力模型预测药物-药靶结合亲和力
LigUnity:蛋白质-配体亲和力预测大模型,虚拟筛选与先导化合物优化双管齐下
蛋白质与配体相互作用的研究是理解药物疗效和推动分子设计的关键。蛋白质-配体亲和力,即潜在药物分子与靶点蛋白结合的强度,直接影响药物筛选和优化的效果。在药物研发的早期阶段,虚拟筛选(Virtual Screening, VS)用于从大规模化学库中识别能够结合特定蛋白的活性化合物,而先导化合物优化(Hit-to-Lead Optimization, HLO)则聚焦于提升这些化合物的结合亲和力和药理特性。
实验盒
2025/02/27
2750
LigUnity:蛋白质-配体亲和力预测大模型,虚拟筛选与先导化合物优化双管齐下
Survey | 基于图卷积网络的药物发现方法
本期介绍2019年6月发表在Briefings in Bioinformatics的综述,该综述由康奈尔大学等机构的研究人员撰写,系统总结了GCN及其在药物发现方面的最新进展,重点是与药物相关的应用;在图形卷积原理部分提供图卷积的理论支持和GCN的详细架构及其在药物发现中的应用并讨论了当前方法之外的挑战和可能性。
DrugAI
2021/02/01
1.1K0
Survey | 基于图卷积网络的药物发现方法
图卷积网络 (GCN) 的高层解释
图的独特功能可以捕获数据之间的结构关系,从而比孤立地分析数据可以获得更多的洞察力。图是最通用的数据结构之一。它们自然出现在许多应用领域,从社会分析、生物信息学到计算机视觉。
deephub
2021/07/27
1K0
【Briefings in Bioinformatics】四篇好文简读-专题29
BERT6mA: prediction of DNA N6-methyladenine site using deep learning-based approaches 论文摘要:
智能生信
2022/10/05
5170
【Briefings in Bioinformatics】四篇好文简读-专题29
BIB | 基于图卷积网络和深度神经网络的药物靶点相互作用识别
今天为大家介绍的是哈尔滨工业大学计算机科学与技术学院臧天仪教授等人发表在Briefings in Bioinformatics上的文章“Identifying drug–target interactions based ongraph convolutional network and deep neural network”。识别新的药物靶点相互作用(DTIs)是药物发现中一个重要但耗时且昂贵的步骤。然而,现有的方法大多是分别构建药物网络和靶点网络,然后根据已知的药物和靶点之间的关联来预测新的DTI,而没有考虑药物-蛋白质对之间的关联(DPP)。为了将DPP纳入到DTI建模中,本文构建了一个基于多种药物和蛋白质的DPP网络,以DPP为节点,DPP之间的关联为网络的边缘。然后,提出了一个新的基于深度学习的框架:图卷积网络DTI预测框架(GCN-DTI)用于新的药物-靶点相互作用识别。
智能生信
2021/05/17
1.8K0
BIB | 基于图卷积网络和深度神经网络的药物靶点相互作用识别
GNN 模型在生物化学和医疗健康中的典型应用
例如,分子和化合物可以自然地表示为以原子为节点、以键为边的图。蛋白质相互作用(Protein-ProteinInteractions,PPI)记录了两个或多个蛋白质之间的物理联系, 这种联系可以很自然地用图的形式表示。
博文视点Broadview
2021/07/05
9110
ACS Omega|基于多特征提取和融合的深度药物-靶点结合亲和力预测方法
药物-靶点结合亲和力(DTA, Drug-Target Binding Affinity)预测是药物研发中的重要课题之一。它不仅决定了药物与靶点之间的相互作用强度,还对药物筛选、优化和临床应用具有重要指导意义。然而,由于药物化合物和潜在靶点数量庞大,通过生物实验全面测量DTA既费时又费力。因此,开发高效准确的计算方法来预测DTA值成为当务之急。
智药邦
2025/02/05
2050
ACS Omega|基于多特征提取和融合的深度药物-靶点结合亲和力预测方法
CELL SYST|多目标神经网络框架预测化合物-蛋白相互作用和亲和力
这次给大家介绍清华大学交叉信息研究院的曾坚阳教授课题组在Cell Systems上发表的论文“MONN: A Multi-objective Neural Network for Predicting Compound-Protein Interactions and Affinities”。分析化合物与蛋白质的相互作用 (Compound-Protein Interactions ,CPIs)在药物研发过程中起着至关重要的作用,迅速准确地预测作用位点和其间的亲和力有利于高效的药物研发。基于此问题,曾坚阳教授课题组引入深度学习,提出了一种预测化合物-蛋白相互作用和亲和力的多目标神经网络-MONN。作者在方法中引入了(i)捕获全局特征的超级节点、(ii)预测亲和力的GRU模块(Gate Recurrent Unit,门循环单元模型)、(iii)预测化合物-蛋白结合位点和判断其间的亲和力指标的多目标共享特征结构,使得其模型具有比现有模型更好的特征可解释性,有效捕捉了化合物与蛋白质的内在特征与联系,实现精确判断分子间的相互作用和亲和力。
智能生信
2021/02/04
1.1K0
npj Digit. Med. | 基于绑定位点接触图的双模态神经网络助力药物靶点亲和力预测
今天为大家介绍的是来自北京大学化学基因组学重点实验室、化学生物学与生物技术学院陈语谦团队发表在数字医学领域顶级期刊npj Digital Medicine(IF=12.4,中科院一区Top)的论文,研究生何昊淮为第一作者。研究人员在药物靶点亲和力预测领域取得重大突破,该团队开发了一种新型的双模态图神经网络模型DMFF-DTA,能够利用绑定位点接触图,准确预测药物与靶点蛋白之间的结合亲和力,这一成果有望加速药物研发进程。
DrugAI
2025/02/18
1960
npj Digit. Med. | 基于绑定位点接触图的双模态神经网络助力药物靶点亲和力预测
Nat. Comput. Sci. | 通过结合比较网络计算配体的相对亲和力
今天为大家介绍的是来自Xutong Li, Xiaomin Luo和Mingyue Zheng团队的一篇论文。先导化合物优化是药物发现领域的一个关键挑战。目前,这一领域大部分还是依赖于假设和药物化学家的先前经验。作者为了应对这一挑战,提出了一种基于物理信息图注意力机制的配对结合比较网络(PBCNet),专门用于对同类配体的相对结合亲和力进行排名。通过在两个独立数据集上的基准测试, PBCNet在预测准确性和计算效率方面都显示出了显著的优势。
DrugAI
2024/01/19
2260
Nat. Comput. Sci. | 通过结合比较网络计算配体的相对亲和力
【Bioinformatics】四篇好文简读-专题1
Subtype-GAN: a deep learning approach for integrative cancer subtyping of multi-omics data
智能生信
2021/10/08
7710
【Bioinformatics】四篇好文简读-专题1
赠书 | GNN 模型在生物化学和医疗健康中的典型应用
计算生物化学和医疗健康的数据常常通过图来表示。 例如,分子和化合物可以自然地表示为以原子为节点、以键为边的图。蛋白质相互作用(Protein-ProteinInteractions,PPI)记录了两个或多个蛋白质之间的物理联系, 这种联系可以很自然地用图的形式表示。 此外,在制药行业中,药物相互作用(Drug-Drug Interactions,DDI)描述了在使用不同药物组合治疗复杂疾病时的不良结果,这种相互作用也可以用图来表示。 图神经网络模型具有强大的图表示学习能力,已被应用于许多生物化学和医疗健康应
AI科技大本营
2023/05/08
1470
赠书 | GNN 模型在生物化学和医疗健康中的典型应用
阿斯利康团队用具有域适应性的可解释双线性注意网络改进了药物靶标预测
编辑 | 萝卜皮 预测药物-靶标相互作用是药物发现的关键。近期,虽然基于深度学习的方法显示出强有力的性能,但是仍然存在两个挑战:如何明确地建模和学习药物和目标之间的局部相互作用以更好地预测和解释,以及如何优化新药物-目标对预测的泛化性能。 英国谢菲尔德大学(The University of Sheffield)和阿斯利康的研究人员合作开发了 DrugBAN,这是一个深度双线性注意网络(BAN)框架,具有域适应性,可以显式学习药物和目标之间的成对局部相互作用,并适应分布外的数据。 DrugBAN 对药物分
机器之心
2023/02/23
5160
阿斯利康团队用具有域适应性的可解释双线性注意网络改进了药物靶标预测
推荐阅读
Bioinformatics丨GraphDTA用图神经网络预测药物靶点的结合亲和力
3.4K0
Chem. Sci.|MGraphDTA:基于深层多尺度图神经网络预测药物-靶标亲和力
8190
南开大学卫金茂团队提出新的药物相似度建模方法,通过药物结构包含相似度(SIS)进行药物靶标结合亲和力预测
2540
Brief Bioinform|跨尺度图对比学习预测药物靶点结合亲和力
4310
Int J Mol Sci|CSatDTA:带自注意力机制的卷积模型预测药物-靶标亲和力
5620
Nat. Mach. Intell. | 利用图网络发现蛋白质与配体相互作用关键点
7700
BIBM | AttentionDTA -- 使用注意力模型预测药物-药靶结合亲和力
2.5K0
LigUnity:蛋白质-配体亲和力预测大模型,虚拟筛选与先导化合物优化双管齐下
2750
Survey | 基于图卷积网络的药物发现方法
1.1K0
图卷积网络 (GCN) 的高层解释
1K0
【Briefings in Bioinformatics】四篇好文简读-专题29
5170
BIB | 基于图卷积网络和深度神经网络的药物靶点相互作用识别
1.8K0
GNN 模型在生物化学和医疗健康中的典型应用
9110
ACS Omega|基于多特征提取和融合的深度药物-靶点结合亲和力预测方法
2050
CELL SYST|多目标神经网络框架预测化合物-蛋白相互作用和亲和力
1.1K0
npj Digit. Med. | 基于绑定位点接触图的双模态神经网络助力药物靶点亲和力预测
1960
Nat. Comput. Sci. | 通过结合比较网络计算配体的相对亲和力
2260
【Bioinformatics】四篇好文简读-专题1
7710
赠书 | GNN 模型在生物化学和医疗健康中的典型应用
1470
阿斯利康团队用具有域适应性的可解释双线性注意网络改进了药物靶标预测
5160
相关推荐
Bioinformatics丨GraphDTA用图神经网络预测药物靶点的结合亲和力
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档