前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nat. Comput. Sci. | MISATO:蛋白质-配体复合物的机器学习数据集用于基于结构的药物发现

Nat. Comput. Sci. | MISATO:蛋白质-配体复合物的机器学习数据集用于基于结构的药物发现

作者头像
DrugAI
发布于 2024-06-05 10:24:22
发布于 2024-06-05 10:24:22
3230
举报
文章被收录于专栏:DrugAIDrugAI

DRUGAI

今天为大家介绍的是来自Grzegorz M. Popowicz团队的一篇论文。LLM极大地增强了人们理解生物学和化学的能力,但基于结构的药物发现、量子化学和结构生物学的健全方法仍然稀缺。对于大型语言模型来说,精确的生物分子-配体相互作用数据集是迫切需要的。为了解决这个问题,作者提出了MISATO,一个结合了小分子的量子力学性质和大约20,000个实验蛋白质-配体复合物的分子动力学模拟的数据集,并对实验数据进行了广泛验证。从现有的实验结构出发,使用半经验量子力学系统地优化这些结构。数据集中包含了大量蛋白质-配体复合物在显式水中的分子动力学轨迹,累计超过170微秒。作者提供了机器学习基线模型的示例,证明了使用作者的数据可以提高准确性。数据集可通过https://github.com/t7morgen/misato-dataset获得。

近年来,人工智能(AI)预测在许多科学领域引发了革命。在结构生物学中,AlphaFold2仅通过氨基酸序列就能预测出准确的蛋白质结构,其准确性接近最先进的实验数据。AlphaFold2的成功得益于一个包含近20万个蛋白质结构的丰富数据库,这些结构存储在蛋白质数据库(PDB)中,并可供使用。这些结构是通过X射线晶体学、核磁共振(NMR)或冷冻电子显微镜在过去几十年中确定的。尽管投入巨大,每年批准的新药数量仍然很少,研发成本达到数十亿美元。一个持续的重大挑战是基于结构的药物发现(Drug Discovery,DD)。与蛋白质结构预测相比,这项任务要困难得多。引入AI到这一过程仍处于早期阶段。AI方法原则上能够学习描述实验数据的基本状态变量。因此,它们可能会从电子和基于力场的蛋白质-配体复合物描述中抽象出来。然而,到目前为止,提出的多为简单解决方案,并未充分利用现有的蛋白质-配体数据,如评分蛋白质-配体吉布斯自由能(Gibbs free energies)、ADME(吸收、分布、代谢和排泄)属性估计或合成路径预测。这些方法大多数是使用一维的SMILES(简化分子线性输入系统)构建的,只有少数方法恰当地解决三维生物分子-配体数据。

作者在本篇中提出了一个实验验证过的蛋白质-配体结构的数据库MISATO(molecular interactions are structurally optimized,分子相互作用结构优化)。作者展示了该数据库有助于更好地训练与药物发现及其他领域相关的模型,包括量子化学、通用结构生物学和生物信息学。作者提供基于量子化学的结构整理和优化,包括配体几何结构的正则化。作者为数据库补充了缺失的动态和化学信息,包括在时间尺度上允许检测某些系统的瞬态和隐蔽状态的分子动力学模拟。这些对于成功的药物设计非常重要。因此,作者用尽可能多的物理参数补充实验数据,减轻AI模型隐式学习所有这些信息的负担,从而集中于主要的学习任务。MISATO数据库提供用户友好的格式,可以直接导入机器学习代码。作者还提供了各种预处理脚本来筛选和可视化数据集,提供了AI基线模型示例,这些示例包含计算量子化学性质(化学硬度和电子亲和力)、结合亲和力计算、蛋白质柔性或诱导契合特征预测。这些量子力学(QM)、分子动力学(MD)和AI基线模型在实验数据上进行了广泛验证。作者希望将MISATO转变为一个雄心勃勃的社区项目,对整个药物发现领域产生深远影响。

数据集描述

图 1

MISATO(图1)的基础是从PDBbind中提取的19,443个蛋白质-配体结构。这些结构是在过去几十年中通过实验确定的,代表了一个多样化的蛋白质-配体复合物集合,并且都有实验亲和力数据。在AI用于药物发现的背景下,将模型训练在一个尽可能正确和一致的数据集上至关重要,原因有几个。首先,可用结构的总数量远低于其他AI目标的典型训练规模。其次,在分子识别过程中,配体结合具有相当复杂的能量景观。蛋白质-配体结构或原子参数的微小偏差可以显著影响结合。在PDB中,错误的原子分配和不一致的几何形状并不少见。更严重的是,氢原子对其化学和分子环境高度敏感,并且很少能通过实验获得。作者在工作中系统地解决了所有这些问题,并将其编入数据库中。

基于量子力学的配体整理评估

图 2

按照补充部分第6节定义的方案,作者修改了总计3,930个结构,大约占原数据库20%的结构需要进行大量优化(图2)。其中,有3,905个案例涉及质子化状态的变化,而97个配体涉及杂原子的变化。这些变化主要是添加模型功能基团以模拟与蛋白质的共价结合(20个)或添加缺失的羟基到硼酸中。

一些配体被分割成多个分子,因为原始结构不是二元的蛋白质-配体复合物(一个配体):1A0T、1G42、1G9D、2L65、3D4F和4MNV。1E55被认为是两个实体的混合物。然而,它们之间的最近接触不足以将它们单独考虑,但也太大,无法形成共价相互作用。类似的考虑适用于1F4Y,尽管这里涉及的是近距离分子内接触。在4AW8中,作者观察到发布的配体PG6有显著变形。作者发现参考亲和力与系统中的金属离子Zn(ii)有关,而不是与PG6有关,因此该结构被排除在外。

如图2所示,最常见的调整是从初始PDBbind几何结构中去除氢原子,这占了几乎75%的修改。有人指出,诸如PDBbind这样的库在结合构型方面存在偏重的数据集。

分子动力学模拟

图 3

实验结构数据是静态快照,假定其代表在晶体中捕获的热力学最稳定状态,但忽略了构象动态的存在。从纳秒到毫秒时间尺度,生物大分子动态的实验描述是具有挑战性的,需要结合不同的光谱技术。NMR光谱和基于荧光的方法可以提供相关信息,但耗时较长,而且到目前为止,公共数据库中未能很好地捕捉到动态信息。可以从实验结构出发进行MD模拟,让它们随时间演变,使用描述分子势能面的力场。通常情况下,可以针对单个系统实现纳秒到微秒的时间段,具体取决于系统大小。MD轨迹允许分析蛋白质-配体复合物的小范围结构波动,但在某些情况下,也可以观察到大规模的罕见事件(图3)。在现有的药物发现软件中,这些事件大多被忽略了。

图 4

作者这里对16,972个显式水中的蛋白质-配体复合物进行了10纳秒的MD模拟。遇到非标准配体原子或蛋白质起始结构不一致的情况时,结构会被忽略。MD模拟生成了各种元数据(图4)。这里计算了配体在蛋白质对齐后的均方根偏差(RMSDLigand)和整个复合物相对于天然结构的均方根偏差。此外,作者使用MMGBSA评分估算了结合亲和力(未显式考虑熵贡献),还获得了复合物的埋藏溶剂可及表面积。计算的性质在模拟过程中稳定,证明它们很好地达到了平衡状态。对于某些系统,捕捉到了结合位点的较大重新排列,在极端情况下导致整个结合口袋的打开(图3)。这些罕见事件表明可能存在隐匿口袋或瞬态结合模式。在少数情况下,检测到了解离。

AI模型

图 5

为了展示数据集的可能应用,作者训练并评估了基线AI模型。这些模型作为模板包含在库中,以供未来社区开发使用。对于量子力学(QM)数据集,预测了配体分子的电子亲和力和化学硬度(图5)。电子亲和力的Pearson相关系数为0.75,化学强度为0.77。平均绝对误差显示预测值接近目标值:电子亲和力平均为0.12 eV,化学强度平均为0.13 eV。这两个QM特征的高准确性表明可以快速推导出QM性质,这对计算时间较长的大分子尤为重要。

对于分子动力学(MD)轨迹,作者预测了蛋白质的诱导契合能力(适应性)。模型能够识别出可能适应配体结合的生物分子结构元素,实现了0.66的平均Pearson相关系数。平均而言,前100个原子中有42个被正确预测(图5)。如图5d所示,模型可以预测MD运行期间蛋白质口袋中最具柔性的原子(大球)和更刚性的蛋白质区域(小球)。这使得在不需要冗长的MD设置和模拟的情况下快速检查蛋白质口袋成为可能。适应性模型提供了一个创新的例子,说明如何利用基于MD的MISATO数据增强实验结构。

结合亲和力AI模型结合了MISATO的MD和QM数据。已知实验结合亲和力在不同实验技术、实验条件和计算亲和力类型之间难以比较。为了减少这些影响,作者的亲和力模型预测了相对于定义基准复合物的目标结构的相对亲和力。这些配对具有相同的蛋白质和亲和力类型。在MISATO结合亲和力基准测试中,取得了高相关性,与不使用MISATO特征相比,使用MISATO特征的结果有所改善(图6)。

编译|黄海涛

审稿|王建民

参考资料

Siebenmorgen, T., Menezes, F., Benassou, S., Merdivan, E., Didi, K., Mourão, A. S. D., ... & Popowicz, G. M. (2024). MISATO: machine learning dataset of protein–ligand complexes for structure-based drug discovery. Nature Computational Science, 1-12.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
KDD2021 | 用于预测蛋白质-配体结合亲和力的图神经网络
本文介绍由中国科学技术大学和百度商业智能实验室等机构的研究人员合作发表于KDD 2021的研究成果:作者提出了一个基于图神经网络的模型SIGN(structure-aware interactive graph neural network),通过利用原子间的细粒度结构和相互作用信息来学习蛋白质-配体复合物的表征,从而更好地进行结合亲和力预测。SIGN由两部分组成:极坐标启发的图注意力层(PGAL)和成对相互作用池化(PiPool)。PGAL用来整合原子之间的距离和角度信息,进行三维空间结构建模。PiPool用来将蛋白质和配体之间的远程相互作用纳入模型中。在两个基准上的实验结果验证了SIGN的优越性。
DrugAI
2021/08/24
1.4K0
Nat. Mach. Intell. | 利用图网络发现蛋白质与配体相互作用关键点
今天为大家介绍的是来自Jürgen Bajorath团队的一篇论文。图神经网络(GNNs)通过分析蛋白质与配体相互作用的图表示结构来预测配体的亲和力。虽然有一些研究表明GNNs能够详细了解蛋白质与配体的相互作用,但这种预测方法也存在争议。比如,有证据显示GNNs可能并不是真正学习蛋白质与配体的相互作用,而是仅仅记住了训练数据中的配体和蛋白质信息。为此作者对六种不同的GNN架构进行了亲和力预测实验,并使用可解释的人工智能技术对结果进行了分析。
DrugAI
2024/01/17
7640
Nat. Mach. Intell. | 利用图网络发现蛋白质与配体相互作用关键点
Nat. Mach. Intell. | 多尺度拓扑Transformer用于蛋白质-配体相互作用预测
今天为大家介绍的是来自美国密歇根州立大学的Guo-Wei Wei团队的一篇论文。尽管预训练的自然语言处理(NLP)模型在各个领域取得了成功,但它们在计算生物学中的应用受到了阻碍,因为它们依赖于生物序列而忽略了重要的三维(3D)结构信息,这与NLP模型的序列架构不兼容。在此,作者提出了TopoFormer,该模型通过整合NLP模型和一种多尺度拓扑技术——持久拓扑超图拉普拉斯(PTHL)构建而成。PTHL能够系统地将复杂的3D蛋白质-配体复合物在不同的空间尺度上转换为NLP可接受的拓扑不变量和同伦形状序列,捕捉跨越不同空间尺度的基本相互作用。TopoFormer在多个基准数据集中的评分、排序、对接和筛选任务中表现出了出色的准确性和卓越的性能。这种方法可以用于将一般的高维结构数据转换为NLP兼容的序列,为更广泛的基于NLP的研究铺平了道路。
DrugAI
2024/07/30
2040
Nat. Mach. Intell. | 多尺度拓扑Transformer用于蛋白质-配体相互作用预测
J Med Chem|静电互补在基于结构的药物设计中的应用
2022年5月5日,Astex Pharmaceuticals的科学家们在J Med Chem杂志上对静电势计算在药物设计中的应用进行了综述,并且利用6个具体的例子阐明了ESP计算对于基于结构的药物设计的改善和指导意义。还推荐了该公司研发的一款基于AI的快速ESP计算工具:GC-DNN,该工具在精度上可以媲美DFT方法计算的ESP结果。
智药邦
2022/11/16
1.5K0
J Med Chem|静电互补在基于结构的药物设计中的应用
Nat. Methods | SurfDock:利用表面信息的扩散生成模型实现蛋白质-配体复合物结构精准预测
理解蛋白-配体相互作用是分子生物学和生物化学的基础。从酶催化到信号传导,这些相互作用构成了众多细胞过程的核心。对蛋白-配体相互作用的深入理解对基于结构的药物设计至关重要,研究人员可以据此发现或设计与特定蛋白质结合的配体。基于人工智能(AI)技术,我们能更精准地理解蛋白-配体相互作用,加速药物发现的进程。人工智能与生命科学的交叉正在改变人类健康和医学研究的格局,为疾病研究和靶向治疗药物开发开辟新的途径。
DrugAI
2024/11/29
1860
Nat. Methods | SurfDock:利用表面信息的扩散生成模型实现蛋白质-配体复合物结构精准预测
J. Med. Chem. | 一种基于图表示学习的蛋白-配体相互作用打分方法InteractionGraphNet
本文介绍来自一篇浙江大学智能创新药物研究院侯廷军教授团队, 浙江大学计算机学院吴健教授团队,中南大学曹东升团队和腾讯量子实验室联合在药物化学领域权威期刊 Journal of Medicinal Chemistry发表的一篇文章。该文章提出一种新型的基于图表示学习的蛋白-小分子相互作用的打分方法InteractionGraphNet(IGN)。在IGN中,作者基于物理原理分别设计了独立的分子内图卷积和分之间图卷积模块来先后学习蛋白-配体复合物中的分子内相互作用和分子间相互作用,并将学习到的分子间相互作用应用于下游的任务预测, 包括蛋白-配体结合亲和力预测、大规模虚拟筛选以及小分子结合构象预测。实验结果表明,IGN模型的泛化性能均优于同类ML方法和分子对接程序。此外, 作者还用大量的实验表明IGN模型的优异性能并非是来自于学习数据集中的隐藏偏差,而是真正学习了蛋白-配体相互作用的一些关键特征。
DrugAI
2021/12/16
8220
J. Med. Chem. | 一种基于图表示学习的蛋白-配体相互作用打分方法InteractionGraphNet
Nat. Commun. | 使用Umol从序列预测蛋白质-配体复合物结构
今天为大家介绍的是来自Frank Noe团队的一篇论文。蛋白质-配体对接是药物发现和开发中的常用工具,可以筛选出潜在的治疗物进行实验测试。然而,这需要高质量的蛋白质结构,通常蛋白质会被处理成完全或部分刚性的。作者开发了一种AI系统,可以直接从序列信息预测蛋白质-配体复合物的全原子灵活结构。作者发现传统的对接方法仍然更优越,但依赖于目标蛋白质的晶体结构。除了预测灵活的全原子结构外,预测的置信度指标(plDDT)还可以用于选择准确的预测结果以及区分强和弱结合物。Umol工具可在:https://github.com/patrickbryant1/Umol 获取。
DrugAI
2024/07/17
2590
Nat. Commun. | 使用Umol从序列预测蛋白质-配体复合物结构
Nat. Comput. Sci. | 通过结合比较网络计算配体的相对亲和力
今天为大家介绍的是来自Xutong Li, Xiaomin Luo和Mingyue Zheng团队的一篇论文。先导化合物优化是药物发现领域的一个关键挑战。目前,这一领域大部分还是依赖于假设和药物化学家的先前经验。作者为了应对这一挑战,提出了一种基于物理信息图注意力机制的配对结合比较网络(PBCNet),专门用于对同类配体的相对结合亲和力进行排名。通过在两个独立数据集上的基准测试, PBCNet在预测准确性和计算效率方面都显示出了显著的优势。
DrugAI
2024/01/19
2240
Nat. Comput. Sci. | 通过结合比较网络计算配体的相对亲和力
Nat. Commun. | Interformer:通过相互作用感知进行蛋白质-配体对接亲和力预测
近年来,深度学习模型在蛋白质-配体对接和亲和力预测中的应用引起了越来越多的关注,这种应用对于基于结构的药物设计至关重要。然而,许多这些模型忽略了复合物中配体和蛋白质原子之间相互作用的复杂建模,从而限制了它们的泛化和可解释性的能力。
DrugAI
2024/12/27
2111
Nat. Commun. | Interformer:通过相互作用感知进行蛋白质-配体对接亲和力预测
Sci. Rep. | 一个对任意分子体系实现准确且高效几何深度学习的通用框架
这篇工作是来自纽约城市大学/康奈尔医学院谢磊团队的一篇论文。作者提出了一个通用框架,PAMNet,可以对任意分子体系实现准确且高效的几何深度学习。在小分子性质、RNA三维结构以及蛋白质-配体结合亲和力的预测任务上,PAMNet在准确性和效率方面都优于最先进的基线模型。这些成果不仅展示了PAMNet在模拟分子体系的通用性,而且强调了其在实际分子科学应用中的潜力。
DrugAI
2023/12/12
2820
Sci. Rep. | 一个对任意分子体系实现准确且高效几何深度学习的通用框架
利用量子理论加速药物发现的18家初创企业
在合成有机化学、药物化学和药物设计的建模方面,分子力学(Molecular mechanics,MM)是一种传统的计算方法。但是它在一些情况下(例如,MM方法用于研究药物-受体微环境中基于电子的特性时)存在很大的局限性。
智药邦
2021/06/03
8680
利用量子理论加速药物发现的18家初创企业
Nat. Comput. Sci. | 基于拓扑表面和几何结构的3D分子生成方法
今天为大家介绍的是来自侯廷军教授团队的一篇论文。计算机辅助药物发现的一个重大挑战是高效地从头设计药物。虽然近年来已经开始有一些针对特定结构的三维分子生成方法,但多数方法并没有完全学习到决定分子形态和结合复合物稳定性的原子间互动细节。因此,很多模型难以为各种治疗目标生成合理的分子。为了解决这个问题,作者提出了一个名为SurfGen的模型。这个模型设计分子的方式就像锁和钥匙原理一样。SurfGen由两个等变神经网络组成,它们分别捕捉口袋表面的拓扑互动和配体原子与表面节点之间的空间互动。SurfGen在多个基准测试中的表现优于其他方法,并且对口袋结构的高敏感性为解决由突变引起的药物耐受性问题提供了有效的解决方案。
DrugAI
2023/10/24
7090
Nat. Comput. Sci. | 基于拓扑表面和几何结构的3D分子生成方法
Nat. Commun. | 融入分子动力学的粗粒度建模,MCGLPPI有效解决复合物性质预测任务
今天为大家介绍的是来自英国伯明翰大学、澳门理工大学Shan He团队与深圳大学朱泽轩的一篇论文。基于结构的机器学习算法已经被用于预测蛋白质-蛋白质相互作用(PPI)复合物的性质,例如结合亲和力,这对于理解生物机制和疾病治疗至关重要。目前,大多数现有算法在原子级或残基级表示PPI复合物的图结构,但这些表示可能计算成本高昂,或未能充分整合更精细的化学合理性互动细节。作者在此提出了一种几何表示学习框架MCGLPPI,该框架结合了图神经网络(GNNs)与MARTINI分子粗粒度(CG)模型,能够准确且高效地预测PPI整体性质。大量基于三种下游PPI性质预测任务的实验表明,在CG级别上,MCGLPPI相比原子级和残基级方法展现出具有竞争力的性能,但计算资源消耗仅为其三分之一。此外,在蛋白质结构域-结构域相互作用结构上进行CG级别的预训练,进一步增强了其在PPI任务中的预测能力。MCGLPPI为PPI整体性质预测提供了一种高效有效的解决方案,是大规模生物分子相互作用分析的一个有前景的工具。
DrugAI
2024/12/20
2800
Nat. Commun. | 融入分子动力学的粗粒度建模,MCGLPPI有效解决复合物性质预测任务
Nat. Mach. Intell. | CGN+CAN=CGN!Frad大尺度扰动分子提升属性预测
今天为大家介绍的是来自清华大学兰艳艳团队的一篇论文。深度学习方法被认为在加速药物发现和材料设计中的分子筛选方面具有前景。由于标记数据的有限可用性,各种自监督的分子预训练方法相继出现。尽管许多现有方法利用计算机视觉和自然语言处理中的常见预训练任务,但往往忽视了支配分子的基本物理原理。相比之下,在预训练中应用去噪可以视为一种等效的力学习,但有限的噪声分布会引入对分子分布的偏差。为了解决这一问题,作者提出了一种名为分数去噪的分子预训练框架,它将噪声设计与力学习等效所施加的约束解耦。通过这种方式,噪声变得可定制,从而允许结合化学先验,显著改善分子分布建模。实验表明,作者的框架在力预测、量子化学性质和结合亲和力任务上始终优于现有方法,确立了最新的最佳结果。改进的噪声设计提高了力的准确性和采样覆盖率,有助于创建物理一致的分子表征,最终提升预测性能。
DrugAI
2024/11/23
950
Nat. Mach. Intell. | CGN+CAN=CGN!Frad大尺度扰动分子提升属性预测
J. Chem. Theory Comput. | 里程碑模拟在药物-靶点动力学中的进展与挑战
今天为大家介绍的是来自美国圣地亚哥加利福尼亚大学Rommie E. Amaro团队的一篇论文。分子动力学模拟在探索复杂的生物过程中已变得不可或缺,但其在捕捉罕见事件方面的局限性阻碍了作者对药物-靶点动力学的理解。在这篇观点文章中,作者研究了“里程碑模拟”(milestoning simulations)领域以理解这一挑战。里程碑(milestoning)方法将药物-靶点复合物的相空间划分为离散单元,从而提供了更长时间尺度的见解。本文追溯了里程碑模拟在药物-靶点动力学研究中的历史、应用和未来潜力。文章探讨了里程碑方法的基本原理,强调了概率转移和转移时间独立性的重要性。通过重新审视具有Voronoi镶嵌的马尔可夫里程碑方法来解决传统里程碑方法的挑战。在关注该领域进展的同时,本文也指出了通过里程碑模拟估计药物-靶点解离速率常数时面临的紧迫挑战,为更有效的药物设计策略铺平了道路。
DrugAI
2024/12/25
1290
J. Chem. Theory Comput. | 里程碑模拟在药物-靶点动力学中的进展与挑战
J. Chem. Theory Comput. | AI驱动的柔性蛋白-小分子复合物建模
今天为大家介绍的是来自陈语谦教授团队发表在Journal of Chemical Theory and Computation的论文,“Equivariant Flexible Modeling of the Protein−Ligand Binding Pose with Geometric Deep Learning”,博士生董铁君为第一作者。该文提出了一种新的AI驱动的蛋白-小分子复合物结构柔性建模方法FlexPose,可准确高效的预测复合物结构、亲和力及模型置信度。模型采用标量-矢量二元特征表示和 SE(3)-等变网络,以端到端动态建模复合物结构;同时提出构象感知的预训练和弱监督学习策略提高模型在未见过的化学空间中泛化性。在PDBbind,APObind数据集上的评估显示,在涉及蛋白质构象变化的任务中,模型的精度和效率大幅高于传统的分子对接及近期基于AI的方法。在基于数据集相似性的评价中,两个构象感知策略很大程度上提高了模型在低相似性化学空间中的性能。此外模型预测的亲和力及置信度估计为后续的药物研发提供了有效直接的参考。
DrugAI
2023/11/13
3830
J. Chem. Theory Comput. | AI驱动的柔性蛋白-小分子复合物建模
Brief. Bioinform. | 蛋白质-小分子复合物结合强度和配体结合姿态一体预测的深度学习框架
基于结构的药物设计中一项重要的任务是预测配体在靶体口袋中的结合姿态,然而当前已报道的打分函数通常受限于精度,或是局限于单一的输出,比如仅预测构象姿势的偏差(RMSD),结合强度(pKd)或是基于残基-原子间距离分布的统计势。本文介绍的是近期发表在国际知名生物信息学期刊《Briefings in Bioinformatics》上的一篇题为《A New Paradigm for Applying Deep Learning to Protein-Ligand Interaction Prediction》的研究论文。该论文提出了一种同时预测蛋白质-配体复合物结合强度及配体结合姿态偏差RMSD的打分框架IGModel。论文的第一作者是智峪生科助理研究员王泽琛(山东大学物理学院博士在读),共同通讯作者是郑良振博士(智峪生科-深圳先进院联合实验室)和李伟峰教授(山东大学物理学院)。
DrugAI
2024/04/14
8300
Brief. Bioinform. | 蛋白质-小分子复合物结合强度和配体结合姿态一体预测的深度学习框架
Nat. Phys. | 量子计算机上的药物设计
今天为大家介绍的是来自Raffaele Santagati团队的一篇论文。量子计算机在工业应用中的潜力很大程度上依赖于它们执行精确、高效量子化学计算的预期能力。计算机辅助药物发现依赖于精确预测候选药物在含有数千个原子、特定温度条件下的细胞环境中的目标相互作用。作者在这里探讨了将量子计算机应用于药物设计中的挑战与机遇。
DrugAI
2024/03/26
2630
Nat. Phys. | 量子计算机上的药物设计
基于结构的药物设计中的深度学习
本文为《Artificial Intelligence in Drug Design》一书第11章的内容,作者是Evotec公司的Andrew Anighoro。
智药邦
2022/04/13
8110
基于结构的药物设计中的深度学习
Stanford | 基于蛋白-配体复合物的几何深度学习指导基于片段的配体生成
本文介绍一篇来自于斯坦福大学计算机科学系Ron O. Dror教授组的分子生成工作——《Fragment-Based Ligand Generation Guided By Geometric Deep Learning On Protein-Ligand Structure》。计算辅助新型分子设计有可能加速药物发现。然而,在药物发展中分子优化是一项耗时的工作,通常需要花费数年对分子的多种性质同时进行优化。将一个能和蛋白质口袋结合的小的、片段状初始分子扩展成更大的分子,使之与已知药物的物理化学性质相匹配,这是生物信息学中一个特定的分子优化问题。针对这一问题,作者使用数据有效的E(3)等变网络和3D原子点云表征进行建模,这种方法能结合蛋白质口袋的3D空间信息同时生成合理的分子,从而加速药物发现过程。通过对多种性质进行评估证明该框架确实能生成可行的分子。
DrugAI
2022/06/10
4390
Stanford | 基于蛋白-配体复合物的几何深度学习指导基于片段的配体生成
推荐阅读
KDD2021 | 用于预测蛋白质-配体结合亲和力的图神经网络
1.4K0
Nat. Mach. Intell. | 利用图网络发现蛋白质与配体相互作用关键点
7640
Nat. Mach. Intell. | 多尺度拓扑Transformer用于蛋白质-配体相互作用预测
2040
J Med Chem|静电互补在基于结构的药物设计中的应用
1.5K0
Nat. Methods | SurfDock:利用表面信息的扩散生成模型实现蛋白质-配体复合物结构精准预测
1860
J. Med. Chem. | 一种基于图表示学习的蛋白-配体相互作用打分方法InteractionGraphNet
8220
Nat. Commun. | 使用Umol从序列预测蛋白质-配体复合物结构
2590
Nat. Comput. Sci. | 通过结合比较网络计算配体的相对亲和力
2240
Nat. Commun. | Interformer:通过相互作用感知进行蛋白质-配体对接亲和力预测
2111
Sci. Rep. | 一个对任意分子体系实现准确且高效几何深度学习的通用框架
2820
利用量子理论加速药物发现的18家初创企业
8680
Nat. Comput. Sci. | 基于拓扑表面和几何结构的3D分子生成方法
7090
Nat. Commun. | 融入分子动力学的粗粒度建模,MCGLPPI有效解决复合物性质预测任务
2800
Nat. Mach. Intell. | CGN+CAN=CGN!Frad大尺度扰动分子提升属性预测
950
J. Chem. Theory Comput. | 里程碑模拟在药物-靶点动力学中的进展与挑战
1290
J. Chem. Theory Comput. | AI驱动的柔性蛋白-小分子复合物建模
3830
Brief. Bioinform. | 蛋白质-小分子复合物结合强度和配体结合姿态一体预测的深度学习框架
8300
Nat. Phys. | 量子计算机上的药物设计
2630
基于结构的药物设计中的深度学习
8110
Stanford | 基于蛋白-配体复合物的几何深度学习指导基于片段的配体生成
4390
相关推荐
KDD2021 | 用于预测蛋白质-配体结合亲和力的图神经网络
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档