Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >JCIM|EHreact:用于酶促反应模板提取和评分的扩展Hasse图

JCIM|EHreact:用于酶促反应模板提取和评分的扩展Hasse图

作者头像
智药邦
发布于 2022-03-04 06:23:48
发布于 2022-03-04 06:23:48
9380
举报
文章被收录于专栏:智药邦智药邦

2021年9月29日,JCIM上发表了有关酶促反应模板提取和评分的文章:"EHreact: Extended Hasse Diagrams for the Extraction and Scoring of Enzymatic Reaction Templates"。

作者开发了一个纯数据驱动的开源软件工具EHreact,该工具可以从已知的反应中提取规则并进行打分。EHreact基于虚构的过渡结构(imaginary transition structures)中共同的子结构,提取反应规则并分组,生成具有树状结构的Hasse图。每个图可以用来输出一个或一组反应规则(酶反应模板)。此外,它还可以计算出在给定酶的情况下该酶催化新底物的概率(预测其在非天然底物上的适用性)。EHreact通过从已知酶反应和模板树的分组情况中可以推断有关酶活性位点的信息。EHreact采用启发式预测给定的酶在底物上的活性,其准确性和功能性优于现有方法。

1.研究背景

科学家们开发了大量的工具从大型数据库中的有机或生物催化反应中提取、应用和评分具有一般性的反应模板。其中,酶反应的反应规则的生成尤其具有挑战性,因为酶之间的底物混杂性差别很大,这导致了规则特异性的最佳水平和包含的原子的最佳数量在不同酶之间差别巨大。从另一方看,从数据库中自动提取酶反应的数据的困难促进了手工管理反应规则集的创建。

大多数酶在某种程度具有混杂性,换句话说,它们可以被改造以接受新底物。

在反应途径设计的实践中,适度混杂的酶是首选。因为定向进化可为其增加一定程度的活性。酶既能表现底物混杂性,也能表现反应混杂性,但在生物逆合成中,通常只有底物混杂性被利用。底物混杂性是指在非原生底物上催化原生反应的能力,而反应混杂性则是指催化非原生反应的能力。需要指明的是:本文的混杂性均指底物的混杂性。

酶合成路径规划领域的工具一般通过识别反应中心,将原子和键的变化编码成反应规则,并根据一组标准对新底物进行相同转化的可行性进行评分,从而从已知的反应中提取催化转化模板。其中,最重要的是提高评分函数的准确度,从而正确地对预期可行的反应进行排序。然而,依赖于相似性或反应规则特异性的方法无法区分通用酶和专用酶,即它们缺少对酶的混杂性的描述。

因此,我们需要一种数据驱动的方法来提取不同特异性水平的酶反应模板,以及在指纹相似度以外的标准上对新的查询进行评分。这个标准需要考虑到酶的估计混杂性和从已知底物推断反应中心周围化学结构的多样性。

EHreact 软件提供了一个有价值的工具来描述和预测酶的反应,这个工具可以在GitHub上免费获得(https://github.com/hesther/ehreact)。

2.方法

2.1格式的输入和转换,生成伪过渡结构(ITS)

EHreact可以运行在两种不同的模板树生成模式:以反应作为输入(默认,推荐)或仅反应物(单一底物)为输入。

在标准设置下,即在反应模式下,EHreact采用一个平衡的、原子映射的反应SMILES作为输入,它必须包括显式的氢原子。如果原子映射未知,则通过反应解码器(RDT)自动计算,这是一种最先进的酶反应原子映射工具。在这种情况下,非原子映射的SMILES反应既可以有氢也可以没有氢。

EHreact中提取的模板没有考虑手性,而是在评分算法中处理。在单底物模式下,EHreact以SMILES字符串作为输入(例如,“CC(O)C(=O)[O-]”为乳酸盐),可以输入氢原子或不输入氢原子。由于在此模式中没有指定产物,因此可以另外输入一个种子(seed),以SMILES格式进行最大公共子结构搜索,以帮助算法聚焦于分子的相关部分。对于乳酸的氧化(图1),一个有意义的种子是“C([H])O[H]”,即乳酸氧化酶转化为酮的仲醇。如果没有指定种子,则算法使用所有输入底物中的最大公共子结构作为种子。

图1:EHreact处理一个输入的原子映射的SMILES串(a,上框),产生三个输出(下框),即各自的伪过渡结构(b),键变化表(c),以及仅由发生变化的原子和键或发生变化的原子间键组成的反应中心(d)。

2.2模板树的生成

在确定反应中心(或底物模式下的种子的原子构成)后,根据已知反应或底物的结构,逐步展开模板。在单底物模式下,结构是真实的分子,即输入底物,种子可以手动给出,也可以从最大共同子结构中自动推断出来。图2给出了模板树生成的概述。

图2:模板树生成的原理图工作流:对于每一种酶,一个已知反应的列表被转换成它们各自的伪过渡结构(ITS,白色方块),并传递给模板树生成算法。该算法输出反应中心周围常见的子结构(反应模板、灰圈)和已知反应的Hasse图,并保存到文件中。

该算法迭代地向模板添加信息,创建一个新的、更具体的模板。

图3:当前模板允许原子1、7和8被扩展(还没有指定所有的邻居)。通过将模板与每个伪分子匹配,并确定其邻居,来比较模板中每个候选原子的邻居。该算法选择所有伪分子中相邻原子相同的原子,这里是原子1和原子8(用灰色突出显示),用于扩展模板,生成一个新的、更大的、更特定的模板

图3示例了模板树的生成过程。模板与伪分子可能会有多个匹配,在这种情况下,将探索所有选项,并保持导致所有伪分子中最大可相互扩展原子的匹配。生成的模板保存在一个模板树中,其中每个新模板都附加到它的父模板。每个模板只能有一个父模板,但可以有一个或多个子模板。树中没有子节点的节点只是一个输入的伪分子,其中所有的原子都包含在模板中,在短列表中不留下任何原子,因此没有更具体的模板可以作为子节点附加。在数学上,这样的图称为Hasse图,它是一种使用部分顺序对一组对象进行排序和描述的方法。由于作者不仅将父节点和子节点的信息保存到图中,而且还将大量的附加特性保存到图中,所以我们将生成的模板树称为“扩展的Hasse图”。

综上所述,给定一个反应,则从反应中心提取不同直径的模板,创建一个没有分支的线性Hasse图。但如果已知多个反应,则算法利用它们之间的相互结构信息。在这两种情况下,模板树及其叶子节点的许多属性都被预先计算,以加快查询反应或底物的后续评分。这种方法的创新点是在反应中心加入原子和化学键,利用所有已知反应中保守的子结构,而不是预先设定的反应中心半径。

2.3在模板树上的查寻

图4描述了如何在扩展的Hasse图上查询和评分新的底物或反应。

图4:为了对查询分子Q是否能被酶N处理的概率进行评分,将加载相应的模板树,并将Q转换为一个可能的伪过渡结构列表(白色方块,只显示了一种可能性)。然后将Q的ITS与树中的模板(灰色圆圈)进行迭代匹配,直到找到最具体的(最右边的)匹配,用红色突出显示。然后,通过对Q与当前分支(Y和Z)中已知基板的各种比较,以及模板在树中的位置,以及树的整体形状和多样性,得出分数。

2.4打分函数

SS是查询底物与当前分支内已知底物之间的摩根指纹最大谷本相似度(半径2,无特征)。

SP是模板树中所有底物对之间谷本相似性的平均值,是酶特异性的度量。

1−SP是酶混杂的量度。

SM是查询与所有已知底物(在整个树中,而不仅仅是当前的分支)之间的谷本相似度平均值。

SL是到最近的叶节点的最小边数。

2.5数据准备

作者从文献中手工提取了一系列关于各种酶的底物范围的实验研究,以及有机偶联反应的研究,来测试EHreact对有机、非酶促反应的性能。

每项研究都报告了在整个研究中一致的反应条件下,特定底物上酶/催化剂的产率或活性。通过手动指定一个阈值,每个数据集产生大约10-40%的活性反应,将每个反应分为活性反应和非活性反应(阈值列于表1)。对于有机偶联反应,由于数据集的大小,选择较大的阈值来限制活性反应的数量。剩余底物和酶的数量也列在表1中。所有的反应都通过RDT进行原子映射,并通过对每个类的所有反应运行EHreact进行校正,用一个偏差的反应中心标记反应,并手动校正原子映射。

表1:实验数据摘要

(参考文献,底物数量,酶的数量/反应类,活性/非活性阈值(活性 If >阈值))

3.结果和讨论

3.1示例模板树构建

输入的反应如何转变为ITS,以及如何围绕反应中心的共同子结构进行迭代搜索?作者以4-羟基-2-氧戊二酸裂解酶(EC 4.1.3.42)为例进行讨论。从BRENDA列出3种已知底物:4-羟基-2-氧戊二酸、4-羟基-2-牛丁醛和草酰乙酸。底物和4-羟基-2-氧戊二酸裂解酶催化的反应如图5a所示。

图5:4-羟基-2-氧戊二酸裂解酶的三个已知反应的标准模板和Hasse图(EC 4.1.3.42)。原子的映射对于不在反应中心的原子是不显示的。输入的反应(a)被转换为它们各自的ITS(c)。迭代的子结构搜索生成所有模板的Hasse图(d),该图由EHreact绘制(添加了两个反应模板图)重新打印。反应中心用灰色突出显示。模板(ITS伪分子的子结构)用红色框起来,叶节点(已知反应的全部ITS)用黑色框起来。第一个模板对应于反应中心。第四个模板是最具体、最大的模板,它描述了所有输入的反应,对应于4-羟基-2-氧戊二酸裂解酶手工制作的反应规则。相比之下,标准模板提取程序(b),这里显示的是包括离反应中心最多一个键的原子的共同选择,导致三种不同的模板,它们不能很好地表征系统。

这种酶使靠近羟基的碳-碳键分裂。这三种情况下的产品分别是丙酮酸、乙醛酸、甲醛和二氧化碳。例如,用文献方法提取反应模板,包括离反应中心一个键以下的所有原子(一种常见的选择),将创建三种不同的模板(图5b),它们都缺少从已知反应传递而来的互信息。

反应的ITS显示大的公共子结构(图5c)。底物一侧是高度保守的,即形成丙酮酸侧(连接在C:10上),而另一边(连接在C:4上)在结构和大小上是不同的。这表明丙酮酸侧是必需的,因为它适应酶的活性口袋,参与了反应机理。事实上,对4-羟基-2-氧戊二酸裂解酶的机理研究表明,活性袋中的氨基酸与底物的丙酮酸侧存在特定的相互作用,以及同侧的体积限制。

EHreact利用已知反应之间的互信息,以迭代的方式将保守子结构中的原子添加到最小反应模板中(图5d中的第一个模板)。在每一步中,算法只添加原子及其对应的键,这些原子在所有的反应中都是守恒的,是模板中当前原子直接相邻的原子,最终得到图5d中的第四个模板,它适用于所有输入反应。它标识4-羟基-2-氧化戊二酸裂解酶作用于底物表现出重要的丙酮酸C−C键旁边的一部分的分割,没有指定另一边的分子。因此,完美地对应专家知识模板制作的活性口袋和机制系统。

将原子进一步添加到模板之后,图分为三个分支,其中两个分支直接指向叶节点(完全反应的ITS),一个分支在结束于叶节点之前生成一个额外的模板。如果用户对单模板感兴趣,那么提取最具体的相互模板(图5d中的第四个模板)就足够了,并且与传统的模板提取方法相比具有优势。

如图5所示,EHreact为所有反应生成一个模板,而不是其他方法提取的三个不同模板。众所周知,提取模板的数量随着数据库中反应的数量而变化,而且即使在大型数据集中,大部分模板也只出现一次。在Hasse图中,如果缺少与最通用模板的匹配,则立即取消反应类型的资格,从而使计算机辅助合成计划更容易、更快。

3.2酶反应数据集的构建

EHreact模板的质量和评分直接取决于反应的数量。反应的数量决定了每个模板树的大小和多样性,从而决定了它创建有意义的模板和分数的能力。

图6:不同数据库中每个EC类的反应数量(左)和每个酶的反应数量(右)。

3.3实验数据验证

作者比较了EHreact评分的能力,以识别在实验筛选研究中观察到的有希望的底物/酶组合,根据不同的相似性指标。为了达到这个目的,从文献中选择了9个最近的数据集(反应物和产物都是已知的)

作者采用留一实验法(Leave-one-out experiments),在计算模板树(每个酶一棵树)的过程中,对每个反应(底物/产物/酶组合)的可行性进行评估,然后根据之前评分方案计算得分。使用EHreact和传统的相似度度量(Tanimoto, radius:2, len:2048, features:None)。

表2:曲线下面积AUC和分类准确的Acc.(阈值为0.5)通过相似度或EHreact获得的分数

表2列出了反应模式下活性/非活性底物分类的AUC和准确性。一般来说,EHreact可以得到类似的AUC,但准确率更高,在羧基-甲基转移酶、转氨酶、色氨酸合成酶和酰胺转移酶中差异尤其明显。在这些分析中,底物之间有很高的相似性分数,但酶只对底物起作用的范围很窄,也就是说,酶是相当有选择性的。(较高的相似性分数并不一定保证酶对新底物具有活性)

图7:通过相似度(左)、EHreact(中)和它们的差异(右)计算出的相似性评分SS和混杂性评分SP之间的关系。这些线连接每个系统的SS和SP值。新的EHreact方法对于非混杂酶或如果新的底物与训练集中的底物非常相似,则更加准确。

简单相似度指标的分类精度随着相似度分数的增加而显著降低(图7左图),因为已知底物之间的相似度也增加了,这表明酶非常特定。

由于没有考虑到酶的特异性/混杂性,较高的相似性分数导致了分类中大量的假阳性。相比之下,EHreact得分的准确性(中间面板)并不显示出对个体相似性和特异性的依赖。

图7的右图显示了通过EHreact的准确率和相似性评分的差异,在个体相似性和特异性较高的例子中差异最大。

这一观察结果与所使用的阈值无关,但在相似性度量方面存在根本缺陷,无法区分通才酶(generalist)和专才酶(specialist),因此需要为每种酶设置不同的阈值。

EHreact评分与相似性的评分相比,在AUC和准确性方面较好。作者推测这种改提升也适用于其他一些有机反应,即当反应中心周围的结构对反应结果或产量有显著贡献时。虽然本实验不是一般有机反应的情况,但它证明了EHreact至少对某些反应类是一个有用的工具。

作者还研究了在只知道一种酶的底物的情况下,EHreact是否仍然比基于相似性的方法更具优势。然而,作者发现基于相似度和EHreact的得分之间的AUC没有明显的差距。作者推测基于位置分数的惩罚的增益效果视系统而定。这表明基于直径的模板得分并不一定优于整体相似性得分。

3.4区域选择性和辅底物建议

图8:EHreact评分与相似度评分的比较。用于对基质组合是否可能进行分类的ROC−AUC的箱线图(左)、建议的底物的top-1准确度(中)和正确的辅底物的平均等级(右)。

为了评估EHreact在多底物反应中提出有意义的共底物的能力,作者从BRENDA中选择了EC类(两个底物的反应,每个反应都有超过10个已知的反应)在所有反应中最常见的底物的发生率低于70%,单个底物的分子质量小于200g/mol。对于每个EC类中的反应,作者对EHreact和相似性得分的辨别能力进行了分析。作者计算受试者-操作者特征的AUC,来分析在多大程度上能够区分真实和人工底物组合(图8,左面板)。

EHreact的平均AUC为0.69,相似度得分则为0.59。平均排名如图8右面板所示,其中EHreact的平均排名为2.5,高于相似度得分的排名(平均排名3.6)。在反应中,在 rank 1 (top-1-accuracy) 识别出正确 partner 的比例为64%(EHreact)和41%(相似性)。

在区域选择性方面,作者从BRENDA选择了13个EC类,其中一些反应有多个可能的转化位点。作者使用EHreact计算每个反应位点的分数,或使用相同EC类内的非区域选择性反应作为训练反应的相似分数。EHreact和相似度得分均为100%(top-1-accuracy)。

3.5局限性

一个明显的缺点是它的平衡反应需要原子映射,因此,在数据的预处理有额外负担。这些反应通常是不平衡的,而且并不总有原子映射,有时甚至是不正确的原子映射。事实上,在有机和生物催化合成中,错误的原子映射是所有基于模板的反应预测的一个主要限制。不正确的原子映射通常会导致唯一的、没有意义的ITS,这些ITS在模板的Hasse图的开头分支。

当每个酶有多个反应时,EHreact的效果较好。如果只有一个反应,评分方案仍然从多个模板中提取不同特异性水平的信息,形成一个线性模板树。

评分算法也有局限性。虽然EHreact的评分方案不是简单的化学相似性度量,但它仍然基于常见结构及其相似性。

4.总结

作者介绍了一种新的方法:从一组已知的反应中提取多个反应模板,并利用互信息预测非天然底物的活性。因此,作者开发了开源软件EHreact,它能从模板提取、归类、保存为ITS,并构建过渡态分子片段的Hasse图。

参考资料

Heid, E.; Goldman, S.; Sankaranarayanan, K.; Coley, C. W.; Flamm, C.; Green, W. H. EHreact: Extended Hasse Diagrams for the Extraction and Scoring of Enzymatic Reaction Templates. J. Chem. Inf. Model. 2021, 61(10), 4949-4961. https://doi.org/10.1021/acs.jcim.1c00921.

----------- End -----------

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-01-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
前瞻 | 溶质载体 (SLC):代谢的看门人 | Cell
◉ 图1. 研究SLCs多功能性的挑战,多功能性是指转运蛋白能够识别和运输多种底物的能力;冗余现象,当多种转运蛋白共享重叠的底物特异性时的现象;亚细胞定位的复杂性,在细胞器/质膜上的定位。◉ ,
生信菜鸟团
2025/02/27
2280
前瞻 | 溶质载体 (SLC):代谢的看门人 | Cell
ICML 2024 | 基于重要功能位点与小分子底物的生成式酶设计
今天为大家介绍的是来自Lei Li团队的一篇论文。酶是由基因编码的生物催化剂,能够加速化学反应。那么,如何能自动设计出功能性酶呢?在这篇论文中,作者提出了EnzyGen,这是一种学习统一模型来设计各个功能家族酶的方法。作者的核心理念是基于重要功能位点和对应期望催化功能的底物生成酶的氨基酸序列及其三维(3D)坐标。这些位点是从酶数据库中自动挖掘出来的。EnzyGen由一种新颖的交错注意力网络和邻域等变层组成,能够捕捉整个蛋白质序列中的远程关联和3D空间中最近氨基酸的局部影响。为了学习生成模型,作者设计了一个联合训练目标,包括序列生成损失、位置预测损失和酶-底物相互作用损失。作者还构建了EnzyBench,一个包含3157个酶家族的数据集,覆盖了蛋白质数据库(PDB)中所有可用的酶。实验结果表明,EnzyGen在所有323个测试家族中始终表现最佳,在底物结合亲和力方面比最佳基线高出10.79%。这些发现证明了EnzyGen在设计具有高亲和力并与特定底物结合的结构良好且有效的酶方面的卓越能力。
DrugAI
2024/06/18
1700
ICML 2024 | 基于重要功能位点与小分子底物的生成式酶设计
PNAS | 基于结构感知图卷积网络预测蛋白酶特异性功能
今天为大家介绍的是来自Sagar D. Khare团队的一篇论文。酶具有精确和选择性地读取、编写和编辑DNA的能力,已经彻底改变了生物化学科学和技术。如果能够获得类似的酶,用于有选择性地“编辑”蛋白质,将产生广泛的影响。
DrugAI
2023/10/31
4230
PNAS | 基于结构感知图卷积网络预测蛋白酶特异性功能
铜死亡丨解锁细胞死亡新方式 - MedChemExpress
细胞死亡的相关研究一直是生命科学领域的热点。依据发生机制的不同 (起始的刺激、中间过程的激活和末端的效应器的不同) ,细胞的死亡可以区分为不同的方式,常见的有细胞凋亡、焦亡、坏死、铁死亡等。
MedChemExpress
2023/01/09
7650
铜死亡丨解锁细胞死亡新方式 - MedChemExpress
2023年获FDA批准的小分子新药及药物设计思路
本文根据美国FDA官网的公开信息,解读了2023年获FDA药物评估和研究中心(CDER)批准上市的小分子药物,并总结了每个药物的分子结构、靶点/机制、研发公司,制作成图表。以下文字内容大多参考自FDA官方的药物说明书和分子结构图底下的参考资料。部分的数据除非特别引用,一般是参考维基百科和药企官方公告。
智药邦
2024/03/19
6430
2023年获FDA批准的小分子新药及药物设计思路
Nat. Commun. | 深度学习驱动的酶动力学参数预测模型CataPro助力高效酶挖掘与改造
在生物催化领域,酶作为高效、特异性强的生物催化剂,在工业生产中发挥着至关重要的作用,广泛应用于制药、化工、食品饮料加工以及生物燃料合成等行业。酶挖掘的目的是从自然界中(比如微生物、植物、动物来源)中筛选和鉴定具有特定催化功能的新酶,以满足不同工业应用的需求。然而,自然界中的野生酶往往难以满足工业生产对其催化效率等性能的要求,因此需要对其进行优化和改造以进一步提高其工业适用性。传统的酶挖掘和酶改造方法主要依赖湿实验,这一过程耗时长且成本高昂,并且受实验条件的限制,筛选范围有限。而基于理性设计的酶改造依赖于对酶的结构、功能和作用机制的深入理解,这在许多情况下难以全面获取,进一步增加了酶改造的难度。近年来,随着计算技术的迅猛发展,基于深度学习的酶挖掘和改造方法逐渐兴起,为这一领域带来了新的希望。
DrugAI
2025/03/27
1880
Nat. Commun. | 深度学习驱动的酶动力学参数预测模型CataPro助力高效酶挖掘与改造
Angew. Chem. Int. Ed. | 通过荧光偏振和原位合成筛选抑制剂:加速药物发现的有效方法
今天为大家介绍的是来自中国药科大学张晓进教授团队在Angewandte上发表的一篇论文,该论文将荧光偏振与原位抑制剂合成结合起来,提出一个原位抑制剂合成与筛选(ISISS)的策略,将高通量合成与高通量筛选集成为一体,极大提高发现先导化合物的效率。
DrugAI
2024/11/23
2250
Angew. Chem. Int. Ed. | 通过荧光偏振和原位合成筛选抑制剂:加速药物发现的有效方法
mLife|华东师范大学张鲁嘉团队:高效的酶智能设计平台NAC4ED
计算方法包括分子对接、分子动力学、量子力学和多尺度QM/MM方法等,已被广泛用于研究酶催化机制和酶的设计。但这些会涉及大量手动操作,这显然对高通量方式模拟酶和突变体是不友好的。
智药邦
2025/01/07
5370
mLife|华东师范大学张鲁嘉团队:高效的酶智能设计平台NAC4ED
eLife | NICEdrug.ch : 可进行药物代谢分析的药设平台
今天给大家介绍的文章来自瑞士洛桑联邦理工学院计算系统生物技术实验室,于2021年8月发表于elife期刊上。该论文开发了一个药物设计平台(数据库),收录了25万个具有生物活性的小分子,并研究了它们的代谢产物、代谢过程和毒性。该论文提出基于代谢物与活性位点相似性指纹的评分方法NICEDrug来评价抗癌药物5-氟尿嘧啶的抑制作用和毒性,并提出减轻副作用的途径。该论文还发现了shikimate 3-phosphate可用于治疗liver-stage疟疾。此外,NICEDrug提供了1300多种针对COVID-19的候选药物,并阐述了此类分子的抑制机制。
DrugAI
2021/08/24
7820
JCIM|VenomPred2.0:基于AI的药物分子毒性预测工具
人工智能和机器学习方法在计算毒理学和药物设计中的应用越来越受欢迎,这一方法在评估化合物安全性、优化ADMET以及满足3R原则(the rules of 3R)等领域被认为非常具有前景。
智药邦
2024/05/08
1.1K3
JCIM|VenomPred2.0:基于AI的药物分子毒性预测工具
基于生成式深度学习方法设计潜在2019-nCoV蛋白酶抑制剂
没有疫苗和任何已知有效治疗方法的2019-nCoV的出现给新型药物发现方法带来了紧迫感。最重要的2019-nCoV蛋白靶标之一是3C样蛋白酶,其晶体结构已知。近期的大部分努力都集中在重新利用已知临床批准药物的药物上,以及对分子库的分子进行虚拟筛选。Insilico Medicine于2020年1月28日决定利用其生成化学方法来设计2019-nCoV的新型抑制剂,进行合成和测试,并根据需要优化已发布的分子。
DrugAI
2021/01/29
3840
生物降解芳香族化合物的分子检测技术研究进展
本文总结了目前关于芳香族化合物环羟基化加氧酶基因的数据库,介绍了微生物降解芳香族化合物(苯系物、萘及其它多环芳烃)过程中发挥重要作用的各类功能基因,总结了环境检测中使用的分子引物,并综述了它们在各类复杂环境样本中的检测应用,此外对使用宏基因组技术来研究微生物在环境中降解芳香族化合物的能力进行了总结与展望.
Listenlii-生物信息知识分享
2020/06/01
1.9K0
生物降解芳香族化合物的分子检测技术研究进展
Nat. Commun.| 将酶化学和合成化学与计算合成规划相结合
这次为大家报道的是Nature Communiations 上一篇题为”Merging enzymatic and synthetic chemistry with computational synthesis planning” 的文章,来自美国马萨诸塞州麻省理工学院的Connor W. Coley团队。
DrugAI
2023/02/13
8170
Nat. Commun.| 将酶化学和合成化学与计算合成规划相结合
Nat. Commun. | 酶功能预测新方法TopEC!基于3D图神经网络的局部特征描述
今天为大家介绍的是来自德国于利希研究中心(Forschungszentrum Jülich GmbH)和黑尔姆霍兹人工智能中央单位(Helmholtz AI Central Unit)的一篇论文。从一般序列、结构折叠或进化信息推断酶功能的现有工具通常都很成功。然而,如果局部结构特征的偏差影响了功能,这些工具可能会导致错误分类。在此,作者提出了TopEC,一种基于局部化3D描述符的3D图神经网络,用于从酶结构中学习酶的化学反应并预测酶委员会(EC)分类。通过使用消息传递框架,作者纳入了距离和角度信息,与常规2D图神经网络相比,显著提高了EC分类的预测性能(F score:0.72)。作者训练了没有结构折叠偏差的网络,可以对广泛的功能空间(>800个EC)中的酶结构进行分类。作者的模型对结合位点位置的不确定性以及不同结合位点中的相似功能具有稳健性。作者观察到TopEC网络从生物化学特征和局部形状依赖特征之间的相互作用中进行学习。TopEC可在GitHub上获取:https://github.com/IBG4-CBCLab/TopEC和https://doi.org/10.25838/d5p-66
DrugAI
2025/04/02
1500
Nat. Commun. | 酶功能预测新方法TopEC!基于3D图神经网络的局部特征描述
催化能力提高 3.5 倍!中科院团队基于扩散模型,开发 P450 酶从头设计方法 P450Diffusion
中国科学院天津工业生物技术研究所的新酶设计团队,开发了基于扩散模型和口袋设计原则的 P450 酶从头设计方法 P450Diffusion。
HyperAI超神经
2024/07/29
1780
催化能力提高 3.5 倍!中科院团队基于扩散模型,开发 P450 酶从头设计方法  P450Diffusion
Nat Commun|星药科技为天然产物生物合成路线规划提供导航
天然产物(Natural Products)是临床药物开发的主要来源,解析天然产物的生物合成途径是实现生物合成中最基础的一步。然而,目前超过90%的天然产物的生物合成途径仍然未知。星药科技联合中山大学药学院巫瑞波教授课题组、国家超算广州中心杨跃东教授课题组、美国麻省理工学院和佐治亚理工学院,基于此前化学逆合成反应智能预测研究,依托“天河二号”开发了基于深度学习的天然产物生物合成途径导航器BioNavi-NP, 并在多个公开测试集中获得出色验证,是AI+超算开展科技创新的又一个实践。该研究对天然产物生源途径的发现,以及异源生物合成途径的重构具有重要意义。相关成果6月正式发表在国际知名期刊《Nature Communications》。
智药邦
2022/11/16
4680
Nat Commun|星药科技为天然产物生物合成路线规划提供导航
Nat. Commun. | 新评测基准CatPred!助力体外酶动力学参数预测
今天为大家介绍的是来自宾夕法尼亚州立大学Costas D. Maranas团队的一篇论文。酶活性的测定仍然主要依赖于实验方法,这些方法通常既耗时又昂贵。作者提出了CatPred,这是一个用于预测体外酶动力学参数的深度学习框架,包括周转数(kcat)、米氏常数(Km)和抑制常数(Ki)。CatPred解决了几个关键挑战,如缺乏标准化数据集、在与训练时使用的酶序列不相似的酶序列上评估性能,以及模型不确定性量化。作者探索了多种学习架构和特征表示方法,包括预训练的蛋白质语言模型和三维结构特征,以实现稳健的预测。CatPred提供准确的预测结果并附带特定查询的不确定性估计,其中预测方差较低与预测准确度较高相关。预训练的蛋白质语言模型特征特别增强了对分布外样本的性能表现。CatPred还引入了覆盖范围广泛的基准数据集(kcat约23,000个、Km约41,000个和Ki约12,000个数据点)。作者的框架与现有方法相比表现具有竞争力,同时提供可靠的不确定性量化。
DrugAI
2025/03/27
1600
Nat. Commun. | 新评测基准CatPred!助力体外酶动力学参数预测
从零开始学PCR技术(二):Taq DNA酶
1986 年,Mullis 发明了 PCR 技术,当时使用的是大肠杆菌聚合酶 I(Klenow),而这个酶是不耐热的,在反应体系温度升高使 DNA 变性的过程中会失去活性,因而每次循环都要加入新的聚合酶,操作十分麻烦,不能做到无人值守,成本也很高。
简说基因
2020/12/02
1.7K0
从零开始学PCR技术(二):Taq DNA酶
【生信文献200篇】18 新的抑癌基因LHPP
「英文标题:The protein histidine phosphatase LHPP is a tumour suppressor」
生信菜鸟团
2021/03/04
1.2K0
【生信文献200篇】18 新的抑癌基因LHPP
Nat. Biotechnol. | 绘制药物代谢扰动图谱,解码1520种药物的隐秘作用机制
今天为大家介绍的是来自瑞士巴塞尔大学Mattia Zampieri团队的一篇论文。理解小分子的作用模式(mode of action,MoA)对于指导先导化合物的选择、优化和临床开发至关重要。在本研究中,作者使用高通量非靶向代谢组学技术,分析了1,520种药物在A549肺癌细胞中引起的2,269种推定代谢物的变化。尽管只有26%的药物抑制了细胞生长,但86%的药物导致了细胞内代谢变化,这些变化在另外两种癌细胞系中基本保持一致。通过测试超过340万种药物-代谢物依赖关系,作者生成了一个药物干扰代谢的查询表,实现了在单次筛选中对各种药物治疗类别的化合物进行高通量表征。所发现的代谢变化揭示了药物以前未知的作用,扩展了它们的MoA注释和潜在的治疗应用。作者确认了基于代谢组预测的四种新型糖皮质激素受体激动剂、两种非常规3-羟基-3-甲基戊二酰辅酶A(HMGCR)抑制剂和两种二氢乳清脱氢酶(DHODH)抑制剂。此外,作者证明了代谢组分析可以补充其他表型和分子分析技术,为提高临床前药物发现的效率、规模和准确性创造了机会。
DrugAI
2025/03/17
700
Nat. Biotechnol. | 绘制药物代谢扰动图谱,解码1520种药物的隐秘作用机制
推荐阅读
前瞻 | 溶质载体 (SLC):代谢的看门人 | Cell
2280
ICML 2024 | 基于重要功能位点与小分子底物的生成式酶设计
1700
PNAS | 基于结构感知图卷积网络预测蛋白酶特异性功能
4230
铜死亡丨解锁细胞死亡新方式 - MedChemExpress
7650
2023年获FDA批准的小分子新药及药物设计思路
6430
Nat. Commun. | 深度学习驱动的酶动力学参数预测模型CataPro助力高效酶挖掘与改造
1880
Angew. Chem. Int. Ed. | 通过荧光偏振和原位合成筛选抑制剂:加速药物发现的有效方法
2250
mLife|华东师范大学张鲁嘉团队:高效的酶智能设计平台NAC4ED
5370
eLife | NICEdrug.ch : 可进行药物代谢分析的药设平台
7820
JCIM|VenomPred2.0:基于AI的药物分子毒性预测工具
1.1K3
基于生成式深度学习方法设计潜在2019-nCoV蛋白酶抑制剂
3840
生物降解芳香族化合物的分子检测技术研究进展
1.9K0
Nat. Commun.| 将酶化学和合成化学与计算合成规划相结合
8170
Nat. Commun. | 酶功能预测新方法TopEC!基于3D图神经网络的局部特征描述
1500
催化能力提高 3.5 倍!中科院团队基于扩散模型,开发 P450 酶从头设计方法 P450Diffusion
1780
Nat Commun|星药科技为天然产物生物合成路线规划提供导航
4680
Nat. Commun. | 新评测基准CatPred!助力体外酶动力学参数预测
1600
从零开始学PCR技术(二):Taq DNA酶
1.7K0
【生信文献200篇】18 新的抑癌基因LHPP
1.2K0
Nat. Biotechnol. | 绘制药物代谢扰动图谱,解码1520种药物的隐秘作用机制
700
相关推荐
前瞻 | 溶质载体 (SLC):代谢的看门人 | Cell
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档