首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >计算机辅助药物设计的流程梳理

计算机辅助药物设计的流程梳理

原创
作者头像
追风少年i
发布2026-05-27 10:03:10
发布2026-05-27 10:03:10
200
举报

作者,Evil Genius

整理了分子对接和分子动力学,我们来梳理一下计算机辅助药物设计的流程。

小分子药物设计是一个快速发展的领域,它具有革新新药物开发的潜力。随着结构生物学和计算方法的不断进步,研究人员对分子结构与药效关系的理解不断扩大,正在寻找设计比以往更有效、更选择性和更安全的小分子化合物的新颖创新方法。

第一步:预测蛋白质三维结构

蛋白质三维结构的确定可以通过各种方法,例如X射线衍射技术、冷冻电镜术、核磁共振波谱学和预测技术。准确预测三维蛋白质结构已经成为药物设计领域的关键方面,在近年来受到广泛关注。理解蛋白质的三维结构对阐明药物结合机制和促进设计亲和力和特异性增强的化合物至关重要。值得注意的是,随着计算技术的显著进步,药物发现领域发生了革命性的变化,这促进了对蛋白质结构的预测与极高精度。

预测蛋白质结构中最广泛使用的计算方法之一是同源建模。

同源建模,也称为比较建模,利用已知相关蛋白质的结构来预测目标蛋白质的结构。这个方法假设进化相关的蛋白质具有相似的结构,并且与序列相比,蛋白质的结构是更为保守的。

>1.模板选择:从蛋白质结构数据库中选择适当的模板结构。模板结构应该与目标蛋白质序列有很高的同源性,并且应该具有相似的功能或折叠。

如使用BLAST,来识别蛋白质结构数据库中的同源序列。

2.序列比对:第二步是将目标蛋白质序列与所选模板结构进行比对。比对应该进行优化,以确保目标和模板结构之间的保守区域正确对齐。使用几种算法,如ClustalW和MUSCLE,来执行序列比对。

3.模型构建:在这一步中,根据目标和模板序列的比对结果生成目标蛋白质的三维模型。该模型是通过将目标序列叠加到模板结构上并调整边链以适应目标序列而构建的。几种软件程序, 如MODELLER和SWISS-MODEL,用于模型构建。

>4.模型优化:一旦生成初始模型,就要对其进行优化以提高其准确性。这一步包括优化边链取向、最小化结构能量以及执行结构验证,以确保模型在生物学上是合理的。一些软件程序,如CHARMM和GROMACS,用于模型优化。

预测蛋白质结构的另一种方法是denovo蛋白质结构预测,它涉及从头预测一个蛋白质的结构,而不依赖已知的结构。这种方法基于物理原理,如能量最小化和自由能计算来预测蛋白质的结构。

1.片段组装:Denovo蛋白质结构预测的第一步是片段组装。这涉及将蛋白质序列分解成较小的片段,并预测这些片段在三维空间中的相对取向。可以使用物理法或统计法组装片段。物理法计算系统的能量以确定片段的优化取向,而统计法则使用基于已知结构的特定片段组装的可能性。

2.模型构建:一旦组装了片段,下一步是模型构建,其中通过以满足空间约束的方式连接片段来构建完整的三维模型,如堆积碰撞和键角。模型构建过程可以由基于知识的能量函数指导,该函数为模型的质量提供评分,或者由从先前的成功预测中学习的机器学习算法指导。

3.模型优化:Denovo蛋白质结构预测的最后一步是模型优化,这涉及优化三维模型以提高其准确性和整体质量。这可以通过分子动力学模拟、能量最小化算法或机器学习方法来实现。

同源建模和denovo结构预测等计算方法使蛋白质结构的预测达到了高精度,这为药物发现领域带来了革命性的变化。

准确预测蛋白质结构的能力还导致了针对以前认为“不可药效”的蛋白质开发新药物的发展。

配体结合口袋在SBDD中的关键作用

配体结合口袋在基于结构的小分子药物设计中起着关键作用。这种设计方法的起点是这样一个假设,即药物分子通过与靶向蛋白质受体(通常是蛋白质)的特异性结合来发挥其生物活性。

结合口袋是指靶向蛋白质表面上的一个有限的空间区域,腔或凹陷,配体在其中与蛋白质结合并发生相互作用的部位。

第二步:小分子药物的结构分析

两种主要类型的药物是小分子药物和生物制剂。

小分子药物通常通过化学合成,并且比生物制剂简单。它们被设计为针对与疾病过程相关的特定分子,并且通常具有定义的结构,允许它们与这些靶点高特异性地结合。

生物制剂通常是由活细胞产生的大型复杂分子,如蛋白质,它们被设计为与人体内的特定受体或通路相互作用。

官能团是小分子药物设计的关键结构特征之一。如羟基(-OH)、羧基(-COOH)和氨基(-NH2)等官能团的存在可以使小分子与特定的酶(受体)相互作用并在体内赋予特定的药理学特性。

例如,乙醇分子中羟基的存在可以使它们与大脑中的受体相互作用,导致众所周知的饮酒效应。

立体化学是小分子药物设计的一个关键方面,指一个分子中原子的三维布局以及这种布局如何影响分子与生物靶点的相互作用。例如,抗炎药异布比酮的活性形式具有特定的立体化学,这使其能够与环加氧酶结合并抑制其活性。

分子量在小分子药物设计中也是一个重要的考虑因素,它可以影响药物的药代动力学和药效动力学。例如,低分子量的药物可以被体内快速吸收和排泄,而高分子量的药物可能有更长的半衰期和需要更低的剂量。

分子的大小和形状可以影响其物理和化学性质。例如,较大的分子往往比小分子具有更高的沸点和熔点。

分子中特定化学键的存在可以影响其结构和性质。例如,共价键是通过两个原子之间共享价壳电子对形成的,IV到VI族的原子结合以完成价壳层八电子。

分子的电荷特性,如偶极矩和电荷分布,可以影响其与其他分子的相互作用及其反应活性。通过了解这些结构特征的重要性,研究人员可以设计小分子药物候选化合物,优化其药理学特性并减少副作用。

第三步:小分子药物设计的计算方法

分子对接是小分子药物设计中使用的主要计算方法之一。

分子对接涉及预测小分子(称为配体)与较大的靶点(如蛋白质或核酸)之间的结合亲和力和取向。

对接算法使用能量最小化和评分函数来评估配体-蛋白质复合物的稳定性并对潜在的药物候选化合物进行排名。

对接过程有助于研究人员深入了解各种生物过程(如药物-蛋白质相互作用、蛋白质-蛋白质相互作用和酶促反应)的分子机制。

随着计算机技术和生命科学领域的融合,分子对接也取得了巨大进步,显著增强了这项技术的精确性和有效性。

(i)自由能微扰(FEP)和热力学积分(Ti)等ALCHEMICAL自由能方法已被开发来计算配体与蛋白质的结合自由能。这些方法可以比传统对接方法提供更准确的结合亲和力预测。

(ii)开发了新的对接工具,如HADDOCK和RosettaDock,可以将蛋白质柔性引入对接模拟。这些工具可以预测配体结合导致的蛋白质构象变化,从而提高对接预测的准确性。

(iii)机器学习已被纳入对接工具以提高其预测准确性。

相关研究探讨了使用随机森林回归作为传统线性回归方法的替代方法,并证明了改进的预测性能。这些研究突出了机器学习技术(包括随机森林回归)在预测蛋白质-配体相互作用中的结合亲和力方面的潜力。通过训练已知的配体-蛋白质复合物,具有实验测定的结合亲和力,机器学习模型可以学习模式并对新的、未知的复合物进行预测。

虚拟筛选

虚拟筛选是使用分子对接或其他技术对大量化合物库进行筛选,以识别潜在的药物候选化合物。·节省成本和时间,帮助研究人员缩小进一步实验分析的化合物数量。

用于识别可能与靶向蛋白质结合的小分子。

实现工具:GOLD、GLIDE和AutoDock Vina等。AutoDock Vina是免费的且能提供良好结果的用于虚拟筛选的工具。

虚拟筛选结果的准确性取决于蛋白质结构和化合物库的质量。

虚拟筛选过程不考虑化合物的药代动力学和毒理学特性。

通过虚拟筛选识别的化合物需要实验验证,以确定其疗效和安全性。

分子动力学模拟

MD模拟是一种强大的计算工具,用于研究体系中原子和分子的物理运动和相互作用。

MD模拟按时间积分牛顿运动方程,以获得体系中原子/分子的运动,从而在原子水平上提供该体系宏观行为的定量和定性信息。

MD模拟提供了研究系统“演化”动态的“电影”。

(i)深度学习算法越来越多地应用于MD模拟。例如,原子卷积网络已用于直接从分子的原子坐标预测分子的势能,这可以显著提高MD模拟的准确性

(ii)开发了增强取样技术,如metadynamics,以克服传统MD模拟的局限性。这些技术可以探索更大的构象空间,并提供系统能量面更准确的代表。

(iii)粗粒度模型通过将原子集合在一起来简化系统的表示,从而降低了MD模拟的计算成本。这些模型可以模拟传统全原子模型无法模拟的更大系统和更长时间尺度。

量子力学/分子力学计算

量子力学/分子力学(QM/MM)计算是一种强大的计算方法,用于在原子和分子水平研究化学和生化系统。QM/MM方法将量子力学计算的精确性与分子力学模拟的速度相结合,来研究化学和生化系统,这使其成为研究溶液或酶中的化学和生化系统的有价值工具。QM/MM计算可以提供准确的反应能和反应路径计算。

在传统的分子力学和量子力学计算中,仅考虑给定冻结配置系统内分子和分子间相互作用,通常不带显式溶剂化。

QM/MM方法可以通过将QM区域视为溶质(或关键区域)和MM区域视为溶剂(或非关键区域)来考虑溶剂化效应。

QM/MM方法由Warshel和Levitt在1976年首次提出。从那时起,它已被广泛用于研究各种化学和生化系统,包括酶、反应机制和蛋白质-配体结合相互作用。

QM/MM方法能够模拟仅用量子力学方法很难有效处理的较大系统。

机器学习算法在预测小分子的性质方面越来越受欢迎。这些算法使用计算方法来预测潜在小分子药物候选化合物的性质,例如溶解度、毒性和结合亲和力。

机器学习算法在预测小分子药物候选化合物的性质方面展示了巨大的前景。这些算法有望革新药物发现,减少对昂贵实验方法的需求,使药物开发更快更高效。

目前计算方法的局限性

蛋白质灵活性:传统的对接算法通常将蛋白质视为刚性体,这是一个非常大的简化。蛋白质高度动态并可以采用一系列构象。考虑这种灵活性是对接算法的一个重大挑战。

评分函数:对接算法中用于预测配体与蛋白质的结合亲和力的评分函数通常不准确。它们通常基于分子间相互作用的简化模型,不能完全捕获这些相互作用的复杂性。

溶剂效应:许多对接算法没有充分考虑溶剂的影响。溶剂可以在相互作用中发挥关键作用,忽略这些效应会导致不准确的预测。

时间尺度:分子动力学模拟可以模拟分子的动态行为,但它们受可以模拟的时间范围的限制。大多数模拟在纳秒到微秒尺度上,而许多生物过程发生在毫秒到秒尺度上。

计算成本:对接和分子动力学模拟计算量都很大。这限制了可以研究的系统的大小和可以执行的模拟的长度。

实验数据的缺乏:对接和分子动力学模拟的预测通常缺乏实验数据进行验证。这使得很难评估这些方法的准确性。

预测诱导配合的困难:许多对接算法在预测配体与蛋白质结合时发生的构象变化(称为诱导配合)方面遇到困难。

预测非靶向效应的局限:虽然计算方法在预测药物与其预期靶点的相互作用方面正在改进,但预测潜在的非靶向效应仍然是一个重大挑战。

生活很好,有你更好。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 作者,Evil Genius
  • 整理了分子对接和分子动力学,我们来梳理一下计算机辅助药物设计的流程。
  • 小分子药物设计是一个快速发展的领域,它具有革新新药物开发的潜力。随着结构生物学和计算方法的不断进步,研究人员对分子结构与药效关系的理解不断扩大,正在寻找设计比以往更有效、更选择性和更安全的小分子化合物的新颖创新方法。
  • 第一步:预测蛋白质三维结构
  • 蛋白质三维结构的确定可以通过各种方法,例如X射线衍射技术、冷冻电镜术、核磁共振波谱学和预测技术。准确预测三维蛋白质结构已经成为药物设计领域的关键方面,在近年来受到广泛关注。理解蛋白质的三维结构对阐明药物结合机制和促进设计亲和力和特异性增强的化合物至关重要。值得注意的是,随着计算技术的显著进步,药物发现领域发生了革命性的变化,这促进了对蛋白质结构的预测与极高精度。
  • 预测蛋白质结构中最广泛使用的计算方法之一是同源建模。
  • 同源建模,也称为比较建模,利用已知相关蛋白质的结构来预测目标蛋白质的结构。这个方法假设进化相关的蛋白质具有相似的结构,并且与序列相比,蛋白质的结构是更为保守的。
  • >1.模板选择:从蛋白质结构数据库中选择适当的模板结构。模板结构应该与目标蛋白质序列有很高的同源性,并且应该具有相似的功能或折叠。
  • 如使用BLAST,来识别蛋白质结构数据库中的同源序列。
  • 2.序列比对:第二步是将目标蛋白质序列与所选模板结构进行比对。比对应该进行优化,以确保目标和模板结构之间的保守区域正确对齐。使用几种算法,如ClustalW和MUSCLE,来执行序列比对。
  • 3.模型构建:在这一步中,根据目标和模板序列的比对结果生成目标蛋白质的三维模型。该模型是通过将目标序列叠加到模板结构上并调整边链以适应目标序列而构建的。几种软件程序, 如MODELLER和SWISS-MODEL,用于模型构建。
  • >4.模型优化:一旦生成初始模型,就要对其进行优化以提高其准确性。这一步包括优化边链取向、最小化结构能量以及执行结构验证,以确保模型在生物学上是合理的。一些软件程序,如CHARMM和GROMACS,用于模型优化。
  • 预测蛋白质结构的另一种方法是denovo蛋白质结构预测,它涉及从头预测一个蛋白质的结构,而不依赖已知的结构。这种方法基于物理原理,如能量最小化和自由能计算来预测蛋白质的结构。
  • 1.片段组装:Denovo蛋白质结构预测的第一步是片段组装。这涉及将蛋白质序列分解成较小的片段,并预测这些片段在三维空间中的相对取向。可以使用物理法或统计法组装片段。物理法计算系统的能量以确定片段的优化取向,而统计法则使用基于已知结构的特定片段组装的可能性。
  • 2.模型构建:一旦组装了片段,下一步是模型构建,其中通过以满足空间约束的方式连接片段来构建完整的三维模型,如堆积碰撞和键角。模型构建过程可以由基于知识的能量函数指导,该函数为模型的质量提供评分,或者由从先前的成功预测中学习的机器学习算法指导。
  • 3.模型优化:Denovo蛋白质结构预测的最后一步是模型优化,这涉及优化三维模型以提高其准确性和整体质量。这可以通过分子动力学模拟、能量最小化算法或机器学习方法来实现。
  • 同源建模和denovo结构预测等计算方法使蛋白质结构的预测达到了高精度,这为药物发现领域带来了革命性的变化。
  • 准确预测蛋白质结构的能力还导致了针对以前认为“不可药效”的蛋白质开发新药物的发展。
  • 配体结合口袋在SBDD中的关键作用
  • 配体结合口袋在基于结构的小分子药物设计中起着关键作用。这种设计方法的起点是这样一个假设,即药物分子通过与靶向蛋白质受体(通常是蛋白质)的特异性结合来发挥其生物活性。
  • 第二步:小分子药物的结构分析
  • 两种主要类型的药物是小分子药物和生物制剂。
  • 小分子药物通常通过化学合成,并且比生物制剂简单。它们被设计为针对与疾病过程相关的特定分子,并且通常具有定义的结构,允许它们与这些靶点高特异性地结合。
  • 生物制剂通常是由活细胞产生的大型复杂分子,如蛋白质,它们被设计为与人体内的特定受体或通路相互作用。
  • 官能团是小分子药物设计的关键结构特征之一。如羟基(-OH)、羧基(-COOH)和氨基(-NH2)等官能团的存在可以使小分子与特定的酶(受体)相互作用并在体内赋予特定的药理学特性。
  • 立体化学是小分子药物设计的一个关键方面,指一个分子中原子的三维布局以及这种布局如何影响分子与生物靶点的相互作用。例如,抗炎药异布比酮的活性形式具有特定的立体化学,这使其能够与环加氧酶结合并抑制其活性。
  • 分子量在小分子药物设计中也是一个重要的考虑因素,它可以影响药物的药代动力学和药效动力学。例如,低分子量的药物可以被体内快速吸收和排泄,而高分子量的药物可能有更长的半衰期和需要更低的剂量。
  • 分子的大小和形状可以影响其物理和化学性质。例如,较大的分子往往比小分子具有更高的沸点和熔点。
  • 分子中特定化学键的存在可以影响其结构和性质。例如,共价键是通过两个原子之间共享价壳电子对形成的,IV到VI族的原子结合以完成价壳层八电子。
  • 分子的电荷特性,如偶极矩和电荷分布,可以影响其与其他分子的相互作用及其反应活性。通过了解这些结构特征的重要性,研究人员可以设计小分子药物候选化合物,优化其药理学特性并减少副作用。
  • 第三步:小分子药物设计的计算方法
  • 分子对接是小分子药物设计中使用的主要计算方法之一。
  • 分子对接涉及预测小分子(称为配体)与较大的靶点(如蛋白质或核酸)之间的结合亲和力和取向。
  • 对接算法使用能量最小化和评分函数来评估配体-蛋白质复合物的稳定性并对潜在的药物候选化合物进行排名。
  • 对接过程有助于研究人员深入了解各种生物过程(如药物-蛋白质相互作用、蛋白质-蛋白质相互作用和酶促反应)的分子机制。
  • 随着计算机技术和生命科学领域的融合,分子对接也取得了巨大进步,显著增强了这项技术的精确性和有效性。
  • (i)自由能微扰(FEP)和热力学积分(Ti)等ALCHEMICAL自由能方法已被开发来计算配体与蛋白质的结合自由能。这些方法可以比传统对接方法提供更准确的结合亲和力预测。
  • (ii)开发了新的对接工具,如HADDOCK和RosettaDock,可以将蛋白质柔性引入对接模拟。这些工具可以预测配体结合导致的蛋白质构象变化,从而提高对接预测的准确性。
  • (iii)机器学习已被纳入对接工具以提高其预测准确性。
  • 相关研究探讨了使用随机森林回归作为传统线性回归方法的替代方法,并证明了改进的预测性能。这些研究突出了机器学习技术(包括随机森林回归)在预测蛋白质-配体相互作用中的结合亲和力方面的潜力。通过训练已知的配体-蛋白质复合物,具有实验测定的结合亲和力,机器学习模型可以学习模式并对新的、未知的复合物进行预测。
  • 虚拟筛选
  • 虚拟筛选是使用分子对接或其他技术对大量化合物库进行筛选,以识别潜在的药物候选化合物。·节省成本和时间,帮助研究人员缩小进一步实验分析的化合物数量。
  • 用于识别可能与靶向蛋白质结合的小分子。
  • 实现工具:GOLD、GLIDE和AutoDock Vina等。AutoDock Vina是免费的且能提供良好结果的用于虚拟筛选的工具。
  • 虚拟筛选结果的准确性取决于蛋白质结构和化合物库的质量。
  • 虚拟筛选过程不考虑化合物的药代动力学和毒理学特性。
  • 通过虚拟筛选识别的化合物需要实验验证,以确定其疗效和安全性。
  • 分子动力学模拟
  • MD模拟是一种强大的计算工具,用于研究体系中原子和分子的物理运动和相互作用。
  • MD模拟按时间积分牛顿运动方程,以获得体系中原子/分子的运动,从而在原子水平上提供该体系宏观行为的定量和定性信息。
  • MD模拟提供了研究系统“演化”动态的“电影”。
  • (i)深度学习算法越来越多地应用于MD模拟。例如,原子卷积网络已用于直接从分子的原子坐标预测分子的势能,这可以显著提高MD模拟的准确性
  • (ii)开发了增强取样技术,如metadynamics,以克服传统MD模拟的局限性。这些技术可以探索更大的构象空间,并提供系统能量面更准确的代表。
  • (iii)粗粒度模型通过将原子集合在一起来简化系统的表示,从而降低了MD模拟的计算成本。这些模型可以模拟传统全原子模型无法模拟的更大系统和更长时间尺度。
  • 量子力学/分子力学计算
  • 量子力学/分子力学(QM/MM)计算是一种强大的计算方法,用于在原子和分子水平研究化学和生化系统。QM/MM方法将量子力学计算的精确性与分子力学模拟的速度相结合,来研究化学和生化系统,这使其成为研究溶液或酶中的化学和生化系统的有价值工具。QM/MM计算可以提供准确的反应能和反应路径计算。
  • 在传统的分子力学和量子力学计算中,仅考虑给定冻结配置系统内分子和分子间相互作用,通常不带显式溶剂化。
  • QM/MM方法可以通过将QM区域视为溶质(或关键区域)和MM区域视为溶剂(或非关键区域)来考虑溶剂化效应。
  • QM/MM方法由Warshel和Levitt在1976年首次提出。从那时起,它已被广泛用于研究各种化学和生化系统,包括酶、反应机制和蛋白质-配体结合相互作用。
  • QM/MM方法能够模拟仅用量子力学方法很难有效处理的较大系统。
  • 机器学习算法在预测小分子的性质方面越来越受欢迎。这些算法使用计算方法来预测潜在小分子药物候选化合物的性质,例如溶解度、毒性和结合亲和力。
  • 机器学习算法在预测小分子药物候选化合物的性质方面展示了巨大的前景。这些算法有望革新药物发现,减少对昂贵实验方法的需求,使药物开发更快更高效。
  • 目前计算方法的局限性
  • 蛋白质灵活性:传统的对接算法通常将蛋白质视为刚性体,这是一个非常大的简化。蛋白质高度动态并可以采用一系列构象。考虑这种灵活性是对接算法的一个重大挑战。
  • 评分函数:对接算法中用于预测配体与蛋白质的结合亲和力的评分函数通常不准确。它们通常基于分子间相互作用的简化模型,不能完全捕获这些相互作用的复杂性。
  • 溶剂效应:许多对接算法没有充分考虑溶剂的影响。溶剂可以在相互作用中发挥关键作用,忽略这些效应会导致不准确的预测。
  • 时间尺度:分子动力学模拟可以模拟分子的动态行为,但它们受可以模拟的时间范围的限制。大多数模拟在纳秒到微秒尺度上,而许多生物过程发生在毫秒到秒尺度上。
  • 计算成本:对接和分子动力学模拟计算量都很大。这限制了可以研究的系统的大小和可以执行的模拟的长度。
  • 实验数据的缺乏:对接和分子动力学模拟的预测通常缺乏实验数据进行验证。这使得很难评估这些方法的准确性。
  • 预测诱导配合的困难:许多对接算法在预测配体与蛋白质结合时发生的构象变化(称为诱导配合)方面遇到困难。
  • 预测非靶向效应的局限:虽然计算方法在预测药物与其预期靶点的相互作用方面正在改进,但预测潜在的非靶向效应仍然是一个重大挑战。
  • 生活很好,有你更好。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档