首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >四川大学刘祥根团队:通过自适应模拟退火算法进行靶点特异药物设计

四川大学刘祥根团队:通过自适应模拟退火算法进行靶点特异药物设计

作者头像
智药邦
发布2025-02-19 23:47:38
发布2025-02-19 23:47:38
2430
举报
文章被收录于专栏:智药邦智药邦

靶向药物设计这一新兴领域引起了人们的广泛关注,其重点是识别对特定靶点具有高结合亲和力的化合物。然而,现有的针对特定靶点的深度生成模型面临着显著的挑战。一些模型严重依赖复杂的数据集和复杂的训练方法,而另一些模型忽视了药物设计中固有的多约束优化问题,导致生成的分子结构或化学性质不合理。

2024年12月4日,四川大学刘祥根老师团队在Bioinformatics上发表文章TargetSA: adaptive simulated annealing for target-specific drug design。

作者提出了一个新的框架(TargetSA),利用自适应模拟退火(SA)进行靶点特异药物分子生成和多约束优化。SA过程探索分子的离散结构空间,逐步收敛到满足预定目标的最优解。为了设计新的化合物,模型首先根据数据预测有希望的现有药物分子编辑位置,然后迭代编辑分子图。这些操作共同构成了一个完整的操作集,便于对类药空间进行深入的探索。此外,作者引入了可逆采样策略来重新接受当前次优解。实验证明了TargetSA的性能超越了现有方法。

如图1所示,TargetSA框架包括模拟退火(SA)过程和可逆抽样策略(图1a)。SA是一种基于启发式算法的随机优化算法。在本文中,通过SA算法探索药物分子离散的化学空间,通过启发式地局部迭代修正来达到预定的目标。在每次迭代中,SA选择一个新的候选分子,并根据考虑解的质量和当前退火温度的概率确定其接受度。对于较好的解决方案,接受概率保持为1,对于较差的解决方案,接受概率逐渐降低到0。理论上,只要提议机制和温度计划满足一定条件,SA就能保证在有限问题下收敛到全局最优。

图1 TargetSA结构图

在SA过程中,在每个步骤t中,TargetSA编辑当前分子,提出一个新的候选解⁠。如果候选解分数越高以超过设置的阈值(类比于模拟退火过程中的“温度”),则立即接受。否则,TargetSA倾向于拒绝该解,但仍可能以小概率接受它⁠。这种初始的高温设置使得对化学空间的彻底探索成为可能。随后,温度逐渐降低,有利于收敛到一个特定的最优解。迭代SA过程,得到一组目标函数值优于原始输入的新化合物⁠。

模型的目标函数是鉴定与靶点紧密结合,具有高药物相似性和合成可及性的新化合物。因此,需要优化三个属性:即生成的分子与目标物的对接亲和力(docking affinity)、合成的难度(synthesis difficulty)和类药性(druglikeness)。作者选择了112个类似药物的片段作为优化的起点,而不是从头开始生成。为了促进结构多样性,避免对任何单一骨架类型的过度依赖,片段之间的Tanimoto相似性被限制在0.8以下,即添加相似性约束(similarity constraint)。新生成的分子有望在保持输入片段结构特征的同时表现出新颖性和多样性。新分子与输入片段的相似度应控制在合理范围内。此外,违反化学规则的分子必须被排除在外。因此,作者设计了一个额外的函数来强制约束价态有效性(covalence validity)条件。换句话说,一个新生成的分子只有SMILES语法正确,且与现有片段相似度大于某个设定的阈值时,才被认为是有效的。此外,将无效分子的分数设为负无穷大,以防止它们被采样。以上条件如图1c所示。

作者将分子生成任务建模为图编辑过程(图1b)。在每个搜索步骤中,历史信息引导的位置预测器(图1d)提供一个潜在的编辑位置,然后候选分子生成器通过从完整操作集中采样的局部编辑操作提出新的候选分子。

在修改分子结构之前,选择合适的位置进行编辑是至关重要的。虽然随机选择看起来很简单,但有些位置可能不利于有效的编辑。为了解决这个问题,作者设计了一个基于历史经验的位置预测器。简而言之,作者收集了随机选择位置的分子,并构建了矩阵来跟踪每个原子的编辑频率,这可以作为其编辑潜力的指标。作者将位置预测任务表述为节点分类问题,利用图同构网络(GIN)来生成基于分子图特征的原子级表示,同时与分子图的节点(原子)和边(化学键)特征结合,这些特征包括原子属性,如类型和手性,以及边属性,如键类型和立体化学属性。

对于一个给定的分子,作者使用GIN来预测其编辑频率矩阵,然后选择top-K个位置作为候选集,最终编辑位置,随后从该集合中采样。编辑操作的集合包括四种操作:插入、删除、替换、环化(insertion,deletion,replacement,cyclization),以生成新分子。插入操作符提出一个候选节点原子和一个新的化学键边连接。删除操作符删除选定位置的原子及其连接的化学键。值得注意的是,去除原子可能会破坏分子结构的有效性,因而需要进行检查,然后采样一个符合规则的分子作为候选。对于替换操作符,它建议一个候选节点原子变成另一种原子。类似地,环化操作符连接两个相邻的原子以建立一个新的键,从而创建一个新的环结构。

每个分子都可以分解成树形结构和环状结构。树形结构是指由单个原子或侧链组成的无环亚结构,而环状结构则包括环状结构,如五元环和苯环。每个树形结构都可以通过插入和替换操作符从单个原子派生出来,而环结构可以通过环化操作符从树形结构或其他环结构派生出来。因此,操作集是完全可以从零开始生成分子的。在此基础上,分子优化过程涉及分子转化,其一种途径是通过迭代删除节点和边,直到达到针对某靶点的几种现有药物分子共享的最大公共子结构。随后,分子可以从这个子结构出发,通过插入、替换和环化,逐步生成新分子。

传统的SA算法在目标函数得分较低时通常会拒绝候选解,然而,作者的可逆采样策略允许在最后输出结果前进行第二次编辑。如果得到的分子从这个二次编辑过程仍然不令人满意,即舍弃。否则,模型将重复一次循环,判定分子是否可以接受。这种重新接受的过程被定义为“可逆采样”。

作者将TargetSA与一些具有代表性的方法进行了比较,如表1所示,将Vina对接分数(越低越好),亲和力(越高越好),类药性(QED,越高越好),合成可及性(SA,越高越好),多样性(Div,越高越好)作为评价指标,对比多次实验的平均数(Avg)与中位数(Med)。结果表明,TargetSA超越了现有方法。添加历史信息引导的位置预测器的TargetSA性能超过了未添加的TargetSA-wo-pos。

表1 与其他方法对比

作者设计了消融实验来验证模型设计的有效性。在表2中,作者对每个设计组件的贡献进行了全面评估。完整的框架表示为TargetSA, TargetSA-wo-pos表示排除历史信息引导的位置预测器的变体(即随机选择位置),TargetSA-wo-reverse对应于没有可逆采样策略的版本。而TargetSA-origin则缺乏这两个组件。结果表明,两种设计的组分都显著增强了结合亲和力。此外,TargetSA-origin优于参考,强调了作者基于编辑的生成和优化策略的有效性。

表2 消融实验

作者还进行了案例分析。作者选择功能复杂的sigma-2受体作为靶点(PDB ID: 7M95)。最近的研究表明,sigma-2配体在神经性疼痛模型中表现出抗变动力特性,这表明为sigma-2受体设计选择性配体可能会推动新型镇痛药物的发现。如图4所示,RGA算法生成了一个不太适合目标口袋的复杂结构。同样,DiffSBDD算法产生的长链分子未能有效捕获空腔,QED评分较低。相比之下,TargetSA产生的配体完全占据了口袋,在保持高QED和SA分数的同时,增强了结合亲和力。

图2 案例分析

在这项工作中,作者提出了TargetSA,这是首个专门为靶点特异性药物分子生成和多约束优化设计的基于模拟退火的框架。通过将元启发式算法与强大的神经网络相结合,该方法有效地限制了类药化合物的搜索空间,通过四个简单而有效的操作,即插入、删除、替换和环化,迭代编辑分子图来生成新的化合物。传统的搜索算法在新的应用场景中重新焕发活力,与最新的深度生成模型相比,实现了更为先进的性能。TargetSA可以为任何靶点生成新的配体,因为其既不需要对广泛的蛋白质配体复合物进行预训练,也不需要在靶点发生变化时从头开始重新训练,有望在更多的实际靶点特异性药物发现场景中得到广泛应用。

参考文献

Xue et al. TargetSA: adaptive simulated annealing for target-specific drug design. Bioinformatics. 2024

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档