今天给大家介绍的是北京大学来鲁华课题组在frontiers in Chemistry上发表的文章《LigBuilder V3: A Multi-Target de novo Drug Design Approach》。在文章中,作者提出了第一个从头多靶点药物设计程序LigBuilderV3,可用于设计靶向结合多个受体、一个受体的多个结合位点或一个受体的各种构象的配体。为了证明LigBuilderV3的实用性,作者使用LigBuilderV3,并用三种不同的策略,包括多目标从头设计,多目标增长,和多目标连接,设计了靶向HIV蛋白酶和HIV逆转录酶的双功能抑制剂。设计出的化合物经过MM/GBSA结合自由能估计被验证为计算上有效,有较高的作为HIV蛋白酶和HIV逆转录酶的多靶点药物的潜力。LigBuilderV3程序可以在“http://www.pkumdl.cn/ligbuilder3/”上下载。
一、研究背景
在20世纪的大部分时间里,药物发现过程主要由“一种疾病,一种靶点,一种分子”的哲学所主导,所以研究人员和医药研究所一直在努力针对特定靶点开发药物。虽然有许多通过这种方法开发的药物已经投放市场,但在过去的几十年里,针对新型靶点的新药研发速度明显放缓,被批准的药物也更少。这意味着以前的单靶点药物发现策略具有明显的局限性和缺陷。由于生物网络的复杂性,疾病通常涉及多种因素和生物途径,因此直接干扰单个分子靶点的药物在治疗复杂疾病方面往往缺乏有效性。此外,如果针对一种多种病理相关的疾病只关注其一个靶点,则必须调控通路的上游成分,而这则使药物更有可能具有意想不到的副作用。所以,最近研究人员和制药行业开始将注意力转向开发同时调节多个靶点的治疗方法。
作者开发了一种创新的多目标设计方法,称为LigBuilderV3,它使得从头设计和分子优化算法能够处理多个目标。他们升级了继承自LigBuilderV2的化学空间解释算法,以探索更复杂的多目标配体的结构空间。从头开始设计多靶点配体时,模型会考虑到每个组分组团的多重相互作用,这种从头设计方法有望实现较高的配体效率,这对于多靶点药物非常重要。在LigBuilderV3中也实现了多目标先导化合物优化,这可以帮助研究人员找到可能的多目标优化解决方案。
二、模型与方法
2.1 数据结构和定义
LigBuilderV3使用了与LigBuilderV2相同的遗传算法(GA)。遗传算法是一种受自然选择过程启发的优化算法,它模拟了一个种群在选择压力下的进化。LigBuilderV3使用了GA的重叠生成模型,即新一代的个体从以前的种群中进化出来,然后用GA迭代替换它们的父代。对于典型的GA重叠生成模型,轮盘赌选择被用于从当前种群中选择10%的成员作为下一代的父代,而当前种群中的所有成员都将被丢弃。为了平衡样本的质量和多样性,LigBuilder不淘汰当前样本中前10%的成员,即这些顶级成员将直接转移给下一代。所以后代成员的质量会更好,至少等于父代。作者将GA化合物池定义为最新一代GA种群进化中的分子集合。在GA演化中使用的数据结构的概述如图1A所示。
由于多靶点设计方法产生的每个分子都涉及多个蛋白质,因此我们应该考虑与相应靶点结合的分子的多种构象。这与单靶点药物的设计方法是不同的。为了避免混淆,作者使用“构象群”而不是“分子”和“构象”来表示多靶点分子的多重结合构象(图1A)。
作者还定义了“化学簇”和“构象簇”,以描述多靶点分子之间的化学结构和结合构象的关系(图1B)。从合成的角度来看,具有相同化学结构的分子可以被认为是相同的。但从蛋白质-配体相互作用的角度来看,配体的构象必须被考虑在内,因为配体的结合是基于来自配体和蛋白质的原子之间的空间相互作用。因此,作者在两个层次上将所有构象进行聚类:(1)化学簇:一个化学簇的每个构象具有相同的二维结构,它们可以通过合成可达性分析模块估计的相同反应来合成。(2)构象簇:一个构象簇中的所有构象也具有相同的二维结构,因此构象簇是化学簇的一个子集。一个构象簇中的所有构象彼此相似,因此可以被认为是共享相同的相互作用模式。虽然从相互作用模式的角度来看,一个构象簇的所有构象都是可以互换的,但我们必须保留这些“重复性”,因为它们可能提供必要的局部扰动。例如,构象簇中的成员可能具有不同的氢原子的取向。氢原子的取向通常除了参与氢键的形成外,对蛋白质-配体的结合的影响很小,但在进一步的进化中它却非常重要。因为氢原子为生长位点,负责连接新添加的片段。
图1. LigBuilderV3中的数据结构示意图。(A)遗传算法演化和遗传算法化合物池的概述结构。(B)化学簇和构象簇的定义。(a)所有具有相同化学结构的分子将聚集在同一化学簇,可以通过相同的途径合成。(b)具有相似的蛋白质-配体相互作用的构象将被聚类为构象簇,代表相同的相互作用模式。
2.2 多目标种子结构映射
种子结构是先导化合物优化的起始结构。为单靶点先导化合物优化准备种子结构很简单,但是,为多目标设计准备种子结构需要额外的步骤。由于每个“多目标种子结构”表示一个由配体与每个靶点的不同结合构象组成构象群,因此,有必要在构象群中每个成员的原子之间进行一对一的对应关系。因为只有氢原子在整个设计过程中都是可能的连接位点,所以种子结构映射是基于氢原子的映射,即氢映射。由于分子的对称性,在两个结构之间可能有不止一种可能的氢映射。如图2所示,应考虑两种对称性,即分子的氢对称性和基团的氢对称性。分子氢对称是指分子中所有氢的旋转对称性,基团的氢对称性是指与一个重原子相连的多个氢原子的旋转对称性。图2A显示了1,4-二氯苯的两个C2对称轴,它们产生了4个可能的氢映射。图2B显示了乙酸的甲基的C3对称轴,它导致了3种可能的氢映射。虽然一些分子,例如乙酸,不是手性的,但在LigBuilderV3的氢映射中考虑了潜在的手性,因为进一步的生长操作可能会给碳原子带来手性。换句话说,在氢映射中二维拓扑和三维结构信息都被考虑到了。
图2. 氢映射中的对称性。(A)结构对称性的例子。(B)基团对称性的例子。
虽然配体中所有的氢原子都可能是片段生长位点,但由于空间位阻或用户的偏好,并不是每个氢原子都可以作为生长位点。因此,LigBuilderV3只保留了映射的生长位点最大的可能的氢映射,称为生长位点映射,这最大程度地增加了进一步生长的可能性。然而,如果有多个合理氢映射的解决方案,LigBuilderV3将把它们视为不同的种子结构,并在子顺序设计过程中独立使用它们。
对于涉及两个以上目标的情况,LigBuilderV3对第一个目标的构象与每个剩余目标的构象进行氢映射。因此,该构象群的所有其余构象都被映射到第一个构象上,因此找到整个构象组的共同生长位点映射是可行的。
2.3 多目标生长
先导化合物优化是LigBuilder系列的基本函数。LigBuilder V1和V2都提供了“增长”策略,它基于已预先放置在结合口袋里的先导结构生成衍生物。在本研究中,作者将“增长”策略扩展到多目标增长(多靶点先导化合物优化)。
图3为单目标生长操作的简略示意图,是多目标生长操作的基础。图3A左侧的灰色区域代表目标的结合位点,苯是具有代表性的种子结构。右边盒子中的分子是准备好的片段,可以作为组装新结构的构建模块。虽然所有的氢原子都可以连接片段,但其中只有少数是没有空间位阻的潜在连接位点。以图3A为例,苯上面向结合位点空区域的氢原子用蓝色表示,这表示潜在的生长位点,而受体原子附近的其他氢原子将被忽略。同时,默认情况下构建模块的所有氢原子都将被视为潜在的连接位。用户还可以在种子结构和构建模块上分配或阻止某些“生长位点”,以自定义分子的风格。在准备好种子结构和构建块库后,LigBuilder将从构建模块库中随机选择一个片段(图3A中的虚线框),然后从种子结构和选定的构建块上各自随机选择一个潜在生长位点(图3B中的红色氢原子)。构建模块将沿着选定的氢原子的方向附着在种子结构上(图3B中的红色氢原子)。沿新形成的键(图3C中的红色键)进行3度-步采样,考虑到分子的灵活性,将保留几种具有局部最小能量的有利构象作为候选构象。GA用于从这些候选人中选择优秀个体,这些优秀个体将作为下一个成长周期的种子结构。对于每个配体,这个过程将会一直重复直到:(1)配体设计完成,没有可用的空间来添加任何新的化学基团。(2)配体达到分子量的限制,默认为480Da。(3)GA生成数达到a最大,默认为15。
图3. 生长操作的示意图。(A)绑定位点中的种子结构和构建模块库(实体框)中选择的片段(虚线框)。(B)随机选择的种子结构生长部位和选择片段(红色表示)。(C)移动所选的片段,然后连接到种子结构上。
与单靶标设计不同,多靶标设计的先导结构为“种子”构象,由先导结构与每个靶标的结合构象组成。在构象组中每个成员的同一位置上同时生长化学上相同的构建模块,由LigBuilderV3产生的化合物能够与多个靶标结合。如图4所示,多目标生长可以看作是多同步单目标生长操作。在生长操作中,相同的构件和相同的生长场地将保持构象组二维结构的一致性。
图4.生长过程的示意图。
2.4 集成连接
虽然组装多个生物活性片段生成有效的配体非常有前途,但连接片段的计算方法充满了挑战。为了避免影响各自的生物活性,片段的方向和位置应该是不可改变的。因此,分子中键长度和键角的刚性限制严重限制了连接的可行性。此外,扭转的不利能量可能会进一步降低其可行性。虽然在巨大的化学空间中可能存在一些解决方案,但寻找这样的解决方案的效率较低,缩小了片段连接的应用范围。
在LigBuilderV3中,作者开发了集成连接算法,以提高片段连接过程的效率,这有望使这种方法更加实用。为了演示新算法的细节,图5中展示了以前版本的LigBuilder系列中使用的连接算法和LigBuilderV3中使用的集成连接算法的对比示意图。先前的连接算法采用了一种直接的连接策略,旨在将某些片段与许多构建模块连接起来。而集成连接算法采用了一种更灵活的连接策略,它试图从每个种子片段中独立推导出新的结构,然后找到这些结构之间可能的连接方法。虽然在图5中这两种算法能够生成相同的最终结构,但集成连接策略更有效。
图5.连接和集成连接过程的示意图。红色箭头表示生长操作,蓝色箭头表示连接操作。
如图6所示,每一代的集成连接都可以分为两个步骤,即成长步骤和连接步骤。LigBuilderV3对生长步骤每个化合物池中的所有化合物执行增长操作,然后在连接步骤中找到新形成的化合物和所有以前存在的化合物之间的可能连接方法,包括种子池(图6中的虚线框)。虽然在这两个步骤中产生的化合物将被一起收集到新一代的化合物池中,但在连接步骤中(图6中的链接池)中生成的化合物将有一个GA过程中的优先级,这使集成链接算法倾向于链接片段,而不是增长派生。
图6.LigBuilderV3中的连接过程的流程图。
2.5 多目标连接
设计多靶点配体进一步的挑战是连接与多个靶点与相互作用的片段。尽管在通过片段连接策略设计单靶点配体方面取得了许多成功,但很少有人研究多目标连接方法。与先导化合物相比,潜在的活性片段更容易通过基于片段的方法来进行选择,如核磁共振、DSF、X射线晶体学、表面等离子体共振和质谱学。此外,计算方法,如片段对接或CrystalDock也是识别先导片段的有效方法。此外,由于小片段的特异性较低,更有可能与多个靶点相互作用。因此,通过整合多个片段来设计多靶点配体是可行的且很有前途的。基于以上情况,作者试图改进集成连接算法来处理多目标片段连接问题。
与多目标生长算法一样,多目标连接的片段也应准备为“种子”构象组。连接过程中构象组的准备与生长过程相同。唯一的区别是,至少应该准备2个构象组进行连接,至少1个进行生长。
多目标连接算法基于集成连接算法,因此,构成集成连接算法的增长步骤和连接步骤都将扩展到多个目标。多目标集成连接的增长步骤与多目标增长完全相同,而连接步骤与多目标增长中使用的“多目标操作”策略相同。如上所述,多目标生长操作是在构象组中每个成员的同一位置上生长化学相同的构建模块的同时操作。同样,连接步骤中的多目标连接操作是连接相同连接位点上两个构象组的相应成员的同时成对操作。(图7)
图7.多目标集成连接操作可以看作是多同步单目标集成连接操作。
三、实验结果
通过设计COX2/LTA4H双功能抑制剂,实验验证了LigBuilderV3生长模式算法的概念原型,与 COX2和LTA4H的IC50值分别为7.1和7.0µM。虽然这项工作是基于LigBuilderV3的开发版本,并且由于算法的不成熟,涉及了许多人工干预,但本案例的成功表明了使用LigBuilderV3设计多靶点配体的可行性。
在这项研究中,作者通过设计针对两种特征良好的病毒酶HIV蛋白酶(PR)和HIV逆转录酶(RT)的双功能抑制剂来测试LigBuilderV3 的三种设计模式。由于PR和RT都是临床抗逆转录病毒治疗的重要药物靶点,核苷逆转录酶抑制剂(NRTI)和蛋白酶抑制剂(PI)联合使用等多靶点策略与每种成分相比具有显著优势,并已广泛用于HIV治疗。因此,研究人员一直在开发鸡尾酒药物组合,并追求多靶点抗艾滋病毒抑制剂。因此,作者提出了一个更通用的多靶点设计解决方案,通过LigBuilderV3设计PR和RT双功能抑制剂的例子。
从每种设计模式中选择前1000种化合物,进行100ps短时间分子动力学模拟,然后通过MM/GBSA方法估计每种化合物的结合亲和力。每种设计模式的前10个化合物和前1个化合物的平均结合亲和力见表1。虽然设计的多靶标化合物不能与具有亚纳摩尔水平活性的超级PR和RT抑制剂进行比较,但所设计的化合物预计比微摩尔水平的PR和RT抑制剂更有效,也就是说,这些化合物预计是亚微摩尔活性的PR和RT的双功能抑制剂。
表1.用MM/GBSA方法预测的结合自由能
四、总结
在本文中,作者提出了第一个全新的多靶点药物设计程序LigBuilderV3。此外,除了从头构建配体,LigBuilderV3还提供了多靶点先导化合物优化和多靶点片段连接的可行性。LigBuilderV3的开发版本已成功应用于设计具有微摩尔水平活性的COX2/LTA4H双功能抑制剂。在本研究中,作者进一步演示了LigBuilderV3的三种设计策略,并通过设计HIV-PR和HIV-RT双功能抑制剂进行了计算评估。