
DRUGONE
蛋白–配体相互作用在理解生物过程和药物发现中具有关键作用。然而,实验方法昂贵,单配体导向方法依赖特定配体,多配体导向方法则受限于缺乏配体编码。在本研究中,研究人员提出了一种基于结构的方法 LABind,用于在配体感知的条件下预测小分子和离子的结合位点。LABind 采用图变换器捕捉蛋白局部空间上下文中的结合模式,并结合交叉注意力机制学习蛋白与配体之间的特征差异。实验结果表明,LABind 在三类基准数据集上表现优异,并能推广至未见过的配体。进一步分析验证了 LABind 有效整合配体信息预测结合位点的能力。此外,LABind 还被扩展应用于结合中心定位、基于序列的方法和分子对接任务。

蛋白–配体相互作用在酶催化、信号转导和分子识别等过程中发挥着基础作用,也是药物发现的核心。传统实验技术(如晶体学、核磁和冷冻电镜)虽能精确确定结合位点,但资源消耗大。随着已知蛋白结构与小分子数量的迅速增加,开发高效计算方法显得尤为重要。
现有方法主要分为三类:基于单配体的模板方法、序列方法和结构方法。尽管这些方法对特定配体有效,但难以推广到新配体。多配体方法虽能利用多个数据集联合建模,但通常缺乏对配体特征的显式建模,导致无法区分不同配体的结合模式。因此,亟需一种统一模型,既能结合配体信息,又能应对不同配体场景。
结果
LABind 方法概览
LABind 结合蛋白语言模型 Ankh 与分子语言模型 MolFormer,分别获取蛋白序列表示和配体表示。蛋白结构被转换为图表示,节点和边包含空间角度、方向和距离等特征。随后,蛋白与配体表示通过交叉注意力机制进行交互,最终由多层感知机预测结合位点。该方法既能利用蛋白局部空间上下文,也能整合配体特征,提升预测精度。

基准数据集上的预测性能
在 DS1、DS2 和 DS3 三个基准数据集上,LABind 的预测性能优于现有单配体和多配体方法。在 DS1 数据集中,LABind 相比最佳基线方法 LigBind 平均 MCC 提高约 21.8%。在 DS2 数据集中,LABind 在多种离子和小分子配体上均优于对比方法。在 DS3 数据集中,LABind 展现出更强的泛化能力,对未见配体依然保持高精度。

结合中心预测
LABind 并非直接输出结合中心,但通过对预测的结合残基进行聚类,可以推断中心。在多个数据集上,LABind 在 DCC 和 DCA 指标上均优于 P2Rank、DeepSurf 和 DeepPocket,显示出对结合中心定位的潜力。
无实验结构的蛋白验证
在无实验结构的情况下,研究人员结合 ESMFold 和 OmegaFold 的预测结构,测试 LABind 的稳健性。结果显示,即便使用预测结构,LABind 依然优于 LigBind,证明其对低质量结构的鲁棒性,并可扩展至基于序列的预测。

区分不同配体的能力
研究人员选择与多种配体结合的同一蛋白进行验证,结果表明 LABind 能清晰地区分不同配体的结合位点。例如,在同一蛋白上,Zn²⁺ 与 PO₄³⁻ 结合区域显著重叠,而 Ca²⁺ 的结合位点则明显不同,LABind 能准确捕捉这些差异。

辅助分子对接任务
研究人员利用 LABind 预测的结合位点辅助 Smina 对接实验。结果显示,在 CASF-2016 数据集上,结合 LABind 预测位点的对接成功率相比盲对接提升 19.1%,虽然仍低于使用真实结合位点的结果,但展示了 LABind 在实际分子对接中的应用潜力。

SARS-CoV-2 NSP3 结合位点预测
在 SARS-CoV-2 NSP3 macrodomain 与未见配体的案例中,LABind 能准确识别所有真实结合残基,且未产生错误预测,优于对比方法。这进一步验证了 LABind 在真实场景中的适用性。
特征与消融实验
消融实验表明,蛋白图特征、序列嵌入和 DSSP 特征对模型性能均至关重要。去除配体信息后,模型性能明显下降,说明配体特征的引入对提升预测精度至关重要。可视化分析也显示,交叉注意力机制能有效区分结合残基与非结合残基。

讨论
研究人员提出的 LABind 是一种统一的、基于结构的配体感知方法,能够预测所有小分子和离子的结合位点。其优势在于:
实验表明,LABind 在已知和未见配体的预测上均超越现有方法,并在结合中心预测、分子对接和实际案例中表现出较高可靠性。未来,研究人员计划扩展 LABind 至更复杂的结合场景,如蛋白–大分子结合位点、磷酸化位点、肽结合位点以及蛋白–蛋白相互作用位点,从而为生物学研究和药物设计提供更全面的帮助。
整理 | DrugOne团队
参考资料
Zhang, Z., Quan, L., Wang, J. et al. LABind: identifying protein binding ligand-aware sites via learning interactions between ligand and protein. Nat Commun 16, 7712 (2025).
https://doi.org/10.1038/s41467-025-62899-0
内容为【DrugOne】公众号原创|转载请注明来源