
DRUGONE
随着人工智能方法在大分子复合物结构预测中的快速发展,如何在无需人工干预的情况下,对复杂预测结果进行系统、公平且可扩展的评估,成为结构生物信息学中的关键问题。研究人员构建了一套全自动基准测试框架,用于比较预测模型与实验参考结构在三级结构、四级结构、界面以及蛋白–配体复合物等多个层面的差异。该框架集成了自动化链映射、配体匹配与多种互补评分指标,能够高效处理高复杂度的大分子体系,为大规模基准评测和 AI 方法开发提供了统一、可靠的解决方案。

蛋白质结构预测领域长期依赖基准评测来推动方法进步。随着预测对象从单链蛋白扩展到多链大分子复合物,传统评测方法在以下方面逐渐暴露局限性:
在 AI 驱动的结构预测时代,研究人员迫切需要一种可扩展、全自动、适用于复杂体系的结构比较与基准评测框架。
方法
研究人员在 OpenStructure 框架中实现了一套端到端的自动化结构比较流程。该流程首先对蛋白质、核酸及小分子配体进行统一预处理,并通过序列与化学等价性分组实现自动化映射;随后,针对不同评估目标,采用专门设计的链映射算法(QSMap / QSMapR)与配体匹配策略;最终,计算一系列互补的结构评分指标,用于量化预测模型在整体拓扑、局部结构、界面相互作用以及配体结合构象等方面的准确性。整个流程无需人工干预,适用于高通量、大规模基准测试。
结果
面向大规模复合物的自动链映射算法
研究人员提出了 QSMap 与 QSMapR 两种链映射算法,分别针对界面接触精度与整体拓扑一致性进行优化。结果表明:

图 1|大分子复合物结构评估的关键维度示意图。
升级版 LDDT 评分实现多链与多分子支持
研究人员重新实现并扩展了 LDDT 评分,使其能够:
该实现显著提升了在复杂体系中的鲁棒性与自动化程度。
蛋白–配体复合物的全自动评估指标
针对多配体与复杂结合模式,研究人员提出了三类新评分指标:
这些指标能够区分“构象正确但局部接触错误”等传统指标难以识别的情况。

图 2|链映射算法在不同规模复合物中的性能比较。

图 3|配体构象误差与相互作用重现度之间的关系。

图 4|异常预测示例及不同评分指标的响应差异。
统一的全自动基准测试平台
研究人员将上述方法整合为一个统一的平台,支持:
该框架已在国际结构预测评测中得到实际应用验证。
讨论
该研究提出的全自动基准测试框架,为复杂大分子复合物结构预测提供了系统性的评估工具。通过将链映射、结构比对与多层次评分统一到单一框架中,研究人员显著降低了人工干预需求,提高了评测结果的可重复性与可扩展性。
尽管该框架尚未覆盖结构质量验证、无序区建模或蛋白–肽相互作用等更复杂场景,但其设计为未来扩展奠定了坚实基础。在 AI 驱动的结构预测快速发展的背景下,这种高通量、自动化的评测体系将成为方法开发与比较中不可或缺的基础设施。
整理 | DrugOne团队
参考资料
Studer, G., Robin, X., Bienert, S. et al. A fully automated benchmarking suite to compare macromolecular complexes. Nat Methods (2025).
https://doi.org/10.1038/s41592-025-02973-z
内容为【DrugOne】公众号原创|转载请注明来源