
DRUGONE
随着蛋白质数据库规模的快速增长,对更快、更敏感的同源性搜索工具的需求愈发迫切。研究人员开发了 GPU 加速版 MMseqs2 (MMseqs2-GPU),在单一蛋白搜索中比基于 128 核 CPU 的方法快 6 倍,在大规模批量任务中,使用 8 张 GPU 时可实现 2.4 倍的成本效率提升。MMseqs2-GPU 能显著加速结构预测与比对任务,例如在 ColabFold 中的多序列比对生成较 AlphaFold2 标准流程快 31.8 倍,在 Foldseek 中的结构搜索快 4–27 倍。该工具已开源,面向全球科研人员。

蛋白质同源性搜索是理解功能与结构的核心环节。传统的 Smith–Waterman–Gotoh 动态规划算法能保证最优比对,但计算代价极高。为提高效率,BLAST、PSI-BLAST、MMseqs2 与 DIAMOND 等工具采用启发式方法;HMMER 与 HHblits 则使用更敏感但计算代价高的基于动态规划的筛选。然而,即便有 CPU 并行化优化和 FPGA 加速器,面对超大规模数据库时仍然受限。GPU 的并行优势为加速同源性搜索提供了新的机会。研究人员将两类 GPU 加速算法集成到 MMseqs2 中:无缺口筛选与 基于 PSSM 的有缺口比对,在保持灵敏度的同时显著提高了速度和效率。

方法
算法设计
并行与优化
结果
性能提升
搜索敏感性

单查询与大批量性能
结构预测与 Foldseek 搜索
在 ColabFold 流程中,MMseqs2-GPU 使多序列比对生成加速 176 倍,整体结构预测加速 31.8 倍,同时保持 TM-score (0.70 ± 0.05) 不变。
在 Foldseek 中,单卡 GPU 加速比 CPU 快 4 倍,8 卡提升至 27 倍,且灵敏度略有提升。
能效与内存优化
讨论
MMseqs2-GPU 展示了 GPU 加速在蛋白质同源性搜索中的巨大潜力:
局限性包括:
未来方向:
总结
MMseqs2-GPU 在保持高灵敏度的同时,大幅加速蛋白质同源性搜索、结构预测与比对任务,并显著降低能耗与成本。这一框架不仅为基础生物学研究提供了高效工具,也为药物研发、蛋白质工程和人工智能驱动的生物学探索提供了技术支撑。
整理 | DrugOne团队
参考资料
Kallenborn, F., Chacon, A., Hundt, C. et al. GPU-accelerated homology search with MMseqs2. Nat Methods (2025).
https://doi.org/10.1038/s41592-025-02819-8
内容为【DrugOne】公众号原创|转载请注明来源