
DRUGONE
研究人员利用 AlphaFold 建立了一个覆盖病毒单体与同源二聚体的结构预测数据库,旨在系统性揭示病毒界内保守蛋白折叠的多样性与分布。通过对来自细菌、古菌和真核宿主的超过 20 万种病毒蛋白进行结构建模与聚类分析,研究人员发现许多折叠结构在不同宿主病毒中表现出显著的保守性,甚至跨越病毒分类界限。部分折叠与宿主蛋白共享同源结构,暗示病毒在进化过程中可能通过基因交换与折叠再利用形成了结构上的“通用模块”。本研究建立的 Viral AlphaFold Database (VAF-DB) 作为首个系统性病毒结构预测资源,为病毒蛋白功能推断、起源研究与抗病毒药物靶点发现提供了新工具。

病毒是地球上最为丰富且多样的生物实体,其编码蛋白覆盖了极广的化学与功能空间。从进化角度看,病毒基因组的多样性及其与宿主的基因交流在生命早期演化中起到了关键作用。然而,与细胞生物相比,病毒的结构信息极度有限,约有 95% 的病毒蛋白缺乏实验解析的三维结构。这种缺口限制了研究人员对病毒功能与进化机制的理解。
AlphaFold 的出现极大改变了蛋白结构研究的格局。其在单体蛋白结构预测中的高精度已在多个基因组数据库中得到验证。研究人员在此基础上,提出将深度学习结构预测扩展至整个病毒蛋白组,以探索不同病毒间的折叠共性和进化关系。
尽管部分病毒蛋白数据库已包含少量预测结构,但尚未有系统性地覆盖所有宿主来源病毒,尤其是细菌与古菌病毒的统一数据资源。研究人员因此构建了一个大规模病毒 AlphaFold 数据库,涵盖单体和同源二聚体预测结果,用于解析跨宿主病毒的结构保守性及其潜在进化意义。
方法
研究人员从多个权威病毒基因组资源(包括 NCBI RefSeq、IMG/VR 和 GenBank)中整合了约 22 万个非冗余病毒蛋白序列,并根据宿主类型分为细菌病毒、古菌病毒和真核病毒三大类。所有序列经长度与质量过滤后,使用 AlphaFold2 和 AlphaFold-Multimer 进行单体与同源二聚体预测。
预测模型经过质量评分(pLDDT 与 pTMscore)筛选,保留高置信度结构用于聚类分析。随后,研究人员基于结构相似度(TM-align 和 Foldseek)构建病毒蛋白结构网络,并通过聚类与比对识别跨宿主的保守折叠类型。此外,还将这些折叠与已知 PDB 条目及宿主蛋白进行比对,以探索可能的结构继承与功能同源关系。
所得结果存入 VAF-DB 平台,并通过交互式界面提供可视化浏览、下载与注释功能。
结果
病毒蛋白折叠空间的整体分布
在超过 20 万条预测结构中,约 67% 的模型具有高置信度(平均 pLDDT > 80)。病毒单体折叠空间呈现高度集中分布,约 30% 的病毒蛋白可归入不到 2,000 个结构簇中,表明尽管病毒基因多样,其结构层面仍存在明显收敛。
这些折叠主要包括核酸结合结构域、螺旋束结构、β-桶结构以及 Rossmann-like 核苷酸结合结构,暗示病毒在进化过程中反复利用了少量高稳定性的折叠框架。

跨宿主保守折叠的发现
研究人员在病毒结构聚类分析中识别出超过 500 个跨宿主保守折叠簇,其中 72 个折叠同时出现在细菌、古菌与真核病毒中。这些折叠包括 ATPase 核心结构、金属离子结合域和核酸识别模块,显示出强烈的结构保守性。
例如,病毒衣壳蛋白中的 HK97 折叠在多类噬菌体与动物病毒中均被发现;而 Rossmann-like 结构在核苷酸代谢相关蛋白中广泛保留。此类跨界结构的存在暗示病毒可能在生命早期演化中形成了共享的折叠“基因库”。

病毒与宿主间的结构同源性
为了探讨病毒折叠与宿主蛋白的联系,研究人员将病毒折叠与 UniProt 中的宿主结构进行了比对。结果发现,约 18% 的病毒折叠与宿主蛋白呈现显著结构相似性。
其中一类典型案例是含锌指结构的 DNA 结合蛋白,在噬菌体与真核病毒中均出现相似拓扑。此类结构可能通过水平基因转移或共同祖先保留的方式传播,表明病毒在演化上与宿主存在复杂的折叠共用机制。

同源二聚体结构揭示病毒蛋白的功能特征
通过 AlphaFold-Multimer 建模,研究人员获得了 4.5 万个高置信度的病毒同源二聚体模型。约 60% 的二聚体显示出显著的对称性(C2 对称),多集中于衣壳组装、ATP 驱动装置和复制复合物中。
这些结果支持了病毒通过有限的折叠组合形成复杂功能复合体的假设,也为理解病毒蛋白自组装与多聚化机制提供了结构基础。

病毒折叠的功能注释与蛋白家族映射
研究人员将所有高置信度折叠映射至 Pfam 和 EC 分类体系,以识别潜在功能类别。结果显示,病毒折叠主要集中在五类功能:
约 20% 的折叠未在任何已知家族中出现,提示病毒界存在大量“结构暗物质”(structural dark matter),其功能尚待验证。

Viral AlphaFold Database (VAF-DB) 的结构可视化与访问接口
研究人员开发了 VAF-DB 在线平台(https://viral.afdb.org),实现结构可视化、比对与批量下载功能。 该平台支持:
平台采用交互式架构,可在网页端动态渲染并联动显示保守折叠网络,是目前覆盖范围最广的病毒结构预测资源。

病毒折叠的进化关系与跨域保守性分析
通过基于结构相似度的系统发育网络分析,研究人员发现,部分病毒折叠在细菌、古菌和真核病毒间构成跨域连接节点。这些“折叠桥梁”主要集中于核酸加工与组装相关功能,反映了病毒在不同宿主生态位中对相似结构框架的反复利用。
此外,进化网络显示部分折叠在病毒和宿主间存在闭环关系,提示可能发生了多次水平基因转移事件。研究人员提出,这些跨界保守折叠或许代表生命早期共同起源的结构原型,为重建病毒与细胞生命的演化关系提供了线索。

讨论
研究人员通过构建 Viral AlphaFold Database,揭示了病毒在跨宿主演化中的结构保守性与模块化特征。结果表明,病毒蛋白折叠空间远小于其序列多样性所暗示的范围,大量不同病毒通过共用有限数量的结构模块实现功能多样化。
这些模块化折叠既包括经典的衣壳与酶活性核心,也包含此前未注释的新型拓扑。病毒折叠的重用与收敛表明,病毒在进化上受到结构稳定性和组装效率的双重约束,同时通过折叠“再利用”实现了高度的适应性与功能创新。
VAF-DB 的建立不仅扩展了病毒结构组学的边界,也为未来的功能注释、蛋白工程与抗病毒药物发现提供了基础性平台。研究人员认为,这一数据库将成为探索病毒结构演化与生命起源的关键资源,促进人工智能驱动的病毒结构生物学研究。
整理 | DrugOne团队
参考资料
Roni Odai et al. ,The Viral AlphaFold Database of monomers and homodimers reveals conserved protein folds in viruses of bacteria, archaea, and eukaryotes.Sci. Adv.11,eadz8560(2025).
DOI:10.1126/sciadv.adz8560
内容为【DrugOne】公众号原创|转载请注明来源