首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nat. Commun. | 大型蛋白质数据库揭示结构互补性与功能局域性

Nat. Commun. | 大型蛋白质数据库揭示结构互补性与功能局域性

作者头像
DrugOne
发布2025-09-02 18:21:18
发布2025-09-02 18:21:18
930
举报
文章被收录于专栏:DrugOneDrugOne

DRUGONE

近期蛋白质结构预测的突破带来了数量激增的高质量三维模型,这对计算方法提出了新的需求。研究人员对来自 AlphaFold 蛋白质结构数据库(AFDB)、ESMAtlas 的高质量子集以及 Microbiome Immunity Project(MIP)的结构簇进行分析,构建了一个统一的低维表示空间。结果显示,不同数据库虽占据独立区域,但在功能谱系上存在显著重叠,高层次的生物学功能往往集中在特定区域,揭示了共享的功能景观。研究人员进一步在该结构空间中定位功能注释,并开发了开放访问的在线服务器以供探索。本研究为理解蛋白质序列—结构—功能关系提供了新视角,也为未来在分类学、环境因素或功能特异性等方面的研究奠定了基础。

随着 AlphaFold 数据库和 ESMAtlas 的发布,蛋白质结构的数量在短短几年内从约 20 万个增长到接近 10 亿个。这一“地震式”转变使得蛋白质结构不仅是存档对象,更成为理解生物学的关键信息来源。尽管过去几十年对蛋白质序列的存储、比对、聚类和注释已经十分成熟,但结构层面的研究尚缺乏统一视角。现有工作多集中于结构压缩、聚类和折叠搜索,而一个能够统一不同来源数据库、揭示其互补性与冗余性的框架仍然缺失。

本研究旨在构建共享的结构与功能空间,比较不同数据库在结构和功能上的覆盖度,并探讨它们如何共同构成蛋白质宇宙的整体景观。

结果

数据集的互补性

研究人员整合了三个大型数据库:AFDB、ESMAtlas 高质量子集和 MIP。通过去除冗余并构建二维结构空间,发现这些数据集在结构上互补。AFDB 与 ESMAtlas 大量重叠,但覆盖空间的不同区域;MIP 则提供了更多单域结构,补充了前两者的不足。这一互补性揭示了不同预测来源在构建蛋白质宇宙时的协同作用。

结构景观中的渐变

在统一空间中,蛋白质构象呈现出连续性:α/β 结构集中在中心区域,逐渐向 α 或 β 为主的分支过渡。部分低质量模型和可能的无序蛋白位于边缘,显示出异质性。纤维状蛋白形成独立簇,与跨膜运输和致病性密切相关,具有重要医学意义。

功能局域性

基于 deepFRI 的功能注释结果表明,高层次功能类别(如代谢、信息存储与处理、细胞过程与信号传导)在结构空间中表现出明显的空间集中性。不同功能类别的分布并非随机,而是呈现显著的空间自相关性。这种“功能局域性”说明蛋白质功能可通过结构空间中的位置得到有效预测。

新折叠的功能多样性

MIP 中的新型折叠虽然在结构上前所未见,但多数仍可被注释为已知功能。研究人员发现其中一些蛋白与代谢、脂质转运或细胞壁调控相关,提示新结构可能为已知功能提供新的结构解决方案,而非完全未知的功能。

结构簇的异质性

在 AFDB 与 ESMAtlas 的高质量结构中,大部分形成异质性簇,说明它们在结构上高度相似。然而,仍存在部分同质性簇和单例,显示出数据库间的差异。异质性簇的功能分布更丰富,表明跨数据库的聚合有助于揭示更广泛的生物学多样性。

分类学偏倚

分析发现,当前数据库中以细菌蛋白为主,真核蛋白比例偏低,可能导致功能预测的偏倚。尤其在无序区域占比更高的真核蛋白中,预测准确度明显下降。这一不平衡提醒未来需引入更多真核结构以改善整体代表性。

在线探索平台

研究人员构建了一个交互式网络服务器,允许用户在二维结构空间中浏览、搜索和筛选蛋白质,查看三维结构与功能注释。这一工具有助于进一步挖掘数据库资源并开展个性化分析。

讨论

研究人员证明,大规模结构数据库不仅在数量上极为庞大,而且在结构和功能层面呈现连续性与互补性。通过统一的结构空间,可以揭示不同数据库之间的重叠与差异,同时观察到功能的局域性。这一视角为理解蛋白质功能与演化提供了新框架。

然而,本研究也存在局限:未能深入处理无序蛋白的动态特性,序列与结构之间的直接对应关系未被系统性分析,二维可视化虽便于展示但限制了复杂模式的捕捉。未来的工作可进一步结合多维表示、序列—结构—功能耦合分析,以及对无序蛋白更精准的建模。

总的来说,本研究为描绘蛋白质宇宙的结构—功能景观提供了重要参考,并通过开放平台促进了后续探索与发现。

整理 | DrugOne团队

参考资料

Szczerbiak, P., Szydlowski, L.M., Wydmański, W. et al. Large protein databases reveal structural complementarity and functional locality. Nat Commun 16, 7925 (2025).

https://doi.org/10.1038/s41467-025-63250-3

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档