首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nat. Mach. Intell. | 高分辨率设备下的多肽从头测序

Nat. Mach. Intell. | 高分辨率设备下的多肽从头测序

作者头像
智能生信
发布2021-05-17 16:45:18
发布2021-05-17 16:45:18
7190
举报
文章被收录于专栏:智能生信智能生信

今天给大家介绍的是Rui Qiao等人在Nature Machine Intelligence上发表的文章“Computationally instrument-resolution independent de novo peptide sequencing for high-resolution devices”。从头测序是从质谱中寻找新肽的关键技术。测序结果的整体质量取决于从头肽测序算法以及质谱的质量。在过去的十年里,质谱仪的分辨率和准确度提高了几个数量级,产生了更高分辨率的质谱。如何有效地利用这些高分辨率数据而不大幅增加计算的复杂性仍然是从头肽测序工具的一个挑战。在这篇论文中作者提出了PointNovo模型,这是一个基于神经网络的从头肽测序模型,可以稳健地处理任何分辨率的质谱数据同时保持计算复杂度不变。最终的实验结果表明,PointNovo能利用最新质谱仪的超高分辨率,优于现有的从头肽测序工具。

一、研究背景

从头肽测序是直接从串联质谱和肽质量重建肽序列的过程。在过去的20年中,不同的从头肽测序工具被提出,并在组装单克隆抗体序列和识别肿瘤特异性抗原,特别是那些由非编码区或选择性剪接产生的抗原方面显示了成功的应用。然而,对于从头开始的肽测序工具来说,区分具有相似质量的氨基酸对(例如谷氨酰胺(Q)和赖氨酸(K)或蛋氨酸亚砜(M(Oxi))和苯丙氨酸(F))仍然具有挑战性。例如,在评估从头肽测序的准确性时,以前的一些研究认为,如果预测的氨基酸的质量差小于0.1Da,并且前面的前缀质量差小于0.5Da,则预测的氨基酸与真实的氨基酸匹配。这意味着,例如,如果从头测序工具预测出了Q,实际上应该是K,由于Q和K之间的质量差小于0.05Da,它仍将被评估标准标记为正确;然而,对于抗体测序应用或肿瘤特异性抗原发现,从头测序工具能够重建肽的精确序列是重要的。否则,氨基酸的差异可能导致无效的药物或疫苗。随着质谱仪的最新进展,质量精度可以提高到1ppm左右。对于质量为1000da的碎片离子,这意味着测量误差小于0.001Da。这样的高分辨率数据需要更加精确的从头肽测序技术。

二、模型与方法

PointNovo模型的整体架构如下:

质谱中的每条数据可以表示成一个

元组,那么整个质谱就可以表示为元组的集合。把质荷比和强度值分别表示为

。同样对于理论上的碎片离子也可以通过计算得到

。将二者作差便可以得到理论值和观测值之间的差异矩阵:

随后使用非线性激活函数

这里的指数运算和绝对运算都是元素运算。随后将计算结果输入到T-NET神经网络中得到对氨基酸的预测概率,依次来得到多肽的预测结果。

三、实验结果

下图是在三个不同数据集上DeepNovo和PointNovo两种方法在氨基酸召回率、精准率和多肽召回率上的实验结果,可以发现不论PointNovo是否添加上LSTM结构,效果都好于现有方法。

四、总结

PointNovo能够充分利用最新的质谱仪提供的高精度数据,并且不需要对质谱进行矢量化。PointNovo已准备好应用于将来可能生成的更高分辨率数据,而不会增加任何复杂性。PointNovo通过直接将光谱表示为一组m/z值和强度对,并通过使用次序不变的网络结构从这种结构的数据中学习来实现这一点。


参考文献

Qiao,R., Tran, N.H., Xin, L. et al.Computationally instrument-resolution-independent de novo peptide sequencingfor high-resolution devices. Nat MachIntell (2021).

https://doi.org/10.1038/s42256-021-00304-3


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-05-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档