前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Nature npj|机器学习在疫苗靶标选择中的开发和应用

Nature npj|机器学习在疫苗靶标选择中的开发和应用

作者头像
智药邦
发布2024-06-12 14:52:15
1280
发布2024-06-12 14:52:15
举报
文章被收录于专栏:智药邦

2024年1月20日,Nature期刊下的npj vaccines发表了文章"Development and use of machine learning algorithms in vaccine target selection",总结了疫苗设计的计算流程与现有ML方法应用的情况。

图1 合理设计疫苗流程示意图(a); 机器学习在疫苗靶标选择的任务中的应用:B和T细胞表位的发现[B细胞表位发现,抗原呈递的预测]和免疫原设计[抗原免疫原预测](b、d);通过epitope-paratope相互作用的定量建模来表征相互作用(c、e)。

B细胞表位识别

基于只有少数序列和结构属性可以确定某个残基是否可以为抗体结合位点的假设,很多B细胞表位发现的方法,主要应用基于特征的机器学习方法。

基于图的表位区域表示,也是传统特征加上残基堆积以及键的类型和拓扑排列等角度建模。

上述两种方法的效果,关键是我们对最相关特征的理解程度,以及怎么组合特征的技术,有些图特征预测容易产生预测偏差。

当然除了传统特征,基于蛋白质语言模型提取的残基表示也可以输入传统机器学习表位预测中。

结构建模和蛋白-蛋白对接,可以优化抗原-抗体相互作用表征,尤其机器学习可以识别与构象变化最相关的残基来辅助做决策。

抗原呈递预测

抗原呈递是决定哪些致病蛋白区域可能被T细胞靶向,计算预测是有效筛选疫苗设计候选靶点的关键。

HLA多态性是仍未解决的挑战,大多数方法对常见HLA等位基因的预测接近完美,但是对稀少的等位基因预测效果不行。HLA-II,数据有限,等位基因特异性结合基序的多样性,预测更难。

抗原免疫原性预测

免疫原性预测方法的最大AUROC为0.7,低于B细胞表位预测。主要缺点对机器学习模型中的特征的科学共识不清楚,比如与HLA的高亲和力和稳定性是否与高免疫相关,不太清楚。

epitope-paratope相互作用

机器学习方法主要有下面两种: (i) 仅使用TCR/抗体的结构的信息;(ii) TCR/抗体-抗原结合对的信息。

图2 用于预测B细胞和T细胞表位-抗体相互作用的ML方法方案,仅使用TCR/抗体信息(a、b) vs TCR/抗体-抗原对;序列(a,c) vs 基于结构(b、d)。

基于结构的epitope-paratope相互作用方法,也依赖于特征选择,比如物理化学/几何特征以及基于图的界面区域表示。

基于序列的TCR表位特异性预测方法揭示了一些趋势:

数据集比特定的模型架构更能决定性能,不同方法的泛化能力在各种抗原之间是一致的。

基于TCR序列相似性预测抗原特异性提供了良好的基线。

深度学习方法相对于简单模型的收益并不大,因为深度学习需要更多的数据。

以上内容仅代表论文中的观点

参考文献

Bravi, B. Development and use of machine learning algorithms in vaccine target selection. npj Vaccines 9, 15 (2024). https://doi.org/10.1038/s41541-023-00795-8

--------- End ---------

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智药邦 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档