作者 | 张泽宇 编辑 | 庞超
今天给大家介绍Ji Wan等人在BMC Bioinformatics 2021上发表的文章“MATHLA: a robust framework for HLApeptide binding prediction integrating bidirectional LSTM and multiple head attention mechanism”。在HLA分子与肽的结合预测任务中,基于深度学习的预测模型虽然表现出较好的性能,但许多依赖于特定类型的HLA分子或特定的肽表位长度,且对数据量依赖较大,这导致数据量较少的HLA-C类分子和长肽表位的预测性能相对不佳。为此,作者基于双向LSTM和Multi-head Attention提出了新的预测模型,改善了HLA-C类分子和长肽表位的预测性能。

一、研究背景
1.1 背景
1.2 相关工作
另外,研究表明,数据的质量对于模型的预测有着重要影响,而近年来数据量的增多也一定程度上促使模型性能提升。
1.3 现存主要问题
二、模型与方法
2.1 嵌入层
2.2 序列学习层
2.3 注意力模块
对于序列学习层中的隐藏层向量和输出层向量,使用多头注意力机制,得到注意力向量,注意力计算方式如图1。

图1. 注意力计算方式
2.4 融合层与输出层
2.5 模型架构

图2. MATHLA模型架构
三、实验结果
3.1 模型对长表位序列的预测性能提升较大

3.2 模型对新等位基因分子的预测性能较好
相比于现有模型,论文模型对新等位基因分子的预测性能较好。
3.3 模型对HLA-C类分子的预测性能提升较大
实验表明,模型对HLA-C类分子的预测性能提升较大,如图4。

图4. 各模型对HLA-C类分子的预测性能
3.4 模型能够刻画不同HLA分子结合的模式特征

图5. HLA分子结合的模式特征刻画
四、总结
参考资料