在进行抗体药物研发时,当冷冻电镜的数据分辨率比较低,可以通过测序信息来辅助进行序列鉴定。
今天带来一篇发表在2022年1月份的science advance文献。
感染或疫苗接种之后的免疫应答分析是非常费时费力。ELISA或病毒中和实验可以带来非常丰富的信息,但是需要应对庞大的生物试剂的组合。而为了进行理性的基于结构的疫苗设计,通常我们需要压迫分离出单克隆抗体(mAbs).而分离特异性B细胞通常需要带荧光标记的探针以及先进的细胞分选设备,随后mAbs被生产,并进行生物结构和功能评估,来评估抗原表位的特异性,亲和力和活性(中和能力,neutralization),随后抗体的高分辨率结构被解析。
在进行疫苗或者感染的免疫应答分析时,限速步骤之一通常为单克隆抗体的分离和表征。在本文中提出了一种基于结构和生物信息学的方法,来直接确定重力链和轻链,识别CDR区,并且从血源性中的多克隆抗原抗体冷冻电镜密度图中发现序列。和next-generation测序技术进行结合时,我们就可以特异性的识别对应的家族成员,合成单克隆抗体,并进行生物验证。
作者使用了之前发表的基于HIV Env三聚体的结构数据。本研究使用的三个主要的cryoEMPEM maps都与多克隆抗体(pAbs)结合。cryoEM质量较好(3.3- to 3.7-Å ),并且Fab区结合附近有着high local resolution。
作者分析了Rh.4O9 pAbC-1 cryoEMPEM地图(Fig 1 left),Rh.4O9 与抗原的V1 loop相结合。有科学家从相同的恒河猴中分离出了同样识别这一表位的两个抗体: Rh4O9.7和Rh4O9.8,它们中的Rh4O9.8能够中和BG505假病毒,并也是靶向V1 loop。作者使用负染对Rh4O9.8与BG505 SOSIP的结合进行表征,并确认了V1的特异性(Fig 2 A)。此外,Rh4O9.8 mAb与Rh.4O9 pAbC-1地图中的多克隆Fab重叠(图2B)。
Fig. 1. 复合物的高分辨率map(透明灰色表面)及其相应的model(从左到右:Rh.4O9 pAbC-1、Rh.33104 pAbC-1和Rh.33172 pAbC-2)
使用Rh4O9.8的序列重建了一个原子模型,将其放入到Rh.4O9 pAbC-1 Fab对应的部分。该原子模型和cryoEMPEM相比,在二级结构(Fig 2D Left)和侧链(Fig 2D Right)水平上呈现出很高的一致性。Per-residue Q score也很好的证实了Rh4O9.8抗体在Rh.4O9 map中展示出了很高的整体一致性(FW区和CDR区)。总而言之,基于B细胞分离出的Rh4O9.8 mAb和通过cryoEM鉴定出的pAb属于同一克隆家族成员。
Fig.2. 靶向BG505 SOSIP V1 loop的mAb和pAb结构的比较。
通过以上实验,验证了可以通过mAbs序列在原子级别解释cryoEM的密度。但是由于结合抗体的多克隆性质和cryoEMPEM map的分辨率约为3到4埃,仅凭结构信息难以直接确定抗体序列。==作者假设如果能够获取适当的序列数据库==,在这个序列数据库中包含与采集血清(即pAb)的时间点相匹配的B细胞受体库(BCR),那么就可以利用cryoEMPEM中的含有的pAb的结构信息,从BCR库中选择出重链和轻链的候选者。随后,作者开发了一种方法,综合使用cryoEMPEM地图的结构约束和抗原特异性B细胞库的NGS数据来鉴定mAbs。流程如下:
首先,为了解决分辨为3-4埃的cryoEM map的固有的模糊性,作者开发了一个分配系统。该系统整合了氨基酸的密度特征,给氨基酸进行了手动分配,使用标识符来进行分层分类。Fig 3 B展示了使用Rh.33104 pAbC-1 map基于氨基酸分层分类的示例。
使用与已发表的抗体结构的同源性来定义CDR以及FW区域,并且给与抗体自己的分层分类标志。
随后,作者设计了一个搜索算法,输入内容有两个:(i)预处理的NGS序列数据库和(ii)用户定义的基于结构的序列查询(Fig 3 C)。NGS的数据首先会根据用户设置的长度来对CDR长度来进行过滤。然后,程序对剩下的序列进行搜索,匹配,输出根据CDR长度,对齐分数以及不匹配的位置和数量进行排名(Fig 3 D)。
Fig 3:从高分辨率cryoEMPEM map出发进行的序列预测。
结构数据证实了从NGS数据库中选择的mAbs是通过cryoEMPEM检测到的多克隆家族的成员。
Fig. 4. Characterization of the recovered mAbs