适应度景观计算模拟HIV包膜蛋白
尽管医学上在艾滋病治疗上取得了重大进展,但仍然没有有效的疫苗用于治疗人类免疫缺陷病毒(HIV)感染。虽然近些年发现能够中和各种HIV病毒株的抗体,然而,HIV病毒有时可以通过突变途径逃避已知的广泛中和抗体反应,这使得设计一种有效的治疗方案变得更加困难。
被认为理想的一种疫苗是对病毒突起蛋白产生的广泛中和抗体,那里通常是病毒接近宿主细胞的首要接触点,如果突变会严重影响病毒的适应性或复制能能力。这需要了解适应度景观,从序列到适应度的映射。为了实现这一目标,来自中国香港科技大学的数据科学家和他们来自麻省理工学院的合作者采用了一种计算的方法来估计包含HIV病毒的多聚蛋白gp160的适应度景观。然后,通过与不同的实验测量进行比较,验证了推断的景观。
他们的发现发表在2018年1月的《 pnasin 》杂志上。
"如果没有大数据机器学习方法, 就不可能做出这样的预测,"雷蒙德•路易(Raymond Louie)说, 他是中国香港科技大学高级研究院初级研究员及电子及电脑工程学系助理教授。 "估计参数接近440万个。"
该小组处理的数据包括来自1918名艾滋病毒感染者的815个残留物和20043个序列。
科大电子与计算机工程与生物工程系副教授、合著者马修·麦凯(Matthew McKay)说:“这种计算方法给我们提供了快速、准确的结果。这些发现可以帮助生物学家提出新的免疫原和疫苗接种方案,迫使病毒突变到不适合的状态,以逃避免疫应答,而免疫应答可能会阻碍或限制病毒的感染。”
“虽然这种方法的开发是为了解决gp160蛋白引起的具体挑战,我们无法用我们开发的方法来获得其他HIV蛋白的适应度景观,这种方法是一般的,可以应用于其他高维度, 最大熵推断问题,具体来说,我们的适应度景观可以在未来的临床上应用于联合治疗和免疫原设计的选择。“
“这是一项多学科研究,提出了应用数据科学,特别是大数据机器学习方法,以解决生物学中的一个具有挑战性的问题,”McKay说。
原 文 出 处
Big data methods applied to the fitness landscape of the HIV envelope protein
感谢阅读,分享给朋友
版权声明
本文系HIVnews公众平台文章,请使用“分享图文”分享本文,未获得作者授权禁止一切转载行为,转载请联系公众平台获取授权,如有发现擅自转载,一律举报并追究法律责任。
领取专属 10元无门槛券
私享最新 技术干货