今天要介绍的是 昨天新发在《New Phytologist》的研究论文,题为《ApoplastP: prediction of effectors and plant proteins in the apoplast using machine learning》。
植物质外体是细胞间信号传导,运输和植物-病原体相互作用的组成部分。植物病原体将效应物递送到质外体和内部宿主细胞中,但目前还没有计算方法来区分这些定位。
作者开发了ApoplastP,这是第一种方法来预测效应器或植物蛋白本地化的质外体。
ApoplastP揭示了两种效应蛋白和植物蛋白共同的外质体定位的特征,即谷氨酸,酸性氨基酸和带电荷氨基酸的消耗以及小氨基酸的富集。ApoplastP预测效应器中的质外体定位,灵敏度为75%,假阳性率为5%,将富含半胱氨酸的分类器的准确性提高了> 13%。
ApoplastP不依赖于信号肽的存在并正确预测非常规分泌蛋白的定位。真菌腐生菌的分泌物以及坏死营养物质,半活体和细胞外真菌病原体富集预测质外体蛋白质。锈菌病原体具有低比例的预测质外体蛋白质,但是它们对预测的效应物高度富集。
ApoplastP使用机器学习开创了外推式定位预测。它将促进功能研究,并且对于预测效应物是否定位于质外体或其是否进入植物细胞是有价值的。
黑暗大邪神点评:我们外行人看来,机器学习还是刚刚起步。比如前几天我的微信公众号不能登录,联系腾讯的客服,他就是用机器学习训练的客服和我沟通,感觉真是笨笨的,但是似乎这个领域的发展很快,比如会围棋的阿尔法狗。
机器学习与生命科学的研究的紧密程度越来越高,今年以来已经发表了若干篇研究论文。从大的来说,现在趋势就是学科的融合与交叉,培育和衍生出新的学科增长点,比如农-工交叉、农-信息交叉等等。
回答该论文上,个人觉得质外体本身也是一个值得研究却仍少被研究的方向(相对于细胞的其他组分)。具体可以参见何胜洋院士今年发表的Nature和他最新的综述。所以建立这样的一个数据库,在方法和内容上都有一定的新意,只是不知道这个预测的准确度了,大伙可以试一试。
天气冷了,可别感冒了。吃火锅的时候要的别多吃大蒜。
领取专属 10元无门槛券
私享最新 技术干货