

Journal:Methods in Ecology and Evolution
First published: 23 July 2019
昨天刚刚上线一篇新文章,测试了5.8S区域也可作为OTU划分的依据,并通过in silico方法比较了5.8S与ITS2对物种划分的差异。作者建立了一个平台,可以将5.8S与ITS2结合起来进行数据分析。
结果表明5.8S-ITS2平台和单独ITS2相比得到了3倍的OTU,尤其是Chytridiomycota(10x) 和Rozellomycota(3x)。
此方法可以有效的提升数据库的物种覆盖度,进而得到更多的OTU。
5.8S区域由于变化小,通常不利于物种划分。但是却可用于系统发育的鉴定。目前UNITE数据库包含所有ITS区域,自然也涵盖5.8S区。由于现在对于ITS1和ITS2数据库仍不完善,很多真菌在门水平上不能被准确分类,因此可探究5.8S与ITS2区整合之后的物种覆盖度,尤其是在较高分类水平上。
作者发现在种水平上,如果数据库完整,ITS1和ITS2效果确实好与5.8S。但是当数据库不完整,高分类水平上5.8S可以有效的区分物种,效果好于ITS1和ITS2。
该工具基于snakemake开发,目前已经上传到Github:
https://github.com/f-heeger/two_marker_metabarcoding
主要分四步:序列质控;5.8S鉴定;ITS2鉴定;最终鉴定。
5.8S和 ITS2序列在质控后通过ITSx分开,分别进行物种划分。划分方法为lowest common ancestor (LCA) classification。最终鉴定步骤将两者结果综合考虑,若ITS2划分到了更低的分类水平,则选择ITS2的结果。若ITS2没有划分成功自动选择5.8S的结果。若两者结果不一致,还可以自己选择用5.8S还是ITS2。

结果

In silico结果,可以清楚看到高分类水平5.8S更准,低分类水平ITS1和ITS2更准。

环境样本,5.8S+ITS2得到的Unknown比例大大减少。(原文的图就是这么不清楚)