Journal:Biology and Fertility of Soils
IF=3.788
Corresponding authors: Qirong Shen &James M. Tiedje
背景
本文以三种生物燃料作物的根际真菌群落为研究对象,考察了不同参考数据库对得到物种的影响。
三种数据库:Unite, warcup,LSU
引物:ITS9 (GAACGCAGCRAAIIGYGA) /ITS4 (TCCTCCGCTTATTGATATGC)扩增ITS2;
LR3 (CCGTGTTTCAAGACGGG)和LR0R (ACCCGCTGAACTTAAGC)扩增LSU;
LSU区域在454上测序,ITS在Illumina Miseq上测序。
数据处理
LSU序列和LSU数据库比对,数据库包含11,442条序列,1895个属。ITS序列分别和UNITE与Warcup数据库比对。Warcup数据库包含17,923条序列,1461个属, UNITE数据库包含145,019条序列,2137个属。
结果
1. UNITE鉴定出的物种数量最多,未鉴定的物种百分比也最多。移除了未鉴定的物种后,LSU鉴定的比例最高,其次是Warcup和UNITE。
Fig. 1 LSU, UNITE, Warcup从门到属可鉴定的比例
2. LSU覆盖度较低。UNITE和Warcup这两个ITS区域的数据库得到的群落更相似。不同数据库覆盖度不同,相同序列用不同的数据库得到的群落也会有差异。
Fig. 2 UNITE, WARCUP, LSU门到属独有和共有的物种数
3.PERMANOVA和MRT表明植物类型(一年vs多年生)是驱动群落变化的主要动力。MRT中占据了第一次分枝。Warcup和LSU其次按照生物燃料类型分开,最后是采样时间。而UNITE先按照时间最后按照生物燃料类型。
Fig. 3 LSU, UNITE, Warcup属水平上的多元回归树Multipleregression tree (MRT)
4. Beta多样性在三个数据库无显著差异。而三种生物燃料及旱季或者雨季之间的差异很大,和数据库无关。
作者讨论
虽然ITS可以精确到种,但是只有小部分的序列达到了这个标准(35.1% Warcup, 16.3% UNITE)。且ITS的物种信息存在更多的冲突,这可能是因为ITS序列更多造成的。
不同数据库侧重点不同。Warcup侧重植物相关的真菌,UNITE致力于提高所有真菌类群的覆盖度。LSU有着更好的系统发育等级。
只有不到50%的属在不同数据库之间共享,表明了数据库对物种分类影响很大。但是不同数据库分类的模式(pattern)相同,表明对群落beta多样性影响不大。
我的一些想法
1.该文章讨论了不同数据库对物种注释带来的影响。但是观测到的影响到底是数据库的差异还是引物带来的差异呢?ITS和LSU每个区域都只选择一对引物,不同引物对之间的偏好性可能已经很强了。本来引物扩增的物种就不一样,再经过不同数据库的放大,我们看到的差异可能就更大了。
2. Resample数只有4127,太少了。文中也没有稀释曲线,不清楚测序深度如何。但是看resample数应该不够。
[1] Xue C, Hao Y, Pu X, et al. Effect of LSUand ITS genetic markers and reference databases on analyses of fungalcommunities [J].Biology andFertility of Soils, 2018.
一个环境工程专业却做生信分析的深井冰博士,深受拖延症的困扰。想给自己一点压力,争取能够不定期分享学到的生信小技能,亦或看文献过程中的一些笔记与小收获,记录生活中的杂七杂八。
领取专属 10元无门槛券
私享最新 技术干货