开篇先引用周老师综述中的一张图:
相信只要是做过群落构建(community assembly processes)对这张图都不会陌生。
Stegen这套方法目前已经被用烂了,也是多种群落构建方法中使用量最大的一种(我猜的)。
我总结了一下,目前在文章中普遍出现的计算群落构建的方法有三套:
1.即是Stegen这套方法及其发展;
该方法最近的进展参见前文:
2.ST,NST,MST系列;ST为最基础的算法,NST和MST是其进化版。
之前介绍过NST:
3.最近介绍的Sloan方法:
ISME+Microbiome:Sloan随机性方法的发展及代码
关于Stegen方法我虽然也看过不少文章,听过不少介绍,但是一直没有看过原文。趁着有空把该方法的原文看了一下,本文做一记录。
Link:
https://www.nature.com/articles/ismej201393
研究地下含水层两种不同地质构造下的地下微生物群落的构建机制。
Stegen并不是独创了这套方法,而是在前人Vellend(2010)的概念框架内进行,该框架侧重于选择、分散、漂移和物种形成的影响。
Vellend M . (2010). Conceptual synthesis in community ecology. Q Rev Biol 85: 183–206.
并结合了前人大量的研究成果,最早可追溯到(Hubbell, 2001)。
Hubbell SP . (2001) The Unified Neutral Theory of Biodiversity and Biogeography. Princeton University Press: Princeton, NJ.
零模型部分参考:
Chase JM, Kraft NJB, Smith KG, Vellend M,Inouye BD . (2011). Using null models to disentangle variation in community dissimilarity from variation in α-diversity. Ecosphere 2: art24.
Stegen JC, Lin X, Konopka AE, Fredrickson JK .(2012). Stochastic and deterministic assembly processes in subsurface microbial communities. ISME J 6: 1653–1664.
为了推断生态过程,分析框架部分依赖于系统发育更替,即一个群落中发现的OTUs与另一个群落中发现的OTUs之间的进化距离。
利用系统发育周转率来推断生态过程需要OTUs的最佳生境条件中的“系统发育信号(phylogenetic signal)”,其中亲缘关系密切的类群的栖息地偏好比远亲的栖息地偏好更相似。
首先要测试系统发育信号,以确定是否可以利用系统发育周转率在系统中进行生态推断,并确定最合适的系统发育周转率指标。
与之前的工作一致,此研究发现了显著的系统发育信号,但仅在较短的系统发育距离内。
因此,最合适的方法是在最近的亲戚中量化系统发育的更替。
所以才会使用βMNTD(定量了一个群落中每个OTU (k)与其在另一个群落中最近亲属(m)之间的系统发育距离)这个参数。
R包picante中的comdistnt函数计算βMNTD。
使用Mantel correlogram 表征系统发育信号的显著性。实心的点为显著的系统发育信号,都在较短的系统发育距离内。
延伸:
1. 使用Stegen方法之前应该先画一个Mantel correlogram 图先确定有显著的系统发育信号。但是很多文章并没有画,而是直接就用该方法。
2. 打乱一棵树本质上是很有问题的,会使小距离变得很大。改进举措之一就是iCAMP,先划分bins,只在bin的小距离范围内进行打乱。
3. 在iCAMP方法中,由于先划分了Bins,而bin内存在显著的系统发育信号,因此可以使用βMPD(群落中所有物种对间平均的进化距离)来代替βMNTD。
4. 由于物种数对系统发育树距离产生影响,βMNTD和βMPD巧妙地解决了物种数的影响,见:
系统发育群落组成的更替用βMNTD表征,而OTU组成的更替用RCbray表征。
Raup–Crick原本不考虑丰度,本文将其拓展为考虑丰度的形式。简而言之,当地群落是概率聚集的,其中观察到一个给定的OTU个体的概率与OTU所占据的数量和OTU在所有抽样群落中的相对丰度相关。对于给定的一对群体,每个群体都被概率聚集999次。对于每一次迭代,Bray-Curtis dissimilarity被用于量化组成的转换,从而生成一个Bray-Curtis值的零分布。
延伸:
RCbray利用矩阵进行打乱构建零模型,和物种数无关。
经典的群落构建判断标准:
延伸:
这里作者划分了两步,先看βNTI,再看RC。目前所有文章也都是按照这个来写的。但是一定要是这个顺序吗?先RC看,再看βNTI呢?实际计算过程,其实两者是同时进行的。
另外,该方法|βNTI|>2只是选择作用,而没有区分同质选择和异质选择。
该方法不足:
1. 现有的方法不能估计生态过程的相对影响或确定未测量的环境变量。
2. 当前的框架不能解析出选择的子类,如竞争和营养的相互作用。
3. 该框架可能对系统发育不确定性和alpha多样性低估等因素敏感。
Link:
https://www.frontiersin.org/articles/10.3389/fmicb.2015.00370/full
和上文同样的数据。
对模型框架进行了扩展,区分了同质选择(homogeneous selection)和变量选择(variable selection)。这个扩展的框架揭示了变量选择相对于同质选择的重要影响。
生态选择是由对特定环境条件具有不同适应水平的不同生物体所产生的结果。
认为“环境条件”包括非生物变量(例如,温度)和与生物相互作用有关的生物因素。
如果环境条件在空间上是均匀的,那么选择性环境也将是均匀的。
一致的选择压力(由一致的环境条件产生)是组分低周转率的主要原因,这种情况被称为“同质选择”。
另一方面,如果环境条件通过空间变化,类群间的适应度差异也会发生变化。选择压力的变化(由环境条件的变化引起)是高度组分转换的主要原因,这种情况被称为“变量选择”。
PS:我猜本文的变量选择应该就是异质选择(Heterogeneous selection)。
至此,Stegen方法的四种结果终于聚齐,可以召唤神龙paper了~
Reference:
Stegen JC, Lin X, Fredrickson JK,Konopka AE. 2015. Estimating and mapping ecological processes influencing microbial community assembly. Front Microbiol6:370. https://doi.org/10.3389/fmicb.2015.00370
Stegen JC, Lin X, Fredrickson JK, Chen X, Kennedy DW, Murray CJ, Rockhold ML, Konopka A. 2013. Quantifying community assembly processes and identifying features that impose them. ISME J 7:2069–2079. https://doi.org/10.1038/ismej.2013.93