博文

[转载]iCAMP学习2-群落组装机制分析

已有 3736 次阅读 2021-3-17 17:08 |个人分类:R语言|系统分类:科研笔记|文章来源:转载

https://mp.weixin.qq.com/s?__biz=MzI1OTk3NjEwMA==&mid=2247487267&idx=1&sn=6b776e219d1a782adc96b3f4937c2d7a&chksm=ea71f1e8dd0678fe0f5e3e03a06f98483cf2923c0df0f600c821dcda8c109217924afbe91ad4&scene=178&cur_album_id=1568899743559303169#rd

但是文章没有具体讲解方法是如何实现的。本文进行简单说明。我关注的是整套流程的思路，还有非常多的细节并没有写。

之前广泛使用的stegen的群落构建理论是基于对系统发育树整体打乱的基础上进行的。

Stegen, J.C. et al. Quantifying community assembly processes and identifying features that impose them. ISME J. 7, 2069 (2013).

Stegen, J.C., Lin, X., Fredrickson, J. K. & Konopka, A. E. Estimating and mapping ecological processes influencing microbial community assembly. Front.Microbiol. 6, 370 (2015).

但是真实情况更可能是生态过程在基因型和种群上发生，而不是整个群落。在一个微生物群落中，某些种群处于强选择之下，而其他种群可能处于强漂移之下。这种类型的差异不能使用整个群落级别的度量来识别。

而且不同的生物体对环境变化的反应也有很大的不同。在不同的微生物群中，分散能力、多样化率和对漂变的敏感性也有本质上的不同。

因此，在单个分类单元/谱系的水平而不是整个群落的水平上考虑生态过程是有意义的。

iCAMP的方法就是在系统发育树的的基础上先进一步划分了bins,对bins再利用stegen的基本理论进行群落构建过程的分析。

一、三种binning的方法

1. 基于和高丰度物种的距离。丰度最高的物种作为第一个bin的中心。其他物种和他的距离若小于系统发育阈值（ds），就会被划到这个bin中。若大于阈值，则被划分为一个新的bin。以此类推，生成了一系列半径小于ds的bins，称为严格的bins。然而一些严格的bins可能包含类群太少，不能为进一步的分析提供足够的统计能力。每个小bin被合并到它的最近邻bin中，直到所有bin达到最小的大小要求的nmin。

2.基于成对距离。第一个bin是最丰富的物种，其他物种的成对距离均低于ds。第二个bin包括剩余物种中第二丰富的物种。这个过程一直持续到所有类群被分类到不同的bins。为了保证每个bin有足够的大小, 小于nmin的小bin被合并到最近的邻居中，直到所有bin都达到最小需求nmin。

3.基于系统发育树。系统发育树在与根有一定的系统发育距离时(尽可能短)被截断，在此距离下，所有物种之间的连接都低于阈值ds。在截断点后从同一祖先派生衍生的类群被分组到同一严格bin中。然后每个小的bin合并到最近的bin中。重复这个过程，直到所有合并的bin都有足够的大小(≥nmin)。

所有的binning算法都需要一个可靠的系统发育树，但是如果针对高度分化的标记基因（如ITS），树可能很难构建。在这种情况下，应该考虑一些特殊的系统发育树构建方法(如杂交或约束的系统发育树构建)。

nmin一般取6-96之间。对于模拟数据，nmin为24，对于经验数据，nmin为12。ds默认为0.2.

三种方法结果差异不大，模拟群落中差异小于9%。其中第三种基于系统发育树的略好一些。

系统发育binning的目的是获得充分的bin内部的系统发育信号。为了评价每个单元内的系统发育信号，通过Mantel检验分析两两系统发育距离与生态位偏好差异之间的相关性，其中生态位偏好是指一个分类单元的最佳适合(或相对丰度反映的相对适合度)的生态位。Pearson相关系数R > 0.1和p < 0.05为系统发育信号显著的bin。

a-c,三种算法;

d-f,低中高系统发育信号

二、零模型分析

第二步是每个bin内的零模型分析，可由βNRI和RCbray计算。由于bin内存在显著的系统发育信号，βNRI的系统发育零模型随机化在bin内部进行。而RCbray的分类学零模型是用来推断中性扩散过程的，它不是种特异性的，而是在同一群落下以概率影响所有分类单元，因此跨bin随机化是合理的。RCbray随机化在bin间进行。