
噬菌体在微生物群落中多种多样且丰富,它们在微生物群落的进化和适应中发挥着重要作用。噬菌体复制和繁殖通常被认为限制在单个或狭窄的宿主范围内。法国巴斯德研究所的研究人员,使用来自各种环境的已发表和新生成的基于邻近连接的宏基因组 Hi-C(metaHiC)数据来探索病毒与宿主的相互作用。重建了 4,975 个中等质量或更高的微生物基因组和 6,572 个噬菌体基因组。MetaHiC 在基因组之间产生了联系网络,并能够将大约一半的噬菌体基因组分配给其宿主,结果表明这些噬菌体中有很大一部分在海洋或人类肠道等不同环境中与多个物种相互作用。这一观察结果挑战了噬菌体宿主范围狭窄的传统观点,揭示了多宿主关联在生态系统中很常见,并对它们可能如何影响生态学和进化以及噬菌体治疗方法产生影响。
通过在三个人类肠道metaHiC文库中寻找病毒,将研究开发的MetaTOR流程应用于复杂的自然数据集。在对每个数据集进行独立组装、注释和分箱后,检测到与原始重叠群相比,完整和 HQ vMAG 的数量有所增加。

结果表明,该方法对病毒重叠群进行了适当的分箱,与SemBin或ViralCC 产生的高度污染的 vMAG 形成鲜明对比。MetaTOR 从单个宏基因组样本中生成了数十个具有完整单个病毒基因组的所有特征的 vMAG。它还强调了对接触图进行目视检查以正确评估邻近连接数据集的基因组重建质量的价值。而且与原始组装和单个重叠群的评估相比,MetaTOR显着增加了检索到的完整、HQ和MQ病毒基因组的数量。

MetaTOR和原始组装结果的对比
MetaHiC 的主要优势在于它能够将 vMAG 分配给同一样品中的宿主。厚壁菌门、拟杆菌门和变形菌门是最具代表性的门,反映了数据集的组成(厚壁菌门和变形菌门宿主分别在肠道/发酵罐和海洋/废水样品中过多)。共有 754 个 vMAG 分配给属水平的 MAG 宿主,其中 305 个种水平。其余 487 个 vMAG(占所有宿主相关 vMAG 的 17%)与多个细菌 MAG 和多达 8 个不同的宿主相关。在同一样品中具有多个宿主的 487 个 vMAG 中,分别有 4、5、3、121 和 21 个与来自不同门、纲、目、科和属的细菌相互作用,与不同科相互作用的 vMAG 比例增加似乎主要是由于未分配属的宿主比例增加。

vMAGs的宿主分布
使用 ViPTree 构建了 6,572 个 vMAG 的蛋白进化树,并针对其宿主进行了分析。证实了共享蛋白质特征的相关噬菌体倾向于(1)感染系统发育相关的宿主和(2)具有相对相似的基因组大小的一般行为,表明基因组大小在某种程度上具有进化枝特异性。另一方面,该树还揭示了一些相关的噬菌体可以感染不同细菌属的宿主。

vMAG进化树
研究开发了基于宏基因组三维组织的重组装流程,可简化宏基因组 metaHiC 数据集的处理和分箱。可以应用于已经测序的物种,也可以直接用于从头组装、支架和表征未知基因组的三维组织。
# 安装,conda是安装最新版本的官方推荐方式。
conda create -n metator bioconda::metator
# 激活环境
conda activate metator
# 使用
metator {network|partition|validation|pipeline} [parameters]
metator 命令采用以下形式metator action --param1 arg1 --param2 arg2 #etc.
metator 管道中有三个作/步骤,必须以以下顺序运行:
还有许多其他可选的杂项作:

软件参数对应的运行过程 详细原理如下图:


软件详细原理图