欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 用于分析来自复杂异质群落的微生物菌株、预测并识别其功能关系和相互作用、以及基于其选择并合成微生物群的方法、设备和系统独创技术181428字

用于分析来自复杂异质群落的微生物菌株、预测并识别其功能关系和相互作用、以及基于其选择并合成微生物群的方法、设备和系统

2021-02-04 15:28:41

用于分析来自复杂异质群落的微生物菌株、预测并识别其功能关系和相互作用、以及基于其选择并合成微生物群的方法、设备和系统

  本申请要求2015年6月25日提交的标题为“Methods for Screening Microbial Communities,”的美国临时申请序列号62/184,650的优先权益,并且要求2016年1月7日提交的标题为“Methods for Screening Microbial Communities,”的美国临时申请序列号62/276,142的优先权益;前述申请中的每个以引用的方式明确地并入本文。

  背景

  微生物在自然界中作为群落共存并且进行各种相互作用,从而在个体群落成员之间引起合作和竞争两者。微生物生态学的进步展示了大多数群落中高水平的物种多样性和复杂性。微生物在环境中无处不在,它们栖息在生物圈内的广泛的生态系统中。个体微生物及其相应的群落在环境(诸如海洋地点(深海和海洋表面两者)、土壤和动物组织,包括人类组织)中发挥独特的作用。

  概述

  在本公开的一方面,公开一种用于识别来自多个样品的活性微生物、分析所识别的微生物与至少一种元数据、以及基于所述分析创建微生物的群的方法。所述方法的实施方案包括确定样品中的一种或多种活性微生物菌株的绝对细胞计数,其中所述一种或多种活性微生物菌株存在于所述样品中的微生物群落中。所述一种或多种微生物菌株是微生物类型的亚分类单元。本文提供的方法中使用的样品可具有任何环境来源。例如,在一个实施方案中,所述样品来自动物、土壤(例如,非根际土壤或根际)、空气、盐水、淡水、废水污泥、沉淀物、油、植物、农业产品、植物、或极端环境。在另一个实施方案中,所述动物样品是血液、组织、牙齿、汗液、指甲、皮肤、毛发、粪便、尿液、精液、黏液、唾液、胃肠道、瘤胃、肌肉、脑、组织、或器官样品。在一个实施方案中,提供一种用于确定一种或多种活性微生物菌株的绝对细胞计数的方法。

  在本公开的一个实施方案中,所述一种或多种微生物类型是一种或多种细菌(例如,支原体、球菌、芽胞杆菌、立克次氏体、螺菌)、真菌(例如,丝状真菌、酵母)、线虫、原生动物、古生菌、藻类、沟鞭藻类、病毒(例如,噬菌体)、类病毒和/或其组合。在一个实施方案中,所述一种或多种微生物菌株是一种或多种细菌(例如,支原体、球菌、芽胞杆菌、立克次氏体、螺菌)、真菌(例如,丝状真菌、酵母)、线虫、原生动物、古生菌、藻类、沟鞭藻类、病毒(例如,噬菌体)、类病毒和/或其组合。在另一个实施方案中,所述一种或多种微生物菌株是一种或多种真菌物种或真菌亚种。在另一个实施方案中,所述一种或多种微生物菌株是一种或多种细菌物种或细菌亚种。在再一个实施方案中,所述样品是瘤胃样品。-在一些实施方案中,所述瘤胃样品来自牛。在再一个实施方案中,所述样品是胃肠样品。在一些实施方案中,所述胃肠样品来自猪或鸡。

  在用于确定样品中的一种或多种活性微生物菌株的绝对细胞计数的方法的一个实施方案中,检测所述样品中的一种或多种微生物类型的存在,并且确定所述样品中的所述一种或多种微生物类型中的每一种的绝对数量。测量独特的第一标记物的数量,连同所述独特的第一标记物中的每一种的量或丰度。如本文所述,独特的第一标记物是独特的微生物菌株的标记物。然后通过测量一种或多种独特的第二标记物的表达水平在蛋白质或RNA水平下评定活性。所述独特的第二标记物与所述第一独特标记物相同或不同,并且是生物体菌株的活性的标记物。基于所述独特的第二标记物中的一种或多种的表达水平,确定哪些(如果有的话)一种或多种微生物菌株是活性的。在一个实施方案中,如果微生物菌株在阈值水平下或在高于阈值水平的百分比下表达所述第二独特标记物,则所述微生物菌株被认为是活性的。所述一种或多种活性微生物菌株的绝对细胞计数基于所述一种或多种活性微生物菌株的所述一种或多种第一标记物的量和所述一种或多种微生物菌株是其亚分类单元的微生物类型的绝对数量来确定。

  在一个实施方案中,确定所述样品中的所述一种或多种生物体类型中的每一种的数量包括将所述样品或其部分经受核酸测序、离心、光学显微镜检查术、荧光显微镜检查术、染色法、质谱法、微流体、定量聚合酶链反应(qPCR)或流式细胞术。

  在一个实施方案中,测量所述样品中的第一独特标记物的数量包括测量独特的基因组DNA标记物的数量。在另一个实施方案中,测量所述样品中的第一独特标记物的数量包括测量独特RNA标记物的数量。在另一个实施方案中,测量所述样品中的独特的第一标记物的数量包括测量独特的蛋白标记物的数量。在另一个实施方案中,测量所述样品中的独特的第一标记物的数量包括测量独特的代谢物标记物的数量。在另一个实施方案中,测量所述样品中的独特的代谢物标记物的数量包括测量独特的碳水化合物标记物、独特的脂质标记物或其组合的数量。

  在另一个实施方案中,测量独特的第一标记物的数量及其量包括将来自所述样品的基因组DNA经受高通量测序反应。在一个实施方案中,测量独特的第一标记物包括例如使用对于独特的第一标记物特异性的引物的标记物特异性反应。在另一个实施方案中,一种元基因组途径。

  在一个实施方案中,测量一种多种独特的第二标记物的表达水平包括将样品中的RNA(例如,miRNA、tRNA、rRNA、和/或mRNA)经受表达分析。在另一个实施方案中,所述基因表达分析包括测序反应。在又一个实施方案中,所述RNA表达分析包括定量聚合酶链反应(qPCR)、元转录组测序和/或转录组测序。

  在一个实施方案中,测量所述样品中的第二独特标记物的数量包括测量独特的蛋白标记物的数量。在另一个实施方案中,测量所述样品中的独特的第二标记物的数量包括测量独特的代谢物标记物的数量。在另一个实施方案中,测量所述样品中的独特的代谢物标记物的数量包括测量独特的碳水化合物标记物的数量。在另一个实施方案中,测量所述样品中的独特的代谢物标记物的数量包括测量独特的脂质标记物的数量。在另一个实施方案中,所述一种或多种微生物菌株的绝对细胞计数在多个样品中测量。在另一个实施方案中,所述多个样品从相同的环境或相似的环境获得。在另一个实施方案中,所述多个样品在多个时间点处获得。

  在另一个实施方案中,测量一种多种独特的第二标记物的水平包括将所述样品或其部分经受质谱法分析。在又一个实施方案中,测量一种多种独特的第二标记物的表达水平包括将所述样品或其部分经受元核糖体作图或核糖体作图。

  在本公开的另一方面,用于确定一种或多种活性微生物菌株的绝对细胞计数的方法在多个样品中确定,并且所述绝对细胞计数水平与一种或多种元数据(例如,环境)参数相关。在一个实施方案中,使所述绝对细胞计数水平与一种或多种元数据参数相关包括共现测量、交互信息测量、链接分析、和/或类似方法。在一个实施方案中,所述一种或多种元数据参数是第二活性微生物菌株的存在。因此,在此方法的一个实施方案中,所述绝对细胞计数值用于确定微生物群落中的所述一种或多种活性微生物菌株与环境参数的共现。在另一个实施方案中,所述一种或多种活性微生物菌株的所述绝对细胞计数水平与环境参数相关,所述环境参数诸如饲喂条件、pH、营养物质或从其获得微生物群落的环境的温度。

  在此方面,所述一种或多种活性微生物菌株的所述绝对细胞计数与一种或多种环境参数相关。所述环境参数可以是样品本身的参数,例如pH、温度、样品中的蛋白质的量、群落中其他微生物的存在。在一个实施方案中,所述参数是从其获得样品的宿主的特定基因组序列(例如,特定基因突变)。可替代地,所述环境参数是影响微生物群落的一致性的变化(即,其中微生物群落的“一致性”通过群落中的微生物菌株的类型和/或特定微生物菌株的数量表征)或受微生物群落的一致性的变化影响的参数。例如,在一个实施方案中,环境参数是动物的食物摄入或由泌乳的反刍动物产生的乳液的量(或乳液的蛋白质或脂肪含量)。在本文所述的一些实施方案中,环境参数称为元数据参数。

  在一个实施方案中,确定所述样品中的一种或多种活性微生物菌株的共现包括创建使用代表一种或多种环境参数和活性微生物菌株关联的链接填充的矩阵。

  在一个实施方案中,确定一种或多种活性生物体菌株和元数据参数的共现包括测量网络内的菌株的连通性的网络和/或聚类分析方法,其中所述网络是共享共同的或相似的环境参数的两个或更多个样品的集合。在另一个实施方案中,所述网络分析包括链接分析、模块性分析、稳健性测量、中间性测量、连通性测量、传递性测量、集中性测量或其组合。在另一个实施方案中,所述聚类分析方法包括构建连通性模型、子空间模型、分布模型、密度模型、或质心模型。在另一个实施方案中,所述网络分析包括通过链路挖掘和预测、协作分类、基于链路的聚类、关系相似性、或其组合进行的网络预测建模。在另一个实施方案中,所述网络分析包括交互信息、最大信息系数计算、或在变量之间建立连通性的其他非参数方法。在另一个实施方案中,所述网络分析包括基于微分方程的群体建模。在另一个实施方案中,所述网络分析包括洛特卡-沃尔泰拉建模(Lotka-Volterra modeling)。

  基于所述分析,识别一种或多种活性相关菌株以用于包括在微生物群中。

  附图简述

  图1A示出用于根据一些实施方案筛选并分析来自复杂异质群落的微生物菌株、预测其功能关系和相互作用、以及基于其选择并合成微生物群的示例性高水平过程流程图。

  图1B示出用于根据一个实施方案确定一种或多种活性微生物菌株的绝对细胞计数的大体过程流程图。

  图2示出根据一个实施方案确定一个样品或样品中的一种或多种活性微生物菌株与一种或多种元数据(环境)参数的共现的一般过程流程图。

  图3A是示出根据一个实施方案的示例性微生物相互作用分析和选择系统300的示意图,并且图3B是用于使用此系统的示例性过程流程图。参考图3A和图3B描述确定天然微生物群落内的多维种间相互作用和依赖性、识别活性微生物、以及选择多种活性微生物以形成改变指定参数和/或相关测量的微生物的群、聚集体或其他合成分组的系统和过程。

  图3C和图3D提供示出本公开的一些方面的示例性数据。

  图4示出确定影响奶牛的乳脂产生的瘤胃微生物群落组分的实验过程中产生的乳脂的磅数的非线性。

  图5示出靶标菌株Ascus_713的具有活性过滤的绝对细胞计数与所产生的乳脂的磅数(lb)的相关性。

  图6示出靶标菌株Ascus_7的具有活性过滤的绝对细胞计数和在实验过程中产生的乳脂的磅数(lb)。

  图7示出靶标菌株Ascus_3038的不具有活性过滤的相对丰度与所产生的乳脂的磅数(lb)的相关性。

  图8示出其中奶牛被施用根据所公开的方法制备的微生物群的现场实验的结果;图8A示出随时间产生的乳脂的磅数的平均数量;图8B示出随时间产生的乳蛋白的磅数的平均数量;并且图8C示出随时间产生的能量校正的乳液(ECM)的磅数的平均数量。

  详细描述

  生物群落例如通过循环营养物质和固定碳对于许多不同类型的生态系统和地球的生物地球化学中的环境过程是重要的(Falkowski等人(1998)Science 281,第237-240页,其以引用的方式整体并入本文)。然而,由于群落复杂性和任何给定生物群落的大多数成员缺乏可培养性,这些过程的分子和生态细节以及影响因素仍然了解得很少。

  微生物群落在定性和定量组成方面不同并且每个微生物群落是独特的,并且微生物群落的组成取决于其所驻留的给定生态系统和/或环境。微生物群落成员的绝对细胞计数易受群落所驻留的环境的变化以及由微生物导致的生理和代谢变化(例如,细胞分裂、蛋白质表达等)影响。群落内的一种活性微生物的环境参数和/或量的变化可对于群落的其他微生物并且对于群落所存在的生态系统和/或环境具有深远的影响。为了理解、预测这些微生物群落的变化并且对其做出反应,需要识别样品中的活性微生物和相应群落中的活性微生物的数量。然而,目前,微生物群落成员的大部分研究聚焦于特定微生物群落中的微生物的比例而非绝对细胞计数(Segata等人(2013).Molecular Systems Biology 9,第666页,其以引用的方式整体并入本文)。

  虽然微生物群落组成可易于例如通过使用高通量测序途径来确定,但是还需要更深地理解相应的群落如何会集和维持。

  微生物群落参与关键的过程,诸如必需元素的生物地球化学循环(例如,碳、氧、氮、硫、磷的循环)和碳、氧、氮、硫、磷以及各种金属的各种金属粘结;并且相应群落的结构、相互作用和动态学对于生物圈的存在是关键的(Zhou等人(2015).mBio6(1):e02288-14.Doi:10.1128/mBio.02288-14,其出于所有目的以引用的方式整体并入本文)。此类群落是高度异质的并且几乎总是包括细菌、病毒、古生菌、以及其他微真核生物(诸如真菌)的复杂混合物。人类环境(诸如肠和阴道)中的微生物群落异质性的水平与诸如炎性肠病和细菌性阴道病的疾病关联(Nature(2012).第486卷,第207页,其出于所有目的以引用的方式整体并入本文)。然而,值得注意的是,甚至健康的个体在占据此类环境中的组织的微生物方面也明显地不同(Nature(2012).第486卷,第207页)。

  因为许多微生物可能是不可培养的或另外地培养起来困难/昂贵的,培养独立性途径(诸如核酸测序)已使对各种微生物群落的多样性的理解进步。小亚基核糖体RNA(SSU rRNA或16s rRNA)基因的扩增和测序是部分地基于基因的普遍存在和进化的相对统一速率研究群落中的微生物多样性的基本途径。高通量方法的进步引起元基因组学分析,其中对微生物的整个基因组进行测序。此类方法不需要群落的先验知识,从而能够发现新的微生物菌株。元基因组学、元转录组学、元蛋白质组学和代谢物组学均能够探测群落以区分结构和功能。

  不仅能够编录群落中的微生物并且还能够辨别哪些成员是活性的、这些生物体的数量、以及微生物群落成员与彼此和与环境参数的共现(例如,群落中的两种微生物响应于群落环境的某些变化的共现)允许理解相应的环境因素(例如,气候、存在的营养物质、环境pH)对于微生物群落内的微生物(及其相应的数量)的一致性的重要性以及某些群落成员对于群落所驻留的环境的重要性。本公开解决这些和其他需要。

  除非上下文另外明确地规定,否则如在本说明书中所用的,单数形式“一个/种(a/an)”和“所述(the)”包括复数个指代物。因此,例如,术语“生物体类型”意图是指单种生物体类型或多种生物体类型。又例如,除非上下文明确地要求存在一种且仅一种环境参数,否则术语“环境参数”可是指单种环境参数或多种环境参数,使得不定冠词“一个/种(a/an)”不排除存在多于一种环境参数的可能性。

  在整个本说明书中对“一个实施方案”、“实施方案”、“一方面”、“或方面”、“一个具体实施”、或“具体实施”的引用是指结合实施方案来描述的具体特征、结构或特性被包括在本发明的至少一个实施方案中。因此,贯穿本说明书在各个地方出现短语“在一个实施方案中(in one embodiment)”或“在一个实施方案中(in an embodiment)”不一定全部指代相同的实施方案。此外,具体特征、结构或特性可以任何合适的方式组合在一个或多个实施方案中。

  如本文所用,在具体实施方案中,当在数值前时,术语“约”或“大约”指示加或减10%的范围的值。

  如本文所用,“分离”、“分离的”、“分离的微生物”和类似的术语意图是指一种或多种微生物与在特定环境(例如,土壤、水、动物组织)中其所相关联的物质中的至少一种分开。因此,“分离的微生物”不存在于其天然发生的环境中;相反,通过本文所述的各种技术,所述微生物从其天然环境去除并且放置成非天然发生的存在状态。因此,分离的菌株可例如作为生物上纯的培养物或作为与可接受的载体缔合的孢子(或其他形式的菌株)存在。

  如本文所用,“微生物群”指代包含通过本公开的方法、系统和/或设备识别的一种或多种活性微生物并且在天然发生的环境中和/或在不在自然界中存在的比率或量下不天然地存在的组成。例如,微生物群或聚集体可由一种或多种分离的微生物菌株连同适当的培养基或载体形成。微生物群可施加或施用到靶标,诸如靶标环境、群体和/或动物。

  根据本公开的微生物群选自活性的互相关个体微生物物种或物种菌株的集、子集和/或分组。如通过本公开的方法识别的关系和网络基于实行一种或多种共同的功能来分组和/或关联,或者可描述为、涉及、或引起可识别的参数(诸如感兴趣的表型性状(例如,反刍动物的乳液产生增加))、或与其相关联。从其选择微生物群的组和/或微生物群本身可包括两种或更多种物种、物种菌株、或不同物种菌株、微生物菌株。在一些情况下,微生物可在组和/或微生物群内共生地共存。

  在本公开的某些方面,微生物群是或基于作为分离的且生物上纯的培养物存在的一种或多种分离的微生物。本领域的技术人员应理解,特定微生物的分离的且生物上纯的培养物代表所述培养物基本上不含(在科学原因内)其他活的生物体并且仅含有所讨论的个体微生物。培养物可含有变化浓度的所述微生物。本公开指出分离的且生物上纯的微生物经常“必需区别于较不纯或不纯的物质”。参见,例如,In re Bergstrom,427F.2d 1394,(CCPA 1970)(讨论纯化的前列腺素),还参见,In re Bergy,596F.2d 952(CCPA 1979)(讨论纯化的微生物),还参见,Parke-Davis&Co.v.H.K.Mulford&Co.,189F.95(S.D.N.Y.1911)(讨论纯化的肾上腺素的Learned Hand),部分维持,部分推翻,196F.496(第2巡回法院1912年),其中的每个以引用的方式并入本文。此外,在一些方面,本公开的具体实施可需要分离的且生物上纯的微生物培养物在所公开的微生物群中使用而必需实现的浓度或纯度限度的某些定量测量。在某些实施方案中,这些纯度值的存在是使通过现在公开的方法识别的微生物与以天然状态存在的那些微生物区分开的另外属性。参见,例如,Merck&Co.v.Olin Mathieson Chemical公司,253F.2d 156(第4巡回法院1958年)(讨论由微生物产生的维生素B12的纯度限度),其以引用的方式并入本文。

  如本文所用,“载体”、“可接受的载体”、或“药学载体”指代与微生物群一起使用或在微生物群中使用的稀释剂、佐剂、赋形剂、或媒介物。此类载体可以是无菌液体,诸如水和油,包括石油、动物、植物或合成来源的那些;诸如花生油、大豆油、矿物油、芝麻油等。优选地采用水或水性溶液盐水溶液以及水性右旋糖和甘油溶液作为载体,在一些实施方案中用作可注射溶液。可替代地,所述载体可以是固体剂型载体,包括但不限于粘结剂(用于压缩丸剂)、助流剂、包封剂、风味剂、以及着色剂中的一种或多种。载体的选择可关于预期的施用途径和标准药学实践来选择。参见Hardee和Baggo(1998.Development and Formulation of Veterinary Dosage Forms.第2版CRC Press.第504页);E.W.Martin(1970.Remington’s Pharmaceutical Sciences.第17版Mack Pub.公司);以及Blaser等人(美国公布US20110280840A1),其中的每个以引用的方式明确地整体并入本文。

  术语“微生物(microorganism)”和“微生物(microbe)”在本文中可互换使用并且指代属于细菌域、真核生物域或古生菌域的任何微生物。微生物类型包括但不限于细菌(例如,支原体、球菌、芽胞杆菌、立克次氏体、螺菌)、真菌(例如,丝状真菌、酵母)、线虫、原生动物、古生菌、藻类、沟鞭藻类、病毒(例如,噬菌体)、类病毒和/或其组合。生物体菌株是生物体类型的亚分类单元,并且可以是例如特定微生物的物种、亚种、亚型、遗传性变体、致病变型或血清变型。

  如本文所用的术语“标记物”或“独特的标记物”是独特的微生物类型、微生物菌株或微生物菌株的活性的指示物。标记物可在生物样品中测量,并且包括但不限于基于核酸的标记物(诸如核糖体RNA基因)、基于肽或蛋白质的标记物和/或代谢物或其他小分子标记物。

  如本文所用的术语“代谢物”是代谢的中间体或产物。在一个实施方案中,代谢物是小分子。代谢物具有各种功能,包括在作为酶的辅因子对酶的促进、结构、信号传导、刺激性和抑制性作用中、在防御中以及在与其他生物体(诸如色素、增味剂和信息素)的相互作用中的各种功能。初级代谢物直接参与正常生长、发育和生殖。次级代谢物不直接参与这些过程但是通常具有重要的生态功能。代谢物的实例包括但不限于抗生素和色素,诸如树脂和萜烯等。一些抗生素使用初级代谢物作为前体,诸如放线菌素,其由初级代谢物色氨酸产生。如本文所用的代谢物包括小的亲水性碳水化合物;大的疏水性脂质和复合天然化合物。

  在本公开的一方面,公开一种用于识别多种微生物菌株与一种或多种元数据和/或参数之间的关系的方法。如图1A所示,从至少两个样品来源接收样品和/或至少两个样品的样品数据101,并且针对每个样品,确定一种或多种微生物类型的存在103。确定每个样品中的一种或多种微生物类型的每种所检测的微生物类型的数量(细胞计数)105,并且确定每个样品中的独特的第一标记物的数量及其量107,每种独特的第一标记物是微生物菌株的标记物。整合每种微生物类型的数量和第一标记物的数量以得出存在于每个样品中的每种微生物菌株的绝对细胞计数109,并且基于每种微生物菌株的至少一种独特的第二标记物的测量值超过指定阈值确定每个样品中的每种微生物菌株的活性水平111,如果微生物菌株的至少一种独特的第二标记物的测量值超过对应的阈值,则此菌株被识别为活性的。然后通过所确定的活性过滤每种微生物菌株的绝对细胞计数以提供至少两个样品中的每个的活性微生物菌株及其相应的绝对细胞计数的列表113。进行对至少两个样品中的每个的活性微生物菌株的所过滤的绝对细胞计数的列表与至少一种测量的元数据或额外的活性微生物菌株的网络分析115,所述网络分析包括确定每种活性微生物菌株与每另一种活性微生物菌株之间的最大信息系数分数和确定每种活性微生物菌株与至少一种测量的元数据或额外的活性微生物菌株之间的最大信息系数分数。然后可基于功能、预测功能和/或化学对活性微生物菌株进行归类117,并且基于所述归类识别并输出多种活性微生物菌株119。在一些实施方案中,所述方法还包括从所识别的多种微生物菌株会集活性微生物群121,所述微生物群被配置来在施加到靶标时改变对应于至少一种测量的元数据的特性。所述方法还可包括基于所输出的多种识别的活性微生物菌株识别至少一种病原体(对于额外的细节,参见实施例4)。在一些实施方案中,可利用所述多种活性微生物菌株会集被配置来当施加到靶标时解决至少一种所识别的病原体和/或治疗与至少一种所识别的病原体相关联的症状的活性微生物群。

  在本公开的一方面,提供一种用于确定一个样品或多个样品中的一种或多种活性微生物菌株的绝对细胞计数,其中所述一种或多种活性微生物菌株存在于所述样品中的微生物群落中。所述一种或多种微生物菌株是一种或多种生物体类型的亚分类单元(参见图1B处的方法1000)。针对每个样品,检测样品中的一种或多种微生物类型的存在(1001)。确定样品中的一种或多种生物体类型中的每一种的绝对数量(1002)。测量独特的第一标记物的数量,连同所述独特的第一标记物中的每一种的量(1003)。如本文所述,独特的第一标记物是独特的微生物菌株的标记物。然后通过测量一种或多种独特的第二标记物的表达水平在蛋白质和/或RNA水平下评定活性(1004)。所述独特的第二标记物可与所述第一独特标记物相同或不同,并且是生物体菌株的活性的标记物。基于所述独特的第二标记物中的一种或多种的表达水平,确定哪些(如果有的话)微生物菌株是活性的(1005)。如果微生物菌株在特定水平或高于阈值水平(例如,高于阈值水平至少约10%、至少约20%、至少约30%或至少约40%)下表达第二独特标记物,则微生物菌株被认为是活性的(1005)(应理解,各种阈值可基于具体应用和/或具体实施确定,例如,阈值可根据样品来源(诸如特定物种)、样品源位置、感兴趣的元数据、环境等变化。一种或多种活性微生物菌株的绝对细胞计数可基于一种或多种活性微生物菌株的一种或多种第一标记物的量和一种或多种微生物菌株是其亚分类单元的生物体类型的绝对数量来确定。

  如在图2中所提供的,在本公开的另一方面,在多个样品中确定一种或多种活性微生物的绝对细胞计数,并且所述绝对细胞计数与元数据(环境参数)相关(2001-2008)。将多个样品经受一种或多种活性微生物菌株的绝对细胞计数的分析,其中如果所述多个样品中的至少一个中活性测量值处于阈值水平下或高于阈值水平,则所述一种或多种活性微生物菌株被认为是活性的(2001-2006)。然后将一种或多种活性微生物菌株的绝对细胞计数与具体实施和/或应用的元数据参数相关(2008)。

  在一个实施方案中,所述多个样品随时间从相同的环境来源(例如,随时间过程从相同的动物)采集。在另一个实施方案中,所述多个样品来自多种环境来源(例如,不同的动物)。在一个实施方案中,所述环境参数是第二活性微生物菌株的绝对细胞计数。在另一个实施方案中,一种或多种活性微生物菌株的绝对细胞计数值用于确定一种或多种活性微生物菌株与微生物群落的第二活性微生物菌株的共现。在另一个实施方案中,第二环境参数与一种或多种活性微生物菌株的绝对细胞计数和/或第二环境菌株的绝对细胞计数相关。

  这些方面的实施方案通篇进行讨论。

  用于与本文提供的方法一起使用的样品可以是包括微生物群落的任何类型。例如,用于与本文提供的方法一起使用的样品涵盖但不限于动物样品(例如,哺乳动物、爬行动物、雏鸡)、土壤、空气、水(例如,海水、淡水、废水污泥)、沉淀物、油、植物、农业产品、植物、土壤(例如,根际)以及极端环境样品(例如,酸性矿水排水、水热系统)。在海水或淡水样品的情况下,所述样品可来自水体表面或水体的任何深度,例如深海样品。在一个实施方案中,所述水样品是海洋、河流或湖泊样品。

  在一个实施方案中,所述动物样品是体液。在另一个实施方案中,所述动物样品是组织样品。非限制性动物样品包括牙齿、汗液、指甲、皮肤、毛发、粪便、尿液、精液、黏液、唾液、胃肠道)。所述动物样品可以是例如人类、灵长类动物、牛、猪、犬、猫、啮齿动物(例如,小鼠或大鼠)、或雏鸡样品。在一个实施方案中,所述雏鸡样品包括来自一种或多种鸡的样品。在另一个实施方案中,所述样品是人类样品。人类微生物组包括存在于皮肤的表面和深层上、乳腺、唾液、口腔粘膜、结膜以及胃肠道中的微生物的集合。存在于微生物组中的微生物包括细菌、真菌、原生动物、病毒以及古生菌。不同的身体部分表现出不同的微生物多样性。微生物的量和类型可发出个体的健康或疾病状态的信号。细菌分类单元的数量是数千个,并且病毒可以是同样丰富的。身体上的给定部位的细菌组成因人而异,不仅类型不同,丰度或量也不同。

  在另一个实施方案中,所述样品是瘤胃样品。反刍动物(诸如牛)依赖于各种不同的微生物群落来消化其饲料。这些动物已进化来通过具有改进的上消化道(网状瘤胃或瘤胃)使用具有不良营养价值的饲料,饲料保持在所述消化道中,同时它通过厌氧微生物的群落发酵。瘤胃微生物群落是非常致密的,约3×1010个微生物细胞/毫升。厌氧发酵微生物在瘤胃中占主导地位。瘤胃微生物群落包括全部三个生命域的成员:细菌、古生菌和真核生物。瘤胃发酵产物为其相应的宿主所需要以用于身体维持和生长以及乳液产生(van Houtert(1993).Anim.Feed Sci.Technol.43,第189-225页;Bauman等人(2011).Annu.Rev.Nutr.31,第299-319页;各自出于所有目的以引用的方式整体并入)。此外,已报道乳液产率和组成与瘤胃微生物群落相关联(Sandri等人(2014).Animal 8,第572-579页;Palmonari等人(2010).J.Dairy Sci.93,第279-287页;各自出于所有目的以引用的方式整体并入)。在一个实施方案中,瘤胃样品通过在以下中所描述的过程采集:Jewell等人(2015).Appl.Environ.Microbiol.81,第4697-4710页,其出于所有目的以引用的方式整体并入本文。

  在另一个实施方案中,所述样品是土壤样品(例如,非根际土壤或根际样品)。估计1克土壤含有上万个细菌分类单元,并且含有多至10亿个细菌细胞以及约200百万个真菌菌丝(Wagg等人(2010).Proc Natl.Acad.Sci.USA 111,第5266-5270页,其出于所有目的以引用的方式整体并入)。细菌、放线菌、真菌、藻类、原生动物以及病毒均存在于土壤中。土壤微生物群落多样性牵涉土壤微环境的结构和肥力、植物的营养物质获取、植物多样性和生长、以及地上和地下群落之间的资源循环。因此,评定土壤样品随时间的微生物含量和活性微生物的共现(以及活性微生物的数量)提供对于与环境元数据参数(诸如营养物质获取和/或植物多样性)相关联的微生物的了解。

  在一个实施方案中,所述土壤样品是根际样品,即,土壤的直接受根分泌物影响并且与土壤微生物相关联的窄区域。根际是致密填充区域,在其中观察到微生物活性提升并且植物根部通过营养物质和生长因子的交换与土壤微生物相互作用(San Miguel等人(2014).Appl.Microbiol.Biotechnol.DOI 10.1007/s00253-014-5545-6,其出于所有目的以引用的方式整体并入)。因为植物分泌许多化合物到根际中,所以分析根际中的生物体类型可用于确定在其中生长的植物的特征。

  在另一个实施方案中,所述样品是海水或淡水样品。海洋水含有多至一百万个微生物/毫升和数千种微生物类型。在具有更高生产率和更大量的有机物质和营养物质的近海水域中,这些数字可以是更高的量值数量级。海洋微生物对于以下是重要的:海洋生态系统的功能;维持所产生的与固定的二氧化碳之间的平衡;通过海洋光养微生物(诸如蓝细菌(Cyanobacteria))、硅藻和微微型和微型浮游生物)产生地球上的多于50%的氧气;提供新型生物活性化合物和代谢途径;通过占据海洋食物网中的关键底层营养级确保海洋产物的持续供应。存在于海洋环境中的生物体包括病毒、细菌、古生菌以及一些真核生物。海洋病毒可通过病毒裂解在控制海洋细菌的群体方面发挥显著作用。海洋细菌作为其他小微生物的食物来源以及有机物质的生产者是重要的。存在于海洋中的水柱中的古生菌是远洋古生菌,并且其丰度堪比海洋细菌的丰度。

  在另一个实施方案中,所述样品包括来自极端环境的样品,所述极端环境即具有对于地球上的大多数生命有害的条件的环境。在极端环境中旺盛生长的生物体被称为嗜极生物。虽然古生菌域含有嗜极生物的熟知实例,但是细菌域也可具有这些微生物的代表。嗜极生物包括:在3或低于3的pH水平下生长的嗜酸菌;在9或高于9的pH水平下生长的嗜碱菌;不需要氧气用于生长的厌氧菌,诸如Spinoloricus Cinzia;生长在岩石、裂缝、含水层以及在深层地表中的填充有地下水的断层内的微观空间中的隐藏岩内生物(cryptoendoliths);在约至少0.2M浓度的盐中生长的嗜盐菌;在诸如存在于水热系统中的高温度(约80-122℃)下旺盛生长的超嗜热菌;在冷沙漠中的岩石下生长的hypoliths;从还原的矿化合物(像黄铁矿)得到能量并且在地球化学循环中是活性的岩石自养生物,诸如欧洲亚硝化单胞菌(Nitrosomonas europaea);耐受高水平的溶解重金属(诸如铜、镉、砷和锌)的耐金属生物体;在营养受限的环境中生长的寡营养生物;在具有高糖浓度的环境中生长的嗜高渗菌;在诸如存在于海洋或地下深处的高压下旺盛生长的嗜压微生物(或嗜压菌);在约-15℃或更低的温度下存活、生长和/或生殖的嗜冷菌/嗜冷生物;对于高水平的电离辐射具有抗性的抗辐射生物体;在45-122℃之间的温度下旺盛生长的嗜热生物;可在极度干燥条件中生长的喜旱生物。聚嗜极生物是在多于一项类目下具有作为嗜极生物的资格的生物体并且包括嗜热嗜酸菌(70-80℃的优选温度和2与3之间的pH)。古生菌的泉古菌门组包括嗜热嗜酸菌。

  所述样品可包括来自一个或多个域的微生物。例如,在一个实施方案中,所述样品包括细菌和/或真菌的异质群体(在本文中还称为细菌或真菌菌株)。

  在本文提供的用于确定样品中的一种或多种微生物的存在和绝对细胞计数(例如,在从相同的或不同的环境和/或在多个时间点内采集的多个样品中的一种或多种微生物的绝对细胞计数)的方法中,所述一种或多种微生物可以是任何类型。例如,所述一种或多种微生物可来自细菌域、古生菌域、真核生物域或其组合。细菌和古生菌是原核的,其具有没有内部细胞器的非常简单的细胞结构。细菌可分类为革兰氏阳性/没有外膜、革兰氏阴性/存在外膜和未分组的门。古生菌组成单细胞微生物的域或界。虽然在视觉上与细菌相似,但是古生菌具有与真核生物的更紧密相关的基因和若干代谢途径,值得注意的是参与转录和翻译的酶。古生菌生物化学的其他方面是独特的,诸如在其细胞膜中存在醚脂质。古生菌分为四个识别的门:奇古菌门、曙古菌门、泉古菌门和初古菌门。

  原核生物域包括真核生物体,其由膜结合的细胞器(诸如细胞核)限定。原生动物是单细胞真核生物体。所有多细胞生物体均是真核生物,包括动物、植物和真菌。真核生物分类为四个界:原生生物界、植物界、真菌界和动物界。然而,存在若干种可替代的分类。另一种分类将真核生物分为六个界:古虫界(各种鞭毛虫原生动物);变形虫界(叶状变形虫和粘液丝状真菌);后鞭毛生物(动物、真菌、领鞭虫类);有孔虫界(有孔虫类、放射虫类和各种其他变形虫原生动物);囊泡藻界(原生藻菌(褐藻、硅藻)、定鞭藻、隐藻(或隐滴虫)、以及囊泡虫);原始色素体生物/Primoplantae(陆生植物、绿藻、红藻、以及灰藻)。

  在原核生物域内,真菌是在微生物群落中超优势的微生物。真菌包括微生物诸如酵母和丝状真菌以及熟悉的蘑菇。真菌细胞具有包含葡聚糖和甲壳质的细胞壁,这是这些生物体的独特特征。真菌形成单一组的相关生物体,称为共享共同原种的真菌门(Eumycota)。估计真菌界具有1.5百万至5百万种物种,这些中的约5%先前已被分类。大多数真菌的细胞生长为管状、伸长的和丝状的结构,称为菌丝,其可含有多个核。一些物种生长为通过发芽和二分裂生殖的单细胞酵母。真菌的主要门(有时称为部)主要基于其有性生殖结构的特征来分类。当前,提出七个门:微孢子虫门、壶菌门、芽枝霉门、新美鞭菌门、球囊菌门、子囊菌门、以及担子菌门。

  用于通过本文所述的方法检测和定量的微生物还可以是病毒。病毒是仅在其他生物体的活细胞内复制的小感染剂。病毒可感染真核生物域、细菌域和古生菌域中的所有类型的生命形式。病毒颗粒(已知为病毒体)由两个或三个部分组成:(i)可以是DNA或RNA的遗传物质;(ii)保护这些基因的蛋白外壳;以及在一些情况下(iii)当在细胞外时包围蛋白外壳的脂质包膜。针对病毒已建立七个目:有尾噬菌体目(Caudovirales)、疱疹病毒目(Herpesvirales)、线状病毒目(Ligamenvirales)、单股负链病毒目(Mononegavirales)、尼多病毒目(Nidovirales)、小核糖核酸目(Picornavirales)、以及芜菁黄花叶病毒目(Tymovirales)。病毒基因组可以是单链(ss)或双链(ds)RNA或DNA,并且可使用或可不使用逆转录酶(RT)。另外,ssRNA病毒可以是有义的(+)或反义的(-)。此分类将病毒分到七个组中:I:dsDNA病毒(诸如腺病毒、疱疹病毒、痘病毒);II:(+)ssDNA病毒(诸如细小病毒);III:dsRNA病毒(诸如呼肠孤病毒);IV:(+)ssRNA病毒(诸如小核糖核酸病毒、披膜病毒);V:(-)ssRNA病毒(诸如正粘病毒、弹状病毒);VI:在生命周期中具有DNA中间体的(+)ssRNA-RT病毒(诸如逆转录病毒);VII:dsDNA-RT病毒(诸如嗜肝DNA病毒)。

  用于通过本文所述的方法检测和定量的微生物还可以是类病毒。类病毒是已知的最小感染病原体,其仅由短链的环状单链RNA组成而没有蛋白外壳。它们大多数是植物病原体,其中一些具有经济学重要性。类病毒基因组大小极其小,范围是约246个至约467个核碱基。

  根据本文提供的方法,对样品进行处理以检测样品中的一种或多种微生物类型的存在(图1B,1001;图2,2001)。确定样品中的一种或多种微生物生物体类型的绝对数量(图1B,1002;图2,2002)。可并行地或顺序地进行一种或多种生物体类型的存在和至少一种生物体类型的绝对数量的确定。例如,在包括具有细菌(即,一种微生物类型)和真菌(即,第二微生物类型)的微生物群落的样品的情况下,在一个实施方案中,用户检测样品中的生物体类型的一种或两种的存在(图1B,1001;图2,2001)。在另一个实施方案中,用户确定样品中的至少一种生物体类型的绝对数量-在此实施例的情况下,确定样品中的细菌、真菌或其组合的数量(图1B,1002;图2,2002)。

  在一个实施方案中,将样品或其部分经受流式细胞术(FC)分析以检测一种或多种微生物类型的存在和/或数量(图1B,1001,1002;图2,2001,2002)。在一个流式细胞仪实施方案中,个体微生物细胞在至少约300*s-1、或至少约500*s-1、或至少约1000*s-1的速率下穿过照明区域。然而,本领域的普通技术人员将认识到,此速率可根据所采用的仪器的类型而变化。电选通的检测器测量表示散射光的程度的脉冲幅度。这些脉冲的幅度在电子上分选为“仓”或“信道”,从而允许显示具有某些定量特性(例如,细胞染色特性、直径、细胞膜)的细胞的数量相对于信道数量的柱状图。此类分析允许确定每个“仓”中的细胞的数量,在本文所述的实施方案中,所述仓是“微生物类型”仓,例如细菌、真菌、线虫、原生动物、古生菌、藻类、甲藻、病毒、类病毒等。

  在一个实施方案中,使用一种或多种荧光染料对样品进行染色(其中荧光染料对于特定微生物类型是特异性的),以实现通过流式细胞仪进行的检测或利用荧光的一些其他检测和定量方法,诸如荧光显微镜检查术。所述方法可提供对样品中的给定生物体类型的细胞数量和/或细胞体积的定量。在另一个实施方案中,如本文所述,利用流式细胞术来确定生物体类型的独特的第一标记物和/或独特的第二标记物的存在和量(诸如酶表达、细胞表面蛋白表达等)。还可生成例如光散射相对于来自细胞膜染色的荧光(相对于来自蛋白质染色或DNA染色的荧光)的二或三变量柱状图或等高线图,并且因此可获得群体中的细胞间感兴趣的各种特性的整体分布效果。此类多参数流式细胞计数数据的多种显示经常被使用并且适于与本文所述的方法一起使用。

  在处理样品以检测一种或多种微生物类型的存在和数量的一个实施方案中,采用显微镜检查术测定(图1B,1001,1002)。在一个实施方案中,显微镜检查术是光学显微镜检查术,其中使用可见光和透镜系统来放大小样品的图像。可通过电荷耦合装置(CCD)照相机捕捉数字图像。其他显微镜检查技术包括但不限于扫描电子显微镜检查术和透射电子显微镜检查术。根据本文提供的方面对微生物类型进行可视化和定量。

  在本公开的另一个实施方案中,为了检测一种或多种微生物类型的存在和数量,将每个样品或其部分经受荧光显微镜检查术。可使用不同的荧光染料直接对细胞进行染色并且使用以上所述的落射荧光显微镜以及流式细胞术定量总细胞计数。定量微生物的可用的染料包括但不限于吖啶橙(AO)、4,6-二-氨基-2-苯基吲哚(DAPI)和5-氰基-2,3二甲苯四唑氯化物(CTC)。可通过成活力染色方法估计可成活细胞,所述成活力染色方法诸如活/细菌成活力试剂盒(Bac-LightTM),其含有两种核酸染色剂:绿色荧光SYTO 9TM染料穿透所有的膜并且红色荧光碘化丙啶(PI)染料穿透具有受损膜的细胞。因此,具有受损害的膜的细胞将染成红色,而具有未受损膜的细胞将染成绿色。荧光原位杂交(FISH)对落射荧光显微镜检查术进行延伸,从而允许快速检测和列举特定生物体。FISH使用特异性地结合到样品中的生物体DNA的荧光标记的寡核苷酸探针(通常15-25个碱基对),从而允许使用落射荧光或共焦激光扫描显微镜(CLSM)对细胞进行可视化。催化报告子沉积荧光原位杂交(CARD-FISH)通过使用辣根过氧化物酶(HRP)标记的寡核苷酸探针使从所研究的微生物获得的信号强度扩增来在FISH方法上进行改善。FISH可与其他技术组合以表征微生物群落。一种组合技术是高亲和力肽核酸(PNA)-FISH,其中探针穿透细胞外高聚物(EPS)基质的能力增强。另一个实例是活/死-FISH,其将细胞成活力试剂盒与FISH组合并且已用于评定饮用水分布系统中的消毒效率。

  在另一个实施方案中,将每个样品或其部分经受拉曼显微光谱法以便确定微生物类型的存在和至少一种微生物类型的绝对数量(图1B,1001-1002;图2,2001-2002)。拉曼显微光谱法是能够检测并测量单细胞拉曼光谱(SCRS)的非破坏性且不使用标记的技术。典型的SCRS提供单细胞的内在生物化学“指纹”。SCRS内包含丰富的生物分子信息,包括核酸、蛋白质、碳水化合物和脂质,其能够表征不同细胞物种、生理变化和细胞表型。拉曼显微镜检查术通过不同细胞生物标记物的化学键检查激光的散射。SCRS是一个单细胞中所有生物分子的光谱的总和,从而指示细胞的表型图谱。由于基因表达,细胞表型通常反映基因型。因此,在相同的生长条件下,不同的微生物类型给出对应于其基因型差异的有差别的SCRS并且可因此通过其拉曼光谱来识别。

  在又一个实施方案中,将样品或其部分经受离心以便确定微生物类型的存在和至少一种微生物类型的数量(图1B,1001-1002;图2,2001-2002)。此过程通过使用由离心机产生的离心力使异质混合物沉淀。混合物中较致密的组分远离离心机的轴心迁移,而混合物的不太致密的组分朝向轴心迁移。离心可允许将样品分级为细胞质部分、膜部分和细胞外部分。它还可用于确定感兴趣的生物分子的定位信息。另外,离心可用于对总微生物群落DNA进行分级。不同的原核生物组在DNA的鸟嘌呤-加-胞嘧啶(G+C)含量方面不同,所以基于G+C含量的密度梯度离心是区分生物体类型和与每种类型相关联的细胞的数量的方法。所述技术生成整个群落DNA的分级图谱并且指示作为G+C含量的函数的DNA丰度。总群落DNA物理地分成高度纯化的部分,各自表示可通过额外的分子技术(诸如变性梯度凝胶电泳(DGGE)/扩增核糖体DNA限制分析(ARDRA)(参见本文的讨论))分析的不同G+C含量以评定总微生物群落多样性和一种或多种微生物类型的存在/量。

  在另一个实施方案中,将样品或其部分经受染色以便确定微生物类型的存在和至少一种微生物类型的数量(图1B,1001-1002;图2,2001-2002)。染色剂和染料可用于对生物组织、细胞或细胞内的细胞器进行可视化。染色可与显微镜检查法、流式细胞术或凝胶电泳结合使用以对对于不同的微生物类型独特的细胞或生物分子进行可视化或标记。体内染色是使活组织染色的过程,而体外染色涉及使从其生物环境去除的细胞或结构染色。用于与本文所述的方法一起使用的特定染色技术的实例包括但不限于:确定细菌的革兰氏状态的革兰氏染色、识别内生孢子的存在的内生孢子染色、齐-尼二氏染色(Ziehl-Neelsen staining)、苏木精和伊红染色以检查组织的薄切片、检查来自各种体内分泌物的细胞样品的巴氏染色(papanicolaou staining)、碳水化合物的希氏高碘酸染色(acid-Schiff staining)、采用三色染色方案使细胞与周围的结缔组织区分开的马森藻丝(Masson’s trichome)、检查血液或骨髓样品的罗曼诺夫斯基染色剂(Romanowsky stains)(或包括赖特氏染色剂(Wright's stain)、詹纳尔血液染色剂(Jenner's stain)、梅-格二氏染色剂(May-Grunwald stain)、李斯曼氏染色剂(Leishman stain)以及吉姆沙染色剂(Giemsa stain)的常见变体)、展示蛋白质和DNA的银染色、脂质的苏丹染色以及检测真正的内生孢子的康克林染色(Conklin’s staining)。常见的生物染色剂包括用于细胞周期确定的吖啶橙;用于酸性粘蛋白的俾斯麦棕;用于糖原的胭脂红;用于核的胭脂红明矾;用于蛋白质的考马斯蓝;用于神经元细胞质的酸性组分的甲酚紫;用于细胞壁的结晶紫;用于核的DAPI;用于细胞质物质、细胞膜、一些细胞外结构以及红细胞的曙红;用于DNA的溴化乙锭;用于胶原、平滑肌或线粒体的酸性品红;用于核的苏木精;用于DNA的Hoechst染色剂;用于淀粉的碘;用于Gimenez染色技术中的细菌和用于孢子的孔雀绿;用于染色质的甲基绿;用于动物细胞的亚甲蓝;用于尼氏物质(Nissl substance)的中性红;用于核的尼罗蓝(Nile blue);用于亲脂性实体的尼罗红(Nile red);用于脂质的四氧化锇;用于荧光显微镜检查术中的若丹明;用于核的番红。染色剂也用于透射电子显微镜检查术以增强对比,并且包括磷钨酸、四氧化锇、四氧化钌、钼酸氨、碘化镉、碳酰肼、氯化铁、六胺、三氯化铟、硝酸镧、醋酸铅、柠檬酸铅、硝酸铅(II)、高碘酸、磷钼酸、铁氰化钾、亚铁氰化钾、钌红、硝酸银、蛋白银、氯金酸钠、硝酸铊、氨基硫脲、醋酸铀酰、硝酸铀酰、以及硫酸氧钒。

  在另一个实施方案中,将样品或其部分经受质谱法(MS)以便确定微生物类型的存在和至少一种微生物类型的数量(图1B,1001-1002;图2,2001-2002)。如下所讨论的MS还可用于检测样品中的一种或多种独特的标记物的存在和表达(图1B,1003-1004;图2,2003-2004)。MS用于例如检测对于微生物类型独特的蛋白质和/或肽标记物的存在和量并且因此提供对样品中的相应的微生物类型的数量的评定。定量可使用稳定同位素标记或不使用标记。肽的从头测序也可直接从MS/MS光谱或序列标记(产生可针对碱基匹配的短标签)发生。MS还可展示蛋白质的翻译后修饰并且识别代谢物。MS可与色谱分离和其他分离技术(诸如气相色谱法、液相色谱法、毛细管电泳、离子迁移)结合使用以增强质量分辨率和确定。

  在另一个实施方案中,将样品或其部分经受脂质分析以便确定微生物类型的存在和至少一种微生物类型的数量(图1B,1001-1002;图2,2001-2002)。脂肪酸存在于相对恒定比例的细胞生物质中,并且特征脂肪酸存在于可区分群落内的微生物类型的微生物细胞中。在一个实施方案中,脂肪酸可通过皂化接着衍生化来提取以得到相应的脂肪酸甲酯(FAME),所述脂肪酸甲酯然后通过气相色谱法进行分析。在一个实施方案中,FAME图谱然后与参考FAME数据库进行比较以通过多元统计分析识别脂肪酸及其对应的微生物特征。

  在本文提供的方法的各方面,测量样品或其部分(例如,样品等分试样)中的独特的第一标记物的数量以及独特的第一标记物中的每一种的量(图1B,1003;图2,2003)。独特的标记物是微生物菌株的标记物。本领域的普通技术人员应理解,根据所探测和测量的独特标记物,不需要分析整个样品。例如,如果独特的标记物对于细菌菌株是独特的,则不需要分析样品的真菌部分。如上所述,在一些实施方案中,测量样品中的一种或多种生物体类型的绝对细胞计数包括通过例如流式细胞术根据生物体类型将样品分开。

  在本文中可采用对于生物体菌株是独特的任何标记物。例如,标记物可包括但不限于小亚基核糖体RNA基因(16S/18S rDNA)、大亚基核糖体RNA基因(23S/25S/28S rDNA)、插入5.8S基因、细胞色素c氧化酶、β-微管蛋白、延长因子、RNA聚合酶以及内部转录间隔区(ITS)。

  核糖体RNA基因(rDNA),尤其是小亚基核糖体RNA基因(即,在真核生物的情况下的18S rRNA基因(18S rDNA)和在原核生物的情况下的16S rRNA(16S rDNA))是用于评定微生物群落中的生物体类型和菌株的超优势靶标。然而,也靶向大亚基核糖体RNA基因28SrDNA。rDNA适于分类识别,因为:(i)它们在所有已知的生物体中是普遍存在的;(ii)它们具有保守域和可变域两者;(iii)存在可用于进行比较的其序列的指数级扩展的数据库。在样品的群落分析中,保守域充当用于对应的通用PCR和/或测序引物的退火位点,而可变区可用于系统发育分化。另外,细胞中的rDNA的高拷贝数量有利于从环境样品进行的检测。

  也靶向位于18S rDNA与28S rDNA之间的内部转录间隔区(ITS)。ITS被转录并且被拼接,之后装配核糖体。ITS区由两个高度可变的间隔区ITS1和ITS2以及插入5.8S基因构成。此rDNA操纵子发生在基因组的多个拷贝中。因为ITS区不编码核糖体组分,所以它是高度可变的。

  在一个实施方案中,独特的RNA标记物可以是mRNA标记物、siRNA标记物或核糖体RNA标记物。

  蛋白质编码功能基因也可在本文中用作独特的第一标记物。此类标记物包括但不限于:重组酶A基因家族(细菌RecA、古生菌RadA和RadB、真核生物Rad51和Rad57、噬菌体UvsX);RNA聚合酶β亚基(RpoB)基因,其负责转录起始和延长;陪伴蛋白。还针对细菌加古生菌识别候选标记物基因:核糖体蛋白S2(rpsB)、核糖体蛋白S10(rpsJ)、核糖体蛋白L1(rplA)、翻译延长因子EF-2、翻译起始因子IF-2、金属内肽酶、核糖体蛋白L22、ffh信号识别颗粒蛋白、核糖体蛋白L4/L1e(rplD)、核糖体蛋白L2(rplB)、核糖体蛋白S9(rpsI)、核糖体蛋白L3(rplC)、苯丙氨酰-tRNA合成酶β-亚基、核糖体蛋白L14b/L23e(rplN)、核糖体蛋白S5、核糖体蛋白S19(rpsS)、核糖体蛋白S7、核糖体蛋白L16/L10E(rplP)、核糖体蛋白S13(rpsM)、苯丙氨酰-tRNA合成酶α亚基、核糖体蛋白L15、核糖体蛋白L25/L23、核糖体蛋白L6(rplF)、核糖体蛋白L11(rplK)、核糖体蛋白L5(rplE)、核糖体蛋白S12/S23、核糖体蛋白L29、核糖体蛋白S3(rpsC)、核糖体蛋白S11(rpsK)、核糖体蛋白L10、核糖体蛋白S8、tRNA假尿苷合成酶B、核糖体蛋白L18P/L5E、核糖体蛋白S15P/S13e、胆色素原脱氨酶、核糖体蛋白S17、核糖体蛋白L13(rplM)、磷酸核糖甲酰甘氨脒环连接酶(rpsE)、核糖核酸酶HII以及核糖体蛋白L24。细菌的其他候选标记物基因包括:转录延长蛋白NusA(nusA)、rpoB DNA指导的RNA聚合酶亚基β(rpoB)、GTP结合蛋白EngA、rpoC DNA指导的RNA聚合酶亚基β’、priA引发体装配蛋白、转录修复偶合因子、CTP合成酶(pyrG)、secY前蛋白转位酶亚基SecY、GTP结合蛋白Obg/CgtA、DNA聚合酶I、rpsF 30S核糖体蛋白S6、poA DNA指导的RNA聚合酶亚基α、肽链释放因子1、rplI 50S核糖体蛋白L9、多核糖核苷酸核苷酸转移酶、tsf延长因子Ts(tsf)、rplQ 50S核糖体蛋白L17、tRNA(鸟嘌呤-N(1)-)-甲基转移酶(rplS)、rplY可能的50S核糖体蛋白L25、DNA修复蛋白RadA、葡萄糖抑制分裂蛋白A、核糖体结合因子A、DNA错配修复蛋白MutL、smpB SsrA结合蛋白(smpB)、N-乙酰葡糖胺基转移酶、S-腺苷-甲基转移酶MraW、UDP-N-乙酰胞壁酰丙氨酸--D-谷氨酸连接酶、rplS 50S核糖体蛋白L19、rplT 50S核糖体蛋白L20(rplT)、ruvA霍利迪连结体DNA解旋酶、ruvB霍利迪连结体DNA解旋酶B、serS丝氨酰-tRNA合成酶、rplU 50S核糖体蛋白L21、rpsR30S核糖体蛋白S18、DNA错配修复蛋白MutS、rpsT 30S核糖体蛋白S20、DNA修复蛋白RecN、frr核糖体循环因子(frr)、重组蛋白RecR、未知功能的蛋白UPF0054、miaA tRNA异戊烯基转移酶、GTP结合蛋白YchF、染色体复制抑制子蛋白DnaA、脱磷酸-CoA激酶、16SrRNA加工蛋白RimM、ATP锥结构域蛋白、1-脱氧-D-木酮糖5-磷酸还原异构酶、2C-甲基-D-赤藓糖醇2,4-环二磷酸合成酶、脂肪酸/磷脂合成蛋白PlsX、tRNA(Ile)-赖氨酸合成酶、dnaG DNA引物酶(dnaG)、ruvC霍利迪连结体解离酶、rpsP 30S核糖体蛋白S16、重组酶A recA、核黄素生物合成蛋白RibF、甘氨酰-tRNA合成酶β亚基、trmU tRNA(5-甲基氨基甲基-2-硫尿苷酸)-甲基转移酶、rpmI 50S核糖体蛋白L35、hemE尿卟啉原脱羧酶、棒状决定蛋白、rpmA 50S核糖体蛋白L27(rpmA)、肽基-tRNA水解酶、翻译抑制因子IF-3(infC)、UDP-N-乙酰胞壁酰-三肽合成酶、rpmF 50S核糖体蛋白L32、rpIL 50S核糖体蛋白L7/L12(rpIL)、leuS亮氨酰-tRNA合成酶、ligA NAD依赖性DNA连接酶、细胞分裂蛋白FtsA、GTP结合蛋白TypA、ATP依赖性Clp蛋白酶、ATP结合亚基ClpX、DNA复制和修复蛋白RecF以及UDP-N-乙酰基烯醇丙酮酰基葡糖胺还原酶。

  根据本文所述的方法,磷脂脂肪酸(PLFA)也可用作独特的第一标记物。因为PLFA在微生物生长期间快速合成、不存在于存储分子中并且在细胞死亡期间快速降解,所以它提供当前活群落的准确种群调查。所有细胞均含有可提取并且酯化以形成脂肪酸甲酯(FAME)的脂肪酸(FA)。当FAME使用气相色谱法-质谱法分析时,所得的图谱组成样品中的微生物的“指纹”。细菌域和真核生物域中的生物体的膜的化学组成由通过酯类型键连接到丙三醇的脂肪酸(磷脂脂肪酸(PLFA))构成。相比之下,古生菌的膜脂由通过酯类型键接合到丙三醇的长的和支链的烃类(磷脂醚脂质(PLEL))构成。这是使三个域区分开的最常使用的非遗传准则中的一种。在此上下文中,特征在于不同的酰基链的来源于微生物细胞膜的磷脂是优异的特征分子,因为此脂质结构多样性可与特定的微生物分类单元关联。

  如本文提供的,为了确定生物体菌株是否是活性的,测量一种或多种独特的第二标记物的表达水平,所述一种或多种独特的第二标记物可与第一标记物相同或不同(图1B,1004;图2,2004)。独特的第一标记物在以上进行描述。独特的第二标记物是微生物活性的标记物。例如,在一个实施方案中,以上所述的第一标记物中的任一种的mRNA或蛋白表达被认为是用于本公开的目的的独特的第二标记物。

  在一个实施方案中,如果第二标记物的表达水平高于阈值水平(例如,对照水平)或处于阈值水平下,则微生物被认为是活性的(图1B,1005;图2,2005)。在一个实施方案中,如果第二标记物的表达水平与阈值水平(其在一些实施方案中是对照水平)相比改变至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、或至少约30%,则确定活性。

  在一个实施方案中,在蛋白质、RNA或代谢物水平下测量第二独特标记物。独特的第二标记物与第一独特标记物相同或不同。

  如以上所提供的,独特的第一标记物和独特的第二标记物的数量可根据本文所述的方法检测。此外,根据本领域的普通技术人员已知的方法实行独特的第一标记物的检测和定量(图1B,1003-1004,图2,2003-2004)。

  在一个实施方案中,使用核酸测序(例如,gDNA、cDNA、rRNA、mRNA)确定独特的第一标记物和/或独特的第二标记物的绝对细胞计数。测序平台包括但不限于可从Roche/454Life Sciences、Illumina/Solexa、Pacific Biosciences、Ion Torrent以及Nanopore获得的Sanger测序和高通量测序方法。测序可以是特定DNA或RNA序列的扩增子测序或整个元基因组/转录组鸟枪测序。

  传统的Sanger测序(Sanger等人(1977)DNA sequencing with chain-terminating inhibitors.Proc Natl.Acad.Sci.USA,74,第5463-5467页,其以引用的方式整体并入本文)依赖于在体内DNA复制期间通过DNA聚合酶选择性并入链终止双脱氧核苷酸并且适于与本文所述的方法一起使用。

  在另一个实施方案中,将样品或其部分经受核酸的提取、使用合适的引物的感兴趣的DNA(诸如rRNA基因)的扩增以及使用测序载体的克隆文库的构建。然后通过Sanger测序对所选择的克隆进行测序并且检索感兴趣的DNA的核苷酸序列,从而允许计算样品中的独特的微生物菌株的数量。

  来自Roche/454Life Sciences的454焦磷酸测序得出长读取并且可用于本文所述的方法中(Margulies等人(2005)Nature,437,第376-380页;美国专利号6,274,320;6,258,568;6,210,891,其中的每个出于所有目的整体并入本文)。待测序的核酸(例如,扩增子或雾化的基因组/元基因组DNA)具有通过PCR或通过连接作用附连在任一端部上的特异性适配子。具有适配子的DNA固定到悬浮在油包水乳液中的小珠(理想地,具有一个DNA片段的一个珠)。然后实施乳液PCR步骤以制备每个DNA片段的多个拷贝,从而引起一系列珠,其中每个珠含有相同DNA片段的许多克隆拷贝。然后将每个珠放到也含有合成法测序反应所必需的酶的光纤芯片的孔中。添加碱基(诸如A、C、G、或T)触发焦磷酸释放,其产生被记录来推断每个孔中的DNA片段的序列的闪光。可实现约1百万个读取/每个运行,读取的长度多至1,000个碱基。可进行配对端部测序,其产生读取对,所述读取对中的每个在给定DNA片段的一个端部处开始。可创建分子条码并且在多重反应中放置在适配子序列与感兴趣的序列之间,从而允许每个序列通过生物信息学方法分配到样品。

  Illumina/Solexa测序产生约25个碱基对(bp)至约300个bp的平均读取长度(Bennett等人(2005)Pharmacogenomics,6:373-382;Lange等人(2014).BMC Genomics 15,第63页;Fadrosh等人(2014)Microbiome 2,第6页;Caporaso等人(2012)ISME J,6,第1621–1624页;Bentley等人(2008)Accurate whole human genome sequencing using reversible terminator chemistry.Nature,456:53–59)。此测序技术也是合成法测序,但是采用可逆染料终止子和附接有寡聚物场的流动池。待测序的DNA片段在任一端部上具有特异性适配子并且在填充有杂交到所述片段的端部的特异性寡核苷酸的流动池上冲洗。然后复制每个片段以制备相同片段的聚类。然后在流动池上冲洗可逆染料终止子核苷酸并且给予时间来附接。冲洗掉多于的核苷酸,对流动池进行成像,并且可去除可逆终止子使得可重复所述过程并且核苷酸可继续添加在随后的循环中。可实现每个长度是300个碱基的配对端部读取。Illumina平台可在单个运行中产生呈配对端部方式的40亿个片段,每个读取具有125个碱基。条码还可用于样品复用,但是使用索引引物(indexing primer)。

  SOLiD(通过寡核苷酸连接作用进行的测序和检测,Life Technologies)过程是“连接法测序”途径,并且可与本文所述的方法一起使用以用于检测第一标记物和/或第二标记物的存在和量(图1B,1003-1004;图2,2003-2004)(Peckham等人SOLiDTMSequencing and2-Base Encoding.San Diego,CA:American Society of Human Genetics,2007;Mitra等人(2013)Analysis of the intestinal microbiota using SOLiD 16S rRNA gene sequencing and SOLiD shotgun sequencing.BMC Genomics,14(增刊5):S16;Mardis(2008)Next-generation DNA sequencing methods.Annu Rev Genomics Hum Genet,9:387–402;各自以引用的方式整体并入本文)。DNA片段的文库从待测序的样品制备,并且用于制备克隆珠群体,其中仅一个物种的片段存在于每个磁珠的表面上。附接到磁珠的片段具有通用的P1适配子序列,使得每个片段的开始序列是已知的且相同的。引物杂交到在文库模板内的P1适配子序列。一组四个荧光标记的二碱基探针竞争连接到测序引物。二碱基探针的特异性通过询问每个连接反应中的每个第1碱基和第2碱基来实现。实施连接作用、检测和裂解的多个循环,其中循环的数量决定最终的读取长度。SOLiD平台每个运行可产生多至30亿个读取,其中读取是75个碱基长。配对端部测序是可获得的并且可在本文中使用,但是配对中的第二读取仅35个碱基长。样品的复用通过与Illumina所使用的系统同类的系统是可能的,具有独立的索引运行。

  Ion Torrent系统与454测序一样适于与本文所述的方法一起使用以用于检测第一标记物和/或第二标记物的存在和量(图1B,1003-1004;图2,2003-2004)。它使用含有DNA片段所附接的珠的微孔板。然而,它在检测碱基并入的方式方面不同于所有其他系统。当碱基添加到生长DNA链时,质子被释放,其轻微改变周围的pH。对于pH敏感的微量检测器与板上的孔相关联,并且当这些变化发生时,所述检测器进行记录。通过所述孔依序冲洗不同的碱基(A、C、G、T),从而允许推断来自每个孔的序列。Ion Proton平台每个运行可产生多至50百万个读取,其具有200个碱基的读取长度。Personal Genome Machine平台具有在400个碱基下的更长读取。双向测序是可获得的。复用通过标准内联分子条码测序是可能的。

  Pacific Biosciences(PacBio)SMRT测序使用单分子实时测序途径,并且在一个实施方案中与本文所述的方法一起使用以用于检测第一标记物和/或第二标记物的存在和量(图1B,1003-1004;图2,2003-2004)。PacBio测序系统不涉及扩增步骤,从而使它有别于其他主要下一代测序系统。在一个实施方案中,在含有许多零模式波导(ZMW)检测器的芯片上实施测序。DNA聚合酶附接到ZMW检测器并且当合成DNA链时,对磷酸连接的染料标记的核苷酸并入进行实时成像。PacBio系统每个运行得出非常长的读取长度(平均约4,600个碱基)和非常大量的读取(约47,000个)。典型的“配对端部”途径不与PacBio一起使用,因为读取通常足够长以致于可通过CCS来覆盖片段多次而无需独立地从每个端部进行测序。使用PacBio的复用不涉及独立读取,而是实际上遵循标准“内联”条形编码模型。

  在一个实施方案中,其中第一独特标记物是ITS基因组区域,在一个实施方案中使用自动核糖体基因间间隔区分析(ARISA)来确定样品中的微生物菌株的数量和统一性(图1B,1003,图2,2003)(Ranjard等人(2003).Environmental Microbiology 5,第1111-1120页,其出于所有目的以引用的方式整体并入)。ITS区在长度和核苷酸序列方面具有显著异质性。使用荧光标记的正向引物和自动DNA测序仪允许高分辨率的分离和高通量。在每个样品中包括内部标准提供确定一般片段大小的准确性。

  在另一个实施方案中,使用PCR扩增的rDNA片段的片段长度多态性(RFLP)(另外地已知为扩增核糖体DNA限制分析(ARDRA))来表征样品中的独特的第一标记物及其量(图1B,1003,图2,2003)(对于额外的细节,参见Massol-Deya等人(1995).Mol.Microb.Ecol.Ma nual.3.3.2,第1-18页,其全部内容出于所有目的以引用的方式并入本文)。使用一般引物通过PCR生成rDNA片段,使用限制酶消化,在琼脂糖或丙烯酰胺凝胶中进行电泳,并且使用溴化乙锭或硝酸银进行染色。

  用于检测独特的第一标记物的存在和丰度的一种指纹处理技术是单链构象多态性(SSCP)(参见Lee等人(1996).Appl Environ Microbiol 62,第3112-3120页;Scheinert等人(1996).J.Microbiol.Methods 26,第103-117页;Schwieger和Tebbe(1998).Appl.Environ.Microbiol.64,第4870-4876页,其中的每个以引用的方式整体并入本文)。在此技术中,对使用对于16S rRNA基因特异性的引物获得的DNA片段(诸如PCR产物)进行变性并且直接在非变性凝胶上进行电泳。分离基于影响电泳迁移的单链DNA的大小和折叠构象的差异来进行。可通过多种策略防止电泳期间DNA链的退火,包括在PCR中使用一种磷酸化引物接着使用λ外切核酸酶对磷酸化链进行特异性消化和使用一种生物素酰化引物来实施对变性后的一个单链的磁分离。在一个实施方案中,为了评定给定微生物群落中的超优势群体的统一性,切除带并且进行测序,或者可将SSCP模式与特异性探针杂交。电泳条件(诸如凝胶基质、温度和向凝胶添加丙三醇)可影响分离。

  除基于测序的方法之外,用于定量第二标记物的表达(例如,基因、蛋白质表达)的其他方法适于与本文提供的方法一起使用以用于确定一种或多种第二标记物的表达水平(图1B,1004;图2,2004)。例如,定量RT-PCR、微阵列分析、线性扩增技术(诸如基于核酸序列的扩增(NASBA))均适于与本文所述的方法一起使用,并且可根据本领域的普通技术人员已知的方法实行。

  在另一个实施方案中,将样品或其部分经受定量聚合酶链反应(PCR)以用于检测第一标记物和/或第二标记物的存在和量(图1B,1003-1004;图2,2003-2004)。特定微生物菌株活性通过将转录的核糖体和/或信使RNA(rRNA和mRNA)逆转录成互补DNA(cDNA)、接着进行PCR(RT-PCR)来测量。

  在另一个实施方案中,将样品或其部分经受基于PCR的指纹处理技术以检测第一标记物和/或第二标记物的存在和量(图1B,1003-1004;图2,2003-2004)。PCR产物可基于核苷酸组成通过电泳分离。不同DNA分子间的序列变异影响熔化行为,并且因此具有不同序列的分子在凝胶中的不同位置处停止迁移。因此可通过不同带或峰的位置和相对强度来定义电泳图谱,并且可翻译成用于计算多样性指数的数字数据。还可从凝胶切除带并且随后进行测序以展示群落成员的系统发育联系。电泳法可包括但不限于:变性梯度凝胶电泳(DGGE)、温度梯度凝胶电泳(TGGE)、单链构象多态性(SSCP)、限制片段长度多态性分析(RFLP)或扩增核糖体DNA限制分析(ARDRA)、末端限制片段长度多态性分析(T-RFLP)、自动核糖体基因间间隔区分析(ARISA)、随机扩增多态性DNA(RAPD)、DNA扩增指纹处理(DAF)以及Bb-PEG电泳。

  在另一个实施方案中,将样品或其部分经受基于芯片的平台(诸如微阵列或微流体)以确定独特的第一标记物的量和/或独特的第二标记物的存在/量(图1B,1003-1004,图2,2003-2004)。PCR产物从样品中的总DNA扩增并且直接杂交到附连到微阵列的已知分子探针。在荧光标记的PCR扩增子杂交到探针之后,通过使用共焦激光扫描显微镜法对正信号进行评分。微阵列技术允许使用复制快速评估样品,这是微生物群落分析的显著优点。微阵列上的杂交信号强度可与靶标生物体的量成正比。通用高密度16S微阵列(例如,PHYLOCHIP)含有16SrRNA基因的靶向若干培养的微生物物种和“候选分裂”的约30,000个探针。这些探针靶向全部121个分界的原核生物目并且允许同时检测8,741个细菌和古生菌分类单元。用于对微生物群落进行作图的另一种微阵列是功能基因阵列(FGA)。与PHYLOCHP不同,FGA主要被设计来检测细菌的特定代谢组。因此,FGA不仅展示群落结构,它们还阐明原位群落代谢潜力。FGA含有来自具有已知生物功能的基因的探针,所以它们可用于将微生物群落组成与生态系统功能联系起来。称为FGA的GEOCHIP含有来自参与各种生物地球化学、生态学和环境过程(诸如氨氧化、甲烷氧化和固氮)的全部已知的代谢基因的>24,000个探针。

  在一个实施方案中,蛋白表达测定与本文所述的方法一起使用以用于确定一种或多种第二标记物的表达水平(图1B,1004;图2,2004)。例如,在一个实施方案中,利用质谱法或免疫测定(诸如酶联免疫吸附测定(ELISA))定量一种或多种独特的第二标记物的表达水平,其中所述一种或多种独特的第二标记物是蛋白质。

  在一个实施方案中,将样品或其部分经受溴脱氧尿苷(BrdU)并入以确定第二独特标记物的水平(图1B,1004;图2,2004)。BrdU(胸腺嘧啶核苷的合成核苷类似物)可并入到复制细胞的新合成的DNA中。然后可使用对于BRdU特异性的抗体以用于检测碱基类似物。因此BrdU并入识别主动复制其DNA的细胞,根据本文所述的方法的一个实施方案测量微生物的活性。BrdU并入可与FISH组合使用以提供靶向细胞的统一性和活性。

  在一个实施方案中,将样品或其部分经受与FISH组合的显微放射自显影术(MAR)以确定第二独特标记物的水平(图1B,1004;图2,2004)。MAR-FISH基于将放射活性底物并入到细胞中、使用放射自显影术检测活性细胞以及使用FISH识别细胞。使用显微镜实施在单细胞分辨率下检测并识别活性细胞。MAR-FISH提供关于总细胞、靶向细胞的探针和并入给定的放射标记的物质的细胞的百分比的信息。所述方法提供对靶向微生物的原位功能的评定并且是研究微生物的体内生理学的有效途径。发展用于与MAR-FISH组合定量细胞特异性底物摄入的技术已知为定量MAR(QMAR)。

  在一个实施方案中,将样品或其部分经受与FISH组合的稳定同位素拉曼光谱法(Raman-FISH)以确定第二独特标记物的水平(图1B,1004;图2,2004)。此技术将稳定同位素探测、拉曼光谱法和FISH组合来将代谢过程与特定生物体联系起来。通过细胞进行的稳定同位素并入的比例影响光散射,从而引起标记的细胞组分(包括蛋白质和mRNA组分)的可测量的峰移位。拉曼光谱法可用于识别细胞是否合成化合物,所述化合物包括但不限于:油(诸如烷烃)、脂质(诸如三酰基甘油(TAG))、特定蛋白质(诸如血红素蛋白、金属蛋白)、细胞色素(诸如P450、细胞色素c)、叶绿素、发色团(诸如用于集光类胡萝卜素和视紫红质的色素)、有机聚合物(诸如聚羟基链烷酸酯(PHA)、聚羟基丁酸酯(PHB))、藿烷类、类固醇、淀粉、硫化物、硫酸盐以及次级代谢物(诸如维生素B12)。

  在一个实施方案中,将样品或其部分经受DNA/RNA稳定同位素探测(SIP)以确定第二独特标记物的水平(图1B,1004;图2,2004)。SIP实现与特定代谢途径相关联的微生物多样性的确定,并且通常应用于研究参与碳和氮化合物的利用的微生物。使用稳定同位素(诸如13C或15N)标记感兴趣的底物并且添加到样品。仅能够使底物代谢的微生物将其并入到微生物的细胞中。随后,可通过密度梯度离心分离13C-DNA和15N-DNA并且用于元基因组分析。基于RNA的SIP可以是用于SIP研究中的应答性生物标记物,因为RNA本身反映细胞活性。

  在一个实施方案中,将样品或其部分经受同位素阵列以确定第二独特标记物的水平(图1B,1004;图2,2004)。同位素阵列允许以高通量方式进行对活性微生物群落的功能和系统发育筛选。所述技术使用用于监测底物摄入图谱的SIP和用于确定活性微生物群落的分类统一性的微阵列技术的组合。将样品与14C标记的底物一起孵育,所述底物在生长过程期间并入到微生物生物质中。将14C标记的rRNA与未标记的rRNA分离并且然后使用荧色物标记。将荧光标记的rRNA杂交到系统发育微阵列,接着扫描放射活性和荧光信号。因此所述技术允许同时研究微生物群落组成和复杂微生物群落的代谢活性微生物进行的特定底物消耗。

  在一个实施方案中,将样品或其部分经受代谢物组学测定以确定第二独特标记物的水平(图1B,1004;图2,2004)。代谢物组学研究表示生物细胞、组织、器官或生物体中的细胞过程的所有代谢物、终产物的集合的代谢物组。此方法可用于监测微生物的存在和/或微生物介导的过程,因为它允许将特定代谢物图谱与不同的微生物关联起来。可使用诸如气相色谱法-质谱法(GC-MS)的技术获得与微生物活性相关联的细胞内和细胞外代谢物的图谱。可通过诸如气相色谱法、高效液相色谱法和毛细管电泳的技术分离代谢物组样品的复杂混合物。代谢物的检测可通过质谱法、核磁共振(NMR)光谱法、离子迁移光谱法、电化学检测(偶合到HPLC)以及放射性标记(当与薄层色谱法组合时)进行。

  根据本文所述的实施方案,确定样品中的一种或多种活性微生物菌株的存在和相应数量(图1B,1006;图2,2006)。例如,分析从测定第一标记物的数量和存在获得的菌株统一性信息来确定存在多少独特的第一标记物的发生,从而表示独特的微生物菌株(例如,通过计数测序测定中的序列读取的数量)。在一个实施方案中,此值可表示为第一标记物的总序列读取的百分比以得到特定微生物类型的独特的微生物菌株的百分比。在另一个实施方案中,此百分比乘以微生物类型的数量(在步骤1002或2002处获得,参见图1B和图2)以得到样品和给定体积中的一种或多种微生物菌株的绝对细胞计数。

  如上所述,如果第二独特标记物表达水平处于阈值水平下、高于阈值(例如,比对照水平高至少约5%、至少约10%、至少约20%或至少约30%),则一种或多种微生物菌株被认为是活性的。

  在本公开的另一方面,用于确定一种或多种微生物菌株的绝对细胞计数的方法在多个样品中确定(图2,具体地参见2007)。对于分类为活性的微生物菌株,它仅需要在样品中的一个中是活性的即可。样品可从相同来源在多个时间点处获取,或者可来自不同的环境来源(例如,不同的动物)。

  在一个实施方案中,样品的绝对细胞计数值用于使一种或多种活性微生物菌株与环境参数相关(图2,2008)。在一个实施方案中,所述环境参数是第二活性微生物菌株的存在。在一个实施方案中,使一种或多种活性微生物菌株与环境参数相关通过网络分析确定菌株和参数的共现来实行。

  在一个实施方案中,确定一种或多种活性微生物菌株与环境参数的共现包括测量网络内的多种菌株或一种菌株与环境参数的连通性的网络和/或聚类分析方法,其中所述网络是共享共同的或相似的环境参数的两个或更多个样品的集合。在另一个实施方案中,网络分析包括非参数途径,包括建立变量之间的连通性的交互信息。在另一个实施方案中,网络分析包括链接分析、模块性分析、稳健性测量、中间性测量、连通性测量、传递性测量、集中性测量或其组合。在另一个实施方案中,聚类分析方法包括构建连通性模型、子空间模型、分布模型、密度模型、或质心模型和/或使用群落检测算法诸如Louvain、Bron-Kerbosch、Girvan-Newman、Clauset-Newman-Moore、Pons-Latapy、Wakita-Tsurumi算法。

  在一个实施方案中,聚类分析方法是基于模块性优化的启发性方法。在另一个实施方案中,聚类分析方法是Louvain法(参见,例如,由Blondel等人(2008)Fast unfolding of communities in large networks.Journal of Statistical Mechanics:Theory and Experiment,第2008卷,2008年10月所描述的方法,其出于所有目的以引用的方式整体并入本文)。

  在另一个实施方案中,网络分析包括通过链路挖掘和预测、协作分类、基于链路的聚类、关系相似性、或其组合进行的网络预测建模。在另一个实施方案中,网络分析包括基于微分方程的群体建模。在另一个实施方案中,网络分析包括洛特卡-沃尔泰拉建模。

  在一个实施方案中,使样品中的一种或多种活性微生物与环境参数相关(例如,确定共现)包括创建使用代表环境参数和微生物菌株关联的链接填充的矩阵。

  在一个实施方案中,编译在步骤2007处(例如,在可在每个时间点对应于个体样品的两个或更多个时间点处采集的两个或更多个样品上)获得的多种样品数据。在另一个实施方案中,每个样品中的一种或多种微生物菌株中的每种的细胞数量存储在关联矩阵(在一些实施方案中,其可以是量矩阵)中。在一个实施方案中,关联矩阵用于使用以关联(例如,量)数据加权的规则挖掘途径识别特定时间点样品中的活性微生物菌株之间的关联。在一个实施方案中,应用过滤器以去除不显著的规则。

  在一个实施方案中,一种或多种或两种或更多种活性微生物菌株的绝对细胞计数例如通过共现确定与一种或多种环境参数相关(图2,2008)。环境参数通过用户基于待分析的样品来选择并且不被本文所述的方法限制。所述环境参数可以是样品本身的参数,例如pH、温度、样品中的蛋白质的量。可替代地,所述环境参数是影响微生物群落的一致性的变化(即,其中微生物群落的“一致性”通过群落中的微生物菌株的类型和/或特定微生物的数量表征)或受微生物群落的一致性的变化影响的参数。例如,在一个实施方案中,环境参数是动物的食物摄入或由泌乳的反刍动物产生的乳液的量(或乳液的蛋白质或脂肪含量)。在一个实施方案中,环境参数是存在于相同样品中的微生物群落中的第二微生物菌株的存在、活性和/或量。

  在本文所述的一些实施方案中,环境参数称为元数据参数并且反之亦然。

  元数据参数的其他实例包括但不限于来自样品从其获得的宿主的遗传信息(例如,DNA突变信息)、样品pH、样品温度、特定蛋白质或mRNA的表达、营养条件(例如,(周围环境/生态系统的一种或多种营养物质的水平和/或统一性)、对于疾病的易感性或抗性、疾病的发作或进展、样品对于毒素的易感性或抗性、异生素化合物(药学药物)的效力、天然产物的生物合成、或其组合。

  例如,根据一个实施方案,根据图2的方法(即,在2001-2007处)关于多个样品计算微生物菌株数量变化。编译一种或多种活性菌株(例如,根据步骤2006初始识别为活性的一种或多种菌株)随时间的菌株数量变化,并且指出变化的方向性(即,负值代表降低,正值代表增加)。细胞随时间的数量表示为网络,其中微生物菌株表示节点并且量加权规则表示边缘。运用马尔可夫链和随机游动来确定节点之间的连通性并且限定聚类。在一个实施方案中,使用元数据过滤聚类以便识别与合乎需要的元数据相关联的聚类(图2,2008)。

  在另一个实施方案中,通过整合随时间的细胞数量变化和存在于靶标聚类中的菌株根据重要性对微生物菌株进行排名,其中最大的细胞数量变化排名最高。

  在一个实施方案中,网络和/或聚类分析方法用于测量网络内的一种或多种菌株的连通性,其中所述网络是共享共同的或相似的环境参数的两种或更多种样品的集合。在一个实施方案中,网络分析包括链接分析、模块性分析、稳健性测量、中间性测量、连通性测量、传递性测量、集中性测量或其组合。在另一个实施方案中,网络分析包括通过链路挖掘和预测、社会网络理论、协作分类、基于链路的聚类、关系相似性、或其组合进行的网络预测建模。在另一个实施方案中,网络分析包括交互信息、最大信息系数计算、或在变量之间建立连通性的其他非参数方法。在另一个实施方案中,网络分析包括基于微分方程的群体建模。在又一个实施方案中,网络分析包括洛特卡-沃尔泰拉建模。

  聚类分析方法包括构建连通性模型、子空间模型、分布模型、密度模型、或质心模型。

  例如实行图2的方法步骤2008的基于网络和聚类的分析可通过处理器、部件和/或模块来实行。如本文所用,部件和/或模块可以是例如任何组件、指令和/或操作性地联接的电部件的组,并且可包括例如存储器、处理器、电迹线、光学连接器、软件(在硬件中执行)和/或类似物。

  图3A是示出根据一个实施方案的微生物分析、筛选和选择平台和系统300的示意图。根据本公开的平台可包括确定天然微生物群落内的多维种间相互作用和依赖性的系统和过程,并且参照图3A描述一个实施例。图3A是构造图并且因此省略了某些方面以改善描述的清晰度,虽然这些方面当在本公开的上下文中理解时对于技术人员应是显而易见的。

  如图3A所示,微生物筛选和选择平台和系统300可包括一个或多个处理器310、数据库319、存储器320、通信接口390、被配置来与用户输入装置396和外围装置397(包括但不限于数据采集和分析装置(诸如FAC)、选择/孵育/配制装置、和/或额外的数据库/数据源、远程数据采集装置(例如,可采集元数据环境数据(诸如样品特征、温度、天气等)的装置),包括运行app以采集此类信息的移动智能电话以及其他移动或固定装置)交互的输入/输出接口、被配置来在通信网络392(例如,LAN、WAN和/或因特网)上接收数据并向客户端393b和用户393a传送数据的网络接口;数据采集部件330、绝对计数部件335、样品相关部件340、活性部件345、网络分析部件350、以及菌株选择/微生物群生成部件355。在一些实施方案中,微生物筛选系统300可以是单一物理装置。在其他实施方案中,微生物筛选系统300可包括多个物理装置(例如,通过网络操作性地联接),其中的每个可包括图3A所示的一个或多个部件和/或模块。

  微生物筛选系统300中的每个部件或模块可操作性地联接到每个剩余的部件和/或模块。微生物筛选系统300中的每个部件和/或模块可以是能够实施与此部件和/或模块相关联的一种或多种特定功能的硬件和/或软件(在硬件中存储和/或执行)的任何组合。

  存储器320可以是例如随机存取存储器(RAM)(例如,动态RAM、静态RAM)、闪存存储器、可移除存储器、硬盘驱动器、数据库和/或其他存储器。在一些实施方案中,存储器320可包括例如数据库(例如,如在309中的)、处理、应用、虚拟机器、和/或一些其他软件部件、程序和/或模块(在硬件中存储和/或执行)或被配置来执行用于微生物筛选和群生成的微生物筛选过程和/或一种或多种相关联的方法(例如,通过数据采集部件330、绝对计数部件335、样品相关部件340、活性部件345、网络分析部件350、菌株选择/微生物群生成部件355(和/或相似的模块))的硬件部件/模块。在此类实施方案中,执行微生物筛选和/或群生成过程和/或相关联的方法的指令可存储在存储器320内并且在处理器310处执行。在一些实施方案中,通过数据采集部件330采集的数据可存储在数据库319中和/或存储器320中。

  处理器310可被配置来控制例如通信接口390的操作、将数据编写到存储器320中并且从存储器320读取数据、并且执行存储在存储器320内的指令。处理器310还可被配置来执行和/或控制例如数据采集部件330、绝对计数部件335、样品相关部件340、活性部件、以及网络分析部件350的操作,如本文另外详细描述的。在一些实施方案中,在处理器310的控制下并且基于存储在存储器320内的方法或处理,数据采集部件330、绝对计数部件335、样品相关部件340、活性部件345、网络分析部件350、以及菌株选择/群生成部件355可被配置来执行微生物筛选、选择和合成群生成过程,如本文另外详细描述的。

  通信接口390可包括和/或被配置来管理微生物筛选系统300的一个或多个端口(例如,通过输入输出接口395)。在一些情况下,例如,通信接口390(例如,网络接口卡(NIC))可包括一个或多个线路卡,其中的每个可包括(操作性地)联接到装置(例如,外围装置397和/或用户输入装置396)的一个或多个端口。通信接口390中包括的端口可以是可主动与联接的装置通信或在网络392上通信(例如,与终端用户装置393b、主机装置、服务器等通信)的任何实体。在一些实施方案中,此端口不一定是硬件端口,而可以是虚拟端口或通过软件定义的端口。通信网络392可以是能够传送信息(例如,数据和/或信号)的任何网络或网络组合,并且可包括例如电话网络、以太网网络、光纤网络、无线网络、和/或蜂窝网络。通信可在网络上进行,例如像Wi-Fi或无线局域网(“WLAN”)连接、无线广域网(“WWAN”)连接、和/或蜂窝连接。网络连接可以是有线连接,例如像以太网连接、数字订购线(“DSL”)连接、宽带同轴连接、和/或光纤连接。例如,微生物筛选系统300可以是被配置来通过网络392被一个或多个计算装置393b访问的主机装置。以这种方式,计算装置可通过网络392向微生物筛选系统300提供信息和/或从微生物筛选系统300接收信息。此类信息可以是例如用于微生物筛选系统300采集、相关、确定、分析和/或生成活性的、网络分析的微生物的群的信息,如本文另外详细描述的。相似地,计算装置可被配置来检索和/或请求来自微生物筛选系统300的确定的信息。

  在一些实施方案中,通信接口390可包括和/或被配置来包括输入/输出接口395。输入/输出接口可接收、连通和/或连接到用户输入装置、外围装置、加密处理器装置、和/或类似装置。在一些情况下,一种输出装置可以是视频显示器,其可包括例如具有从视频接口接收信号的接口(例如,数字视觉接口(DVI)电路和电线)的阴极射线管(CRT)或液晶显示器(LCD)、LED、或基于等离子体的监视器。在此类实施方案中,通信接口390可被配置来除其他功能以外接收数据和/或信息并且发送微生物筛选修改、命令和/或指令。

  数据采集部件330可以是任何硬件和/或软件部件和/或模块(存储在诸如存储器320的存储器中和/或在诸如处理器310的硬件中执行),其被配置来采集、处理、和/或归一化数据以用于通过绝对计数部件335、样品相关部件340、活性部件345、网络分析部件350、和/或菌株选择/群生成部件355实施的对于天然微生物群落内的多维种间相互作用和依赖性的分析。在一些实施方案中,数据采集部件330可被配置来确定样品的给定体积中的一种或多种活性生物体菌株的绝对细胞计数。基于一种多种活性微生物菌株的绝对细胞计数,数据采集部件330可使用标记物序列识别绝对细胞计数数据集内的活性菌株。数据采集部件330可在一段时间内连续采集数据以表示样品内的微生物群体的动态学。数据采集部件330可编译时间数据并且将量矩阵中的每种活性生物体菌株的细胞数量存储在诸如存储器320的存储器中。

  样品相关部件340和网络分析部件350可被配置来协作确定天然微生物群落内的多维种间相互作用和依赖性。样品相关部件340可以是任何硬件和/或软件部件(存储在诸如存储器320的存储器中和/或在诸如处理器310的硬件中执行),其被配置来使元数据参数(环境参数,例如通过共现)与一种或多种活性微生物菌株的存在相关。在一些实施方案中,样品相关部件340可使一种或多种活性生物体菌株与一种或多种环境参数相关。

  网络分析部件350可以是任何硬件和/或软件部件(存储在诸如存储器320的存储器中和/或在诸如处理器310的硬件中执行),其被配置来确定样品中的一种或多种活性微生物与环境(元数据)参数的共现。在一些实施方案中,基于通过数据采集部件330采集的数据和通过样品相关部件340确定的一种或多种活性微生物菌株与一种或多种环境参数之间的关系,网络分析部件350可创建使用代表环境参数和微生物菌株关联的链接、一种或多种活性微生物菌株的绝对细胞计数以及一种多种独特的第二标记物的表达水平填充的矩阵以表示微生物菌株的异质群体的一个或多个网络。例如,网络分析可使用关联(量和/或丰度)矩阵来使用以量数据加权的规则挖掘途径识别样品中的活性微生物菌株与元数据参数之间的关联(例如,两种或更多种活性微生物菌株的关联)。在一些实施方案中,网络分析部件350可应用过滤器来选择和/或去除规则。网络分析部件350可计算活性菌株随时间的细胞数量变化,从而指出变化的方向性(即,负值代表降低,正值代表增加)。网络分析部件350可将矩阵表示为网络,其中微生物菌株表示节点并且量加权规则表示边缘。网络分析部件350可使用杠杆马尔可夫链和随机游动来确定节点之间的连通性并且限定聚类。在一些实施方案中,网络分析部件350可使用元数据过滤聚类以便识别与合乎需要的元数据相关联的聚类。在一些实施方案中,网络分析部件350可通过整合随时间的细胞数量变化和存在于靶标聚类中的菌株对靶标微生物菌株进行排名,其中最大的细胞数量变化排名最高。

  在一些实施方案中,网络分析包括链接分析、模块性分析、稳健性测量、中间性测量、连通性测量、传递性测量、集中性测量或其组合。在另一个实施方案中,可使用聚类分析方法,其包括构建连通性模型、子空间模型、分布模型、密度模型、或质心模型。在另一个实施方案中,网络分析包括通过链路挖掘和预测、协作分类、基于链路的聚类、关系相似性、或其组合进行的网络预测建模。在另一个实施方案中,网络分析包括交互信息、最大信息系数计算、或在变量之间建立连通性的其他非参数方法。在另一个实施方案中,网络分析包括基于微分方程的群体建模。在另一个实施方案中,网络分析包括洛特卡-沃尔泰拉建模。

  图3B示出根据本公开的一个实施方案的示例性逻辑流程图。首先,采集和/或接收多个样品和/或样品集3001。应理解,如本文所用,“样品”可指代一个或多个样品、样品集、多个样品(例如,来自特定群体),使得当讨论两个或更多个不同样品时,为了便于理解,并且每个样品可包括多个子样品(例如,当讨论第一样品和第二样品时,第一样品可包括从第一群体采集的2个、3个、4个、5个或更多个子样品,并且第二样品可包括从第二群体或可替代地从第一群体但是在不同的时间点处(诸如采集第一子样品之后的一个周或一个月)采集的2个、3个、4个、5个或更多个子样品)。当采集子样品时,可监测并存储每个子样品的个体采集标记和参数,包括环境参数、定性和/或定量观察、群体成员统一性(例如,所以当从相同的群体在两个或更多个不同时间处采集样品时,子样品通过统一性配对,所以在时间1处来自动物1的子样品与在时间2处从此相同动物采集的子样品关联,并且依次类推)。

  针对每个样品、样品集和/或子样品,基于靶标生物体类型对细胞进行染色3002,对每个样品/子样品或其部分进行称重并且顺序地稀释3003,并且进行处理3004以确定每个样品/子样品中的每种微生物类型的细胞数量。在一个示例性具体实施中,可使用细胞分选仪对来自样品(诸如来自环境样品)的个体细菌和真菌细胞进行计数。作为本公开的一部分,对特定染料进行显色以实现对根据传统方法先前不可计数的微生物的计数。遵循本公开的方法,使用特定染料对细胞壁(例如,针对细菌和/或真菌)进行染色,并且可使用激光基于细胞特征从较大群体对靶标细胞的分散群体进行计数。在一个特定实施例中,制备环境样品并且稀释到等渗缓冲溶液中并且使用染料进行染色:(a)对于细菌,可使用以下染料染色-DNA:Sybr绿,呼吸作用:5-氰基-2,3-二甲苯基四唑氯化物和/或CTC,细胞壁:孔雀绿和/或结晶紫;(b)对于真菌,可使用以下染料染色-细胞壁:Calcofluor白、刚果红、台盼蓝、直接黄96、直接黄11、直接黑19、直接橙10、直接红23、直接红81、直接绿1、直接紫51、麦胚凝集素-WGA、活性黄2、活性黄42、活性黑5、活性橙16、活性红23、活性绿19、和/或活性紫5。

  在本公开的发展中,有利地发现虽然直接染料和活性染料通常与基于纤维素的材料(即,棉、亚麻和粘胶人造丝)的染色相关联,但是它们也可用于分别由于β-(1→4)连接的N-乙酰葡萄糖胺链和β-(1→4)连接的D-葡糖胺和N-乙酰基-D-葡糖胺链的存在来对甲壳质和壳聚糖进行染色。当这些亚基装配成链时,形成与纤维素链非常相似的平坦、纤维状结构。直接染料通过染料与纤维分子之间的范德瓦耳斯力(Van der Waals forces)附着到甲壳质和/或壳聚糖分子。两者之间的表面积接触越大,相互作用越强。在另一方面,活性染料形成甲壳质和/或壳聚糖的共价键。

  将每个染色的样品加载到FAC中3004以用于计数。可将样品运行通过具有生成个体液滴(例如,大约1/10微升(0.1μL))的流的特定大小喷嘴(例如,100μm,根据具体实施和应用选择)的微流体芯片。这些变量(喷嘴大小、液滴形成)可针对每种靶标微生物类型进行优化。理想地,包封在每个液滴中的是一个细胞或“事件”,并且当每个液滴被激光击中时,激发被染色的任何事物并且发射不同波长的光。FAC通常检测每个发射并且可将其绘制为事件(例如,在2D图上绘制)。典型的图由针对事件大小(通过“正向散射”确定)的一个轴和针对荧光强度的另一个轴组成。可在这些图上的分散群体周围画“门”,并且可对这些门中的事件进行计数。

  图3C示出来自使用直接黄染色的真菌的示例性数据;包括酵母单一培养物3005a(阳性对照,左)、大肠杆菌3005b(阴性对照,中)和环境样品3005c(实验,右)。在此图中,“反向散射”(BSC-A)测量事件的复杂性,而FITC测量来自直接黄的荧光发射的强度。每个点表示一个事件,并且事件的密度通过从绿至红的颜色变化指示。门B指示其中期待存在靶向事件(在此情况下是使用直接黄染色的真菌)的大体区域。

  返回到图3B,以从一个或多个来源采集的两个或更多个样品3001(包括从个体动物或单一地理位置随时间;从在地理学、品种、性能、饮食、疾病等方面不同的两个或更多个组;从经历生理学扰动或事件的一个或多个组;和/或类似组采集的样品)开始,可使用流式细胞术(包括染色3002)分析样品以建立绝对计数,如上所讨论的。对样品进行称重并且顺序地稀释3003,并且使用FAC进行处理3004。然后处理来自FAC的输出以确定每个样品中的所需生物体类型的绝对数量3005。以下编码片段示出根据一个实施方案的用于此类处理的示例性方法:

  #用户定义变量

  #

  #体积=通过FAC测量的样品的体积

  #稀释=稀释因子

  #珠_num=计数珠因子

  #总_体积=以mL为单位的样品(如果适用的话)的总体积

  #

  #关于总_体积的注意事项:这可直接测量(即

  #瘤胃抽空来测量瘤胃的整个体积含量),

  #或通过稳定追踪物来测量(即,使用以已知量投配的

  #不可消化标记物以便反计算小肠的

  #体积。)

  将FAC输出读取为x

  对于范围(len(x))中的i:

  支持物=x[i]

  mule=[]

  对于范围(len(支持物))中的j:

  珠=支持物[-1]

  如果珠==0:

  temp=(((支持物[j]/珠_num)*(51300/体积))*1000)*稀释*100*总_体积

  mule.append(temp)

  否则:

  temp=(((支持物[j]/支持物[-1])*(51300/体积))*1000)*稀释*100*总_体积

  mule.append(temp)

  生物体_类型_1=mule[柱_位置]

  调用=样品_名称[i]

  细胞_计数=[调用,生物体_类型_1]

  savetxt(输出_文件,细胞_计数)

  输出_文件.关闭()

  从每个样品分离总核酸3006。将核酸样品洗脱液分成两个部分(通常,两个等量部分),并且对每个部分进行酶促纯化以获得纯化的DNA 3006a或纯化的RNA 3006b。将纯化的RNA通过酶促转化为cDNA 3006c来稳定化。使用PCR针对纯化的DNA和纯化的cDNA两者制备测序文库(例如,ILLUMINA测序文库)以附接适当的条码和适配子区,并且扩增对于测量所需生物体类型适当的标记物区3007。可评定并定量文库质量,并且然后可集中所有的文库并且进行测序。

  对原始测序读取进行质量修整和合并3008。对处理的读取进行反复制和聚类以生成存在于多个样品中的全部独特的菌株的列表3009。此列表可用于存在于多个样品中的每种菌株的分类识别3010。可识别来源于DNA样品的测序文库,并且将来自识别的DNA文库的测序读取映射回反复制的菌株的列表以便识别每个样品中存在有哪些菌株,并且定量每个样品中的每种菌株的读取的数量3011。然后将定量的读取列表与靶标微生物类型的绝对细胞计数整合以便确定每种菌株的绝对数量或细胞计数3013。以下编码片段示出根据一个实施方案的用于此类处理的示例性方法:

  #用户定义变量

  #

  #输入=来自序列分析的定量计数输出

  #计数=生物体类型的计算的绝对细胞计数

  #分类学=每种菌株的预测分类学

  #

  将绝对细胞计数文件读取为计数

  将分类学读取为tax

  ncols=len(计数)

  num_样品=ncols/2

  tax_水平=[]

  tax_水平.append(独特(分类学['界'].值.ravel()))

  tax_水平.append(独特(分类学[‘门'].值.ravel()))

  tax_水平.append(独特(分类学[‘类'].值.ravel()))

  tax_水平.append(独特(分类学[‘目'].值.ravel()))

  tax_水平.append(独特(分类学[‘科'].值.ravel()))

  tax_水平.append(独特(分类学[‘属'].值.ravel()))

  tax_水平.append(独特(分类学[‘种'].值.ravel()))

  tax_计数=合并(左=计数,右=tax)

  #物种水平分析

  tax_计数.to_csv('种.txt')

  #仅拉取DNA样品

  数据_mule=loadcsv('种.txt',usecols=xrange(2,ncols,2))

  数据_mule_归一化=数据_mule/总和(数据_mule)

  数据_mule_具有_计数=数据_mule_归一化*计数

  针对每一个分类水平进行重复

  识别来源于cDNA样品的测序文库3014。然后将来自识别的cDNA文库测序读取映射回反复制的菌株的列表以便确定每个样品中哪些菌株是活性的。如果读取的数量低于指定的或指明的阈值3015,则所述菌株被认为或识别为非活性的并且从随后的分析去除3015a。如果读取的数量超过所述阈值3015,则所述菌株被认为或识别为活性的并且保持在分析中3015b。然后将非活性菌株从输出过滤3013以生成每个样品的活性菌株和相应的绝对数量/细胞计数的列表3016。以下编码片段示出根据一个实施方案的用于此类处理的示例性方法:

  #继续使用来自以上的变量

  #仅拉取RNA样品

  活性_数据_mule=loadcsv('种.csv',usecols=xrange(3,ncols+1,2))

  阈值=百分位数(活性_数据_mule,70)

  对于范围(len(活性_数据_mule))中的i:

  如果数据_mule_活性>=阈值

  乘数[i]=1

  否则

  乘数[i]=0

  活性_数据_mule_具有_计数=乘数*数据_mule_具有_计数

  针对每一个分类水平进行重复

  针对每个样品(样品集、子样品等)识别、检索和/或采集定性和定量元数据(例如,环境参数等)3017并且存储在数据库(例如,319)中3018。根据应用/具体实施,可识别适当的元数据并且查询数据库以拉取分析的每个样品的识别的和/或相关的元数据3019。然后将元数据的子集与活性菌株及其对应的绝对数量/细胞计数的列表合并以通过样品矩阵创建大物种和元数据3020。

  然后计算菌株与元数据之间3021a和菌株之间3021b的最大信息系数(MIC)。集中结果以创建所有关系及其对应的MIC分数的列表3022。如果所述关系得分低于给定阈值3023,则所述关系被认为/识别为非相关的3023b。如果所述关系高于给定阈值3023,则所述关系被认为/识别为相关的2023a,并且进一步经受网络分析3024。以下编码片段示出根据一个实施方案的用于此类分析的示例性方法:

  将总关系列表文件读取为链路

  阈值=0.8

  对于范围(len(链路))中的i:

  如果链路>=阈值

  乘数[i]=1

  否则

  乘数[i]=0

  结束如果

  链路_temp=乘数*链路

  最终_链路=链路_temp[链路_temp!=0]

  savetxt(输出_文件,最终_链路)

  输出_文件.关闭()

  基于网络分析的输出,选择活性菌株3025以用于制备含有选择的菌株的产物(例如,群、聚集体和/或其他合成分组)。网络分析的输出还可用于通告用于进一步产物组成测试的菌株的选择。

  阈值的使用针对分析和确定在以上讨论。基于具体实施和应用,阈值可:(1)凭经验确定(例如,基于分布水平,设定在去除指定的或显著部分的低水平读取的数量下的截取值);(2)任何非零值;(3)基于百分比/百分位数;(4)仅其归一化的第二标记物(即,活性)读取大于归一化的第一标记物(细胞计数)读取的菌株;(5)活性与量或细胞计数之间的log2倍变化;(6)对于整个样品(和/或样品集),归一化第二标记物(活性)读取大于平均第二标记物(活性)读取;和/或除统计学阈值之外的以上所述的任何量值阈值(即,显著性测试)。以下实施例提供根据一个实施方案的参照基于DNA的第一标记物测量的基于RNA的第二标记物测量的分布的阈值分割细节。

  采集一个雄性Cobb500的小肠含量并且经受根据本公开的分析。简而言之,使用FAC确定样品中的细菌细胞的总数量(例如,3004)。从固定的小肠样品分离总核酸(例如,3006)。制备DNA(第一标记物)和cDNA(第二标记物)测序文库(例如,3007)并且加载到ILLUMINA MISEQ中。对来自每个文库的原始测序读取进行质量过滤、反复制、聚类和定量(例如,3008)。将来自基于DNA和基于cDNA的文库两者的定量菌株列表与细胞计数数据整合以建立样品内的每种菌株的细胞的绝对数量(例如,3013)。虽然cDNA不一定是菌株的直接测量量(即,高度活性菌株可具有相同RNA分子的许多拷贝),但是在此实施例中将基于cDNA的文库与细胞计数数据整合以维持用于DNA文库的相同归一化程序。

  在分析之后,在基于cDNA的文库中识别到702种菌株(46种独特的)并且在基于DNA的文库中识别到1140种菌株。如果使用0作为活性阈值(即,保留任何非零值),则此样品内具有基于DNA的第一标记物的菌株中的57%也与基于cDNA的第二标记物缔合。这些菌株被识别为/认为是微生物群落的活性部分,并且仅这些菌株继续进行随后的分析。如果阈值更加严格并且仅其第二标记物值超过第一标记物值的菌株被认为是活性的,则仅289种菌株(25%)达到阈值。达到此阈值的菌株对应于高于图3D中的DNA(第一标记物)线的那些菌株。

  本公开包括各种方法,其识别影响彼此以及一种或多种参数或元数据的多种活性微生物菌株,并且选择识别的微生物以用于包括在实行或影响共同的功能方面关联或可描述为参与或引起可识别的参数(诸如感兴趣的表型性状(例如,反刍动物的乳液产生增加))或与其相关联的个体微生物物种或物种菌株的微生物群落的选择子集的微生物群中。本公开还包括实施和/或有利于所述方法的各种系统和设备。

  在一些实施方案中,所述方法包括:获得共享至少一种共同的特征(诸如样品地理位置、样品类型、样品来源、样品来源个体、样品靶标动物、样品时间、品种、饮食、温度等)并且具有至少一种不同的特征(诸如样品地理位置/时间位置、样品类型、样品来源、样品来源个体、样品靶标动物、样品时间、品种、饮食、温度等,不同于共同的特征)的至少两个样品。针对每个样品,检测一种或多种微生物类型的存在,确定每个样品中的一种或多种微生物类型的每种所检测的微生物类型的数量;并且测量每个样品中的独特的第一标记物的数量及其量,每种独特的第一标记物是微生物菌株的标记物。这之后将每种微生物类型的数量和第一标记物的数量整合以得出存在于每个样品中的每种微生物菌株的绝对细胞计数;基于指定阈值测量每种微生物菌株的至少一种独特的第二标记物以确定每个样品中的此微生物菌株的活性水平;通过所确定的活性过滤绝对细胞计数以提供至少两个样品中的每个的活性微生物菌株及其相应的绝对细胞计数的列表;将至少两个样品中的每个的活性微生物菌株的所过滤的绝对细胞计数与彼此和与至少两个样品中的每个的至少一种测量的元数据进行比较并且基于预测的功能和/或化学将活性微生物菌株归类为至少两个组。例如,所述比较可以是识别相应的微生物菌株之间和每种微生物菌株与元数据之间和/或元数据与微生物菌株之间的联系的网络分析。至少一种微生物可选自至少两个组,并且组合以形成被配置来改变对应于至少一种元数据的特性(例如,靶标中的特性,诸如奶牛或奶牛群的乳液产生)的微生物群。形成所述群可包括分离所述或每种微生物菌株、基于所述分析选择先前分离的微生物和/或基于所述分析孵育/生长特定微生物菌株、以及组合所述菌株以形成微生物群。所述群可包括以所述群中的微生物可影响受者(例如,增加乳液产生)的方式实现所述微生物的递送的适当的培养基、载体和/或药学载体。

  测量独特的第一标记物的数量可包括测量每个样品中的独特的基因组DNA标记物的数量、测量每个样品中的独特的RNA标记物的数量、测量每个样品中的独特的蛋白标记物的数量、和/或测量每个样品中的独特的代谢物标记物的数量(包括测量每个样品中的独特的脂质标记物的数量和/或测量每个样品中的独特的碳水化合物标记物的数量)。

  在一些实施方案中,测量独特的第一标记物的数量及其量包括将来自每个样品的基因组DNA经受高通量测序反应和/或将来自每个样品的基因组DNA经受元基因组测序。独特的第一标记物可包括mRNA标记物、siRNA标记物和/或核糖体RNA标记物中的至少一种。独特的第一标记物可另外地或可替代地包括σ因子、转录因子、核苷相关蛋白、和/或代谢酶中的至少一种。

  在一些实施方案中,测量至少一种独特的第二标记物包括测量每个样品中的至少一种独特的第二标记物的表达水平,并且可包括将样品中的mRNA经受基因表达分析。所述基因表达分析可包括测序反应、定量聚合酶链反应(qPCR)、元转录组测序和/或转录组测序。

  在一些实施方案中,测量至少一种独特的第二标记物的表达水平包括将每个样品或其部分经受质谱法分析和/或将每个样品或其部分经受元核糖体作图或核糖体作图。所述一种或多种微生物类型包括细菌、古生菌、真菌、原生动物、植物、其他真核生物、病毒、类病毒、或其组合,并且所述一种或多种微生物菌株包括一种或多种细菌菌株、古生菌菌株、真菌菌株、原生动物菌株、植物菌株、其他真核生物菌株、病毒菌株、类病毒菌株、或其组合。所述一种或多种微生物菌株可以是一种或多种真菌物种或亚种,并且/或者所述一种或多种微生物菌株可以是一种或多种细菌物种或亚种。

  在一些实施方案中,确定每个样品中的一种或多种微生物类型中的每一种的数量包括将每个样品或其部分经受测序、离心、光学显微镜检查术、荧光显微镜检查术、染色法、质谱法、微流体、定量聚合酶链反应(qPCR)、凝胶电泳、和/或流式细胞术。

  独特的第一标记物可包括系统发育标记物,所述系统发育标记物包含5S核糖体亚基基因、16S核糖体亚基基因、23S核糖体亚基基因、5.8S核糖体亚基基因、18S核糖体亚基基因、28S核糖体亚基基因、细胞色素c氧化酶亚基基因、β-微管蛋白基因、延长因子基因、RNA聚合酶亚基基因、内部转录间隔区(ITS)、或其组合。测量独特的标记物的数量或其量可包括将来自每个样品的基因组DNA经受高通量测序反应、将基因组DNA经受基因组测序、和/或将基因组DNA经受扩增子测序。

  在一些实施方案中,所述至少一种不同的特征包括:采集时间,在所述采集时间处采集至少两个样品中的每个,使得第一样品的采集时间不同于第二样品的采集时间;采集位置(地理位置差异和/或个体样品靶标/动物采集差异),在所述采集位置处采集至少两个样品中的每个,使得第一样品的采集位置不同于第二样品的采集位置。所述至少一种共同的特征可包括样品来源类型,使得第一样品的样品来源类型与第二样品的样品来源类型相同。所述样品来源类型可以是动物类型、器官类型、土壤类型、水类型、沉淀物类型、油类型、植物类型、农业产品类型、非根际土壤类型、土壤根际类型、植物部分类型、和/或类似类型中的一种。在一些实施方案中,所述至少一种共同的特征包括至少两个样品中的每个是胃肠样品,其在一些具体实施中可以是瘤胃样品。在一些具体实施中,本文提供的共同的/不同的特征可反而是某些样品之间的不同的/共同的特征。在一些实施方案中,所述至少一种共同的特征包括动物样品来源类型,每个样品具有另外共同的特征,使得每个样品是组织样品、血液样品、牙齿样品、汗液样品、指甲样品、皮肤样品、毛发样品、粪便样品、尿液样品、精液样品、黏液样品、唾液样品、肌肉样品、脑样品、或器官样品。

  在一些实施方案中,以上方法还可包括基于至少一种测量的元数据从靶标获得至少一个另外的样品,其中来自靶标的所述至少一个另外的样品与所述至少两个样品共享至少一种共同的特征。然后,针对来自靶标的至少一个另外的样品,检测一种或多种微生物类型的存在、确定一种或多种微生物类型的每种所检测的微生物类型的数量、测量独特的第一标记物的数量及其量、整合每种微生物类型的数量和第一标记物的数量以得出存在的每种微生物菌株的绝对细胞计数、测量每种微生物菌株的至少一种独特的第二标记物以确定此微生物菌株的活性水平、通过所确定的活性过滤绝对细胞计数以提供来自靶标的至少一个另外的样品的活性微生物菌株及其相应的绝对细胞计数的列表。在此类实施方案中,从至少两个组选择至少一种微生物菌株基于来自靶标的至少一个另外的样品的活性微生物菌株和所述/其相应的绝对细胞计数的列表,使得所形成的群被配置来改变靶标的对应于至少一种元数据的特性。例如,使用此具体实施,可从取自Holstein奶牛的样品和取自Jersey奶牛或水牛的靶标样品识别微生物群,其中所述分析识别来自初始样品和靶标样品的相同或相似微生物菌株之间的相同、基本上相似、或相似的网络关系。

  在一些实施方案中,将至少两个样品中的每个的活性微生物菌株的所过滤的绝对细胞计数与至少两个样品中的每个的至少一种测量的元数据或额外的活性微生物菌株进行比较包括确定每个样品中的一种或多种活性微生物菌株与至少一种测量的元数据或额外的活性微生物菌株的共现。所述至少一种测量的元数据可包括一种或多种参数,其中所述一种或多种参数是样品pH、样品温度、脂肪丰度、蛋白质丰度、碳水化合物丰度、矿物质丰度、维生素丰度、天然产物丰度、指定化合物丰度、样品来源的体重、样品来源的饲料摄入、样品来源的重量增加、样品来源的饲料效率、一种或多种病原体的存在或不存在、样品来源的物理特征或测量、样品来源的产生特征、或其组合中的至少一种。参数还可包括由样品来源产生的乳液中的乳清蛋白的丰度、酪蛋白的丰度、和/或脂肪的丰度。

  在一些实施方案中,确定一种或多种活性微生物菌株和每个样品中的至少一种测量的元数据或额外的活性微生物菌株的共现可包括创建使用代表两个或更多个样品集中的元数据和微生物菌株关联的链接、一种或多种活性微生物菌株的绝对细胞计数以及一种多种独特的第二标记物的测量值填充的矩阵以表示一个或多个异质微生物群落的一个或多个网络。确定一种或多种活性微生物菌株和至少一种测量的元数据或额外的活性微生物菌株的共现并且对活性微生物菌株进行归类可包括测量网络内的每种微生物菌株的连通性的网络分析和/或聚类分析,所述网络表示共享共同的特征、测量的元数据和/或相关环境参数的至少两个样品的集合。网络分析和/或聚类分析可包括链接分析、模块性分析、稳健性测量、中间性测量、连通性测量、传递性测量、集中性测量、或其组合。聚类分析可包括构建连通性模型、子空间模型、分布模型、密度模型、和/或质心模型。在一些具体实施中,网络分析可包括通过链路挖掘和预测、协作分类、基于链路的聚类、关系相似性、或其组合进行的网络预测建模和/或类似建模。网络分析可包括基于微分方程的群体建模和/或洛特卡-沃尔泰拉建模。所述分析可以是启发性方法。在一些实施方案中,所述分析可以是Louvain法。网络分析可包括在变量之间建立连通性的非参数方法和/或在变量之间建立连通性的交互信息和/或最大信息系数计算。

  对于一些实施方案,用于基于在两个或更多个样品集之间共享至少一种共同的或相关的环境参数并且在两个或更多个样品集之间具有至少一种不同的环境参数的两个或更多个样品集(每个样品集包括具有异质微生物群落的至少一个样品,其中所述一种或多种微生物菌株是一种或多种生物体类型的亚分类单元)形成被配置来改变环境中的特性或特征的活性微生物菌株的群的方法包括:检测每个样品中的多种微生物类型的存在;确定每个样品中的所检测的微生物类型中每一种的细胞的绝对数量;以及测量每个样品中的独特的第一标记物的数量及其量,其中独特的第一标记物是微生物菌株的标记物。然后,在蛋白质或RNA水平下,测量一种或多种独特的第二标记物的表达水平,其中独特的第二标记物是微生物菌株的活性标记物,基于一种或多种独特的第二标记物的表达水平超过指定阈值确定每个样品的所检测的微生物菌株的活性,基于一种或多种第一标记物的量和一种或多种微生物菌株是其亚分类单元的微生物类型的细胞的绝对数量计算每个样品中的每种所检测的活性微生物菌株的绝对细胞计数,其中所述一种或多种活性微生物菌株表达高于指定阈值的第二独特标记物。然后基于测量网络内的每种微生物菌株的连通性的最大信息系数网络分析确定样品中的活性微生物菌株与至少一种环境参数的共现,其中所述网络是具有至少一种共同的或相关的环境参数的至少两个或更多个样品集的集合。基于所述网络分析选择来自一种或多种活性微生物菌株的多种活性微生物菌株,并且从选择的多种活性微生物菌株形成活性微生物菌株的群,当活性微生物菌株的群引入到环境中时,活性微生物菌株的群被配置来选择性地改变此环境的特性或特征。对于一些具体实施,第一样品集的至少一种共同的或相关的环境因子的至少一种测量的标记不同于第二样品集的至少一种共同的或相关的环境因子的测量的标记。例如,如果所述样品/样品集来自奶牛,则第一样品集可来自以草饮食饲喂的奶牛,而第二样品集可来自以玉米饮食饲喂的奶牛。虽然一个样品集可以是单一样品,但是它可替代地是多个样品,并且样品集内的每个样品的至少一种共同的或相关的环境因子的测量的标记是基本上相似的(例如,一个集中的样品均取自草饲喂的畜群),并且一个样品集的平均测量的标记不同于来自另一个样品集的平均测量的标记(第一样品集来自草饲喂的畜群,并且第二样品集是来自玉米饲喂的畜群的样品)。可能存在在分析中考虑的额外的差异和相似性,诸如差别品种、差别饮食、差别性能、差别年龄、差别饲料添加剂、差别生长阶段、差别生理特征、差别健康状态、差别提高、差别环境温度、差别季节、不同抗生素等。虽然在一些实施方案中,每个样品集包括多个样品,并且第一样品集从第一群体采集并且第二样品集从第二群体采集,但是在额外的或可替代的实施方案中,每个样品集包括多个样品,并且第一样品在第一时间处从第一群体采集并且第二样品集在不同于第一时间的第二时间处从第一群体采集。例如,第一样品集可在第一时间处取自牛畜群,此时它们以草饲喂,并且第二样品集在第二时间处(例如,2个月后)获取,其中畜群在获取第一样品集之后马上转换至玉米饲料。在此类实施方案中,可采集样品并且关于群体实施的分析和/或可包括对个体动物的特定参考,使得可识别在一段时间内个体动物发生的变化,并且提供更细的数据粒度水平。

  在一些实施方案中,至少一种共同的或相关的环境因子包括营养物质信息、膳食信息、动物特征、感染信息、健康状态、和/或类似因子。

  所述至少一种测量的标记可包括样品pH、样品温度、脂肪丰度、蛋白质丰度、碳水化合物丰度、矿物质丰度、维生素丰度、天然产物丰度、指定化合物丰度、样品来源的体重、样品来源的饲料摄入、样品来源的重量增加、样品来源的饲料效率、一种或多种病原体的存在或不存在、样品来源的物理特征或测量、样品来源的产生特征、由样品来源产生的乳液中的乳清蛋白的丰度、由样品来源产生的酪蛋白的丰度、和/或由样品来源产生的乳液中的脂肪的丰度、或其组合。

  根据所述实施方案,测量每个样品中的独特的第一标记物的数量可包括测量独特的基因组DNA标记物的数量、测量独特的RNA标记物的数量、和/或测量独特的蛋白标记物的数量。多种微生物类型可包括一种或多种细菌、古生菌、真菌、原生动物、植物、其他真核生物、病毒、类病毒、或其组合。

  在一些实施方案中,确定每个样品中的微生物类型中的每一种的绝对数量包括将样品或其部分经受测序、离心、光学显微镜检查术、荧光显微镜检查术、染色法、质谱法、微流体、定量聚合酶链反应(qPCR)、凝胶电泳和/或流式细胞术。在一些实施方案中,一种或多种活性微生物菌株是一种或多种微生物类型的亚分类单元,所述一种或多种微生物类型选自一种或多种细菌、古生菌、真菌、原生动物、植物、其他真核生物、病毒、类病毒、或其组合。在一些实施方案中,一种或多种活性微生物菌株是一种或多种细菌菌株、古生菌菌株、真菌菌株、原生动物菌株、植物菌株、其他真核生物菌株、病毒菌株、类病毒菌株、或其组合。在一些实施方案中,一种或多种活性微生物菌株是一种或多种细菌物种或亚种。在一些实施方案中,一种或多种活性微生物菌株是一种或多种真菌物种或亚种。

  在一些实施方案中,至少一种独特的第一标记物包括系统发育标记物,所述系统发育标记物包含5S核糖体亚基基因、16S核糖体亚基基因、23S核糖体亚基基因、5.8S核糖体亚基基因、18S核糖体亚基基因、28S核糖体亚基基因、细胞色素c氧化酶亚基基因、β-微管蛋白基因、延长因子基因、RNA聚合酶亚基基因、内部转录间隔区(ITS)、或其组合。

  在一些实施方案中,测量独特的第一标记物的数量及其量包括将来自每个样品的基因组DNA经受高通量测序反应和/或将来自每个样品的基因组DNA经受元基因组测序。在一些具体实施中,独特的第一标记物可以是mRNA标记物、siRNA标记物或核糖体RNA标记物。在一些具体实施中,独特的第一标记物可包括σ因子、转录因子、核苷相关蛋白、代谢酶、或其组合。

  在一些实施方案中,测量一种或多种独特的第二标记物的表达水平包括将每个样品中的mRNA经受基因表达分析,并且在一些具体实施中,基因表达分析包括测序反应。在一些具体实施中,所述基因表达分析包括定量聚合酶链反应(qPCR)、元转录组测序和/或转录组测序。

  在一些实施方案中,测量一种或多种独特的第二标记物的表达水平包括将每个样品或其部分经受质谱法分析、元核糖体作图和/或核糖体作图。

  在一些实施方案中,测量至少一种或多种独特的第二标记物的表达水平包括将每个样品或其部分经受元核糖体作图或核糖体作图(Ribo-Seq)(Ingolia、N.T.、S.Ghaemmaghami、J.R.Newman、以及J.S.Weissman.2009.Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling.Science 324:218-223;Ingolia,N.T.2014.Ribosome profiling:new views of translation,from single codons to genome scale.Nat.Rev.Genet.15:205-213)。Ribo-seq是可用于在基因组规模下确定体内蛋白合成的分子技术。此方法直接测量哪些转录物在结合mRNA并与mRNA相互作用时通过足迹处理核糖体有效地翻译。然后处理结合的mRNA区并且经受高通量测序反应。Ribo-seq显示与定量蛋白质组学具有强相关性(Li、G.W.、D.Burkhardt、C.Gross、以及J.S.Weissman.2014.Quantifying absolute protein synthesis rates reveals principles underlying allocation of cellular resources.Cell 157:624-635)。

  样品的来源类型可以是动物、土壤、空气、盐水、淡水、废水污泥、沉淀物、油、植物、农业产品、非根际土壤、土壤根际、植物部分、蔬菜、极端环境、或其组合中的一种。在一些具体实施中,每个样品是消化道和/或瘤胃样品。在一些具体实施中,样品可以是组织样品、血液样品、牙齿样品、汗液样品、指甲样品、皮肤样品、毛发样品、粪便样品、尿液样品、精液样品、黏液样品、唾液样品、肌肉样品、脑样品、组织样品、和/或器官样品。

  根据具体实施,本公开的微生物群可包括两个或更多个基本上纯的微生物或微生物菌株、所需微生物/微生物菌株的混合物,并且还可包括可施用到靶标例如以用于恢复动物的微生物丛的任何额外的组分。根据本公开制备的微生物群可与药剂一起施用以允许允许微生物在靶标环境(例如,动物的肠胃道,其中所述群被配置来抵抗低pH并且在肠胃环境中生长)存活。在一些实施方案中,微生物群可包括增加一种或多种所需微生物或微生物菌株的数量和/或活性的一种或多种药剂,所述菌株在包括在所述群中的微生物/菌株中存在或不存在。此类药剂的非限制性实例包括果糖低聚糖(例如,低聚果糖、菊糖、菊糖类型果聚糖)、低聚半乳糖、氨基酸、醇类、以及其混合物(参见Ramirez-Farias等人2008.Br.J.Nutr.4:1-10和Pool-Zobel和Sauer2007.J.Nutr.137:2580-2584以及增刊,其中的每个出于所有目的以引用的方式整体并入本文)。

  通过本公开的方法识别的微生物菌株可在包括在群中之前进行培养/生长。培养基可用于此生长,并且可包括适于支持微生物生长的任何培养基,通过非限制性实例的方式,其包括天然的或人工的,包括胃泌素补充琼脂、LB培养基、血清、和/或组织培养凝胶。应理解,所述培养基可单独使用或与一种或多种其他培养基组合使用。它还可在添加或不添加外源营养物质的情况下使用。所述培养基可被改进或富含额外的化合物或组分,例如可有助于微生物和/或其菌株的特定组的相互作用和/或选择的组分。例如,可存在抗生素(诸如青霉素)或消毒剂(例如,季铵盐和氧化剂)并且/或者可改进物理条件(诸如盐度、营养物质(例如有机和无机矿物质(诸如磷、含氮盐、氨、钾和微量营养物,诸如钴和镁))、pH和/或温度)。

  如上所述,系统和设备可根据本公开配置,并且在一些实施方案中可包括处理器和存储器,存储器存储处理器可读/可发布指令来实施所述方法。在一个实施方案中,系统和/或设备被配置来实施所述方法。还公开所述方法的处理器具体实施,如参考图3A所讨论的。例如,处理器实施的方法可包括:从共享至少一种共同的特征并且具有至少一种不同的特征的至少两个样品接收样品数据;针对每个样品,确定每个样品中的一种或多种微生物类型的存在;确定每个样品中的一种或多种微生物类型的每种所检测的微生物类型的细胞的数量;确定每个样品中的独特的第一标记物的数量及其量,每种独特的第一标记物是微生物菌株的标记物;通过一个或多个处理器整合每种微生物类型的数量和第一标记物的数量以得出存在于每个样品中的每种微生物菌株的绝对细胞计数;基于每种微生物菌株的至少一种独特的第二标记物的测量值超过指定阈值确定每个样品中的每种微生物菌株的活性水平,如果微生物菌株的至少一种独特的第二标记物的测量值超过对应的阈值,则此菌株被识别为活性的;通过所确定的活性过滤每种微生物菌株的绝对细胞计数以提供至少两个样品中的每个的活性微生物菌株及其相应的绝对细胞计数的列表;通过一个或多个处理器分析至少两个样品中的每个的活性微生物菌株的所过滤的绝对计数与至少两个样品中的每个的至少一种测量的元数据或额外的活性微生物菌株,并且基于功能、预测功能和/或化学对活性微生物菌株进行归类;基于所述归类识别多种活性微生物菌株;以及输出识别的多种活性微生物菌株以用于会集被配置来当施加到靶标时改变靶标的对应于至少一种测量的元数据的特性的活性微生物群。在一些实施方案中,输出可在合成的和/或转基因的微生物和微生物菌株的生成、合成、评估、和/或测试中利用。一些实施方案可包括存储用于实施所述方法和/或有利于所述方法的执行的指令的处理器可读非暂态计算机可读介质。在一些实施方案中,根据本公开的分析和筛选方法、设备和系统可用于识别产生问题的微生物和菌株,诸如病原体,如在以下实施例4中所讨论的。在此类情况下,已知症状元数据(诸如病灶分数)将用于样品的网络分析。

  预期本文所述的系统和方法可通过软件(存储在存储器中和/或在硬件上执行)、硬件或其组合来实施。硬件部件和/或模块可包括例如通用处理器、现场可编程门阵列(FPGA)、和/或专用集成电路(ASIC)。软件部件和/或模块(在硬件上执行)可以各种软件语言(例如,计算机代码)表达,包括Unix utilities、C、C++、JavaTM、JavaScript(例如,ECMAScript 6)、Ruby、SQL、R编程语言/软件环境、Visual BasicTM、以及其他面向对象的、程序的或其他编程语言和发展工具。计算机代码的实例包括但不限于微代码或微指令、机器指令(诸如编译器产生的)、用于产生web服务的代码、以及包含由计算机使用翻译器执行的较高级指令的文件。计算机代码的额外实例包括但不限于控制信号、加密代码和压缩代码。

  本文所述的一些实施方案涉及具有非暂态计算机可读介质(还可称为非暂态处理器可读介质或存储器)的装置,所述装置上具有用于执行各种计算机实施的操作的指令或计算机代码。计算机可读介质(或处理器可读介质)在其本身不包括暂态传播信号(例如,在传输介质(诸如空间或电缆)上携带信息的传播电磁波)的意义上而言是非暂态的。所述介质和计算机代码(还可称为代码)可以是设计并构造用于特定目的或多种目的的那些代码。非暂态计算机可读介质的实例包括但不限于:磁存储介质,诸如硬盘、软盘和磁盘;光学存储介质,诸如压缩盘/数字视频盘(CD/DVD)、压缩盘-只读存储器(CD-ROM)和全息装置;磁光存储介质,诸如光盘;载波信号处理部件和/或模块;以及专门被配置来存储和执行程序代码的硬件装置,诸如专用集成电路(ASIC)、可编程逻辑装置(PLD)、只读存储器(ROM)以及随机存取存储器(RAM)装置。本文所述的其他实施方案涉及一种计算机程序产品,其可包括例如本文所讨论的指令和/或计算机代码。

  虽然以上已描述了图3A的各种实施方案,但是应理解,所述实施方案通过以举例的方式呈现而不具有限制性。虽然以上所述的方法和步骤指示某些事件以一定顺序发生,但是某些步骤的排序可修改。另外,某些步骤在可能的情况下可在并行过程中同时实施,以及如上所述依序实施。虽然各种实施方案已描述为具有特定特征和/或部件的组合,但是具有来自本文所述的任何实施方案的任何特征和/或部件的任何组合或子组合的其他实施方案是可能的。此外,虽然各种实施方案描述为具有与特定计算装置相关联的特定实体,但是在其他实施方案中,不同的实体可与其他和/或不同计算装置相关联。

  实验数据和实施例

  本发明性公开参考以下实验数据和实施例来进一步说明。然而应注意,这些实验数据和实施例与以上所述的实施方案一样是说明性的并且不应解释为以任何方式限制所公开的发明的范围。

  实施例1

  参考在图2处提供的步骤。

  2000:从基质剪切下来自奶牛瘤胃样品的细胞。这可经由通过超声处理或涡旋剧烈共混或混合样品接着进行差速离心以用于从细胞去除基质来进行。离心可包括使用Nycodenz或Percoll的梯度离心步骤。

  2001:使用靶向特定生物体类型的荧光染料对生物体进行染色。使用流式细胞术基于染色特性和大小辨别不同群体。

  2002:通过例如流式细胞术确定样品中的生物体的绝对数量。此步骤得出关于在给定体积中有多少生物体类型(诸如细菌、古生菌、真菌、病毒或原生生物)的信息。

  2003:获得奶牛瘤胃样品并且通过珠振动直接使附着到基质的细胞裂解。对总核酸进行纯化。使用RNA酶处理总纯化的核酸以获得纯化的基因组DNA(gDNA)。使用qPCR同时使来自大量gDNA的特定标记物扩增并且使测序适配子和条码附接到每种标记物。在指数级扩增开始时停止qPCR反应以使PCR相关偏差最小化。集中样品并且使用Illumina Miseq在集中的样品上实施复用测序。

  2004:通过珠振动直接使附着到基质的来自奶牛瘤胃样品的细胞裂解。使用基于柱的途径对总核酸进行纯化。使用RNA酶处理总纯化的核酸以获得纯化的RNA。使用逆转录酶将总RNA转化为cDNA。使用qPCR同时使来自大量cDNA的特定标记物扩增并且使测序适配子和条码附接到每种标记物。在指数级扩增开始时停止qPCR反应以使PCR相关偏差最小化。集中样品并且使用Illumina Miseq在集中的样品上实施复用测序。

  2005:通过去除低质量碱基对和截短的读取处理测序输出(fastq文件)。使用定制的UPARSE流水线分析基于DNA的数据集,并且将测序读取匹配到现有的数据库条目以识别群体内的菌株。将独特序列添加到数据库。使用定制的UPARSE流水线分析基于RNA的数据库。使用更新的数据库识别活性菌株。

  2006:使用在先前步骤(2005)中获得的菌株统一性数据,确定表示每种菌株的读取的数量并且表示为总读取的百分比。所述百分比乘以细胞的计数(2002)以计算样品和给定体积中的每种生物体类型的绝对细胞计数。使用存在于基于RNA的数据集中的标记物序列连同适当的阈值在绝对细胞计数数据集内识别活性菌株。将未达到阈值的菌株从分析去除。

  2007:重复2003-2006以建立表示多个奶牛瘤胃内的微生物群体的动态学的时程。编译时间数据并且将每个样品的每种活性生物体菌株的细胞数量和元数据存储在量或丰度矩阵中。使用量矩阵来使用以量数据加权的规则挖掘途径识别特定时间点样品中的活性菌株之间的关联。应用过滤器以去除不显著的规则。

  2008:计算活性菌株随时间的细胞数量变化,从而指出变化的方向性(即,负值代表降低,正值代表增加)。将矩阵表示为网络,其中生物体菌株表示节点并且量加权规则表示边缘。运用马尔可夫链和随机游动以确定节点之间的连通性并且限定聚类。使用元数据过滤聚类以便识别与合乎需要的元数据(环境参数)相关联的聚类。通过整合随时间的细胞数量变化和存在于靶标聚类中的菌株对靶标生物体菌株进行排名,其中最大的细胞数量变化排名最高。

  实施例2

  实验设计和材料和方法

  目的:确定影响奶牛中的乳脂产生的瘤胃微生物群落组分。

  动物:将八只泌乳的、瘤胃插管的Holstein奶牛圈养在用于所述实验的个体畜舍中。奶牛每天两次饲喂,每天两次挤奶,并且连续获得淡水。由于由实验之前的流产引发的并发症,在第一次膳食乳脂降低之后将一头奶牛(奶牛1)从研究去除。

  实验设计和处理:所述实验使用具有2个组和1个实验周期的交叉设计。实验周期持续38天:10天用于共变/冲洗期并且28天用于数据采集和采样。数据采集期由10天膳食乳脂降低(MFD)和18天恢复组成。在第一实验周期之后,所有奶牛经历10天冲洗期,之后开始周期2。

  使用具有高淀粉可降解性(70%可降解)和高多不饱和脂肪酸水平(PUFA,3.7%)的低纤维(29%NDF)总混合配给量(TMR)诱导膳食MFD。恢复阶段包括淀粉可降解性可变的两种饮食。将四头奶牛随机分配到高纤维(37%NDF)、低PUFA(2.6%)和高淀粉可降解性(70%可降解)的恢复饮食。对剩余的四头奶牛饲喂高纤维(37%NDF)、低PUFA(2.6%)但是低淀粉可降解性(35%)的恢复饮食。

  在10天共变和10天冲洗期期间,对奶牛饲喂高纤维、低PUFA和低淀粉可降解性饮食。

  样品和测量:在整个共变、清洗和样品采集期中,针对每只动物每天测量乳液产率、干物质摄入和饲料效率。针对营养物质组成测量TMR样品。在采集期期间,采集乳液样品并且每3天一次进行分析。针对乳液成分浓度(乳脂、乳蛋白、乳糖、乳液尿素氮、体细胞计数、以及固态物)和脂肪酸组成分析样品。

  采集瘤胃样品并且在采集期期间针对微生物群落组成和活性每3天一次进行分析。在第0天、第7天和第10天膳食MFD期间,在饲喂之后0小时、2小时、4小时、6小时、8小时、10小时、12小时、14小时、16小时、18小时、20小时、和22小时对瘤胃进行充分采样。相似地,在恢复期期间,在第16天和第28天饲喂之后0小时、2小时、4小时、6小时、8小时、10小时、12小时、14小时、16小时、18小时、20小时、和22小时对瘤胃进行充分采样。针对pH、乙酸盐浓度、丁酸盐浓度、丙酸盐浓度、异酸浓度、以及长链和CLA异构体浓度分析瘤胃含量。

  瘤胃样品制备和测序:在采集之后,在4℃下在摆动斗式离心机中在4,000rpm下对瘤胃样品进行离心20分钟。滗出上清液并且将等分试样的每个瘤胃含量样品(1-2mg)添加到预填充有0.1mm玻璃珠的无菌1.7mL管。采集第二等分试样并且存储在空的无菌1.7mL管中以用于细胞计数。

  使用珠振动匀化具有玻璃珠的瘤胃样品(第1等分试样)以使微生物裂解。提取DNA和RNA并且从每个样品纯化,并且准备用于在Illumina Miseq上进行测序。使用配对端部化学对样品进行测序,在文库的每个端部上测序300个碱基对。对空管中的瘤胃样品(第2等分试样)进行染色并且放置通过流式细胞仪以定量每个样品中的每种微生物类型的细胞的数量。

  测序读取处理和数据分析:对测序读取进行质量修整和处理以基于标记物基因识别存在于瘤胃中的细菌物种。将计数数据集和活性数据集与测序读取整合以确定瘤胃微生物群落内的活性微生物物种的绝对细胞数量。使用交互信息将奶牛随时间的产生特征(包括产生的乳液的磅数)与每个样品内的活性微生物随实验过程的分布关联起来。计算产生的乳脂的磅数与每种活性微生物的绝对细胞计数之间的最大信息系数(MIC)分数。通过MIC分数对微生物进行排名,并且将具有最高MIC分数的微生物选择为与产生的乳液的磅数最相关的靶标物种。

  通过省略来自测序分析的适当数据集运行确定计数数据、活性数据以及计数和活性对于最终输出的影响的测试事例。为了评定使用线性相关而非MIC对于靶标选择的影响,还针对与所有微生物的相对丰度和活性微生物的绝对细胞计数相比的产生的乳脂的磅数计算皮尔逊系数(Pearson’s coefficients)。

  结果和讨论

  相对丰度相对于绝对细胞计数

  基于MIC分数,针对包括细胞计数数据(绝对细胞计数,表2)的数据集和针对不包括细胞计数数据(相对丰度,表1)的数据集识别前15种靶标物种。在此分析中不使用活性数据以便隔离细胞计数数据对于最终靶标选择的影响。最后,前8种靶标在两个数据集之间是相同的。在剩余的7种中,5种菌株以变化的顺序呈现在两个列表上。虽然这5种菌株的排名有差异,但是针对每种菌株计算的MIC分数在两个列表之间是相同的。存在于绝对细胞计数列表但是不存在于相对丰度列表上的两种菌株ascus_111和ascus_288在相对丰度列表上分别排名91和排名16。存在于相对丰度列表但是不存在于绝对细胞计数列表上的两种菌株ascus_102和ascus_252在绝对细胞计数列表上分别排名50和排名19。这4种菌株在每个列表上确实具有不同的MIC分数,从而解释其排名变化和对于列表中的其他菌株的后续影响。

  表1:使用不具有活性过滤的相对丰度的前15种靶标菌株

  表2:使用不具有活性过滤的绝对细胞计数的前15种靶标菌株

  细胞计数数据的整合并不总是影响分配到每种菌株的最终MIC分数。这可归因于以下事实:虽然微生物群体每天并且在38天实验的过程中在瘤胃内变化,但是它总是在107-108个细胞/毫升内。群体数量的远远更大的变化无疑将对于最终MIC分数具有更广泛的影响。

  非活性物种相对于活性物种

  为了基于活性数据评定过滤菌株的影响,从运用具有(表3)和不具有(表1)活性数据的相对丰度的数据集以及运用具有(表4)和不具有(表2)活性数据的绝对细胞计数的数据集识别靶标物种。

  对于相对丰度事例,在应用活性数据之前,ascus_126、ascus_1366、ascus_1780、ascus_299、ascus_1139、ascus_127、ascus_341、以及ascus_252被认为是靶标菌株。在整合活性数据之后,这8种菌株(初始前15个靶标中的53%)落至低于排名15。对于绝对细胞计数事例观察到相似的趋势。在活性数据集整合之后,Ascus_126、ascus_1366、ascus_1780、ascus_299、ascus_1139、ascus_127、以及ascus_341(初始前15个靶标中的46%)落至低于排名15。

  活性数据集比细胞计数数据集对于靶标排名和选择具有远远更严重的影响。当将这些数据集整合在一起时,如果发现样品是非活性的,则其基本上变为“0”并且不被认为是分析的一部分。由此,样品内的点分布可在整合之后极大地改变或偏斜,这进而大大地影响最终MIC分数并且因此影响靶标微生物的排名顺序。

  表3:使用具有活性过滤的相对丰度的前15种靶标菌株

  表4:使用具有活性过滤的绝对细胞计数的前15种靶标菌株

  相对丰度和非活性相对于绝对细胞计数和活性

  最后,在此定义的方法运用细胞计数数据和活性数据两者来识别与相关元数据特征高度关联的微生物。在使用两种方法选择的前15个靶标(表4,表1)内,仅7种菌株存在于两个列表上。八种菌株(53%)对于绝对细胞计数和活性列表是独特的。两个列表上的前3个靶标在菌株以及在排名两个方面均匹配。然而,三分之二在两个列表上均不具有相同的MIC分数,这暗示它们受活性数据集整合影响但不足以打乱其排名顺序。

  线性相关相对于非参数途径

  计算产生的乳脂的磅数与每个样品内的活性微生物的绝对细胞计数之间的皮尔逊系数和MIC分数(表5)。通过MIC(表5a)或皮尔逊系数(表5b)对菌株进行排名以选择与乳脂产生最相关的靶标菌株。在每个事例中报告MIC分数和皮尔逊系数两者。六种菌株存在于两个列表上,这意味着使用MIC途径识别九种(60%)独特的菌株。两个列表之间的菌株的排名顺序不匹配-通过每种方法识别的前3种靶标菌株也是独特的。

  与皮尔逊系数一样,MIC分数报告在0至1的范围内,其中1暗示两个变量之间非常紧密的关系。在此,前15个靶标表现出范围是0.97-0.74的MIC分数。然而,相关性测试事例的皮尔逊系数的范围是0.53至0.45-基本上低于交互信息测试事例。此差值可能是由于每种分析方法固有的差异引起的。相关是测量线周围的点的分散的线性估计,而交互信息运用概率分布并且测量两个分布之间的相似性。在实验的过程中,产生的乳脂的磅数非线性地变化(图4)。此特定函数通过交互信息比相关可更好地表示和接近。为了调查这一点,分别对使用相关和交互信息识别的前靶标菌株Ascus_713(图5)和Ascus_7(图6)进行绘制以确定每种方法预测菌株与乳脂之间的关系的准确程度。如果两个变量表现出强相关性,则它们在针对彼此绘制时由具有很少至没有点分散的线表示。在图5中,Ascus_713与乳脂弱相关,如由点的广泛散布所指示的。交互信息同样测量两个点分布的相似程度。当Ascus_7与乳脂一起绘制时(图6),明显的是,两个点分布非常相似。

  整体的现在方法相对于常规途径

  分析微生物群落的常规途径依赖于使用不并入活性信息的相对丰度数据,并且最后以微生物物种与元数据的简单相关结束(参见,例如,美国专利号9,206,680,其出于所有目的以引用的方式整体并入本文)。在此,已示出并入每个数据集如何递增地影响最终靶标列表。当整体应用时,与常规方法相比,本文所述的方法选择完全不同的靶标集(表5a和表5c)。将使用常规途径选择的前靶标菌株Ascus_3038针对乳脂进行绘制以对相关性强度进行可视化(图7)。与先前实施例一样,Ascus_3038也表现出与乳脂的弱相关性。

  表5:使用交互信息或相关的前15种靶标菌株

  表5a.使用具有活性过滤的绝对细胞计数的MIC

  表5b.使用具有活性过滤的绝对细胞计数的相关

  表5c.使用不具有活性过滤的相对丰度的相关

  实施例3

  增加奶牛的总乳脂、乳蛋白和能量校正的乳液(ECM)

  实施例3示出目标在于增加由泌乳的反刍动物产生的乳脂和乳蛋白以及计算的ECM的总量的特定具体实施。如本文所用,ECM表示基于乳液体积、乳脂和乳蛋白的乳液中的能量的量。ECM将乳液组分调整至3.5%脂肪和3.2%蛋白质,从而使动物性能均衡并且允许比较随时间在个体动物和畜群水平下的产生。与本公开相关的用于计算ECM的等式是:

  ECM=(0.327x乳液磅数)+(12.95x脂肪磅数)+(7.2x蛋白质磅数)

  应用本文呈现的方法学、利用识别活性互相关微生物/微生物菌株的所公开的方法以及根据其生成微生物群证明增加由泌乳的反刍动物产生的乳脂和乳蛋白的总量。实现这些增加而不需要另外添加激素。

  在此实施例中,将包含根据以上公开内容识别和生成的两种分离的微生物Ascusb_X和Ascusf_Y的微生物群在五周时间段内施用到处于中期泌乳阶段的Holstein奶牛。将奶牛随机分配到8头奶牛的2个组中,其中一个组是接受缺少微生物群的缓冲液的对照组。对第二组实验组施用包含Ascusb_X和Ascusf_Y的微生物群,每天一次,持续五周。将每头奶牛圈养在个体围栏中并且自由获得饲料和水。所述饮食是高乳液产率饮食。对奶牛进行随意饲喂并且在当天结束时对饲料进行称重,并且对前一天残余物进行称重并舍弃。使用来自Salter Brecknell(Fairmont,MN)的PS-2000称具实施称重。

  对奶牛进行插管使得插管可延伸到奶牛的瘤胃中。插管之后还为奶牛提供至少10天的恢复,之后施用对照剂量或实验剂量。

  对对照组的施用由20ml的中性缓冲盐水组成,而对实验组的施用由悬浮在20mL的中性缓冲盐水中的大约109个细胞组成。对照组每天一次接受20ml的盐水,而实验组接受还包含所述微生物群的109个微生物细胞的20ml的盐水。

  在第0天、第7天、第14天、第21天和第35天对每头牛的瘤胃进行采样,其中第0天是微生物施用之前的一天。应注意实验施用和对照施用在当天对瘤胃进行采样之后实施。在第0天开始,使用来自Hanna Instruments(Woonsocket,RI)的pH计,将瘤胃的每日采样插入到采集的瘤胃流体中以用于记录。瘤胃采样包括通过插管进行的来自瘤胃的中心、背部、腹部、前部、以及后部区域的粒状采样和流体采样两者,并且将全部五个样品集中到含有1.5ml的终止溶液(95%乙醇,5%苯酚)的15ml锥形小瓶中。还在每个采样日采集粪便样品,其中使用触诊套管从瘤胃采集粪便。在每次采样的时间对奶牛进行称重。

  将粪便样品放置在2盎司小瓶中,冷冻存储并且进行分析以确定表观中性洗涤剂纤维(NDF)可消化性、表观淀粉可消化性和表观蛋白可消化性的值。瘤胃采样由对瘤胃的流体部分和粒状部分的采样两者组成,其中的每个存储在15ml锥形管中。将细胞使用10%终止溶液(5%苯酚/95%乙醇混合物)固定并且保持在4℃下并且在冰上运输到Ascus Biosciences(San Diego,California)。

  每天两次测量乳液产率,早上一次并且晚上一次。每天两次测量乳液组成(脂肪%和蛋白质%等),早上一次并且晚上一次。在Tulare乳牛畜群改良协会(DHIA)(Tulare,California)处,还使用近红外光谱法针对蛋白质脂肪、固态物分析乳液样品,针对乳液尿素氮(MUN)进行分析并且进行体细胞计数(SCC)。每天一次确定个体奶牛的饲料摄入和瘤胃pH。

  在适配周期的最后一天采集总混合配给量(TMR)的样品,并且然后每周一次连续采集。使用四分法实施采样,其中将样品存储在运输到Cumberland Valley Analytical Services(Hagerstown,MD)的真空密封袋中并且使用NIR1套件进行分析。施用缓冲液和/或微生物生物群的最后一天是在第35天,然而,所有其他测量和采样继续进行直至第46天,如所描述的。

  图8A证明基于所公开的方法接受微生物群的奶牛表现出相对于仅施用缓冲溶液的奶牛的平均乳脂产生的20.9%增加。图8B证明施用微生物群的奶牛表现出相对于仅施用缓冲溶液的奶牛的平均乳蛋白产生的20.7%增加。图8C证明施用微生物群的奶牛表现出平均能量校正乳液产生的19.4%增加。在施用所述群中断之后,图8A-图8C中所看到的增加变得较不明显,如贯穿数据点的竖直线所描述的。

  实施例4

  作为肉仔鸡中的病灶形成的成因剂的产气荚膜梭菌的检测

  使用各种水平的产气荚膜梭菌(Clostridium perfringens)攻击160只雄性Cobb 500(表6a)。对其进行养殖21天、处死并且进行病灶评分以定量坏死性肠炎的进展和产气荚膜梭菌的影响。

  表6a

  实验设计

  将雏鸡圈养在呈木制地面围栏形式(~4’×4’减去2.25平方英尺的饲槽空间)的环境受控的设施内,其提供地面空间&[~0.69英尺2/雏鸡]的雏鸡密度、温度、照明、饲槽以及水。将雏鸡放置在含有适当深度的木屑的干净围栏中以便为鸡提供舒适的环境。如果在研究期间围栏对于测试雏鸡的舒适条件变得过于潮湿,则向围栏添加额外的切屑。照明通过白炽光灯进行并且如下使用商业照明程序。

  表6b

  雏鸡的环境条件(即,雏鸡密度、温度、照明、饲槽以及水空间)与所有处理组的相似。为了防止围栏之间的雏鸡迁移和细菌扩散,每个围栏具有围栏之间的大约24英寸高的固体(塑料)间隔物。

  疫苗和治疗性药品:

  在孵化场针对Mareks对雏鸡进行接种。接受(研究第0天)之后,通过喷涂施加针对新城病(Newcastle)和传染性支气管炎对雏鸡进行接种。疫苗制造商、批号和失效期的文档与最终报告一起提供。

  水:

  在整个研究中通过每个围栏一个Plasson饮水器随意提供水。饮水器按需要每天两次检查并清理以保证对雏鸡的清洁且恒定的水供应。

  饲料:

  在整个研究中通过每个围栏一个悬挂的~17英寸直径管饲槽随意提供饲料。在大约前4天将鸡饲槽托盘放置在每个围栏中。根据实验设计,在接受(第0天)之后,将雏鸡放置在其相应的处理饮食上。对从第0天至研究结束的添加的和从围栏去除的饲料进行称重和记录。

  每日观察:

  针对整体鸡群状态、照明、水、饲料、通风以及未预料到的事件至少每天两次观察测试设施、围栏和雏鸡。如果在每天两次观察中的任一次注意到异常状态或异常行为,则对其进行记载并且文档与研究记录一起包括在内。每天一次记录测试设施的最小-最大温度。

  围栏卡:

  每个围栏附接2张卡。一张卡识别围栏编号并且另一张代表处理编号。

  动物处理:

  将动物保持在存活力的理想条件下。动物以减少损伤和不必要的压迫的方式处理。严格执行人性化措施。

  兽医护理、干预和安乐死:

  根据地点SOP,将发展与测试程序不相关的临床上显著的并发疾病的雏鸡按照研究调查员或指定者的判断从研究去除并且进行安乐死。另外,在地点兽医或合格的技术人员授权之后,也对濒死的或受伤的雏鸡进行安乐死。记载任何抽取的原因。如果动物死亡,或因为人道原因而去除并进行安乐死,则将其记录在围栏的死亡表上,并且实施并提交尸检以记载去除的原因。

  如果研究调查员认为安乐死是必要的,则通过颈椎脱位法对动物进行安乐死。

  死亡和淘汰:

  在研究第0天开始,对发现死亡或去除并处死的任何雏鸡进行称重和尸检。对无法触及饲料或水的淘汰雏鸡进行处死、称重和记载。在围栏死亡记录上记录重量和可能的死因以及尸检发现。

  体重和饲料摄入:

  在大约第14天和第21天,以围栏和个体的方式,对雏鸡进行称重。在研究第14天和第21天对每个围栏中剩余的饲料进行称重并记录。计算第14-21天期间的饲料摄入。

  重量增加和饲料转化:

  在围栏和个体基础上对每个称重日的平均雏鸡重量进行汇总。使用围栏的总饲料消耗除以存活雏鸡的总重量在研究第21天(即,第0-21天)计算平均饲料转化。使用每个围栏中的总饲料消耗除以存活雏鸡的总重量和死亡或从此围栏去除的雏鸡的重量计算调整的饲料转化。

  产气荚膜梭菌攻击

  施用方法:

  通过饲喂施用此研究中的产气荚膜梭菌(CL-15、类型A、α和β2毒素)培养物。使用来自每个围栏的饲槽的饲料与所述培养物混合。在将培养物放置在围栏中之前,将处理饲料从雏鸡去除大约4-8小时。对于每个围栏的雏鸡,将在大约2.0–9.0X108cfu/ml的浓度下的基于研究设计的固定量的肉汤培养物与饲槽托盘中的固定量的饲料(~25g/雏鸡)混合,并且所有攻击的围栏以相同的方式处理。大多数培养物-饲料在1-2小时内被消耗。使得所有处理中的雏鸡以相似的方式处理,未攻击的组也在与攻击组相同的时间段期间使饲料去除。

  梭菌攻击:

  将产气荚膜梭菌培养物(CL-15)在~37℃下在含有淀粉的流体巯基乙酸盐培养基中生长~5小时。CL-15是来自Colorado的肉仔鸡爆发的产气荚膜梭菌的现场菌株。制备新鲜肉汤培养物并且每天使用。对于每个围栏的雏鸡,将固定量的过夜肉汤培养物与饲槽托盘中的固定量的处理饲料混合(参见施用)。将饲料的量、培养物接种物的体积和定量、以及投配天数的数量记载在最终报告中,并且所有围栏以相同的方式处理。雏鸡接受产气荚膜梭菌培养物一天(研究第17天)。

  采集的数据:

  -使用根据本公开的Ascus平台方法分析的肠含量。

  -在大约第14天和第21天的以围栏和个体方式的雏鸡重量和以围栏方式的饲料效率。

  -从第0天至研究结束添加的和从每个围栏去除的饲料量。

  -死亡:第0天至研究结束的性别、重量和可能的死因。

  -去除的雏鸡:第0天至研究结束的淘汰原因、性别和重量。

  -设施和雏鸡的每日观察,每日设施温度。

  -大约第21天的5只雏鸡/围栏的病灶分数

  病灶评分:

  在上一次产气荚膜梭菌培养物施用之后四天,通过抓到第一支雏鸡、处死并且针对坏死性肠炎对肠病灶进行评分的方式从每个围栏随机选择五只雏鸡。病灶评分如下:

  -0=正常:没有NE病灶,小肠具有正常弹性(打开之后卷回正常位置)

  -1=轻微:小肠壁薄且松弛(打开时保持平坦并且打开之后不卷回正常位置);过量黏液覆盖黏膜

  -2=中度:可觉察到的小肠壁发红和肿胀;肠膜的微小溃疡和坏死;过量黏液

  -3=严重:小肠膜的广泛面积的坏死和溃疡;显著出血;黏膜上的血纤维蛋白层和坏死碎片(土耳其式毛巾外观)

  -4=死亡或濒死:可能在24小时内死亡并且具有2或更大NE病灶分数的雏鸡

  结果

  使用以上所公开的方法(例如,如参考图1A、图1B和图2以及在整个说明书中所讨论的)以及常规相关途径(如以上所讨论的)分析结果。针对每只雏鸡的小肠含量确定菌株水平微生物丰度和活性,并且参考两种不同的雏鸡特征分析这些图谱:个体病灶分数和围栏的平均病灶分数。

  在个体病灶分数分析中使用37只雏鸡-虽然对40只雏鸡进行评分,但是仅37只具有用于分析的足够的小肠物质。将相同的测序读取和相同的测序分析流水线用于本公开的Ascus途径和常规途径两者。然而,Ascus途径也整合活性信息以及每个样品的细胞计数信息,如早前详述的。

  使用Ascus交互信息途径来对活性菌株的丰度与37只肉仔鸡的个体病灶分数之间的关系进行评分。针对常规途径计算菌株与37只肉仔鸡的个体病灶分数之间的皮尔逊相关性。通过针对从样品池识别的生物体列表进行的总体比对搜索确认成因菌株产气荚膜梭菌。然后根据每种分析方法的输出识别此特定菌株的排名。Ascus途径将实验中施用的产气荚膜梭菌识别为与个体病灶分数关联的第一位菌株。常规途径将此菌株识别为与个体病灶分数关联的第26位菌株。

  在平均病灶分数分析中使用102只雏鸡。如在先前事例中的,将相同的测序读取和相同的测序分析流水线用于Ascus途径和常规途径两者。同样,Ascus途径也整合活性信息以及每个样品的细胞计数信息。

  使用Ascus交互信息途径来对活性菌株的丰度与每个围栏的平均病灶分数之间的关系进行评分。针对常规途径计算菌株与每个围栏的平均病灶分数之间的皮尔逊相关性。通过针对从样品池识别的生物体列表进行的总体比对确认成因菌株产气荚膜梭菌。然后根据每种分析方法的输出识别此特定菌株的排名。Ascus途径将实验中施用的产气荚膜梭菌识别为与围栏的平均病灶分数关联的第4位菌株。常规途径将产气荚膜梭菌识别为与围栏的平均病灶分数关联的第15位菌株。由于大量/平均测量掩盖的产气荚膜梭菌感染的可变水平,围栏的平均病灶分数是比个体病灶分数更不准确的测量。当将个体病灶分数分析与平均围栏病灶分数分析进行比较时,预期排名下降。采集的元数据在以下提供

  表7

  实施例5

  使用与基于相关性的途径相比的基于交互信息的途径检测复杂微生物群落的关系的能力

  在乳脂降低发作期间通过插管从三头中期泌乳的Holstein奶牛采集一系列瘤胃样品。在第0天、第7天、第10天、第16天和第28天在早上4点采集瘤胃样品。根据从瘤胃含量纯化的DNA制备测序文库并且进行测序。

  使用原始测序读取识别存在于样品池中的所有微生物菌株-在样品池中识别到4,729种独特的菌株。然后计算每种微生物菌株的相对丰度并且用于随后的分析。

  表8a

  在每个时间点处由每个动物产生的乳脂的测量的磅数在表8a中给出。通过取乳脂值并且减去1来创建用于此分析中的模拟菌株,以便确保模拟菌株和乳脂值随时间趋势相同,即模拟菌株与乳脂值之间存在已知的线性趋势/关系。然后将此模拟菌株添加到在群落中先前识别的所有菌株的矩阵中。针对各种条件(以下描述)同时计算产生的乳脂与矩阵内的所有菌株之间的MIC值和皮尔逊系数以建立作为关系预测因子的这些测量值的敏感性和稳健性。

  为了测试所公开的发明性方法相对于传统方法检测关系的能力,逐一去除模拟菌株的数据点(相对丰度设定为0)。在去除每个数据点之后,再计算MIC和皮尔逊系数,并且记录模拟菌株的排名(表8b)。如可看到的,MIC是比皮尔逊系数远远更加稳健的测量值。当没有去除点时,两种方法均将模拟菌株识别为与产生的乳脂的磅数相关的第一位菌株。然而,当去除一个点时,相关法使模拟菌株下降至排名55,并且当去除额外一个点时下降至排名2142。MIC继续将模拟菌株预测为最高排名的菌株,直至去除6个点。

  表8b

  去除点来测试敏感性背后的一个基本原理是当查看靶标组(例如,动物)的微生物时,存在对于其中的所有是共同的特定菌株,所述菌株可称为核心微生物。此组可表示特定靶标(例如,特定动物)的微生物群体的少数部分,并且可存在仅存在于靶标/动物的子集/小部分中的整个单独的菌株群体。在一些实施方案中,更独特的菌株(即,所有动物中均不存在的那些菌株)可以是具有特定关联性的菌株。发展所公开的方法的一些实施方案来解决数据集中的此类“缺口”并且因此特定地靶向相关微生物和菌株。

  实施例6

  改善肉仔鸡的饲料效率的活性微生物菌株的群的选择

  对96只雄性Cobb 500进行养殖21天。针对个体雏鸡确定重量和饲料摄入,并且在处死之后采集盲肠刮样。使用本公开的方法处理盲肠样品以识别当施用到生产环境中的肉仔鸡时增强饲料效率的微生物的群。

  实验设计

  基于膳食处理对120只Cobb 500鸡进行分类并且放置在围栏中。通过从第0-14天的处理将雏鸡放置在地面围栏中。将测试设施分成2个围栏1个区和2个个体笼子每个48个区。使用完全随机区组设计将处理分配到围栏/笼子;围栏/笼子在整个研究中保留其处理。通过数字代码识别处理。将雏鸡随机分配到笼子/围栏。特定处理组如表9中的以下各项。

  表9

  圈养:

  使用计算机程序进行处理到笼子/围栏的分配。计算机生成的分配如下:

  将雏鸡圈养在呈由固体塑料(4’高)构造的具有干净褥草的大混凝土地面围栏(4’x8’)形式的环境受控设施中。在第14天,将96只雏鸡移到在相同的环境受控设施内的笼子中。每个笼子是24”x18”x24”。

  照明通过白炽光灯进行并且使用商业照明程序。每24小时时间段的连续灯光时间如表10中的以下各项。

  表10

  雏鸡的环境条件(即,0.53ft2)、温度、照明、饲槽以及水空间)与所有处理组的相似。

  为了防止雏鸡迁移,检查每个围栏以保证围栏之间不存在大约14英寸高的大于1英寸的开口。

  接种:

  在孵化场针对Mareks对雏鸡进行接种。接受(研究第0天)之后,通过喷涂施加针对新城病(Newcastle)和传染性支气管炎对雏鸡进行接种。疫苗制造商、批号和失效期的文档与最终报告一起提供。

  水:

  在整个研究中随意提供水。地面围栏水通过自动钟式饮水器提供。层架式笼水通过一个乳头饮水嘴提供。饮水器按需要每天两次检查并清理以保证在所有时间对雏鸡的清洁水供应。

  饲料:

  在整个研究中随意提供饲料。地面围栏饲料通过悬挂的~17英寸直径管饲槽提供。层架式笼饲料通过一个9”x4”的饲槽提供。在大约前4天将鸡饲槽托盘放置在每个地面围栏中。

  每日观察:

  针对整体鸡群状态、照明、水、饲料、通风以及未预料到的事件至少每天两次观察测试设施、围栏和雏鸡。每天一次记录测试设施的最小-最大温度。

  死亡和淘汰:

  在研究第0天开始,对发现死亡或去除并处死的任何雏鸡进行尸检。对无法触及饲料或水的淘汰雏鸡进行处死和尸检。在围栏死亡记录上记录可能的死因和尸检发现。

  体重和饲料摄入:

  每天单个地对~96只雏鸡进行称重。从第14-21天每天对每个笼子中剩余的饲料进行称重和记录。每天确定每个笼子的饲料摄入。

  重量增加和饲料转化:

  从第14-21天确定笼子基础上的体重增加和处理基础上的平均体重增加。使用笼子的总饲料消耗除以雏鸡重量计算每天的和第14-21天时间段总体的饲料转化。通过对来自处理内的每个笼子的个体饲料转化进行平均化来确定第14-21天时间段的平均处理饲料转化。

  兽医护理、干预和安乐死:

  使发展显著并发病的动物受损害,并且将其状态可影响研究结果的动物从研究去除并且在进行此确定的时间处进行安乐死。在攻击前六天,将笼子中的所有雏鸡去除并且进行病灶评分。

  采集的数据:

  从第14-21天每天个体方式的雏鸡重量和饲料转化。

  从第0天至研究结束添加的和从地面围栏和笼子去除的饲料量。

  死亡:第0天至研究结束的可能的死因。

  去除的雏鸡:第0天至研究结束的淘汰原因。

  设施和雏鸡的每日观察,每日设施温度。

  第21天来自每只雏鸡的盲肠含量。

  结果

  使用以上所公开的方法(例如,如参考图1A、图1B和图2以及在整个说明书中所讨论的)分析结果。针对每只雏鸡的盲肠含量确定菌株水平微生物丰度和活性。在全部96个肉仔鸡盲肠样品中检测总计22,461种独特的菌株。通过活性阈值过滤每种菌株的绝对细胞计数以创建活性微生物菌株及其相应的绝对细胞计数的列表。平均而言,在处死的时间处在每个肉仔鸡中,仅48.3%的菌株被认为是活性的。在过滤之后,将每个雏鸡中的活性微生物的图谱与各种雏鸡元数据(包括饲料效率、最终体重、以及饮食中沙利霉素的存在/不存在)整合以便选择改善所有这些性状的性能的群。

  使用本公开的交互信息途径来对所有96只雏鸡的活性菌株的绝对细胞计数与性能测量之间的关系以及两种不同活性菌株之间的关系进行评分。在应用阈值之后,4039个元数据-菌株关系被认为是显著的,并且8842个菌株-菌株关系被认为是显著的。然后将通过MIC分数加权的这些链路用作边缘(以元数据和菌株作为节点)来创建网络以用于随后的群落检测分析。将Louvain法群落检测算法应用到所述网络以便将节点归类到子组中。

  Louvain法通过首先将节点从其当前的子组去除并且放置到相邻的子组中来优化网络模块性。如果节点的相邻节点的模块性得到改善,则所述节点重新分配到新的子组中。如果多个组具有改善的模块性,则选择具有最正向变化的子组。针对网络中的每个节点重复此步骤,直至没有进行新的分配为止。下一步骤涉及创建新的粗粒度网络,即所发现的子组变成新的节点。节点之间的边缘通过每个子组内的所有较低水平的节点的总和限定。从此重复第一步骤和第二步骤,直至不可进行更多的模块性优化变化为止。可调查局部最大值(即,在迭代步骤中形成的组)和全局最大值(即,最终分组)以解析总微生物群落内发生的子组,并且识别可能存在的潜在分级结构。

  模块性:

  其中A是元数据-菌株和菌株-菌株关系的矩阵;ki=∑jAij是附接到节点i的总链接权重;并且m=1/2ΣijAij。当节点i和节点j分配到相同的群落时,克罗内克符号δ(ci,cj)是1,否则是0。

  移动节点时模块性的计算变化:

  ΔQ是子组C中模块性的增益。Σin是C中链路的权重的总和,Σtot是C中与节点连接的链路的权重的总和,ki是与节点i连接的链路的权重的总和,ki,in是C中从I到节点的链路的权重的总和,并且m是网络中所有链路的权重的总和。

  使用Louvain群落检测法在鸡微生物群落中检测到五个不同的子组。虽然大量的微生物多样性存在于自然界中,但是存在功能性远远较小的多样性。代谢能力的相似性和重叠产生冗余。对应于相同环境刺激或营养物质的微生物菌株可能趋势相似-这通过本公开的方法捕捉,并且这些微生物最终分组在一起。所得的归类和层级结构基于群落检测分析之后菌株所落入的组展示对于菌株的功能性的预测。

  在完成菌株的归类之后,从样品培养微生物菌株。由于与分离和生长来自异质微生物群落的无病菌培养物相关联的技术困难,通过本公开的方法的活性和关系阈值两者的仅小部分菌株将在实验室环境中无病菌地繁殖。在培养完成之后,基于无病菌培养物是否存在以及菌株所归类到的子组选择微生物菌株的群。群被创建来包含尽可能多的功能性多样性-即,选择菌株使得多种不同范围的子组呈现在所述群中。然后在效力和现场研究中测试这些群以确定菌株群作为产品的效果,并且如果菌株群证明对于生产具有贡献,则所述菌株群可作为产品生产和推销。

  *********

  虽然所公开的发明已参考其特定实施方案进行了描述,但是本领域技术人员应理解,可以进行各种改变以及可进行等效物替换而不脱离所公开的发明的真实精神和范围。另外,可进行许多修改以使特定情况、材料、物质组成、过程、一个或多个过程步骤适于所述发明的目标、精神和范围。所有此类修改意图处于所附权利要求书的范围内。本文所引用的专利、专利应用、专利应用公布、期刊文章以及方案出于所有目的以引用的方式整体并入。

《用于分析来自复杂异质群落的微生物菌株、预测并识别其功能关系和相互作用、以及基于其选择并合成微生物群的方法、设备和系统.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)