欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种微生物多样性文库构建方法及其应用独创技术72051字

一种微生物多样性文库构建方法及其应用

2021-02-07 10:33:41

一种微生物多样性文库构建方法及其应用

  技术领域

  本发明涉及微生物多样性研究领域,特别是涉及一种微生物多样性文库构建方法及其应用。

  背景技术

  微生物的群落结构及多样性和微生物的功能及代谢机理是微生物生态学的研究热点。长期以来,由于受到技术限制,对微生物群落结构和多样性的认识还不全面,对微生物功能及代谢机理方面了解的也很少。近年来测序技术发展迅猛,已成为生物学研究的重要手段。高通量测序技术的兴起,使大规模、低成本研究宏基因组序列以及微生物多样性成为可能。微生物多样性分析是以研究环境中微生物的种类和数量为目的,揭示随环境变化导致微生物群落结构变化的过程。其研究对象广泛,包括土壤、水体、发酵液、植物表面、动物胃肠道、皮肤等。目前常规的鉴定流程为宏基因组提取、利用16S rRNA/18S rRNA/ITS等扩增引物对基因序列进行扩增及测序。探测出环境微生物群落结构随外界环境的改变而发生的极其微弱的变化,对于我们研究微生物与环境的关系、环境治理和微生物资源的利用以及人类医疗健康有着重要的理论和现实意义。

  在国内,微生物多样性的研究涉及农业、土壤、林业、海洋、矿井、人体医学等诸多领域。以在医疗领域的应用为例,通过比较正常和疾病状态下或疾病不同进程中人体微生物群落的结构和功能变化,可以对正常人群与某些疾病患者体内的微生物群体多样性进行比较分析,研究获得人体微生物群落变化同疾病之间的关系;通过深度测序还可以快速地发现和检测常见病原及新发传染病病原微生物。

  目前对于微生物多样性的研究对样本DNA量要求较高,通常需达到ng及以上。样本总量偏低或细胞数较少的时候,扩增会显得尤为困难。目前常用的解决办法如下:1.调整退火温度;2.增大循环数;3.先进行全基因扩增,然后再进行微生物多样性PCR扩增。但这3种方案均存在弊端:1.调整退火温度,降低退火温度可以在一定程度上得到更多的扩增产物,但退火温度的降低带来的是非特异性扩增的增多以及引物二聚体的增多,对后续的文库构建以及测序数据的利用带来了极大的不利;2.循环数的调整也可一定程度上将产物量提高到后续建库水平,但循环数的增大也会使非特异性扩增产物、引物二聚体的增多,微量样本拷贝数可能只有各位数,循环数的过度增大很可能会带来扩增的偏向性及阴性对照产物的出现,导致测序结果中不同微生物丰度的缺失及失真。

  常规微生物多样性文库只能针对16S rRNA/18S rRNA/ITS等某一特定区域进行扩增,这样的情况下就只能对样本的细菌、真菌、古菌等种群进行单一分析,若想要同时对多种种群进行同时分析,可采用多重PCR的方法,在同一个体系中利用多种群对应引物进行扩增。但这一方案由于不同扩增引物Tm值的不同会导致退火温度的差异,极易造成非特异性产物及引物二聚体的增多。并且多重PCR的引入极易造成扩增偏向性,影响后续数据分析真实性。

  目前用于研究微生物多样性的分子生物学技术主要包括:变性梯度凝胶电泳系统(DGGE)、温度梯度凝胶电泳(TGGE)、时间温度梯度电泳(TTGE)、限制性长度多态性(Terminal Restriction Fragment Length Polymorphism,T-RFLP)、SSCP、FISH、印记杂交、定量PCR、基因芯片等。TTGE时间温度梯度凝胶电泳系统技术在微生物生态学中的一个主要用途是分析微生物群落结构组成,该技术被广泛应用于各微生物生态系统,包括土壤、活性污泥、人体和动物肠道、温泉、植物根系、海洋、淡水湖、油藏等。绝大部分研究都是通过扩增细菌或古细菌的16S rRNA基因来研究各生态系统中的细菌或古细菌群落多样性。也有用真菌的通用引物扩增18S rRNA基因,从而研究真菌的群落多样性。

  DGGE等分子指纹图谱技术,在其实验结果中往往只含有数十条条带,只能反映出样品中少数优势菌的信息;另一方面,由于分辨率的误差,部分电泳条带中可能包含不只一种16S rDNA序列,因此要获悉电泳图谱中具体的菌种信息,还需对每一条带构建克隆文库,并筛选克隆进行测序,此实验操作相对繁琐;此外,采用这种方法无法对样品中的微生物做到绝对定量。生物芯片是通过固定在芯片上的探针来获得微生物多样性的信息,“只能验证已知,却无法探索未知”,此方法通过信号强弱判断微生物的丰度也不是非常的准确。

  随着高通量测序技术的迅猛发展,利用二代测序技术对微生物多样性已成为常规研究方案。对微生物群落进行测序包括两类,一类是通过16s rDNA,18s rDNA,ITS区域进行扩增测序分析微生物的群体构成和多样性;还有一类是宏基因组测序,是不经过分离培养微生物,而对所有微生物DNA进行测序,从而分析微生物群落构成,基因构成,挖掘有应用价值的基因资源。常规流程是对样本进行抽提后分别使用16s rDNA、18s rDNA、ITS区域特异性引物进行扩增后再进行二代测序文库构建,所得文库测序后用于微生物群落多样性和构成的分析。

  但常规流程存在以下缺点:

  (1)起始量高:常规多样性文库构建需要起始量DNA总量大于100ng,浓度大于10ng/ul。某些珍贵样本及微量样本抽提后DNA总量较少,甚至达不到试剂盒进行DNA抽提的要求,这部分样本就不能进行多样性文库的构建,限制了多样性分析的应用。

  (2)不能对同一样本进行多物种鉴别:常规多样性文库构建是对整个群组DNA进行PCR扩增,只能针对某一区域如16s rDNA、18s rDNA、ITS区域分别进行扩增建库。无法对样本中的多物种如细菌、真菌、古菌等全部样本进行全面分析。

  (3)样本偏向性较强:常规多样性文库构建采用PCR方法对保守序列区域进行扩增,样本群组中丰度较小的信息往往会由于PCR的偏向性导致信息偏少甚至缺失,不能精确反映样本真实情况。

  (4)样本丰度存在误差:常规多样性文库构建采用PCR方法进行文库构建,所涉及PCR引物由于Tm值等不同容易造成偏差,且引物设计时没有加入相关参考校正序列,使分析结果出现偏差。

  发明内容

  鉴于以上所述现有技术的缺点,本发明的目的在于提供微生物多样性文库构建方法及其应用。

  为实现上述目的及其他相关目的,本发明的第一方面提供了一种微生物多样性文库构建方法,包括如下步骤:

  (1)对微生物样本的基因组DNA进行处理,使其成为单链DNA;

  (2)将步骤(1)中获得的单链DNA与特殊标签引物接头进行连接,获得一端连接有特殊标签引物接头的单链DNA;

  (3)对步骤(2)中获得的一端连接有特殊标签引物接头的单链DNA进行延伸,形成一端连接有特殊标签引物的双链DNA;

  (4)对步骤(3)获得的双链DNA与双链接头进行连接,获得两端均连接有接头的双链DNA;

  (5)对步骤(4)获得的两端均连接有接头的双链DNA进行扩增,获得微生物多样性文库。

  进一步地,所述微生物样本可以是含有微生物的微量样本、FFPE样品及150个以下的少量细胞团。

  所述微生物样本的基因组DNA由微生物样本裂解或抽提获得。

  此外,可以是在进行步骤(1)之前,先对微生物样本进行裂解或抽提,从而获得所述微生物样本的基因组DNA。也可以采用由他人利用本领域所熟知的技术已经由微生物样本裂解获得或由微生物样本抽提获得的样本基因组DNA。

  进一步地,当微生物样本的细胞数目在十万个以下时,可直接裂解获得微生物样本的基因组DNA,而无需进行抽提。

  所述细胞可以是原核细胞或真核细胞。

  进一步地,所述微生物样本的基因组DNA的质量可以大于等于6pg。

  进一步地,所述步骤(1)中,所述单链DNA的长度可以是500nt左右。

  进一步地,所述步骤(1)中,本领域技术人员可采用公知的技术,例如高温变性后猝冷、NaOH溶液碱变性等方案使微生物样本的基因组DNA变性成单链DNA。所述高温一般是指60℃-98℃。优选地为80℃-98℃。更优选地为90℃-98℃。处理时间一般为30s-10min。所述NaOH溶液为0.2~0.6M NaOH,1~1.5MNaCl。优选地为0.3~0.5M NaOH,1~1.5MNaCl。更优选地为0.4M NaOH,1.5MNaCl。

  进一步地,所述步骤(2)中,所述特殊标签引物接头,所述特殊标签引物接头,为带有黏性末端的双链接头,所述特殊标签引物接头的一端为第一黏性末端,所述第一黏性末端至少包括特殊末端序列,所述特殊末端序列用于识别微生物基因组DNA的目标区域,并与所述目标区域的单链DNA通过互补配对进行连接。

  进一步地,所述目标区域选自16S rRNA区域、18S rRNA区域、ITS区域、功能基因等区域。

  进一步地,所述特殊末端序列的结构为“可选序列-识别目标序列”,所述可选序列用于调节所在接头的Tm、保证各接头之间的Tm相近,所述识别目标序列用于识别微生物基因组DNA的目标区域,并与所述目标区域的单链DNA通过互补配对进行连接。

  进一步地,所述可选序列的长度为1-2nt。优选可为2nt。

  进一步地,所述特殊末端序列的长度为2-30nt,优选的为4-20nt,更优选的为5-10nt。

  进一步地,所述特殊末端序列如SEQ ID NO.8~57之任一所示。

  进一步地,所述特殊标签引物接头的另一端可以是平末端,也可以是第二黏性末端。当所述第二黏性末端为任意序列或A/T/C/G寡核苷酸的重复序列,优选的为重复序列;长度优选为2-10nt,更优选为2-5bt。

  进一步地,所述特殊标签引物接头中,带有第一黏性末端的单链的长度为10-70nt。进一步可以是20-40nt。再进一步可以是20-35nt。

  进一步地,所述特殊标签引物接头中,带有第一黏性末端的单链的退火温度为10-100℃。进一步可以是20-80℃。再进一步可以是30-60℃。

  进一步地,所述特殊标签引物接头中,带有第一黏性末端的单链的5’端进行间臂(spacer)修饰。优选地,采用C3Spacer或C6Spacer或Spacer C12或Spacer 12或Spacer C18的修饰。再优选地,所述特殊标签引物接头中,带有第一黏性末端的单链的5’端采用2-5个Spacer C12或2个C18Spacer或10个C3Spacer或5个C6Spacer的修饰。再优选地,所述特殊标签引物接头中,带有第一黏性末端的单链的5’端采用甲基化修饰的重复A/T/C/G序列与C3Spacer或C6Spacer或Spacer 12或Spacer 12或Spacer C18的修饰的组合。优选地,采用甲基化修饰的重复A/T/C/G序列个数为2-8个为佳;更优选地,随机引物之后还可以采用AmC3或AmC6或AmC7的修饰或硫代修饰。

  进一步地,所述特殊标签引物接头中,不带有第一黏性末端的那条单链称为另一条单链。

  进一步地,所述特殊标签引物接头中,所述另一条单链的长度为10-70nt。优选为10-30nt。再优选为可以是10-25nt。

  进一步地,所述特殊标签引物接头中,所述另一条单链的退火温度为10-100℃。优选为20-80℃。再优选为是30-60℃。

  进一步地,所述特殊标签引物接头中,所述另一条单链的5’端进行磷酸化修饰。

  进一步地,所述特殊标签引物接头中,所述另一条单链的3’端进行间臂(spacer)修饰。优选地,所述特殊标签引物接头中,所述另一条单链的3’端可采用C3Spacer或C6Spacer或Spacer C12或Spacer 12或Spacer C18的修饰。再优选地,所述特殊标签引物接头中,所述另一条单链的3’端可采用2个Spacer C12或2个C18Spacer或10个C3Spacer或5个C6Spacer的修饰。

  进一步地,所述特殊标签引物接头中,所述另一条单链的3’端进行生物素化(bioten)修饰。

  进一步地,所述特殊标签引物接头中,所述另一条单链的3’端既有间臂(spacer)修饰又有生物素化(bioten)修饰。优选地,所述间臂(spacer)修饰位于所述另一条链的3’末端端序列与生物素化(bioten)修饰之间。再优选地,所述间臂(spacer)修饰与生物素之间用TEG进行连接。

  进一步地,步骤(2)中,使用连接酶将单链DNA与特殊标签引物接头进行连接。

  进一步地,所述连接酶选自HiFi Taq DNA连接酶、T4 RNA连接酶2、T4 RNA连接酶、连接酶、9°NTM DNA连接酶、Taq DNA连接酶、T7 DNA连接酶、T3 DNA连接酶、电转连接酶、平末端/TA连接酶预混液、瞬时黏性连接酶预混液、T4 DNA连接酶、Circligase ssDNA ligase、5′AppDNA/RNA热稳定连接酶中的任一种或多种。

  进一步地,步骤(3)中,延伸时所用的DNA延伸试剂选自DNA聚合酶、dNTPs、DNA聚合酶缓冲液、延伸引物。

  进一步地,所述DNA聚合酶选自vent DNA聚合酶、T7 DNA聚合酶、Bsu DNA聚合酶、、T4 DNA聚合酶、DNA聚合酶I、Klenow大片段、DNA聚合酶I(E.coli)、TherminatorTM DNA聚合酶、Sulfolobus DNA聚合酶IV、phi29DNA聚合酶、Bst2.0DNA聚合酶、Bst 2.0 DNA聚合酶、Bst DNA聚合酶、Bst DNA聚合酶、Deep VentR(exo–)DNA聚合酶、Deep VentRTMDNA聚合酶、VentR(exo–)DNA聚合酶、DNA聚合酶、热启动Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶、Taq DNA聚合酶、热启动DNA聚合酶、DNA聚合酶、热启动Flex DNA聚合酶、超保真DNA聚合酶、热启动超保真DNA聚合酶、超保真DNA聚合酶等一种或几种酶的组合。

  进一步地,所述dNTPs可以是2.5mM~10mM。所述DNA聚合酶缓冲液为对应选用的最佳匹配缓冲液。

  进一步地,所述延伸引物的序列与黏性末端接头的任意一条链的非黏性部分的序列全部或部分互补。所述非黏性部分是指黏性末端接头的双链部分。

  进一步地,步骤(4)中,扩增时所用的DNA扩增试剂选自DNA聚合酶、dNTPs、DNA聚合酶缓冲液、扩增引物。

  进一步地,所述DNA聚合酶选自vent DNA聚合酶、T7 DNA聚合酶、Bsu DNA聚合酶、T4 DNA聚合酶、Klenow片段、DNA聚合酶I(E.coli)、TherminatorTM DNA聚合酶、Sulfolobus DNA聚合酶IV、phi29DNA聚合酶、Bst2.0DNA聚合酶、Bst 2.0DNA聚合酶、Bst DNA聚合酶、Bst DNA聚合酶、Deep VentR(exo–)DNA聚合酶、Deep VentRTM DNA聚合酶、VentR(exo–)DNA聚合酶、DNA聚合酶、热启动Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶、Taq DNA聚合酶、热启动DNA聚合酶、DNA聚合酶、热启动Flex DNA聚合酶、超保真DNA聚合酶、热启动超保真DNA聚合酶、超保真DNA聚合酶等中一种或几种酶的组合。

  进一步地,所述扩增引物的序列与黏性末端接头的任意一条链的非黏性部分的序列全部或部分互补。所述非黏性部分是指黏性末端接头的双链部分。

  进一步地,在对步骤(3)获得的双链DNA进行扩增之前,先进行双链接头连接,获得获得双端连接有接头的双链DNA。

  进一步地,所述双链接头的末端为平末端或黏性末端。

  所述双链接头的序列可以是适用于illumina测序平台的接头序列,也可以是其他双链结构的DNA。

  进一步地,所述黏性末端的长度为2-10nt,优选为2-5nt。

  进一步地,所述黏性末端可以是带有一个T的黏性末端、Y型黏性末端或为A或T或C或G的重复序列。

  例如,所述双链接头的一端可以是平末端或带有一个T的黏性末端。所述双链接头的另一端为平末端或Y型黏性末端或黏性末端,所述黏性末端为A或T或C或G的重复序列。

  进一步地,所述双链接头包括第一条链和第二条链。

  进一步地,所述双链接头中,第一条单链的长度为10-70nt。优选为10-30nt。再优选为10-25nt。

  进一步地,所述双链接头中,第一条单链的退火温度为10-100℃。优选为20-80℃。再优选为30-60℃。

  进一步地,所述双链接头中,第一条单链的5’端进行磷酸化修饰。

  进一步地,所述双链接头中,第一条单链的5’端进行间臂(spacer)修饰。

  进一步地,所述双链接头中,第一条单链的的5’端进行生物素化(bioten)修饰。

  进一步地,所述双链接头中,第一条单链的的5’端既有间臂(spacer)修饰又有生物素化(bioten)修饰。优选地,所述间臂(spacer)修饰位于所述第一条链的3’末端端序列与生物素化(bioten)修饰之间。再优选地,所述间臂(spacer)修饰与生物素之间用TEG进行连接。

  进一步地,所述双链接头中,第二条单链的长度为10-70nt。优选为10-30nt。再优选为10-25nt。

  进一步地,所述双链接头中,第二条单链的的退火温度为10-100℃。优选为20-80℃。再优选为30-60℃。

  进一步地,所述双链接头中,第二条单链的的3’端进行间臂(spacer)修饰。优选地,采用C3Spacer或C6Spacer或Spacer C12或Spacer 12或Spacer C18的修饰。再优选地,所述第二条单链的5’端采用2-5个Spacer C12或2个C18Spacer或10个C3Spacer或5个C6Spacer的修饰。再优选地,所述第二条单链的5’端采用甲基化修饰的重复A/T/C/G序列与C3Spacer或C6Spacer或Spacer 12或Spacer 12或Spacer C18的修饰的组合。优选地,采用甲基化修饰的重复A/T/C/G序列个数为2-8个为佳。

  进一步地,所述第二条单链的3’端进行生物素化(bioten)修饰。

  进一步地,所述二条单链的3’端既有间臂(spacer)修饰又有生物素化(bioten)修饰。

  优选地,所述间臂(spacer)修饰可位于所述第二条单链的5’末端端序列与生物素化(bioten)修饰之间。再优选地,所述间臂(spacer)修饰与生物素之间用TEG进行连接。

  本发明的第二方面,提供前述微生物多样性文库用于微生物多样性测序或微生物多样性分析中的用途。

  本发明的第三方面,提供一种微生物多样性测序的方法,包括如下步骤:采用前述方法建立文库后,对所获得的文库进行测序。

  本发明的第四方面,提供一种微生物多样性分析的方法,包括如下步骤:采用前述方法建立文库后,对所获得的文库进行测序,然后根据测序结果进行多样性分析。

  本发明的第五方面,提供一种微生物多样性文库构建试剂盒,包括:特殊标签引物接头、连接酶、DNA延伸试剂、DNA扩增试剂。

  进一步地,所述试剂盒还包括细胞裂解液或基因组DNA抽提试剂。所述细胞裂解液用于对微生物样本进行裂解,获得微生物样本基因组DNA。所述基因组DNA抽提试剂用于对微生物样本抽提,获得微生物样本基因组DNA。

  进一步地,所述特殊标签引物接头用于连接到微生物样本的基因组DNA变性成的单链DNA上,获得一端带有特殊标签引物接头的单链DNA。

  进一步地,所述特殊标签引物接头同前所述。

  进一步地,所述连接酶用于连接所述特殊标签引物接头与所述单链DNA。

  进一步地,所述连接酶选自HiFi Taq DNA连接酶、T4 RNA连接酶2、T4 RNA连接酶、连接酶、9°NTM DNA连接酶、Taq DNA连接酶、T7 DNA连接酶、T3 DNA连接酶、电转连接酶、平末端/TA连接酶预混液、瞬时黏性连接酶预混液、T4 DNA连接酶、Circligase ssDNA ligase、5′AppDNA/RNA热稳定连接酶中的任一种或多种。

  进一步地,所述DNA延伸试剂用于对所述一端连接有接头的单链DNA进行延伸,形成一端连接有接头的双链DNA。

  进一步地,所述DNA延伸试剂同前所述。

  进一步地,所述DNA扩增试剂用于对所述双链DNA进行扩增,获得微生物多样性测序文库。

  进一步地,所述DNA扩增试剂同前所述。

  进一步地,所述试剂盒还可包括双链接头。所述双链接头用于连接至一端连接有特殊引物标签的双链DNA的另一端,用于获得双端连接有接头的双链DNA。

  进一步地,所述双链接头同前所述。

  本发明的第五方面,提供一种微生物多样性测序产品,包括前述测序文库构建试剂盒。

  进一步地,所述测序可以是一代测序、二代测序或三代测序。

  进一步地,所述测序平台可以是illumina测序平台。

  与现有技术相比,本发明具有如下有益效果:

  (1)起始量低:

  本发明的新型的微生物多样性文库构建方法,将样本DNA起始量可降低至pg级,适用于某些珍贵样本及微量样本,极大拓展了多样性的应用。

  (2)可对同一样本进行多物种鉴别:

  本发明的新型的微生物多样性文库构建方法,采用特殊标签引物接头,可对群组中所有样本保守区域如16s rDNA、18s rDNA、ITS区域同时进行扩增建库。可以对样本中的多物种如细菌、真菌、古菌等全部样本进行全面分析。

  (3)均一化样本偏向性

  本发明新型的微生物多样性文库构建方法,利用单链连接及特殊标签引物接头对宏基因组进行微生物多样性文库构建,该方案适用于常规样品、微量样品、FFPE样品及150个以下的少量细胞团,扩大了微生物多样性研究的应用范围;单链连接及特殊标签的引入可将不同种群目的片段进行偏向性较小的富集,保证了物种丰富性以及样本不同物种丰度的真实性。

  附图说明

  图1:本发明的特殊标签引物接头的结构示意图,NNNN为特殊末端序列,图上的4个N只是展示结构,而并非对特殊末端序列部分长度的限定。

  图2:展示本发明的单链DNA连接特殊标签引物接头并建库的大致过程,其中特殊标签引物接头连接单链DNA的步骤中,特殊标签引物接头中的特殊末端序列NNNN,只作为结构示意,不作为限定;特殊标签引物接头上还可以连接生物素等修饰,后续可以与链霉亲和素等磁珠相连,进行纯化;若在连接特殊标签引物接头后或延伸成双链DNA后或双链接头连接后已能满足应用,则可相应的停止后续实验,而非一定进行到指数扩增。

  图3:样本中主要微生物成分百分比柱状图。

  具体实施方式

  在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围;在本发明说明书和权利要求书中,除非文中另外明确指出,单数形式“一个”、“一”和“这个”包括复数形式。

  当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。

  除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明,具体可参见Sambrook等MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold Spring Harbor Laboratory Press,1989and Third edition,2001;Ausubel等,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,John Wiley&Sons,New York,1987and periodic updates;the series METHODS IN ENZYMOLOGY,Academic Press,San Diego;Wolffe,CHROMATIN STRUCTURE AND FUNCTION,Third edition,Academic Press,San Diego,1998;METHODS IN ENZYMOLOGY,Vol.304,Chromatin(P.M.Wassarman and A.P.Wolffe,eds.),Academic Press,San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,Vol.119,Chromatin Protocols(P.B.Becker,ed.)Humana Press,Totowa,1999等。

  本发明提供了一种微生物多样性文库构建方法,包括如下步骤:

  (1)对微生物样本的基因组DNA进行处理,使其成为单链DNA;

  (2)将步骤(1)中获得的单链DNA与特殊标签引物接头进行连接,获得一端连接有特殊标签引物接头的单链DNA;

  (4)对步骤(3)获得的双链DNA与双链接头进行连接,获得两端均连接有接头的双链DNA;

  (5)对步骤(4)获得的两端均连接有接头的双链DNA进行扩增,获得微生物多样性文库。

  在一个示例中,所述微生物可以是细菌、真菌、古菌、螺旋体、支原体、立克次体、衣原体、放线菌等。所述微生物多样性是指针对某一微生物样本分析其中所含有的微生物的种类及占比。

  在一个示例中,所述微生物样本可以是含有微生物的微量样本、FFPE样品及150个以下的少量细胞团。

  在一个示例中,所述微生物样本的基因组DNA由微生物样本裂解获得或由微生物样本抽提获得。

  可以是在进行步骤(1)之前,先对微生物样本裂解或对微生物样本抽提,从而获得所述微生物样本的基因组DNA。也可以采用由他人利用本领域所熟知的技术已经由微生物样本裂解获得或由微生物样本抽提获得的微生物样本的基因组DNA。

  在一个示例中,所述步骤(1)中,所述单链DNA的长度可以是500nt左右。

  在一个示例中,步骤(2)中,所述特殊标签引物接头,所述特殊标签引物接头,为带有黏性末端的双链接头,所述特殊标签引物接头的一端为第一黏性末端,所述第一黏性末端至少包括特殊末端序列,所述特殊末端序列用于识别微生物基因组DNA的目标区域,并与所述目标区域的单链DNA通过互补配对进行连接。

  在一个示例中,所述目标区域可以是16S rRNA区域、18S rRNA区域或ITS区域、功能基因等区域。

  在一个示例中,所述特殊末端序列的结构为“可选序列-识别目标序列”,所述可选序列用于调节所在接头的Tm、保证各接头之间的Tm相近,所述识别目标序列用于识别微生物基因组DNA的目标区域,并与所述目标区域的单链DNA通过互补配对进行连接。

  在一个示例中,所述可选序列的长度为1-2nt。优选可为2nt。

  所述特殊末端序列的长度可根据目标样本的多样性进行调整,若目标样本的多样性高则特殊末端序列的长度可相对增加,若目标样本的多样性低则特殊末端序列的长度可相对减少。通常所述特殊末端序列的长度为2-30nt,优选的为4-20nt,更优选的为5-10nt。

  在一个示例中,所述特殊末端序列如SEQ ID NO.8~57之任一所示。

  进一步地,所述特殊标签引物接头的另一端可以是平末端,也可以是第二黏性末端。当所述第二黏性末端为任意序列或A/T/C/G寡核苷酸的重复序列,优选的为重复序列;长度优选为2-10nt,更优选为2-5bt。

  所述第一条链的长度可以根据需要进行选择。

  在一个示例中,所述特殊标签引物接头中,带有第一黏性末端的单链的长度为10-70nt。进一步可以是20-40nt。再进一步可以是20-35nt。

  在一个示例中,所述特殊标签引物接头中,带有第一黏性末端的单链的退火温度为10-100℃。进一步可以是20-80℃。再进一步可以是30-60℃。

  在一个示例中,所述特殊标签引物接头中,带有第一黏性末端的单链可进行适当的修饰,以减少引物的非特异性扩增。例如,所述带有第一黏性末端的单链的5’端可进行间臂(spacer)修饰,如采用C3Spacer或C6Spacer或Spacer C12或Spacer 12或Spacer C18的修饰。进一步地,带有第一黏性末端的单链的5’端可采用2-5个Spacer C12或2个C18Spacer或10个C3Spacer或5个C6Spacer的修饰。再进一步地,采用甲基化修饰的重复A/T/C/G序列与C3Spacer或C6Spacer或Spacer 12或Spacer 12或Spacer C18的修饰的组合;其中采用甲基化修饰的重复A/T/C/G序列个数为2-8个为佳;更优选地,特殊末端序列之后还可以采用AmC3或AmC6或AmC7的修饰或硫代修饰防止引物降解并形成一定的空间结构,有利于形成双链结构。

  在一个示例中,所述特殊标签引物接头中,不带有第一黏性末端的那条单链称为另一条单链。

  在一个示例中,所述特殊标签引物接头中,所述另一条单链的长度为10-70nt。进一步可以是10-30nt。再进一步可以是10-25nt。

  在一个示例中,所述特殊标签引物接头中,所述另一条单链的退火温度为10-100℃。进一步可以是20-80℃。再进一步可以是30-60℃。

  在一个示例中,所述特殊标签引物接头中,所述另一条单链的可进行适当的修饰,以减少引物的非特异性扩增。例如,所述特殊标签引物接头中,所述另一条单链的5’端可进行磷酸化修饰,所述特殊标签引物接头中,所述另一条单链的3’端可进行间臂(spacer)修饰,如采用C3Spacer或C6Spacer或Spacer C12或Spacer 12或Spacer C18的修饰,优选采用2个Spacer C12或2个C18Spacer或10个C3Spacer或5个C6Spacer的修饰。

  在一个示例中,所述特殊标签引物接头中,所述另一条单链的3’端还可进行生物素化(bioten)修饰。当所述特殊标签引物接头中,所述另一条单链的3’端既有间臂(spacer)修饰又有生物素化(bioten)修饰时,间臂(spacer)修饰可位于所述另一条链的3’末端序列与生物素化(bioten)修饰之间。进一步地,所述间臂(spacer)修饰与生物素之间用TEG进行连接。

  本发明一些实施例中所列举的是适用于illumina测序平台的接头序列,仅用于示意,并不局限于这些具体的序列。实施例中所列举的修饰方式也仅用于示意。可根据实际需要进行其他修饰。

  在一个示例中,步骤(2)中,使用连接酶将单链DNA与特殊标签引物接头进行连接。

  在一个示例中,所述连接酶选自HiFi Taq DNA连接酶、T4 RNA连接酶2、T4 RNA连接酶、连接酶、9°NTM DNA连接酶、Taq DNA连接酶、T7 DNA连接酶、T3 DNA连接酶、电转连接酶、平末端/TA连接酶预混液、瞬时黏性连接酶预混液、T4 DNA连接酶、Circligase ssDNA ligase、5′AppDNA/RNA热稳定连接酶中的任一种或多种。

  在一个示例中,步骤(3)中,延伸时所用的DNA延伸试剂选自DNA聚合酶、dNTPs、DNA聚合酶缓冲液、延伸引物。

  在一个示例中,所述DNA聚合酶选自vent DNA聚合酶、T7 DNA聚合酶、Bsu DNA聚合酶、T4 DNA聚合酶、Klenow片段、DNA聚合酶I(E.coli)、TherminatorTM DNA聚合酶、Sulfolobus DNA聚合酶IV、phi29DNA聚合酶、Bst2.0DNA聚合酶、Bst2.0 DNA聚合酶、Bst DNA聚合酶、Deep VentR(exo–)DNA聚合酶、Deep VentRTM DNA聚合酶、VentR(exo–)DNA聚合酶、DNA聚合酶、热启动Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶、Taq DNA聚合酶、热启动DNA聚合酶、DNA聚合酶、热启动Flex DNA聚合酶、超保真DNA聚合酶、热启动超保真DNA聚合酶、超保真DNA聚合酶等一种或几种酶的组合。

  在一个示例中,所述dNTPs可以是2.5mM~10mM。所述DNA聚合酶缓冲液为对应选用的最佳匹配缓冲液。本领域技术人员可根据实际需要来选择dNTPs的浓度,只要不限制本发明的目的即可。

  在一个示例中,所述延伸引物的序列与黏性末端接头的任意一条链的非黏性部分的序列全部或部分互补。所述非黏性部分是指黏性末端接头的双链部分。

  在一个示例中,步骤(4)中,扩增时所用的DNA扩增试剂选自DNA聚合酶、dNTPs、DNA聚合酶缓冲液、扩增引物。

  在一个示例中,所述DNA聚合酶选自vent DNA聚合酶、T7 DNA聚合酶、Bsu DNA聚合酶、T4 DNA聚合酶、DNA聚合酶I、Klenow大片段、DNA聚合酶I(E.coli)、TherminatorTM DNA聚合酶、Sulfolobus DNA聚合酶IV、phi29DNA聚合酶、Bst2.0DNA聚合酶、Bst 2.0 DNA聚合酶、Bst DNA聚合酶、Deep VentR(exo–)DNA聚合酶、Deep VentRTM DNA聚合酶、VentR(exo–)DNA聚合酶、DNA聚合酶、热启动Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶、Taq DNA聚合酶、热启动DNA聚合酶、DNA聚合酶、热启动Flex DNA聚合酶、超保真DNA聚合酶、热启动超保真DNA聚合酶、超保真DNA聚合酶等中一种或几种酶的组合。

  在一个示例中,所述扩增引物的序列与黏性末端接头的任意一条链的非黏性部分的序列全部或部分互补。所述非黏性部分是指黏性末端接头的双链部分。

  在一个示例中,在对步骤(3)获得的双链DNA进行扩增之前,先进行双链接头连接,获得获得双端连接有接头的双链DNA。

  在一个示例中,所述双链接头的末端为平末端或黏性末端。

  所述双链接头的序列可以是适用于illumina测序平台的接头序列,也可以是其他双链结构的DNA。

  在一个示例中,所述黏性末端的长度为2-10nt,优选为2-5nt。

  在一个示例中,所述黏性末端可以是带有一个T的黏性末端、Y型黏性末端或为A或T或C或G的重复序列。

  例如,所述双链接头的一端可以是平末端或带有一个T的黏性末端。所述双链接头的另一端为平末端或Y型黏性末端或黏性末端,所述黏性末端为A或T或C或G的重复序列。

  在一个示例中,所述双链接头包括第一条链和第二条链。

  在一个示例中,所述双链接头中,第一条单链的长度为10-70nt。优选为10-30nt。再优选为10-25nt。

  在一个示例中,所述双链接头中,第一条单链的退火温度为10-100℃。优选为20-80℃。再优选为30-60℃。

  在一个示例中,所述双链接头中,第一条单链的5’端进行磷酸化修饰。

  在一个示例中,所述双链接头中,第一条单链的5’端进行间臂间臂(spacer)修饰。

  在一个示例中,所述双链接头中,第一条单链的的5’端进行生物素化(bioten)修饰。

  在一个示例中,所述双链接头中,第一条单链的的5’端既有间臂(spacer)修饰又有生物素化(bioten)修饰。优选地,所述间臂(spacer)修饰位于所述第一条链的3’末端端序列与生物素化(bioten)修饰之间。再优选地,所述间臂(spacer)修饰与生物素之间用TEG进行连接。

  在一个示例中,所述双链接头中,第二条单链的长度为10-70nt。优选为10-30nt。再优选为10-25nt。

  在一个示例中,所述双链接头中,第二条单链的的退火温度为10-100℃。优选为20-80℃。再优选为30-60℃。

  在一个示例中,所述双链接头中,第二条单链的的3’端进行间臂(spacer)修饰。优选地,采用C3Spacer或C6Spacer或Spacer C12或Spacer 12或Spacer C18的修饰。再优选地,所述第二条单链的5’端采用2-5个Spacer C12或2个C18Spacer或10个C3Spacer或5个C6Spacer的修饰。再优选地,所述第二条单链的5’端采用甲基化修饰的重复A/T/C/G序列与C3Spacer或C6Spacer或Spacer 12或Spacer 12或Spacer C18的修饰的组合。优选地,采用甲基化修饰的重复A/T/C/G序列个数为2-8个为佳。

  在一个示例中,所述第二条单链的3’端进行生物素化(bioten)修饰。

  在一个示例中,所述二条单链的3’端既有间臂(spacer)修饰又有生物素化(bioten)修饰。

  在一个示例中,所述间臂(spacer)修饰可位于所述第二条单链的5’末端端序列与生物素化(bioten)修饰之间。再优选地,所述间臂(spacer)修饰与生物素之间用TEG进行连接。

  本发明还进一步提供了前述微生物多样性文库用于微生物多样性测序或微生物多样性分析中的用途。

  本发明还提供了一种微生物多样性测序方法,包括如下步骤:采用前述方法建立文库后,对所获得的文库进行测序。

  本发明还提供了一种微生物多样性分析方法,包括如下步骤:采用前述方法建立文库后,对所获得的文库进行测序,然后根据测学结果进行微生物多样性分析。

  本发明还提供了一种微生物多样性文库构建试剂盒,包括:特殊标签引物接头、连接酶、DNA延伸试剂、DNA扩增试剂。

  在一个示例中,所述试剂盒还包括细胞裂解液或基因组DNA抽提试剂。所述细胞裂解液用于对微生物单细胞样本裂解,获得微生物单细胞样本基因组DNA。所述基因组DNA抽提试剂用于对微生物多细胞样本抽提,获得微生物多细胞样本基因组DNA。

  在一个示例中,

  进一步地,本领域技术人员可采用公知的技术,例如高温变性后猝冷、NaOH溶液碱变性等方案使微生物样本的基因组DNA变性成单链DNA。所述高温一般是指60℃-98℃。优选地为80℃-98℃。更优选地为90℃-98℃。处理时间一般为30s-10min。所述NaOH溶液为0.2~0.6M NaOH,1~1.5MNaCl。优选地为0.3~0.5M NaOH,1~1.5MNaCl。更优选地为0.4M NaOH,1.5MNaCl。本领域技术人员可根据实际需要来选择合适的方式对微生物样本的基因组DNA进行处理,使其成为单链DNA,只要不限定本发明的目的即可。

  在一个示例中,所述特殊标签引物接头用于连接到微生物样本的基因组DNA变性成的单链DNA上,获得一端带有特殊标签引物接头的单链DNA。

  在一个示例中,所述特殊标签引物接头同前所述。

  在一个示例中,所述连接酶用于连接所述特殊标签引物接头与所述单链DNA。

  在一个示例中,所述连接酶选自HiFi Taq DNA连接酶、T4 RNA连接酶2、T4 RNA连接酶、连接酶、9°NTM DNA连接酶、Taq DNA连接酶、T7 DNA连接酶、T3 DNA连接酶、电转连接酶、平末端/TA连接酶预混液、瞬时黏性连接酶预混液、T4 DNA连接酶、Circligase ssDNA ligase、5′AppDNA/RNA热稳定连接酶中的任一种或多种。

  在一个示例中,所述DNA延伸试剂用于对所述一端连接有接头的单链DNA进行延伸,形成一端连接有接头的双链DNA。

  在一个示例中,所述DNA延伸试剂同前所述。

  在一个示例中,所述DNA扩增试剂用于对所述双链DNA进行扩增,获得微生物多样性测序文库。

  在一个示例中,所述DNA扩增试剂同前所述。

  在一个示例中,所述试剂盒还可包括双链接头。所述双链接头用于连接至一端连接有特殊引物标签的双链DNA的另一端,用于获得双端连接有接头的双链DNA。

  在一个示例中,所述双链接头同前所述。

  本发明还进一步提供一种微生物多样性测序产品,包括前述测序文库构建试剂盒。

  在一个示例中,所述测序可以是一代测序、二代测序或三代测序。

  进一步地,所述测序平台可以是illumina测序平台。

  与现有技术相比,本发明的微生物多样性文库构建方法,具有如下优势:

  (1)相比传统多样性文库构建方案,能应用于低起始量的样品(低至pg级别)。

  (2)相比传统多样性文库构建方案,能同时对样本中多个群组进行文库构建,更加全面地分析样本组成。

  (3)相比于传统多样性文库构建方案,特殊标签引物接头组合在设计时加入可选序列,使得各特殊标签引物接头的Tm值在均等范围,保证了扩增的相对均一性,能更大限度的保留样品的多样性,缩小由于引物原因造成的文库偏向性。

  下文以具体实施例1对本发明实施例的技术方案进行更具体地说明。

  实施例1

  一、特殊标签引物接头合成:

  所述特殊标签引物接头,为带有黏性末端的双链接头,所述特殊标签引物接头的一端为第一黏性末端,所述第一黏性末端至少包括特殊末端序列,所述特殊末端序列用于识别微生物基因组DNA的目标区域,并与所述目标区域的单链DNA通过互补配对进行连接。所述目标区域可以是16S rRNA区域、18S rRNA区域或ITS区域等。所述特殊末端序列的结构为“可选序列-识别目标序列”,所述可选序列用于调节所在接头的Tm、保证各接头之间的Tm相近,所述识别目标序列用于与目标区域的核苷酸序列互补配对。

  1、作为示例,采用Primer1和Primer2合成特殊标签引物接头,

  Primer1:5’-AGCTCAGAGT-3’-bioten(SEQ ID NO.1);

  Primer2:5’-ACTCTGAGC-特殊末端序列-3’(SEQ ID NO.2);其中,所述特殊末端序列,的长度为2-30nt,优选的为4-20nt,更优选的为5-10nt。

  一般情况下,本领域技术人员可根据要识别的微生物基因组DNA的目标区域,来选择相对应的特殊末端序列,从而形成特殊标签引物接头群,在这个群中,含有若干个特殊标签引物接头,各特殊标签引物接头中特殊末端序列可不同。例如,当要识别的目标区域是细菌16S rRNA区域时,可制备两种特殊标签引物接头,一种特殊标签引物接头中的特殊末端序列为“CCTGGCTCAG”、其中的可选序列为“CC”、目标识序列为“TGGCTCAG”、此时形成的特殊标签引物接头中,带有第一黏性末端的单链的整体序列为5’-ACTCTGAGC-CCTGGCTCAG-3’。另一种接头中的特殊末端序列为“CCGTAGGAGT”、其中的可选序列为“CC”、目标识别序列为“GTAGGAGT”、此时形成的特殊标签引物接头中,带有第一黏性末端的单链的整体序列为5’-ACTCTGAGC-CCGTAGGAGT-3’。以此类推。根据下表1中的不同特殊末端序列,可形成一个含有52个特殊标签引物接头的特殊标签引物接头群,采用这个特殊标签引物接头群,即可同时识别26个不同的目标区域。

  表1

  2、按下表2加入配置反应液:

  表2

  

  其中上述反应中采用的TE buffer也可以被水、tris-hcl(0.05mM,PH7.0-8.0)等具有相似功能的缓冲液所替代。

  3、按下表3进行反应:

  表3

  

  获得识别不同微生物基因组DNA不同目标区域的特殊标签引物接头,其共同结构为:

  5’-ACTCTGAGC-特殊末端序列-3’

  bioten-3’-GAAGGCTAGA-5’。

  其中,识别的目标区域是细菌16S rRNA区域的两种特殊标签引物接头分别为:

  5’-ACTCTGAGC-CCTGGCTCAG-3’

  bioten-3’-GAAGGCTAGA-5’。

  5’-ACTCTGAGC-CCGTAGGAGT-3’

  bioten-3’-GAAGGCTAGA-5’。

  依次类推,形成一个含有52个特殊标签引物接头的特殊标签引物接头群。

  可转存于-20℃保存。

  表3中的反应条件只是作为示例,也可以采用类似的方案进行,总体原则为先高温变性后缓慢退火形成互补的DNA双链特殊标签引物接头。

  二、双链接头的准备

  所述双链接头的末端为平末端或黏性末端。

  1、作为示例,双链接头由Primer3和Primer4制备而成,一端为平末端,一端为黏性末端。

  Primer3:5’-CTACTCTGAGC-3’(SEQ ID NO.3);

  Primer4:5’-GGAAGAGCGTCGTGTAGGGAAAGAGTG-3’(SEQ ID NO.4);

  Primer3在3’端优选地采用磷酸化修饰的C,更优选地可以采用双脱氧核糖核酸的C进行引物的合成;Primer4可以选择进行硫代修饰或不进行硫代修饰,优选的为进行硫代修饰,更优选的为硫代修饰3’端的3个碱基;primer4的5’端优选地采用磷酸化修饰。

  2、按下表4加入配置反应液:

  表4

  

  2、按下表5进行反应:

  表5

  

  获得双链接头可转存于-20℃保存。

  上表5中的反应条件只是作为示例,也可以采用类似的方案进行,总体原则为先高温变性后缓慢退火形成互补的DNA双链结构。

  三、DNA抽提

  1、常规样本DNA抽提可采用本领域内技术人员通用的方案进行抽提,即可进行步骤四的处理;

  2、微量样本、FFPE样品及150个以下的少量细胞团:在每个样品中加入14μL细胞裂解液(50mM KAc,20mM Tris-Ac,10mM MgAc,0.2%Trition X-100)、10mg glass beads置于每个200μL PCR管,最高速混匀30s对样本进行破壁处理。加入1μL细胞裂解酶(QIAGEN protease,10mg/ml;溶菌酶,20mg/ml)混合均匀后离心,置于PCR仪上,25℃孵育30分钟、50℃孵育50分钟裂解细胞,80℃孵育10min使蛋白酶变性。获得样本基因组DNA后,进行步骤四的处理。

  3、当然也可以是也可以采用由他人利用本领域所熟知的技术已经由微量样本、FFPE样品及150个以下的少量细胞团样本中裂解获得或抽提获得的样本基因组DNA。

  4、所得基因组DNA可以通过酶切、机械打断、超声打断等方式,将基因组DNA打断为500bp左右的双链。

  四、采用特殊标签引物接头群对单链DNA进行连接

  1、按下表6加入配置反应液:

  表6

  

  这一操作步骤可将DNA样品去磷酸化,防止样品之间的自连。

  2、将样品轻弹混匀后,按下表7进行反应:

  表7

  

  将样品立即转移到冰上。

  这一操作步骤可将样本基因组DNA变为单链DNA。

  3、按下表8加入配置反应液:

  表8

  

  轻弹混匀,总体积40ul。

  4、按下表9进行反应

  表9

  

  可将样品于-20℃保存,或直接进行下一步反应。

  样本基因组DNA在与特殊标签引物接头群连接时,可以不用FastAP进行处理,优选的为利用FastAP进行处理。反应中采用的1%Tween 20、1%NP40、1%triton x-100等缓冲液以均匀体系;T4 DNA连接酶可以由其他具有双链或单链连接酶活性的酶所替代,优选地有HiFi Taq DNA连接酶、T4 RNA连接酶2、T4 RNA连接酶、连接酶、9°NTM DNA连接酶、Taq DNA连接酶、T7 DNA连接酶、T3 DNA连接酶、电转连接酶、平末端/TA连接酶预混液、瞬时黏性连接酶预混液、T4 DNA连接酶、Circligase ssDNA ligase、5′AppDNA/RNA热稳定连接酶中的任一种或多种。

  五、磁珠捕获

  1、将链霉亲和素修饰的磁珠,在室温至少平衡30分钟,涡旋混匀。

  2、取20ul的beads到1.5ml的EP管中(20ul/样品)。

  3、Beads用500μl的1xBWT+SDS(1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH 8.0),0.05%Tween-20and 0.5%SDS)洗涤2次。

  4、将beads重悬于250ul的1xBWT+SDS中(250ul/20ul磁珠)。

  5、将样品(40ul)在95℃加热1min,迅速转移到冰上,放置至少2-5min。

  6、将样品与洗涤完成的beads混匀。

  7、在室温孵育20min,并不断混匀。

  8、瞬离,将EP管放置在磁力架上,去除上请。

  9、加入200μl的0.1xBWT+SDS(0.1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH 8.0),0.05%Tween-20and 0.5%SDS),转移到ThermoMixer(set to 25℃;MKR 13,HLC/Ditabis)上,涡旋8s是beads重悬。

  10、瞬离,将EP管转移到磁力架上,去除上清。

  其中链霉亲和素修饰的磁珠可以是DynabeadsTM M-280Streptavidin、DynabeadsTM MyOneTM Streptavidin C1、DynabeadsTM M-270Streptavidin等商业产品,也可以是自行偶联的链霉亲和素修饰的类似磁珠样品。

  六、延伸

  按下表10加入配置反应液:

  表10

  

  Primer5:5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC-3’(SEQ ID NO.5)。

  可选的,primer5可进行硫代修饰,也可不进行硫代修饰,优选的进行硫代修饰,更优选地为整条引物进行硫代修饰,更优选地为3端的10个碱基进行硫代修饰;更优选的为3端的5个碱基进行硫代修饰;更优选地为3端的个碱基进行硫代修饰。

  1.将beads转移到磁力架上,去除上请。

  2.加入上表10中的混合物,涡旋使beads充分混匀。

  3.将样品转移到95℃,2min。

  4.迅速转移到冰上,至少放置2-5min。

  5.将样品在室温转移到EP管中。

  6.加入2ul的Klenow fragment(10U/μl),混匀,将beads重悬。

  7.25℃孵育5min,每60s混匀2s,1500rpm。

  8.35℃孵育25min,每60s混匀2s,1500rpm。

  其中Klenow fragment也可以被其他的聚合酶[聚合酶种类]所替代,如vent DNA聚合酶、T7 DNA聚合酶、Bsu DNA聚合酶,大片段、T4 DNA聚合酶、DNA聚合酶I,(Klenow)大片段、DNA聚合酶I(E.coli)、TherminatorTM DNA聚合酶、Sulfolobus DNA聚合酶IV、phi29 DNA聚合酶、Bst2.0DNA聚合酶、Bst 2.0 DNA聚合酶、Bst DNA聚合酶,Deep VentR(exo–)DNA聚合酶、Deep VentRTM DNA聚合酶、VentR(exo–)DNA聚合酶、DNA聚合酶、热启动Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶(提供不含镁离子的ThermoPol II缓冲液)、Taq DNA聚合酶(提供缓冲液)、热启动DNA聚合酶、DNA聚合酶、热启动Flex DNA聚合酶、超保真DNA聚合酶、热启动超保真DNA聚合酶、超保真DNA聚合酶等一种或几种酶的组合。

  上述反应体系只用于实例展示,而不用于限定。

  七、扩增后清洗

  1.样品瞬离,转移到磁力架上,去除上清。

  2.加入200μl的0.1xBWT2.(0.1M NaCl,1mM Tris-HCl(pH 8.0),0.1mM EDTA(pH 8.0),0.005%Tween-20)。

  3.将样品混匀,瞬离,转移到磁力架上,去除上清。

  4.加入100μl的Stringency wash buffer(0.1xSSC and 0.1%SDS)。

  5.将样品室温孵育3min。

  6.瞬离,转移到磁力架上,去除上请。

  7.加入200μl的0.1xBWT2.(0.1M NaCl,1mM Tris-HCl(pH 8.0),0.1mM EDTA(pH 8.0),0.005%Tween-20),涡旋混匀。

  上述清洗方案只用与实例展示而不用于限定。

  八、双链接头连接

  按下表11加入配置反应液:

  表11

  

  1.将beads去上清,用上表11中的mix混匀。

  2.将样品在25℃孵育1h,孵育时注意混匀。

  T4 DNA连接酶可以由其他具有双链或单链连接酶活性的酶所替代,优选地有HiFi Taq DNA连接酶、T4 RNA连接酶2、T4 RNA连接酶、连接酶、9°NTM DNA连接酶、Taq DNA连接酶、T7 DNA连接酶、T3 DNA连接酶、电转连接酶、平末端/TA连接酶预混液、瞬时黏性连接酶预混液、T4 DNA连接酶、Circligase ssDNA ligase、5′AppDNA/RNA热稳定连接酶中的任一种或多种。

  九、连接后洗涤及样品洗脱

  1.将样品瞬离,转移到磁力架上,去除上请。

  2.加入200μl的0.1xBWT2.(0.1M NaCl,1mM Tris-HCl(pH 8.0),0.1mM EDTA(pH 8.0),0.005%Tween-20)。

  3.将样品混匀。

  4.瞬离,转移到磁力架上,去除上清。

  5.加入100μl的Stringency wash buffer(0.1xSSC and 0.1%SDS)。

  6.将样品在45℃,孵育3min。

  7.瞬离,转移到磁力架上,去除上请。

  8.加入200μl的0.1xBWT2.(0.1M NaCl,1mM Tris-HCl(pH 8.0),0.1mM EDTA(pH 8.0),0.005%Tween-20)。

  9.将样品转移到混匀,转移到磁力架上,去除上请。

  10.加入50μl的无核酸水。

  11.将样品在室温孵育10min后,95℃加热2min。

  12.将样品转移到磁力架上,将上清转移到干净的低吸付的EP管中。

  上述双链接头连接方案只用于实例说明,而不用于限定。

  十、样品扩增(可选步骤)

  按下表12混合pcr扩增原料:

  表12

  

  将洗脱的样品或直接带着磁珠进行下列反应(每个样品可做2个或多个平行的PCR扩增反应,可增加样品的产量)。

  混匀样品,按下表13进行扩增:

  表13

  Primer6:

  5’-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTACTCTGAGCT-3’(SEQ ID NO.6);

  Primer7:

  5’-CAAGCAGAAGACGGCATACGAGATtgccgaGTGACTGGAGTTCAGACGTGTGCTACTCTGAGC-3’(SEQ ID NO.7);

  其中下划线部分为index序列,可以替换为其他的index序列,具体可参考illumina测序仪器适用的index序列。

  其中KAPA HiFi HotStart ReadyMix(2x)也可以由其他聚合酶所替代,如vent DNA聚合酶、T7 DNA聚合酶、Bsu DNA聚合酶,大片段、T4 DNA聚合酶、DNA聚合酶I,(Klenow)大片段、DNA聚合酶I(E.coli)、TherminatorTM DNA聚合酶、Sulfolobus DNA聚合酶IV、phi29 DNA聚合酶、Bst2.0DNA聚合酶、Bst 2.0 DNA聚合酶、Bst DNA聚合酶,全长、Bst DNA聚合酶,Deep VentR(exo–)DNA聚合酶、Deep VentRTM DNA聚合酶、VentR(exo–)DNA聚合酶、DNA聚合酶、热启动Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶(提供不含镁离子的ThermoPol II缓冲液)、Taq DNA聚合酶(提供缓冲液)、热启动DNA聚合酶、DNA聚合酶、热启动Flex DNA聚合酶、超保真DNA聚合酶、热启动超保真DNA聚合酶、超保真DNA聚合酶、KAPA HiFi Uracil+ReadyMix(2x)、PfuTurbo Cx热启动DNA聚合酶等一种或几种酶的组合。

  上述反应只用于实例展示,而不用于限定。

  十一、Ampure XP beads纯化样品

  1.将AMPure XP BeadsDNA纯化磁珠在室温平衡至少30min。

  2.取40μlDNA纯化磁珠Agencourt AMPure XP Beads到50μl的样品中,涡旋混匀。若同一样品进行了平行的PCR反应,可将多个样品混合成一管。其中DNA纯化磁珠Agencourt AMPure XP Beads的用量可更具需要进行调整,优选的为40-50ul。

  3.室温放置5min,使样品与DNA充分结合。

  4.将样品转移到磁力架上,待样品澄清后弃去上清。

  5.用新鲜的200ul 80%(vol/vol)的乙醇(现配现用),清洗beads,可上下颠倒,转动EP管,使洗涤充分。

  6.弃去上清。

  7.用新鲜的200ul 80%(vol/vol)的乙醇(现配现用),清洗beads,可上下颠倒,转动EP管,使洗涤充分。弃去上清。

  8.瞬离一次,待样品澄清后弃去残留乙醇。

  9.室温开盖等待,使乙醇充分挥发,至表面出现小裂痕。(不可过干或有乙醇残留)。

  10.加入适量的无核酸水,与样品充分混匀。

  11.在室温孵育至少2min。

  12.将上清转移至干净的NF的EP管中,余2ul进行定量与质检。

  其中DNA纯化磁珠可以是AMPure XP Beads可以由等其他具有相同功效的磁珠替代,除了可以用磁珠纯化样品,也可以采用具有相同功效的试剂盒或方案替代。

  实施例2

  (一)取粪便样本10ng平均分为6份,按照下表14进行分组。每组设置阴性对照,分别命名为N1&N2:

  表14

  其中,A-C样本抽提后使用picogreen双链定量染料进行定量,定量结果均低于检测限。

  常规建库方案如下:

  1.配置下列PCR反应混合液:

  表15

  

  其中,引物库表示本领域技术人员熟知的对细菌、真菌、古菌、反硝化细菌、固氮菌、亚硝酸盐还原菌、氨氧化细菌、丛枝真菌等微生物进行扩增的引物对。每个引物对分别配置一个反应mix。

  2.按照下列条件进行PCR扩增:

  表16

  常规建库时循环数为35个左右,本实施例中由于样本起始量较低,故增加8个循环数以达到磁珠纯化水平。

  3.将上述产物纯化后混合为一个文库,定量测序,使用miseq 2x250平台。

  4.D、E、F样品采用专利方案中建库方式进行,定量测序,使用miseq 2x250平台。

  5.文库出库信息如下表17:

  表17

  

  如上表所示,微量样本使用不同建库方案进行扩增,常规建库方案样本浓度较高,但同批次阴性对照样本浓度也很高,表明出现了比较严重的非特异性扩增;本发明建库方案所得样本浓度均一,与阴性对照相比有较好的对比性,初步认为建库成功。

  上述样本进行miseq 2*250测序,数据量300M data以初步分析文库成分,结果如下表18所示:

  表18

  如果某碱基质量值为30(Q30),则表示该碱基测序出错的概率为0.001。比对效率:能回帖到基因组的数据占下机数据的比例。冗余度:能回帖到基因组的数据中重复序列占总数据量的比例。

  由上表16可以看出,微量粪便样本使用常规建库方式比对效率较差,且测序冗余度较高;采用本发明方案进行的文库测序结果显示比对效率较好,且冗余度在可接受的水平。

  (二)取平行环境样本3份,每份1ng左右,命名为T1-T3,阴性对照命名为NC。按照本发明实施例1提供的实验方案进行文库构建:

  文库出库信息如下:

  表19

  测序数据如下表20:

  表20

  分析后样本多样性信息如下表21:

  表21

  样本主要成分百分比柱状图如图3所示。

  由上述结果可以看出,使用本方案可以较好的对微量样本进行多样性文库构建、测序及分析。

  综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

  上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

  序列表

  <110> 上海美吉生物医药科技有限公司

  <120> 一种微生物多样性文库构建方法及其应用

  <130> 176457

  <160> 55

  <170> SIPOSequenceListing 1.0

  <210> 1

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 1

  agctcagagt 10

  <210> 2

  <211> 9

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 2

  actctgagc 9

  <210> 3

  <211> 11

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 3

  ctactctgag c 11

  <210> 4

  <211> 27

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 4

  ggaagagcgt cgtgtaggga aagagtg 27

  <210> 5

  <211> 33

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 5

  gtgactggag ttcagacgtg tgctcttccg atc 33

  <210> 6

  <211> 58

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 6

  aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctac tctgagct 58

  <210> 7

  <211> 63

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 7

  caagcagaag acggcatacg agattgccga gtgactggag ttcagacgtg tgctactctg 60

  agc 63

  <210> 8

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 8

  cctggctcag 10

  <210> 9

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 9

  ccgtaggagt 10

  <210> 10

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 10

  cctggctcag 10

  <210> 11

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 11

  ctgctggcac 10

  <210> 12

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 12

  gcmgccgcgg 10

  <210> 13

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 13

  mtttragttt 10

  <210> 14

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 14

  gaggcagcag 10

  <210> 15

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 15

  ggtwtctaat 10

  <210> 16

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 16

  gaggaagtaa 10

  <210> 17

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 17

  tcatcgatgc 10

  <210> 18

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 18

  cgtaacaagg 10

  <210> 19

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 19

  tcatcgatgc 10

  <210> 20

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 20

  agaacgcagc 10

  <210> 21

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 21

  attgatatgc 10

  <210> 22

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 22

  trraatagga 10

  <210> 23

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 23

  gtgagtttcc 10

  <210> 24

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 24

  gcaggcgcga 10

  <210> 25

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 25

  gccaattcct 10

  <210> 26

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 26

  gccgcggtaa 10

  <210> 27

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 27

  gavtccaatt 10

  <210> 28

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 28

  gccgcggtaa 10

  <210> 29

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 29

  ggtwtctaat 10

  <210> 30

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 30

  gcmgccgcgg 10

  <210> 31

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 31

  ggtwtctaat 10

  <210> 32

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 32

  gccgcggtaa 10

  <210> 33

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 33

  ggtatctaat 10

  <210> 34

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 34

  aggaracsgg 10

  <210> 35

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 35

  tgsgtcttga 10

  <210> 36

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 36

  cscayccgaa 10

  <210> 37

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 37

  acttrccggt 10

  <210> 38

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 38

  artccaccac 10

  <210> 39

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 39

  tsgccatcat 10

  <210> 40

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 40

  cacgccaagg 10

  <210> 41

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 41

  gggccttgtt 10

  <210> 42

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 42

  tsctgccgcg 10

  <210> 43

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 43

  grttgtggtt 10

  <210> 44

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 44

  tactggtggt 10

  <210> 45

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 45

  agccttcttc 10

  <210> 46

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 46

  ggcttagacg 10

  <210> 47

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 47

  atctgtatgt 10

  <210> 48

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 48

  aygcwacagc 10

  <210> 49

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 49

  twggrtagtt 10

  <210> 50

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 50

  ggacttctgg 10

  <210> 51

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 51

  cgtcyttacc 10

  <210> 52

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 52

  gtaggataga 10

  <210> 53

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 53

  tttggtttcc 10

  <210> 54

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 54

  agataccckg 10

  <210> 55

  <211> 10

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 55

  cccaccttcc 10

《一种微生物多样性文库构建方法及其应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)