欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种多重测序文库的构建方法独创技术14598字

一种多重测序文库的构建方法

2021-03-13 10:01:06

一种多重测序文库的构建方法

  技术领域

  本发明涉及分子生物学技术领域,具体涉及一种ITS序列多重测序文库的构建方法。

  背景技术

  真菌多样性和人类生活生产中的众多领域存在密切联系,了解和掌握不同生境中的真菌多样性信息能对食品加工、农业生产、医学治疗等诸多方面有重要指导作用。随着分子生物学技术的发展,以核糖体RNA(rRNA)测序为基础的真菌多样性研究方法不断完善。此类方法通过对未知样品中的微生物环境基因组(也成宏基因组,Metagenome,即某生境中全部微小生物遗传物质的总和)进行提取,通过PCR扩增其中的特定rRNA序列,构建特定rRNA序列的测序文库,在连接测序接头等必要接头后,与高通量测序技术相结合,能够快速高效地获得特定样品中的全部特定rRNA序列信息,进而得知该样品中的真菌组成情况。

  早期的测序文库构建方法仅能实现对单个文库样品的测序,无法实现对多个测序文库样品的混合测序。然而,在实际应用中,通常会同时涉及到数百个,甚至上千个测序文库样品,因此单个文库样品的测序已无法满足实际需求。为了实现多个文库样品混合测序,避免测序资源浪费,进而发展出了多重核酸测序技术(Multiplex sequencing)。多重测序技术在没测测序文库中加入一段用于识别样品的标签(一段核苷酸序列,也称为Index),在测序后,根据不同的标签序列,区分不同的文库样品,即利用不同的Index标记不同的样品。

  然而值得注意的是,并非任何核苷酸序列都适合用作Index,在实际测序反应中,混合不同文库同时进行测序,常常会因为测序反应对标签中碱基的偏好性,造成检测插入片段时光强参数的波动,影响输出的数据质量和平衡性,导致数据结果不可信并且重复性低,不能真实的反映样品的相关信息。

  另外,现有技术中构建多重测序文库时在一轮PCR反应中给待测序文库样品的上下游各添加1个Index,用于区分测序文库样品。例如,上游PCR引物如果分别连接12个Index,下游PCR引物分别连接8个Index,可以实现对96个文库样品的标记,也就是利用20个Index仅能够实现对96个不同样品的区分,无法实现以相对较少的Index数量标记更多的样品。

  目前在真菌多样性研究中,逐步采用ITS序列取代18S rRNA作为遗传标记来进行真菌的分类鉴定,而通常使用的ITS引物并不能够满足各种样品类型的需求,例如用于土壤样品的测序文库构建时,由于土壤样品本身的复杂性,目前常规的ITS通用引物获得的PCR扩增产物弥散严重,扩增特异性相对较差。

  因此,提供一种ITS序列多重测序文库构建方法,以相对较少的Index数目标记更多的待测序文库样品,并且适用于各种不同的样品类型,对真菌多样性研究以及与之相关的食品加工、农业生产、医学治疗等诸多方面有重要作用。

  发明内容

  除非另外定义,本文中使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同意义。

  本发明中的术语“标签”也称为Index,具体指一段用于区分不同测序样品的核苷酸序列;术语“PCR”指聚合酶链式反应。

  一个方面,本发明提供了一种ITS序列多重测序文库的构建方法,所述的构建方法包括以下步骤:

  (1)、扩增PCR:使用引物F1和引物R1构成引物对,PCR扩增样品中的ITS1-ITS4序列;

  (2)、建库PCR:使用引物F2和引物R2构成引物对,以步骤(1)获得的PCR产物为模板,进行PCR扩增。

  所述的构建方法中的ITS序列指ITS1-ITS4这一区段的核酸序列。

  所述的构建方法中,引物F1是含有如下所示的Index1-30中的任意一个Index的ITS1序列的5’端扩增引物。

  

  

  做为优选,所述的ITS1序列的5’端扩增引物的序列可以为SEQ ID NO:1-9中所示的任意一条核苷酸序列,其中Index位于ITS1序列的5’端扩增引物的核苷酸序列中的第28和29个核苷酸之间。

  

  所述的构建方法中,引物R1是含有本发明所述的Index1-30中的任意一个Index的ITS4序列的3’端扩增引物。

  作为优选,所述的ITS4序列的3’端扩增引物的序列可以为SEQ ID NO:10-19中所示的任意一条核苷酸序列,其中Index位于ITS4序列的3’端扩增引物的核苷酸序列中的第29和30个核苷酸之间。

  

  所述的构建方法中,引物R2是在如SEQ ID NO:20所示的核苷酸序列中包含了如下所示的Index31-40中的任意一个Index构成的核苷酸序列,其中Index位于SEQ ID NO:20所示的核苷酸序列中的第24和25个核苷酸之间。

  

  

  所述的构建方法中,引物F2的核苷酸序列如SEQ ID NO:21所示:AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC。

  所述的构建方法中,所述的引物F1和引物R1中包含的Index的序列为不同核苷酸序列。

  所述的构建方法中,所述的引物F1和引物R2中包含的Index的序列为不同核苷酸序列。

  所述的构建方法中,所述的引物R1和引物R2中包含的Index的序列为不同核苷酸序列。

  所述的构建方法中,所述的引物F1、引物R1和引物R2中包含的Index的序列为不同核苷酸序列。

  与现有技术相比,本发明的有益效果为:

  1、本发明提供的构建方法中所使用的40个Index在设计时,充分考虑到彼此之间的序列差异程度和测序反应对不同Index序列的数据产出偏好性,极大程度地降低了其序列合成或测序过程中可能出现的错误率;引物F1、F2和、R1和R2进行两轮PCR获得的测序文库,在测序时,测序反应得到的数据质量和平衡性更好,测序结果更加准确。

  2、本发明提供的ITS序列多重测序文库的构建方法采用两轮PCR,并且分别在第一轮和第二轮PCR引入2个和1个Index,使得能够标记的文库样品数量大大提高。例如,没法明共提供了40个不同Index,若将其中15个用于引物F1的,15个用于引物R1,10个用于引物R2,则能够获得15条不同的引物F1、15条不同的引物R1和10条不同的引物R2,在步骤(1)和步骤(2)两轮PCR后,能够实现对15*15*10个不同文库样品的标记,也就是使用41条引物(含有40个Index)能够实现对多达2250个不同文库样品的标记。而按照现有技术中双Index标记法,例如Illunima公司提供的Nextera XT Index Kit和Nextera XT v2Index Kit,前者提供22条引物(包含20个Index),仅能够实现对96个不同文库样品的标记;后者提供42条引物(包含40个Index),仅能够实现对384个不同文库样品的标记。因此,本发明提供的测序文库构建方法可以实现的文库样品标记数量远大于现有技术。

  3、本发明提供的构建方法中所使用的引物R1和F1对样品中ITS1-ITS4序列扩增的特异性高,获得的扩增产物电泳检验目的条带清晰,无弥散现象,并且适用于更多种类的样品类型,不仅能够对动物肠道、水体以及大曲等复杂性相对较低的样品类型获得高特异的扩增产物;对土壤和淤泥等高复杂性的样品类型也具有较高的特异性。因此,本发明提供的构建方法比现有技术的样品类型适用范围更广,极大程度地保证了后续测序反应和研究结果的准确性,进而使得真菌多样性研究更加高效便捷准确。

  4、本发明提供的构建方法中所使用的引物R1、F1和引物R2、F2分别能够使得步骤(1)和步骤(2)的PCR扩增循环数降低,使得步骤(1)中扩增循环数在低至12时,仍能够获得较为清晰的扩增产物,使得步骤(2)中扩增循环数在低至6时,仍能够获得较为清晰的扩增产物。这极大程度的缩小了由于PCR循环数的提高使得测序结果对样品中实际真菌多样性情况的偏离,本发明提供的构建方法获得的测序文库的测序结果更加逼近样品中真菌多样性的实际情况,大大提高了真菌多样性研究的准确性。

  5、本发明提供的构建方法中所使用的引物R2和F2中插入了Illumina MiSeq测序平台的测序接头,因此步骤(2)获得的扩增产物可混合后,使用Illumina MiSeq测序平台进行测序。

  附图说明

  图1为实验例1步骤(2)中的扩增产物的琼脂糖凝胶电泳图。

  图2为对比例1中的扩增产物的琼脂糖凝胶电泳图。

  具体实施方式

  以下实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。对所公开的实施例的下述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例中,而是可以应用于符合与本文所公开的原理和新颖特点相一致的更宽的范围。虽然在本发明的实施或测试中可以使用与本发明中所述相似或等价的任何方法和材料,本文在此处例举优选的方法和材料。

  除非另外定义,本文中使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同意义。

  本发明中的术语“ddH2O”指双蒸水。

  实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。

  Soil DNA Kit购自Omega公司;KOD-Plus-Neo购自TOYOBO公司;引物合成委托生工生物工程股份有限公司进行;600个不同来源的土壤样品由中科院北京基因组研究所提供。

  实施例1构建600个不同来源土壤样品的多重测序文库

  (1)、样品基因组DNA的提取:

  用Soil DNA Kit提取土壤样品中的基因组DNA,共获得600个不同基因组DNA,提取步骤参见产品说明书。

  (2)、扩增PCR:使用引物F1和引物R1构成引物对,分别以步骤(1)获得的600个基因组DNA作为模板,PCR扩增样品中的ITS1-ITS4序列;

  共使用10条引物F1,其序列如下所示:

  

  共使用10条引物R1,其序列如下表所示:

  

  

  将10条引物R1和10条引物F1两两配对共可组成100个引物对,其组成如下表所示

  

  

  随机将600个基因组DNA样品分为100组,每组6个样品,使用上表中的引物对1-100分别对第1-100组样品进行PCR扩增。PCR扩增体系如下所示:

  

  

  PCR扩增程序如下所示:

  

  对获得的600个扩增产物进行琼脂糖凝胶电泳,胶浓度0.8%,电泳结果显示采用本发明提供的引物获得的ITS1-ITS4序列扩增产物条带清晰,无弥散现象。由于样品数量较多,随机挑选10个样品的电泳图自此展示,如图1所示,ITS1-ITS4序列扩增产物目的条带明确,无弥散现象,其余样品的扩增产物电泳图和此10个样品相似或相同。

  (3)、建库PCR:使用引物F2和引物R2构成引物对,以步骤(2)获得的PCR产物为模板,进行PCR扩增。

  共使用6条引物R2,其序列如下表所示:

  

  引物F2的核苷酸序列如SEQ ID NO:21所示:AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC。

  分别利用引物F2和6条引物R2构成6对引物对,其组成如下表所示:

  分别使用引物对101-106作为建库PCR引物,分别以上述100组样品中的每组6个样品的扩增产物作为模板,进行PCR扩增。例如100组样品中的某组样品编号为1-6,则用引物对101-106分别对样品1-8在步骤(2)中获得的扩增产物进行PCR扩增,其他样品组以此为例进行扩增。

  PCR扩增体系如下所示:

  PCR扩增程序如下所示:

  

  使用Agencourt AMPure XP磁珠纯化步骤(3)获得的600个扩增产物,纯化后的600个扩增产物混合后,即为600个不同来源土壤样品的多重测序文库,该测序文库可使用Illumina MiSeq测序平台进行测序,测序结果经分析后,可反应样品中的真菌多样性情况。

  对比例1

  以下引物对为常规ITS1-ITS4序列扩增引物:

  5’-TCCGTAGGTGAACCTGCGG-3’

  5’-TCCTCCGCTTATTGATATGC-3’

  利用上述两个引物对对本发明实施例1中涉及的600个土壤样品中的随机300个样品中的ITS1-ITS4序列进行扩增。

  样品基因组DNA的提取方法同实施例1步骤(1),PCR体系和PCR程序同实施例1步骤(2)。

  将扩增产物进行琼脂糖凝胶电泳,胶浓度和电泳条件同实验例1步骤(2),电泳结果显示:采用上述引物对获得的ITS1-ITS4序列扩增产物电泳后目的条带不清晰,弥散严重。由于样品数量较多,在此随机挑选10个扩增产物电泳图进行展示,电泳结果如图2所示,ITS1-ITS4序列目的条带不清晰,弥散严重;其余样品的电泳结果与图2相同或相似,扩增产物目的条带不清晰,弥散严重;此外,该引物该用于文库构建时,由于其所需建库引物太长会导致PCR产物有杂带或扩增不出条带,不利于文库构建。

  以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

  

  

  

  

  

  

  

  

  

  

  

  

  

  

《一种多重测序文库的构建方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)