欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种捕获文库构建方法及应用独创技术21099字

一种捕获文库构建方法及应用

2021-01-30 08:52:33

一种捕获文库构建方法及应用

  技术领域

  本发明涉及基因测序领域,特别是涉及一种捕获文库构建方法及应用。

  背景技术

  在二代测序中,常需要对特定基因组目标区域测序。目标区域测序,比较常用的方法是利用DNA或RNA探针杂交捕获目标基因或基因组区域的DNA片段,以提高测序的深度、准确性和灵敏度。杂交捕获过程中会用到一种必不可少的试剂-接头封闭序列。接头封闭序列是用来封闭文库的接头序列,防止引起二次杂交。如图1所示,杂交时双链文库变性为单链,单链文库中每个分子带有相同的接头序列,杂交过程中,与探针结合的单链文库分子,其接头序列部分,可能会结合其他非目标区域的单链文库分子。造成捕获特异性下降。如图2所示,接头封闭序列与接头序列碱基互补配对,使其不能与其它的接头序列互补,由此提高捕获的特异性。

  二代测序接头,均可被接头封闭序列高效封闭,显著提高中靶率。但是,接头封闭序列的成本较高,在整个杂交捕获过程的总成本中占了比较大的比例。杂交捕获文库构建过程中,如果可以省略或降低使用接头封闭序列,同时保持较高的中靶率,可以明显节省实验成本。

  发明内容

  鉴于以上所述现有技术的缺点,本发明的目的在于提供一种捕获文库构建方法及应用。

  本发明第一方面提供一种捕获文库构建方法,至少包括以下步骤:

  1)将片段化的DNA与接头连接,获得预文库;

  2)利用扩增引物对预文库进行扩增,获得富集文库;所述扩增引物包括上游引物和下游引物,所述上游引物或下游引物的一端设有修饰基团;或者,所述上游引物和下游引物的一端同时设有不同的修饰基团;所述富集文库中包括双链DNA;

  3)使用核酸酶消化所述富集文库,使得所述富集文库中的双链DNA的一条单链被消化;

  4)在不存在接头封闭序列或存在低于正常工作体积的接头封闭序列的情况下,将步骤3)获得的产物与杂交探针进行杂交捕获,获得捕获文库。

  本发明第二方面提供一种用于构建捕获文库的试剂盒,所述试剂盒包括:

  (1)用于连接接头的试剂,包括接头;

  (2)用于PCR扩增的试剂,包括扩增引物,所述扩增引物包括上游引物和下游引物,所述上游引物或下游引物的一端设有修饰基团;或者,所述上游引物和下游引物的一端同时设有不同的修饰基团;

  (3)用于杂交的试剂,不包括封闭序列。

  本发明第三方面提供一种捕获文库,采用前述的捕获文库构建方法或前述用于构建捕获文库的试剂盒构建。

  如上所述,本发明的一种捕获文库构建方法及应用,具有以下有益效果:

  本发明所述方法通过用核酸酶消化其中一条文库单链,产生的单链文库用于杂交,直接避免了杂交过程中文库互补单链间由于接头序列互补导致的二次杂交,从而提高捕获特异性。可以在不加或少量封闭序列的前提下,保持较好的捕获效率,显著降低测序成本。

  附图说明

  图1:现有技术中,无封闭接头序列时,杂交捕获过程示意图。

  图2:现有技术中,有封闭接头序列时,杂交捕获过程示意图。

  图3:本发明一实施例所述的无需接头封闭序列的捕获文库构建方法中,核酸酶消化示意图,T7外切酶切掉不带有硫代基团的文库单链,留下另一条带有硫代基团的文库单链。

  图4:本发明一实施例所述的无需接头封闭序列的捕获文库构建方法中,杂交捕获示意图,捕获时,由于不存在接头序列的互补链,因此捕获的特异性较高。

  具体实施方式

  以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。

  在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围;在本发明说明书和权利要求书中,除非文中另外明确指出,单数形式“一个”、“一”和“这个”包括复数形式。

  当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,如本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。

  除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。

  本发明一实施例的捕获文库构建方法,至少包括以下步骤:

  1)将片段化的DNA与接头连接,获得预文库;

  2)利用扩增引物对预文库进行扩增,获得富集文库;所述扩增引物包括上游引物和下游引物,所述上游引物或下游引物的一端设有修饰基团;或者,所述上游引物和下游引物的一端同时设有不同的修饰基团;所述富集文库中包括双链DNA;

  3)使用核酸酶消化所述富集文库,使得所述富集文库中的双链DNA的一条单链被消化;

  4)在不存在接头封闭序列或存在低于正常工作体积的接头封闭序列的情况下,将步骤3)获得的产物与杂交探针进行杂交捕获,获得捕获文库。

  本发明所述的方法可以不加封闭接头序列,也可以采用低于正常工作体积的接头序列,采用少量封闭接头序列。所述正常工作体积是指不同供应商接头封闭序列说明书中标示的使用体积。例如低于正常工作体积的接头序列可以为0-0.2ul,0.2-0.5ul,0.5-1ul,1-1.5ul,1.5-2ul(不包括2ul);大大减少了封闭接头序列的使用量。

  进一步的,步骤2)中,所述扩增引物中,所述修饰基团设于5’端一侧的碱基上。

  利用所述扩增引物获得的双链DNA具有两种状态:

  状态I、双链DNA的两条单链为带有修饰基团的单链和不带有修饰基团的单链;

  状态II、双链DNA的两条单链为带有不同修饰基团的单链。

  所述修饰基团的选择满足以下任一种条件:

  条件1、当获得的双链DNA满足状态I时,与不带有修饰基团的单链相比,带有修饰基团的单链更倾向于被酶切;

  条件2、当获得的双链DNA满足状态I时,与不带有修饰基团的单链相比,带有修饰基团的单链更不容易被酶切;

  条件3、当获得的双链DNA满足状态II时,带有不同修饰基团的单链中,仅有一条单链容易被酶切。

  选择满足以上任一条件的修饰基团进行修饰均可。

  步骤2)中,上游引物或下游引物中,被修饰的碱基的数量为1-10个。可以为1-3个,3-6个,6-10个等。

  步骤2)中,所述修饰基团的可选择使得DNA单链更易于或更难于被核酸酶消化的修饰基团。在一种实施方式中,所述步骤2)中,所述修饰基团的修饰方式可以选自生物素修饰、氨基修饰、磷酸化修饰、巯基修饰、硫代修饰或双脱氧碱基修饰。也可以选择其他使得DNA单链更易于或更难于被核酸酶消化的修饰基团。

  消化富集文库后,文库中的DNA仅有一条单链被保留下来。在后续的杂交捕获过程中,探针与目标单链文库结合,将目标序列捕获下来。由于与之互补的另一半单链文库已经被消化掉,因此不会造成由于接头自连或互补引起的非特异性捕获。

  所述片段化的DNA是指天然存在的短片段DNA或者通过人工打断基因组DNA获得的短片段DNA。

  在一个实施方案中,片段化的DNA可以源自血液、血清、血浆、关节液、精液、尿液、汗液、唾液、粪便、脑脊液、腹水、胸水、胆汁或胰腺液等。在一个优选的实施方案中,天然短片段DNA是外周血游离DNA、肿瘤游离DNA或自然降解的基因组DNA。在另一个实施方案中,基因组DNA可以有各种来源,例如来自外周血、干血斑、口腔拭子等。本领域技术人员知晓打断基因组DNA的方法,例如通过超声处理、机械打断或通过酶切等。由于超声处理和机械打断相对而言会损失较多的DNA,因此在起始DNA含量较少(例如,低至50ng)的情况下,优选用酶切的方法使DNA片段化。

  在一种实施方式中,所述片段化的DNA的长度为100-500bp。

  在一种实施方式中,所述方法还还包括在步骤1)之前,将片段化的DNA进行末端修复和/或末端加A的步骤。在该实施方案中,可以用本领域技术人员已知的任何适用于末端修复的酶对DNA进行末端修复,例如T4 DNA聚合酶、Klenow酶及其混合物。在该实施方案中,可以用本领域技术人员已知的任何适用于末端加A的酶对DNA进行末端加A。这种酶的实例包括但不限于Taq酶、Klenow ex-酶及其混合物。在该实施方案中,末端修复和末端加A可以在两个反应体系中进行,即,在末端修复后,经过纯化再进行末端加A。可替换地且为优选地,末端修复和末端加A在一个反应体系中进行,即,末端修复和末端加A同时完成,之后再对核酸进行纯化。或者,更加优选地,将DNA片段化、末端修复和末端加A三者在一个反应体系中进行,之后再连接接头。这样不仅简化了操作步骤、节约成本,同时也降低了样本间的污染。

  所述核酸酶为能够实现特异性地消化核酸单链功能的酶。在一种实施方式中,所述核酸酶选自T7外切酶、T5外切酶、Lambda外切酶或外切酶III。也可以采用其他的核酸酶,能够实现特异性地消化核酸单链功能的即可。

  所述接头为二代测序平台适用的接头类型。在一种实施方式中,所述接头可选自短Y型接头或长Y型接头。也可以选自其他二代测序平台适用的接头类型。

  在一种实施方式中,步骤1)可以用本领域技术人员已知的任何适用于连接接头的酶进行。这种酶的实例包括但不限于T4 DNA连接酶、T7 DNA连接酶或它们的混合物。进行连接反应的条件是本领域技术人员熟知的。

  在本发明的上下文中,Y型接头是指不完全互补的两条链形成的接头,所述接头的一端由于两条链的碱基互补形成双链,而另一端由于两条链的碱基之间不完全互补,没有形成双链。目前常用的Y型接头主要包括长Y型接头和短Y型接头。常规的长Y型接头主要包括扩增引物序列(P5/P7)、index标签序列、read 1/read 2测序引物序列和index read测序引物序列,其中read 1/read 2测序引物序列和index read测序引物的序列不完全互补形成一部分双链。常规的短Y型接头主要包括read 1/read 2测序引物序列和index测序引物序列,或部分read 1/read 2测序引物序列和部分index测序引物序列,其中read 1/read 2测序引物和index read测序引物的序列不完全互补形成一部分双链。这种短Y型接头通常需要搭配另外的包含P5/P7引物和index标签序列的接头一起使用。

  在本发明的上下文中,“封闭序列”是指用于封闭接头和标签序列的序列,包括设计为与接头和/或标签序列反向互补的序列。在一些实施方案中,为增加封闭序列的封闭效果,在封闭序列的末端添加特殊修饰,如反向dT修饰、氨基修饰、ddNTP修饰(包括ddCTP、ddATP、ddGTP和ddTTP)、间臂(spacer)修饰、次黄嘌呤修饰、随机碱基修饰等。

  本发明一实施例的用于构建捕获文库的试剂盒,所述试剂盒包括:

  (1)用于连接接头的试剂,包括接头;

  (2)用于PCR扩增的试剂,包括扩增引物,所述扩增引物包括上游引物和下游引物,所述上游引物或下游引物的一端设有修饰基团;或者,所述上游引物和下游引物的一端同时设有不同的修饰基团;

  (3)用于杂交的试剂,不包括封闭序列。

  所述扩增引物中,所述修饰基团设于5’端一侧的碱基上;

  所述修饰基团的修饰方式选自生物素修饰、氨基修饰、磷酸化修饰、巯基修饰、硫代修饰或双脱氧碱基修饰;

  所述接头可选自短Y型接头或长Y型接头。

  在一种实施方式中,所述核酸酶选自T7外切酶、T5外切酶、Lambda外切酶或外切酶III。

  所述试剂盒还包括用于进行末端修复和/或末端加A的试剂。

  上游引物或下游引物中,被修饰的碱基的数量为1-10个。

  用于扩增的试剂还包括缓冲液、PCR聚合酶。

  用于杂交的试剂包括杂交缓冲液、Cot-1 DNA和杂交探针,但不包括封闭序列。本领域技术人员根据实际需要可以调节杂交的条件,例如杂交温度、杂交时间等。设计和制备杂交探针的一般原理也是本领域技术人员熟知的。

  一种捕获文库,采用前述的捕获文库构建方法或前述的用于构建捕获文库的试剂盒构建。

  根据本发明方法制备的捕获文库可用于多种二代测序平台,包括但不限于如华大智造MGI/BGI、Roche/454FLX、Illumina/Hiseq、Miseq、NextSeq和Life Technologies/SOLID system、PGM、Proton等测序平台。

  实施例1:根据本发明的方法构建捕获文库

  步骤1:获得片段化的DNA、末端修复和末端加A

  使用翊圣的Hieff NGS Fast-Pace DNA Fragmentation Reagent(货号12609ES96),制备如表1所示的反应体系以一步完成片段化、末端修复和末端加A,并将该反应体系按以下程序进行反应:4℃,1min;30℃,17min;72℃,20min,然后保持在4℃。

  表1

  步骤2:连接接头

  (1)制备接头

  合成如Ad-SY5F和Ad-SY7R所示的序列:

  Ad-SY5F:

  A-*-CACTCTTTCCCTACACGACGCTCTTCCGATC-*-T(SEQ ID NO:1)

  Ad-SY7R:

  G-*-ATCGGAAGAGCACACGTCTGAACTCCAGTC-*-A(SEQ ID NO:2)

  此处*是指该序列为增加稳定性,本身带有的修饰序列,属于常规技术手段。

  将Ad-SY5F和Ad-SY7R所示的序列在以下条件下退火,以形成短Y型接头:95℃,2min;95℃,2min,以0.1℃/s的速率降温到90℃,并保持2min;以0.1℃/s的速率降温到85℃,并保持2min;以0.1℃/s的速率降温到80℃,并保持2min;以此类推,直到以0.1℃/s的速率降温到25℃,并保持2min;最后保持在4℃。

  (2)连接接头

  使用翊圣的快速DNA连接模块(货号12607ES96),用步骤1的反应体系配制如表2所示的连接体系,并将该连接体系在20℃温育15分钟,然后保持在4℃,获得预文库。

  表2

  步骤3:预文库筛选

  磁珠选用翊圣的Hieff NGS DNA Selection Beads(货号12601ES56)

  (1)往步骤2的体系中加100ul磁珠纯化一遍,用100ul Nuclease-free water洗脱。

  (2)加入70ul PEG溶液,混匀静置5min,吸取上清至新的离心管。

  (3)加入20ul磁珠纯化一遍,用23.5ul Nuclease-free water洗脱。

  步骤4:文库扩增

  根据表3配制反应体系,并按以下程序进行反应:98℃45s;98℃15s,65℃30s,72℃30s,8个循环;72℃1min;保持在4℃。获得富集文库,扩增引物序列如下,序列中*代表硫代修饰,引物R中NNNNNN序列为标签序列,用于后续测序数据中文库的拆分。

  F:

  A*ATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC*T(SEQ IDNO:3)

  R:

  CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC*T(SEQID NO:4)

  表3

  PCR结束后,用翊圣的Hieff NGS DNA Selection Beads(货号12601ES56)对富集文库进行纯化。

  步骤5:文库消化

  使用NEB的T7 Exonuclease(货号M0263)对纯化后的富集文库进行消化,该反应体系按以下程序进行反应:25℃,50min。

  根据表4配制反应体系:

  表4

  步骤6:杂交捕获

  使用IDT的xGen Hybridization and Wash kit(货号1080584)进行杂交捕获。根据表5配制浓缩体系:

  表5

  置于浓缩仪内浓缩至干粉。根据表6配制杂交体系:

  表6

  往干粉中加入杂交体系,吹打混匀后室温静置5-10min,离心后吸取全部液体至反应管中,按以下程序进行反应:95℃30s;65℃4h;保持在65℃(热盖100℃)。然后按照SOP进行捕获,即获得最终的捕获文库。

  对照实施例1

  本实施例的文库构建方法与实施例1基本相同,区别仅在于在步骤6的浓缩体系中还包括0.2μl封闭序列,所述封闭序列是xGen Universal Blockers-TS Mix(IDT,货号1076154)。

  对照实施例2

  本实施例的文库构建方法与实施例1基本相同,区别仅在于无步骤5,并在步骤6的浓缩体系中还包括2μl封闭序列,所述封闭序列是xGen Universal Blockers-TS Mix(IDT,货号1076154)。

  对照实施例3

  本实施例的文库构建方法与实施例1基本相同,区别在于无步骤5,并在步骤6的浓缩体系中还包括0.2μl封闭序列,所述封闭序列是xGen Universal Blockers-TS Mix(IDT,货号1076154)。

  对照实施例4

  本实施例的文库构建方法与实施例1基本相同,区别仅在于无步骤5。

  将以上实施例1和对照实施例1-3制备的捕获文库,按照测序仪标准操作流程,用Illumina NextSeq 500测序平台对文库进行测序(150bp单端测序),每个样本测得1G数据。测序结果如表7所示:

  表7

  从表7可以得出:

  (1)在不加封闭序列的前提下,经过外切酶消化的文库捕获效率要远远高于不经过外切酶消化的文库。

  (2)经过外切酶消化后,加少量的封闭序列,捕获效率高于无消化,少量封闭序列的方法,可以接近不经过外切酶消化,加正常量的封闭序列的方法。

  以上的实施例是为了说明本发明公开的实施方案,并不能理解为对本发明的限制。此外,本文所列出的各种修改以及发明中方法、组合物的变化,在不脱离本发明的范围和精神的前提下对本领域内的技术人员来说是显而易见的。虽然已结合本发明的多种具体优选实施例对本发明进行了具体的描述,但应当理解,本发明不应仅限于这些具体实施例。事实上,各种如上所述的对本领域内的技术人员来说显而易见的修改来获取发明都应包括在本发明的范围内。

  序列表

  <110> 上海韦翰斯生物医药科技有限公司

  <120> 一种捕获文库构建方法及应用

  <160> 4

  <170> SIPOSequenceListing 1.0

  <210> 1

  <211> 31

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 1

  cactctttcc ctacacgacg ctcttccgat c 31

  <210> 2

  <211> 30

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 2

  atcggaagag cacacgtctg aactccagtc 30

  <210> 3

  <211> 58

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 3

  aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

  <210> 4

  <211> 64

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 4

  caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60

  atct 64

《一种捕获文库构建方法及应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)