欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种靶向序列捕获及PCR建库方法独创技术15580字

一种靶向序列捕获及PCR建库方法

2021-03-10 05:33:38

一种靶向序列捕获及PCR建库方法

  技术领域

  本发明属于生物技术领域,特别涉及一种靶向序列捕获及PCR建库方法。

  背景技术

  靶向序列捕获技术主要基于探针杂交捕获技术或者基于多重PCR两大类。

  探针杂交捕获技术是指把特异性探针合成在固相或液相芯片上,从基因组文库中将靶基因序列捕获出来,主要产品如Nimble Gen Seq Cap Hybrid Capture(Roche)、SureSelect Hybrid Capture(Agilent)、TurSeq Capture(Illumina)和IDT Capture(IDT)为代表。

  锚定多重PCR技术则以PCR为基础,在同一PCR反应体系中加入多对引物,同时扩增出多个靶基因序列的PCR反应,主要产品如Halo Plex(Agilent)、AmpliSeq(Ion Torrent)、TruSeq Amplicon(Illumina)、Gene Read(Qiagen)、Clean Plex(Paragon)、Variant ProOne-step Capture PCR Technology(联川生物)、SLIM amp(Stem Loop InhibitionMediated Amplification,真固生物) 为代表。

  一方面,探针杂交捕获技术存在以下问题:1)对DNA起始量要求高,DNA量少时,会影响数据质量,甚至影响实验结果准确性,因此不适合稀有样本检测;2)探针合成需要生物素标记,后续实验还需要用昂贵的链霉亲和素磁珠进行靶序列富集,成本高,富集靶基因序列后仍需要post-PCR扩增;3)实验流程繁琐、费时费力、成本高;4)并且捕获新发的基因融合片段序列成功率不高,容易在洗涤过程中丢失;5)不能检测未知的基因融合变异。

  另一方面,锚定多重PCR的捕获技术均存在缺陷。比如,部分多重PCR技术不能有效避免引物二聚体的形成与扩增,如Variant Pro、Ampliseq;部分多重PCR技术不能有效抑制非特异扩增,如CleanPlex(Paragon);部分多重PCR技术不能有效避免连续基因序列扩增时引物Overlap区域的过度扩增,如CleanPlex(Paragon);部分多重PCR技术在PCR时才添加UID分子标签,不能及时标记原始DNA模板,影响了超罕见、超低频基因突变的检测,如VariantPro、Ampliseq、SLIMamp等技术。而且多重PCR技术,需要对每个样本分别进行PCR扩增和建库,成本较高。

  根据以上问题,研制新的一种靶向序列捕获及建库技术成为亟需解决的问题。

  发明内容

  本发明的目的在于提供一种靶向序列捕获及建库方法。

  本发明所采取的技术方案是:

  本发明第一个方面,提出了一种多样本靶基因序列捕获及NGS文库构建方法。根据本发明的实施例,所述方法包括以下步骤:

  1)根据需要捕获的靶基因区域设计特异性引物,特异性引物的5’端含有第一核酸序列;

  2)使用转座酶复合物对基因组DNA、互补DNA进行片段化,所述转座酶复合物由第二核酸序列、转座酶识别序列与转座酶组成;

  3)将上述片段化的DNA进行等量pooling,均一化样本捕获建库;

  4)锚定多重PCR,对上述已经pooling的样本进行多重PCR,捕获和扩增靶基因序列;

  5)PCR建库;通过PCR使所述靶基因序列添加完整的测序接头与二级Barcode,形成NGS文库。

  根据本发明的实施例,步骤1)所述特异性引物的设计可以选择PP5/PP6/Oligo6或多重 PCR引物设计软件,引物Tm值在63±3℃;模拟PCR时,无明显非特异扩增,无明显Hairpin 和Dimer。

  根据本发明的实施例,步骤1)所述特异性引物5’端含有第一核酸序列;所述第一核酸序列为部分测序接头序列,可以根据相应的基因测序仪测序接头进行调整,该序列为通用序列,如illumina平台则用P7端部分接头,如MGISEQ平台则用部分MGIAd_barcode序列,如IonTorrent平台则用部分A端接头序列;所述MGISEQ平台,第一核酸序列可用,但不限于:

  5’-AGACCGCTTGGCCTCCGACTT-3’。

  根据本发明的实施例,步骤2)所述转座酶复合物的第二核酸序列包括通用引物、一级 Barcode和UID标签序列。

  根据本发明的实施例,所述通用序列为一端测序接头的部分序列,如illumina平台则用 P5端部分接头,如MGISEQ平台则用部分MGIAd_Bottom序列,如IonTorrent平台则用部分 P端接头序列;所述通用序列的3’端含有一级Barcode和UID标签序列,所述一级barcode 由6-12个序列已知的N碱基组成,所述UID标签序列由6-15个序列未知的N碱基组成;所述MGISEQ测序平台,第二核酸序列的核苷酸序列如下:

  5'-CGACATGGCTACGATCCGACTTNNNNNNNNNNNNNNNNNNAGATGTGTATAAGA GACAG-3’。

  根据本发明的实施例,步骤2)所述转座酶识别序列核苷酸序列为:

  5'-CTGTCTCTTATACACATCT-3’。

  根据本发明的实施例,所述转座酶可为Tn5转座酶或具有相似功能的转座酶;优选的,所述转座酶为Tn5转座酶。

  根据本发明的实施例,步骤4)所述多重PCR扩增体系:

  

  和

  

  根据本发明的实施例,步骤4)所述多重PCR扩增程序:

  

  根据本发明的实施例,步骤5)所述PCR扩增体系:

  

  根据本发明的实施例,步骤5)所述PCR扩增程序:

  

  本发明首先利用转座酶将gDNA或cDNA片段化,在片段化DNA的同时添加第二核酸序列,有异于常规的转座酶建库,常规方法需要用2种接头序列,制备而成的转座酶复合物有3种。并且,常规转座酶片段化DNA会产生9bp的gap,往往需要DNA聚合酶进行gap 修复,本发明不需要进行gap修复,然后对片段化DNA即可进行qubit定量,多样本pooing。

  随后进行多重PCR扩增,扩增引物为GP primer和用于靶序列捕获的特异性引物,特异性引物序列5’端包含第一核酸序列,即使只有单端特异性引物与模板DNA结合,也可捕获成功。

  最后,进行第2轮PCR,以第二核酸序列中的GP primer序列和特异性引物中的第一核酸序列作为锚定PCR序列,引入完全的NGS测序接头及二级Barcode,一步PCR即完成NGS文库构建,至此,同时完成了多个样本的靶基因序列捕获和文库构建。

  使用本发明制备的转座酶复合物片段化DNA时,得到的片段DNA都含有该通用序列,多重PCR捕获时,可以与单端特异性引物一起捕获并放大目标基因片段,因此,与常规多重 PCR每个目标基因片段分别需要1对正反向特异性引物进行序列捕获和放大不同。

  本发明的有益效果是:

  1)本发明提供一种核苷酸引物,无须修饰以及使用昂贵的链霉亲和素磁珠富集。

  2)用转座酶对gDNA或cDNA进行了片段化,片段化的同时插入了一级barocde和UID分子标签,因此,后续可以对多样本进行pooling后,多样本同时进行靶基因序列捕获和文库构建,大大降低了生产成本,提高生产效率。另外,核酸样本的片段化,可以同时进行多重PCR,有效避免了连续基因序列的捕获时overlap区域的过度扩增和非特异扩增。

  3)添加了UID分子标签,对原始DNA样本分别添加独特的分子标记,为准确检测更罕见或低频的基因突变提供了保障。

  通过转座酶介导的锚定多重PCR技术,可以同时对多样本进行靶基因序列捕获和测序文库构建,只需要2步PCR,即可完成靶序列捕获和建库,实验流程大大缩短,仅需要3h即可完成。

  附图说明

  图1为本发明转座酶复合物的结构,含Barcode及UID(以NNNNNNNNN表示)。

  图2本发明的PCR靶向捕获及建库技术流程图。

  图3均一化样本捕获建库。

  具体实施方式

  下面结合实施例对本发明中的技术方案进行清楚、完整的说明,但并不局限于此。

  实施例1

  本实施例以靶向捕获DMD(假肥大性肌营养不良)基因27kb外显子区域,并构建华大智造MGISeq SE400测序文库为例进行说明。

  1.特异性引物设计。

  根据目的基因DMD基因27kb外显子区域设计特异性引物,引物Tm值在63±3℃,模拟 PCR时,无明显非特异扩增,无明显Hairpin和Dimer。特异性引物序列5’端含有第一核酸序列,为了后续PCR建库时起着锚定作用。

  特异性引物的核苷酸序列为:

  5’-AGACCGCTTGGCCTCCGACTT-3’(SEQ ID NO.1)。

  2.转座酶复合物制备。

  1)转座子DNA退火

  Tn5(Epicentre)转座酶绑定序列的5’端添加第二核酸序列,第二核酸序列包括GPprimer、一级Barcode以及UID分子标签。其中GP primer在锚定多重PCR和PCR建库中起重要作用,一级Barcode(序列已知,用于区分不同样本,以NNNNNNN表示)和UID分子标签(以随机N碱基组成),第二核酸序列的核苷酸序列为:5'- CGACATGGCTACGATCCGACTTNNNNNNNNNNNNNNNNNNAGATGTGTATAAGAGACA G-3’(SEQ ID NO.2);

  转座酶识别序列:

  5'PHO-CTGTCTCTTATACACATCT-3’(SEQ ID NO.3);

  将2条引物(第二核酸序列以及转座酶识别序列)取等摩尔量混合,使用OligoAnnealing Buffer进行退火。退火完成后使用Agilent 2100DNA1000 Kit进行质检,要求片段单一,无明显杂峰。

  2)转座酶复合物制备

  取等量的退火好的转座子DNA与Tn5转座酶(Epicentre),室温孵育30分钟,制备成转座酶复合物,转座酶复合物结构如图1。

  3.gDNA片段化。

  反应体系如表1:4℃进行操作。

  表1

  轻轻吹打,短暂离心,置于PCR仪,反应程序为:55℃10min,95℃10min,4℃hold,热盖on。

  4.多样本pooling。

  每个片段化DNA样本各取10μL进行均一化,混匀成Tag fragment DNA Mix(图3)。

  5.多重PCR。

  多重PCR反应体系(表2和表3),4℃配制。SP Primer序列5’端是第一核酸序列通用序列。

  表2

  或

  表3

  

  

  吹打混匀,短暂离心,进行PCR实验,PCR程序如表4。

  表4

  

  6.PCR结束后,短暂离心,取2μL PCR产物进行PCR建库。

  7.PCR建库。

  使用MGI-PCR-1primer mix与MGI-PCR-Barcode引物进行PCR扩增,往多重PCR产物引入完全的测序接头与Barcode,形成NGS测序文库。

  其中,MGI-PCR-1引物的核苷酸序列为:

  /5Phos/GAACGACATGGCTACGATCCGACTT(SEQ ID NO.4)和 /5Phos/GAACGACATGGCTACGA(SEQ ID NO.5);

  MGI-PCR-Barcode引物的核苷酸序列为:

  5’-TGTGAGCCAAGGAGTTGNNNNNNNNNNTTGTCTTCCTAAGACCGCTTGGCCTCC GACTT-3’(SEQ ID NO.6),

  其中NNNNNNNNNN对应Barcode标签序列,和5’-TGTGAGCCAAGGAGTTG-3’。

  PCR反应体系与PCR程序(表5、6)进行PCR扩增反应。

  表5

  

  表6

  

  

  8.扩增产物磁珠纯化。

  将PCR扩增产物用Nuclease-free water补至50μL,添加45μL XP磁珠进行纯化,80%乙醇漂洗2次,最后用30μL Elution Buffer洗脱,至止完成PCR建库。

  9.文库质检、环化、Make DNB及MGI2000 SE400测序。

  10.数据分析。

  检测结果统计信息见表7,结果表明本方法实现了DMD基因27kb外显子的完全覆盖(靶基因区域覆盖度100%),并且捕获效率高(中靶率>94.5%)与主流多重PCR捕获技术相当,均一性较好(≥0.2x平均测序深度的靶基因区域覆盖度>95%)与主流多重PCR捕获技术(表现优秀的方法0.2x平均测序深度的靶基因区域覆盖度在90%-98%范围内)相当。所有样本的数据产出较均一,说明多样本同时捕获的效果也比较理想。

  表7

  

  综上,本靶向序列捕获与建库技术,检测性能与多重PCR靶向捕获和建库技术准确度一样。本发明可对多样本同时进行靶向捕获与建库,二步PCR即可完成,是一种快速、经济、有效的靶向捕获与建库技术。

  实施例2

  本实施例以靶向捕获肺癌70基因,并构建华大智造MGISeq PE150测序文库为例进行说明。

  1.样本信息。为验证本方法可以检测罕见突变及基因融合,从A公司多重PCR技术检测结果中,挑选几个已知突变的阳性DNA样本,和89个阴性样本,其中阳性样本信息如下(表8):

  表8

  2.转座酶复合物制备。同实施例1。

  3.gDNA/cDNA片段化、多样本pooling、锚定多重PCR、PCR建库以及MGISeq 2000PE150测序,操作参考实施例1。

  4.数据分析。

  检测结果如表9,检测结果与实验设计高度吻合,证明本方法适合检测罕见突变与基因融合变异。此外,本方法检验时发现了一例假阴性样本,检出de novo变异,后续经RT-qPCR 实验设计和Sanger测序,验证了该样本的de novo变异。

  阳性样本检测结果与A公司检测结果比较如下:

  本技术检测结果中,突变率比A公司低的原因,是本发明给原始DNA模板添加了UID分子标签才进行PCR扩增,可以定量原始DNA模板量与基因突变频。而A公司是PCR扩增时才添加UID分子标签,只能对扩增子添加UID分子标签,扩增子是否来源于相同的原始 DNA模板是未知的。因此,本发明能更真实反应待检测样本的突变情况。

  表9

  阴性样本检测结果统计,89例阴性样本,使用本发明方法得到的检测结果有88例,1例新发罕见基因融合变异,后续经RT-PCR和Sanger验证了该变异的存在,证明了本方法的准确度。

  上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

  SEQUENCE LISTING

  <110> 广州精科医学检验所有限公司

  <120> 一种靶向序列捕获及PCR建库方法

  <130>

  <160> 6

  <170> PatentIn version 3.5

  <210> 1

  <211> 21

  <212> DNA

  <213> 人工序列

  <400> 1

  agaccgcttg gcctccgact t 21

  <210> 2

  <211> 59

  <212> DNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (23)..(40)

  <223> n is a, c, g, or t

  <400> 2

  cgacatggct acgatccgac ttnnnnnnnn nnnnnnnnnn agatgtgtat aagagacag 59

  <210> 3

  <211> 19

  <212> DNA

  <213> 人工序列

  <400> 3

  ctgtctctta tacacatct 19

  <210> 4

  <211> 25

  <212> DNA

  <213> 人工序列

  <400> 4

  gaacgacatg gctacgatcc gactt 25

  <210> 5

  <211> 17

  <212> DNA

  <213> 人工序列

  <400> 5

  gaacgacatg gctacga 17

  <210> 6

  <211> 59

  <212> DNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (18)..(27)

  <223> n is a, c, g, or t

  <400> 6

  tgtgagccaa ggagttgnnn nnnnnnnttg tcttcctaag accgcttggc ctccgactt 59

《一种靶向序列捕获及PCR建库方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)