欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 单链环状文库的构建方法独创技术20473字

单链环状文库的构建方法

2021-03-09 11:42:54

单链环状文库的构建方法

  技术领域

  本发明涉及生物技术领域中,单链环状文库的构建方法。

  背景技术

  全基因组测序是对未知基因组序列的物种进行个体的基因组测序。比较常见的全基因组建库是基于illumina平台或者Proton平台的双链DNA文库,其试验流程大致如下:将基因组DNA经物理或化学的方法随机打断成180-280bp的片段,末端修复和加A尾后在片段两端分别连上接头,经链式聚合酶反应(polymerase chain reaction,PCR)线性扩增后进行质检,合格即可进行测序。

  单链环状文库是一种带有接头序列的闭合单链环状文库,其主要应用的平台有全基因组(Complete Genomics,CG)平台及BGISEQ-500等。目前常用的构建方法有两种:一种是常规全基因组单链环状文库构建方法,另一种是现有转座酶单链环状文库构建方法。

  常规全基因组单链环状文库构建流程如图1:将基因组DNA经物理或化学的方法随机打断成150-250bp的片段,末端修复和加A尾后在片段两端分别连上接头,经PCR线性扩增后进行纯化、单链分离及环化,此方法过程复杂,耗时较长。该方法操作复杂,需要进行打断、末端修复、接头连接、PCR等操作、单链分离、经环化桥环化,实验周期较长,不利于对疾病的快速诊断和研究。

  现有转座酶单链环状文库构建方法,如图2,文库构建流程为:将基因组DNA经转座酶的方法随机打断成180-280bp的片段,经扩增酶的作用进行缺口平移,然后经PCR线性扩增在片段两端分别添加上接头,然后进行纯化、单链分离及环化。转座酶是一种生物化学品,执行转座功能,通常由转座子编码,识别转座子两端的特异序列,能把转座子从相邻序列中脱离出来,再插入到新的DNA靶位点。利用其特性可以实现同时完成DNA片段化和序列插入。某些商业试剂盒,例如Epicentra公司(已被illumina收购)的Nextera试剂盒,利用转座酶同时实现DNA打断和接头的添加。此方法较简单快捷,但不利于环状单链文库。

  虽然利用转座酶构建单链环状文库简便快捷,但在转座时依赖转座酶特定的19bp ME(mosaic end,ME)序列,从而使得打断片段两端存在完全一样的ME序列。环状单链文库因此下游测序时,ME发生退火互补,影响测序引物的结合,使得测序质量和效率明显下降。另外该方法实验操作上还需要缺口平移和单链分离及经环化桥环化等操作。为了不浪费数据,下游测序方面还需要更换测序引物等操作,另外不方便和其他常规文库凑样,所以此方法操作方面相对繁琐且不灵活。

  所以亟需一种快速构建、可以有效的避免转座酶ME序列带来的下游测序影响建库方法。

  发明内容

  本发明所要解决的技术问题是如何构建单链环状文库。

  为解决上述技术问题,本发明首先提供了单链环状文库的构建方法,所述方法包括:

  1)利用转座酶复合体打断靶DNA,得到DNA打断产物;

  所述转座酶复合体包括转座酶和转座元件,所述转座元件由名称分别为A和B的接头组成;

  所述A由名称分别为a1和c1的单链DNA组成,所述a1由捕获标签、名称序列甲的单链DNA和所述转座酶的识别序列依次连接得到,所述序列甲为序列表中序列1的第1-16位所示的单链DNA;所述c1为所述识别序列的互补序列;

  所述B由所述识别序列所示单链DNA(名称为b1)以及所述c1组成;

  2)对所述DNA打断产物进行缺口平移,得到缺口平移产物;将所述缺口平移产物解链,利用所述捕获标签进行捕获得到含有所述捕获标签的单链DNA;

  3)将所述含有所述捕获标签的单链DNA环化,得到单链环状文库。

  所述靶DNA可为全基因组DNA,也可为其他需要测序的DNA。

  所述转座酶复合体可由所述转座酶和所述转座元件组成。

  所述转座酶复合体具体可由所述转座酶和所述转座酶形成的复合体。所述转座酶复合体具体可由所述转座酶和所述转座酶在25℃孵育60min得到。

  所述识别序列具体为所述转座酶实现转座所依赖的特定的19bp ME(mosaic end)序列。

  所述解链具体是指将双链DNA解链得到单链DNA。

  在利用所述转座酶复合体打断靶DNA时,所述接头A和所述接头B连接在打断的DNA片段的两端,得到所述DNA打断产物。

  上述方法中,步骤2)还可包括利用成套引物对所述含有所述捕获标签的单链DNA进行扩增,得到的扩增产物即为单链环状文库;

  所述成套引物由名称分别为P1、P2和P3的单链DNA组成;

  所述P1含有所述序列甲;

  所述P2为所述P1的5′端部分序列,所述P2的长度为15-33nt;

  所述P3为所述识别序列的3′端部分序列,所述P3的长度为6-19nt。

  上述方法中,所述成套引物中,所述P2的含量远大于所述P1和所述P3的含量。所述成套引物中所述P1、所述P2和所述P3的摩尔比可为a1)或a2):

  a1)1∶50∶1-1∶300∶1;

  a2)1∶100∶1-1∶200∶1。

  在本发明的一个实施例中,所述P1、所述P2和所述P3的摩尔比1∶200∶1。

  上述方法中,所述P1还可含有标签序列和/或用于对所述标签序列进行测序的标签测序引物和/或测序引物;所述标签序列为随机序列,所述标签序列的长度为b1)或b2):

  b1)6-16nt;

  b2)10nt。

  将所述标签序列的长度记为n,所述标签序列每个核苷酸为A、T、C或G,即可得到所述标签序列共有4n种,进一步,所述P1共有4n种序列。所述标签测序引物没有特殊要求,可用来测定所述标签序列的序列即可。

  所述测序引物没有特殊要求,可用来对所述单链环状文库进行测序即可。

  所述测序引物与所述标签测序引物可部分序列重叠。

  上述方法中,所述标签测序引物可为标签测序引物1和/或标签测序引物2;所述标签测序引物1为序列表中序列2的第18-32位所示的单链DNA,所述标签测序引物2为与序列表中序列2的第43-59位互补的单链DNA。

  所述测序引物可为测序引物1和/或测序引物2;所述测序引物1为序列表中序列2的第58-84位所示的单链DNA,所述测序引物2为与序列表中序列2的第1-25位互补的单链DNA。

  上述方法中,所述P1可由上述各部分连接得到,所述P1中的上述各部分可以重叠。所述P1的序列可为序列表中序列2所示的单链DNA。

  所述P2的序列可为序列表中序列3所示的单链DNA。

  所述P3的序列可为序列表中序列4所示的单链DNA。

  上述方法中,进行所述扩增的条件可如表8所示。

  上述方法中,所述转座酶可为TN5转座酶。

  所述识别序列可为序列1的第17-35位。

  所述捕获标签可为生物素。

  上述方法步骤2)中,将所述DNA打断产物打断可采用NaOH进行。利用所述捕获标签进行捕获得到含有所述捕获标签的单链DNA可包括:根据亲和素与生物素的结合特性采用亲和素捕获得到含有所述捕获标签的单链DNA。

  所述亲和素具体可为链霉亲和素。

  利用其他物质作为捕获标签替换生物素以及其他可与该捕获标签结合的物质替换亲和素来实现本发明的目的,也属于本发明的保护范围。

  上述方法步骤3)中,将所述含有所述捕获标签的单链DNA环化可采用单链环化酶进行。

  上述方法中,所述转座酶复合体可由所述转座酶和所述转座元件组成。

  本发明还提供了单链DNA前体文库的制备方法,所述方法包括所述单链环状文库的构建方法中的步骤1)和2)。

  本发明还提供了下述X1)-X5)中任一产品:

  X1)所述转座酶复合体;

  X2)所述转座元件;

  X3)所述成套引物;

  X4)成套试剂,由X41)和X42)组成;

  X41)所述转座酶复合体或所述转座元件;

  X42)所述成套引物;

  X5)成套试剂,由X4)与所述标签测序引物和所述测序引物组成。

  X4)和X5)所述成套试剂均可用于单链环状文库构建或DNA测序。

  本发明还提供了所述产品在单链环状文库构建或DNA测序中的应用。

  本发明的方法具有以下特点:

  1.工艺简洁,操作简单,不需要进行末端修复、加接头、单链分离等操作,可以缩短建库周期,提高建库效率,可以实现对疾病快速诊断和研究;

  2.利用转座酶的特性,只保留了一端的插入元件,不用进行单链分离操作,不受转座元件的影响,不用更换测序引物等,可实现与BGISEQ-500平台完美兼容,兼容性好,又避免了双端ME序列对下游测序的影响,同时可以和其他常规文库一起凑样上机测序。

  3.使用复合PCR技术,同时完成测序序列的添加和单链DNA的形成,省去转座酶建库的分离单链和中间纯化步骤;

  4.使用的试剂成分更少,可以实现低成本建库;

  5.只保留了一条正链,可以对后期分析有一定的帮助,为后期数据分析提供了一种解决思路。

  6.能够实现基本的核酸单链文库构建,并不区分外显子和内含子,不含内含子的基因组或通过转录形成的cDNA等均可通过本发明的方法实现单链环状文库的构建。

  附图说明

  图1为常规全基因组单链环状文库构建流程。

  图2为现有转座酶单链环状文库构建方法。

  图3为本发明的单链环状文库构建方法流程图。其中,引物1为引物P1,引物2为引物P2,引物3为引物P3。

  图4为单链环状文库的检测。其中,环化前表示实施例1步骤7得到的单链DNA前体文库;环化后表示对前体文库环化的结果,包含两条带,其中上面那条带为实施例1步骤8得到的单链环状文库。

  图5为本发明得到的单链环状文库的测序结果。其中,横坐标为染色体名称,纵坐标为平均测序深度。

  具体实施方式

  下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。序列表中各DNA序列的第1位均为相应序列的3′末端序列。

  本发明提供的单链环状文库的构建方法,流程如图3,包括:

  1)利用转座酶复合体打断靶DNA,得到DNA打断产物;

  转座酶复合体由转座酶和转座元件组成,转座元件由名称分别为A和B的接头组成;

  A由名称分别为a1和c1的单链DNA组成,a1由捕获标签、名称序列甲的单链DNA和转座酶的识别序列依次连接得到,序列甲为序列表中序列1的第1-16位所示的单链DNA;c1为所述识别序列的互补序列;

  B由转座酶的识别序列所示单链DNA以及c1组成;

  靶DNA与转座酶反应后,转座元件转座到靶DNA中,负向链并形成9nt缺口,而正向链不会存在缺口,所以打断后的DNA直接和转座元件序列相连接的只正向链;

  2)将DNA打断产物解链,利用捕获标签进行捕获得到含有捕获标签的单链DNA;然后进行PCR扩增,得到PCR扩增产物;

  3)将PCR扩增产物进行单链DNA环化,得到单链环状文库。

  下面以转座酶TN5及其识别序列AGATGTGTATAAGAGACAG为例具体阐述单链环状文库的构建方法。

  下述实施例中的转座酶(不含接头)为TN5(BGI产品);5x打断缓冲液为Vazyme Biotech公司产品;磁珠(Dynabeads M-280Streptavidin)及其结合缓冲液均为INVITROGEN产品;KAPA HiFi hot start MIX(2X)、5X kapa HiFi Buffer和KAPA HiFi DNA polymerase(1U/μl)均为KAPA Biotech产品;环化酶(CircLigaseTM II ssDNA Ligase)及其所用缓冲液(circligaseII 10x reaction buffer)均为EPICENTRE产品;PEG8000磁珠为SIGMA产品;TE缓冲液(TE Buffer)和无核酸水(Nuclease-free Water)均为AMBION产品。

  实施例1、单链环状文库的构建

  本实施例中采用50ng基因组用量进行测试,单链环状文库的构建方法如下:

  1.合成含生物素的接头序列(即单链DNA),接头序列包括a1、b1和c1三种,其中c1为a1和b1的公共序列(即TN5转座酶的识别序列,ME序列)互补序列。

  a1:(序列表中序列1,将序列1的第1-16位(即加粗部分)记为序列甲,下划线区域为转座酶TN5的识别序列,生物素作为捕获标签用于下面的单链DNA的捕获);

  b1:AGATGTGTATAAGAGACAG;

  c1:CTGTCTCTTATACACATCT。

  2.将步骤1的a1、b1和c1均稀释到200μM后,将a1和c1等量混合,得到a1-c1混合物;将b1和c1等量混合,得到b1-c1混合物。然后将a1-c1混合物及b1-c1混合物分别按如下表1程序进行退火,分别得到由a1和c1组成的接头A以及由b1和c1组成的接头B:

  表1

  

  将退火后得到的接头A以及接头B等摩尔混合,得到接头混合物(转座元件)。

  3.按如下表2中体系混合制备转座酶复合体:

  表2

  

  充分混匀,25℃孵育60min,孵育完后得到转座酶复合体,储存于-20℃备用。

  4.按如下表3中体系制备50ng基因组DNA打断体系:

  表3

  使用移液器轻轻吹打20次,充分混匀。将PCR管置于PCR仪中,按如下表4中程序进行反应:

  表4

  

  反应完成后,添加5μl 0.1%(质量百分比)的十二烷基硫酸钠(SDS)水溶液室温5min,终止反应,得到DNA打断产物。

  5.按如下表5体系制备缺口平移体系:

  表5

  

  使用移液器轻轻吹打20次,充分混匀。将PCR管置于PCR仪中,按如下表6中程序进行反应,得到缺口平移产物。

  表6

  

  6.按如下方法进行生物素-链霉素结合及链选择捕获含有捕获标签的单链DNA:

  (1)用漩涡混合仪剧烈振荡重悬DynabeadsM-280 Streptavidin Beads至混匀。每一个杂交反应取5μl DynabeadsM-280 Streptavidin Beads于一新的1.5ml离心管。将20μl结合缓冲液加入磁珠中,用漩涡混合仪剧烈振荡5秒钟重悬磁珠。再重复洗2遍,用20μl结合缓冲液重悬磁珠,得到磁珠悬浮液。

  (2)把步骤5的25μl缺口平移产物加入到步骤(1)的磁珠悬浮液中,涡旋混匀5s,将装有该混合液的离心管对称的固定于盘旋装置或类似的装置上360度旋转混匀,室温下孵育30min。

  (3)将离心管瞬时离心3s,然后放置在磁力架上,静置2min待液体完全澄清,小心吸取并弃去上清,得到沉淀。

  (4)向步骤(3)的沉淀中加入20μl 0.1M的NaOH水溶液,室温孵育10min溶解DNA,得到液体1。

  (5)将含有步骤(4)液体1的1.5ml离心管转移放置在磁力架上,静置2min待液体完全澄清,小心吸取并弃去上清,得到沉淀。

  (6)用100μl 75%乙醇溶液重悬步骤(5)得到的沉淀(即磁珠),并于漩涡混合仪上振荡5秒混匀样品,室温下孵育样品2min。将离心管瞬时离心3s,然后放置在磁力架上,静置2min待液体完全澄清,小心吸取并弃去上清,得到纯化产物(即磁珠),该磁珠上结合有含有a1的单链DNA。

  (7)用21μl无核酸水重悬步骤(6)得到的纯化产物,存储于-4℃,备用。

  7.按如下体系和方法进行复合PCR,以制备单链DNA前体文库:

  (1)配置如下表7中PCR反应体系:

  表7

  

  其中,引物P1的序列为:

  (下划线部分为标签序列(barcode序列),该序列为随机序列,N为A、T、C或G,引物P1的序列共有410种)。

  引物P2的序列为:

  AAGTCGGAGGCCAAG(序列表中序列3);

  引物P3的序列为:

  AAGAGACAG

  (2)将步骤(1)的反应体系按如下表8进行扩增:

  表8

  (3)扩增完成后,将得到的扩增产物按如下方法进行纯化,得到单链DNA前体文库:

  从4℃冰箱拿出PEG8000磁珠,室温放置10min。把上一步的扩增产物放置在磁力架上2min,待液体澄清后吸出液体加入到一新的管子中,再往该管子中加入60μl PEG8000磁珠,充分混匀,结合10min。然后把管子放在磁力架上2min,待液体澄清后吸弃液体。取下管子,用300μl 75%乙醇溶液重悬磁珠,并于漩涡混合仪上振荡5秒混匀样品,室温下孵育样品2min。将离心管瞬时离心3s,然后放置在磁力架上,静置2min待液体完全澄清,小心吸取并弃去上清。加入300μl 75%乙醇溶液重悬磁珠,并于漩涡混合仪上振荡5秒混匀样品,室温下孵育样品2min。将离心管瞬时离心3s,然后放置在磁力架上,静置2min待液体完全澄清,小心吸取并弃去上清。打开管子盖子,室温放置5min,待液体挥发干净后,用42μl TE缓冲液重悬磁珠,室温放置10min。将离心管瞬时离心3s,然后放置在磁力架上,静置2min待液体完全澄清,小心吸取40μl上清液至一新的管子中,该上清液即为单链DNA前体文库,储存在-20℃保存。

  8.按如下体系和方法进行文库环化制备单链环状文库:

  (1)根据单链DNA(single stranded DNA,ssDNA)的定量结果,调整步骤7的单链DNA前体文库的浓度至10pmol(650ng),将其在95℃放在5min后,直接放在冰上冷却,而后按照表9配制环化体系体系进行环化:

  表9

  

  (2)把配置的环化体系放置在PCR仪上,按如下表10条件反应进行环化:

  表10

  

  反应完成即得到单链环状文库,然后进行环化产物检测,检测结果如图4结果显示。

  9.将步骤8得到的单链环状文库在BGISEQ-500测序仪上测序,结果如表11所示。基因组DNA分别用两种测序引物进行双端测序,分别为序列表中序列2的第58-84位所示的单链DNA和与序列表中序列2的第1-25位反向互补的单链DNA。用两种barcode测序引物进行双端测序确定barcode的序列,所用barcode测序引物分别为序列表中序列2的第18-32位所示的单链DNA和与序列表中序列2的第43-59位反向互补的单链DNA。

  表11

  

  各染色体深度分布如图5所示。以上结果说明,本实施例构建的文库能够成功应用于测序。

  <110> 深圳华大生命科学研究院

  <120> 单链环状文库的构建方法

  <160> 4

  <170> PatentIn version 3.5

  <210> 1

  <211> 35

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 1

  ggctacgatc cgacttagat gtgtataaga gacag35

  <210> 2

  <211> 89

  <212> DNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (33)..(42)

  <223> n is a, c, g, or t

  <400> 2

  aagtcggagg ccaagcggtc ttaggaagac aannnnnnnn nncaactcct tggctcacag 60

  aacgacatgg ctacgatccg acttagatg 89

  <210> 3

  <211> 15

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 3

  aagtcggagg ccaag15

  <210> 4

  <211> 9

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 4

  aagagacag 9

《单链环状文库的构建方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)