欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种适用于PacBio测序平台的扩增子混样测序文库构建方法独创技术16928字

一种适用于PacBio测序平台的扩增子混样测序文库构建方法

2020-12-05 18:17:10

一种适用于PacBio测序平台的扩增子混样测序文库构建方法

  技术领域

  本发明涉及文库构建技术领域,更具体地,涉及一种适用于PacBio测序平台的扩增子混样测序文库构建方法。

  背景技术

  PacBio平台(PacBio核酸测序平台)采用的是单分子实时测序(Single Molecule Real-Time)。PacBio平台的测序基于两个关键技术,第一,Pacific Biosciences公司发明的一种直径只有几十纳米的纳米孔,该纳米孔内只能容许单分子核酸在DNA聚合酶作用下进行反应,检测纳米孔中合成过程的A、T、C、G这四种荧光标记的脱氧核苷酸,即可实现核酸测序;第二,利用共聚焦显微镜实时、快速地对集成在SMRT cell上的无数的纳米孔同时进行记录。PacBio核酸测序平台,其平均读长可达10-15k,且测序不受AT和CG含量的影响,能够对高GC含量或低GC含量的区域进行测序,相比二代测序有较大优势。

  但PacBio核酸测序平台仍存在一些不足,例如目前已有的扩增子扩增时,并不会添加标签引物;即使引入标签,一般也是通过两轮PCR、或添加具体标签序列的接头来实现,这些步骤相对繁琐,并且成本也较高。而在Illumina测序平台上,一般是通过添加带有标签序列的接头,或在文库构建的最后一步通过PCR加入单端的标签序列,这些操作同样存在着流程相对复杂、成本高的问题。

  发明内容

  针对现有技术中存在的技术问题,本发明提出了一种适用于PacBio测序平台的扩增子混样测序文库构建方法,该方法将带有不同标签的扩增子混合,可实现多个扩增子样品仅需一次文库构建并实现测序,简化了实验操作流程,提高了建库效率,降低了测序成本。

  为实现上述目的,本发明是通过以下技术方案实现的:

  一种适用于PacBio测序平台的扩增子混样测序文库构建方法,包括如下步骤:

  (1)设计与合成带标签的扩增引物:每个待测样本设计并合成一对扩增子的扩增引物,其中每对引物的5’端带有标签序列,每对引物的5’端标签序列反向互补且唯一无重复;每对引物的3’端为扩增子的特异性引物;

  (2)扩增子样本的扩增:分别以各个样本DNA为模板、以对应的带标签的扩增引物为引物进行PCR扩增,扩增之后纯化PCR产物并确定片段的大小分布;

  (3)将每个样本的DNA扩增纯化产物等摩尔量混样,混样后总量大于2μg;

  (4)将混样扩增产物进行末端修复并纯化;

  (5)对步骤(4)中的纯化产物与平末端接头进行连接反应;

  (6)对步骤(5)获得的连接产物进行外切酶消化和纯化,得到适用于PacBio测序平台的扩增子混样测序文库。

  进一步地,所述步骤(2)中PCR扩增体系为:50ng/μL的样本DNA 5μL、10μM带标签的扩增引物F 3μL、10μM带标签的扩增引物R 3μL、5X HiFi高保真缓冲液10μL、10mM dNTP混合液1.5μL、1U/μL HiFi酶1μL、无核酸酶水26.5μL。

  进一步地,所述步骤(2)中扩增程序为:PCR反应程序为:98℃2min,20-25个循环×(98℃20s,65℃30s,72℃1kb/min),72℃5min。

  进一步地,所述步骤(2)中采用AMPure PB磁珠纯化PCR扩增产物。

  进一步地,所述步骤(4)中末端修复反应体系为:混样扩增产物36.5μL、10X DNA损伤修复缓冲液5μL、100X NAD+0.5μL、10mM ATP Hi 5μL、10mM dNTP 0.5μL、末端修复酶预混液2.5μL。

  进一步地,所述步骤(4)采用AMPure PB磁珠纯化PCR扩增产物。

  进一步地,所述步骤(5)连接反应体系为:纯化的末端修复产物31μL、20μM平末端接头2μL、10X模板预制缓冲液4μL、10mM ATP Low 2μL、30U/μL连接酶1μL。

  进一步地,所述步骤(6)中采用的外切酶为ExoIII和ExoVII外切酶。

  更进一步地,所述步骤(6)外切酶消化反应体系为:连接反应产物40μL、100U/μL外切酶III 1μL、10U/μL外切酶VII 1μL。

  进一步地,步骤(6)中对连接产物进行外切酶消化和纯化后还对文库片段大小进行检测。

  与现有技术相比,本发明的有益效果在于:

  (1)本发明提出的适用于PacBio测序平台的扩增子混样测序文库构建方法,针对多个样本,每个样本在实验开的第一步直接将标签序列分别添加至目标引物的5’端,即可在第一次复制时直接引入标签序列,且使同一次扩增的扩增子都标记有标签序列,这些标签序列在后续文库构建流程中一直保留,将带有不同标签的扩增子混合,可实现多个扩增子样品仅需一次文库构建并实现测序,简化了实验操作流程,提高了建库效率,降低了测序成本。

  (2)本发明的适用于PacBio测序平台的扩增子混样测序文库构建方法在设计标签序列时,使每种样本的两个引物的5’端添加的标签序列反向互补,从而在测序时两端均可能识别出标签序列,可以极大的提高扩增子样本的标签序列识别效率。

  附图说明

  图1为本发明的适用于PacBio测序平台的扩增子混样测序文库构建流程图。

  图2为本发明的扩增子标签引物结构示意图。

  具体实施方式

  展示一下实例来具体说明本发明的某些实施例,且不应解释为限制本发明的范围。对本发明公开的内容可以同时从材料、方法和反应条件进行改进,所有这些改进,均应落入本发明的的精神和范围之内。

  本发明提供的适用于PacBio测序平台的扩增子混样测序文库构建方法中所用试剂均可由市场购得;其中,AMPure PB磁珠、HiFi高保真缓冲液、dNTP混合液、HiFi酶购自KAPA公司,DNA损伤修复缓冲液、NAD+、ATP Hi、ATP Hi、平末端接头、模板预制缓冲液、ATP Low、连接酶、外切酶III、外切酶VII购自PacBio公司,无核酸酶水购自NEB公司。

  本发明针对现有的PacBio核酸测序平台应用于扩增子扩增的文库构建中,存在试剂成本过高、建库步骤复杂等技术问题,基于扩增子样本的扩增原理,结合PacBio测序技术的特征,在实验开始的第一步-扩增子样本的扩增中引入反向互补的标签序列,构思出本发明的适用于PacBio测序平台的扩增子混样测序文库构建方法。

  具体地如图1所示,该方法是通过以下步骤实现的:

  1.设计与合成带标签的扩增引物:每个待测样本设计一对扩增子的扩增引物,其中每对引物的5’端带有标签序列,每对引物的5’端标签序列反向互补且唯一无重复;每对引物的3’端为扩增子的特异性引物。扩增子标签引物结构如图2所示,其中FFFFFFFFFFFFFF表示F端特异性引物,RRRRRRRRRRRRRRRRRRRR表示R端特异性引物。

  设计好的引物在引物合成公司如上海生工等公司进行合成。

  2.扩增子样本的扩增:配制PCR反应体系,分别以各个样本DNA为模板、以对应的带标签的扩增引物为引物进行PCR扩增,扩增之后采用AMPure PB磁珠纯化PCR产物并确定片段的大小分布。

  其中PCR扩增体系为:50ng/μL的样本DNA5μL、10μM带标签的扩增引物F 3μL、10μM带标签的扩增引物R 3μL、5X HiFi高保真缓冲液10μL、10mM dNTP混合液1.5μL、1U/μL HiFi酶1μL、无核酸酶水26.5μL。扩增程序为:PCR反应程序为:98℃2min,20-25个循环×(98℃20s,65℃30s,72℃1kb/min),72℃5min。

  3.将每个样本的DNA扩增纯化产物等摩尔量混样,混样后总量大于2μg。

  4.混样扩增产物进行末端修复并用AMPure PB磁珠纯化。

  其中末端修复反应体系为:混样扩增产物36.5μL、10X DNA损伤修复缓冲液5μL、100X NAD+0.5μL、10mM ATP Hi 5μL、10mM dNTP 0.5μL、末端修复酶预混液2.5μL。

  5.对纯化的末端修复产物与平末端接头进行连接反应。

  其中连接反应体系为:纯化的末端修复产物31μL、20μM平末端接头2μL、10X模板预制缓冲液4μL、10mM ATP Low 2μL、30U/μL连接酶1μL。

  6.对连接产物进行外切酶消化和纯化,并对纯化产物进行文库质检,确定文库大小,从而得到适用于PacBio测序平台的扩增子混样测序文库。其中外切酶消化反应体系为:连接反应产物40μL、100U/μL外切酶III 1μL、10U/μL外切酶VII 1μL。

  实施例1:

  对9个不同的土壤样本分别提取DNA后进行带标签序列的引物扩增,扩增后进行等摩尔数混样,文库构建,采用PacBio Sequel测序1个cell,具体实验过程如下:

  1.带标签的扩增子引物的设计与合成

  该项目的目标是分析土壤样本中微生物的多样性,采用扩增微生物16S全长的方法进行土壤微生物成分分析。16S全长的通用引物为27F(AGRGTTYGATYMTGGCTCAG)与1492R(RGYTACCTTGTTACGACTT),根据通用引物设计的标签序列引物与对应的样本如表1,其核苷酸序列如SEQ ID NO:1-18所示,并将表1中的序列送至上海生工合成。

  表1

  2.扩增子样本的16S扩增

  (1)配制如表2所示的反应体系

  表2

  (2)充分混匀,瞬时离心,按照如下的PCR条件进行PCR扩增。

  (3)反应完成后,按照AMPure PB磁珠的使用说明进行磁珠纯化,最后使用11μL洗脱缓冲液洗脱,纯化完成。

  (4)取1μL纯化产物,使用无核酸酶水稀释10倍,取2μL稀释液进行Qubit定量,确定PCR产物的浓度与总量;取1μL稀释液进行安捷伦2100检测,确定片段的大小分布,以计算每个PCR产物的摩尔数,实现等摩尔量混样。

  3.混样

  (1)根据Qubit定量结果与安捷伦2100检测结果,进行等摩尔数混样,摩尔浓度计算公式如下:

  (2)取2μg混样扩增产物,使用无核酸酶水将体积稀释至36.5μL。

  (3)涡旋混匀,瞬时离心。

  4.末端修复

  (1)反应体系:

  表3

  (2)充分混匀,瞬时离心,25℃孵育5min,置于冰上;

  (3)使用AMPure PB磁珠进行纯化,最后使用31μL无核酸酶水洗脱。5.连接接头

  (1)按如下体系配置反应:

  表4

  (2)充分混匀,瞬时离心,25℃孵育15min,65℃孵育10min使连接酶失活。

  6.核酸外切酶消化

  (1)按如下体系配置反应:

  表5

  (2)充分混匀,瞬时离心,37℃孵育1h;

  (3)使用AMPure PB磁珠进行纯化,最后使用11μL无核酸酶水洗脱,11μL洗脱液即为构建好的文库。

  7.文库质检

  取1μL文库稀释5倍,取2μL稀释液进行Qubit定量,计算文库浓度;取1μL稀释液进行2100检测,确定文库大小。

  8.上机测序

  (1)根据文库质检的结果,按照PacBio Sequel测序的操作说明进行上机测序,测序1个Cell,产出3.97G数据。

  (2)对测序数据结果进行分析,数据拆分结果如下:

  表6

  

  从分析结果可以看出,单端识别标签序列的CCS可以达到90.1%,双端可以识别标签序列的CCS可以达到86.93%,说明该添加标签序列混样建库的方法在仅损失10%的数据比例情况下,可以实现混样建库测序。

  本发明的测序文库构建方法以PCR产物作为建库对象,相比原始的基因组片段而言,PCR产物比较完美,没有碱基缺失与单链断裂等缺陷,因此不需要进行碱基修复;本发明的方法也可实现多个扩增子样品仅需一次文库构建并实现测序,因此,降低了建库的试剂成本,减少建库周期,提高了建库效率,降低了测序成本。同时,本发明的方法广泛地适用于全长16S rDNA建库和全长转录组建库等。

  以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

  序列表

  <110> 武汉菲沙基因信息有限公司

  <120> 一种适用于PacBio测序平台的扩增子混样测序文库构建方法

  <160> 18

  <170> SIPOSequenceListing 1.0

  <210> 1

  <211> 36

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 1

  tcagacgatg cgtcatagrg ttygatymtg gctcag 36

  <210> 2

  <211> 35

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 2

  atgacgcatc gtctgargyt accttgttac gactt35

  <210> 3

  <211> 36

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 3

  ctatacatga ctctgcagrg ttygatymtg gctcag 36

  <210> 4

  <211> 35

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 4

  gcagagtcat gtatagrgyt accttgttac gactt35

  <210> 5

  <211> 36

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 5

  tactagagta gcactcagrg ttygatymtg gctcag 36

  <210> 6

  <211> 35

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 6

  gagtgctact ctagtargyt accttgttac gactt35

  <210> 7

  <211> 36

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 7

  tgtgtatcag tacatgagrg ttygatymtg gctcag 36

  <210> 8

  <211> 35

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 8

  catgtactga tacacargyt accttgttac gactt35

  <210> 9

  <211> 36

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 9

  acacgcatga cacactagrg ttygatymtg gctcag 36

  <210> 10

  <211> 35

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 10

  agtgtgtcat gcgtgtrgyt accttgttac gactt35

  <210> 11

  <211> 36

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 11

  gatctctact atatgcagrg ttygatymtg gctcag 36

  <210> 12

  <211> 35

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 12

  gcatatagta gagatcrgyt accttgttac gactt35

  <210> 13

  <211> 36

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 13

  acagtctata ctgctgagrg ttygatymtg gctcag 36

  <210> 14

  <211> 35

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 14

  cagcagtata gactgtrgyt accttgttac gactt35

  <210> 15

  <211> 36

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 15

  atgatgtgct acatctagrg ttygatymtg gctcag 36

  <210> 16

  <211> 35

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 16

  agatgtagca catcatrgyt accttgttac gactt35

  <210> 17

  <211> 36

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 17

  ctgcgtgctc tacgacagrg ttygatymtg gctcag 36

  <210> 18

  <211> 35

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 18

  gtcgtagagc acgcagrgyt accttgttac gactt35

《一种适用于PacBio测序平台的扩增子混样测序文库构建方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)