欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种基于双酶切的简化基因组测序文库的构建方法独创技术14860字

一种基于双酶切的简化基因组测序文库的构建方法

2021-03-23 19:14:11

一种基于双酶切的简化基因组测序文库的构建方法

  技术领域

  本发明属于全基因组重测序技术领域,尤其涉及一种基于双酶切的简化基因组测序文库的构建方法。

  背景技术

  全基因组重测序为基因组开发的分子标记在全基因组水平上通量高、覆盖度广,是一种快捷有效的技术手段。基于重测序数据的SNP开发与以往的标记系统相比具有许多优点,包括分布密度高、标记丰富、遗传性稳定性好、二等位基因型等特点。然而重测序样品建库成本高,限制在群体规模上的应用。而简化基因组测序技术为各物种开发高密度SNP标记,提供一个经济而高效的平台。

  简化基因组测序主要通过使用核酸内切酶来降低基因组的复杂性,它是指利用限制性内切酶将全基因组进行酶切打断,得到一定范围片段大小的文库,将酶切产生的片段作为全基因组研究的简化代表,降低基因组的复杂性。并且使用标签序列系统来区别模板DNA来生成多样品测序文库,是群体全基因组SNP开发的比较经济的方法。该技术的应用不仅针对已知参考基因组的物种,也适用于无参考基因组的物种研究。

  采用(Poland%20JA,Brown%20PJ,Sorrells%20ME,Jannink%20JL.Development%20of%20high-density%20genetic%20maps%20for%20barley%20and%20wheat%20using%20a%20novel%20two-enzymegenotyping-by-sequencing%20approach.PLoS%20One,2012,7(2):e32253.doi:10.1371/journal.pone.0032253.)公开的方法,利用两种限制性内切酶PstI和MspI对六个巨桉样品开展GBS建库测序,最终开发的SNP位点仅73,621个。

  发明内容

  有鉴于此,本发明的目的在于提供一种基于双酶切的简化基因组测序文库的构建方法,采用本发明提供的构建方法最终开发的SNP位点有225,744个。

  为了实现上述发明目的,本发明提供了以下技术方案:

  本发明提供了一种基于双酶切的简化基因组测序文库的构建方法,包括以下步骤:

  1)提取6个不同个体巨桉叶片的基因组DNA,利用限制性内切酶MspI和MseI对得到的基因组DNA分别进行酶切,得到酶切产物;

  2)将接头序列分别连接到步骤1)得到的酶切产物上,得到连接产物;

  所述接头序列包括GTACA、TACGC、AGTCA、GCATC、CTGAA和CATCG,1个接头序列连接到1个酶切产物上;

  3)将所述步骤2)分别得到的连接产物进行等纳摩尔量混合,将得到的混合物进行双轮磁珠分选,得到350bp的片段;

  4)以所述步骤3)得到的片段为模板,用引物对进行PCR扩增,将得到的扩增产物纯化后,构建得到基于双酶切的简化基因组测序文库;

  所述引物对的上游引物的序列如SEQ%20ID%20No.1所示,下游引物的序列如SEQ%20IDNo.2所示。

  优选的,所述步骤1)酶切的条件包括:37℃水浴4h;65℃失活20min。

  优选的,所述步骤2)连接使用体系每50μL包括:酶切产物30μL、接头序列5μL、T4LigationBuffer4μL、T4NDALigase0.5μL和ddH2O10.5μL。

  优选的,所述连接的条件包括:22℃连接2h;65℃失活20min。

  优选的,所述步骤4)PCR扩增使用的体系每25μL包括:片段10μL、5×NEBmix5μL、上游引物1μL、下游引物1μL和ddH2O8μL。

  优选的,所述PCR扩增的程序包括:95℃预变性30s;95℃变性30s、62℃退火20s、68℃延伸30s,共计16个循环;72℃延伸5min。

  优选的,所述步骤4)纯化采用柱式纯化的形式进行。

  优选的,所述连接产物的浓度使用Qubit3.0进行测定。

  本发明提供了一种基于双酶切的简化基因组测序文库的构建方法,包括以下步骤:1)提取6个不同个体巨桉叶片的基因组DNA,利用限制性内切酶MspI和MseI对得到的基因组DNA分别进行酶切,得到酶切产物;2)将接头序列分别连接到步骤1)得到的酶切产物上,得到连接产物;所述接头序列包括GTACA、TACGC、AGTCA、GCATC、CTGAA和CATCG,1个接头序列连接到1个酶切产物上;3)将所述步骤2)分别得到的连接产物进行等纳摩尔量混合,将得到的混合物进行双轮磁珠分选,得到350bp的片段;

  4)以所述步骤3)得到的片段为模板,用引物对进行PCR扩增,将得到的扩增产物纯化后,构建得到基于双酶切的简化基因组测序文库;所述引物对的上游引物的序列如SEQID%20No.1所示,下游引物的序列如SEQ%20ID%20No.2所示。本发明使用限制性内切酶MspI和MseI酶切巨桉叶片的基因组DNA,能够获得更多的SNP数目。

  具体实施方式

  本发明提供了一种基于双酶切的简化基因组测序文库的构建方法,包括以下步骤:

  1)提取6个不同个体巨桉叶片的基因组DNA,利用限制性内切酶MspI和MseI对得到的基因组DNA分别进行酶切,得到酶切产物;

  2)将接头序列分别连接到步骤1)得到的酶切产物上,得到连接产物;

  所述接头序列包括GTACA、TACGC、AGTCA、GCATC、CTGAA和CATCG,1个接头序列连接到1个酶切产物上;

  3)将所述步骤2)分别得到的连接产物进行等纳摩尔量混合,将得到的混合物进行双轮磁珠分选,得到350bp的片段;

  4)以所述步骤3)得到的片段为模板,用引物对进行PCR扩增,将得到的扩增产物纯化后,构建得到基于双酶切的简化基因组测序文库;

  所述引物对的上游引物的序列如SEQ%20ID%20No.1所示,下游引物的序列如SEQ%20IDNo.2所示。

  本发明提取6个不同个体巨桉叶片的基因组DNA,利用限制性内切酶MspI和MseI对得到的基因组DNA分别进行酶切,得到酶切产物。

  本发明对所述巨桉叶片的基因组DNA的提取方法没有特殊限定,采用常规提取方法即可,如CTAB法。

  在本发明中,所述酶切使用的体系每30优选包括:浓度为30ng/ul的基因组DNA10μL、MseI1μL、MspI1μL、SmartCutBuffer5μL和ddH2O13μL。在本发明中,所述酶切的条件优选包括:37℃水浴4h;65℃失活20min。

  本发明将接头序列分别连接到步骤1)得到的酶切产物上,得到连接产物;所述接头序列包括GTACA、TACGC、AGTCA、GCATC、CTGAA和CATCG,1个接头序列连接到1个酶切产物上。

  在本发明中,连接使用体系每50μL优选包括:酶切产物30μL、接头序列5μL、T4LigationBuffer4μL、T4NDALigase0.5μL和ddH2O10.5μL;所述连接的条件包括:22℃连接2h;65℃失活20min。

  在本发明中,1个接头序列连接到1个酶切产物上,保证不重复连接。

  本发明将分别得到的连接产物进行等纳摩尔量混合,将得到的混合物进行双轮磁珠分选,得到350bp的片段。在本发明中,所述350bp的片段指整个基因组DNA随机打断为350bp的片段,相当于对整个基因组片段随机测序,不是特指基因序列。因为测序读长是150bp,双端测序,加起来约300bp,350bp是比较适宜的长度,有利于最大程度开发SNP。

  在本发明中,所述等纳摩尔量混合具体优选为:将质量浓度转换成摩尔浓度,各个样品取相同的总纳摩尔量,计算出需要的体积,进行混养即可。例如,样品A.B.C.连接后QUbit测得的质量浓度分别为A1,B1,C1,根据公式:(样品摩尔浓度=(样品质量浓度/(片段长度*617.9*106))/10-12),转化为纳摩尔浓度A2,B2,C2,取总量为2000nM,则所需要的体积分别为2000/A2,2000/B2,2000/C2。总纳摩尔量的规定取决于混样群体中最小的质量浓度,最终取样体积需在连接反应后的体积内范围内。

  在本发明中,所述连接产物优选使用Qubit3.0进行测定浓度,测定浓度后再等质量混合。本发明优选使用诺唯赞VAHTSDNACleanBeads进行双轮磁珠分选,对分选方法没有特殊限定。

  本发明以得到的片段为模板,用引物对进行PCR扩增,将得到的扩增产物纯化后,构建得到基于双酶切的简化基因组测序文库;所述引物对的上游引物的序列如SEQ%20IDNo.1所示,下游引物的序列如SEQ%20ID%20No.2所示。

  在本发明中,所述纯化优选采用柱式纯化的形式进行。

  在本发明中,所述PCR扩增使用的体系优选每25μL包括:片段10μL、5×NEBmix5μL、上游引物1μL、下游引物1μL和ddH2O8μL。在本发明中,所述片段的浓度优选为10ng/uL。在本发明中,所述PCR扩增的程序包括:95℃预变性30s;95℃变性30s、62℃退火20s、68℃延伸30s,共计16个循环;72℃延伸5min。在本发明中,所述PCR扩增的目的是:1.对目标片段(350bp的片段)进行大量扩增;2.同时PCR的循环数对片段范围亦起到再次筛选的作用;3.能够在目标片段两端引入测序p5&p7序列,为了后期上机测序做准备。(注:一般的DNA建库中,接头序列已含有p5&P7序列,本发明是自主合成的接头序列,接头序列和P5&P7序列分步引入目标片段两侧);所述目标片段是分子量为350bp的DNA片段,不是特指某些基因,是整个基因组酶切后的片段。在本发明中,所述P5&P7序列包含在PCR扩增使用的引物中。

  在本发明中,所述基于双酶切的简化基因组测序文库是大量的350bp大小的DNA片段的混合文库,不是特指某些基因,是整个基因组酶切后的片段。

  下面结合实施例对本发明提供的技术方案进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。

  实施例1

  (1)巨桉DNA的提取:

  分别取6个不同个体的叶样0.3g,在液氮中研碎,转移至2mL离心管中,并加入1mLCTAB提取液,60~65℃保温45~60min,10min摇动一次。取出样品管,4℃、12000rpm离心10min,取上清液。加入等体积的氯仿:异戊醇(24:1),封口,摇匀;4℃、12000rpm离心10min,取上清液。加入等体积氯仿:异戊醇(24:1),12000rpm离心10min,取上清液。向上清液中加入冷藏的、2/3体积的异丙醇,轻轻晃动混匀,静置-20℃下1小时以上。12000rpm离心10min,倒掉上清液,加1mL70%和95%乙醇水溶液各洗一次,洗后将管倒置于卫生纸上吸干,真空浓缩仪中真空干燥5min。加入1×TE110μL,沉淀浸泡5~10min,弹动或振荡以充分溶解DNA。稍离心,溶液转入1.5mL离心管中,10000rpm离心5min,取上清液到另一1.5mL离心管,放-80℃长期保存。

  (2)双酶切消化:

  利用两种限制性内切酶MseI和MspI对第一步中提取的基因组DNA进行双酶切消化。

  限制性内切酶MseI识别序列如下:

  5’—T|TAA—3’

  3’—AAT|T—5’

  限制性内切酶MspI识别序列如下:

  5’—C|CGG—3’

  3’—GGC|C—5’

  酶切反应条件为:37℃水浴4h;65℃失活20min;4℃保存酶切产物。

  表1酶切和连接体系

  

  使用T4DNA连接酶将酶切后的限制性片段连接上接头序列,连接反应条件为:22℃连接2h,65℃失活20min,4℃保存连接产物。

  表2接头序列

  

  (3)定量混样和目标片段分选:将第二步连接好的产物进行Qubit3.0测定浓度,将连接好的产物稀释到10nM后等摩尔量混合,各取10μL,用移液枪轻微吸打混匀。所混合的样品不能有重复的标签序列。使用诺唯赞VAHTSDNACleanBeads进行双轮磁珠分选(样品体积100μL),将350bp大小的片段分选出来。

  (4)PCR扩增目标DNA片段及产物纯化:

  以分选完的350bp大小的DNA为模板,进行PCR扩增,PCR扩增体系为:

  表3扩增体系

  

  分选DNA片段的浓度为10ng/μL。

  PCR反应条件为:95℃预变性30s;后进入循环程序:95℃变性30s、62℃退火20s、68℃延伸30s,共计16个循环;72℃延伸5min,4℃保存备用;使用QIAquickPCR纯化试剂盒进行柱式纯化。

  引物F序列(SEQ ID No.1):

  AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT;

  引物R序列(SEQ ID No.2):

  CAAGCAGGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAA。

  (5)文库质检及测序:

  纯化后的文库用Qubit3.0测定浓度,稀释到约总浓度为2.0ng/μL后使用LabchipGXIITouch仪检测文库质量,利用Illuminanextseq500开展测序分析,测序长度为PE150。

  (6)数据质控及SNP开发:

  下机数据使用trimmomatic-0.36去除低质量(测序质量Q20<20,序列长度低于36bp)序列后,利用GATKv3.8初步开发SNP位点2,758,313个,利用vcftools过滤SNP位点,过滤标准为:数据在6个巨桉样品中无缺失,各位点支持的reads数目4条以上,至少一个样本为杂合SNP位点,经过筛选过滤后开发SNP位点225,744个。

  对比例1

  采用已发表文章(Poland JA,Brown PJ,Sorrells ME,Jannink JL.Developmentof high-density genetic maps for barley and wheat using a novel two-enzymegenotyping-by-sequencing approach.PLoS One,2012,7(2):e32253.doi:10.1371/journal.pone.0032253.)公开的方法,利用两种限制性内切酶PstI和MspI对相同六个巨桉样品开展GBS建库测序,并采用相同的过滤标准,选择相同的reads数目,最终开发的SNP位点仅73,621个。

  表4接头序列

  

  由以上对比例和实施例可以得出,采用本发明提供的构建方法最终开发的SNP位点有225744个,提高了SNP位点的开发。

  以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

  序列表

  <110> 中国林业科学研究院热带林业研究所

  <120> 一种基于双酶切的简化基因组测序文库的构建方法

  <160> 2

  <170> SIPOSequenceListing 1.0

  <210> 1

  <211> 58

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 1

  aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

  <210> 2

  <211> 47

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 2

  caagcaggaa gacggcatac gagatcggtc tcggcattcc tgctgaa 47

《一种基于双酶切的简化基因组测序文库的构建方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)