欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种测序文库的构建方法及试剂盒和应用独创技术21900字

一种测序文库的构建方法及试剂盒和应用

2021-03-22 05:35:34

一种测序文库的构建方法及试剂盒和应用

  技术领域tt

  本发明涉及测序技术领域,尤其涉及一种测序文库的构建方法及试剂盒和tt应用。tt

  背景技术tt

  新一代测序技术以高通量、低成本的优势,自出现之日起就倍受欢迎。tt随着技术的发展,新一代测序技术在许多科学研究和临床检测方面都有应tt用。tt

  目前很多科学研究与临床应用需要在单个细胞水平进行,或者在微量水tt平进行。在单细胞水平分析DNA遗传变异信息,判断细胞、胚胎或个体是tt否患病或携带疾病基因,亦是常见的研究方法。例如,在辅助生殖技术中的tt植入前诊断(PreimplantationGeneticDiagnosis),涉及对配子细胞、单个卵tt裂球细胞或胚胎细胞进行DNA遗传检测,判断受精卵或胚胎的基因型是否tt正常,选取正常的胚胎进行植入。tt

  测序仪方面,LifeTechnologies公司研发的IonProton测序仪采用新一tt代半导体测序技术,以小型化、快速的优势得到了广泛的欢迎。tt

  在实际利用IonProton测序仪完成单细胞检测染色体数目异常(CNV)tt中,很多时候对时效性要求相当高,例如在辅助生殖技术中的植入前诊断,tt在胚胎不冻存的情况下,需要24小时得出检测结果,这就需要在检测的每tt一个环节都尽可能缩短时间。tt

  测序文库的构建是通过测序实现单细胞染色体数目异常检测的必经步tt骤,传统的测序文库构建方法主要是通过打断仪(如Covaris)等对基因组ttDNA等靶DNA进行机械打断,然后通过末端修复、添加接头等步骤实现(如tt图1中左侧的PF文库构建流程所示)。基于机械打断的片段随机性良好,tt但是通量上也要依赖大量的Covaris打断仪,同时需要后续单独进行末端处tt理、加接头和PCR以及各种纯化操作。tt

  通过转座酶同时实现DNA片段化和接头的添加,完成测序文库构建的tt方法已经有报道,比如国际专利申请WO2010/048605公开了一种转座子末tt端组合物和方法,能够用于测序文库的构建,这种方法能够减少样品处理的tttttt时间。但是,由于通过转座酶实现的DNA片段化和接头的添加只能在靶ttDNA的5’端加上标签,还需要一步DNA聚合酶等核酸修饰酶催化的3’端tt标签序列添加,才能得到双接头的DNA文库,这不可避免的增加了文库构建tt的耗时。tt

  发明内容tt

  本发明提供一种测序文库的构建方法及试剂盒和应用,所述测序文库的构tt建方法使用转座酶实现一步法打断DNA并在5’端和3’端分别加入测序接头,tt测序接头中包含样品标签信息,能够同时实现不同来源样品的测序,进一步tt实现染色体数目异常检测,该方法比常规文库构建方法节省时间,并且操作tt简单,对实验设备和反应条件的要求较低,利于新一代测序检测单细胞或微tt量DNA技术的推广应用。tt

  根据本发明的第一方面,本发明提供一种测序文库的构建方法,所述方法tt包括:将靶DNA与转座酶包埋复合物在转座反应的条件下孵育,产生两端带有tt双接头的DNA文库;其中,所述转座酶包埋复合物包括转座酶、转座酶识别序tt列互补序列、第一测序接头序列和第二测序接头序列,所述第一测序接头序列tt包括5’端的第一测序标签序列和3’端的转座酶识别序列,所述第二测序接头序tt列包括5’端的第二测序标签序列、样品标签序列和3’端的转座酶识别序列。tt

  本发明所用的靶DNA可以是基因组DNA或扩增的DNA,如全基因组扩tt增的DNA。其中,基因组DNA的样品来源可以是人类单细胞、少数几个细tt胞或微量DNA样品等。细胞类型可以是植入前遗传检测的胚胎细胞,癌症tt研究的单个肿瘤细胞,产前诊断的母体外周血有核红细胞、血浆、羊水,病tt理学研究的组织切片等。tt

  本发明中,所述的全基因组扩增是指对单个细胞、几个细胞或微量核酸tt样品进行全基因组范围的扩增,其方法可以是部分随机引物扩增tt(DegenerateOligonucleotidePrimerPCR,缩写DOP-PCR)、完全随机引物tt扩增(PrimerExtensionPreamplificationPCR,缩写PEP-PCR)、多重链置换tt扩增(MultipleDisplacementAmplification,缩写MDA)、OmniPlexWGAtt等方法中的任一种。也可采用商业试剂盒如QIAgen公司的REPLI-g,SigmattAldrich公司的GenomePlexWGA,NewEnglandBiolabs公司的Sureplex,ttttttRubiconGenomics公司的PicoPlexWGA,GEHealthcare公司的illustrattGenomiphiV2等试剂盒中的任一种。tt

  本发明的方法可对新一代高通量半导体测序平台产生的测序序列进行tt染色体拷贝数分析。其中,新一代高通量半导体测序平台包括并不限于IonttTorrentTM和IonProtonTM测序平台。tt

  本发明中,所述样品标签序列为随机序列,优选6-14个碱基的随机序列,tt更优选10个碱基的随机序列,由于随机序列的每一个位点均有A、T、C和Gtt四种选择,理论上随机序列若有N个碱基可产生4N个样品标签序列,因此10tt个碱基的随机序列足够标记测序样品。tt

  作为本发明的优选技术方案,所述第二测序接头序列在样品标签序列与3’tt端的转座酶识别序列之间还包括测序特殊碱基“GAT”。在样品标签序列后加入tt三个碱基“GAT”,避免出现两个连续的C,以免在后续分析时造成标签识别出tt错。tt

  作为本发明的优选技术方案,所述第一测序标签序列和/或第二测序标签序tt列选自IonTorrentTM或IonProtonTM测序平台的标签序列;因此,本发明的tt方法适用于IonTorrentTM或IonProtonTM测序平台。tt

  作为本发明的优选技术方案,所述转座酶识别序列为转座酶Tn5识别的tt19bp的嵌合端转座子末端。tt

  作为本发明的优选技术方案,所述转座酶识别序列互补序列具有SEQIDttNO:1所示的碱基序列;所述第一测序接头序列具有SEQIDNO:2所示的碱tt基序列;所述第二测序接头序列具有SEQIDNO:3所示的碱基序列。tt

  其中,SEQIDNO:1为5'-CTGTCTCTTATACACATCT-3'。需要说明的是,tt本发明的转座酶识别序列互补序列并不局限于SEQIDNO:1所示的碱基序列,tt在其5’端和3’端均可以有若干附加的碱基序列。SEQIDNO:2为:tt

  5'-CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATAGATGTGTATAAGAGACAG-3';其中,下划线部分为转座酶识别序列,非下划线部分为第tt一测序标签序列。需要说明的是,本发明的第一测序接头序列并不局限于SEQIDttNO:2所示的碱基序列,在转座酶识别序列和第一测序标签序列前后以及它们tt之间还可以有若干附加的碱基序列或连接序列。SEQIDNO:3为:tt

  5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGNNNNNNNNNNGATAGATGTGTATAAGAGACAG-3';其中,下划线部分为转座酶识别序列,NNNNNNNNNNtt为样品标签序列,每个N可选自A、T、C和G中任一个,NNNNNNNNNN之tt前的序列为第二测序标签序列,之后的GAT为测序特殊碱基。需要说明的是,tt本发明的第二测序接头序列并不局限于SEQIDNO:3所示的碱基序列,在转座tt酶识别序列之前和/或之后还可以有若干附加的碱基序列或连接序列,在第二测tt序标签序列之前还可以有若干附加的碱基序列。tt

  根据本发明的第二方面,本发明提供一种用于构建测序文库的试剂盒,所tt述试剂盒包括转座酶识别序列互补序列、第一测序接头序列和第二测序接头序tt列,所述第一测序接头序列包括5’端的第一测序标签序列和3’端的转座酶识别tt序列,所述第二测序接头序列包括5’端的第二测序标签序列、样品标签序列和3’tt端的转座酶识别序列。tt

  作为本发明的优选技术方案,所述样品标签序列为随机序列,优选6-14个tt碱基的随机序列,更优选10个碱基的随机序列。tt

  作为本发明的优选技术方案,所述第二测序接头序列在样品标签序列与3’tt端的转座酶识别序列之间还包括测序特殊碱基“GAT”。tt

  作为本发明的优选技术方案,所述第一测序标签序列和/或第二测序标签序tt列选自IonTorrentTM或IonProtonTM测序平台的标签序列。tt

  作为本发明的优选技术方案,所述转座酶识别序列为转座酶Tn5识别的tt19bp的嵌合端转座子末端。tt

  作为本发明的优选技术方案,所述转座酶识别序列互补序列具有SEQIDttNO:1所示的碱基序列;所述第一测序接头序列具有SEQIDNO:2所示的碱tt基序列;所述第二测序接头序列具有SEQIDNO:3所示的碱基序列。tt

  作为本发明的优选技术方案,所述试剂盒还包括转座酶,所述转座酶优选tt为转座酶Tn5,本发明一个具体实施例选用了Vazyme公司的TagmentEnzyme,tt但是其它这类转座酶也适用于本发明。tt

  作为本发明的优选技术方案,所述试剂盒还包括用于切口平移反应的DNAtt聚合酶,本发明一个具体实施例选用了LifeTechnologies公司的PlatinumPfxttDNA聚合酶,但是其它这类DNA聚合酶也适用。DNA聚合酶能够通过切口平tt移(nicktranslation)反应补平转座酶打断DNA后的切口,利于后续测序的进行。tt

  第一方面中的说明也适用于第二方面,二者并无实质差别,所以在此不再tttttt赘述。tt

  需要说明的是,本发明中“第一”、“第二”等概念仅用于区分不同的表述对象,tt并能理解为有技术含义或有顺序限定的含义。tt

  根据本发明的第三方面,本发明提供如第二方面所述的试剂盒在测序文库tt的构建并通过测序进行染色体数目异常检测中的应用,优选在单细胞染色体数tt目异常检测中的应用。tt

  相比现有技术,本发明的优势体现在:本发明的测序文库的构建方法使用tt转座酶识别序列互补序列、第一测序接头序列和第二测序接头序列,其中第二tt测序接头序列含有一段特别的样品标签序列作为样品的标签信息,使用转座酶tt能够实现一步法打断DNA并在5’端和3’端同时加入不同的测序接头,不需tt要像现有的基于转座酶的DNA打断方法那样通过DNA聚合酶等核酸修饰酶tt催化添加3’端标签序列。本发明的测序接头中包含样品标签信息,能够同时tt实现不同来源样品的测序,进一步实现染色体数目异常检测。本发明的方法tt比常规文库构建方法节省时间,可以节约文库构建耗时近5个小时,并且操tt作简单,对实验设备和反应条件的要求较低,利于新一代测序检测单细胞或tt微量DNA技术的推广应用。tt

  附图说明tt

  图1为传统的PF文库构建流程(左)和本发明的转座酶建库流程(右)对tt比图。tt

  图2为本发明利用转座酶一步完成DNA打断和测序接头连接的原理示意tt图。tt

  图3为本发明中的样本S1采用本发明方法(a和c)和常规建库方法(b和ttd)建库测序分析得到的核型图(a和b)和结果峰图(c和d)比较。tt

  图4为本发明中的样本S2采用常规建库方法(a和c)和本发明方法(b和ttd)建库测序分析得到的核型图(a和b)和结果峰图(c和d)比较。tt

  具体实施方式tt

  下面通过具体实施方式结合附图对本发明作进一步详细说明。tt

  如图1所示,传统的PF文库构建流程(图1中左图)包括Covaris打断仪tt打断DNA、末端修复、加接头、质量检测、混库(pooling)、缺口平移、再次tt质量检测和上机等步骤;而本发明的转座酶建库流程(图1中右图)包括转座tttttt反应混合液配置、转座反应(DNA片段化同时加接头)、质量检测、混库(pooling)、tt缺口平移、再次质量检测和上机等步骤。可见,本发明的转座反应一步代替了tt传统的Covaris打断仪打断DNA、末端修复和加接头三个步骤,明显节省了时tt间。tt

  如图2所示,本发明利用转座酶一步完成DNA打断和测序接头连接的原理tt为:转座酶识别序列-反向(ME-r,即转座酶识别序列互补序列)分别与测序接tt头序列1(即第一测序接头序列)和带标签的测序接头序列2(即第二测序接头tt序列,其中标签即样品标签序列)退火形成接头,然后将接头与转座酶包埋形tt成转座酶包埋复合物,再将该转座酶包埋复合物与基因组DNA或扩增产物孵育tt进行转座打断得到两端带有双接头的DNA片段,通过延伸(切口平移反应)得tt到DNA文库;然后通过乳液PCR生成单链,用于测序。tt

  下面通过具体实施例详细说明本发明。tt

  1、样本选择和全基因组扩增tt

  选择已知核型的人类淋巴细胞细胞系样本8例,包括非整倍体,片段缺失/tt重复大小不同的样本(其中最小为1.9Mb左右)。将其培养至最佳状态时,挑tt取单个细胞或细胞团,完成全基因组扩增并用Nanodrop分光光度计做DNA定tt量,SigmaAldrich公司的GenomePlexWGA和NewEnglandBiolabs公司的ttSureplex两种全基因扩增试剂盒平行扩增,每种细胞系设置单个细胞和多个细tt胞组,共32例全基因组扩增产物样本。tt

  每例样本取100ng的DNA来完成本发明转座酶文库构建。tt

  另外每例样本再取100ng的DNA用LifeTechnologies公司官方网站公布的tt标准文库构建方法完成,作为对照。具体方法步骤参见LifeTechnologies公司tt官方网站(http://www.lifetechnologies.com)。tt

  2、接头制备tt

  合成如下接头:tt

  ME-r:5'-CTGTCTCTTATACACATCT-3'(SEQIDNO:4);tt

  P1:5'-CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGATtt

  AGATGTGTATAAGAGACAG-3'(SEQIDNO:5);tt

  PA_1:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGCTAAGGTA

  ACGATAGATGTGTATAAGAGACAG-3'(SEQIDNO:6);tt

  PA_2:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGTAAGGAGA

  ACGATAGATGTGTATAAGAGACAG-3'(SEQIDNO:7);tt

  PA_3:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGAAGAGGAT

  TCGATAGATGTGTATAAGAGACAG-3'(SEQIDNO:8);tt

  PA_4:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGTACCAAGA

  TCGATAGATGTGTATAAGAGACAG-3'(SEQIDNO:9);tt

  PA_5:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGCAGAAGGA

  ACGATAGATGTGTATAAGAGACAG-3'(SEQIDNO:10);tt

  PA_6:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGCTGCAAGT

  TCGATAGATGTGTATAAGAGACAG-3'(SEQIDNO:11);tt

  PA_7:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGTTCGTGAT

  TCGATAGATGTGTATAAGAGACAG-3'(SEQIDNO:12);tt

  PA_8:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGTTCCGATA

  ACGATAGATGTGTATAAGAGACAG-3'(SEQIDNO:13)。tt

  注:其中下划线部分为样品标签序列,在反应中,不同的样品选用带不tt同标签的PA_N以示区别。tt

  用退火缓冲液,将ME-r、P1、PA_1~8溶解至100μM。tt

  注:退火缓冲液配制方法如下,精确称量1.21gTris-base(100mM),5.844gttNaCl(1000mM),0.372gEDTA2Na(10mM),混合加入超纯水至终体积100mL,tt充分溶解,混合均匀,即配制成为10×退火缓冲液。tt

  在200μL的PCR管中按下表配制反应体系(表1):tt

  表1tt

  将配制好的反应1和反应2中1~8共9份,分别涡旋振荡充分混匀,并短tt暂离心。置于PCR仪内按如下反应程序完成反应(表2):tt

  表2tt

  反应结束后,将反应1和反应2的1~8分别等体积混合,混匀,分别命tt名为“退火接头混合液1~8”,-20℃保存。tt

  3、退火接头混合液-转座酶包埋tt

  在8个200μL的PCR管中按下表分别配制反应体系(表3):tt

  表3tt

  注:实施例中所用转座酶为Vazyme公司生产的TagmentEnzyme,规格tt为(10U/μL);包埋缓冲液为转座酶配套试剂,同为Vazyme公司生产。tt

  用移液器轻轻吹打至少20次充分混匀。tt

  将配制好的反应体系置于PCR仪上30℃反应1小时,反应产物分别命名为tt“转座反应混合液1~8”,置于-20℃保存。tt

  4、DNA片段化并加入测序接头tt

  于室温解冻转座反应缓冲液,上下颠倒混匀后备用。tt

  分别在8个PCR管中分别配制如下反应体系(表4):tt

  表4tt

  注:转座反应缓冲液为转座酶配套试剂,同为Vazyme公司生产。tt

  用移液器轻轻吹打至少20次充分混匀。tt

  将混好的反应体系置于PCR仪上按如下程序进行反应(表5):tt

  表5tt

  反应完成后,取出PCR管,用1.5倍体积的AmpureXPBeads进行纯化,tt溶25μL的EB。tt

  5、文库混合tt

  将上一步骤得到的8份产物各取3μL等体积混合,得到24μL混合液。tt

  6、切口平移tt

  在PCR管中配制如下反应体系(表6):tt

  表6tt

  注:扩增酶为LifeTechnologies公司的PlatinumPfxDNA聚合酶,扩增缓tt冲液为配套试剂。tt

  用移液器轻轻吹打10次充分混匀。tt

  将混合均匀的反应体系置于PCR仪上,72℃恒温孵浴20min。tt

  反应完成后,取出PCR管,用1.2倍体积的AmpureXPBeads进行纯化,tt溶16μL的EB。tt

  7、上机测序tt

  产物经文库检测合格后,使用IonProtonTM测序平台进行上机测序。tt

  8、测序后信息分析tt

  将8个样本上述流程测序得到的数据,连同常规建库得到的8份测序数据,tt同时按照如下流程进行信息分析:tt

  1)提取有效数据:将bam格式的下机数据转换为比对软件所需的fastQ格tt式,并从读段(reads)的5’端截取50bp用于后续分析,在此基础上,再从其5’tt端切除20bp,以排除全基因组扩增(WGA)时引入的接头对后续分析的影响;tt

  2)序列比对:将截取后的reads与NCBI数据库中版本37.3(hg19;ttttttNCBIBuild37.3)的人类基因组参考序列用SOAPaligner/soap2进行比对;tt

  3)Y染色体判断:根据Y染色体特异基因的支持数判断Y染色体是否存在;tt

  4)窗口划分:将人类基因组参考序列划分为100kb左右的窗口,并上下滑tt动20kb;tt

  5)GC含量校正:统计各窗口内的uniquereads(即去重后的序列中在参考tt基因组上只有唯一比对位置的序列)数,并计算其GC含量(GC%),以各窗tt口中reads的GC%的中位数作为该窗口的GC%。分别将样本序列和参考序列上tt的各窗口按GC%(梯度为0.05)划分为不同校正单元,并计算各校正单元内不tt同窗口reads数的中位数(Mi),以此计算出各校正单元的校正系数,再算出各tt窗口校正后的Ratio值用于后续分析;tt

  6)断点筛查:将每个窗口视作一个点,对每一个点进行一次游程检验,以tt此得到初步的断点集,再对该断点集中的点进行多次筛选,确定最终的断点集;tt

  7)数据过滤及可视化:本发明中阳性信号(CNV)需满足三个条件:a)ttCNV片段不小于1M;b)P≤1e-10;c)Ratio≤0.7(缺失)或Ratio≥1.3(重复)。tt根据上述条件判断CNV,并画出其核型图以及各窗口Ratio值对应的峰图。tt

  9、结果分析tt

  通过以上方法分析得到的结果如下表(表7)所示,本次检测的样本共计8tt例,本发明方法检测的结果与已知结果和常规建库得到的结果分别做对比,结tt果完全一致。tt

  表7tt

  图3显示了本发明中的样本S1采用本发明方法和常规建库方法建库测序分tt析得到的核型图和结果峰图比较。其中,图3a为采用本发明方法得到的核型图;tt图3b为采用常规建库方法得到的核型图;图3c为采用本发明方法得到的结果tt峰图;图3d为采用常规建库方法得到的结果峰图。tt

  图4显示了本发明中的样本S2采用常规建库方法和本发明方法建库测序分tt析得到的核型图和结果峰图比较。其中,图4a为采用常规建库方法得到的核型tt图;图4b为采用本发明方法得到的核型图;图4c为采用常规建库方法得到的tt结果峰图;图4d为采用本发明方法得到的结果峰图。tt

  图3和图4所示的结果显示,本发明方法检测的结果与常规建库方法得到tt的结果完全一致。说明本发明方法能够在保证结果真实性的前提下,大大简化tt建库程序,缩短建库时间。tt

  以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认tt定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术tt人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换。tt

《一种测序文库的构建方法及试剂盒和应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)