欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种微量DNA样品高通量测序文库的构建技术独创技术31013字

一种微量DNA样品高通量测序文库的构建技术

2021-02-02 06:14:14

一种微量DNA样品高通量测序文库的构建技术

  技术领域

  本发明属于生物技术领域,具体涉及一种微量DNA样品高通量测序文库的构建技术。

  背景技术

  随着生命科学技术的不断革新,人们对于生命科学的研究也越来越深入,从生命现象到内在机理再到遗传物质,而对于遗传物质的研究也逐渐从空间上的一维延伸到二维再到三维结构。核酸是生命遗传信息的载体,而核酸通常又是以很多种复杂的形态结构存在着。要揭开生命科学的神秘面纱,基因组学研究以及表观遗传学研究势在必行。第二代测序技术的出现,大大降低了测序成本,还大幅度提高了测序速度并保持了高准确性。在第二代测序技术不断完善的同时,第三代测序技术也初现端倪。然而,由于其中关键技术问题尚待解决,目前应用受到限制。

  测序文库是含有某种生物体全部基因组DNA或者存在共性的DNA群体的随机片段的DNA克隆群,是进行全基因组测序、构建物理图谱、染色体步移、表观遗传修饰等研究的基础,为基因组学以及表观遗传学研究提供了强有力的技术平台。近年来,包括人、拟南芥、水稻等越来越多的基因组被测序,全基因组测序为重要的基因克隆、基因的系统进化以及基因组学研究提供了坚实的平台。但是对于一些特殊样本,获取难度大、基因组提取量少(低于50ng),按照目前的建库流程和方法,无法获得可以用于高通量测序的文库。

  测序文库质量的高低决定了测序文库作用的大小。然而,当其实样品量较少时,由于分子碰撞几率降低,连接反应和扩增反应难度都会大大增加,并且杂质的影响被放大,文库常常很难构建成功。

  目前,针对低起始量DNA建库的方法主要有转座酶法和普通流程建库。而转座酶切割打断建库的方法易受样本质量的影响,导致切割失败,基因组无法正常片段化,在后续扩增中无法得到有效扩增。而普通流程建库无法进行低于20ng的建库,在起始量在50ng时,建库成功率仅为30%,且文库质量较差。

  因此,本领域急需一种专门针对微量DNA样品通用型的高通量测序文库构建方法。

  发明内容

  本发明的目的就是提供一种微量DNA样品高通量测序文库的构建技术。

  在本发明的第一方面,提供了一种微量DNA样品高通量测序文库的构建方法,包括步骤:

  (a)提供第一混合物,所述第一混合物包括DNA片段和辅助核酸片段,所述DNA片段包括来源于细胞基因组DNA;

  (b)向所述第一混合物中的DNA片段和辅助核酸片段两端添加接头,从而得到含末端带有接头的DNA片段和辅助核酸片段的第二混合物;

  (c)用特异性抗体捕获富集所述的第二混合物中的末端带有接头的DNA片段和辅助核酸片段;

  (d)任选地用特异性酶去除所述辅助核酸片段;

  (e)用特异性引物对上一步骤中经捕获富集的DNA片段和辅助核酸片段进行扩增,从而获得含扩增产物的第三混合物;和

  (f)任选地,用特异性针对所述辅助核酸片段的核酸酶对所述第三混合物进行处理,从而消化所述辅助核酸片段,从而获得含有富集所述DNA片段的扩增产物的第四混合物。

  在另一优选例中,所述方法还包括:(g)对上一步骤中富集的所述DNA片段的扩增产物进行建库,从而获得所述测序文库。

  在另一优选例中,所述的DNA片段是经片段化处理形成的DNA片段。

  在另一优选例中,所述步骤(a)之前包括步骤(a1):将所述细胞基因组DNA和所述辅助核酸片段同时、或先后进行片段化处理。

  在另一优选例中,所述细胞基因组DNA来源于细胞抽提的基因组DNA。

  在另一优选例中,所述细胞选自下组:体细胞、生殖细胞、干细胞、或其组合。

  在另一优选例中,所述细胞选自:小鼠雌性生殖干细胞(FGSC,Female Germline Stem Cells)。

  在另一优选例中,步骤(a)中所述DNA片段来自10-120pg,较佳地,30-100pg更佳地,20-80pg核酸,或者来自3-30个细胞,较佳地,5-20个细胞的核酸。

  在另一优选例中,步骤(a)中所述辅助核酸片段为DNA或RNA。

  在另一优选例中,所述辅助核酸片段包括噬菌体DNA。

  在另一优选例中,所述噬菌体DNA选自下组:λDNA。

  在另一优选例中,所述辅助核酸片段为修饰的辅助核酸片段。

  在另一优选例中,所述辅助核酸片段选自下组:经T→U变换的辅助核酸片段。

  在另一优选例中,所述辅助核酸片段的长度为200-4000bp,较佳地,500-3000bp,更佳地,1000-2500bp。

  在另一优选例中,所述辅助核酸片段的量为10-500ng,较佳地,30-300ng,更佳地,50-200ng。

  在另一优选例中,所述的DNA片段与所述辅助核酸片段的质量比为1:20-1:10000,较佳地1:50-1:5000,更佳地1:100-1:2000。

  在另一优选例中,所述步骤(d)中,所述特异性酶选自下组:USER酶、RNA酶A、或其组合。

  在另一优选例中,步骤(c)中所述特异性抗体是DNA甲基化抗体或者组蛋白表观修饰类抗体。

  在另一优选例中,所述DNA甲基化抗体选自下组:Anti-5-methylcytosine(5-mC)antibody(抗5-甲基胞嘧啶(5-MC)抗体)[33D3]。

  在另一优选例中,所述组蛋白表观修饰类抗体选自下组:Anti-Histone H3(tri methyl K4)antibody(抗组蛋白H3(三甲基K4)抗体)-ChIP Grade(ab8580)。

  在另一优选例中,所述抗体的含量为1-20ug,较佳地,1.5-10ug,更佳地,2-5ug。

  在另一优选例中,在整个第二混合物中,添加所述数量的抗体。

  在另一优选例中,相对于约100pg的所述DNA片段,添加所述数量的抗体。

  在另一优选例中,所述抗体与第二混合物的比例(重量比)为10-300:1-2-50:1,较佳地,30-200:1-5-30:1,更佳地,50-150:1-8-20:1。

  在另一优选例中,步骤(e)中所述特异性引物为特异性扩增所述第二混合物中的DNA片段的引物。

  在另一优选例中,步骤(e)中所述特异性引物为特异性扩增所述第二混合物中的DNA片段和辅助核酸片段的引物。

  在另一优选例中,所述特异性引物选自下组:

  λDNA-F:TGTGGGGTGAATATGGCAGT(SEQ ID No.:1);

  λDNA-R:CGTCGATTTGGTGCCGTAAT(SEQ ID No.:2)。

  在另一优选例中,所述特异性引物选自下组:

  P5引物:AATGATACGGCGACCACCGAG(SEQ ID No.:3);

  P7引物:CAAGCAGAAGACGGCATACGAG(SEQ ID No.:4)。

  在另一优选例中,所述接头选自下组:衔接子Index 19:F-5'GATCGGAAGAGCACACGTCTGAACTCCAGTCACGTGAAAATCTCGTATGCCGTCTTCTGCTTG(SEQ ID No.:5);

  R-CAAGCAGAAGACGGCATACGAGATTTTCACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC(SEQ ID No.:6)。

  在另一优选例中,所述扩增包括PCR扩增、Q-PCR、和/或RT-PCR。

  在另一优选例中,所述扩增产物中,λDNA的量≤2%。

  在本发明的第二方面,提供了一种辅助核酸片段的用途,用于制备构建微量核酸样品文库的试剂。

  在另一优选例中,所述微量核酸样品为10-300pg,较佳地,20-200pg,更佳地,50-150pg。

  在另一优选例中,所述辅助核酸片段为DNA或RNA。

  在另一优选例中,所述辅助核酸片段包括噬菌体DNA。

  在另一优选例中,所述噬菌体DNA选自下组:λDNA。

  在另一优选例中,所述辅助核酸片段为修饰的辅助核酸片段。

  在另一优选例中,所述辅助核酸片段选自下组:经T→U变换的辅助核酸片段。

  在另一优选例中,所述辅助核酸片段的长度为200-4000bp,较佳地,500-3000bp,更佳地,1000-2500bp。

  应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。

  附图说明

  图1显示了本发明的实验流程。

  图2显示了50个细胞MeDIP最终文库2100质检结果。

  图3显示了高通量测序中每个碱基的质量。

  具体实施方式

  本发明人经过广泛而深入的研究,首次开发了一种微量DNA样品高通量测序文库的构建技术,具体地,通过在少量起始样品中辅助核酸片段(优选修饰的辅助核酸片段,如修饰的λDNA),最终通过特异性的酶(如USER酶)消化去除辅助核酸片段(如λDNA),从而构建基因组DNA文库。本发明的方法适用于少量来源的微量样品的文库构建,构建的文库质量好,无污染,且不需要特定的试剂盒和实验设备,成本较低,具有较高的普遍适用性。在此基础上,本发明人完成了本发明。

  术语

  抗体:

  Anti-5-methylcytosine(5-mC)antibody[33D3]:鼠单克隆抗体,购自Abcam,#ab10805。

  Anti-Histone H3(trimethyl K4)antibody-ChIP Grade(ab8580):兔多克隆抗体,购自Abcam,#ab8580。

  微量DNA样品高通量测序文库的构建方法

  一种微量DNA样品高通量测序文库的构建方法,包括步骤:

  (a)提供第一混合物,所述第一混合物包括DNA片段和辅助核酸片段,所述DNA片段包括来源于细胞基因组DNA;

  (b)向所述第一混合物中的DNA片段和辅助核酸片段两端添加接头,从而得到含末端带有接头的DNA片段和辅助核酸片段的第二混合物;

  (c)用特异性抗体捕获富集所述的第二混合物中的末端带有接头的DNA片段和辅助核酸片段;

  (d)任选地用特异性酶去除所述辅助核酸片段;

  (e)用特异性引物对上一步骤中经捕获富集的DNA片段和辅助核酸片段进行扩增,从而获得含扩增产物的第三混合物;和

  (f)任选地,用特异性针对所述辅助核酸片段的核酸酶对所述第三混合物进行处理,从而消化所述辅助核酸片段,从而获得含有富集所述DNA片段的扩增产物的第四混合物。

  (g)对上一步骤中富集的所述DNA片段的扩增产物进行建库,从而获得所述测序文库。

  在本发明的优选实施方式中,辅助核酸片段的长度为2082bp,所述辅助核酸片段的量为100ng,所述抗体与第二混合物的比例为100:1-10:1。

  辅助核酸片段及其应用

  辅助核酸片段为DNA或RNA,包括噬菌体DNA,选自下组:λDNA。在本发明中,辅助核酸片段为T→U的辅助核酸片段。辅助核酸片段的含量为50-200ng(100ng)。辅助核酸片段可以用于制备构建微量核酸样品文库的试剂。

  特异性酶

  在本发明中,所述特异性酶指尿嘧啶-特异性切除试剂(酶),可以在尿嘧啶位置产生一个单核苷酸缺口。

  在一优选实施方式中,所述特异性酶选自下组:USER酶、RNA酶A、或其组合。

  在一优选实施方式中,所述特异性酶为USER酶。

  USER酶是尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶Endo VIII的混合物。分别从E.coli K-12菌株纯化Endo VIII和尿嘧啶DNA糖基化酶,该菌株的质粒上含有编码这两种酶的基因。UDG催化尿嘧啶碱基的切割,形成一个脱碱基(脱嘧啶)位点,但保持磷酸二酯骨架结构完整。Endo VIII的裂解酶活力使脱碱基位点3'和5'端的磷酸二酯键断裂,释放无碱基的脱氧核糖。

  技术原理

  为解决现有技术存在的两个问题(所需样品量较大和需要特殊试剂盒及设备),本发明采用的技术手段为:①建库过程中加入λDNA(T→U),从而增加建库反应效率。最终λDNA通过USER消化去除,从而避免了λDNA出现在最终的测序文库中。②整个建库过程采用常规的手动操作,不需要使用试剂盒和全自动样品处理系统。

  为了便于理解本发明,发明人提供以下原理供参考。应理解,本发明的保护范围并不受到所述原理的限制。

  本发明的技术原理:阻碍少量样品文库构建的关键在于,随着样品量减少,DNA末端补平以及添加接头的反应就变得很困难,原因在于,极少样品情况下,分子之间碰撞几率降低,分子之间结合效率大幅下降,使完成反应所需要的时间无限延长。本发明通过在少量起始样品中加入修饰的λDNA(T→U),既可以减少样品在每步操作中的损失,又可以提高反应效率,因此建库过程可以采用常规的手动操作。最为关键的是λDNA不会掺入的最终文库中,避免了λDNA对样品测序文库的污染。

  本发明的方法不仅可以完成微量DNA样品的文库构建,还可以应用于微量细胞的基因组或者转绿组样品的文库构建,使得微量样品的基因组学、转录组学、表观遗传学分析成为可能。因此,本发明的方法是一种应用较为广泛的通用型建库方法。

  本发明的主要优点包括:

  1)本发明的方法所需最低样品量为60pg DNA或10个细胞,更加适用于少量来源的微量样品的文库构建;

  2)本发明的文库质量好,无污染;

  3)本发明实验不需要特定的试剂盒和实验设备,成本较低,具有较高的普遍适用性。

  下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。

  实施例1.

  1.Fragmented DNA末端补齐

  于PCR仪20℃,5min

  2.ddH2O补至200μl,酚抽,乙醇沉降,20μl Tris-HCl重悬

  3.DNA 3'末端加dA

  于PCR仪70℃,30min

  4.ddH2O补至200μl,酚抽,乙醇沉降,10μl Tris-HCl重悬

  5.DNA末端加接头

  于PCR仪16℃过夜

  6.ddH2O补至200μl,酚抽,乙醇沉降,25μl Tris-HCl重悬

  7.电泳120V,30min,做200-500bp条带的胶回收(QIAquick Gel Extraction Kit)

  8、抗体富集的具体实验步骤。

  1)取20ul A/G蛋白磁珠(Mill ipore,16-663)用缓冲液洗两次后,用500ul缓冲液重悬磁珠(beads);

  2)在500ul缓冲液中加入2-5ug抗体,4℃,40rpm,孵育2h;

  3)用1000ul缓冲液洗磁珠2次,加入500ul I缓冲液重悬磁珠;

  4)取经过片段化的基因组DNA,1/10体积的连接产物作为Input。将DNA样品加到重悬的磁珠中,4℃,40rpm,孵育过夜;

  5)用磁架富集磁珠,弃上清,用缓冲液洗磁珠6次;

  6)用400ul洗脱液重悬磁珠,55℃,800rpm,孵育2-5h;

  用磁架富集磁珠,将上清转移到新的离心管中,用酚氯仿进行抽提纯化后,乙醇沉淀DNA,最终溶于10mM Tris(pH 8.0)中;

  9.UESR酶去除λDNA并进行PCR扩增,反应体系如下:

  于PCR仪中37℃处理6h后,将PCR管取出,各加入0.5ul Q5High fidelity enzyme,PCR条件如下:

  10.2%的琼脂糖凝胶电泳检测,并回收目的产物(QIAquick Gel Extraction Kit)

  11.用建库成功的产物进行Sanger测序,并用Agilent Bioanalyzer 2100进行片段大小检测后即可进行高通量测序。

  结果:

  1.1损失率低

  实验结果表明,损失率仅为10%-20%,测序文库中的λDNA≤2%。

  图2显示了50个FGSC细胞文库Sanger测序结果,挑取6个单克隆送Sanger测序。测序结果显示,序列全部为小鼠基因组,并且与小鼠基因组序列比对率在97%以上。

  TGGTACGACTATATAGGGCGATTGATTTAGCGGCCGCGAATTGCCCTTCAAGCAGAAGACGGCATACGAGATTTTCACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAAGGAGCCTGATTACATCCTACTCTCAGAACGAGGAATGCCTCGCCGTCGAGAGTTCGTAATGCAGGTATTCTTAATCTTCATACTAAATATTTCTGAAATCAGTGAAAAGACTGAGGCACAGTGATGTGCCACAGTGATGTGCCAACGACAGGCGGGTTCTGGGAAGGTTCGTAGTGTTTCCACTGTGAGGCATTCATCCCTCTCGGACACTCGCCTCTTTGCTTGGTGAAGCAGGCTGGTGTCAAGGACGTGTTAGATGGGCAGTGTAAGATTTAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATTAAGGGCAATTCGTTTAAACCTGCAGGACTAGTCCCTTTAGTGAGGGTTAATTCTGAGCTTGGCGTAATCATGGTCATAGTTGGATTTCCTGAC(SEQ ID No.:7)Mus比对率100%

  GCGTCGACTCCTATAGGGCGATTGATTTAGCGGCCGCGAATTGCCCTTAATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTTTCTCATCACTGAATTCACTTCCACATATTGTCAAATTATGATAAATTTAAGCCTGGAAGTATGTGATGTAAGAGATGGGAAGCCTATAAATACAAATAACTACTGTCTCAACGGTCAATTTCACTTGCACTGTCTGCCGTGACATTAAAACACGTTCATCATATTTCTCCTCATCCTTTATCATCTAAGAAAGTCTATTCCTAATTTTTAGAATGTGCTTGATATACCTGTACTGCCTCTGTTGTTACATTTTTCTGGGCATTTCCTTTCGGTTTAATTTTTTTAAATGTCATTAGTGGCTTCCTTAAAGGATTCGAAGGCCATCTTCACACCAGTGAGTCCATATACTGTGAGTCCTGCCTTCAGGATTCTGACTCCTTTATGGCCATATTCCCAGGCTCCCCGATGCTGAAGTGCAGACCTGGGTTTGCCTGACTTTAAGAAGGTAAAGCACATGAAGAATAGGCGGTACAGAACTGTTCCCTTTCTTGGTTTGCGGGCGGTGGAGACTTCGTGGTCTTCGGTTGGCAGCAGTAACATCTTGACTGGACTAGAAAGTTCCTGTGTGGCCAGTCTGACTGTGTGTTCTGTGGTCTGTGGCACTTGAGGGTAGCTGTTACTGGGGAAGGGAAATCACCTCCTTCCTAAACTTTCTTTATGGTTATTTCTGGCCATCGCTGCTGGAAGTCAGCCTAGATTTTGTTCTCTACCCTGTCTTATGAAGATCGGAAGAGCACACGTCTGAACTCCAGTCACGTGAAAATCTCGTATGCCGTCTTCTGCTTGAAGGCAATTCGTTTAAACCTGCAGGACTAGTCCCTTTAGTGAGGGTTAATTCTGAGCTTGGCGTAATCATGGCAGCT(SEQ ID No.:8)Mus比对率100%

  GCGTCGACTCCTATAGGGCGATTGATTTAGCGGCCGCGAATTGCCCTTAATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTTTCTCATCACTGAATTCACTTCCACATATTGTCAAATTATGATAAATTTAAGCCTGGAAGTATGTGATGTAAGAGATGGGAAGCCTATAAATACAAATAACTACTGTCTCAACGGTCAATTTCACTTGCACTGTCTGCCGTGACATTAAAACACGTTCATCATATTTCTCCTCATCCTTTATCATCTAAGAAAGTCTATTCCTAATTTTTAGAATGTGCTTGATATACCTGTACTGCCTCTGTTGTTACATTTTTCTGGGCATTTCCTTTCGGTTTAATTTTTTTAAATGTCATTAGTGGCTTCCTTAAAGGATTCGAAGGCCATCTTCACACCAGTGAGTCCATATACTGTGAGTCCTGCCTTCAGGATTCTGACTCCTTTATGGCCATATTCCCAGGCTCCCCGATGCTGAAGTGCAGACCTGGGTTTGCCTGACTTTAAGAAGGTAAAGCACATGAAGAATAGGCGGTACAGAACTGTTCCCTTTCTTGGTTTGCGGGCGGTGGAGACTTCGTGGTCTTCGGTTGGCAGCAGTAACATCTTGACTGGACTAGAAAGTTCCTGTGTGGCCAGTCTGACTGTGTGTTCTGTGGTCTGTGGCACTTGAGGGTAGCTGTTACTGGGGAAGGGAAATCACCTCCTTCCTAAACTTTCTTTATGGTTATTTCTGGCCATCGCTGCTGGAAGTCAGCCTAGATTTTGTTCTCTACCCTGTCTTATGAAGATCGGAAGAGCACACGTCTGAACTCCAGTCACGTGAAAATCTCGTATGCCGTCTTCTGCTTGAAGGCAATTCGTTTAAACCTGCAGGACTAGTCCCTTTAGTGAGGGTTAATTCTGAGCTTGGCGTAATCATGGCAGCT(SEQ ID No.:9)Mus比对率100%

  TGGTACGACTCTATAGGGCGATTGATTTAGCGGCCGCGAATTGCCCTTCAAGCAGAAGACGGCATACGAGATTTTCACGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTGCCCATATCTTCAAGGCTTTTCCCCACTTTCTCCTCTATAAGTTTCAGTGTCTCTGGTTTTATGTGAAGTTCCTTGATCCACTTAGATTTGACCTTAGTACAAGGAGATAAGTATGGATCGATTCGCATTCTTCTACACGATAACAACCAGTTGTGCCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATTAAGGGCAATTCGTTTAAACCTGCAGGACTAGTCCCTTTAGTGAGGGTTAATTCTGAGCTTGGCGTAATCATGGTCATACTTGTTTCCTAAA(SEQ ID No.:10)Mus比对率100%

  GGTACGACTATATAGGGCGATTGATTTAGCGGCCGCGAATTGCCCTTAATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTTTTCAAGTTCGCATCAATATGTCCTTGAGAGTTTGTGGTTTATAAGATCAGAACTCTTTCCTGATAAAGAGAAATATTCAGGTAGATTCCACATGCTGACCTGTCATGCATTCCTTTGTCACGTGAGCCCTCTCCTGCGTCCATTCTTTCCAAGGACTGTGATGTAATCCTGGTGAGCATGCCCAGGCCAGGTCATCCCCACAGCTGGGGGGAGATGTAAACAGCCAGCTGATGACGGGTCTGCAGGCATCCCAGCGCTGTCAGGGCTGGGTGCTATCCTAGCTGAGTCCCAGTTGTCCCCAGTATACTCCACTGCCTGTGGCTCTGGGAGGTGGGCAGCTTCCAGATCGGAAGAGCACACGTCTGAACTCCAGTCACGTGAAAATCTCGTATGCCGTCTTCTGCTTGAAGGGCAATTCGTTTAAACCTGCAGGACTAGTCCCTTTAGTGAGGGTTAATTCTGAGCTTGGCGTAATCATGGTCAATG(SEQ ID No.:11)Mus比对率97%

  GCGTTCGACTCCTATAGGGCGATTGATTTAGCGGCCGCGAATTGCCCTTAATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTGCATGACACGGGACTTCAGGGGCATTCTCGTCGAGTTATGAGCCCCAGTGGACAGGGTCATGATGGTATCCCATAAGACCTCAACTTTCTACGACTCCTTCAGCCTGAGGGACATCACTTTGACCTAGATGAACCTGCTCTGACACCTTCCAAATGGCACCACAACCCCTAGACTCCATAGGGCTCAGCAGGCAAGGACCCCCCTCCTTTATCAGCTATGACGACGCCTCCCCCAACAGGTGGAACTTGGGAACTTTCCTTATAGTGTTTGTTGGCTCCACTGCCCAGGTTTCCATGTCACCTTGCCCTCAGTACAGTGAATACGTGATTGTGCCTGTGCCACTTGCTGAGGAAATCCAACGTAAGGCCTGGCTGGGCGTCACTGGTGGTCCATGTGGCAATGTAGCAAACCCACTAAGCTCCTACCAGCACTGCAGGATATGTAGGTCCTGAGAACGGCAACCCCCGCCCAGGTCTCCTTCTTGCTCTGAAGAGTCTAGCGATGATCTGGTTAAGAAGAGTAAGTCCAAGGTGCCAAGACCTGACCTTGGGCTTGGTGGATAGGCTGTAGGGCCATTGTTGAGGTTCAGATCGGAAGAGCACACGTCTGAACTCCAGTCACGTGAAAATCTCGTATGCCGTCTTCTGCTTGAAGGGCAATTCGTTTAAACCTGCAGGACTAGTCCCTTTAGTGAGGGTTAATTCTGAGCTTGGCGTAATCATGGTCTG(SEQ ID No.:12)Mouse比对率100%

  1.2最终文库的高通量测序质量高结果如图3所示。

  其中,碱基质量一般用Phred值表示。碱基错误的可能性,用log~10~进行变换,再乘以-10。举例来说,某个碱基有1%的概率是错误的,那么它的质量值为q=-10*log~10~(0.01)=20。质量越高数值越大。在fastq文件里,为了节省存储,质量值是用ASCII字符表示的。查看读序的平均质量的频率分布图可以更好体现总体的测序质量。通常,大部分读序的平均碱基质量高于25。

  而在本发明中,所有碱基的质量值均高于31,最高可>35,接近36。结果表明,本发明的最终文库的高通量测序质量非常高。

  实施例2

  方法同实施例1,区别在于,加入未经修饰的λDNA作为辅助核酸片段。

  结果显示,

  1.可以成功构建测序文库。

  2.损失率略高于本发明实施例1的损失率。

  3.所有碱基的质量值为约28。

  对比例1

  方法同实施例1,区别在于,不加任何辅助核酸片段(即不加入λDNA)。

  结果显示,无法成功建立测序文库。

  在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

  序列表

  <110> 上海交通大学

  <120> 一种微量DNA样品高通量测序文库的构建技术

  <130> P2018-1171

  <160> 12

  <170> PatentIn version 3.5

  <210> 1

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 1

  tgtggggtga atatggcagt 20

  <210> 2

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 2

  cgtcgatttg gtgccgtaat 20

  <210> 3

  <211> 21

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 3

  aatgatacgg cgaccaccga g 21

  <210> 4

  <211> 22

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 4

  caagcagaag acggcatacg ag 22

  <210> 5

  <211> 63

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 5

  gatcggaaga gcacacgtct gaactccagt cacgtgaaaa tctcgtatgc cgtcttctgc 60

  ttg 63

  <210> 6

  <211> 63

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 6

  caagcagaag acggcatacg agattttcac gtgactggag ttcagacgtg tgctcttccg 60

  atc 63

  <210> 7

  <211> 540

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 7

  tggtacgact atatagggcg attgatttag cggccgcgaa ttgcccttca agcagaagac 60

  ggcatacgag attttcacgt gactggagtt cagacgtgtg ctcttccgat ctaaaggagc 120

  ctgattacat cctactctca gaacgaggaa tgcctcgccg tcgagagttc gtaatgcagg 180

  tattcttaat cttcatacta aatatttctg aaatcagtga aaagactgag gcacagtgat 240

  gtgccacagt gatgtgccaa cgacaggcgg gttctgggaa ggttcgtagt gtttccactg 300

  tgaggcattc atccctctcg gacactcgcc tctttgcttg gtgaagcagg ctggtgtcaa 360

  ggacgtgtta gatgggcagt gtaagattta gatcggaaga gcgtcgtgta gggaaagagt 420

  gtagatctcg gtggtcgccg tatcattaag ggcaattcgt ttaaacctgc aggactagtc 480

  cctttagtga gggttaattc tgagcttggc gtaatcatgg tcatagttgg atttcctgac 540

  <210> 8

  <211> 970

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 8

  gcgtcgactc ctatagggcg attgatttag cggccgcgaa ttgcccttaa tgatacggcg 60

  accaccgaga tctacactct ttccctacac gacgctcttc cgatctttct catcactgaa 120

  ttcacttcca catattgtca aattatgata aatttaagcc tggaagtatg tgatgtaaga 180

  gatgggaagc ctataaatac aaataactac tgtctcaacg gtcaatttca cttgcactgt 240

  ctgccgtgac attaaaacac gttcatcata tttctcctca tcctttatca tctaagaaag 300

  tctattccta atttttagaa tgtgcttgat atacctgtac tgcctctgtt gttacatttt 360

  tctgggcatt tcctttcggt ttaatttttt taaatgtcat tagtggcttc cttaaaggat 420

  tcgaaggcca tcttcacacc agtgagtcca tatactgtga gtcctgcctt caggattctg 480

  actcctttat ggccatattc ccaggctccc cgatgctgaa gtgcagacct gggtttgcct 540

  gactttaaga aggtaaagca catgaagaat aggcggtaca gaactgttcc ctttcttggt 600

  ttgcgggcgg tggagacttc gtggtcttcg gttggcagca gtaacatctt gactggacta 660

  gaaagttcct gtgtggccag tctgactgtg tgttctgtgg tctgtggcac ttgagggtag 720

  ctgttactgg ggaagggaaa tcacctcctt cctaaacttt ctttatggtt atttctggcc 780

  atcgctgctg gaagtcagcc tagattttgt tctctaccct gtcttatgaa gatcggaaga 840

  gcacacgtct gaactccagt cacgtgaaaa tctcgtatgc cgtcttctgc ttgaaggcaa 900

  ttcgtttaaa cctgcaggac tagtcccttt agtgagggtt aattctgagc ttggcgtaat 960

  catggcagct 970

  <210> 9

  <211> 970

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 9

  gcgtcgactc ctatagggcg attgatttag cggccgcgaa ttgcccttaa tgatacggcg 60

  accaccgaga tctacactct ttccctacac gacgctcttc cgatctttct catcactgaa 120

  ttcacttcca catattgtca aattatgata aatttaagcc tggaagtatg tgatgtaaga 180

  gatgggaagc ctataaatac aaataactac tgtctcaacg gtcaatttca cttgcactgt 240

  ctgccgtgac attaaaacac gttcatcata tttctcctca tcctttatca tctaagaaag 300

  tctattccta atttttagaa tgtgcttgat atacctgtac tgcctctgtt gttacatttt 360

  tctgggcatt tcctttcggt ttaatttttt taaatgtcat tagtggcttc cttaaaggat 420

  tcgaaggcca tcttcacacc agtgagtcca tatactgtga gtcctgcctt caggattctg 480

  actcctttat ggccatattc ccaggctccc cgatgctgaa gtgcagacct gggtttgcct 540

  gactttaaga aggtaaagca catgaagaat aggcggtaca gaactgttcc ctttcttggt 600

  ttgcgggcgg tggagacttc gtggtcttcg gttggcagca gtaacatctt gactggacta 660

  gaaagttcct gtgtggccag tctgactgtg tgttctgtgg tctgtggcac ttgagggtag 720

  ctgttactgg ggaagggaaa tcacctcctt cctaaacttt ctttatggtt atttctggcc 780

  atcgctgctg gaagtcagcc tagattttgt tctctaccct gtcttatgaa gatcggaaga 840

  gcacacgtct gaactccagt cacgtgaaaa tctcgtatgc cgtcttctgc ttgaaggcaa 900

  ttcgtttaaa cctgcaggac tagtcccttt agtgagggtt aattctgagc ttggcgtaat 960

  catggcagct 970

  <210> 10

  <211> 421

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 10

  tggtacgact ctatagggcg attgatttag cggccgcgaa ttgcccttca agcagaagac 60

  ggcatacgag attttcacgt gactggagtt cagacgtgtg ctcttccgat ctgtgcccat 120

  atcttcaagg cttttcccca ctttctcctc tataagtttc agtgtctctg gttttatgtg 180

  aagttccttg atccacttag atttgacctt agtacaagga gataagtatg gatcgattcg 240

  cattcttcta cacgataaca accagttgtg ccagatcgga agagcgtcgt gtagggaaag 300

  agtgtagatc tcggtggtcg ccgtatcatt aagggcaatt cgtttaaacc tgcaggacta 360

  gtccctttag tgagggttaa ttctgagctt ggcgtaatca tggtcatact tgtttcctaa 420

  a 421

  <210> 11

  <211> 592

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 11

  ggtacgacta tatagggcga ttgatttagc ggccgcgaat tgcccttaat gatacggcga 60

  ccaccgagat ctacactctt tccctacacg acgctcttcc gatcttttca agttcgcatc 120

  aatatgtcct tgagagtttg tggtttataa gatcagaact ctttcctgat aaagagaaat 180

  attcaggtag attccacatg ctgacctgtc atgcattcct ttgtcacgtg agccctctcc 240

  tgcgtccatt ctttccaagg actgtgatgt aatcctggtg agcatgccca ggccaggtca 300

  tccccacagc tggggggaga tgtaaacagc cagctgatga cgggtctgca ggcatcccag 360

  cgctgtcagg gctgggtgct atcctagctg agtcccagtt gtccccagta tactccactg 420

  cctgtggctc tgggaggtgg gcagcttcca gatcggaaga gcacacgtct gaactccagt 480

  cacgtgaaaa tctcgtatgc cgtcttctgc ttgaagggca attcgtttaa acctgcagga 540

  ctagtccctt tagtgagggt taattctgag cttggcgtaa tcatggtcaa tg 592

  <210> 12

  <211> 836

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 12

  gcgttcgact cctatagggc gattgattta gcggccgcga attgccctta atgatacggc 60

  gaccaccgag atctacactc tttccctaca cgacgctctt ccgatctgca tgacacggga 120

  cttcaggggc attctcgtcg agttatgagc cccagtggac agggtcatga tggtatccca 180

  taagacctca actttctacg actccttcag cctgagggac atcactttga cctagatgaa 240

  cctgctctga caccttccaa atggcaccac aacccctaga ctccataggg ctcagcaggc 300

  aaggaccccc ctcctttatc agctatgacg acgcctcccc caacaggtgg aacttgggaa 360

  ctttccttat agtgtttgtt ggctccactg cccaggtttc catgtcacct tgccctcagt 420

  acagtgaata cgtgattgtg cctgtgccac ttgctgagga aatccaacgt aaggcctggc 480

  tgggcgtcac tggtggtcca tgtggcaatg tagcaaaccc actaagctcc taccagcact 540

  gcaggatatg taggtcctga gaacggcaac ccccgcccag gtctccttct tgctctgaag 600

  agtctagcga tgatctggtt aagaagagta agtccaaggt gccaagacct gaccttgggc 660

  ttggtggata ggctgtaggg ccattgttga ggttcagatc ggaagagcac acgtctgaac 720

  tccagtcacg tgaaaatctc gtatgccgtc ttctgcttga agggcaattc gtttaaacct 780

  gcaggactag tccctttagt gagggttaat tctgagcttg gcgtaatcat ggtctg 836

《一种微量DNA样品高通量测序文库的构建技术.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)