欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种接头和通过高效率环化方式构建测序文库的方法独创技术30548字

一种接头和通过高效率环化方式构建测序文库的方法

2022-11-24 16:48:18

一种接头和通过高效率环化方式构建测序文库的方法

  技术领域

  本发明属于基因组高通量测序技术领域,具体地,本发明涉及一种接头和通过环化方式构建DNA高通量测序文库的方法。

  背景技术

  全基因组测序对全面了解一个物种的基因组成、代谢通路和分子进化等有着非常重要的意义。近年来,第二代高通量测序技术取得了突飞猛进的发展,使得测序成本逐年下降,但是应用最广的短插入片段文库测序,由于无法跨越重复序列和二级结构等区域,使得基因组组装往往只能得到一些片段而不是基因组全长。第三代测序技术虽然可以获得较长的测序序列,但是成本一直居高不下,目前其推广和应用程度远低于第二代测序。如何改进文库构建和测序方法,更加高效低成本地获得较为完整的基因组序列,成为了高通量测序领域的研究热点。

  各大仪器和试剂公司,包括Illumina、Roche、Lucigen等,已能提供适用于第二代测序的长片段文库构建试剂盒,但是这些方法很大程度上局限于核酸片段的大小,对于较大的核酸分子进行环化文库构建的效率较低,并且还存在实验过程复杂,成本和错误率都较高等缺点,使得其实际应用范围较窄。

  因此本领域迫切需要一种能够有效提高环化效率和拼接准确度的长片段文库构建方法。

  发明内容

  本发明的目的在于解决现有的DNA高通量测序建库方法中长片段文库环化效率低和错误率高等问题,提供一种能够有效避免拼接错误的高效的长片段文库构建方法。

  为了达到以上目的,本发明提供一种新的接头和通过环化方式构建测序文库的方法,该方法适用于多种测序平台。

  在本发明的第一方面,提供了一种接头,所述接头为正义链和反义链形成的具有互补的突出末端的双链核酸分子;其中,所述双链核酸分子上含有生物素标记;

  并且所述正义链的序列选自:SEQ ID NO:1;而所述反义链的序列选自下组:SEQ ID NO:2、SEQ ID NO:5和SEQ ID NO:6。

  在另一优选例中,所述双链核酸分子中正义链的5’末端的核苷酸带有磷酸基团。

  在另一优选例中,所述双链核酸分子中反义链上含有生物素标记。

  在另一优选例中,所述双链核酸分子中反义链上含有一个被生物素标记的胸腺嘧啶。

  在另一优选例中,所述双链核酸分子中正义链上含有生物素标记。

  在另一优选例中,所述的反义链为SEQ ID NO.:2。

  在本发明的第二方面,提供了一种本发明的第一方面所述的接头的制备方法,包括:

  (1)分别合成正义链和反义链核酸分子,其中至少一条链上含有生物素标记;和

  (2)对所述正义链和反义链核酸分子进行混合后,先变性再退火,形成具有互补的突出末端的双链核酸分子,即本发明的第一方面所述的接头。

  在另一优选例中,其中正义链核酸分子的5’末端的核苷酸带有磷酸基团。

  在另一优选例中,其中正义链核酸分子上含有生物素标记。

  在另一优选例中,其中反义链核酸分子上含有生物素标记。

  在另一优选例中,所述反义链核酸分子上含有一个生物素标记的胸腺嘧啶。

  在本发明的第三方面,提供了一种通过环化方式构建DNA高通量测序文库的方法,包括以下步骤:

  (1)提供本发明的第一方面所述接头;

  (2)对待测生物的基因组DNA进行片段化处理,获取片段化DNA;

  (3)将(1)中接头和(2)中片段化DNA相连,形成片段化DNA两端带有所述接头的分子;

  (4)对(3)中片段化DNA两端带有所述接头的分子进行环化处理,使片段化DNA两端的接头的突出末端发生连接,从而形成环形DNA分子;

  (5)对(4)中的所述环形DNA分子进行随机打断,形成片段混合物;

  (6)从(5)中的所述片段混合物中,分离出带有所述接头的片段,从而构成所述的DNA高通量测序文库。

  在另一优选例中,在步骤(6)中,还包括:对于分离的带有所述接头的片段进行酶切鉴定。

  在另一优选例中,所述步骤(2)中在片段化处理之后,还包括对片段化产物的纯化及末端修饰步骤。

  在另一优选例中,所述末端修饰包括:末端补平和磷酸化。

  在另一优选例中,所述步骤(2)中片段化DNA的长度为1.5~20kb。

  在另一优选例中,所述步骤(4)中环化处理通过控制浓度和时间,不增加DNA分子大小。

  在另一优选例中,所述步骤(5)中片段混合物中DNA片段的长度为200~600bp。

  在另一优选例中,所述步骤(6)中用带有链酶亲和素的磁珠筛选带有接头的片段。

  应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。

  附图说明

  图1为本发明中接头的结构示意图。图中,“生物素标记”表示带有“生物素(biotin)”标记。

  图2为本发明通过环化方式构建测序文库的方法流程图。

  图3为本发明提供的接头和环化文库构建方法与商品化建库试剂盒的比较图。

  图4为不同长度的接头的结构示意图。

  具体实施方式

  本发明人经过广泛而深入的研究,设计了一种接头,所述接头为正义链和反义链形成的互补的突出末端双链核酸分子;所述双链核酸分子上含有生物素标记, 本发明提供的接头长度较短(例如10nt和16nt),进行简单退火就可形成单突出末端双链,制备过程成本较低且方法简便;而且非常容易与核酸片段进行分离,简化了核酸纯化步骤,避免了文库中出现接头自连产物;本发明接头中含有已知的限制性内切酶位点,能够在测序之前对文库构建结果进行快速鉴定,降低测序风险。

  本发明还提供了基于上述接头通过环化方式构建DNA高通量测序文库的方法,所述方法成本低,效率高,步骤简单,易于操作,重现性好,可进行快速质检鉴定,并且能够直接应用于多种二代测序平台的文库构建;大大提高了环化效率,解决高通量测序中长片段文库环化效率较低的问题,进而提高了建库的成功率。在此基础上完成了本发明。

  接头

  本发明提供了一种接头,其中所述接头为正义链和反义链形成的互补的突出末端双链核酸分子;所述双链核酸分子上含有生物素标记。

  优选地,本发明接头的结构是经特殊优化的。在本发明中,不仅优化了所述接头的互补双链区的长度和序列,还优化了突出端的单链的长度和序列(即粘性末端的长度和序列)。通过优化,本发明接头一方面可以极其高效地通过粘性末端连接并形成环化结构;另一方面,所述的接头序列对待测定的序列的干扰也降至最低。

  在另一优选例中,所述的互补双链区的长度通常为9-11nt,较佳地10nt。

  在另一优选例中,所述的粘性末端区的长度通常为5-10nt,较佳地6、7或8nt。

  在另一优选例中,所述的接头中的一条单链(正义链)为SEQ ID NO.:1或其衍生单链。典型地,该衍生单链是长度为9-11nt的单链,例如SEQ ID NO.:1中1-9位构成的单链,或2-10位构成的单链,或SEQ ID NO.:1中1-10位+G构成的单链。

  在另一优选例中,所述的接头中的另一条单链(反义链)包括一互补双链区(长度与正义链的长度一致)以及粘性末端区(长度为5-10nt,较佳地6、7或8nt)。一种优选的反义单链为SEQ ID NO.:2或其衍生单链。典型地,该衍生单链(反义链)是长度为14-18nt的单链,例如SEQ ID NO.:2中1-15位构成的单链,或2-16位构成的单链,或SEQ ID NO.:5或6所示的单链。

  在另一优选例中,在粘性末端中,设有1个或2个限制性酶切位点,如EcoR I位点。

  典型地,本发明提供了一种接头(图1,以及SEQ ID NO.:1和2),所述接头为互补的单突出末端双链核酸分子;所述双链核酸分子中较长一条链上有一个生物素标记的胸腺嘧啶和EcoRI酶切位点,另一条链的5’端带有磷酸基团。所述环化接头的核苷酸序列为SEQ ID NO:1 GCGAGATTCT和SEQ ID NO:2 GAATTCAGAATCTCGC。

  虽然图1所述的接头仅在反义链上带有一个生物素标记,但是应理解,可以在所述接头的正义链上带有生物素标记,或者所述接头的正义链和反义链上都带有生物素标记。此外,一个接头上可带有一个或多个生物素标记(如2-5个)。此外,对于一个接头群体而言,接头可以有所不同。例如,部分接头可以在某一位置含一个生物素标记,而另一些接头含有不同数量和/或位于不同位置上的生物素标记。这些接头混合物同样可以用于本发明。

  本发明接头特别适合用于构建测序文库。因为在构建测序文库时,接头往往是与片段化的产物连接,而片段化的产物往往是一定长度范围内的核酸片段的集合,由于该发明提供的接头长度较短,所以,当用于与接头连接的核酸片段与接头的大小相差越大,接头与核酸片段的连接产物的大小和接头自连产物的大小相差越远,越容易分离,从而避免测序文库中掺入接头自连的产物,避免了对后续测序反应的干扰。

  接头的制备方法

  本发明还提供了一种接头的制备方法。

  本发明提供的接头的制备方法,通常包括以下步骤:

  (1)分别合成用于构成本发明接头的两种单链核酸分子,即正义链和反义链核酸分子。典型地,较长一条中可含有一个带生物素标记的胸腺嘧啶,而较短一条链的5’端带有磷酸基团;

  (2)对所述单链核酸分子进行混合和退火,从而形成本发明的接头。例如,将两种单链核酸分子进行等摩尔浓度混合,先变性再缓慢退火,得到互补的单突出末端双链核酸分子。

  (3)任选地分离出所述的经退火形成的双链形式的本发明接头。

  通过环化方式构建DNA高通量测序文库的方法

  本发明的接头可用于构建含有长度接近的待测序片段的测序文库,进而使得测序文库在后续的环化和测序过程中均一性更佳。

  基于本发明接头,本发明还提供了一种通过环化方式构建DNA高通量测序文库的方法。

  本发明还提供了通过环化方式构建测序文库的方法。一种代表性方法的具体流程见图2,包括以下步骤:

  (1)对待测生物的核酸进行片段化处理,将DNA片段化产物与上述接头相连;

  (2)对所述连接产物进行琼脂糖凝胶电泳获得电泳胶块,切取所述电泳胶块中文库目的大小的片段至比所述文库目的大小的片段大0.5~1kb的片段范围内的凝胶,回收凝胶内的DNA得第一纯化DNA;

  (3)对所述第一纯化DNA,通过控制浓度和时间,以不增加其大小的形式进行环化,得到环形DNA分子;

  (4)对所述环形DNA分子进行随机打断,并用带有链酶亲和素的磁珠回收带有接头的片段;

  其中,在片段化处理之后,所述步骤(1)还包括对片段化产物的纯化及末端修饰步骤。所述末端修饰包括但不限于:末端补平和磷酸化。

  进一步的,所述方法还包括以下步骤:

  (5)对所述的回收产物进行末端补平和磷酸化,连接测序文库接头,并进行扩增,得到线形测序文库。

  其中,在步骤(1)中,进行片段化处理的方式包括但不限于超声波破碎、酶切破碎和微波破碎。

  其中,在所述DNA片段化物料中,DNA片段的大小可以在1.5kb~20kb。

  可选的,在步骤(2)中,所述琼脂糖凝胶电泳的凝胶的浓度为0.8-1.0%。优选的,凝胶长度为12cm,电泳条件为100V,60min或120min(可以根据目标DNA长度选择适当的电泳条件和时间)。

  其中,在步骤(2)中,若文库目的大小的片段为小于5kb,切取所述电泳胶块中文库目的大小的片段至比所述文库目的大小的片段大0.5kb的片段范围内的凝胶;若文库目的大小的片段为大于5kb,切取所述电泳胶块中文库目的大小的片段至比所述文库目的大小的片段大1kb的片段范围内的凝胶。即如果目 的大小的片段为1.5kb,那么应该切取,1.5kb至2kb范围内的凝胶;如果目的大小的片段为6kb,那么应该切取,6kb至7kb范围内的凝胶。

  在本发明的一种实施例中,所使用的DNA胶回收试剂盒为QIAGEN公司QIAquick Gel Extraction Kit,最终回溶体积为30-60μl,

  在优选方案中,可以预设或调节回溶体积,以便后续步骤中不需要补H2O。

  在本发明中,在步骤(5)中对于进行末端修复、3’端加A、加接头等建库步骤的试剂来源、形式没有特别的要求,但试剂必须能够完成所述功能。

  在另一优选例中,在获得所述连接产物后,还包括利用纯化磁珠对所述连接产物进行第二次纯化获得第二次纯化后的连接产物,所述纯化珠子的用量为所述连接产物体积的1.0-2.0倍,优选为1.6倍。

  在本发明中,所述方法还包括对所述第二次纯化后的连接产物进行PCR扩增,再对所述扩增产物进行第二次凝胶电泳并切胶回收获得文库DNA。其中,第二次凝胶电泳和切胶回收的目的是去除非目的DNA、进一步提高文库片段的均一性,所使用的凝胶浓度优选为2.0%,切胶范围为电泳亮带。

  本发明的主要优点在于:

  本发明所提供的接头和环化文库构建方法适用于DNA高通量测序的长片段文库构建,具有以下优点及有益效果:

  (1)本发明所提供的接头,只需要合成两条长度分别为10nt和16nt的寡核苷酸序列,进行简单退火就可形成单突出末端双链,制备过程成本较低且方法简便;

  (2)由于接头长度较短,非常容易与核酸片段进行分离,简化了核酸纯化步骤,避免了文库中出现接头自连产物;

  (3)本发明提供的接头序列,可以用于识别测序结果中错误的序列连接位置;

  (4)该方法提供的接头中含有已知的限制性内切酶位点,能够在测序之前对文库构建结果进行快速鉴定,降低测序风险;

  (5)本发明所提供的接头和环化文库构建方法成本低,效率高,步骤简单,易于操作,重现性好,可进行快速质检鉴定,并且能够直接应用于多种二代测序平台的文库构建;

  (6)在构建测序文库的过程中,接头粘性末端的连接效率远高于核酸片段 平末端的连接效率,大大提高了环化效率,解决高通量测序中长片段文库环化效率较低的问题,进而提高了建库的成功率。

  为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。以下实施例仅限于说明本发明,而非对本发明的限定。在不背离本发明精神和实质的情况下,对本发明方法、步骤或条件所作的修改或替换,均属于本发明的范围。

  下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。

  实施例1

  接头No.1制备和测定

  在本实施例中,进行接头的设计和制备。

  所述接头为互补的单突出末端双链核酸分子;所述双链核酸分子中较长一条链上有一个生物素标记的胸腺嘧啶和EcoRI酶切位点(SEQ ID NO:1),另一条链的5’端带有磷酸基团(SEQ ID NO:2)。

  具体步骤为:将两条合成的寡核苷酸分别回溶,将两者按等摩尔量进行混合并稀释到45um。95℃变性3分钟,缓慢降至室温,即形成一端为平末端,另一端为粘性末端的环化接头,见图1。

  由于所述双链核酸分子含有生物素标记物。因此,利用含有生物素标记物特异性结合的配合物的固相载体,带有链酶亲和素的磁珠,可对本实施例的接头和核酸片段的连接产物进行快速的分离纯化,获得可用于提高测序文库的构建效率的接头。

  经实验测试,图1所示的接头适于与任意长度的核酸片段连接,尤其适用于与长片段核酸相连,核酸片段与接头的摩尔比值最优选在1:5至1:10之间。

  实施例2

  环化文库构建

  在本实施例中,采用实施例1制备的接头No.1进行环化文库的构建。方 法如下:

  (1)将基因组DNA随机打断至特定大小(1.5~20kb范围),进行末端补平修复,并于片段5’-端加上磷酸基团,即末端磷酸化;

  (2)与所述接头No.1进行平末端连接;根据基因组拼接的需求,将连接产物用切胶纯化的方法回收所需特定大小的片段;利用接头的粘性末端进行环化连接,获得通过接头首末相连的环状核酸片段,并对未环化的线性片段进行消化;

  (3)将环化产物随机打断至特定大小(200~600bp范围);用链霉亲和素磁珠对带有生物素标记的片段进行吸附;进行末端修复并于片段3’端加上脱氧腺苷酸A;

  (4)连接测序平台适配的测序接头;用对应引物进行PCR扩增,获得的产物用切胶纯化的方法回收所需大小的片段,即长插入片段文库。

  (5)对该构建的文库用于二代测序平台进行测序。

  结果:

  实验结果表明,在构建测序文库时,本发明接头与核酸片段的连接产物的大小和接头自连产物的大小相差非常大,极易进行分离,从而避免测序文库中掺入接头自连的产物,彻底避免了对后续测序反应的干扰。

  此外,用所述接头No.1所构建含有长度接近的待测序片段的测序文库,在后续的环化和测序过程中均一性也非常优异。

  实施例3

  在本实施例中,将本发明的高通量测序建库方法与常规高通量建库方法之间进行比较。其中,以小球藻基因组DNA为源核酸,对常规短片段文库、常规长片段文库和本发明的构建的文库进行比较。

  A.常规高通量短片段建库方法实验步骤及结果:

  取10ug小球藻基因组DNA,使用Kapa library preparation kit(KAPA Biosystems,#KK8221),按照说明书,构建插入片段长度为500bp的测序文库。使用Illumina HiSeq测序仪对文库进行读长为100nt的双向测序。该组数据的拼接结果统计信息如表1所示。

  B.常规高通量长片段建库方法实验步骤及结果:

  取10ug小球藻基因组DNA,使用Nextera Mate Pair Library Prep Kit(Illumina,FC-132-1001),按照说明书,构建插入片段长度为5kb的测序文库。使用Illumina HiSeq测序仪对文库进行读长为100nt的双向测序。该组数据的拼接结果统计信息如表1所示。

  C.本发明的高通量建库方法实验步骤及结果:

  一、接头制备:

  将合成的单链接头(实施例1制备的接头No.1)干粉分别回溶,并稀释到100μM,分别取45μL,加NEB buffer#2补至100μL。

  反应条件:95℃变性3min;然后缓慢降至室温。

  二、片段化全基因组DNA:

  基因组DNA用琼脂糖凝胶电泳和Qubit(Invitrogen)进行定性定量分析,确认DNA的高质量,包括完整性和纯度。取10ug基因组DNA用Covaris S220进行片段打碎。

  具体条件如下:8℃,Red miniTUBE,Duty Factor 20%,Intensity 1,Cycles per Burst 1000,600秒。

  三、DNA片段末端修复

  1.末端修复

  按以下配比在冰上配置DNA片段末端修复反应体系:步骤一产物85μL;10×End repair Buffer 10μL;End repair mix(KAPA Biosystems,#KK8221)5μL。

  反应条件:20℃孵育30min。

  2.纯化回收

  利用Qiagen MiniElute kit(Qiagen,Cat No./ID:28004)回收片段化产物,具体操作如下:往上一步末端修复产物中加入500μL Buffer PB;将MiniElute离心柱置入对应的2ml收集管,将上述需要纯化的DNA产物移入离心柱,6000rpm离心1分钟;弃离心过柱的液体,加入750μL Buffer PE,6000rpm离心1分钟,弃离心过柱的液体,重复此步骤一次;将MiniElute离心柱再 次放回收集管,13000rpm离心1分钟,然后将MiniElute离心柱转至一个新的1.5mL EP管内;向MiniElute离心柱内底部中心加入34μL Buffer EB,静置2分钟,13000rpm离心1分钟,离心所得液体即为过柱纯化得到的DNA。

  3.磷酸化

  按以下配比在冰上配置DNA片段末端修复反应体系:第三步骤2产物33μL;10×T4 DNA ligase Buffer 4μL;T4 Polynucleotide Kinase(NEB,#M0201S)3μL。

  反应条件:37℃孵育60min;然后加热至65℃,处理20min,以终止反应。

  四、连接接头

  按以下配比在冰上配置DNA片段末端修复反应体系:第三步骤产物40μL;接头7μL;10×T4 DNA ligase Buffer 1μL;T4 DNA ligase(NEB,#M 0202S)2μL。

  反应条件:16℃孵育2h;然后加热至65℃,处理10min,以终止反应。

  然后参考步骤三中2.纯化回收步骤,对连接反应的产物进行柱纯化。

  五、核酸片段长度选择

  1.电泳和切胶

  配制0.8%琼脂糖凝胶,将第四步骤产物点入一个加样孔内,间隔一个孔点入3μL 1kb DNA ladder(NEB,#N3232S),100V电压电泳1h,切取5kb位置2mm厚的胶块。

  2.DNA纯化回收

  利用Qiagen Gel extraction kit(Qiagen,Cat No./ID:28004)回收琼脂糖凝胶中的核酸片段,具体操作如下:保存胶块的离心管中加入300μL Buffer QG;将QIAquick离心柱置入对应的2ml收集管,待胶块完全溶解后,移入离心柱,6000rpm离心1分钟;弃离心过柱的液体,加入750μL Buffer PE,6000rpm离心1分钟,弃离心过柱的液体,重复此步骤一次;将QIAquick离心柱再次放回收集管,13000rpm离心1分钟,然后将QIAquick离心柱转至一个新的1.5mL EP管内;向QIAquick离心柱内底部中心加入58μL Buffer EB,静置2分钟,13000rpm离心1分钟,离心所得液体即为过柱纯化得到的DNA。

  六、DNA片段末端磷酸化

  1.末端修复

  按以下配比在冰上配置DNA片段末端修复反应体系:第五步骤产物57μL;10×T4 DNA ligase Buffer 7μL;T4 Polynucleotide Kinase(NEB,#M0201S)6μL。

  反应条件:37℃孵育60min;然后加热至65℃,处理20min,以终止反应。

  七、连接产物环化

  按以下配比在冰上配置DNA片段末端修复反应体系:第六步骤产物70μL;10×T4 DNA ligase Buffer 23μL;T4 DNA ligase(NEB,#M0201T)13.4μL;ddH2O补至300μL。

  反应条件:16℃孵育16h;然后加热至65℃,处理10min,以终止反应。

  八、去除线性DNA片段

  按以下配比在冰上配置DNA片段末端修复反应体系:第七步骤产物300μL;Plasmid-safe exonuclease(Epicentre,#E3110K)2μL;Buffer 1μL;ATP 4μL。

  反应条件:37℃孵育15min;然后加入1M EDTA 12μL,加热至70℃,处理30min,以终止反应。

  九、环化DNA片段化

  用Covaris S220对第八步产物进行片段打碎。

  具体条件如下:8℃,microTUBE,Duty Factor 5%,Intensity 8,Cycles per Burst 200,80秒。

  然后参考步骤三中2.纯化回收步骤,对连接反应的产物进行柱纯化。

  十、磁珠捕获带有接头的DNA片段

  利用链霉亲和素标记的磁珠M280(Dynal magnetic M-280 streptavidin beads)捕获步骤九产物。

  具体操作如下:

  1.取20μL M280,用磁铁吸附磁珠,然后用移液器吸去上清;

  2.加入50μL wash buffer洗涤,用磁铁吸附磁珠,然后用移液器吸去上清;重复一次;

  3.加入50μL Binding Buffer悬浮磁珠,然后加入50μL步骤九的产物,混匀后至旋转盘上低速转动,室温结合15min,每2min轻弹管壁或短暂涡旋混匀磁珠,使步骤九产物中含生物素标记的分子充分结合到磁珠上;

  4.用磁铁吸附磁珠,小心除去上清,然后用200μL wash buffer清洗磁珠3次;

  5.用磁铁吸附磁珠,小心除去上清,然后加入200μL QIAGEN EB buffer清洗磁珠2次。

  十一、测序文库构建和高通量测序

  使用Kapa library preparation kit(KAPA Biosystems,#KK8221),按照说明书,构建测序文库。将文库进行Illumina HiSeq读长为100nt的双向测序。

  结果:

  三种文库的拼接结果,如表1所示。

  表1 常规高通量建库方法与本发明高通量建库方法测序结果的比较

  结果表明:

  (a)只使用短片段文库测序数据进行拼接,片段的数量非常多,N50的长度仅为基因组长度的万分之一;

  (b)加入常规长片段文库测序数据之后,片段数量减少30%,N50长度只增加了4%;

  (c)加入本发明中文库的测序数据,拼接结果的完整性有明显提高,片段数量仅为加入常规长片段文库的3%,N50长度增加了65倍。

  数据分析发现,本发明文库的测序结果中,85%的序列来自环化的长片段, 其中30%的reads中含有接头序列;而常规长片段文库中仅有40%来自环化片段,且不能判断环化位点,即不能发现错误连接。

  该实施例说明,如图3所示,本发明不仅能提高长片段文库的效率,还能发现环化时的连接错误,从而极其显著地提高基因组拼接的完整度和准确度。

  实施例4

  在本实施例中,对不同长度的接头(图4)之间的比较,包括以下步骤:

  (1)选取细菌、古菌和真菌基因组各10个以及植物和动物基因组各2个作为参考序列,以接头的长链序列为基础,在5’端添加2个(SEQ ID NO:5 CGAATTCGAGAATCTCGC)或4个碱基(SEQ ID NO:6 ACGAATTCGTAGAATCTCGC),选取其中在参考序列中出现几率最低的序列;

  (2)以接头的长链序列为基础,从5’端分别去掉2个(SEQ ID NO:4 AATTAGAATCTCGC)或4个碱基(SEQ ID NO:3 ATAGAATCTCGC);

  (3)以上述序列分别合成单链核酸分子,根据实施例1中的方法制备接头,接头结构如图4所示,并根据实施例3的方法构建文库。

  结果表明:增加接头的粘性末端长度对于文库效率没有显著的影响(仅小幅下降),并且会增加实验成本(如接头No.4和No.5),但也可基本实现本发明的目的。

  此外,缩短接头的粘性末端长度会明显降低环化效率,并且失去限制性酶切位点(如接头No.2和No.3)。尤其是当接头的粘性末端长度≤4nt时,环化效率明显下降。

  上述实施例说明,本发明提供接头的突出末端的长度是最适于高效长片段环化文库构建的。

  虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,仅为本发明的较佳实施例而已,并不用以限制本发明,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改、等同替换或改进等,均属于本发明要求保护的范围。

  在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

  序列表

  <110>中国科学院天津工业生物技术研究所

  <120>一种接头和通过高效率环化方式构建测序文库的方法

  <130>P2016-2192

  <160>6

  <170>PatentIn version 3.5

  <210>1

  <211>10

  <212>DNA

  <213>人工序列

  <400>1

  gcgagattct 10

  <210>2

  <211>16

  <212>DNA

  <213>人工序列

  <400>2

  gaattcagaa tctcgc16

  <210>3

  <211>12

  <212>DNA

  <213>人工序列

  <400>3

  atagaatctc gc12

  <210>4

  <211>14

  <212>DNA

  <213>人工序列

  <400>4

  aattagaatc tcgc14

  <210>5

  <211>18

  <212>DNA

  <213>人工序列

  <400>5

  cgaattcgag aatctcgc18

  <210>6

  <211>20

  <212>DNA

  <213>人工序列

  <400>6

  acgaattcgt agaatctcgc20

《一种接头和通过高效率环化方式构建测序文库的方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)