无创产前胎儿αSEA型地贫基因突变检测文库构建方法、检测方法和试剂盒
技术领域
本发明涉及基因检测技术领域,尤其涉及一种无创产前胎儿α-SEA型地贫基因突变检测文库构建方法、检测方法和试剂盒。
背景技术
地中海贫血(简称地贫)是全世界的高发病率遗传病之一,是由于人体基因突变或者缺失而导致α,β-珠蛋白肽链合成速率的不平衡,从而引起的溶血性贫血。地贫常见的两种类型是α-地贫和β-地贫,α-地贫相关基因为HBA2和HBA1,β-地贫相关基因为HBB。地贫集中在热带和亚热带地区,多发生于地中海沿岸国家,其次为中东、印度、巴基斯坦、东南亚、中国南方和北非,美国是移民国家,其发生率也较高。我国长江以南各省是地贫高发区,广东、广西、海南、中国台湾和香港等地受累人口超过2亿。中国人群中,α-地贫的基因型别常见的有-αSEA、-α3.7、-α4.2、αCS、αQS和αWS,β-地贫常见的有26种基因突变型别。目前地贫尚无根治的方法,只能依靠传统方法治疗,即以输血治疗为主,价格昂贵,因此产前筛查和诊断对预防该种出生缺陷疾病具有重大意义。
1997年,卢煜明发现孕妇外周血浆中存在来自于胎儿的游离DNA,这一发现为通过孕妇外周血无创产前诊断和检测胚胎基因型提供了新的可能,随着高通量测序技术的应用,无创产前检测胚胎染色体异常(如21、18、13染色体非整倍体变异)以及部分大的拷贝数变异已经成功应用于临床产前筛查和诊断,但是孕妇体内胎儿游离DNA仅占孕妇血浆中总游离DNA的3%-6%,对于胎儿无创式的遗传性疾病的检测带来挑战。
不断有研究人员尝试通过孕妇外周血游离DNA对胎儿地贫基因做出检测,由于孕妇外周血中存在大量母源游离DNA,所以如何有效区分胚胎基因的突变,对检测方法的灵敏度提出了很高的要求。目前临床报道产前检测地贫基因突变的方法有几种:传统的羊膜穿刺、腹绒毛活检等,由于是有创伤性的操作,可能伴有胎儿损伤、流产或宫内感染等风险。利用母体血浆中游离胎儿DNA的无创产前诊断也有些研究。Chiu RW通过使用实时荧光PCR技术实现了对父源codons 41/42 4bp缺失的有效检测,还有科研工作者发展了针对其他β地贫点突变的检测方法,但由于检测突变多为点突变,方法的特异性有待提高。对于α地贫突变的研究也有报道,Warunee Tungwiwat等人,建立了基于荧光定量PCR检测α0缺失的方法,然而该方法的灵敏度有待提高。此外,多种高灵敏度的技术方法也被尝试用于无创地贫检测,如质谱、数字PCR、COLD-PCR等。但这些基于单一位点的PCR技术的检测方法存在一定的局限性,如血浆DNA低含量及高度片段化的特点,很可能会带来PCR的假阴性。这种方法只能够检测与母亲不同的特异性父源突变是否存在,而无法进一步确定母源突变的存在与否。基于高通量测序技术的孕妇血浆游离DNA的全基因组测序或者目标区域捕获测序可以更加准确的实现对胎儿地贫基因的检测,但全基因组测序的成本以及分析方法的复杂性和需要父母单体型等限制了在临床上的应用;目标区域捕获测序由于其目标区域捕获效率低,仅能实现对胎儿αSEA缺失纯杂合型的区分,并且还存在分型错误的可能。鉴于此,需要提供一种高精确度的无创产前胎儿地贫基因突变检测方法。
发明内容
本发明提供一种无创产前胎儿α-SEA型地贫基因突变检测文库构建方法、检测方法和试剂盒,能够准确、高效地检测α-SEA型地贫基因突变,其结果与羊水穿刺检测分型一致,但安全性、无创性和高效性方面明显优于羊水穿刺检测。
根据本发明的第一方面,本发明提供一种无创产前胎儿α-SEA型地贫基因突变检测文库构建方法,上述文库用于通过高通量测序进行无创产前胎儿α-SEA型地贫基因突变的检测,上述方法包括:
(a)对母体外周血游离DNA连接带有特异标签序列和任选的样本标签序列的接头序列;
(b)使用预文库扩增引物序列对上一步的连接产物进行预文库扩增,其中上述预文库扩增引物序列与上述接头序列互补结合;
(c)将上一步得到的预文库分为上游预文库和下游预文库,分别使用上游特异性引物组1和下游特异性引物组1对上述上游预文库和下游预文库进行特异性扩增,分别得到上游特异性扩增产物1和下游特异性扩增产物1,
其中,上述上游特异性引物组1包括用于扩增α-SEA型地贫基因的上游引物1以及用于计算胎儿游离DNA比例的多个SNP位点的上游引物组1;上述下游特异性引物组1包括用于扩增α-SEA型地贫基因的下游引物1以及用于计算胎儿游离DNA比例的多个SNP位点的下游引物组1;
(d)对上述上游特异性扩增产物1和下游特异性扩增产物1,分别使用上游特异性引物组2和下游特异性引物组2进行特异性扩增,分别得到上游特异性扩增产物2和下游特异性扩增产物2,
其中,上述上游特异性引物组2包括用于扩增α-SEA型地贫基因的上游引物2以及用于计算胎儿游离DNA比例的多个SNP位点的上游引物组2;上述下游特异性引物组2包括用于扩增α-SEA型地贫基因的下游引物2以及用于计算胎儿游离DNA比例的多个SNP位点的下游引物组2;
并且,上述上游特异性引物组2相比上述上游特异性引物组1更靠近对应的扩增目标位点,上述下游特异性引物组2相比上述下游特异性引物组1更靠近对应的扩增目标位点;上述上游特异性引物组2和上述下游特异性引物组2的5’端含有用于高通量测序文库的接头序列;
(e)将上述上游特异性扩增产物2和下游特异性扩增产物2混合后,使用两端的通用引物进行扩增,得到可上机测序的文库。
进一步地,上述上游特异性引物组1和下游特异性引物组1的5'端带有用于分离扩增产物的修饰,优选带有生物素修饰。
进一步地,上述上游特异性引物组1中针对特定目标位点的引物的3’端,与上述上游特异性引物组2中针对该目标位点的引物的5’端有10-15个碱基的重合;上述下游特异性引物组1中针对特定目标位点的引物的3’端,与上述下游特异性引物组2中针对该目标位点的引物的5’端有10-15个碱基的重合。
进一步地,上述用于扩增α-SEA型地贫基因的上游引物1序列如SEQ ID NO:1所示;
上述用于计算胎儿游离DNA比例的多个SNP位点的上游引物组1序列如SEQ ID NO:2-11所示;
上述用于扩增α-SEA型地贫基因的下游引物1序列如SEQ ID NO:12所示;
上述用于计算胎儿游离DNA比例的多个SNP位点的下游引物组1序列如SEQ ID NO:13-22所示;
上述用于扩增α-SEA型地贫基因的上游引物2序列如SEQ ID NO:23所示;
上述用于计算胎儿游离DNA比例的多个SNP位点的上游引物组2序列如SEQ ID NO:24-33所示;
上述用于扩增α-SEA型地贫基因的下游引物2序列如SEQ ID NO:34所示;
上述用于计算胎儿游离DNA比例的多个SNP位点的下游引物组2序列如SEQ ID NO:35-44所示。
根据本发明的第二方面,本发明提供一种无创产前胎儿α-SEA型地贫基因突变检测方法,包括对第一方面的方法构建的文库进行高通量测序得到测序读长(reads);然后,根据位点的唯一的特异标签序列的总深度和突变等位基因(allele)的深度,计算胎源DNA含量并对地贫相关的突变进行分型以分析α-SEA型地贫基因突变情况。
根据本发明的第三方面,本发明提供一种无创产前胎儿α-SEA型地贫基因突变检测文库构建试剂盒,上述文库用于通过高通量测序进行无创产前胎儿α-SEA型地贫基因突变的检测,上述试剂盒包括:
(a)上游特异性引物组1和下游特异性引物组1,分别用于对上游预文库和下游预文库进行特异性扩增,以分别得到上游特异性扩增产物1和下游特异性扩增产物1,
其中,上述上游特异性引物组1包括用于扩增α-SEA型地贫基因的上游引物1以及用于计算胎儿游离DNA比例的多个SNP位点的上游引物组1;上述下游特异性引物组1包括用于扩增α-SEA型地贫基因的下游引物1以及用于计算胎儿游离DNA比例的多个SNP位点的下游引物组1;
(b)上游特异性引物组2和下游特异性引物组2,分别用于对上述上游特异性扩增产物1和下游特异性扩增产物1进行特异性扩增,以分别得到上游特异性扩增产物2和下游特异性扩增产物2,
其中,上述上游特异性引物组2包括用于扩增α-SEA型地贫基因的上游引物2以及用于计算胎儿游离DNA比例的多个SNP位点的上游引物组2;上述下游特异性引物组2包括用于扩增α-SEA型地贫基因的下游引物2以及用于计算胎儿游离DNA比例的多个SNP位点的下游引物组2;
并且,上述上游特异性引物组2相比上述上游特异性引物组1更靠近对应的扩增目标位点,上述下游特异性引物组2相比上述下游特异性引物组1更靠近对应的扩增目标位点;上述上游特异性引物组2和上述下游特异性引物组2的5’端含有用于高通量测序文库的接头序列。
进一步地,上述上游特异性引物组1和下游特异性引物组1的5'端带有用于分离扩增产物的修饰,优选带有生物素修饰。
进一步地,上述上游特异性引物组1中针对特定目标位点的引物的3’端,与上述上游特异性引物组2中针对该目标位点的引物的5’端有10-15个碱基的重合;上述下游特异性引物组1中针对特定目标位点的引物的3’端,与上述下游特异性引物组2中针对该目标位点的引物的5’端有10-15个碱基的重合。
进一步地,上述用于扩增α-SEA型地贫基因的上游引物1序列如SEQ ID NO:1所示;
上述用于计算胎儿游离DNA比例的多个SNP位点的上游引物组1序列如SEQ ID NO:2-11所示;
上述用于扩增α-SEA型地贫基因的下游引物1序列如SEQ ID NO:12所示;
上述用于计算胎儿游离DNA比例的多个SNP位点的下游引物组1序列如SEQ ID NO:13-22所示;
上述用于扩增α-SEA型地贫基因的上游引物2序列如SEQ ID NO:23所示;
上述用于计算胎儿游离DNA比例的多个SNP位点的上游引物组2序列如SEQ ID NO:24-33所示;
上述用于扩增α-SEA型地贫基因的下游引物2序列如SEQ ID NO:34所示;
上述用于计算胎儿游离DNA比例的多个SNP位点的下游引物组2序列如SEQ ID NO:35-44所示。
进一步地,上述试剂盒还包括:
(c)接头序列,其带有特异标签序列和任选的样本标签序列,用于连接母体外周血游离DNA,以得到连接产物;
(d)预文库扩增引物序列,其与上述接头序列互补结合,用于对上述连接产物进行预文库扩增;
(e)通用引物,用于在上述上游特异性扩增产物2和下游特异性扩增产物2混合后,对混合产物进行扩增,以得到可上机测序的文库;
优选地,
上述接头序列如SEQ ID NO:45-46所示;
上述预文库扩增引物序列如SEQ ID NO:47-48所示;
上述通用引物如SEQ ID NO:49-50所示。
本发明的方法和试剂盒,能够通过以母体游离血浆DNA为原始材料,构建α-SEA型地贫基因突变检测的文库,并通过对文库进行高通量测序而实现α-SEA型地贫基因突变检测。关键在于,在文库构建中,对母体外周血游离DNA片段连接特异性的接头,然后创造性地将接头连接产物预扩增产物分成两部分,分别独立地使用针对目标位点(如α-SEA型地贫基因)的上、下游引物进行两轮特异性扩增,能够高特异性地富集目标位点,显著提高引物扩增特异性。并且在扩增过程中,分别使用用于计算胎儿游离DNA比例的多个SNP位点的上游引物组和下游引物组进行扩增,具体地,针对SNP位点也使用不同的引物进行两轮特异性扩增,能够高效、准确的计算胎儿DNA比例。从而,在高通量测序之后,能够依据测序读长计算胎源DNA含量并对地贫相关的突变进行分型,有效区分胚胎基因的突变。
进一步地,发明人特别针对地贫基因设计了高效的引物,以及计算胎儿DNA比例的多个SNP位点的引物。使用本发明的文库构建方法,优选地在使用本发明提供的引物序列组的情况下,能够准确、高效地检测α-SEA型地贫基因突变,其结果与羊水穿刺检测分型一致,但安全性、无创性和高效性方面明显优于羊水穿刺检测。
附图说明
图1为本发明实施例的无创产前胎儿α-SEA型地贫基因突变检测文库构建方法和突变检测方法的流程示意图;
图2为本发明实施例的上下游特异性引物、通用引物与模板结合的相对位置关系示意图;
图3为本发明实施例的无创产前胎儿α-SEA型地贫基因突变检测的预文库(a)和终文库(b)的2%凝胶电泳检测图谱,M表示Marker,A10-A15表示6个示例性的样本。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。
如图1所示,本发明实施例的无创产前胎儿α-SEA型地贫基因突变检测文库构建方法包括步骤:
S1:对母体外周血游离DNA连接带有特异标签序列和任选的样本标签序列的接头序列。
母体外周血游离DNA,即孕妇的外周血游离DNA,其中包括母源血游离DNA和胎源游离DNA。接头序列带有特异标签序,该特异标签序可以是一段n个(例如8或10个)碱基长度的随机序列,使得每一接头序列均不同于其它接头序列,也就是说,接头序列用于区分其连接的母体外周血游离DNA,使得每一母体外周血游离DNA片段都带有特异性的接头序列,便于后续测序之后的序列信息分析中能够区分不同母体外周血游离DNA片段。由于在高通量测序中,每次都能产生海量的测序数据,因此往往将不同来源(例如来源于不同母体的外周血游离DNA)的样本混库(pooling)进行测序,因此接头序列还可以带有一段样本标签序列(index),其用于区分不同来源的样本。
S2:使用预文库扩增引物序列对上一步的连接产物进行预文库扩增,其中预文库扩增引物序列与接头序列互补结合。
进行预文库扩增(或称“预扩增”)是为了增加接头连接产物的量,因为接头连接产物中有些分子的拷贝数可能偏低,在后续分成上、下游两部分进行特异性扩增时,这些拷贝数偏低的分子可能不能得到有效扩增,而预扩增增加接头连接产物的量,使得各种拷贝数的分子都能得到有效扩增。
S3:将上一步得到的预文库分为上游预文库和下游预文库,分别使用上游特异性引物组1和下游特异性引物组1对上游预文库和下游预文库进行特异性扩增,分别得到上游特异性扩增产物1和下游特异性扩增产物1。
本发明将预文库分为上游预文库和下游预文库分别进行两轮特异性扩增,能够显著提高引物扩增特异性。上、下游分开独立扩增的有益效果包括:一方面,由于二代高通量测序读长(reads)短的原因,上游特异性引物与下游特异性引物需要比较靠近扩增目标位点(或目标区域),不分开难以有效扩增到目标片段,而上、下游分开独立扩增能够有效扩增到目标片段;另一方面,上、下游分开独立扩增能够在序列的一端保留接头序列,便于后续高通量测序的进行。
本发明实施例中,扩增目标位点(或目标区域)包括α-SEA型地贫基因和用于计算胎儿游离DNA比例的多个SNP位点两种,相应的,上游特异性引物组1和下游特异性引物组1也均分别包括两种引物,即上游特异性引物组1包括:用于扩增α-SEA型地贫基因的上游引物1以及用于计算胎儿游离DNA比例的多个SNP位点的上游引物组1;下游特异性引物组1包括:用于扩增α-SEA型地贫基因的下游引物1以及用于计算胎儿游离DNA比例的多个SNP位点的下游引物组1。
如图2示出了本发明实施例中用于扩增α-SEA型地贫基因的上游引物1(USP1)和用于扩增α-SEA型地贫基因的下游引物1(DSP1)与模板结合的相对位置关系。可以看出,USP1和DSP1分别位于扩增目标位点——或称检测点(即-SEA型缺失断裂点)的左右两侧,一般而言USP1和DSP1的3’端距离检测点较近,例如几个碱基、十几个碱基的距离,其中一个原因是,二代高通量测序的读长序列(reads)较短,例如100bp左右,如果USP1和DSP1的3’端距离检测点较远的话,可能二代高通量测序不能有效地测到检测点。用于计算胎儿游离DNA比例的多个SNP位点的上、下游特异性引物与模板结合的相对位置关系与图2的示意图相同。
为了能够分离上游特异性扩增产物1和下游特异性扩增产物1,上游特异性引物组1和下游特异性引物组1的5'端可以带有用于分离扩增产物的修饰,优选带有生物素修饰,生物素能够与亲和素结合,因此上游特异性扩增产物1和下游特异性扩增产物1可以通过生物素-亲和素亲和结合从反应体系中分离出来。
S4:对上游特异性扩增产物1和下游特异性扩增产物1,分别使用上游特异性引物组2和下游特异性引物组2进行特异性扩增,分别得到上游特异性扩增产物2和下游特异性扩增产物2。
只有一轮特异性引物扩增的情况下,可能会有非特异性扩增产物的存在。因此,需要进行第二轮特异性引物扩增,该第二轮的特异性引物扩增使用的特异性引物也包括上游特异性引物和下游特异性引物。
在本发明实施例中,类似于第一轮特异性引物扩增,第二轮特异性引物扩增使用的上游特异性引物组2包括:用于扩增α-SEA型地贫基因的上游引物2以及用于计算胎儿游离DNA比例的多个SNP位点的上游引物组2;下游特异性引物组2包括:用于扩增α-SEA型地贫基因的下游引物2以及用于计算胎儿游离DNA比例的多个SNP位点的下游引物组2。
如图2示出了本发明实施例中用于扩增α-SEA型地贫基因的上游引物2(USP2)和用于扩增α-SEA型地贫基因的下游引物2(DSP2)与模板结合的相对位置关系。可以看出,USP2相比USP1更靠近-SEA型缺失断裂点,DSP2相比DSP1更靠近-SEA型缺失断裂点。用于计算胎儿游离DNA比例的多个SNP位点的上、下游引物组2与模板结合的相对位置关系与图2的示意图相同。总之,上游特异性引物组2相比上游特异性引物组1更靠近对应的扩增目标位点,下游特异性引物组2相比下游特异性引物组1更靠近对应的扩增目标位点。
在具体实施例中,上游特异性引物组1中针对特定目标位点的引物(例如针对α-SEA型地贫基因的USP1)的3’端,与上游特异性引物组2中针对该目标位点的引物(例如针对α-SEA型地贫基因的USP2)的5’端有10-15个碱基的重合;类似地,下游特异性引物组1中针对特定目标位点的引物(例如针对α-SEA型地贫基因的DSP1)的3’端,与下游特异性引物组2中针对该目标位点的引物(例如针对α-SEA型地贫基因的DSP2)的5’端有10-15个碱基的重合。此处“3’端”和“5’端”,分别是指靠近3’末端和5’末端的一段序列。这种重合,主要是考虑USP1和DSP1原本距离检测点(例如-SEA型缺失断裂点)较近,碱基的重合能够在进一步提高扩增特异性的同时,充分有效利用结合空间。
为了便于高通量测序的进行,上游特异性引物组2和下游特异性引物组2 的5’端可以含有用于高通量测序文库的接头序列。具体的,使用何种高通量测序平台,则采用该平台对应的接头序列。
S5:将上游特异性扩增产物2和下游特异性扩增产物2混合后,使用两端的通用引物进行扩增,得到可上机测序的文库。
如图2所示,通用引物(UNP)能够结合接头序列,通过通用引物扩增即可得到上机测序的文库。上机测序通过高通量测序实现。高通量测序技术可以选自Illumina/Genome Analyzer/Hiseq/Miseq/NEXTseq CN500、Applied Biosystems SOLID和life Technologies/Ion Torrent。具体的,使用何种高通量测序技术,则通用引物也采用该高通量测序技术对应的引物。
在本发明的一个实施例中,用于扩增α-SEA型地贫基因的上游引物1序列如SEQ ID NO:1所示;用于计算胎儿游离DNA比例的多个SNP位点的上游引物组1序列如SEQ ID NO:2-11所示;用于扩增α-SEA型地贫基因的下游引物1序列如SEQ ID NO:12所示;用于计算胎儿游离DNA比例的多个SNP位点的下游引物组1序列如SEQ ID NO:13-22所示;用于扩增α-SEA型地贫基因的上游引物2序列如SEQ ID NO:23所示;用于计算胎儿游离DNA比例的多个SNP位点的上游引物组2序列如SEQ ID NO:24-33所示;用于扩增α-SEA型地贫基因的下游引物2序列如SEQ ID NO:34所示;用于计算胎儿游离DNA比例的多个SNP位点的下游引物组2序列如SEQ ID NO:35-44所示。
本发明实施例还提供一种无创产前胎儿α-SEA型地贫基因突变检测方法,包括对本发明实施例构建的文库进行高通量测序得到测序读长(reads);然后,根据位点的唯一的特异标签序列的总深度和突变等位基因(allele)的深度,计算胎源DNA含量并对地贫相关的突变进行分型以分析α-SEA型地贫基因突变情况。
本发明实施例还提供一种无创产前胎儿α-SEA型地贫基因突变检测文库构建试剂盒,上述文库用于通过高通量测序进行无创产前胎儿α-SEA型地贫基因突变的检测,上述试剂盒包括:
(R1)上游特异性引物组1和下游特异性引物组1,分别用于对上游预文库和下游预文库进行特异性扩增,以分别得到上游特异性扩增产物1和下游特异性扩增产物1,其中,上游特异性引物组1包括用于扩增α-SEA型地贫基因的上游引物1以及用于计算胎儿游离DNA比例的多个SNP位点的上游引物组1;下游特异性引物组1包括用于扩增α-SEA型地贫基因的下游引物1以及用于计算胎儿游离DNA比例的多个SNP位点的下游引物组1;
(R2)上游特异性引物组2和下游特异性引物组2,分别用于对上游特异性扩增产物1和下游特异性扩增产物1进行特异性扩增,以分别得到上游特异性扩增产物2和下游特异性扩增产物2,其中,上游特异性引物组2包括用于扩增α-SEA型地贫基因的上游引物2以及用于计算胎儿游离DNA比例的多个SNP位点的上游引物组2;下游特异性引物组2包括用于扩增α-SEA型地贫基因的下游引物2以及用于计算胎儿游离DNA比例的多个SNP位点的下游引物组2。
其中,上游特异性引物组2相比上游特异性引物组1更靠近对应的扩增目标位点,下游特异性引物组2相比下游特异性引物组1更靠近对应的扩增目标位点;上游特异性引物组2和下游特异性引物组2的5’端含有用于高通量测序文库的接头序列。
在优选的实施例中,上游特异性引物组1和下游特异性引物组1的5'端带有用于分离扩增产物的修饰,优选带有生物素修饰,以便从体系中分离上游特异性扩增产物1和下游特异性扩增产物1。
在优选的实施例中,上游特异性引物组1中针对特定目标位点的引物的3’端,与上游特异性引物组2中针对该目标位点的引物的5’端有10-15个碱基的重合;下游特异性引物组1中针对特定目标位点的引物的3’端,与下游特异性引物组2中针对该目标位点的引物的5’端有10-15个碱基的重合。
在本发明的一个实施例中,用于扩增α-SEA型地贫基因的上游引物1序列如SEQ ID NO:1所示;用于计算胎儿游离DNA比例的多个SNP位点的上游引物组1序列如SEQ ID NO:2-11所示;用于扩增α-SEA型地贫基因的下游引物1序列如SEQ ID NO:12所示;用于计算胎儿游离DNA比例的多个SNP位点的下游引物组1序列如SEQ ID NO:13-22所示;用于扩增α-SEA型地贫基因的上游引物2序列如SEQ ID NO:23所示;用于计算胎儿游离DNA比例的多个SNP位点的上游引物组2序列如SEQ ID NO:24-33所示;用于扩增α-SEA型地贫基因的下游引物2序列如SEQ ID NO:34所示;用于计算胎儿游离DNA比例的多个SNP位点的下游引物组2序列如SEQ ID NO:35-44所示。
在优选的实施例中,试剂盒还包括:
(R3)接头序列,其带有特异标签序列和任选的样本标签序列,用于连接母体外周血游离DNA,以得到连接产物;
(R4)预文库扩增引物序列,其与上述接头序列互补结合,用于对上述连接产物进行预文库扩增;
(R5)通用引物,用于在上述上游特异性扩增产物2和下游特异性扩增产物2混合后,对混合产物进行扩增,以得到可上机测序的文库。
在本发明的一个实施例中,接头序列如SEQ ID NO:45-46所示;预文库扩增引物序列如SEQ ID NO:47-48所示;通用引物如SEQ ID NO:49-50所示。
以下通过实施例详细说明本发明的技术方案和技术效果,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。
实施例
1、针对α地中海贫血基因-αSEA突变位点设计合成引物:
上游引物和下游引物分别位于检测点左侧和右侧。同侧的特异性引物1的3’端和特异性引物2的5’端有10-15个碱基的重合。特异性引物1的5'端有生物素修饰。特异性引物2的5’端含有用于高通量测序文库的接头序列。具体的,引物序列如表1所示。
表1
2、带有特异标签序列和样本标签序列(index)的接头序列:
ADT-F:
CAAGCAGAAGACGGCATACGAGATNNNNNNNNATTAAGGGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:45);
ADT-R:pGATCGGAAGAGC(SEQ ID NO:46)。
其中,NNNNNNNN是特异标签序列,ATTAAGG是样本标签序列(index),以上接头序列需要退火成双链。
3、预文库扩增引物序列:
pre-lib-primer-F:CAAGCAGAAGACGGCATACGA(SEQ ID NO:47);
pre-lib-primer-R:GCTCTTCCGATCT(SEQ ID NO:48)。
4、终文库扩增引物序列(通用引物):
Seq-lib-primer-F:CAAGCAGAAGACGGCATACGA(SEQ ID NO:49);
Seq-lib-primer-R:
ATGATACGGCGACCACCGAGATCTACACTCGTCGGCAGCGTC(SEQ ID NO:50)。
5、本发明实施例的检测方法和检测试剂盒,具体建库步骤为:
1)提取2ml孕妇血浆游离DNA。
2)游离DNA末端修复,配置反应体系(反应一)如表2所示。
表2
充分混匀,瞬时离心,在热循环仪上进行如下反应:37℃,20min;72℃,20min;4℃保存。
3)DNA片段连接带有特异标签序列和样本标签序列的接头序列,配置反应体系(反应二)如表3所示。
表3
充分混匀,瞬时离心,在热循环仪上进行如下反应:20℃,15min;65℃,10min;4℃保存。
4)反应结束后,立即使用30μL XP beads纯化,26μL超纯水或者洗脱液中洗脱。
5)PCR预扩增
在冰上配置如下反应体系,如表4所示。
表4
充分混匀,瞬时离心,在热循环仪上进行如下反应:95℃,3min,1循环;(95℃,15s,62℃,30s,72℃,30s)10循环;72℃,5min,1循环;4℃保存。
6)反应终产物使用50μL XP beads回收纯化,使用Qubit定量,5μL反应产物2%凝胶电泳检测,结果如图3a所示,表明预文库构建成功。取两等份预文库,分别命名为上游预文库和下游预文库,每份100ng,进行下一步扩增。
7)特异性扩增1
每份样品预文库为上游预文库和下游预文库,分别使用对应的上、下游特异性引物1和特异性引物2,直到使用通用引物扩增时将每份样品上、下游引物扩增产物合并,再使用通用引物扩增。
在冰上配置如下反应体系,如表5所示。
表5
PCR反应程序如下:95℃,10min,1循环;(95℃,30s,62℃,30s,72℃,1min)20循环;72℃,7min,1循环;4℃保存。
8)5μL反应产物2%琼脂糖凝胶电泳,剩余产物1.2X XP回收,24μL超纯水或者洗脱液洗脱,洗脱液进行下一步扩增。
9)特异性扩增2
在冰上配置如下反应体系,如表6所示。
表6
PCR反应程序如下:95℃,10min,1循环;(95℃,30s,62℃,30s,72℃,1min)15循环;72℃,7min,1循环;4℃保存。
10)5μL反应产物2%琼脂糖凝胶电泳,剩余产物1.2X XP回收,每一个样品的上下游扩增产物可以合并回收,最终26μL超纯水或者洗脱液洗脱,洗脱液进行通用引物扩增。
11)通用引物扩增
在冰上配置如下反应体系,如表7所示。
表7
PCR反应程序如下:98℃,45s,1循环;(98℃,15s,60℃,30s,72℃,30s)10循环;72℃,1min,1循环;4℃保存。
12)5μL反应产物2%凝胶电泳检测,结果如图3b所示,表明终文库构建成功。剩余产物1.0X XP回收,最后使用30ul洗脱液洗脱,即为最终上机文库。
13)文库质控后,Illumina NEXTseq CN500进行75PE测序。
14)测序数据信息分析
过滤掉低质量测序读长(reads)后,对于每一对pair-end reads根据所连接的分子标签序列和扩增引物序列归类,当reads起始部分序列与实验加入的引物序列和分子标签序列不一致时,reads将被过滤掉。保留下来的pair-end reads用BWA MEM人类参考基因组(hg19)比对,按同起始、同终止位置且分子标签一致的序列聚类到同一组,得到唯一的分子标签组序列,将唯一的分子标签组序列重新比对到参考基因组(BWA MEM),用GATK软件对Indel周围的序列重新比对,用samtools软件进行SNP和小的插入缺失检测,用FACTERA软件进行—SEA缺失检测。根据位点的唯一的分子标签组序列的总深度和相关SNP位点等位基因(allele)的深度,计算胚胎DNA含量,并对胎儿地贫相关的SNP、INDEL,--SEA型缺失进行分型。
根据上述实施例,对14例地中海贫血携带者的孕妇进行无创产前地中海贫血基因检测,结果如下表8所示。
表8
结果显示,本发明实施例对–αSEA地中海贫血基因突变无创产前检测和羊水穿刺检测分型一致,表明本发明的方法能够准确、高效地检测α-SEA型地贫基因突变,其结果与羊水穿刺检测分型一致,但安全性、无创性和高效性方面明显优于羊水穿刺检测。
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
SEQUENCE LISTING
<110> 人和未来生物科技(长沙)有限公司
<120> 无创产前胎儿αSEA型地贫基因突变检测文库构建方法、检测方法和试剂盒
<130> 17I23913
<160> 50
<170> PatentIn version 3.3
<210> 1
<211> 30
<212> DNA
<213> 引物序列
<400> 1
tcgtcgcggc ctggggttca cttggggggc 30
<210> 2
<211> 30
<212> DNA
<213> 引物序列
<400> 2
tgtagagcag aaaggtatgg gctcaactag 30
<210> 3
<211> 33
<212> DNA
<213> 引物序列
<400> 3
ctcttttatt ctatacttct ctaatactca cct 33
<210> 4
<211> 30
<212> DNA
<213> 引物序列
<400> 4
gttctccctg ttccggggac atcaccttcc 30
<210> 5
<211> 30
<212> DNA
<213> 引物序列
<400> 5
gatttttagg gcagtgaaac tcctctacag 30
<210> 6
<211> 30
<212> DNA
<213> 引物序列
<400> 6
ttagtcttac tttgcttttt taaattagct 30
<210> 7
<211> 25
<212> DNA
<213> 引物序列
<400> 7
tgttaggatg tacacacatt ttaat 25
<210> 8
<211> 30
<212> DNA
<213> 引物序列
<400> 8
agacattact gctttgaaga ctttgtgtat 30
<210> 9
<211> 30
<212> DNA
<213> 引物序列
<400> 9
cctatcgcca agtggtgaga caatcgccga 30
<210> 10
<211> 30
<212> DNA
<213> 引物序列
<400> 10
tttagtcatg aagttttctg agtgccagtg 30
<210> 11
<211> 30
<212> DNA
<213> 引物序列
<400> 11
gtaataataa caacactaat ggcggtaaac 30
<210> 12
<211> 29
<212> DNA
<213> 引物序列
<400> 12
tgaactcctg gacttaagtg atcctcctg 29
<210> 13
<211> 30
<212> DNA
<213> 引物序列
<400> 13
tataatccca caccactctt tgtttgctct 30
<210> 14
<211> 33
<212> DNA
<213> 引物序列
<400> 14
accctataat gctctgtgaa acacctattt gtt 33
<210> 15
<211> 30
<212> DNA
<213> 引物序列
<400> 15
aagatggcca gggaagtgtg agtgacccta 30
<210> 16
<211> 30
<212> DNA
<213> 引物序列
<400> 16
cagcgttata tgttctacag gtttagacaa 30
<210> 17
<211> 25
<212> DNA
<213> 引物序列
<400> 17
tgggaaggct gcatggtgaa tataa 25
<210> 18
<211> 30
<212> DNA
<213> 引物序列
<400> 18
ttcaagcatt cactgaaggt cttggaacgt 30
<210> 19
<211> 25
<212> DNA
<213> 引物序列
<400> 19
tagaaccttt tggactagtt atgcc 25
<210> 20
<211> 30
<212> DNA
<213> 引物序列
<400> 20
caagtgaaag gggtccgatg gtactcactg 30
<210> 21
<211> 30
<212> DNA
<213> 引物序列
<400> 21
aatcttcagt ggggatgtag cacattttgc 30
<210> 22
<211> 30
<212> DNA
<213> 引物序列
<400> 22
atcatgttgg caacatgctt ggagatcccc 30
<210> 23
<211> 49
<212> DNA
<213> 引物序列
<400> 23
agatgtgtat aagagacagg ttcacttggg gggcgccttg gggaggttc 49
<210> 24
<211> 49
<212> DNA
<213> 引物序列
<400> 24
agatgtgtat aagagacagt atgggctcaa ctagctatgt tacaacttc 49
<210> 25
<211> 52
<212> DNA
<213> 引物序列
<400> 25
agatgtgtat aagagacagc ttctctaata ctcacctgtt ctaatgagat tt 52
<210> 26
<211> 44
<212> DNA
<213> 引物序列
<400> 26
agatgtgtat aagagacagg ggacatcacc ttccagtctc caag 44
<210> 27
<211> 49
<212> DNA
<213> 引物序列
<400> 27
agatgtgtat aagagacagg aaactcctct acagcatact gtaatgatg 49
<210> 28
<211> 49
<212> DNA
<213> 引物序列
<400> 28
agatgtgtat aagagacagg cttttttaaa ttagctcttc atgcagcac 49
<210> 29
<211> 44
<212> DNA
<213> 引物序列
<400> 29
agatgtgtat aagagacagc acacatttta atattttggt acca 44
<210> 30
<211> 49
<212> DNA
<213> 引物序列
<400> 30
agatgtgtat aagagacagg aagactttgt gtatactaaa tgtgggtaa 49
<210> 31
<211> 49
<212> DNA
<213> 引物序列
<400> 31
agatgtgtat aagagacagg tgagacaatc gccgagcagt gagaccatc 49
<210> 32
<211> 49
<212> DNA
<213> 引物序列
<400> 32
agatgtgtat aagagacagt tctgagtgcc agtggaactg tcctggttc 49
<210> 33
<211> 49
<212> DNA
<213> 引物序列
<400> 33
agatgtgtat aagagacagc taatggcggt aaacaccatc atcatcttg 49
<210> 34
<211> 49
<212> DNA
<213> 引物序列
<400> 34
agatgtgtat aagagacagt cctggactta agtgatcctc ctgccccag 49
<210> 35
<211> 49
<212> DNA
<213> 引物序列
<400> 35
agatgtgtat aagagacagc cactctttgt ttgctctatt ttggttctc 49
<210> 36
<211> 52
<212> DNA
<213> 引物序列
<400> 36
agatgtgtat aagagacagt ctgtgaaaca cctatttgtt agataaattg at 52
<210> 37
<211> 49
<212> DNA
<213> 引物序列
<400> 37
agatgtgtat aagagacagg aagtgtgagt gaccctaggg gttgtgccc 49
<210> 38
<211> 49
<212> DNA
<213> 引物序列
<400> 38
agatgtgtat aagagacagt tctacaggtt tagacaagtg tatcctaac 49
<210> 39
<211> 49
<212> DNA
<213> 引物序列
<400> 39
agatgtgtat aagagacagg ctgcatggtg aatataagaa ctgaattct 49
<210> 40
<211> 49
<212> DNA
<213> 引物序列
<400> 40
agatgtgtat aagagacagc tgaaggtctt ggaacgtatc ccctgtgga 49
<210> 41
<211> 49
<212> DNA
<213> 引物序列
<400> 41
agatgtgtat aagagacagt tttggactag ttatgccact cctgaggag 49
<210> 42
<211> 49
<212> DNA
<213> 引物序列
<400> 42
agatgtgtat aagagacagg tccgatggta ctcactgctc agcaatagg 49
<210> 43
<211> 49
<212> DNA
<213> 引物序列
<400> 43
agatgtgtat aagagacagg gatgtagcac attttgctat ttgagatgg 49
<210> 44
<211> 49
<212> DNA
<213> 引物序列
<400> 44
agatgtgtat aagagacaga catgcttgga gatccccaga tcaaaggtg 49
<210> 45
<211> 73
<212> DNA
<213> 引物序列
<220>
<221> misc_feature
<222> (25)..(32)
<223> n is a, c, g, or t
<400> 45
caagcagaag acggcatacg agatnnnnnn nnattaaggg tgactggagt tcagacgtgt 60
gctcttccga tct73
<210> 46
<211> 12
<212> DNA
<213> 引物序列
<400> 46
gatcggaaga gc 12
<210> 47
<211> 21
<212> DNA
<213> 引物序列
<400> 47
caagcagaag acggcatacg a 21
<210> 48
<211> 13
<212> DNA
<213> 引物序列
<400> 48
gctcttccga tct 13
<210> 49
<211> 21
<212> DNA
<213> 引物序列
<400> 49
caagcagaag acggcatacg a 21
<210> 50
<211> 43
<212> DNA
<213> 引物序列
<400> 50
aatgatacgg cgaccaccga gatctacact cgtcggcagc gtc 43