一种提高免疫组库多重PCR建库质量的方法及其应用
技术领域
本申请涉及核酸测试文库构建领域,特别是涉及一种提高免疫组库多重PCR建库质量的方法及其应用。
背景技术
免疫组库是指在任何指定时间,某个个体的循环系统中所有功能多样性B细胞和T细胞的总和。在机体的多种疾病进程中,都有免疫过程参与,而这些疾病特异性的免疫反应,能被机体及时记录下来。通过检测这些表达的B细胞或T细胞的受体基因,就能准确的将其反映出来,用来评估个体的免疫状态、疾病的发生、发展和预后,甚至指导治疗。
随着人们对免疫组库理解的深入,其研究技术也经历了3个主要发展阶段,从最初的流式细胞术分析T细胞各亚家族的分布与缺失,到免疫扫描谱系分析技术研究各亚家族CDR3基因长度的多态性,乃至今天采用高通量测序技术完整的检测所有T细胞、B细胞的CDR3序列,免疫组库研究取得了引人瞩目的重要进展,主要应用于肿瘤(如卵巢癌,肾细胞癌)、自身免疫性疾病、器官移植免疫监测、疫苗注射免疫监测等领域。
B淋巴细胞受体库的多样性来源于受体基因的重组。其重链由V、D、J和C共4个基因片段重组形成,而每个基因片段都含有很多的亚型,各个基因片段的亚型之间能以近乎随机的方式产生很多种组合;而且在重排时,各个基因片段之间的连接处会随机插入丢失一些寡核苷酸片段;在B淋巴细胞的亲和力成熟阶段还会发生高频突变。在这些机制的介导下,产生了数量巨大的淋巴细胞受体库。不论是受体的重链还是轻链,N端都存在可变区(缩写V),变异很大;C端结构域则相反,变异极少,称为恒定区(缩写C)。其中,高变区即V区又包含3个互补决定区(complementarity-determining region,缩写CDR)和4个框架区(Framework region,缩写FR),两者交替排列。其中,第三个互补决定区即CDR3区的多样性最高,最能代表受体库的特异性。当前主要的免疫组库测序(Immune Repertoiresequencing,缩写IR-SEQ)技术,都是采用多重PCR建库或5’RACE建库,构建B细胞受体(BCR)或T细胞受体(TCR)的互补决定区(CDR)文库,并结合高通量测序技术进行检测。
cDNA末端快速扩增技术(rapid amplification of cDNA ends,缩写RACE)是一种基于PCR从低丰度的转录本中快速扩增cDNA的5’或3’末端的有效方法。5’RACE即5’末端快速扩增,可以扩增得到cDNA完整序列的5’末端,再通过打断、亲和选择、限制性酶切、目的片段选择等一系列流程即可完成目标区域的富集和筛选。这一方法更为适合长目标片段的检测,因为几乎不涉及PCR,所以扩增偏好性很小。但是,5’RACE建库的不足是,只能针对RNA样本,无法对DNA样本进行检测;并且,操作复杂,人员技术要求高,费时费力,试剂成本高,实验耗费的样本量大。
多重PCR是在一个反应体系中同时扩增多个目的片段的PCR技术,具有高特异性、高灵敏度、高效率、经济简便的特点。但是,多重PCR建库的不足是,由于采用的引物比较多,各引物的扩增效率差异相当大,影响建库质量,进而影响测序结果的准确性。
发明内容
本申请的目的是提供一种新的提高免疫组库多重PCR建库质量的方法及其应用。
为了实现上述目的,本申请采用了以下技术方案:
本申请一方面公开了一种提高免疫组库多重PCR建库质量的方法,包括以核酸标准品为模板,其中,核酸标准品中含有已知用量比例和类型的基因片段;采用多重引物组对核酸标准品进行文库构建;利用多重PCR扩增构建的文库进行测序,分析核酸标准品中各基因片段的比例;将测序分析获得的核酸标准品中各基因片段的比例,与核酸标准品中各基因片段的实际比例进行比较;根据比较结果调整相应的扩增引物在多重引物组中的用量比例;采用比例调整后的多重引物组对待测样品进行扩增建库。其中,多重引物组中,按照目前常规的作法,各引物的用量相同;当然,也可以按照一定的用量比例,最后再根据本申请的方法进行调整,在此不做具体限定。
需要说明的是,本申请的关键在于,利用已知用量比例和类型的基因片段进行多重PCR扩增建库和测序,根据测序结果中分析得到的各基因片段的比例,与实际比例相比较,判断该基因片段的引物的扩增效率。可以理解,如果某个基因片段的引物扩增效率较低,则最终测序结果分析的该基因片段的比例就会低于其在核酸标准品中的实际比例,则需要提高该引物在多重引物组中的用量比例,以保障该基因片段能够被有效的扩增富集,从而提高建库质量。如果某个基因片段的引物扩增效率较高,则最终测序结果分析的该基因片段的比例就会高于其在核酸标准品中的实际比例,此时出于成本考虑可以适当减小该引物在多重引物组中的用量比例;当然,为了保障建库质量或测序效果,一般不建议降低引物的用量比例,除非某个基因片段的引物扩增效率实在太高,影响到其它引物的扩增。
还需要说明的是,本申请的方法中,核酸标准品中所含有的基因片段,是免疫组库检测中经常会检测的基因片段,例如可变区的V基因片段;可以理解,如果核酸标准品中所包含的基因片段与免疫组库检测的片段越吻合,或含的基因片段越多,则遗漏的没有扩增和评价的引物就越少,对于多重PCR建库质量的提高效果也会更好。因此,核酸标准品中具体采用哪些基因片段,取决于具体需要检测的免疫组库,以及具体实验条件或试验设计,在此不做具体限定。此外,多重引物组可以采用现有公开的免疫组库建库多重PCR引物,也可以是自行设计的引物,在此不做具体限定。
优选的,核酸标准品中含有的基因片段包括多重引物组中所有引物的扩增靶标片段。
需要说明的是,核酸标准品的基因片段选择,最好是能够包含所有引物的扩增靶标片段,这样就可以对所有引物进行扩增效率评价和用量调整,保障建库质量。
优选的,核酸标准品中含有的基因片段包括如下基因片段中的至少一种,B淋巴细胞受体和/或T淋巴细胞受体的48个V基因全部或部分序列组成的基因片段、D基因全部或部分序列组成的基因片段、6个J基因全部或部分序列组成的基因片段、5个C基因全部或部分序列组成的基因片段,以及由V基因、D基因、J基因和C基因中的两个或两个以上基因的全部或部分序列组成的基因片段。
需要说明的是,本申请的方法主要是针对免疫组库多重PCR建库的,评价的也是免疫组库多重PCR扩增的引物,因此,核酸标准品必须含有免疫组库多重PCR扩增的靶标基因片段;而免疫组库检测的通常是B细胞或T细胞受体基因,因此,本申请的核酸标准品中含有B淋巴细胞受体和/或T淋巴细胞受体的各区域的基因片段;并且,根据检测的具体需求或者所使用的多重引物组成,核酸标准品中可以只含有相应引物的基因片段,而不一定含有全部的V基因、D基因、J基因和C基因四种基因片段。例如,在检测时,N端可变区是检测重点,测序检测只需要检测可变区,则只需要对V基因进行多重PCR扩增的引物,相应的核酸标准品中只需要V基因全部或部分序列组成的基因片段即可。
优选的,本申请的方法还包括对待测样品进行预测序,分析测序样品中含有的基因片段类型,根据待测样品中含有的基因片段类型,选择相应亚型的基因片段组成核酸标准品。
需要说明的是,V基因、D基因、J基因和C基因,每个基因片段都含有很多的亚型;如果核酸标准品中所含有的基因片段与待测样品的基因片段亚型相同,则能够更好的体现引物对待测样品基因片段的扩增效率;因此,本申请的优选方案中,率先对待测样品进行了预测序,分析待测样品中每个基因片段的亚型,选择相同亚型的基因片段组成核酸标准品。
优选的,核酸标准品中含有的基因片段以克隆质粒的结构形式存在。
需要说明的是,基因片段以克隆质粒的形式存在是指,将各基因片段分别克隆到质粒载体中,一方面,便于基因片段的稳定保存,另一方面,克隆质粒可以无限次的转化培养,提取获得,使用方便。其中,质粒载体可以采用常规的质粒,例如pMD18-T、pMD19-T等,在此不做具体限定。
优选的,本申请的方法还包括采用调整用量比例后的多重引物组对核酸标准品进行文库构建;测序分析核酸标准品中各基因片段的含量或比例;再次比较测序分析获得的核酸标准品中各基因片段的含量或比例,与核酸标准品中各基因片段的实际含量或比例;根据比较结果再次调整扩增引物在多重引物组中的用量比例;重复以上步骤,直至测序分析获得的核酸标准品中各基因片段的含量或比例,与核酸标准品中各基因片段的实际含量或比例相等或在试验误差允许范围内;采用最后一次比例调整后的多重引物组对待测样品进行建库。
需要说明的是,采用本申请的方法对多重引物组中各引物的用量比例进行调整,并不一定能够一次就调整到所预期的效果,因此,需要两次或多次调整,使得最终测序分析获得的核酸标准品中各基因片段的含量或比例,与核酸标准品中各基因片段的实际含量或比例相等或在试验误差允许范围内,这样基本能够保障各靶标基因片段都得到有效扩增,从而保障建库质量。
本申请的另一面公开了本申请方法在免疫组库高通量测序检测中的应用。
本申请的再一面公开了一种采用本申请的方法进行文库构建的免疫组库检测平台、装置或试剂盒。
本申请的再一面公开了一种免疫组库检测试剂盒,包括独立包装的已知浓度的B淋巴细胞受体和T淋巴细胞受体的V基因片段、D基因片段、J基因片段、C基因片段,以及独立分装的多重PCR的引物。
需要说明的是,本申请的试剂盒中,各基因片段组合实际上就是为了配制核酸标准品,而分装的多重PCR的引物,则是为了方便调整各引物的用量比例。本申请试剂盒的一种使用方法即,采用本申请的方法进行免疫组库文库构建。
由于采用以上技术方案,本申请的有益效果在于:
本申请的提高免疫组库多重PCR建库质量的方法,采用多重引物组对已知基因片段组份和比例的核酸标准品进行文库构建,然后测序分析核酸标准品中各基因片段及其比例,利用测序获得的比例与实际比例进行比较,判断基因片段引物的扩增效率,根据扩增效率调整多重引物组中各引物的用量,以调整后的多重引物组对待测样品进行文库构建,从而保障待测样品中各基因片段都能够得到有效扩增,提高建库质量。
附图说明
图1是本申请实施例中40个克隆质粒的电泳结果图;
图2是本申请实施例中40个克隆质粒单独进行多重PCR扩增电泳结果图;
图3是本申请实施例中优化前、后的引物再次利用质粒模板评估结果图;
图4是本申请实施例中引物及流程优化前、后真实样本检测结果对比。
具体实施方式
在采用多重PCR扩增建库、测序的过程中,通常多重引物组中各引物的用量都是等量的;但是,研究发现,由于各引物的扩增效率不同,以至对各基因片段的扩增富集效果不同,例如某个引物的扩增效率很低,则PCR扩增建库后,其靶标基因片段的含量就会很低,影响建库质量和测序结果。根据常规PCR扩增的研究和试验经验,在引物的扩增效率比较低的情况下,如果适当增加该引物的用量,则可以提高PCR扩增产物的量。
基于以上研究和认识,本申请创造性的提出,如果能够有效的评价免疫组库检测所使用的多重引物组中各引物的扩增效率,针对不同的扩增效率,调整各引物的用量,则可以使得多重PCR扩增产物中,各引物的靶标基因片段都能够得到有效的扩增富集。
因此,本申请提出了一种提高免疫组库多重PCR建库质量的方法,以实现对多重引物组中各引物扩增效率的评价,具体的,本申请采用多重引物组对核酸标准品进行PCR扩增,构建文库、测序,分析测序结果中各基因片段的比例;此处采用的多重引物组中各引物的用量是相同的,核酸标准品中各基因片段的用量比例也是已知的;将测序分析得到的各基因片段的比例,与核酸标准品中实际的比例相比较;如果某基因片段的测序分析比例低于实际比例,则认为该基因片段的引物扩增效率较低,可增加该引物用量比例,以提高其扩增产物量。
本申请的方法基于多重PCR扩增技术、操作简单、样本起始量较低,既可针对RNA样本,也可针对DNA样本,解决了,5’RACE建库样本类型限制及样本量大的问题。本申请的一种实现方式中,利用真实序列来源的免疫序列合成质粒样本,作为参考品,模拟不同的亚型的扩增比例对引物及整个流程进行矫正;以解决目前没有参考品进行校正的问题。本申请的方法,根据不同引物的扩增效率调整其用量,显著减小了引物扩增不同靶标的不平衡性。避免了各引物等量加入,扩增效率差异大的问题,有效解决了基于多重PCR扩增免疫组库建库中,扩增偏好性的问题。
下面通过具体实施例和附图对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明,不应理解为对本申请的限制。
实施例
本例的提高免疫组库多重PCR建库质量的方法,具体包括以下步骤:
A.质粒模板的准备
a)预先对待测样品进行测序,根据待测样品的测序结果,挑选适合亚型序列,合成多条B/T细胞受体基因模板,构建于质粒。该模板既可用于BCR/TCR-seq流程中VJ引物的评估也可进行VC引物的评估;
b)将包含基因片段的克隆质粒模板根据定量结果稀释至适合浓度;
c)根据需求选择所需要的克隆质粒按照设定的浓度梯度进行混合;
B.分步法多重PCR文库制备
d)模板:混合后的克隆质粒;
e)多重PCR扩增,磁珠纯化回收产物;
f)公用引物建库PCR,切胶回收目标片段;
g)文库定量及质控;
h)Illumina HiSeq2500/2000上机测序。
C.下机数据进行生物信息分析
a)SOAPnuke filter:去除低质量reads;
b)利用拼接程序,将PE reads进行拼接合并;
c)拼接好的数据与模板参考序列比对;
d)相关统计及作图;
D.矫正
实际检测分析出的各模板对应比例,与已知混合比例进行比较,对使用引物进行初步的评估,并调整引物浓度配比,此步骤可重复几次,直至与预期比例相近。
E.采用矫正引物配比的多重引物组及待测样品进行多重PCR扩增建库。
按照以上步骤,本例具体对B细胞重链受体基因待测样品进行了试验验证,B细胞重链受体基因待测样品来源于健康成人外周血单核细胞提取RNA样本。
一、质粒模板的制备
1)基因片段的选择
对B细胞重链受体基因待测样品进行了预测序,建库所采用的多重PCR引物如表1所示,测序采用HiSeq平台二代测序法。测序结果显示,待测样品中含有48个V亚型,6个J亚型和5个C亚型基因。根据原有引物,每对引物至少覆盖一个质粒模板,质粒模板需覆盖所有进行分析的V亚型,J亚型和C亚型,其中8个V亚型序列极其相近,可用同一引物进行扩增,因此,本例总共合成了40条V+D+J+C基因组合片段,以制备核酸标准品,如表2所示。基因片段由华大基因合成,本例采用pMD18-T质粒载体,质粒构建参考pMD18-T质粒说明书。表1中,引物IGH J为公共下游引物,其它引物为上游引物。
表1 多重PCR引物组中各引物及其用量
表2 组成核酸标准品的基因片段
2)克隆质粒检验
根据质粒合成报告中提供的估计合成总量,按照50ng/μL的预估浓度进行稀释,稀释后进行Qubit检测记录实际检测浓度。最终将合成质粒模板依次稀释至10ng/μL,1ng/μL,100pg/μL,10pg/μL。每个质粒取10ng/μL的样本3μL进行琼脂糖凝胶电泳检测,初步确认质粒样本的构象特征及样本量的一致性,电泳结果如图1所示。图1中,1-40泳道分别对应含编号为1-40的合成基因片段的质粒载体的电泳结果;结果显示,本例的40个质粒载体构象完整,样本量相对均一,符合配制要求,另外根据合成方提供的对合成质粒进行的一代测序结果进行比对分析,确认都含有目标的基因片段,能够作为核酸标准品使用。
本例将40个质粒1:1等量混合作为核酸标准品,质粒浓度为10pg/ul,用于后续试验。
二、多重引物组及其引物用量配比优化
1.初始多重引物组及其各引物用量
40个基因片段中V基因的引物条数为A,J基因或C基因的引物条数为B,则设置V基因引物的浓度:J/C基因引物的浓度为B:A,使得所有V基因的引物总浓度与所有J/C基因的引物总浓度匹配。本例具体的,V基因的引物条数为12;J基因与C基因的引物条数分别为1条和5条。各条V基因的引物的用量相同,各条J基因或C基因的引物的用量相同。各条引物的具体浓度和用量,如表3所示。以此为多重引物组,进行后续试验。表3中各基因的序列可在数据库中查看:http://www.imgt.org/IMGTrepertoire/。
表3 各引物按照不同基因引物条数配比的多重引物组
2.引物配比预优化
将本例的含有40个V基因片段,6个J基因片断和5个C基因片断组合的40个克隆质粒,分别与“1.初始多重引物组及其各引物用量”中的初始多重引物组进行单质粒的多重PCR扩增验证。
PCR扩增使用QIAGEN公司的Multiplex PCR试剂盒,质粒模板采用10pg的克隆质粒补水稀释至18μL,50μL的反应体系包括:克隆质粒18μL、2×QIAGEN Multiplex PCR MasterMix 25μL、5×Q solution 5μL、多重引物组2μL。
需要说明的是,根据不同的试验条件,50μL的反应体系可以等量减半。
PCR反应条件为:95℃预变性15min;然后进入10-40个循环,优选的进行25-30个循环,本例具体为30个循环:94℃变性30s、60℃退火90s、72℃延伸30s;循环结束后72℃延伸5min,12℃待机。
采用琼脂糖凝胶电泳对PCR扩增产物进行检测,结果如图2所示,图2中M1和M2为DNA marker DL2000,1-40泳道分别对应含编号为1-40的合成基因片段的质粒载体PCR扩增产物电泳图,泳道(-)为以水为PCR模板的空白对照。结果显示,扩增产物片段大小符合目标片段大小,每个质粒均能扩增出目标片段。此外,结果显示,由primerV8扩增的质粒14到质粒20扩增产物量偏低,由primerV9扩增的质粒30、32、33和36号质粒扩增产物量也偏低;因此,本例对扩增效率较低的这两个引物进行浓度调整,提高3倍用量再进行测试,具体的预优化后的多重引物组中各引物的用量如表4所示。
表4 多重引物组各引物配比预优化
3.引物用量配比优化
根据“2.引物配比预优化”预先优化得到的多重引物组,即表4预优化后的引物组,对40个质粒等量混合的核酸标准品进行PCR扩增建库、测序,分析获得的核酸标准品中40个基因片段组合的比例,将分析获得的比例与实际的比例进行比较,再次调整多重引物组中各引物的用量。具体如下:
1)多重PCR扩增
PCR扩增使用QIAGEN公司的Multiplex PCR试剂盒,PCR扩增反应体系和反应条件与“2.引物配比预优化”相同,所不同的是,采用的引物为表4优化的多重引物组,其余不变。
2)切胶回收
多重PCR扩增产物采用QIAquick Gel Purification Kit纯化胶回收产物,具体包括:配置2%的回收胶,将多重PCR产物进行电泳:400mA、100V、电泳2h,然后EB染胶,选择100-200bp的片段,使用30μL超纯水进行回溶。
3)末端修复
在1.5mL的离心管中配制末端修复反应体系:多重PCR产物30μL、ddH2O45μL、10×Polynucleotide Kinase Buffer(B904)10μL、dNTP Solution Mix(10mM)4μL、T4DNAPolymerase 5μL、Klenow Fragment 1μL、T4Polynucleotide Kinase5μL。
上述100μL反应混合物轻微振荡混合均匀,瞬时离心,在Thermomixer中20℃温浴30min。用QIAquick PCR Purification Kit纯化产物,34μL回溶。
4)末端加“A”
在1.5mL的离心管中配制末端加“A”反应体系:DNA 32μL、10×blue buffer 5μL、dATP(1mM)10μL、Klenow(3’-5’exo-)3μL。
上述50μL反应混合物轻微振荡混合均匀,瞬时离心后置于Thermomixer中37℃温浴30min。
用QIAquickMinElute PCR Purification Kit纯化产物,17μL回溶。
5)Adapter的连接
在1.5mL的离心管中配制Adapter连接反应体系:DNA 15μL、2×Rapid ligationbuffer 25μL、PE Adapter oligo mix(1μM)5μL、T4DNA Ligase(Rapid)5μL。
上述50μL反应混合物轻微振荡混匀,瞬时离心后置于Thermomixer中20℃温浴15min。
QIAquickMinElute PCR Purification Kit纯化产物,25μL回溶。
6)连接产物PCR
本例采用Illumina HiSeq2500测序平台的测序引物对连接产物进行PCR扩增,反应体系为:DNA 23μL、10μm的Primer1公用引物1μL、10μm的Primer index X 1μL、2×phusion master mix 25μL,总体积50μL。
PCR反应条件:为98℃预变性1min,然后进入10个循环:98℃20秒、65℃30秒、72℃30秒,循环结束后72℃延伸5min,最后12℃待机。
7)PCR产物的纯化
本例采用AGENCOURT AMPure XP beads对PCR产物进行纯化,具体的,在50μL连接产物中,加入1.2倍体积的磁珠,进行磁珠纯化,最后加入20μL UltraPureWater,进行回溶。
8)文库检测
使用Agilent 2100Bioanalyzer检测文库产量;使用qPCR定量检测文库产量。本例进行六个重复试验的检测结果显示,片段大小都在300bp左右,符合预期,六个重复试验的浓度分别为13.4ng/μL、12.65ng/μL、18.01ng/μL、10.05ng/μL、14.97ng/μL、9.19ng/μL,都大于5ng/μL,符合上机要求。
9)上机测序
采用Illumina HiSeq2500 PE101+8+101程序进行上机测序,测序实验操作按照制造商提供的操作说明书进行上机测序操作。
10)下机数据生物信息分析及免疫组库测序结果分析
生物信息分析
a)测序数据的预处理:去除N rate大于或等于5%的reads;去除含有adapter污染的reads;去除平均质量值低于15的reads;Reads1与reads2尾部质量值小于10的碱基逐个进行切除,切除后reads1长度需满足60bp以上,reads2长度需满足50bp以上。
b)Paired Reads合并:利用COPE和FqMerger(BGI),将PE reads进行拼接合并为contig。
c)Merge好的数据与设计质粒模板序列进行比对:拼接好的序列(contigs)与设计质粒模板序列分别进行BLAST比对。
d)统计分析:根据blast比对结果,统计分配到每个质粒的reads数目,计算reads占比,与理论混合比进行比较分析。结果如表5所示。
根据分析获得的各基因片段组合的比例与核酸标准品中各基因片段组合比例的比较结果,调整各基因片段对应的引物的用量比例,结果如表5所示。
表5 比例分析和引物用量调整
4.优化配比后的多重引物组验证
采用“3.引物用量配比优化”调整后的多重引物组,即表5调整后的多重引物组,按照“3.引物用量配比优化”相同的步骤,再次进行多重PCR扩增建库、测序,分析获得的核酸标准品中40个基因片段的比例,将分析获得的比例与实际的比例进行比较,结果如表6和图3所示。同时,作为对比,采用相同的方法,以优化前的多重引物组,即表3所示配比的多重引物组进行试验,结果如图3所示。
表6 检测分析比例与实际比例
结果显示,按照公式偏差=LOG10(实际值/理论值)计算,结果越接近0越好,此处认为两者偏差绝对值小于0.1为最佳,小于等于0.5可接受,另外,总比例偏差不得超高10%;通过本例的引物用量配比优化,能够有效的改善各基因片段的扩增产量,进而提高建库质量。
需要说明的是,如果比较结果显示,仍然有部分基因片段的比例远低于实际比例,则需要再次进行引物用量调整,然后再进行一次验证,直至各基因片段分析获得的比例与实际的比例相同或很接近。
图3为引物优化前后质粒扩增结果比较图,优化前是指表3所示配比的多重引物组,优化后是指表5调整后的多重引物组配比,图中,灰色线、黑色线分别代表引物浓度调整前后质粒模板对应结果,横坐标为40个质粒模板,纵坐标为倍数差异。结果表明,利用质粒模板进行评估调整引物浓度,优化后的引物使得各个质粒模板的扩增更为均一,利用质粒模板可以对引物进行浓度调整前后进行评估提供依据标准。
此外利用此种方法不仅可以对引物进行评估及优化调整,也可以对PCR循环数等进行相应的调整或其他任意流程中关键环节进行评估。
三、待测样品多重PCR建库和测序检测
采用“3.引物用量配比优化”表5调整后的多重引物组,按照“3.引物用量配比优化”相同的步骤,对健康成人外周血单核细胞提取的RNA样本的B细胞重链受体基因进行多重PCR扩增建库、测序。
采用Trizol法提取总RNA,具体如下:
1)每管PBMC加入1mL Trizol,混均,冰上放置5min。
2)加氯仿0.2mL/管,振摇15s,15-30℃孵育2-3min,4℃、12000g离心15min。
3)吸取上层无色液体转移至新的EP管中。
4)加等体积异丙醇,混匀,15-30℃孵育10-30min,4℃、12000g离心10min。
5)去上清,加入75%乙醇1mL,涡旋振荡30s,4℃、7500g,离心5min。
6)吸净上清,管内沉淀在超净台中鼓风静置3-5min。
7)加入20μL DEPC水溶解,即得到总RNA样本,-80℃冰箱保存。
因为是RNA样品,所以需要反转录后才能按照“3.引物用量配比优化”的步骤进行多重PCR扩增建库、测序。本例的RNA反转录具体如下:
取约200ng总RNA,补DEPC水至10μL,然后加入Reverse Primer 1μL,混匀后,65℃变性5min,然后立即置于冰上,依次加入:5×first stand Buffer 4μL、10mm的dNTP mix 2μL、0.1m DTT 1μL、40U/μL的RNase out 1μL,包括RNA总计19μL,充分混匀后,室温放置2min,再加入20U/μL的SuperScriptⅡ1μL,混匀,总计20μL的反应体系。在PCR仪上按照如下条件反应:42℃50min、70℃15min。反应完成即得到RNA反转录产物,可直接用于后续的多重PCR扩增建库、测序。
与此同时,采用优化前的多重引物组,即表3配比的多重引物组,对相同的RNA反转录样本,按照相同的方法,进行多重PCR扩增建库、测序,作为对比试验。
将各基因片段按照引物类型分为IGHV1-IGHV7,分别统计样本中两组引物对应流程实际检测到的对应的比例,结果详见表7和图4。
表7 真实样本结果验证
结果显示,按照本例提供的方法,使用质粒进行矫正后的优化流程的检测结果,明显在抗体重链IGH可变区7个V亚型扩增效率得到改善,并且,如质粒结果一样在V3、V4亚型的扩增方面有明显的提升,与文献中报道的几个健康人亚型分布更为接近。图4为分别采用优化前和优化后的多重引物组,对健康成人外周血单核细胞提取的RNA样本的B细胞重链受体基因进行反转录及多重PCR扩增建库、测序的检测结果对比,图中,黑色条柱为优化前多重引物组的统计结果,斑点条柱为优化后的多重引物组的统计结果,横坐标为抗体重链IGH可变区7个V亚型,纵坐标为各亚型分析后对应比例;可见,优化后的多重引物组在抗体重链IGH可变区7个V亚型扩增效率得到改善,特别是V3、V4亚型的扩增有明显提升。
对引物及流程优化前、后真实样本检测结果对比
文献报道可参考:
PLoS One.2016Aug 11;11(8):e0160853.doi:10.1371/journal.pone.0160853.eCollection 2016
需要说明的是,由于具体的样本不同,流程稍有差异,因此,本例的各亚型比例与文献报道的比例存在一定偏差,这属于正常现象。
以上内容是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本申请的保护范围。
SEQUENCE LISTING
<110> 深圳华大基因股份有限公司
天津华大医学检验所有限公司
广州华大基因医学检验所有限公司
<120> 一种提高免疫组库多重PCR建库质量的方法及其应用
<130> 16I23693
<160> 53
<170> PatentIn version 3.3
<210> 1
<211> 22
<212> DNA
<213> 人工序列
<400> 1
ctgaggagac ggtgaccrkk gt 22
<210> 2
<211> 21
<212> DNA
<213> 人工序列
<400> 2
agagtcacca tgaccacaga c 21
<210> 3
<211> 21
<212> DNA
<213> 人工序列
<400> 3
agagtcacca kkaccaggga c 21
<210> 4
<211> 21
<212> DNA
<213> 人工序列
<400> 4
agagtcacca tgaccgagga c 21
<210> 5
<211> 21
<212> DNA
<213> 人工序列
<400> 5
agagtcacca ttacyaggga c 21
<210> 6
<211> 21
<212> DNA
<213> 人工序列
<400> 6
agagtcacga twaccrcgga c 21
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<400> 7
agagtcacca tgaccaggaa c 21
<210> 8
<211> 22
<212> DNA
<213> 人工序列
<400> 8
accaggctca ccatywccaa gg 22
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<400> 9
ggccgattca ccatctcmag 20
<210> 10
<211> 21
<212> DNA
<213> 人工序列
<400> 10
cgagtcacca trtcmgtaga c 21
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<400> 11
cagccgacaa gtccatcagc 20
<210> 12
<211> 22
<212> DNA
<213> 人工序列
<400> 12
agtcgaataa ccatcaaccc ag 22
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<400> 13
gacggtttgt cttctccttg 20
<210> 14
<211> 242
<212> DNA
<213> B细胞重链受体基因片段
<400> 14
agagtcacca tgaccacaga cacatccacg aacacagcct acatggagct gaggagcctg 60
acatccgacg acacggccgt ctattactgt gcgggagatg gaccagtagg ccaaccccac 120
caagactggg gccaggggac cctggtcacc gtctcctcag catccccgac cagccccaag 180
gtcttcccgc tgagcctctg cagcacccag ccagatggga acgtggtcat cgcctgcctg 240
gt 242
<210> 15
<211> 219
<212> DNA
<213> B细胞重链受体基因片段
<400> 15
agagtcacca ttaccaggga cacgtccatc agcacagcct acatggagct gagcaggctg 60
agatctgacg acacggccgt gtattactgt gcgagagatc tttctatggt tcaagactac 120
tggtacttcg atctctgggg ccgtggcacc ctggtcactg tctcctcagc acccaccaag 180
gctccggatg tgttccccat catatcaggg tgcagacac 219
<210> 16
<211> 207
<212> DNA
<213> B细胞重链受体基因片段
<400> 16
agagtcacca tgaccgagga cacatctaca gacacagcct acatggagct gagcagcctg 60
agatctgagg acacggccgt gtattactgt gcaacacttg cgggagcgtc tgcttttgat 120
atctggggcc aagggacaat ggtcaccgtc tcttcagcac ccaccaaggc tccggatgtg 180
ttccccatca tatcagggtg cagacac 207
<210> 17
<211> 202
<212> DNA
<213> B细胞重链受体基因片段
<400> 17
agagtcacca ttaccaggga cacatccgcg accacagcct acatggaagt gagaaacctg 60
aaatctgaag acacggctgt ctattactgt gcgagagggc gctacttcgg ggaggtctcc 120
cttgactact ggggccaggg aaccctggtc accgtctcct cagcctccac caagggccca 180
tcggtcttcc ccctggcacc ct 202
<210> 18
<211> 221
<212> DNA
<213> B细胞重链受体基因片段
<400> 18
agagtcacca ttaccaggga caggtctatg agcacagcct acatggagct gagcagcctg 60
agatctgagg acacagccat gtattactgt gcgtcccaag gggggtatag cagtggcgag 120
ttcgacccct ggggccaggg aaccctggtc accgtctcct cagggagtgc atccgcccca 180
acccttttcc ccctcgtctc ctgtgagaat tccccgtcgg a 221
<210> 19
<211> 218
<212> DNA
<213> B细胞重链受体基因片段
<400> 19
agagtcacca ttaccaggga cacgtccacg agcacagtat atatggagtt gagcagtctg 60
cgatccgagg acacggccgt gtatttctgt gcgagagatg ggggtcattg gggggatatg 120
gacgtctggg gccaagggac cacggtcacc gtctcctcag ggagtgcatc cgccccaacc 180
cttttccccc tcgtctcctg tgagaattcc ccgtcgga 218
<210> 20
<211> 205
<212> DNA
<213> B细胞重链受体基因片段
<400> 20
agagtcacga ttaccgcgga caaatccacg agcacagcct acatggacct cagcagcctg 60
acatctgagg acacggccgt gtattattgt gcgagagagc ccgcgtggga ggcggacaac 120
tggttcgacc cctggggcca gggaaccctg gtcaccgtct cctcagcttc caccaagggc 180
ccatcggtct tccccctggc accct 205
<210> 21
<211> 219
<212> DNA
<213> B细胞重链受体基因片段
<400> 21
agagtcacca tgaccaggaa cacctccata agcacagcct acatggagct gagcagcctg 60
agatctgagg acacggccgt gtattactgt gcgagtgtct atgatagtag tggttattac 120
gatgcttttg atatctgggg ccaagggaca atggtcaccg tctcttcagc acccaccaag 180
gctccggatg tgttccccat catatcaggg tgcagacac 219
<210> 22
<211> 226
<212> DNA
<213> B细胞重链受体基因片段
<400> 22
agagtcacga taaccgcgga cacatctaca tccacagtct acatggagct gagcaccctg 60
agatatgacg acacggccgt ctactactgt gcgactgggc ccgaattgac ggcatggggg 120
gttcgggaaa taagtggcga tgacgttgca tggtggggca ggggaaccct ggtcaccgtc 180
tcctcagcct ccaccaaggg cccatcggtc ttccccctgg caccct 226
<210> 23
<211> 236
<212> DNA
<213> B细胞重链受体基因片段
<400> 23
accaggctca ccatttccaa ggacacctcc aaaagccagg tggtcctgac catgaccaac 60
atggaccctg tggacacagc cacatattac tgtgcacgga tcgattgtag tggtgggagt 120
tgctactcgg gagcctttga ctactggggc cagggaaccc tggtcaccgt ctcctcaggg 180
agtgcatccg ccccaaccct tttccccctc gtctcctgtg agaattcccc gtcgga 236
<210> 24
<211> 205
<212> DNA
<213> B细胞重链受体基因片段
<400> 24
accaggctca ccattaccaa ggacacctcc aaaaaccagg tggtccttac aatgaccaac 60
ttgaaccctg tggacacagc cacatattac tgtgcacaca ccgacgttga ttcccagggt 120
acttttgata tctggggcca ggggacaatg gtcaccgtct cttcagcctc caccaagggc 180
ccatcggtct tccccctggc accct 205
<210> 25
<211> 236
<212> DNA
<213> B细胞重链受体基因片段
<400> 25
accaggctca ccatttccaa ggacacctcg aaaaaccagg tggtccttac aatgaccaac 60
atggacccag tggacacagc cacatattac tgtgcacaca ggtcggaggg cttccagcac 120
tggggccaag gcaccctggt caccgtctcc tcagcatccc cgaccagccc caaggtcttc 180
ccgctgagcc tctgcagcac ccagccagat gggaacgtgg tcatcgcctg cctggt 236
<210> 26
<211> 236
<212> DNA
<213> B细胞重链受体基因片段
<400> 26
ggccgattca ccatctccag ggacaacgcc aagaactcac tgtatctgca agtgaacagc 60
ctgagagccg aggacacggc cgtgtattac tgtgcggcct cttattgtag tggtggtagc 120
tgctacaaag aatacttcca acactggggc cagggcaccc tggtcaccgt ctcctcaggg 180
agtgcatccg ccccaaccct tttccccctc gtctcctgtg agaattcccc gtcgga 236
<210> 27
<211> 222
<212> DNA
<213> B细胞重链受体基因片段
<400> 27
ggccgattca ccatctccag agaagatgcc aagaattctt tgtatcttca aatgaacagc 60
ctgagagccg aggacacggc tgtgtattat tgtgcaaggg agaccgggtt tggcgattac 120
tttgacgctg ttaatatctg gggccaaggg acaatggtca ccgtctcttc agcacccacc 180
aaggctccgg atgtgttccc catcatatca gggtgcagac ac 222
<210> 28
<211> 218
<212> DNA
<213> B细胞重链受体基因片段
<400> 28
ggccgattca ccatctcaag agatgattca aaaaacatgg tgtatctgca aatggacagc 60
ctggaaaccg aggatacagc cgtgtattac tgtacctgga tggctacggt gactacggtc 120
gactgctggg gccagggaac cctggtcacc gtctcctcag ggagtgcatc cgccccaacc 180
cttttccccc tcgtctcctg tgagaattcc ccgtcgga 218
<210> 29
<211> 226
<212> DNA
<213> B细胞重链受体基因片段
<400> 29
ggccgattca ccatctccag agacaacgac aagaattctc tgtctttgca aatgaccagc 60
ctgagagccg aggacacagc tttatattac tgtactagga gtccaagggc gtgcggcaca 120
aggttctgta ccattactga tgcttttgac gtgtggggcc aagggacaac ggtcaccgtc 180
tcttcagcct ccaccaaggg cccatcggtc ttccccctgg cgccct 226
<210> 30
<211> 242
<212> DNA
<213> B细胞重链受体基因片段
<400> 30
ggccgattca ccatctccag agacaattcc aagaacaccc tgtatctgca aatgaacagc 60
ctgagagccg acgacacggc cgtatattac tgtgcgaaag gggtttatgg cgctggctgg 120
aacgtctggg gccaagggac cacggtcacc gtctcctcag catccccgac cagccccaag 180
gtcttcccgc tgagcctcga cagcaccccc caagatggga acgtggtcat cgcctgcctg 240
gt 242
<210> 31
<211> 216
<212> DNA
<213> B细胞重链受体基因片段
<400> 31
ggccgattca ccatctccag agacacttcc agcaacacgg tgtttctgca aatgaacagc 60
ctgagagttg aagacacggc cacatactac tgtgcgaaag tccttgggga tacaactatg 120
ggcatagact cctggggcca gggaaccctg gtcaccgtct cctcagcacc caccaaggct 180
ccggatgtgt tccccatcat atcagggtgc agacac 216
<210> 32
<211> 239
<212> DNA
<213> B细胞重链受体基因片段
<400> 32
ggccgattca ccatctccag agacaattcc aagaacacgc tgtatctgca aatgaacagc 60
ctgagagccg aggacacggc tgtgtattac tgtgcgagag atcgtagtgt agtgggaggc 120
ctgtttggag actggtactt cgatctctgg ggccgtggca ccctggtcac tgtctcctca 180
gggagtgcat ccgccccaac ccttttcccc ctcgtctcct gtgagaattc cccgtcgga 239
<210> 33
<211> 242
<212> DNA
<213> B细胞重链受体基因片段
<400> 33
ggccgattca ccatctccag agacaacagc ggggcctccc tgtatttgga aatgaggagt 60
ctgagaagtg aggacaccgc cttctattac tgtgcaaaag attcgtgggg tgagggattt 120
gacagctggg gccagggaac cctggtctcc gtctcctcag catccccgac cagccccaag 180
gtcttcccgc tgagcctctg cagcacccag ccagatggga acgtggtcat cgcctgcctg 240
gt 242
<210> 34
<211> 230
<212> DNA
<213> B细胞重链受体基因片段
<400> 34
ggccgattca ccatctcaag agacaacgcc aagaactcgg cgtatttgca aatgaacagc 60
ctgagagtcg acgacacggc tatttattac tgtgcgagag ggtggctcca agactggggc 120
cagggaatcc tggtcaccgt ctcctcagca tccccgacca gccccaaggt cttcccgctg 180
agcctctgca gcacccagcc agatgggaac gtggtcatcg cctgcctggt 230
<210> 35
<211> 208
<212> DNA
<213> B细胞重链受体基因片段
<400> 35
ggccgattca ccatctcaag ggatgattct aaaagtaccg cctacttgca aatgaacagc 60
ctgaaaatcg aggacacagc cgtttactat tgtggtagat tgttactatg gcctcagtgg 120
ggagacatgg acgtctgggg caaagggacc acggtcagcg tctcctcggc ctccaccaag 180
ggcccatcgg tcttccccct ggcgccct 208
<210> 36
<211> 190
<212> DNA
<213> B细胞重链受体基因片段
<400> 36
ggccgattca ccatctccag agacaactcc aagaataagt tgtatctaca aatgaaccgc 60
ctgagagccg aggacacggc cgtatattac tgtgggggac acggcgattg gtcgcactgg 120
ggccagggaa ccctggtcac cgtctcctca gcctccacca agggcccatc ggtcttcccc 180
ctggcaccct 190
<210> 37
<211> 242
<212> DNA
<213> B细胞重链受体基因片段
<400> 37
ggccgattca ccatctccag agacaacgcc aagaactcac tgtctctgca aatgaacagc 60
ctgagagccg aggacacggc tgtgtatttc tgtgcgatca gtagtggttt ttattccgtc 120
gactactggg gccagggaac cctggtcacc gtctcctcag catccccgac cagccccaag 180
gtcttcccgc tgagcctctg cagcacccag ccagatggga acgtggtcat cgcctgcctg 240
gt 242
<210> 38
<211> 212
<212> DNA
<213> B细胞重链受体基因片段
<400> 38
ggccgattca ccatctcaag agatgattca aagaactcac tgcctctgca aatgaacagc 60
ctgaaagccg aggacacggc cgtgtattac tgtgtcagct acctctacgg actacccctc 120
tggggccagg gaaccctggt caccgtctcc tcagggagtg catccgcccc aacccttttc 180
cccctcgtct cctgtgagaa ttccccgtcg ga 212
<210> 39
<211> 242
<212> DNA
<213> B细胞重链受体基因片段
<400> 39
ggccgattca ccatctccag ggatgattca aagaacacga cgtatctgca aatggacagc 60
ctgcagaccg aggacacggc cgtttattac tgttcgagag ttggaaggaa cacctatatg 120
gacgtctggg gcaaggggac cacggtcatc gtctcctcag catccccgac cagccccaag 180
gtcttcccgc tgagcctcga cagcaccccc caagatggga acgtggtcat cgcctgcctg 240
gt 242
<210> 40
<211> 218
<212> DNA
<213> B细胞重链受体基因片段
<400> 40
ggccgattca ccatctccag agacaacgcc aagaacacgc tgtatctgca aatgaacagt 60
ctgagagccg aggacacggc tgtgtattac tgtgcaaggg ccgggattac ccccctcttc 120
cagcactggg gccagggcac cctggtcacc gtctcctcag ggagtgcatc cgccccaacc 180
cttttccccc tcgtctcctg tgagaattcc ccgtcgga 218
<210> 41
<211> 214
<212> DNA
<213> B细胞重链受体基因片段
<400> 41
ggccgattca ccatctccag agacaacgcc aagacctcca tgtttctgca aatgaacagt 60
ctgaaacttg aggactcggc cttgtatttc tgtgcaaaag gaaatagtag tgctactcat 120
gtccgctggt tcttcgacct ctggggccgt ggcaccctgg tcactgtctc ctcagcctcc 180
accaagggcc catcggtctt ccccctggcg ccct 214
<210> 42
<211> 235
<212> DNA
<213> B细胞重链受体基因片段
<400> 42
cgagtcacca tgtcagtaga caagtccaag aaccagttct ccctgaagct gagttctgtg 60
accgccgtgg acacggccgt atattactgt gcgagagttt tgcgtacgga atcggtattt 120
ccatttttgg agtggactat cgaacgtgga tgcttcgacc cctggggcca gggaaccctg 180
gtcaccgtct cctcagcctc cacacagagc ccatccgtct tccccttgac ccgct 235
<210> 43
<211> 196
<212> DNA
<213> B细胞重链受体基因片段
<400> 43
cgagtcacca tgtcagtaga cgggtccaag aaccagttct acctgagggt gacctctgtg 60
accgccgcgg acacggccgt gtattactgt gccagacaaa atggctacgg ccgctttgat 120
tactggggcc agggaaccct ggtcaccgtc tcctcagcct ccacacagag cccatccgtc 180
ttccccttga cccgct 196
<210> 44
<211> 230
<212> DNA
<213> B细胞重链受体基因片段
<400> 44
cgagtcacca tgtcagtaga cacgtccaag aaccaattct ccctggcgct gacctctgtg 60
actgccgcgg acacggccgt gtattactgt gtcagacatc cgggactgga aaactggggc 120
cagggaaccc tggtcaccgt ctcctcagca tccccgacca gccccaaggt cttcccgctg 180
agcctcgaca gcacccccca agatgggaac gtggtcatcg cctgcctggt 230
<210> 45
<211> 211
<212> DNA
<213> B细胞重链受体基因片段
<400> 45
cgagtcacca tgtcagtaga cacgtctaag aagcagttct ccctggaact gagctctgtg 60
actgccgcgg acacggccgt gtattactgt gcggcctact atggttcggg gagttattat 120
gacaactggt tcgacccctg gggccaggga accctggtca ccgtctcctc agcctccaca 180
cagagcccat ccgtcttccc cttgacccgc t 211
<210> 46
<211> 187
<212> DNA
<213> B细胞重链受体基因片段
<400> 46
cgagtcacca tgtcagtaga cacgtccaag aaccagttct ccctgaagct gagctctgtg 60
accgccgcgg acacggctgt gtattactgt gcgagaggtg ggtcctacca gcactggggc 120
cagggcaccc tggtcaccgt ctcctcagcc tccaccaagg gcccatcggt cttccccctg 180
gcaccct 187
<210> 47
<211> 245
<212> DNA
<213> B细胞重链受体基因片段
<400> 47
cgagtcacca tgtccgtaga cacgtccaag aaccagttct ccctgaagct gagctctgtg 60
accgccgcag acacggctgt gtattactgt gcgagacatc caaccccata ttgtggtggt 120
gattgctata ggccagactg gtacttcgat ctctggggcc gtggcaccct ggtcactgtc 180
tcctcaggga gtgcatccgc cccaaccctt ttccccctcg tctcctgtga gaattccccg 240
tcgga 245
<210> 48
<211> 231
<212> DNA
<213> B细胞重链受体基因片段
<400> 48
cgagtcacca tgtcagtaga cacgtccaag aaccagttct ccctgaagct gagctctgtg 60
accgccgcgg acacggccgt gtattactgt gcgagagatg atagtagtgg tcgaccaaaa 120
caatactact actacggtat ggacgtctgg ggccaaggga ccacggtcac cgtctcctca 180
gcacccacca aggctccgga tgtgttcccc atcatatcag ggtgcagaca c 231
<210> 49
<211> 199
<212> DNA
<213> B细胞重链受体基因片段
<400> 49
cgagtcacca tgtccgtaga cacgtccaag aaccagttct ccctgacggt gacgtctgtg 60
accgccgcgg acacggcctt ttatttctgt gcgaggacgc cgatagcggc aagtggtacc 120
cagcgctggg gccagggaac cctggtcacc gtctcctcag cctccaccaa gggcccatcg 180
gtcttccccc tggcaccct 199
<210> 50
<211> 221
<212> DNA
<213> B细胞重链受体基因片段
<400> 50
cgagtcacca tgtcagtaga cacgtccaag aaccagttct ccctgaagct gagctctgtg 60
accgctgcgg acacggccgt gtattactgt gcgagcgcta cggtgactac atcctggtac 120
ttcgatctct ggggccgtgg caccctggtc actgtctcct cagggagtgc atccgcccca 180
acccttttcc ccctcgtctc ctgtgagaat tccccgtcgg a 221
<210> 51
<211> 207
<212> DNA
<213> B细胞重链受体基因片段
<400> 51
cagccgacaa gtccatcagc accgcctact tacagtggac cagtctgagg gcctcggaca 60
ccgccatata ttactgtgcg aaacatggtc tccggtatga cagcagtcca gacgaagctg 120
agtatttcca acactggggc cagggcaccc tggtcaccgt ctcctcagcc tccacacaga 180
gcccatccgt cttccccttg acccgct 207
<210> 52
<211> 228
<212> DNA
<213> B细胞重链受体基因片段
<400> 52
agtcgaataa ccatcaaccc agacacatcc aagaaccagt tctccctgca gctgaactct 60
gtgactcccg aggacacggc tgtgtattac tgtgcaagag agggacggag tggctacgat 120
tacgatgtct acggtatgga cgtctggggc caagggacca cggtcaccgt ctcctcagca 180
cccaccaagg ctccggatgt gttccccatc atatcagggt gcagacac 228
<210> 53
<211> 210
<212> DNA
<213> B细胞重链受体基因片段
<400> 53
gacggtttgt cttctccttg gacacctctg tcagcacggc atatctgcag atcagcagcc 60
taaaggctga ggactctgcc gtgtattact gtgcgagaca tcgcctagaa agaccgtggg 120
gggcgtggtt cgacccctgg ggccagggaa ccctggtcac cgtctcctca gcctccacca 180
agggcccatc ggtcttcccc ctggcaccct 210