一种遗传性消化道肿瘤的基因文库构建方法和试剂盒
技术领域
本发明涉及基因检测技术领域,尤其涉及一种遗传性消化道肿瘤的基因文库构建方法和试剂盒。
背景技术
消化道肿瘤是世界范围内高发的恶性肿瘤。在恶性肿瘤中,胃癌、结直肠癌大多数为散发性,但约10%的胃癌患者具有家族聚集特诊,约5~10%的肠癌穿着具有遗传相关因素。遗传性弥漫性胃癌和遗传性非息肉病性结直肠癌(HNPCC)是具有相对明确遗传因素的两种遗传性消化道肿瘤。
在遗传性弥漫性胃癌家系中,小叶性乳腺癌和结肠癌等肿瘤的发生率也明显升高。部分无明确家族史的早发(年龄<50岁)弥漫性胃癌存在CDH1基因突变。对于遗传性家系中CDH1基因突变携带者,其终身患胃癌风险高达60~80%。在符合遗传性弥漫性胃癌的家系中,约有40%~50%存在CDH1基因胚系突变。
根据胃肠道内是否出现多发息肉,遗传性结直肠癌可初略分为两大主要类型:(1)遗传性息肉病性结直肠癌综合征:以结直肠广泛分布腺瘤为主要特征,临床常见家族性腺瘤性息肉病FAP其腺瘤数量超过100枚;(2)遗传性非典型息肉病性结直肠癌综合征:结直肠内存在少量或没有明显息肉性病变,其临床特征表现为早发结直肠癌伴随多种肠内外肿瘤病变。Lynch综合征为该类病症的临床典型代表。
Lynch综合征为常染色体显性遗传性疾病,已经明确的致病基因包括错配修复基因家族成员(Mismatch Repair Gene,MMR)的胚系突变,如MLH1、MSH2、MSH6、PMS2等,以及与之相关的部分基因如EPCAM。其中MLH1和MSH2基因胚系突变为最常见的致病机理,占所有Lynch综合征基因变异的90%。我国各临床科研机构检测及报道的致病基因也主要为MLH1、MSH2和MSH6。
家族性腺瘤性息肉病(FAP)也是一种临床常见的遗传性结直肠癌综合征,大约1%的结直肠癌发病与之相关,其最显著的临床特征在于患者结直肠内会有成百上千的息肉形成,且在青少年时即会出现息肉。根据息肉的数量可分为经典型FAP(息肉数量>100枚)和衰减型FAP(息肉数量>20枚但<100枚)。同时可能伴随部分肠外病变如胃十二指肠息肉、先天性视网膜色素上皮肥厚、多生牙、骨瘤等,其中伴发硬纤维瘤的FAP又称Gardner综合征,伴发中枢神经系统肿瘤的FAP又称Turcot综合征⑥。FAP的临床恶性程度极高,若不治疗,几乎所有经典型FAP患者在40~50岁都会发展为结直肠癌⑦。
FAP为常染色体显性遗传性疾病,其遗传学特征为APC基因的胚系突变致病,且存在明显的基因-表型相关性:腺瘤数目越多,检测到APC基因异常的机率越高;不同的FAP患者可能在APC基因的不同位置出现异常,且与临床表型相关。
无论是遗传性胃癌还是HNPCC,约50%甚至更多的符合临床诊断的患者或家系无法找到明确的分子致病机制,原因可能为:①临床诊断符合某类遗传性病综合征,对目标基因进行检测未发现突变,但不能除外患者是否携带尚未发现的致病性基因;②临床上符合某类遗传性病综合征的诊断,但至致病基因是由于位置基因所致;③由于临床表现多样和肿瘤家族史不典型,其临床诊断的遗传综合征于遗传性致病基因不符。目前,高通量测序技术应用广泛,该项技术科同时进行上百万个DNA片段的测序,测序时间和测序成本都大大减少,针对遗传性相关基因谱的测序为遗传性消化道肿瘤的诊断和研究提供了大量信息。
APC(WNT signaling pathway regulator)该基因编码作为Wnt信号通路拮抗剂的肿瘤抑制蛋白。它还参与细胞迁移和粘附、转录激活和凋亡等过程。该基因的缺陷导致家族性腺瘤性息肉病(FAP),一种常染色体显性前恶性疾病,通常进展到恶性肿瘤。与疾病相关的突变倾向于聚集在指定的突变区域(MCR)的一个小区域中,导致蛋白质产物被截断。
CDH1(cadherin 1)基因编码E-cadherin。E-cadherin是依赖性粘附蛋白家族成员。
可选择的剪接导致多种转录本,其中至少有一种转录本编码经蛋白水解生成成熟糖蛋白的前原蛋白。这种依赖钙的细胞-细胞粘附蛋白由5个细胞外cadherin重复序列、跨膜区域和高度保守的区域组成。该基因的突变与胃癌、乳腺癌、结直肠癌、甲状腺癌和卵巢癌有关。这种基因功能的丧失被认为是通过增加增殖、侵袭和/或转移而导致癌症进展的原因。
EPCAM(epithelial cell adhesion molecule)基因编码了上皮细胞粘附分子(EpCAM),该蛋白质存在于上皮细胞中,上皮细胞是沿着体表和腔体内表面排列的细胞。EpCAM蛋白的结构跨越包围上皮细胞的膜,它帮助细胞彼此粘附。此外,可以在特定位置切割细胞膜中的蛋白质,释放“细胞内结构域(EpICD)”片段,其有助于将来自细胞外部的信号传递到细胞核。EpICD进到细胞核并与其他蛋白质形成复合物,参与调节细胞生长、分裂、分化和迁移。EPCAM基因突变增加卵巢癌、结肠癌等多种癌症患病风险。
MLH1(mutL homolog 1)基因编码了DNA修复中起重要作用的蛋白。该蛋白质有助于修复DNA复制时产生的错误。MLH1蛋白与PMS2蛋白(由PMS2基因编码)结合以形成蛋白质复合物,此复合物协调其他蛋白质修复DNA在复制时发生的错误。通过去除含有错误的DNA片段并用校正的DNA序列替换来进行修复。MLH1基因是已知错配修复(MMR)基因组的成员。MLH1基因突变增加卵巢癌、结肠癌等多种癌症患病风险。
MSH2(mutS homolog 2)基因编码了DNA修复中起重要作用的蛋白。该蛋白质有助于修复DNA复制时产生的错误。MSH2蛋白与其它两种蛋白质MSH6或MSH3结合形成蛋白质复合物,此复合物可识别DNA链上DNA复制过程中发生的错误。MSH2基因是已知错配修复(MMR)基因组的成员。MSH2基因突变增加卵巢癌、结肠癌等多种癌症患病风险。
MSH6(mutS homolog 6)基因编码了DNA修复中起重要作用的蛋白。该蛋白质有助于修复DNA复制时产生的错误。MSH6蛋白与MSH2蛋白结合以形成蛋白质复合物。此复合物可识别DNA链上DNA复制过程中发生的错误。MSH6基因是已知错配修复(MMR)基因组的成员。MSH6基因突变增加卵巢癌、结肠癌等多种癌症患病风险。
PMS2(PMS1homolog 2,mismatch repair system component)基因编码了在DNA修复中起重要作用的蛋白,该蛋白质有助于修复DNA复制时产生的错误。PMS2蛋白与MLH1结合以形成蛋白质复合物,此复合物协调其他蛋白质修复DNA复制期间产生的错误。PMS2基因是已知为错配修复(MMR)基因组的成员。PMS2基因突变增加卵巢癌、结肠癌等多种癌症患病风险。
传统的Sanger测序技术在检测基因核苷酸变异应用中为常用检测手段,但对于检测APC,CDH1,MSH2,MLH1,MSH6,PMS2,EPCAM基因的编码氨基酸的外显子区域及附近内含子区域的基因突变存在很大局限性,表现在:检测通量受到限制,该方法仅适用于少数明确突变热点的检测,而对于候选基因数量多且为候选基因的全部编码区段时难以实现的。需要消耗大量时间,且对于待检测样本的基因组DNA消耗巨大,在实践中同一样本难以获得满足检测需求的足量DNA。因而在日常实践中难以采用Sanger方法进行多基因全部编码区段的检测需求。
采用高通量基因测序技术检测APC,CDH1,MSH2,MLH1,MSH6,PMS2,EPCAM基因的突变,需要进行测序前样本文库的制备。如在样本文库制备过程中采用基因组DNA片段化方法,则后续会存在DNA末端修复、加A尾等步骤,不仅过程繁复且对于基因组DNA的需求在100ng以上,对于福尔马林固定石蜡包埋样本会存在所提取DNA量不足问题。且DNA片段化需要借助DNA破碎仪,DNA片段化后需要利用磁珠富集DNA片段,需要投入仪器的维护产生了额外的操作及成本。
因此,有必要寻找一种新的检测遗传性消化道肿瘤相关基因突变的方法,以实现检测,降低劳动强度及检测成本。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种遗传性消化道肿瘤的基因文库构建方法,该方法建库步骤简便快速,有效降低成本,检测变异类型全面、检测准确率达到100%,且可同时对多个样本进行检测。
本发明的另一目的是提供该方法获得的遗传性消化道肿瘤的基因检测文库。
本发明的另一目的是提供所述文库制备的遗传性消化道肿瘤的基因检测试剂盒。
为实现上述目的,本发明提供了一种遗传性消化道肿瘤的基因检测文库,涉及目标区域为以上7基因的编码氨基酸的外显子区域及外显子上下游各20碱基区域。为保证目标区域全部覆盖,PCR扩增过程中所必须的引物组被分离为两个独立引物组,分别进行目标区域扩增,而后将PCR产物进行测序标签连接、文库洗脱及再扩增,扩增后纯化,得到测序用文库。
本发明的一种遗传性消化道肿瘤的基因文库构建方法,包括如下步骤:
(1)DNA质量标准:受试者样本的基因组DNA,经过核酸提取、质量检测后,要求基因组DNA符合相应的控制标准;
(2)目标区域扩增:利用上述(1)DNA及合成的5’端磷酸化修饰的相应引物组,对目标区域进行PCR扩增;
(3)测序标签连接:在DNA连接酶作用下利用上述步骤(2)的PCR产物连接高通量测序平台专用测序标签,测序标签含有区分样本的特异性标签序列;
(4)文库纯化:步骤(3)的产物中加入纯化磁珠后混匀纯化;
(5)产物洗脱及扩增:在上述步骤(4)中加入PCR扩增预混液,进行PCR扩增反应;
(6)扩增产物纯化:在上述步骤(5)的PCR产物中加入磁珠纯化即得文库;
(7)文库质检:使用Qubit荧光计对步骤(6)中文库进行定量质检。
本发明上述的遗传性消化道肿瘤的基因检测文库构建方法,所述目标区域包含以下基因的全编码区和可变剪切区(外显子向内含子外延20bp):APC,CDH1,MSH2,MLH1,MSH6,PMS2,EPCAM。
上述步骤(1)中所述的核酸提取的样本类型包括但不限于外周血、口腔拭子、肿瘤冰冻组织、福尔马林固定石蜡包埋样本等,优选核酸样本为外周血白细胞、口腔黏膜脱落细胞。
上述步骤(1)中所述的DNA质控标准为,DNA浓度≥1ng/μL;DNA纯度:OD260/280 1.8-2.0,OD260/230>2;DNA总起始量:2ng。
步骤(1)中所述的核酸提取方法、DNA质控方法均按照现有技术的操作规程进行。
上述步骤(2)中为了保证目标区域(待测基因全编码区,以及可变剪切区)可全部被扩增,并避免相邻扩增子的引物之对DNA模板产生竞争结合,优选PCR扩增引物被分离成两个独立的引物组,分别进行目标区域扩增。所用两个独立的引物组中每条引物为5’端磷酸化修饰引物。引物组氨基酸序列见表2。
进一步优选每个引物组反应体系为5-10μL,总体积为10-20μL。更优选每个引物组反应体系为5μL,总体积为10μL。
上述步骤(2)中所述的目标区域扩增反应体系按照下述体积比组成,PCR扩增预混液:引物组:DNA=1:1:3;具体反应体系及反应条件见表1。
所述PCR扩增预混液为包含DNTP,DNA聚合酶,Tris-HCL,Mg2+按照现有技术配置成的混合液或购买获得。
表1目标区域扩增反应体系组分及反应条件表
表2引物组氨基酸序列
本发明步骤(3)中所述的连接预混液为含Tris-HCL的溶液,按照现有技术制备或购买获得。
本发明上述步骤(3)连接高通量半导体测序平台专用的测序标签(含区分样本的特异性标签序列),在DNA连接酶的作用下,将测序标签与步骤2的产物连接。所述连接标签反应体系按照下述体积比组成,连接反应缓冲液:DNA连接酶:测序标签=2:1:1。具体反应体系及反应条件见表3。
表3连接接头反应体系组分及反应条件表
本发明所述平台通用测序标签序列,A端CCATCTCATCCCT*G*CGTGTCTCCGACTCAG,P端
CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT。优选是Ion Torrent平台通用测序接头序列。
本发明所述的样本标签序列在测序接头序列A端,长度为10bp,其在测序模板序列的位置如下:
A端接头序列+样本特异性标签+GAT+文库序列+P端接头序列+磁珠
CCATCTCATCCCT*G*CGTGTCTCCGACTCAG+CTAAGGTAAC+GAT+NNNNN+
CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT+磁珠;其中GAT序列是固定序列,为了均衡测序接头的链接效率。所述NNNNN为文库序列。
所述样本特异性标签见下表4:
步骤(4)所述的纯化过程:步骤(3)的产物中加入纯化磁珠后混匀,放置于磁力架上吸附磁珠,待溶液澄清后弃掉上清,采用70%乙醇清洗两遍磁珠,室温晾干磁珠。
步骤(4)中所述连接反应产物与纯化磁珠的体积比为1:1.5。
进一步优选,步骤(4)所述的纯化过程:在连接产物中加入21μL纯化磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,弃掉上清,使用100μL 70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠。
步骤(5)所述的产物洗脱及扩增过程:待磁珠晾干后将离心管从磁力架上取下,加入50μLPCR扩增预混液及2μLPCR引物的混合液,涡旋混匀后,室温静止2~5min吸附,而后置于磁力架上,待溶液澄清后将上清吸取至新的PCR管中按照下述反应条件进行PCR扩增。具体反应体系及反应条件见表5。
所述PCR引物的序列:5'-CCATCTCATCCCTGCGTGTC,5'-CCACTACGCCTCCGCTTTCCTCTCTATG
表5文库扩增反应条件
步骤(6)扩增产物纯化:在上述步骤(5)的PCR产物中加入磁珠,混匀后置于磁力架上吸附磁珠,吸取上清液,在上清液中加入相应体积的磁珠混匀后置于磁力架上进行吸附,带溶液澄清后弃掉上清,采用70%乙醇清洗两遍磁珠,室温晾干磁珠,加入Tris-EDTA,上清液即为文库。
步骤(6)中PCR产物与纯化磁珠两轮纯化,其体积比为1:0.5:1.2。
进一步优选,步骤(6)所述的扩增产物纯化过程:在上述步骤5扩增后的文库中加入25μL磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,吸取上清至新的离心管中并加入60μL磁珠,将离心管置于磁力架上吸附磁珠,待溶液澄清后,弃掉上清,保持离心管在磁力架上,使用100μL 70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠,加入Tris-EDTA,涡旋混匀后室温静置2~5min,而后将离心管置于磁力架上吸附磁珠,此时上清液即为文库。
步骤(7)所述文库质检过程:使用Qubit荧光剂对文库进行定量质检。两个独立引物组的扩增产物均在125-275bp,结合Ion平台测序标签后,平均长度为275bp,18ng/mL为100pM。
本发明上述步骤(3)、步骤(7)所述的高通量半导体为Ion Torrent。
本发明一种遗传性消化道肿瘤的基因文库构建方法,包括如下步骤
(1)核酸提取及质检:提取基因组DNA、质检后,要求其符合一定质控标准:DNA浓度:≥1ng/μL;DNA纯度:OD260/280 1.8-2.0,OD260/230>2;DNA总起始量:≥2ng;
(2)目标区域扩增:利用上述(1)DNA及合成的5’端磷酸化修饰的相应引物组,对目标区域进行PCR扩增。为了保证目标区域(待测基因全编码区,以及可变剪切区)可全部被扩增,并避免相邻扩增子的引物之对DNA模板产生竞争结合,优选PCR扩增引物被分离成两个独立的引物组,分别进行目标区域扩增。每个反应体系为5~10μL,总体系为10~7μL。将符合步骤(1)DNA质量标准的DNA进行目标区域扩增,反应体系为:PCR扩增预混液1μL,引物组1μL,DNA 3μL,合计5μL。目标区域扩增反应条件为:99℃保持2min,而后进行16~19个循环的扩增过程,每个循环为99℃保持15s,60℃保持4~8min,最终在10℃保持不超过12h,反应结束。
(3)测序标签连接:将步骤(2)得到的两个独立引物组扩增产物混合,加入如下测序标签连接反应体系:10μL扩增产物+2μL连接反应缓冲液+1μLDNA连接酶+1μL测序标签,总体积14μL。连接反应条件:22℃保持30min,72℃保持5~7min,而后保持在10℃,不超过1h。
(4)文库纯化:将步骤(3)中获得的连接产物按照以下方法进行纯化:在连接产物中加入21μL纯化磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,弃掉上清,使用100μL70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠。
(5)产物洗脱及扩增:将步骤(4)中的纯化产物按照下述方法进行洗脱及扩增:待磁珠晾干后将离心管从磁力架上取下,加入50μLPCR扩增预混液及2μLPCR引物的混合液,涡旋混匀后,室温静止2~5min吸附,而后置于磁力架上,待溶液澄清后将上清吸取至新的PCR管中按照下述反应条件进行PCR扩增;反应条件:98℃保持2min,而后进行5~10个循环的扩增过程,每个循环98℃保持15sec,64℃保持1min,而后保持在10℃,不超过12h。程序结束。
(6)扩增产物纯化:在步骤(5)扩增后的文库中加入25μL磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,吸取上清至新的离心管中并加入60μL磁珠,将离心管置于磁力架上吸附磁珠,待溶液澄清后,弃掉上清,保持离心管在磁力架上,使用100μL 70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠,加入Tris-EDTA,涡旋混匀后室温静置2~5min,而后将离心管置于磁力架上吸附磁珠,此时上清液即为文库。
(7)文库质检:使用Qubit荧光剂对文库进行定量质检。按照现有标准操作流程进行。两个独立引物组的扩增产物均在125-275bp,结合Ion平台测序标签后,平均长度为275bp,18ng/mL为100pM。本发明还包括步骤(8)-(10)。
(8)测序模板制备:将步骤7中文库根据质检结果稀释至18ng/mL,将稀释后的10个样本文库等体积混合,根据Ion 510TM&Ion 57TM&Ion 530TMKit–Chef试剂盒操作规程利用Ion Chef进行测序模板。
(9)利用Ion GeneStudio S5基因测序仪及步骤8所得产物进行测序过程,所得测序结果利用iAnalyses进行下机数据分析并得到单碱基突变(SNP)、小片段插入缺失(InDel)结果。
(10)由遗传咨询师对步骤9所得数据进行解读,本发明的另一目的是提供该方法获得的遗传性消化道肿瘤的基因检测文库。
本发明的另一目的是提供所述文库制备的遗传性消化道肿瘤的基因检测试剂盒,其包括文库构建试剂及序列。
所述的建库试剂包括但不限于PCR扩增预混液、连接反应缓冲液、DNA连接酶等。
所述的序列包括所述引物序列SEQ ID NO:1至SEQ ID NO:204。
与现有技术相比,本发明具有如下有益效果:
1、本发明的文库采用高通量基因测序技术检测APC,CDH1,MSH2,MLH1,MSH6,PMS2,EPCAM的基因突变,不涉及基因组DNA片段化,DNA末端修复、加A尾等步骤,操作简单,对DNA需求量低,可适用于福尔马林固定石蜡包埋样本。
2、本发明的文库避免了化学打断法,不依赖于酶切方法进行基因组DNA片段化,不容易造成污染等问题。
3、本发明的文库避免了物理打断法中DNA破碎仪的使用,无需投入DNA破碎仪,减少了仪器维护及操作产生的费用,节约了成本。
4、本发明提供一种遗传性消化道肿瘤的基因文库构建方法和试剂盒检测变异类型全面、准确率高达到100%、通量高。
附图说明
图1是根据本发明的方法构建的外周血DNA文库2100生物分析仪检测结果。
图2是根据本发明的方法构建的福尔马林固定石蜡包埋DNA文库2100生物分析仪检测结果。
图3是根据本发明的文库构建及序列测定流程图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
实施例1
采用10个外周血样本提取的基因组DNA进行文库构建,采用包含APC,CDH1,MSH2,MLH1,MSH6,PMS2,EPCAM,共7基因的编码氨基酸的外显子区域及外显子上下游各20碱基区域作为目标区域的引物组进行目标区域扩增反应,并结合高通量测序平台Ion GeneStudio S5进行测序,对于待检测样本进行单碱基突变(SNP)、小片段插入缺失(InDel)检测及分析。具体操作流程如下:
(1)核酸提取及质检:外周血样本所提取基因组DNA、质检后,要求其符合一定质控标准:DNA浓度:≥1ng/μL;DNA纯度:OD260/280 1.8-2.0,OD260/230>2;DNA总起始量:≥2ng;
(1)目标区域扩增:利用上述(1)DNA及合成的5’端磷酸化修饰的相应引物组,对目标区域进行PCR扩增。为了保证目标区域(待测基因全编码区,以及可变剪切区)可全部被扩增,并避免相邻扩增子的引物之对DNA模板产生竞争结合,优选PCR扩增引物被分离成两个独立的引物组,分别进行目标区域扩增。每个反应体系为5~10μL,总体系为10~7μL。将符合步骤(1)DNA质量标准的DNA进行目标区域扩增,反应体系为:PCR扩增预混液1μL,引物组1μL,DNA 3μL,合计5μL。目标区域扩增反应条件为:99℃保持2min,而后进行16~19个循环的扩增过程,每个循环为99℃保持15s,60℃保持4~8min,最终在10℃保持不超过12h,反应结束。
(3)测序标签连接:将步骤(2)得到的两个独立引物组扩增产物混合,加入如下测序标签连接反应体系:10μL扩增产物+2μL连接反应缓冲液+1μLDNA连接酶+1μL测序标签,总体积14μL。连接反应条件:22℃保持30min,72℃保持5~7min,而后保持在10℃,不超过1h。
(4)文库纯化:将步骤(3)中获得的连接产物按照以下方法进行纯化:在连接产物中加入21μL纯化磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,弃掉上清,使用100μL70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠。
(5)产物洗脱及扩增:将步骤(4)中的纯化产物按照下述方法进行洗脱及扩增:待磁珠晾干后将离心管从磁力架上取下,加入50μLPCR扩增预混液及2μLPCR引物的混合液,涡旋混匀后,室温静止2~5min吸附,而后置于磁力架上,待溶液澄清后将上清吸取至新的PCR管中按照下述反应条件进行PCR扩增;反应条件:98℃保持2min,而后进行5~10个循环的扩增过程,每个循环98℃保持15sec,64℃保持1min,而后保持在10℃,不超过12h。程序结束。
(6)扩增产物纯化:在步骤(5)扩增后的文库中加入25μL磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,吸取上清至新的离心管中并加入60μL磁珠,将离心管置于磁力架上吸附磁珠,待溶液澄清后,弃掉上清,保持离心管在磁力架上,使用100μL 70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠,加入Tris-EDTA,涡旋混匀后室温静置2~5min,而后将离心管置于磁力架上吸附磁珠,此时上清液即为文库。
(7)文库质检:使用Qubit荧光剂对文库进行定量质检。按照现有标准操作流程进行。两个独立引物组的扩增产物均在125-275bp,结合Ion平台测序标签后,平均长度为275bp,18ng/mL为100pM。
(8)测序模板制备:将步骤7中文库根据质检结果稀释至18ng/mL,将稀释后的10个样本文库等体积混合,根据Ion 510TM&Ion 57TM&Ion 530TMKit–Chef试剂盒操作规程利用Ion Chef进行测序模板。
(9)利用Ion GeneStudio S5基因测序仪及步骤8所得产物进行测序过程,所得测序结果利用iAnalyses进行下机数据分析并得到单碱基突变(SNP)、小片段插入缺失(InDel)结果。
(10)由遗传咨询师对步骤9所得数据进行解读,数据见下表6。
表6 10例样本的测序结果与Sanger证结果100%一致
实施例2
采用10个福尔马林固定石蜡包埋样本提取的基因组DNA进行文库构建,采用包含APC,CDH1,MSH2,MLH1,MSH6,PMS2,EPCAM,共7基因的编码氨基酸的外显子区域及外显子上下游各20碱基区域作为目标区域的引物组进行目标区域扩增反应,并结合高通量测序平台Ion Torrent PGM进行测序,对于待检测样本进行单碱基突变(SNP)、小片段插入缺失(InDel)检测及分析。具体操作流程如下:
(1)核酸提取及质检:外周血样本所提取基因组DNA、质检后,要求其符合一定质控标准:DNA浓度:≥1ng/μL;DNA纯度:OD260/280 1.8-2.0,OD260/230>2;DNA总起始量:≥2ng;
(2)目标区域扩增:利用上述(1)DNA及合成的5’端磷酸化修饰的相应引物组,对目标区域进行PCR扩增。为了保证目标区域(待测基因全编码区,以及可变剪切区)可全部被扩增,并避免相邻扩增子的引物之对DNA模板产生竞争结合,优选PCR扩增引物被分离成两个独立的引物组,分别进行目标区域扩增。每个反应体系为5~10μL,总体系为10~7μL。将符合步骤(1)DNA质量标准的DNA进行目标区域扩增,反应体系为:PCR扩增预混液1μL,C7引物组1μL,DNA 3μL,合计5μL。目标区域扩增反应条件为:99℃保持2min,而后进行16~19个循环的扩增过程,每个循环为99℃保持15s,60℃保持4~8min,最终在10℃保持不超过12h,反应结束。
(3)测序标签连接:将步骤(2)得到的两个独立引物组扩增产物混合,加入如下测序标签连接反应体系:10μL扩增产物+2μL连接反应缓冲液+1μLDNA连接酶+1μL测序标签,总体积14μL。连接反应条件:22℃保持30min,72℃保持5~7min,而后保持在10℃,不超过1h。
(4)文库纯化:将步骤(3)中获得的连接产物按照以下方法进行纯化:在连接产物中加入21μL纯化磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,弃掉上清,使用100μL70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠。
(5)产物洗脱及扩增:将步骤(4)中的纯化产物按照下述方法进行洗脱及扩增:待磁珠晾干后将离心管从磁力架上取下,加入50μLPCR扩增预混液及2μLPCR引物的混合液,涡旋混匀后,室温静止2~5min吸附,而后置于磁力架上,待溶液澄清后将上清吸取至新的PCR管中按照下述反应条件进行PCR扩增;反应条件:98℃保持2min,而后进行5~10个循环的扩增过程,每个循环98℃保持15sec,64℃保持1min,而后保持在10℃,不超过12h。程序结束。
(6)扩增产物纯化:在步骤(5)扩增后的文库中加入25μL磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,吸取上清至新的离心管中并加入60μL磁珠,将离心管置于磁力架上吸附磁珠,待溶液澄清后,弃掉上清,保持离心管在磁力架上,使用100μL 70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠,加入Tris-EDTA,涡旋混匀后室温静置2~5min,而后将离心管置于磁力架上吸附磁珠,此时上清液即为文库。
(7)文库质检:使用Qubit荧光剂对文库进行定量质检。按照现有标准操作流程进行。两个独立引物组的扩增产物均在125-275bp,结合Ion平台测序标签后,平均长度为275bp,18ng/mL为100pM。
(8)测序模板制备:将步骤7中文库根据质检结果稀释至18ng/mL,将稀释后的10个样本文库等体积混合,根据Ion PGMTMHi-QTMview OT2 Kit试剂盒操作规程利用One Touch 2系统进行测序模板制备。反应体系见7:
表7 One Touch 2系统模板制备反应体系:
(9)利用Ion TorrentTM PGM基因测序仪及步骤8所得产物进行测序过程,所得测序结果利用iAnalyses进行下机数据分析并得到单碱基突变(SNP)、小片段插入缺失(InDel)结果。
(10)由遗传咨询师对步骤9所得数据进行解读,数据见下表8
表8 10例样本的测序结果与Sanger证结果100%一致
实施例3
采用10个口腔拭子样本提取的基因组DNA进行文库构建,采用包含APC,CDH1,MSH2,MLH1,MSH6,PMS2,EPCAM,共7基因的编码氨基酸的外显子区域及外显子上下游各20碱基区域作为目标区域的引物组进行目标区域扩增反应,并结合高通量测序平台Ion Torrent PGM进行测序,对于待检测样本进行单碱基突变(SNP)、小片段插入缺失(InDel)检测及分析。具体操作流程如下:
(3)核酸提取及质检:外周血样本所提取基因组DNA、质检后,要求其符合一定质控标准:DNA浓度:≥1ng/μL;DNA纯度:OD260/280 1.8-2.0,OD260/230>2;DNA总起始量:≥2ng;
(4)目标区域扩增:利用上述(1)DNA及合成的5’端磷酸化修饰的相应引物组,对目标区域进行PCR扩增。为了保证目标区域(待测基因全编码区,以及可变剪切区)可全部被扩增,并避免相邻扩增子的引物之对DNA模板产生竞争结合,优选PCR扩增引物被分离成两个独立的引物组,分别进行目标区域扩增。每个反应体系为5~10μL,总体系为10~7μL。将符合步骤(1)DNA质量标准的DNA进行目标区域扩增,反应体系为:PCR扩增预混液1μL,引物组1μL,DNA 3μL,合计5μL。目标区域扩增反应条件为:99℃保持2min,而后进行16~19个循环的扩增过程,每个循环为99℃保持15s,60℃保持4~8min,最终在10℃保持不超过12h,反应结束。
(3)测序标签连接:将步骤(2)得到的两个独立引物组扩增产物混合,加入如下测序标签连接反应体系:10μL扩增产物+2μL连接反应缓冲液+1μLDNA连接酶+1μL测序标签,总体积14μL。连接反应条件:22℃保持30min,72℃保持5~7min,而后保持在10℃,不超过1h。
(4)文库纯化:将步骤(3)中获得的连接产物按照以下方法进行纯化:在连接产物中加入21μL纯化磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,弃掉上清,使用100μL 70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠。
(5)产物洗脱及扩增:将步骤(4)中的纯化产物按照下述方法进行洗脱及扩增:待磁珠晾干后将离心管从磁力架上取下,加入50μLPCR扩增预混液及2μLPCR引物的混合液,涡旋混匀后,室温静止2~5min吸附,而后置于磁力架上,待溶液澄清后将上清吸取至新的PCR管中按照下述反应条件进行PCR扩增;反应条件:98℃保持2min,而后进行5~10个循环的扩增过程,每个循环98℃保持15sec,64℃保持1min,而后保持在10℃,不超过12h。程序结束。
(6)扩增产物纯化:在步骤(5)扩增后的文库中加入25μL磁珠,涡旋混匀后,室温吸附2~5min,而后置于磁力架上,待溶液澄清后,吸取上清至新的离心管中并加入60μL磁珠,将离心管置于磁力架上吸附磁珠,待溶液澄清后,弃掉上清,保持离心管在磁力架上,使用100μL 70%乙醇清洗磁珠三次,最后一次清洗时需将可见液体全部移除,保持离心管在磁力架上晾干磁珠,加入Tris-EDTA,涡旋混匀后室温静置2~5min,而后将离心管置于磁力架上吸附磁珠,此时上清液即为文库。
(7)文库质检:使用Qubit荧光剂对文库进行定量质检。按照现有标准操作流程进行。两个独立引物组的扩增产物均在125-275bp,结合Ion平台测序标签后,平均长度为275bp,18ng/mL为100pM。
(8)测序模板制备:将步骤7中文库根据质检结果稀释至18ng/mL,将稀释后的10个样本文库等体积混合,根据Ion PI Hi-QTMview OT2 Kit试剂盒操作规程利用One Touch 2系统进行测序模板制备。反应体系见9
表9 One Touch 2系统模板制备反应体系:
(9)利用Ion Proton基因测序仪及步骤8所得产物进行测序过程,所得测序结果利用iAnalyses进行下机数据分析并得到单碱基突变(SNP)、小片段插入缺失(InDel)结果。
(10)由遗传咨询师对步骤9所得数据进行解读,数据见下表10。
表10 10例样本的测序结果与Sanger证结果100%一致
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。
序列表
<110> 北京安智因生物技术有限公司
<120> 一种遗传性消化道肿瘤的基因文库构建方法和试剂盒
<160> 204
<170> SIPOSequenceListing 1.0
<210> 1
<211> 22
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 1
ctcatgcacc atgactgacg ta 22
<210> 2
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 2
atcctggcag gtacctagtt gtt 23
<210> 3
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 3
atcatacaga cacttcattt ggagtacc 28
<210> 4
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 4
tggccaagaa tgtcttagca aagt 24
<210> 5
<211> 17
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 5
cggcgctcgt acttctg 17
<210> 6
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 6
gtgagacatg gagagaagag agc 23
<210> 7
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 7
tttagatgat tgtctttttc ctcttgcc 28
<210> 8
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 8
ccttgttggc tacatctcca aaagt 25
<210> 9
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 9
gcagatgtaa atagtaaaaa gacgttgc 28
<210> 10
<211> 32
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 10
actgaataat acacaggtaa gaaattagga aa 32
<210> 11
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 11
tttgttgtta ctgcatacac attgtgac 28
<210> 12
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 12
acttcccata gcaatcattt tgtgc 25
<210> 13
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 13
cattcatacc tctcaggaag acagaag 27
<210> 14
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 14
agaataggat tcaatcgagg gtttcatt 28
<210> 15
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 15
agcctaccaa ttatagtgaa cgttactc 28
<210> 16
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 16
cctcttggca ttagatgaag gtgt 24
<210> 17
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 17
agttcattat catctttgtc atcagctgaa 30
<210> 18
<211> 21
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 18
tgtgacactg ctggaacttc g 21
<210> 19
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 19
tactccagat ggattttctt gttcatcc 28
<210> 20
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 20
ctgctctgat tctgtttcat tcccat 26
<210> 21
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 21
ggaggaaaaa cctcatctgt aaccat 26
<210> 22
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 22
acgtgtccta tattcagtat tttgtggt 28
<210> 23
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 23
tctctcagtg acattgacca agaaaac 27
<210> 24
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 24
tacattcctg caacaggtca tcttc 25
<210> 25
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 25
cttcaagcaa acatgccttc aatct 25
<210> 26
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 26
acttgaccca cctatttggg atg 23
<210> 27
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 27
atatatataa ggtgcgtgct ttgagagt 28
<210> 28
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 28
aatctgtcca gaagaagcca tagc 24
<210> 29
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 29
ttcaattctt tctgcttcat cagaatcc 28
<210> 30
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 30
agagtctttg attcagcacc atttgta 27
<210> 31
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 31
aatccagtgg aacccaaagt ccta 24
<210> 32
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 32
ccagaacaaa aaccctctaa caagaatc 28
<210> 33
<211> 22
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 33
caggtcccat aacccaccta ga 22
<210> 34
<211> 19
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 34
agttccgacg ccactgaga 19
<210> 35
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 35
agcacatggt taaatattct ggttccat 28
<210> 36
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 36
aagacctttc tttggaaacc ctctaag 27
<210> 37
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 37
cagcagtaca ttctacacgt agca 24
<210> 38
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 38
tgcaagtcag ttgaaaaatc ctcaca 26
<210> 39
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 39
ccagaacctc gaactatatt cttctgt 27
<210> 40
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 40
gcaaagttgc caaaataaaa ctcaggta 28
<210> 41
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 41
tctttcctac tcttcattgt acttcaacc 29
<210> 42
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 42
agactctttt tctcattttt gacacaactc 30
<210> 43
<211> 21
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 43
gagtcacccg gttccatcta c 21
<210> 44
<211> 21
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 44
aatttctcgg cccctttcca a 21
<210> 45
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 45
cccagtgttg ggatccttct ttac 24
<210> 46
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 46
cggtgtcaac aagcttctaa gaga 24
<210> 47
<211> 17
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 47
gggaccccct cgtcgct 17
<210> 48
<211> 19
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 48
agcccagctc cacaactct 19
<210> 49
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 49
ccttgagttg gaaagagttt tattggc 27
<210> 50
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 50
cataaagccc atcattgttc tggag 25
<210> 51
<211> 32
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 51
tgatgcatgt agattataga aaatcaaaca ct 32
<210> 52
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 52
ttgaggcatg atagactaca ttcctg 26
<210> 53
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 53
gggaaggaac cttgtgtttt taaattctg 29
<210> 54
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 54
catggtccca taaaattccc tgtg 24
<210> 55
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 55
tcacagagga taagacagat atttctagtg 30
<210> 56
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 56
gtaggctgta cttttcccaa aaggc 25
<210> 57
<211> 22
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 57
ttggatgctc cgttaaagct tg 22
<210> 58
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 58
acccggctgg aaattttatt tgaag 25
<210> 59
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 59
aagtagtctg tgatctccgt ttagaatga 29
<210> 60
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 60
tgggcaagtt tcatctccta aagatt 26
<210> 61
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 61
ttttctcttt tccccttggg attagtatc 29
<210> 62
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 62
ggacctccat taactagtgc aaattca 27
<210> 63
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 63
cagaaaggag ctctactaag gatgc 25
<210> 64
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 64
tcacctcctg gttgaagaaa atgc 24
<210> 65
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 65
gtaccttttg gatcaaatga tgcttgtt 28
<210> 66
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 66
agtggccttt gctttttaaa aataactact 30
<210> 67
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 67
actacatttg tccctaagga gttgtt 26
<210> 68
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 68
gcatcctggg cttcttcata ttctg 25
<210> 69
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 69
gggtaatatg ggcagtaact ctgtc 25
<210> 70
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 70
ccatgagtac tatcacccca gtttg 25
<210> 71
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 71
tacataaatt gctgtctctt ctcatgct 28
<210> 72
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 72
tgcgattctc caatatactg aaactcc 27
<210> 73
<211> 19
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 73
cacagtgcgc cttttcgac 19
<210> 74
<211> 20
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 74
ctctctgagg cgggaaagga 20
<210> 75
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 75
gtgttaaaat gtccgcagtt gatgg 25
<210> 76
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 76
ctggaatctc ctctatcact agactcaa 28
<210> 77
<211> 17
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 77
gcgaggcgcc tgttgat 17
<210> 78
<211> 17
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 78
gccgccttcg cgtgagg 17
<210> 79
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 79
cctgttctct tcaggaaggt ctgata 26
<210> 80
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 80
acttttctct cctggtgtca acc 23
<210> 81
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 81
ctttctgctc tggaaggatt caaagta 27
<210> 82
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 82
agcttggtca taatcagagt caaagc 26
<210> 83
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 83
attctaatag gctgtgagga agaggag 27
<210> 84
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 84
atgtaactgt gtttggaaaa tgatcacc 28
<210> 85
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 85
tctttaaaag aaacctcact ccccatg 27
<210> 86
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 86
tctttaacaa ctgcatttgc tattgcc 27
<210> 87
<211> 33
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 87
cgattatttc ggtaactaac taactataat gga 33
<210> 88
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 88
gtctgaattt accacctttg tcagaag 27
<210> 89
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 89
acccggccct tattgtttat aaatacat 28
<210> 90
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 90
ccccatcacc ctaacataaa taacaact 28
<210> 91
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 91
cgccctactg tttggtatca tgaa 24
<210> 92
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 92
agctcataaa atttccccac cttgtaa 27
<210> 93
<211> 35
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 93
aaaaataagg aaacacatta gctaaaagct ttaga 35
<210> 94
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 94
gccttagaat gcgttgatat caatgttac 29
<210> 95
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 95
aagacacgaa actattagcc ttagaatca 29
<210> 96
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 96
agaaagaaaa cagattaagt ccactctgtc 30
<210> 97
<211> 31
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 97
aagttgagat gttgagatag aaaactgaaa a 31
<210> 98
<211> 32
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 98
tcatgtatat tttgttgtta tagcacttga ga 32
<210> 99
<211> 19
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 99
cacacccagc cgctatagt 19
<210> 100
<211> 33
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 100
tacagtattg ttgttttcat ttcatttctg ctg 33
<210> 101
<211> 22
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 101
atcaacctga gaggctgaca tg 22
<210> 102
<211> 22
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 102
aggaacatgt ggactctcag ga 22
<210> 103
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 103
gtttgggaag tggaggacta ataagtg 27
<210> 104
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 104
tctgtgtgcc cttagaaaac tgtatatg 28
<210> 105
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 105
ggctaagaaa gcctacacca tttttg 26
<210> 106
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 106
agaaccatct tgcttcatac ttttctgat 29
<210> 107
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 107
attcactcac agcctgatga caag 24
<210> 108
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 108
catgcactac gatgtacact atagagaa 28
<210> 109
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 109
ctaagacgat atgctggaat ggctt 25
<210> 110
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 110
tgaagcacag gtttttatca gtcattgt 28
<210> 111
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 111
ggaaagttct taatttacca gtgaggga 28
<210> 112
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 112
caaaaatgca agtgcaccat ctaca 25
<210> 113
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 113
agcctcagat ttgtagtagc taaca 25
<210> 114
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 114
agtagtggag atcagaactc tggaa 25
<210> 115
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 115
gaatactaca gtgttaccca gctcct 26
<210> 116
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 116
catctgtcac acaatgtaat tcagtgg 27
<210> 117
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 117
gagagcactg atgataaaca cctcaa 26
<210> 118
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 118
gttggtctct cttcttcttc atgctg 26
<210> 119
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 119
gaaaagattg gaactaggtc agctgaa 27
<210> 120
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 120
acgactctca aaactatcaa gtgaact 27
<210> 121
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 121
tggaattaag aataatgcct ccagttca 28
<210> 122
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 122
acaggtggag gtaattttga agcag 25
<210> 123
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 123
atggtaagaa aaagaaacca acttcacc 28
<210> 124
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 124
acagtaagga gttccttcaa taggc 25
<210> 125
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 125
ccaacaatca gctaataaga cacaagc 27
<210> 126
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 126
ggctcagtct ctttgatagg ttcattt 27
<210> 127
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 127
accatttcat cttacacctg atcaagaa 28
<210> 128
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 128
tcgaactcct ggaatatgaa tcattgt 27
<210> 129
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 129
tgtcatatac atctccaggt agacagat 28
<210> 130
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 130
ttttcttctt aaggttgggc ttggag 26
<210> 131
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 131
ccacaaatag tacttctcag accgtt 26
<210> 132
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 132
cccacatttt gttttgcctg attatctt 28
<210> 133
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 133
gtttttgttc tggaagccat atttgatagt 30
<210> 134
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 134
accaattttt ccctgatgta agtttagtca 30
<210> 135
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 135
ctggagtaaa actgcggtca aaaat 25
<210> 136
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 136
aactggagta cacaaggcaa tgttta 26
<210> 137
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 137
cttacaccat cctcagccaa gatc 24
<210> 138
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 138
cctagcagga ttttgctttg tcca 24
<210> 139
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 139
tgagtaggtg agcagatttg agaag 25
<210> 140
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 140
tggtgagaga gacctcaaaa ggta 24
<210> 141
<211> 20
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 141
aaagcacctg tgagcttgcg 20
<210> 142
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 142
actttcttgg aagaagggaa gcg 23
<210> 143
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 143
acatacctaa ataaaaccca agcagctc 28
<210> 144
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 144
ggtctttatt ctggttatcc atgagctt 28
<210> 145
<211> 22
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 145
caagtctggg tgcattgtcg ta 22
<210> 146
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 146
gattgcccca ttcgttcaag tagt 24
<210> 147
<211> 24
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 147
ggactgttag acctgaagta tccg 24
<210> 148
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 148
ctttctctcc ttggtacttc tctgc 25
<210> 149
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 149
agcagtccta aaacaatagt tgtctttct 29
<210> 150
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 150
gattcaacag ggcctttcta tttaggt 27
<210> 151
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 151
tacaatataa cttagctggg acatgagagt 30
<210> 152
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 152
aaactctttc caactcaagg cacat 25
<210> 153
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 153
acagttttag accctgagct gtc 23
<210> 154
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 154
tccagtaagt gcatttaacc accac 25
<210> 155
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 155
gctcctaaaa acgaaccaat aggaaga 27
<210> 156
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 156
aaacgtctag atgctcaacg gaa 23
<210> 157
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 157
tttttaatac agactttgct accaggact 29
<210> 158
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 158
tcaagcatct cctcatcttg ctg 23
<210> 159
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 159
ctgttaacca gattccacag cca 23
<210> 160
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 160
agtggagagc tactattttc agaaacg 27
<210> 161
<211> 21
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 161
gccaggacac cagtgtatgt t 21
<210> 162
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 162
aagaagaaca catcccacag tgc 23
<210> 163
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 163
aaatggaagc agcagttcag ataac 25
<210> 164
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 164
aagataacac tggtgttgag acagg 25
<210> 165
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 165
gggattttta atagtttgct ggtggag 27
<210> 166
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 166
tcttgaaagg ttccaaaata atgtgatgg 29
<210> 167
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 167
ctgtttttca tggcgtagta aggtttt 27
<210> 168
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 168
aagtggtata atcatgtggg taactgc 27
<210> 169
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 169
tgaaaacagt aaaatttaag tgggaggaaa 30
<210> 170
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 170
agacaaaaga attattccaa cctccaatg 29
<210> 171
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 171
tgcagcaaat tgacttcttt aaatgaagag 30
<210> 172
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 172
gccaggtgac attcagaaca ttattagt 28
<210> 173
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 173
ttccatatgt acgaccagcc atttt 25
<210> 174
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 174
tgttaagaac tgggaatttt ctccatca 28
<210> 175
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 175
tgaattggga agaggaactt ctacct 26
<210> 176
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 176
ggtagtaagt ttcccattac caagttct 28
<210> 177
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 177
aattattcag gagttcctgt ccaaggt 27
<210> 178
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 178
cactgacagt taacactatg gaaaaagg 28
<210> 179
<211> 33
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 179
gagtttggat ttttcctttt tgcttataaa att 33
<210> 180
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 180
tatggaatcc acatacccaa ctccaa 26
<210> 181
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 181
gtggcagatt aagtctcaga actttgat 28
<210> 182
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 182
ctacatcgtg cctccatcat ttctg 25
<210> 183
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 183
aggtgcttaa aggtatgact tcagagt 27
<210> 184
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 184
taatgtcact gcatctagca ccattc 26
<210> 185
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 185
aaaggctcga aagactggac ttattac 27
<210> 186
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 186
cccttcttgg tagatttcaa ctcgtatt 28
<210> 187
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 187
ccaaacgatg aagcctcact tttac 25
<210> 188
<211> 26
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 188
cagtaacaag cacacaatag gctttg 26
<210> 189
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 189
aattaagtga aactgccagc atactcat 28
<210> 190
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 190
gtgcgtgctc taaaaacatt catattgt 28
<210> 191
<211> 28
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 191
gcttgtccta aaagctatgg ctttaatg 28
<210> 192
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 192
gccaggcaaa cttcccttaa aattaaa 27
<210> 193
<211> 32
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 193
tttgatttgt ttttaaatac tctttccttg cc 32
<210> 194
<211> 22
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 194
tatttggcgg ctacttcgcc ta 22
<210> 195
<211> 22
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 195
acctgaagtg ctagaagaca gc 22
<210> 196
<211> 20
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 196
cctcttctcc gtccacgttt 20
<210> 197
<211> 30
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 197
aagtcaaagg cataaagaac aaactaacac 30
<210> 198
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 198
actttaagaa tgtgccatgt gatcgta 27
<210> 199
<211> 29
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 199
atgtgcatta accaatactc ttgaaaacc 29
<210> 200
<211> 22
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 200
ggtctctcac tgaacacacc at 22
<210> 201
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 201
ctgtttttgc atttcccaag acagt 25
<210> 202
<211> 23
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 202
aaaaactgat agcatgggtc cgt 23
<210> 203
<211> 25
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 203
ctgccttggc ctctattaga tcttc 25
<210> 204
<211> 27
<212> DNA
<213> 人工序列(Artifial Sequence)
<400> 204
cagtaaaacg atgtttgcag aaatgga 27