基于EV71毒株的感染性cDNA克隆及其应用
技术领域
本发明属于生物医药领域,具体涉及基于一株临床分离的EV71毒株(js1)的感染性cDNA克隆的构建,以及利用此cDNA克隆及其衍生克隆产生的病毒及其带有报告基因的病毒及建立的动物模型在抗病毒药物研发,疫苗研发,病毒诊断方面的应用。
背景技术
现有技术公开了肠道病毒是一类病毒的总称,包括脊髓灰质炎病毒(Poliovirus)的3个分型、柯萨奇病毒(Coxsackie virus A)的23个分型、柯萨奇(Coxsackie virus B)病毒的6个分型、埃可病毒(ECHO virus)的31个分型、肠病毒(Enterovirus)的68-71个分型,共67种类型。传统分型以后发现的肠道病毒﹐按照发现顺序命名,现在已经发现的新型肠道病毒有68﹑69﹑70﹑71和72型肠道病毒。新型肠道病毒71型,简称EV71,属于小RNA病毒科,肠道病毒属,其于1969年从澳大利亚和美国分离出,于1973在日本分离出,并被认为是儿童手足口病爆发流行的主要病原体(Schmidt et al.J Infect Dis 1974,129:304-309;Hagiwara et al.Intervirology 1978,9:60-63.)。在1988年以前,EV71病毒主要在美国、日本、欧洲和澳大利亚地区引起婴幼儿手足口病的爆发流行(Weng et al.MicrobesInfect 2010;12:505-10;Tagaya et al.Jpn J Med Sci Biol 1975;28:231-4;Blomberget al.Lancet 1974;2:112;Nagy et al..Arch Virol 1982;71:217-27;Kennett etal.Bull World Health Organ 1974;51:609-15;Gilbert et al.Pediatr Infect Dis J1988;7:484-8)。自1990年以来,EV71病毒在亚洲-太平洋地区引起一系列的爆发流行(Chanet al.Clin Infect Dis 2000;31:678-83;Tu et al.Emerg Infect Dis 2007;13:1733-41;Jeong et al..Arch Virol 2010;155:1707-12)。截止2014年,EV71感染已波及到全球各个洲和国家。研究显示,EV71感染主要分布在亚洲-太平洋地区,在北美、南美、欧洲和澳大利亚也有EV71感染的分布。
研究报道了EV71病毒是单股正链RNA病毒,其基因组可以编码一条单长的开放阅读框(ORF),在基因组的两段还包含两个长的非编码区5'TURs和3'TURs。5'TURs含有核糖体内部结合位点(Internal ribosome entry site,IRES),启动病毒的翻译过程(Hellen etal.Genes Dev.2001;15,1593–1612)。病毒编码的开放阅读框翻译后被病毒自身编码的蛋白酶切割加工成单个病毒蛋白,其中包括组成病毒颗粒的结构蛋白VP4,VP2,VP3,VP1和负责病毒复制的非结构蛋白2A,2B,2C,3A,3B,3C及3D(Racaniello,et al.FieldsVirology.2007,Fifth edition)。
研究报道,灵长类动物可以作为EV71的感染模型。最早在1978年,Hashimoto等报道使用1.8-3.8kg的食蟹猴,在隔离了9周以后,可以感染来自一名3岁儿童粪便标本分离到的EV71病毒毒株,EV71病毒对这种猴子具有神经毒性,在感染的第四天食蟹猴表现出神经损伤的临床症状,损伤程度跟病毒滴度呈正相关。并且EV71病毒可以诱发猴子产生血清中和抗体(Hashimoto et al.Arch Virol.1978;56:257-61)。Zhang等使用3-3.5岁大小的恒河猴可以建立出现脑内感染,肺水肿、出血伴发神经损伤等症状的动物感染模型,而静脉和呼吸系统感染可直接导致神经系统感染。因此,通过不同的感染途径可以获得不同研究目的的模型(Zhang et al.Lab Invest.2011;91:1337-50)。此外还有能引起中枢神经系统疾病的恒河猴动物模型,(Liu et al.Virology.2011;412:91-100)。
EV71的非灵长类动物模型也有报道,如,老鼠适应性突变的EV71毒株EV71/MP4可以感染ICR老鼠,出现神经和肺部损伤(Chen et al.J Virol.2007,81:8996-9003;Wang etal.J Virol.2004,78:7916-24)。Arita等使用免疫缺陷的非肥胖严重糖尿病的小鼠(NOD/SCID mice),对病毒传代获得了可以使3周大小NOD/SCID小鼠感染的鼠适应EV71毒株,该小鼠模型自然杀伤细胞功能被抑制,并且缺乏功能性T、B细胞。而且获得的鼠适应株主要感染动物的中枢神经系统、心脏和骨骼肌(Arita et al.J Virol.2008,82(4):1787-97)。利用干扰素受体α、β和γ缺陷免疫缺陷小鼠AG129小鼠,2周龄或更小龄的AG129小鼠可以感染EV71天然毒株,并且在小鼠死亡之前表现出肢体瘫痪的症状(Khong et al.J Virol.2012,86(4):2121-31)。三周龄的表达有EV71受体hSCARB2的转基因小鼠可以成功感染EV71Isehara/Japan/99(Isehara)毒株;研究表明构建EV71的老鼠模型需要特殊的老鼠适应性毒株或基因缺失或修饰的老鼠。
研究还报道,单正链(positive-strand)RNA病毒的基因组RNA被释放,进入宿主细胞细胞浆后可以直接作为mRNA模版进行翻译;翻译产生的病毒非结构蛋白招募病毒基因组形成复制复合物起始病毒的基因复制及生活周期,因此单正链RNA病毒的基因组RNA具有感染性,经导入到宿主细胞后,可以完全起始病毒的整个生活周期(Racaniello,etal.Science.1981,214(4523):916)。构建感染性克隆的方法通常采用病毒感染的细胞总RNA作为模版,逆转录成互补DNA(cDNA),然后克隆病毒片段入克隆载体形成病毒的感染性克隆。构建的感染性克隆利用体外转录产生完整的病毒RNA,然后转染病毒RNA入宿主细胞来起始病毒生活周期,产生子代病毒。或者构建的感染性克隆如果带有真核细胞启动子,可以直接转染质粒,由宿主细胞的RNA聚合酶转录出病毒全长RNA,进而起始病毒生活周期,产生子代病毒。
老鼠模型研究证实EV71的VP1 145位谷氨酸是病毒致小鼠死亡的主要位点,VP2149位赖氨酸的甲基化能够协同促进VP1 145E致小鼠死亡的能力(Huang etal.Virology.2012,422(1):132-43)。此病毒位点在病毒体外传代过程中易突变未145G,导致病毒感染动物能力的下降(Yi et al.Unpublished data)。
基于现有技术的基础与现状,本申请的发明人拟提供基于EV71毒株的感染性cDNA克隆及其应用。
发明内容
本发明的目的是基于现有技术的基础与现状,提供基于EV71毒株的感染性cDNA克隆及其应用。具体涉及一个稳定的EV71毒株的感染性cDNA克隆,该克隆及其衍生产生的病毒RNA在细胞中能自行复制、产生子代病毒颗粒及表达报道基因。
本发明要解决的另一个技术问题是提供以上述克隆为基础构建的重组病毒或者亚单位病毒颗粒、质粒等,为构建动物模型、疫苗开发及抗病毒药物的开发提供支持。
本发明从临床上分离到一株EV71毒株(命名为js1),其无需老鼠适应性突变、且能感染未经基因背景改变的小鼠,通过构其感染性克隆能产生稳定基因序列的病毒颗粒,感染普通老鼠,建立简便、高效的EV71动物感染模型。
更具体的,
本发明提供了一种cDNA,它包含EV71毒株的核酸序列和一个低拷贝质粒骨架的核酸序列;其中,EV71毒株的核酸序列涵盖EV71病毒5′到3′正向极性序列,包含病毒5′及3′非编码区及一个编码病毒蛋白的开放阅读框。
较好的,它还包括EV71毒株的核酸序列插入的报道基因荧光素酶或者荧光蛋白的序列。
所述的病毒蛋白开放阅读框的氨基酸序列如SEQ ID NO 4所示。
所述的低拷贝质粒骨架的编码序列如SEQ ID NO 3所示。
所述的EV71毒株的核酸序列如SEQ ID NO 2所示。
在本发明的一个优选实施例中,所述的EV71毒株的感染性cDNA克隆,其序列如SEQID NO 1所示。
在本发明的一个实施例中,提供了一个稳定的、一株临床分离的EV71毒株的感染性cDNA克隆的构建(核酸序列1)及其含有各类报道基因的衍生克隆(核酸序列5,核酸序列6)、及以其为母本构建的各种突变克隆。这些克隆产生的病毒RNA在细胞中能自行复制、产生子代病毒颗粒及表达报道基因。
本发明还包括以核酸序列6或核酸序列7所述的序列为母本,通过替代Nluc或EGFP所构建的含有异源性报道序列或目的基因的重组病毒克隆及其序列。
本发明还包括各种嵌合病毒感染性克隆和含有异源性报道序列或目的基因的重组病毒克隆产生的各种嵌合病毒和含有报道基因或外源基因的各种病毒颗粒。
本发明还包括全长感染性克隆序列构建的在病毒蛋白中同开放阅读框插入有异源性抗性序列的重组病毒克隆及其序列。
具体的,本发明提供了一种包含临床分离的EV71毒株(js1)的感染性cDNA克隆(核酸序列1),此感染性克隆(核酸序列1)包含一个全长的EV71毒株(js1)的核酸序列(核酸序列2)及一个低拷贝质粒骨架(核酸序列3)。核酸序列2涵盖EV71病毒5′到3′正向极性(positive-sense)序列,其中包含病毒5′及3′非编码区及一个编码病毒蛋白的开放阅读框(open reading frame),开放阅读框病毒编码蛋白(蛋白序列4),在此感染性克隆(核酸序列1)中插入报道基因荧光素酶NanoLuc(Nluc)及荧光蛋白EGFP,分别构成带有Nluc的感染性克隆(核酸序列5)及带有EGFP的感染性克隆(核酸序列6),以及以这些克隆为基础,通过改变核酸的手段得到的突变病毒克隆(adapted virus),减毒病毒克隆(live-attenuatedvirus),复制缺陷病毒克隆(defective virus)及复制性的非感染性克隆(replication-competent non-infectious virus)等衍生物(derivative),如包括缺失结构蛋白的亚基因组复制子。
上述序列1-6具体如下:
核酸序列1,SEQ ID NO 1:
GCTAGCGGAGTGTATACTGGCTTACTATGTTGGCACTGATGAGGGTGTCAGTGAAGTGCTTCATGTGGCAGGAGAAAAAAGGCTGCACCGGTGCGTCAGCAGAATATGTGATACAGGATATATTCCGCTTCCTCGCTCACTGACTCGCTACGCTCGGTCGTTCGACTGCGGCGAGCGGAAATGGCTTACGAACGGGGCGGAGATTTCCTGGAAGATGCCAGGAAGATACTTAACAGGGAAGTGAGAGGGCCGCGGCAAAGCCGTTTTTCCATAGGCTCCGCCCCCCTGACAAGCATCACGAAATCTGACGCTCAAATCAGTGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCTGGCGGCTCCCTCGTGCGCTCTCCTGTTCCTGCCTTTCGGTTTACCGGTGTCATTCCGCTGTTATGGCCGCGTTTGTCTCATTCCACGCCTGACACTCAGTTCCGGGTAGGCAGTTCGCTCCAAGCTGGACTGTATGCACGAACCCCCCGTTCAGTCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGAAAGACATGCAAAAGCACCACTGGCAGCAGCCACTGGTAATTGATTTAGAGGAGTTAGTCTTGAAGTCATGCGCCGGTTAAGGCTAAACTGAAAGGACAAGTTTTGGTGACTGCGCTCCTCCAAGCCAGTTACCTCGGTTCAAAGAGTTGGTAGCTCAGAGAACCTTCGAAAAACCGCCCTGCAAGGCGGTTTTTTCGTTTTCAGAGCAAGAGATTACGCGCAGACCAAAACGATCTCAAGAAGATCATCTTATTAAGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTGCAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAACACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTGTCGACGCGGCCGCTAATACGACTCACTATAGGTTAAAACAGCCTGTGGGTTGCACCCACTCACAGGGCCTACTGGGCGCAAGCACTCTGGTACCTCGGTACCTTTGTGCGCCTGTTTTACACCCCCCCCCCAATGAAACTTAGAAGCAATAAACCACGATCAATAGCAGGCATAACGCTCCAGTTATGTCTTGATCAAGCACTTCTGTTTCCCCGGACTGAGTATCAATAGACTGCTCGCGCGGTTGAAGGAGAAAACGTTCGTTATCCGGCTAACTACTTCGGAAAACCTAGTAACACCATGAAAGTTGCGGAGAGCTTCGTTCAGCACTCCCCCAGTGTAGATCAGGTCGATGAGTCACCGCGTTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGTAACCCATGGGGCGCTCTAATACGGACATGGTGTGAAGAGTCTACTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCCAACTGCGGAGCACACGCCCACAAGCCAGCGGGTAGTGTGTCGTAACGGGTAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCCTTTTATCTTTATATTGGCTGCTTATGGTGACAATTAAAGAATTGTTACCATATAGCTATTGGATTAGCCATCCGGTGTGCAACAGAGCAATTATTTACCTATTTATTGGTTTTGTACCATTAACCTCGAATTCTGTGACCACCCTTAATTATATCTTGACCCTTAACACAGCTAAACATGGGTTCGCAAGTGTCTACACAGCGCTCCGGTTCTTACGAAAACTCAAACTCAGCCACTGAGGGTTCTACCATAAACTACACCACCATTAATTACTACAAAGACTCCTATGCTGCCACAGCAGGCAAaCAGAGTCTCAAGCAGGATCCAGACAAGTTTGCAAATCCTGTTAAAGACATATTCACcGAAATGGCAGCGCCACTGAAGTCCCCATCCGCTGAGGCATGTGGATACAGTGATCGAGTGGCGCAATTAACTATTGGCAACTCCACCATCACGACGCAAGAAGCGGCTAACATCATAGTCGGCTATGGTGAGTGGCCTTCCTACTGCTCAGATTCTGACGCTACAGCAGTGGATAAACCAACGCGCCCGGATGTTTCAGTGAACAGGTTTTACACATTGGACACTAAATTGTGGGAGAAATCGTCCAAGGGATGGTACTGGAAGTTCCCGGATGTGTTAACTGAAACTGGGGTTTTTGGGCAAAATGCACAATTCCACTACCTCTACCGATCAGGGTTCTGCATCCACGTGCAGTGCAATGCCAGTAAATTCCACCAAGGAgCACTcCtAgTCGCTGTCCTACCAGAGTATGTCATTGGGACAGTGGCAGGCGGTACAGGGACGGAAGACACCCACCCCCCCTACAAGCAGACCCAACCCGGCGCCGATGGTTTCGAGTTGCAACACCCGTACGTGCTTGATGCTGGCATCCCAATATCACAGTTAACAGTGTGCCCACACCAGTGGATTAATTTGAGGACCAACAATTGTGCTACAATAATAGTGCCATACATTAACGCACTGCCTTTTGATTCTGCCTTGAACCATTGCAACTTTGGCCTGTTAGTTGTGCCTATTAGCCCACTAGACTACGACCAAGGAGCAACGCCAGTAATCCCTATAACTATCACATTGGCCCCAATGTGCTCTGAATTCGCAGGTCTTAGGCAGGCAGTCACGCAAGGGTTCCCCACCGAGCTAAAACCTGGCACAAATCAATTTTTAACCACCGATGATGGCGTCTCAGCACCTATTCTACCAAACTTCCACCCCACCCCGTGTATCCACATACCTGGTGAAGTTAGGAACTTGCTAGAGTTATGCCAGGTGGAGACCATTCTGGAGGTTAACAATGTGCCCACGAATGCCACTAGCTTAATGGAGAGACTGCGCTTCCCGGTCTCAGCACAAGCAGGGAAAGGTGAACTGTGTGCGGTGTTTAGAGCCGATCCTGGGCGAAATGGACCATGGCAATCCACCTTACTGGGCCAGTTGTGCGGGTACTACACCCAATGGTCAGGGTCATTGGAAGTCACCTTCATGTTTACTGGATCCTTCATGGCTACCGGCAAGATGCTCATAGCCTATACACCGCCAGGGGGTCCTCTGCCCAAGGACCGGGCGACCGCCATGTTGGGCACGCACGTCATCTGGGATTTTGGGCTGCAATCGTCTGTTACCCTTGTAATACCATGGATCAGTAACACTCATTATAGAGCACATGCCCGAGATGGAGTGTTTGACTATTACACTACAGGGTTAGTCAGTATATGGTACCAGACAAATTACGTGGTTCCAATCGGTGCGCCCAACACAGCCTATATAATAGCACTAGCGGCAGCCCAAAAGAACTTCACTATGAAATTGTGCAAGGATGCTAGTGATATCCTGCAGACGGGCACCATCCAGGGAGATAGGGTGGCAGATGTAATTGAAAGTTCCATAGGAGATAGCGTGAGCAGAGCCCTCACTCACGCTCTACCAGCACCCACAGGCCAAAACACACAGGTGAGCAGTCATCGACTGGATACAGGCAAGGTTCCAGCACTCCAAGCTGCTGAAATTGGGGCATCATCAAATGCTAGTGACGAGAGCATGATTGAAACACGTTGTGTTCTTAACTCGCATAGTACAGCTGAGACCACTCTTGATAGTTTCTTCAGTAGGGCAGGATTAGTTGGAGAGATAGATCTCCCTCTTGAGGGCACAACTAACCCAAATGGTTATGCCAACTGGGACATAGATATAACAGGTTACGCGCAAATGCGTAGAAAGGTAGAGCTATTCACCTACATGCGTTTTGATGCAGAGTTCACTTTTGTTGCGTGCACACCCACCGGGGAGGTTGTCCCACAATTGCTCCAATATATGTTTGTGCCACCTGGAGCCCCTAAGCCAGATTCTAGGGAATCCCTTGCATGGCAAACCGCCACCAACCCCTCAGTTTTTGTCAAGCTGTCAGACCCTCCGGCGCAGGTTTCAGTGCCATTCATGTCACCTGCGAGTGCTTATCAATGGTTTTATGACGGATATCCCACATTCGGAGAACACAAACAGGAGAAAGACCTTGAATACGGGGCATGTCCTAATAACATGATGGGTACATTCTCAGTGCGGACTGTGGGGACCTCCAAGTCCAAGTACCCTTTAGTGGTTAGGATTTACATGAGAATGAAGCACGTCAGGGCGTGGATACCTCGCCCGATGCGCAACCAGAACTACCTGTTCAAAGCCAACCCAAATTATGCTGGCAACTCTATTAAGCCAACTGGTGCCAGTCGCACAGCGATCACCACTCTTGGGAAATTTGGACAACAGTCTGGGGCTATTTATGTGGGCAACTTTAGAGTGGTCAACCGACATCTTGCCACCCATAATGATTGGGCAAATCTTGTTTGGGAAGACAGCTCTCGCGACTTGCTCGTGTCATCCACCACTGCCCAAGGTTGTGACACGATTGCCCGTTGCGATTGCCAGACAGGGGTGTACTACTGTAACTCGATGAGAAAACACTACCCAGTCAGTTTTTCAAAACCCAGCCTGATCTATGTAGAGGCTAGCGAGTATTACCCAGCCAGGTACCAATCACATCTCATGCTCGCACAGGGTCACTCGGAACCTGGTGATTGCGGTGGTATCCTTAGGTGCCAACATGGCGTCATCGGCATAGTGTCTACTGGTGGCAATGGGCTCGTTGGCTTTGCAGACGTCAGAGACCTCTTGTGGTTAGATGAAGAAGCTATGGAACAGGGCGTGTCCGACTACATTAAGGGTCTCGGAGATGCTTTTGGAACAGGCTTCACTGACGCAGTCTCAAGGGAGGTTGAAGCTCTCAAGAACTATCTTATAGGGTCTGAAGGAGCAGTTGAGAAAATTTTGAAAAATCTTATTAAACTAATCTCTGCACTGGTGATTGTGATCAGAAGTGATTACGACATGGTTACCCTCACTGCAACCTTAGCGCTGATAGGTTGTCATGGCAGTCCTTGGGCTTGGATTAAAGCCAAAACAGCCTCCATCTTAGGTATCCCTATCGCCCAAAAGCAGAGCGCTTCCTGGCTCAAGAAGTTCAATGACATGGCCAACGCCGCTAAGGGGTTAGAGTGGGTTTCCAACAAGATCAGCAAATTTATTGATTGGCTTAAGGAGAAAATAGTACCAGCAGCCAGGGAGAAGGTTGAATTCCTAAATAACTTGAAACAGCTGCCACTGCTAGAGAATCAGATCTCGAACTTGGAACAATCTGCTGCTTCACAAGAGGACCTTGAAGTCATGTTTGGGAATGTGTCGTACCTAGCTCACTTCTGTCGCAAGTTTCAACCGCTATACGCCACGGAAGCTAAAAGAGTCTATGCCCTGGAGAAGAGAATGAATAACTATATGCAGTTCAAGAGCAAACACCGAATTGAACCTGTATGTCTCATTATTAGGGGCTCACCAGGCACCGGGAAGTCTCTAGCCACTGGTATTATTGCTCGAGCAATCGCTGATAAGTACCACTCCAGCGTGTACTCGCTCCCACCAGACCCGGATCATTTTGACGGTTACAAGCAACAGGTGGTTACAGTGATGGATGATTTGTGTCAAAACCCCGATGGTAAGGATATGTCCTTATTCTGTCAAATGGTATCCACCGTAGATTTCATTCCACCAATGGCTTCTCTCGAGGAGAAGGGAGTTTCCTTCACCTCTAAGTTTGTCATCGCATCCACTAATGCCAGTAATATCATAGTACCAACAGTGTCTGATTCTGACGCTATTCGCCGCAGGTTCTACATGGACTGTGACATTGAAGTGACAGACTCGTACAAAACAGATCTAGGTAGACTGGATGCAGGGCGAGCCGCTAAACTGTGTTCTGAAAATAACACTGCAAATTTCAAACGTTGCAGCCCATTAGTGTGTGGGAAAGCCATCCAACTTAGAGATAGAAAGTCTAAAGTCAGATACAGTGTGGATACGGTGGTTTCAGAACTTATTAGGGAATACAGCAATAGGTCCGCCATTGGTAACACAATCGAGGCTCTTTTCCAAGGTCCACCCAAGTTCAGGCCAATTAGGATTAGCCTTGAAGAAAAACCAGCCCCAGACGCTATTAGCGATCTCCTTGCTAGTGTAGATAGTGAAGAAGTGCGCCAGTACTGCAGGGATCAAGGCTGGATTATTCCTGAAGCTCCCACCAATGTGGAGCGGCACCTTAATAGAGCGGTGCTCGTCATGCAATCCATCACCACAGTAGTGGCGGTTGTTTCGTTGGTGTACGTCATCTACAAGCTCTTTGCAGGGTTTCAGGGTGCATATTCTGGTGCTCCTAAGCAAGTGCTTAAGAAACCTGCTCTTCGCACAGCAACAGTGCAGGGTCCGAGCCTTGACTTTGCTCTCTCCCTACTGAGAAGGAACATCAGGCAGGTCCAAACAGACCAAGGGCATTTCACCATGTTGGGTGTTAGGGATCGCTTAGCAGTCCTCCCACGCCACTCACAACCTGGCAAAACCATTTGGATTGAGCACAAACTCGTGAACGTCCTTGATGCAGTTGAACTGGTGGATGAGCAAGGAGTCAACCTGGAATTAACCCTCATCACTCTTGACACCAACGAGAAGTTTAGGGATATCACCAAATTCATCCCAGAAAATATCAGCACTGCTAGCGATGCCACCCTAGTGATCAACACGGAGCACATGCCGTCAATGTTTGTCCCGGTGGGTGACGTTGTGCAGTATGGCTTTTTGAATCTCAGTGGCAAGCCTACCCATCGCACCATGATGTACAATTTTCCTACTAAAGCAGGACAGTGTGGAGGAGTGGTGACATCTGTTGGGAAGGTTGTCGGTATTCACATTGGTGGCAATGGCAGACAAGGTTTTTGCGCAGGCCTCAAAAGGAGTTACTTTGCTAGTGAACAAGGAGAGATCCAGTGGGTTAAGCCCAATAAAGAAAcTggAAGACTCAACATCAATGGACCAACCCGCACCAAGTTAGAACCTAGTGTATTCCATGACATCTTCGAGGGAAATAAGGAACCAGCTGTCTTGCACAGTAAAGACCCCCGACTTGAGGTAGATTTTGAACAGGCCCTGTTCTCTAAGTATGTGGGAAACACACTACATGAGCCTGACGAGTACATCAAAGAGGCAGCTCTACATTATGCAAACCAATTAAAGCAACTAGAAATCAATACCTCTCAAATGAGCATGGAGGAGGCCTGCTATGGTACTGAGAATCTTGAGGCTATTGATCTTCACACTAGTGCAGGTTACCCCTATAGTGCCCTAGGGATAAAGAAAAGAGACATCTTAGACCCTACCACCAGGGACGTGAGTAGAATGAAGTTCTACATGGACAAGTATGGTCTTGATCTTCCCTACTCCACTTATGTCAAGGACGAGCTACGCTCGATTGATAAAATCAAGAAAGGGAAGTCCCGCCTGATCGAGGCCAGTAGTCTAAATGATTCAGTGTACCTCAGAATGGCTTTCGGGCATTTGTATGAGGCTTTCCACGCAAATCCTGGGACGATAACTGGATCGGCCGTGGGGTGTAACCCTGACACATTCTGGAGCAAGCTGCCAATTTTGCTCCCTGGTTCACTCTTTGCCTTTGACTACTCAGGCTATGATGCCAGCCTTAGCCCTGTCTGGTTCAGAGCATTAGAATTGGTTCTTAGGGAGATAGGGTATAGTGAAGAGGCAATCTCACTCATTGAGGGAATCAACCACACACATCATGTGTATCGTAATAAGACCTATTGCGTGCTTGGTGGGATGCCCTCAGGCTGTTCAGGAACATCCATCTTCAACTCAATGATCAACAACATTATTATCAGAGCACTGCTCATAAAAACATTTAAGGGCATTGATTTGGATGAACTCAACATGGTCGCTTATGGAGACGATGTGCTCGCTAGCTATCCCTTCCCAATTGATTGCTTGGAACTAGCAAAGACTGGTAAGGAGTATGGTCTGACCATGACCCCTGCTGATAAATCTCCTTGCTTTAATGAGGTCAATTGGGGTAATGCGACCTTCCTCAAAAGGGGCTTTTTGCCCGATGAACAGTTTCCATTTTTGATTCACCCTACTATGCCAATGAGGGAGATCCATGAGTCCATTCGATGGACCAAGGACGCACGGAACACTCAAGATCATGTGCGGTCCTTGTGCCTCCTAGCATGGCATAATGGTAAGCAAGAATACGAGAAGTTTGTGAGCACAATTAGGTCTGTCCCAGTAGGGAGAGCGTTGGCTATTCCAAATTATGAAAATCTTAGACGAAATTGGCTCGAGTTATTTTAGAGGTTATACACACCTCAACCCCACCAGAAATCTGGTCGTGAATGTGACTGGTGGGGGTAAATTTGTTATAACCAGAATAGCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAaagcttat
核酸序列2,SEQ ID NO 2:
TTAAAACAGCCTGTGGGTTGCACCCACTCACAGGGCCTACTGGGCGCAAGCACTCTGGTACCTCGGTACCTTTGTGCGCCTGTTTTACACCCCCCCCCCAATGAAACTTAGAAGCAATAAACCACGATCAATAGCAGGCATAACGCTCCAGTTATGTCTTGATCAAGCACTTCTGTTTCCCCGGACTGAGTATCAATAGACTGCTCGCGCGGTTGAAGGAGAAAACGTTCGTTATCCGGCTAACTACTTCGGAAAACCTAGTAACACCATGAAAGTTGCGGAGAGCTTCGTTCAGCACTCCCCCAGTGTAGATCAGGTCGATGAGTCACCGCGTTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGTAACCCATGGGGCGCTCTAATACGGACATGGTGTGAAGAGTCTACTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCCAACTGCGGAGCACACGCCCACAAGCCAGCGGGTAGTGTGTCGTAACGGGTAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCCTTTTATCTTTATATTGGCTGCTTATGGTGACAATTAAAGAATTGTTACCATATAGCTATTGGATTAGCCATCCGGTGTGCAACAGAGCAATTATTTACCTATTTATTGGTTTTGTACCATTAACCTCGAATTCTGTGACCACCCTTAATTATATCTTGACCCTTAACACAGCTAAACATGGGTTCGCAAGTGTCTACACAGCGCTCCGGTTCTTACGAAAACTCAAACTCAGCCACTGAGGGTTCTACCATAAACTACACCACCATTAATTACTACAAAGACTCCTATGCTGCCACAGCAGGCAAaCAGAGTCTCAAGCAGGATCCAGACAAGTTTGCAAATCCTGTTAAAGACATATTCACcGAAATGGCAGCGCCACTGAAGTCCCCATCCGCTGAGGCATGTGGATACAGTGATCGAGTGGCGCAATTAACTATTGGCAACTCCACCATCACGACGCAAGAAGCGGCTAACATCATAGTCGGCTATGGTGAGTGGCCTTCCTACTGCTCAGATTCTGACGCTACAGCAGTGGATAAACCAACGCGCCCGGATGTTTCAGTGAACAGGTTTTACACATTGGACACTAAATTGTGGGAGAAATCGTCCAAGGGATGGTACTGGAAGTTCCCGGATGTGTTAACTGAAACTGGGGTTTTTGGGCAAAATGCACAATTCCACTACCTCTACCGATCAGGGTTCTGCATCCACGTGCAGTGCAATGCCAGTAAATTCCACCAAGGAgCACTcCtAgTCGCTGTCCTACCAGAGTATGTCATTGGGACAGTGGCAGGCGGTACAGGGACGGAAGACACCCACCCCCCCTACAAGCAGACCCAACCCGGCGCCGATGGTTTCGAGTTGCAACACCCGTACGTGCTTGATGCTGGCATCCCAATATCACAGTTAACAGTGTGCCCACACCAGTGGATTAATTTGAGGACCAACAATTGTGCTACAATAATAGTGCCATACATTAACGCACTGCCTTTTGATTCTGCCTTGAACCATTGCAACTTTGGCCTGTTAGTTGTGCCTATTAGCCCACTAGACTACGACCAAGGAGCAACGCCAGTAATCCCTATAACTATCACATTGGCCCCAATGTGCTCTGAATTCGCAGGTCTTAGGCAGGCAGTCACGCAAGGGTTCCCCACCGAGCTAAAACCTGGCACAAATCAATTTTTAACCACCGATGATGGCGTCTCAGCACCTATTCTACCAAACTTCCACCCCACCCCGTGTATCCACATACCTGGTGAAGTTAGGAACTTGCTAGAGTTATGCCAGGTGGAGACCATTCTGGAGGTTAACAATGTGCCCACGAATGCCACTAGCTTAATGGAGAGACTGCGCTTCCCGGTCTCAGCACAAGCAGGGAAAGGTGAACTGTGTGCGGTGTTTAGAGCCGATCCTGGGCGAAATGGACCATGGCAATCCACCTTACTGGGCCAGTTGTGCGGGTACTACACCCAATGGTCAGGGTCATTGGAAGTCACCTTCATGTTTACTGGATCCTTCATGGCTACCGGCAAGATGCTCATAGCCTATACACCGCCAGGGGGTCCTCTGCCCAAGGACCGGGCGACCGCCATGTTGGGCACGCACGTCATCTGGGATTTTGGGCTGCAATCGTCTGTTACCCTTGTAATACCATGGATCAGTAACACTCATTATAGAGCACATGCCCGAGATGGAGTGTTTGACTATTACACTACAGGGTTAGTCAGTATATGGTACCAGACAAATTACGTGGTTCCAATCGGTGCGCCCAACACAGCCTATATAATAGCACTAGCGGCAGCCCAAAAGAACTTCACTATGAAATTGTGCAAGGATGCTAGTGATATCCTGCAGACGGGCACCATCCAGGGAGATAGGGTGGCAGATGTAATTGAAAGTTCCATAGGAGATAGCGTGAGCAGAGCCCTCACTCACGCTCTACCAGCACCCACAGGCCAAAACACACAGGTGAGCAGTCATCGACTGGATACAGGCAAGGTTCCAGCACTCCAAGCTGCTGAAATTGGGGCATCATCAAATGCTAGTGACGAGAGCATGATTGAAACACGTTGTGTTCTTAACTCGCATAGTACAGCTGAGACCACTCTTGATAGTTTCTTCAGTAGGGCAGGATTAGTTGGAGAGATAGATCTCCCTCTTGAGGGCACAACTAACCCAAATGGTTATGCCAACTGGGACATAGATATAACAGGTTACGCGCAAATGCGTAGAAAGGTAGAGCTATTCACCTACATGCGTTTTGATGCAGAGTTCACTTTTGTTGCGTGCACACCCACCGGGGAGGTTGTCCCACAATTGCTCCAATATATGTTTGTGCCACCTGGAGCCCCTAAGCCAGATTCTAGGGAATCCCTTGCATGGCAAACCGCCACCAACCCCTCAGTTTTTGTCAAGCTGTCAGACCCTCCGGCGCAGGTTTCAGTGCCATTCATGTCACCTGCGAGTGCTTATCAATGGTTTTATGACGGATATCCCACATTCGGAGAACACAAACAGGAGAAAGACCTTGAATACGGGGCATGTCCTAATAACATGATGGGTACATTCTCAGTGCGGACTGTGGGGACCTCCAAGTCCAAGTACCCTTTAGTGGTTAGGATTTACATGAGAATGAAGCACGTCAGGGCGTGGATACCTCGCCCGATGCGCAACCAGAACTACCTGTTCAAAGCCAACCCAAATTATGCTGGCAACTCTATTAAGCCAACTGGTGCCAGTCGCACAGCGATCACCACTCTTGGGAAATTTGGACAACAGTCTGGGGCTATTTATGTGGGCAACTTTAGAGTGGTCAACCGACATCTTGCCACCCATAATGATTGGGCAAATCTTGTTTGGGAAGACAGCTCTCGCGACTTGCTCGTGTCATCCACCACTGCCCAAGGTTGTGACACGATTGCCCGTTGCGATTGCCAGACAGGGGTGTACTACTGTAACTCGATGAGAAAACACTACCCAGTCAGTTTTTCAAAACCCAGCCTGATCTATGTAGAGGCTAGCGAGTATTACCCAGCCAGGTACCAATCACATCTCATGCTCGCACAGGGTCACTCGGAACCTGGTGATTGCGGTGGTATCCTTAGGTGCCAACATGGCGTCATCGGCATAGTGTCTACTGGTGGCAATGGGCTCGTTGGCTTTGCAGACGTCAGAGACCTCTTGTGGTTAGATGAAGAAGCTATGGAACAGGGCGTGTCCGACTACATTAAGGGTCTCGGAGATGCTTTTGGAACAGGCTTCACTGACGCAGTCTCAAGGGAGGTTGAAGCTCTCAAGAACTATCTTATAGGGTCTGAAGGAGCAGTTGAGAAAATTTTGAAAAATCTTATTAAACTAATCTCTGCACTGGTGATTGTGATCAGAAGTGATTACGACATGGTTACCCTCACTGCAACCTTAGCGCTGATAGGTTGTCATGGCAGTCCTTGGGCTTGGATTAAAGCCAAAACAGCCTCCATCTTAGGTATCCCTATCGCCCAAAAGCAGAGCGCTTCCTGGCTCAAGAAGTTCAATGACATGGCCAACGCCGCTAAGGGGTTAGAGTGGGTTTCCAACAAGATCAGCAAATTTATTGATTGGCTTAAGGAGAAAATAGTACCAGCAGCCAGGGAGAAGGTTGAATTCCTAAATAACTTGAAACAGCTGCCACTGCTAGAGAATCAGATCTCGAACTTGGAACAATCTGCTGCTTCACAAGAGGACCTTGAAGTCATGTTTGGGAATGTGTCGTACCTAGCTCACTTCTGTCGCAAGTTTCAACCGCTATACGCCACGGAAGCTAAAAGAGTCTATGCCCTGGAGAAGAGAATGAATAACTATATGCAGTTCAAGAGCAAACACCGAATTGAACCTGTATGTCTCATTATTAGGGGCTCACCAGGCACCGGGAAGTCTCTAGCCACTGGTATTATTGCTCGAGCAATCGCTGATAAGTACCACTCCAGCGTGTACTCGCTCCCACCAGACCCGGATCATTTTGACGGTTACAAGCAACAGGTGGTTACAGTGATGGATGATTTGTGTCAAAACCCCGATGGTAAGGATATGTCCTTATTCTGTCAAATGGTATCCACCGTAGATTTCATTCCACCAATGGCTTCTCTCGAGGAGAAGGGAGTTTCCTTCACCTCTAAGTTTGTCATCGCATCCACTAATGCCAGTAATATCATAGTACCAACAGTGTCTGATTCTGACGCTATTCGCCGCAGGTTCTACATGGACTGTGACATTGAAGTGACAGACTCGTACAAAACAGATCTAGGTAGACTGGATGCAGGGCGAGCCGCTAAACTGTGTTCTGAAAATAACACTGCAAATTTCAAACGTTGCAGCCCATTAGTGTGTGGGAAAGCCATCCAACTTAGAGATAGAAAGTCTAAAGTCAGATACAGTGTGGATACGGTGGTTTCAGAACTTATTAGGGAATACAGCAATAGGTCCGCCATTGGTAACACAATCGAGGCTCTTTTCCAAGGTCCACCCAAGTTCAGGCCAATTAGGATTAGCCTTGAAGAAAAACCAGCCCCAGACGCTATTAGCGATCTCCTTGCTAGTGTAGATAGTGAAGAAGTGCGCCAGTACTGCAGGGATCAAGGCTGGATTATTCCTGAAGCTCCCACCAATGTGGAGCGGCACCTTAATAGAGCGGTGCTCGTCATGCAATCCATCACCACAGTAGTGGCGGTTGTTTCGTTGGTGTACGTCATCTACAAGCTCTTTGCAGGGTTTCAGGGTGCATATTCTGGTGCTCCTAAGCAAGTGCTTAAGAAACCTGCTCTTCGCACAGCAACAGTGCAGGGTCCGAGCCTTGACTTTGCTCTCTCCCTACTGAGAAGGAACATCAGGCAGGTCCAAACAGACCAAGGGCATTTCACCATGTTGGGTGTTAGGGATCGCTTAGCAGTCCTCCCACGCCACTCACAACCTGGCAAAACCATTTGGATTGAGCACAAACTCGTGAACGTCCTTGATGCAGTTGAACTGGTGGATGAGCAAGGAGTCAACCTGGAATTAACCCTCATCACTCTTGACACCAACGAGAAGTTTAGGGATATCACCAAATTCATCCCAGAAAATATCAGCACTGCTAGCGATGCCACCCTAGTGATCAACACGGAGCACATGCCGTCAATGTTTGTCCCGGTGGGTGACGTTGTGCAGTATGGCTTTTTGAATCTCAGTGGCAAGCCTACCCATCGCACCATGATGTACAATTTTCCTACTAAAGCAGGACAGTGTGGAGGAGTGGTGACATCTGTTGGGAAGGTTGTCGGTATTCACATTGGTGGCAATGGCAGACAAGGTTTTTGCGCAGGCCTCAAAAGGAGTTACTTTGCTAGTGAACAAGGAGAGATCCAGTGGGTTAAGCCCAATAAAGAAAcTggAAGACTCAACATCAATGGACCAACCCGCACCAAGTTAGAACCTAGTGTATTCCATGACATCTTCGAGGGAAATAAGGAACCAGCTGTCTTGCACAGTAAAGACCCCCGACTTGAGGTAGATTTTGAACAGGCCCTGTTCTCTAAGTATGTGGGAAACACACTACATGAGCCTGACGAGTACATCAAAGAGGCAGCTCTACATTATGCAAACCAATTAAAGCAACTAGAAATCAATACCTCTCAAATGAGCATGGAGGAGGCCTGCTATGGTACTGAGAATCTTGAGGCTATTGATCTTCACACTAGTGCAGGTTACCCCTATAGTGCCCTAGGGATAAAGAAAAGAGACATCTTAGACCCTACCACCAGGGACGTGAGTAGAATGAAGTTCTACATGGACAAGTATGGTCTTGATCTTCCCTACTCCACTTATGTCAAGGACGAGCTACGCTCGATTGATAAAATCAAGAAAGGGAAGTCCCGCCTGATCGAGGCCAGTAGTCTAAATGATTCAGTGTACCTCAGAATGGCTTTCGGGCATTTGTATGAGGCTTTCCACGCAAATCCTGGGACGATAACTGGATCGGCCGTGGGGTGTAACCCTGACACATTCTGGAGCAAGCTGCCAATTTTGCTCCCTGGTTCACTCTTTGCCTTTGACTACTCAGGCTATGATGCCAGCCTTAGCCCTGTCTGGTTCAGAGCATTAGAATTGGTTCTTAGGGAGATAGGGTATAGTGAAGAGGCAATCTCACTCATTGAGGGAATCAACCACACACATCATGTGTATCGTAATAAGACCTATTGCGTGCTTGGTGGGATGCCCTCAGGCTGTTCAGGAACATCCATCTTCAACTCAATGATCAACAACATTATTATCAGAGCACTGCTCATAAAAACATTTAAGGGCATTGATTTGGATGAACTCAACATGGTCGCTTATGGAGACGATGTGCTCGCTAGCTATCCCTTCCCAATTGATTGCTTGGAACTAGCAAAGACTGGTAAGGAGTATGGTCTGACCATGACCCCTGCTGATAAATCTCCTTGCTTTAATGAGGTCAATTGGGGTAATGCGACCTTCCTCAAAAGGGGCTTTTTGCCCGATGAACAGTTTCCATTTTTGATTCACCCTACTATGCCAATGAGGGAGATCCATGAGTCCATTCGATGGACCAAGGACGCACGGAACACTCAAGATCATGTGCGGTCCTTGTGCCTCCTAGCATGGCATAATGGTAAGCAAGAATACGAGAAGTTTGTGAGCACAATTAGGTCTGTCCCAGTAGGGAGAGCGTTGGCTATTCCAAATTATGAAAATCTTAGACGAAATTGGCTCGAGTTATTTTAGAGGTTATACACACCTCAACCCCACCAGAAATCTGGTCGTGAATGTGACTGGTGGGGGTAAATTTGTTATAACCAGAATAGC
核酸序列3,SEQ ID NO 3:
AGCGCTAGCGGAGTGTATACTGGCTTACTATGTTGGCACTGATGAGGGTGTCAGTGAAGTGCTTCATGTGGCAGGAGAAAAAAGGCTGCACCGGTGCGTCAGCAGAATATGTGATACAGGATATATTCCGCTTCCTCGCTCACTGACTCGCTACGCTCGGTCGTTCGACTGCGGCGAGCGGAAATGGCTTACGAACGGGGCGGAGATTTCCTGGAAGATGCCAGGAAGATACTTAACAGGGAAGTGAGAGGGCCGCGGCAAAGCCGTTTTTCCATAGGCTCCGCCCCCCTGACAAGCATCACGAAATCTGACGCTCAAATCAGTGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCTGGCGGCTCCCTCGTGCGCTCTCCTGTTCCTGCCTTTCGGTTTACCGGTGTCATTCCGCTGTTATGGCCGCGTTTGTCTCATTCCACGCCTGACACTCAGTTCCGGGTAGGCAGTTCGCTCCAAGCTGGACTGTATGCACGAACCCCCCGTTCAGTCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGAAAGACATGCAAAAGCACCACTGGCAGCAGCCACTGGTAATTGATTTAGAGGAGTTAGTCTTGAAGTCATGCGCCGGTTAAGGCTAAACTGAAAGGACAAGTTTTGGTGACTGCGCTCCTCCAAGCCAGTTACCTCGGTTCAAAGAGTTGGTAGCTCAGAGAACCTTCGAAAAACCGCCCTGCAAGGCGGTTTTTTCGTTTTCAGAGCAAGAGATTACGCGCAGACCAAAACGATCTCAAGAAGATCATCTTATTAAGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTGCAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAACACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTGTCGACGCGGCCGC
蛋白序列4,SEQ ID NO 4:
MGSQVSTQRSGSYENSNSATEGSTINYTTINYYKDSYAATAGKQSLKQDPDKFANPVKDIFTEMAAPLKSPSAEACGYSDRVAQLTIGNSTITTQEAANIIVGYGEWPSYCSDSDATAVDKPTRPDVSVNRFYTLDTKLWEKSSKGWYWKFPDVLTETGVFGQNAQFHYLYRSGFCIHVQCNASKFHQGALLVAVLPEYVIGTVAGGTGTEDTHPPYKQTQPGADGFELQHPYVLDAGIPISQLTVCPHQWINLRTNNCATIIVPYINALPFDSALNHCNFGLLVVPISPLDYDQGATPVIPITITLAPMCSEFAGLRQAVTQGFPTELKPGTNQFLTTDDGVSAPILPNFHPTPCIHIPGEVRNLLELCQVETILEVNNVPTNATSLMERLRFPVSAQAGKGELCAVFRADPGRNGPWQSTLLGQLCGYYTQWSGSLEVTFMFTGSFMATGKMLIAYTPPGGPLPKDRATAMLGTHVIWDFGLQSSVTLVIPWISNTHYRAHARDGVFDYYTTGLVSIWYQTNYVVPIGAPNTAYIIALAAAQKNFTMKLCKDASDILQTGTIQGDRVADVIESSIGDSVSRALTHALPAPTGQNTQVSSHRLDTGKVPALQAAEIGASSNASDESMIETRCVLNSHSTAETTLDSFFSRAGLVGEIDLPLEGTTNPNGYANWDIDITGYAQMRRKVELFTYMRFDAEFTFVACTPTGEVVPQLLQYMFVPPGAPKPDSRESLAWQTATNPSVFVKLSDPPAQVSVPFMSPASAYQWFYDGYPTFGEHKQEKDLEYGACPNNMMGTFSVRTVGTSKSKYPLVVRIYMRMKHVRAWIPRPMRNQNYLFKANPNYAGNSIKPTGASRTAITTLGKFGQQSGAIYVGNFRVVNRHLATHNDWANLVWEDSSRDLLVSSTTAQGCDTIARCDCQTGVYYCNSMRKHYPVSFSKPSLIYVEASEYYPARYQSHLMLAQGHSEPGDCGGILRCQHGVIGIVSTGGNGLVGFADVRDLLWLDEEAMEQGVSDYIKGLGDAFGTGFTDAVSREVEALKNYLIGSEGAVEKILKNLIKLISALVIVIRSDYDMVTLTATLALIGCHGSPWAWIKAKTASILGIPIAQKQSASWLKKFNDMANAAKGLEWVSNKISKFIDWLKEKIVPAAREKVEFLNNLKQLPLLENQISNLEQSAASQEDLEVMFGNVSYLAHFCRKFQPLYATEAKRVYALEKRMNNYMQFKSKHRIEPVCLIIRGSPGTGKSLATGIIARAIADKYHSSVYSLPPDPDHFDGYKQQVVTVMDDLCQNPDGKDMSLFCQMVSTVDFIPPMASLEEKGVSFTSKFVIASTNASNIIVPTVSDSDAIRRRFYMDCDIEVTDSYKTDLGRLDAGRAAKLCSENNTANFKRCSPLVCGKAIQLRDRKSKVRYSVDTVVSELIREYSNRSAIGNTIEALFQGPPKFRPIRISLEEKPAPDAISDLLASVDSEEVRQYCRDQGWIIPEAPTNVERHLNRAVLVMQSITTVVAVVSLVYVIYKLFAGFQGAYSGAPKQVLKKPALRTATVQGPSLDFALSLLRRNIRQVQTDQGHFTMLGVRDRLAVLPRHSQPGKTIWIEHKLVNVLDAVELVDEQGVNLELTLITLDTNEKFRDITKFIPENISTASDATLVINTEHMPSMFVPVGDVVQYGFLNLSGKPTHRTMMYNFPTKAGQCGGVVTSVGKVVGIHIGGNGRQGFCAGLKRSYFASEQGEIQWVKPNKETGRLNINGPTRTKLEPSVFHDIFEGNKEPAVLHSKDPRLEVDFEQALFSKYVGNTLHEPDEYIKEAALHYANQLKQLEINTSQMSMEEACYGTENLEAIDLHTSAGYPYSALGIKKRDILDPTTRDVSRMKFYMDKYGLDLPYSTYVKDELRSIDKIKKGKSRLIEASSLNDSVYLRMAFGHLYEAFHANPGTITGSAVGCNPDTFWSKLPILLPGSLFAFDYSGYDASLSPVWFRALELVLREIGYSEEAISLIEGINHTHHVYRNKTYCVLGGMPSGCSGTSIFNSMINNIIIRALLIKTFKGIDLDELNMVAYGDDVLASYPFPIDCLELAKTGKEYGLTMTPADKSPCFNEVNWGNATFLKRGFLPDEQFPFLIHPTMPMREIHESIRWTKDARNTQDHVRSLCLLAWHNGKQEYEKFVSTIRSVPVGRALAIPNYENLRRNWLELF
核酸序列5,SEQ ID NO 5:
GCTAGCGGAGTGTATACTGGCTTACTATGTTGGCACTGATGAGGGTGTCAGTGAAGTGCTTCATGTGGCAGGAGAAAAAAGGCTGCACCGGTGCGTCAGCAGAATATGTGATACAGGATATATTCCGCTTCCTCGCTCACTGACTCGCTACGCTCGGTCGTTCGACTGCGGCGAGCGGAAATGGCTTACGAACGGGGCGGAGATTTCCTGGAAGATGCCAGGAAGATACTTAACAGGGAAGTGAGAGGGCCGCGGCAAAGCCGTTTTTCCATAGGCTCCGCCCCCCTGACAAGCATCACGAAATCTGACGCTCAAATCAGTGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCTGGCGGCTCCCTCGTGCGCTCTCCTGTTCCTGCCTTTCGGTTTACCGGTGTCATTCCGCTGTTATGGCCGCGTTTGTCTCATTCCACGCCTGACACTCAGTTCCGGGTAGGCAGTTCGCTCCAAGCTGGACTGTATGCACGAACCCCCCGTTCAGTCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGAAAGACATGCAAAAGCACCACTGGCAGCAGCCACTGGTAATTGATTTAGAGGAGTTAGTCTTGAAGTCATGCGCCGGTTAAGGCTAAACTGAAAGGACAAGTTTTGGTGACTGCGCTCCTCCAAGCCAGTTACCTCGGTTCAAAGAGTTGGTAGCTCAGAGAACCTTCGAAAAACCGCCCTGCAAGGCGGTTTTTTCGTTTTCAGAGCAAGAGATTACGCGCAGACCAAAACGATCTCAAGAAGATCATCTTATTAAGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTGCAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAACACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTGTCGACGCGGCCGCTAATACGACTCACTATAGGTTAAAACAGCCTGTGGGTTGCACCCACTCACAGGGCCTACTGGGCGCAAGCACTCTGGTACCTCGGTACCTTTGTGCGCCTGTTTTACACCCCCCCCCCAATGAAACTTAGAAGCAATAAACCACGATCAATAGCAGGCATAACGCTCCAGTTATGTCTTGATCAAGCACTTCTGTTTCCCCGGACTGAGTATCAATAGACTGCTCGCGCGGTTGAAGGAGAAAACGTTCGTTATCCGGCTAACTACTTCGGAAAACCTAGTAACACCATGAAAGTTGCGGAGAGCTTCGTTCAGCACTCCCCCAGTGTAGATCAGGTCGATGAGTCACCGCGTTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGTAACCCATGGGGCGCTCTAATACGGACATGGTGTGAAGAGTCTACTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCCAACTGCGGAGCACACGCCCACAAGCCAGCGGGTAGTGTGTCGTAACGGGTAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCCTTTTATCTTTATATTGGCTGCTTATGGTGACAATTAAAGAATTGTTACCATATAGCTATTGGATTAGCCATCCGGTGTGCAACAGAGCAATTATTTACCTATTTATTGGTTTTGTACCATTAACCTCGAATTCTGTGACCACCCTTAATTATATCTTGACCCTTAACACAGCTAAACtctagaatggtcttcacactcgaagatttcgttggggactggcgacagacagccggctacaacctggaccaagtccttgaacagggaggtgtgtccagtttgtttcagaatctcggggtgtccgtaactccgatccaaaggattgtcctgagcggtgaaaatgggctgaagatcgacatccatgtcatcatcccgtatgaaggtctgagcggcgaccaaatgggccagatcgaaaaaatttttaaggtggtgtaccctgtggatgatcatcactttaaggtgatcctgcactatggcacactggtaatcgacggggttacgccgaacatgatcgactatttcggacggccgtatgaaggcatcgccgtgttcgacggcaaaaagatcactgtaacagggaccctgtggaacggcaacaaaattatcgacgagcgcctgatcaaccccgacggctccctgctgttccgagtaaccatcaacggagtgaccggctggcggctgtgcgaacgcattctggcgatgcatGCGATCACCACTCTTGGTTCGCAAGTGTCTACACAGCGCTCCGGTTCTTACGAAAACTCAAACTCAGCCACTGAGGGTTCTACCATAAACTACACCACCATTAATTACTACAAAGACTCCTATGCTGCCACAGCAGGCAAaCAGAGTCTCAAGCAGGATCCAGACAAGTTTGCAAATCCTGTTAAAGACATATTCACcGAAATGGCAGCGCCACTGAAGTCCCCATCCGCTGAGGCATGTGGATACAGTGATCGAGTGGCGCAATTAACTATTGGCAACTCCACCATCACGACGCAAGAAGCGGCTAACATCATAGTCGGCTATGGTGAGTGGCCTTCCTACTGCTCAGATTCTGACGCTACAGCAGTGGATAAACCAACGCGCCCGGATGTTTCAGTGAACAGGTTTTACACATTGGACACTAAATTGTGGGAGAAATCGTCCAAGGGATGGTACTGGAAGTTCCCGGATGTGTTAACTGAAACTGGGGTTTTTGGGCAAAATGCACAATTCCACTACCTCTACCGATCAGGGTTCTGCATCCACGTGCAGTGCAATGCCAGTAAATTCCACCAAGGAgCACTcCtAgTCGCTGTCCTACCAGAGTATGTCATTGGGACAGTGGCAGGCGGTACAGGGACGGAAGACACCCACCCCCCCTACAAGCAGACCCAACCCGGCGCCGATGGTTTCGAGTTGCAACACCCGTACGTGCTTGATGCTGGCATCCCAATATCACAGTTAACAGTGTGCCCACACCAGTGGATTAATTTGAGGACCAACAATTGTGCTACAATAATAGTGCCATACATTAACGCACTGCCTTTTGATTCTGCCTTGAACCATTGCAACTTTGGCCTGTTAGTTGTGCCTATTAGCCCACTAGACTACGACCAAGGAGCAACGCCAGTAATCCCTATAACTATCACATTGGCCCCAATGTGCTCTGAATTCGCAGGTCTTAGGCAGGCAGTCACGCAAGGGTTCCCCACCGAGCTAAAACCTGGCACAAATCAATTTTTAACCACCGATGATGGCGTCTCAGCACCTATTCTACCAAACTTCCACCCCACCCCGTGTATCCACATACCTGGTGAAGTTAGGAACTTGCTAGAGTTATGCCAGGTGGAGACCATTCTGGAGGTTAACAATGTGCCCACGAATGCCACTAGCTTAATGGAGAGACTGCGCTTCCCGGTCTCAGCACAAGCAGGGAAAGGTGAACTGTGTGCGGTGTTTAGAGCCGATCCTGGGCGAAATGGACCATGGCAATCCACCTTACTGGGCCAGTTGTGCGGGTACTACACCCAATGGTCAGGGTCATTGGAAGTCACCTTCATGTTTACTGGATCCTTCATGGCTACCGGCAAGATGCTCATAGCCTATACACCGCCAGGGGGTCCTCTGCCCAAGGACCGGGCGACCGCCATGTTGGGCACGCACGTCATCTGGGATTTTGGGCTGCAATCGTCTGTTACCCTTGTAATACCATGGATCAGTAACACTCATTATAGAGCACATGCCCGAGATGGAGTGTTTGACTATTACACTACAGGGTTAGTCAGTATATGGTACCAGACAAATTACGTGGTTCCAATCGGTGCGCCCAACACAGCCTATATAATAGCACTAGCGGCAGCCCAAAAGAACTTCACTATGAAATTGTGCAAGGATGCTAGTGATATCCTGCAGACGGGCACCATCCAGGGAGATAGGGTGGCAGATGTAATTGAAAGTTCCATAGGAGATAGCGTGAGCAGAGCCCTCACTCACGCTCTACCAGCACCCACAGGCCAAAACACACAGGTGAGCAGTCATCGACTGGATACAGGCAAGGTTCCAGCACTCCAAGCTGCTGAAATTGGGGCATCATCAAATGCTAGTGACGAGAGCATGATTGAAACACGTTGTGTTCTTAACTCGCATAGTACAGCTGAGACCACTCTTGATAGTTTCTTCAGTAGGGCAGGATTAGTTGGAGAGATAGATCTCCCTCTTGAGGGCACAACTAACCCAAATGGTTATGCCAACTGGGACATAGATATAACAGGTTACGCGCAAATGCGTAGAAAGGTAGAGCTATTCACCTACATGCGTTTTGATGCAGAGTTCACTTTTGTTGCGTGCACACCCACCGGGGAGGTTGTCCCACAATTGCTCCAATATATGTTTGTGCCACCTGGAGCCCCTAAGCCAGATTCTAGGGAATCCCTTGCATGGCAAACCGCCACCAACCCCTCAGTTTTTGTCAAGCTGTCAGACCCTCCGGCGCAGGTTTCAGTGCCATTCATGTCACCTGCGAGTGCTTATCAATGGTTTTATGACGGATATCCCACATTCGGAGAACACAAACAGGAGAAAGACCTTGAATACGGGGCATGTCCTAATAACATGATGGGTACATTCTCAGTGCGGACTGTGGGGACCTCCAAGTCCAAGTACCCTTTAGTGGTTAGGATTTACATGAGAATGAAGCACGTCAGGGCGTGGATACCTCGCCCGATGCGCAACCAGAACTACCTGTTCAAAGCCAACCCAAATTATGCTGGCAACTCTATTAAGCCAACTGGTGCCAGTCGCACAGCGATCACCACTCTTGGGAAATTTGGACAACAGTCTGGGGCTATTTATGTGGGCAACTTTAGAGTGGTCAACCGACATCTTGCCACCCATAATGATTGGGCAAATCTTGTTTGGGAAGACAGCTCTCGCGACTTGCTCGTGTCATCCACCACTGCCCAAGGTTGTGACACGATTGCCCGTTGCGATTGCCAGACAGGGGTGTACTACTGTAACTCGATGAGAAAACACTACCCAGTCAGTTTTTCAAAACCCAGCCTGATCTATGTAGAGGCTAGCGAGTATTACCCAGCCAGGTACCAATCACATCTCATGCTCGCACAGGGTCACTCGGAACCTGGTGATTGCGGTGGTATCCTTAGGTGCCAACATGGCGTCATCGGCATAGTGTCTACTGGTGGCAATGGGCTCGTTGGCTTTGCAGACGTCAGAGACCTCTTGTGGTTAGATGAAGAAGCTATGGAACAGGGCGTGTCCGACTACATTAAGGGTCTCGGAGATGCTTTTGGAACAGGCTTCACTGACGCAGTCTCAAGGGAGGTTGAAGCTCTCAAGAACTATCTTATAGGGTCTGAAGGAGCAGTTGAGAAAATTTTGAAAAATCTTATTAAACTAATCTCTGCACTGGTGATTGTGATCAGAAGTGATTACGACATGGTTACCCTCACTGCAACCTTAGCGCTGATAGGTTGTCATGGCAGTCCTTGGGCTTGGATTAAAGCCAAAACAGCCTCCATCTTAGGTATCCCTATCGCCCAAAAGCAGAGCGCTTCCTGGCTCAAGAAGTTCAATGACATGGCCAACGCCGCTAAGGGGTTAGAGTGGGTTTCCAACAAGATCAGCAAATTTATTGATTGGCTTAAGGAGAAAATAGTACCAGCAGCCAGGGAGAAGGTTGAATTCCTAAATAACTTGAAACAGCTGCCACTGCTAGAGAATCAGATCTCGAACTTGGAACAATCTGCTGCTTCACAAGAGGACCTTGAAGTCATGTTTGGGAATGTGTCGTACCTAGCTCACTTCTGTCGCAAGTTTCAACCGCTATACGCCACGGAAGCTAAAAGAGTCTATGCCCTGGAGAAGAGAATGAATAACTATATGCAGTTCAAGAGCAAACACCGAATTGAACCTGTATGTCTCATTATTAGGGGCTCACCAGGCACCGGGAAGTCTCTAGCCACTGGTATTATTGCTCGAGCAATCGCTGATAAGTACCACTCCAGCGTGTACTCGCTCCCACCAGACCCGGATCATTTTGACGGTTACAAGCAACAGGTGGTTACAGTGATGGATGATTTGTGTCAAAACCCCGATGGTAAGGATATGTCCTTATTCTGTCAAATGGTATCCACCGTAGATTTCATTCCACCAATGGCTTCTCTCGAGGAGAAGGGAGTTTCCTTCACCTCTAAGTTTGTCATCGCATCCACTAATGCCAGTAATATCATAGTACCAACAGTGTCTGATTCTGACGCTATTCGCCGCAGGTTCTACATGGACTGTGACATTGAAGTGACAGACTCGTACAAAACAGATCTAGGTAGACTGGATGCAGGGCGAGCCGCTAAACTGTGTTCTGAAAATAACACTGCAAATTTCAAACGTTGCAGCCCATTAGTGTGTGGGAAAGCCATCCAACTTAGAGATAGAAAGTCTAAAGTCAGATACAGTGTGGATACGGTGGTTTCAGAACTTATTAGGGAATACAGCAATAGGTCCGCCATTGGTAACACAATCGAGGCTCTTTTCCAAGGTCCACCCAAGTTCAGGCCAATTAGGATTAGCCTTGAAGAAAAACCAGCCCCAGACGCTATTAGCGATCTCCTTGCTAGTGTAGATAGTGAAGAAGTGCGCCAGTACTGCAGGGATCAAGGCTGGATTATTCCTGAAGCTCCCACCAATGTGGAGCGGCACCTTAATAGAGCGGTGCTCGTCATGCAATCCATCACCACAGTAGTGGCGGTTGTTTCGTTGGTGTACGTCATCTACAAGCTCTTTGCAGGGTTTCAGGGTGCATATTCTGGTGCTCCTAAGCAAGTGCTTAAGAAACCTGCTCTTCGCACAGCAACAGTGCAGGGTCCGAGCCTTGACTTTGCTCTCTCCCTACTGAGAAGGAACATCAGGCAGGTCCAAACAGACCAAGGGCATTTCACCATGTTGGGTGTTAGGGATCGCTTAGCAGTCCTCCCACGCCACTCACAACCTGGCAAAACCATTTGGATTGAGCACAAACTCGTGAACGTCCTTGATGCAGTTGAACTGGTGGATGAGCAAGGAGTCAACCTGGAATTAACCCTCATCACTCTTGACACCAACGAGAAGTTTAGGGATATCACCAAATTCATCCCAGAAAATATCAGCACTGCTAGCGATGCCACCCTAGTGATCAACACGGAGCACATGCCGTCAATGTTTGTCCCGGTGGGTGACGTTGTGCAGTATGGCTTTTTGAATCTCAGTGGCAAGCCTACCCATCGCACCATGATGTACAATTTTCCTACTAAAGCAGGACAGTGTGGAGGAGTGGTGACATCTGTTGGGAAGGTTGTCGGTATTCACATTGGTGGCAATGGCAGACAAGGTTTTTGCGCAGGCCTCAAAAGGAGTTACTTTGCTAGTGAACAAGGAGAGATCCAGTGGGTTAAGCCCAATAAAGAAAcTggAAGACTCAACATCAATGGACCAACCCGCACCAAGTTAGAACCTAGTGTATTCCATGACATCTTCGAGGGAAATAAGGAACCAGCTGTCTTGCACAGTAAAGACCCCCGACTTGAGGTAGATTTTGAACAGGCCCTGTTCTCTAAGTATGTGGGAAACACACTACATGAGCCTGACGAGTACATCAAAGAGGCAGCTCTACATTATGCAAACCAATTAAAGCAACTAGAAATCAATACCTCTCAAATGAGCATGGAGGAGGCCTGCTATGGTACTGAGAATCTTGAGGCTATTGATCTTCACACTAGTGCAGGTTACCCCTATAGTGCCCTAGGGATAAAGAAAAGAGACATCTTAGACCCTACCACCAGGGACGTGAGTAGAATGAAGTTCTACATGGACAAGTATGGTCTTGATCTTCCCTACTCCACTTATGTCAAGGACGAGCTACGCTCGATTGATAAAATCAAGAAAGGGAAGTCCCGCCTGATCGAGGCCAGTAGTCTAAATGATTCAGTGTACCTCAGAATGGCTTTCGGGCATTTGTATGAGGCTTTCCACGCAAATCCTGGGACGATAACTGGATCGGCCGTGGGGTGTAACCCTGACACATTCTGGAGCAAGCTGCCAATTTTGCTCCCTGGTTCACTCTTTGCCTTTGACTACTCAGGCTATGATGCCAGCCTTAGCCCTGTCTGGTTCAGAGCATTAGAATTGGTTCTTAGGGAGATAGGGTATAGTGAAGAGGCAATCTCACTCATTGAGGGAATCAACCACACACATCATGTGTATCGTAATAAGACCTATTGCGTGCTTGGTGGGATGCCCTCAGGCTGTTCAGGAACATCCATCTTCAACTCAATGATCAACAACATTATTATCAGAGCACTGCTCATAAAAACATTTAAGGGCATTGATTTGGATGAACTCAACATGGTCGCTTATGGAGACGATGTGCTCGCTAGCTATCCCTTCCCAATTGATTGCTTGGAACTAGCAAAGACTGGTAAGGAGTATGGTCTGACCATGACCCCTGCTGATAAATCTCCTTGCTTTAATGAGGTCAATTGGGGTAATGCGACCTTCCTCAAAAGGGGCTTTTTGCCCGATGAACAGTTTCCATTTTTGATTCACCCTACTATGCCAATGAGGGAGATCCATGAGTCCATTCGATGGACCAAGGACGCACGGAACACTCAAGATCATGTGCGGTCCTTGTGCCTCCTAGCATGGCATAATGGTAAGCAAGAATACGAGAAGTTTGTGAGCACAATTAGGTCTGTCCCAGTAGGGAGAGCGTTGGCTATTCCAAATTATGAAAATCTTAGACGAAATTGGCTCGAGTTATTTTAGAGGTTATACACACCTCAACCCCACCAGAAATCTGGTCGTGAATGTGACTGGTGGGGGTAAATTTGTTATAACCAGAATAGCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAaagcttat
核酸序列6,SEQ ID NO 6:
GCTAGCGGAGTGTATACTGGCTTACTATGTTGGCACTGATGAGGGTGTCAGTGAAGTGCTTCATGTGGCAGGAGAAAAAAGGCTGCACCGGTGCGTCAGCAGAATATGTGATACAGGATATATTCCGCTTCCTCGCTCACTGACTCGCTACGCTCGGTCGTTCGACTGCGGCGAGCGGAAATGGCTTACGAACGGGGCGGAGATTTCCTGGAAGATGCCAGGAAGATACTTAACAGGGAAGTGAGAGGGCCGCGGCAAAGCCGTTTTTCCATAGGCTCCGCCCCCCTGACAAGCATCACGAAATCTGACGCTCAAATCAGTGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCTGGCGGCTCCCTCGTGCGCTCTCCTGTTCCTGCCTTTCGGTTTACCGGTGTCATTCCGCTGTTATGGCCGCGTTTGTCTCATTCCACGCCTGACACTCAGTTCCGGGTAGGCAGTTCGCTCCAAGCTGGACTGTATGCACGAACCCCCCGTTCAGTCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGAAAGACATGCAAAAGCACCACTGGCAGCAGCCACTGGTAATTGATTTAGAGGAGTTAGTCTTGAAGTCATGCGCCGGTTAAGGCTAAACTGAAAGGACAAGTTTTGGTGACTGCGCTCCTCCAAGCCAGTTACCTCGGTTCAAAGAGTTGGTAGCTCAGAGAACCTTCGAAAAACCGCCCTGCAAGGCGGTTTTTTCGTTTTCAGAGCAAGAGATTACGCGCAGACCAAAACGATCTCAAGAAGATCATCTTATTAAGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTGCAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAACACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTGTCGACGCGGCCGCTAATACGACTCACTATAGGTTAAAACAGCCTGTGGGTTGCACCCACTCACAGGGCCTACTGGGCGCAAGCACTCTGGTACCTCGGTACCTTTGTGCGCCTGTTTTACACCCCCCCCCCAATGAAACTTAGAAGCAATAAACCACGATCAATAGCAGGCATAACGCTCCAGTTATGTCTTGATCAAGCACTTCTGTTTCCCCGGACTGAGTATCAATAGACTGCTCGCGCGGTTGAAGGAGAAAACGTTCGTTATCCGGCTAACTACTTCGGAAAACCTAGTAACACCATGAAAGTTGCGGAGAGCTTCGTTCAGCACTCCCCCAGTGTAGATCAGGTCGATGAGTCACCGCGTTCCCCACGGGCGACCGTGGCGGTGGCTGCGTTGGCGGCCTGCCCATGGGGTAACCCATGGGGCGCTCTAATACGGACATGGTGTGAAGAGTCTACTGAGCTAGTTGGTAGTCCTCCGGCCCCTGAATGCGGCTAATCCCAACTGCGGAGCACACGCCCACAAGCCAGCGGGTAGTGTGTCGTAACGGGTAACTCTGCAGCGGAACCGACTACTTTGGGTGTCCGTGTTTCCTTTTATCTTTATATTGGCTGCTTATGGTGACAATTAAAGAATTGTTACCATATAGCTATTGGATTAGCCATCCGGTGTGCAACAGAGCAATTATTTACCTATTTATTGGTTTTGTACCATTAACCTCGAATTCTGTGACCACCCTTAATTATATCTTGACCCTTAACACAGCTAAACcatatgATGgtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagatgcatGCGATCACCACTCTTGGTTCGCAAGTGTCTACACAGCGCTCCGGTTCTTACGAAAACTCAAACTCAGCCACTGAGGGTTCTACCATAAACTACACCACCATTAATTACTACAAAGACTCCTATGCTGCCACAGCAGGCAAaCAGAGTCTCAAGCAGGATCCAGACAAGTTTGCAAATCCTGTTAAAGACATATTCACcGAAATGGCAGCGCCACTGAAGTCCCCATCCGCTGAGGCATGTGGATACAGTGATCGAGTGGCGCAATTAACTATTGGCAACTCCACCATCACGACGCAAGAAGCGGCTAACATCATAGTCGGCTATGGTGAGTGGCCTTCCTACTGCTCAGATTCTGACGCTACAGCAGTGGATAAACCAACGCGCCCGGATGTTTCAGTGAACAGGTTTTACACATTGGACACTAAATTGTGGGAGAAATCGTCCAAGGGATGGTACTGGAAGTTCCCGGATGTGTTAACTGAAACTGGGGTTTTTGGGCAAAATGCACAATTCCACTACCTCTACCGATCAGGGTTCTGCATCCACGTGCAGTGCAATGCCAGTAAATTCCACCAAGGAgCACTcCtAgTCGCTGTCCTACCAGAGTATGTCATTGGGACAGTGGCAGGCGGTACAGGGACGGAAGACACCCACCCCCCCTACAAGCAGACCCAACCCGGCGCCGATGGTTTCGAGTTGCAACACCCGTACGTGCTTGATGCTGGCATCCCAATATCACAGTTAACAGTGTGCCCACACCAGTGGATTAATTTGAGGACCAACAATTGTGCTACAATAATAGTGCCATACATTAACGCACTGCCTTTTGATTCTGCCTTGAACCATTGCAACTTTGGCCTGTTAGTTGTGCCTATTAGCCCACTAGACTACGACCAAGGAGCAACGCCAGTAATCCCTATAACTATCACATTGGCCCCAATGTGCTCTGAATTCGCAGGTCTTAGGCAGGCAGTCACGCAAGGGTTCCCCACCGAGCTAAAACCTGGCACAAATCAATTTTTAACCACCGATGATGGCGTCTCAGCACCTATTCTACCAAACTTCCACCCCACCCCGTGTATCCACATACCTGGTGAAGTTAGGAACTTGCTAGAGTTATGCCAGGTGGAGACCATTCTGGAGGTTAACAATGTGCCCACGAATGCCACTAGCTTAATGGAGAGACTGCGCTTCCCGGTCTCAGCACAAGCAGGGAAAGGTGAACTGTGTGCGGTGTTTAGAGCCGATCCTGGGCGAAATGGACCATGGCAATCCACCTTACTGGGCCAGTTGTGCGGGTACTACACCCAATGGTCAGGGTCATTGGAAGTCACCTTCATGTTTACTGGATCCTTCATGGCTACCGGCAAGATGCTCATAGCCTATACACCGCCAGGGGGTCCTCTGCCCAAGGACCGGGCGACCGCCATGTTGGGCACGCACGTCATCTGGGATTTTGGGCTGCAATCGTCTGTTACCCTTGTAATACCATGGATCAGTAACACTCATTATAGAGCACATGCCCGAGATGGAGTGTTTGACTATTACACTACAGGGTTAGTCAGTATATGGTACCAGACAAATTACGTGGTTCCAATCGGTGCGCCCAACACAGCCTATATAATAGCACTAGCGGCAGCCCAAAAGAACTTCACTATGAAATTGTGCAAGGATGCTAGTGATATCCTGCAGACGGGCACCATCCAGGGAGATAGGGTGGCAGATGTAATTGAAAGTTCCATAGGAGATAGCGTGAGCAGAGCCCTCACTCACGCTCTACCAGCACCCACAGGCCAAAACACACAGGTGAGCAGTCATCGACTGGATACAGGCAAGGTTCCAGCACTCCAAGCTGCTGAAATTGGGGCATCATCAAATGCTAGTGACGAGAGCATGATTGAAACACGTTGTGTTCTTAACTCGCATAGTACAGCTGAGACCACTCTTGATAGTTTCTTCAGTAGGGCAGGATTAGTTGGAGAGATAGATCTCCCTCTTGAGGGCACAACTAACCCAAATGGTTATGCCAACTGGGACATAGATATAACAGGTTACGCGCAAATGCGTAGAAAGGTAGAGCTATTCACCTACATGCGTTTTGATGCAGAGTTCACTTTTGTTGCGTGCACACCCACCGGGGAGGTTGTCCCACAATTGCTCCAATATATGTTTGTGCCACCTGGAGCCCCTAAGCCAGATTCTAGGGAATCCCTTGCATGGCAAACCGCCACCAACCCCTCAGTTTTTGTCAAGCTGTCAGACCCTCCGGCGCAGGTTTCAGTGCCATTCATGTCACCTGCGAGTGCTTATCAATGGTTTTATGACGGATATCCCACATTCGGAGAACACAAACAGGAGAAAGACCTTGAATACGGGGCATGTCCTAATAACATGATGGGTACATTCTCAGTGCGGACTGTGGGGACCTCCAAGTCCAAGTACCCTTTAGTGGTTAGGATTTACATGAGAATGAAGCACGTCAGGGCGTGGATACCTCGCCCGATGCGCAACCAGAACTACCTGTTCAAAGCCAACCCAAATTATGCTGGCAACTCTATTAAGCCAACTGGTGCCAGTCGCACAGCGATCACCACTCTTGGGAAATTTGGACAACAGTCTGGGGCTATTTATGTGGGCAACTTTAGAGTGGTCAACCGACATCTTGCCACCCATAATGATTGGGCAAATCTTGTTTGGGAAGACAGCTCTCGCGACTTGCTCGTGTCATCCACCACTGCCCAAGGTTGTGACACGATTGCCCGTTGCGATTGCCAGACAGGGGTGTACTACTGTAACTCGATGAGAAAACACTACCCAGTCAGTTTTTCAAAACCCAGCCTGATCTATGTAGAGGCTAGCGAGTATTACCCAGCCAGGTACCAATCACATCTCATGCTCGCACAGGGTCACTCGGAACCTGGTGATTGCGGTGGTATCCTTAGGTGCCAACATGGCGTCATCGGCATAGTGTCTACTGGTGGCAATGGGCTCGTTGGCTTTGCAGACGTCAGAGACCTCTTGTGGTTAGATGAAGAAGCTATGGAACAGGGCGTGTCCGACTACATTAAGGGTCTCGGAGATGCTTTTGGAACAGGCTTCACTGACGCAGTCTCAAGGGAGGTTGAAGCTCTCAAGAACTATCTTATAGGGTCTGAAGGAGCAGTTGAGAAAATTTTGAAAAATCTTATTAAACTAATCTCTGCACTGGTGATTGTGATCAGAAGTGATTACGACATGGTTACCCTCACTGCAACCTTAGCGCTGATAGGTTGTCATGGCAGTCCTTGGGCTTGGATTAAAGCCAAAACAGCCTCCATCTTAGGTATCCCTATCGCCCAAAAGCAGAGCGCTTCCTGGCTCAAGAAGTTCAATGACATGGCCAACGCCGCTAAGGGGTTAGAGTGGGTTTCCAACAAGATCAGCAAATTTATTGATTGGCTTAAGGAGAAAATAGTACCAGCAGCCAGGGAGAAGGTTGAATTCCTAAATAACTTGAAACAGCTGCCACTGCTAGAGAATCAGATCTCGAACTTGGAACAATCTGCTGCTTCACAAGAGGACCTTGAAGTCATGTTTGGGAATGTGTCGTACCTAGCTCACTTCTGTCGCAAGTTTCAACCGCTATACGCCACGGAAGCTAAAAGAGTCTATGCCCTGGAGAAGAGAATGAATAACTATATGCAGTTCAAGAGCAAACACCGAATTGAACCTGTATGTCTCATTATTAGGGGCTCACCAGGCACCGGGAAGTCTCTAGCCACTGGTATTATTGCTCGAGCAATCGCTGATAAGTACCACTCCAGCGTGTACTCGCTCCCACCAGACCCGGATCATTTTGACGGTTACAAGCAACAGGTGGTTACAGTGATGGATGATTTGTGTCAAAACCCCGATGGTAAGGATATGTCCTTATTCTGTCAAATGGTATCCACCGTAGATTTCATTCCACCAATGGCTTCTCTCGAGGAGAAGGGAGTTTCCTTCACCTCTAAGTTTGTCATCGCATCCACTAATGCCAGTAATATCATAGTACCAACAGTGTCTGATTCTGACGCTATTCGCCGCAGGTTCTACATGGACTGTGACATTGAAGTGACAGACTCGTACAAAACAGATCTAGGTAGACTGGATGCAGGGCGAGCCGCTAAACTGTGTTCTGAAAATAACACTGCAAATTTCAAACGTTGCAGCCCATTAGTGTGTGGGAAAGCCATCCAACTTAGAGATAGAAAGTCTAAAGTCAGATACAGTGTGGATACGGTGGTTTCAGAACTTATTAGGGAATACAGCAATAGGTCCGCCATTGGTAACACAATCGAGGCTCTTTTCCAAGGTCCACCCAAGTTCAGGCCAATTAGGATTAGCCTTGAAGAAAAACCAGCCCCAGACGCTATTAGCGATCTCCTTGCTAGTGTAGATAGTGAAGAAGTGCGCCAGTACTGCAGGGATCAAGGCTGGATTATTCCTGAAGCTCCCACCAATGTGGAGCGGCACCTTAATAGAGCGGTGCTCGTCATGCAATCCATCACCACAGTAGTGGCGGTTGTTTCGTTGGTGTACGTCATCTACAAGCTCTTTGCAGGGTTTCAGGGTGCATATTCTGGTGCTCCTAAGCAAGTGCTTAAGAAACCTGCTCTTCGCACAGCAACAGTGCAGGGTCCGAGCCTTGACTTTGCTCTCTCCCTACTGAGAAGGAACATCAGGCAGGTCCAAACAGACCAAGGGCATTTCACCATGTTGGGTGTTAGGGATCGCTTAGCAGTCCTCCCACGCCACTCACAACCTGGCAAAACCATTTGGATTGAGCACAAACTCGTGAACGTCCTTGATGCAGTTGAACTGGTGGATGAGCAAGGAGTCAACCTGGAATTAACCCTCATCACTCTTGACACCAACGAGAAGTTTAGGGATATCACCAAATTCATCCCAGAAAATATCAGCACTGCTAGCGATGCCACCCTAGTGATCAACACGGAGCACATGCCGTCAATGTTTGTCCCGGTGGGTGACGTTGTGCAGTATGGCTTTTTGAATCTCAGTGGCAAGCCTACCCATCGCACCATGATGTACAATTTTCCTACTAAAGCAGGACAGTGTGGAGGAGTGGTGACATCTGTTGGGAAGGTTGTCGGTATTCACATTGGTGGCAATGGCAGACAAGGTTTTTGCGCAGGCCTCAAAAGGAGTTACTTTGCTAGTGAACAAGGAGAGATCCAGTGGGTTAAGCCCAATAAAGAAAcTggAAGACTCAACATCAATGGACCAACCCGCACCAAGTTAGAACCTAGTGTATTCCATGACATCTTCGAGGGAAATAAGGAACCAGCTGTCTTGCACAGTAAAGACCCCCGACTTGAGGTAGATTTTGAACAGGCCCTGTTCTCTAAGTATGTGGGAAACACACTACATGAGCCTGACGAGTACATCAAAGAGGCAGCTCTACATTATGCAAACCAATTAAAGCAACTAGAAATCAATACCTCTCAAATGAGCATGGAGGAGGCCTGCTATGGTACTGAGAATCTTGAGGCTATTGATCTTCACACTAGTGCAGGTTACCCCTATAGTGCCCTAGGGATAAAGAAAAGAGACATCTTAGACCCTACCACCAGGGACGTGAGTAGAATGAAGTTCTACATGGACAAGTATGGTCTTGATCTTCCCTACTCCACTTATGTCAAGGACGAGCTACGCTCGATTGATAAAATCAAGAAAGGGAAGTCCCGCCTGATCGAGGCCAGTAGTCTAAATGATTCAGTGTACCTCAGAATGGCTTTCGGGCATTTGTATGAGGCTTTCCACGCAAATCCTGGGACGATAACTGGATCGGCCGTGGGGTGTAACCCTGACACATTCTGGAGCAAGCTGCCAATTTTGCTCCCTGGTTCACTCTTTGCCTTTGACTACTCAGGCTATGATGCCAGCCTTAGCCCTGTCTGGTTCAGAGCATTAGAATTGGTTCTTAGGGAGATAGGGTATAGTGAAGAGGCAATCTCACTCATTGAGGGAATCAACCACACACATCATGTGTATCGTAATAAGACCTATTGCGTGCTTGGTGGGATGCCCTCAGGCTGTTCAGGAACATCCATCTTCAACTCAATGATCAACAACATTATTATCAGAGCACTGCTCATAAAAACATTTAAGGGCATTGATTTGGATGAACTCAACATGGTCGCTTATGGAGACGATGTGCTCGCTAGCTATCCCTTCCCAATTGATTGCTTGGAACTAGCAAAGACTGGTAAGGAGTATGGTCTGACCATGACCCCTGCTGATAAATCTCCTTGCTTTAATGAGGTCAATTGGGGTAATGCGACCTTCCTCAAAAGGGGCTTTTTGCCCGATGAACAGTTTCCATTTTTGATTCACCCTACTATGCCAATGAGGGAGATCCATGAGTCCATTCGATGGACCAAGGACGCACGGAACACTCAAGATCATGTGCGGTCCTTGTGCCTCCTAGCATGGCATAATGGTAAGCAAGAATACGAGAAGTTTGTGAGCACAATTAGGTCTGTCCCAGTAGGGAGAGCGTTGGCTATTCCAAATTATGAAAATCTTAGACGAAATTGGCTCGAGTTATTTTAGAGGTTATACACACCTCAACCCCACCAGAAATCTGGTCGTGAATGTGACTGGTGGGGGTAAATTTGTTATAACCAGAATAGCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAaagcttat。
本发明还包括这些cDNA克隆的表达产物。
本发明还包括含有上述cDNA的双链DNA,能产生全长感染性克隆序列的双链DNA(double stranded DNA),正向cDNA(positive-sense cDNA)或负向cDNA(negative-sensecDNA)。
本发明还包括含有上述cDNA或者双链DNA的质粒。
较好的,该质粒能够转录产生EV71毒株的全长感染性RNA或者其突变体,能通过体外转录产生含有全长EV71毒株(js1)全长感染性RNA的质粒,能通过体外转录产生含有全长EV71毒株(js1)全长感染性RNA的质粒及衍生质粒。
其中,衍生质粒包括:
A.利用其他分离株(isolates)的部分序列替换权利要求1中EV71毒株(js1)全长感染克隆的部分序列得到的重组病毒克隆;
B.利用基因突变对权利要求1或2中EV71毒株(js1)全长感染克隆中的序列进行突变得到的突变病毒克隆;
C.由EV71毒株(js1)全长感染克隆产生的病毒经过适应性突变产生的减毒(live-attenuated),复制非感染病毒(replication competent non-infectious)及非复制性病毒(defective variants)等衍生克隆。
本发明提供了一种质粒,它含有上述的双链DNA或者其衍生物。
较好的,它能够转录产生EV71毒株的全长感染性RNA或者其突变体。
本发明还提供了一种疫苗或者病毒载体,它根据上述质粒制备;
本发明提供了一种病毒颗粒,它由上述cDNA克隆或者质粒制备;
例如,减毒(live-attenuated)病毒颗粒,非感染复制性病毒(replicationcompetent non-infectious)颗粒及非复制性病毒(defective variants)颗粒;
所述的病毒可以通过免疫动物方法,分离纯化并获得抗EV71病毒抗体,也可以用于筛选人抗体库;或者,用于制备检测EV71病毒的试剂盒和各种细胞系、组织和动物感染模型。
上述细胞系、组织和动物感染模型可以用于筛选抗EV71病毒的药物。
本发明还包括上述病毒载体和病毒颗粒的检测方法,制备方法;
例如,使用所述的病毒颗粒免疫动物并分离抗体,或者筛选人抗体库。
另一方面,本发明提供了一种检测EV71的试剂盒,它含有上述cDNA或者病毒颗粒。
本发明还提供了一种抗病毒EV71药物的制备方法,它使用上述cDNA或者病毒颗粒构建细胞或者动物模型,用于筛选抗病毒EV71的药物;或者,使用上述cDNA或者病毒颗粒构建细胞或者动物模型,用于筛选抗病毒EV71的药物。
本发明的感染性克隆(核酸序列1)为一个由DNA序列构成的一个完整质粒(plasmid)。其中包含一个全长的EV71毒株(js1)的核酸序列(核酸序列2)及一个低拷贝质粒骨架序列(核酸序列3)。质粒(plasmid)是以共价键结合的闭合双链DNA(doublestranded DNA)。其中包含一条与mRNA序列一致的一条有义链(positive-sense strand)及一条与之互补的反义链或负义链(negative-sense strand)。
本发明的感染性克隆(核酸序列1)中所包含的EV71毒株(js1)的全长核酸序列(核酸序列2)包括病毒正链(positive sense)序列的5’末端的非翻译区(non-translatedregion,NTR)、一个开放阅读框(open reading frame,ORF)和3’末端非翻译区(3’-NTR)。在此感染性克隆中,病毒全长核酸序列5’末端含有一个T7启动子(TAA TAC GAC TCA CTA TAGG,SEQ ID NO 7)(图1A),可以在体外由商品化的T7转录试剂盒来转录病毒全长RNA;在病毒全长核酸序列3’末端含有一个30核苷酸长的polyA尾(AAAAA AAAAA AAAAA AAAAA AAAAAAAAAA,SEQ ID NO 8)(图1A)。
临床分离毒株感染RD细胞,待细胞出现细胞病变时,抽提细胞的总RNA,利用EV71特异性引物(GCTAGCGCTtt tttttttt tttttttt ttttttt ttttt,SEQ ID NO 9)进行逆转录,然后利用逆转录(Superscript II逆转录酶)得到的cDNA进行PCR扩增。全长EV71基因组分4段扩增(图1A),扩增引物为F1(S:GACGCGGCCGCTAA TAC GACTC ACTATAG GTTAAAACAGC CTGT GGGT TGCAC CC,SEQ ID NO 10;As:GCACTG CACGT GGATGC AGAAC,SEQ ID NO11),F2(S:GACGCGGCCGCG TTCT GCAT CCAC GTGCA GTGC,SEQ ID NO 12;As:AAGTC GCGAGAGCT GTCTTC CC,SEQ ID NO 13),F3(S:GACGCGGCCGCG GGAA GACAG CTCTCG CGACTT,SEQID NO 14;As:AATTG TACAT CATG GTGC GATGG GTAGG,SEQ ID NO 15),F4(S:GACGCGGCCGCCCTAC CCATCG CACCATG ATGTAC AATT,SEQ ID NO 16;As:GCTAGCGCTtttttttttttttttt tttttttt ttttttGCT ATTCT GGTTAT AACAA ATTTA CCCCCA CCAG,SEQ ID NO17),扩增片段采用分步克隆的方法克隆到pANCR载体,得到最后的全长cDNA克隆,命名为pEV71-js1(图1A),
此感染性克隆在体外经HindIII线性化后,由T7转录试剂盒来转录出含有病毒全长RNA及其3’末端的polyA尾。该体外产生的病毒RNA经电转或转染的方法导入到宿主细胞如Vero细胞后,病毒的RNA作为翻译模版,翻译其ORF,产生病毒多肽(蛋白序列4);该病毒多肽经加工形成病毒结构蛋白及非结构蛋白,起始整个病毒生活周期,产生子代病毒。
由于基于编码的兼并性,通过改变密码子而不改变蛋白序列仍可以得到相同功能蛋白产物;本发明包括编码与“蛋白序列4”相同的其他核酸序列和感染性克隆。
本发明的感染性克隆(核酸序列1)所产生的病毒在细胞中表现出很强的复制能力(图2),可以用于感染体外培养的细胞系、神经组织、小鼠(图6)或猴等建立病毒感染的细胞模型及动物感染模型,用于药物的研发。
通过对此感染性克隆(核酸序列1)进行改造,在病毒的特定区域(VP4蛋白编码区之前)插入报道基因,报道基因由病毒的IRES翻译起始。在报道基因的C末端添加额外氨基酸位点(AITTL)(图1B),此位点可被病毒的3C蛋白酶识别并切割,产生正常的VP4的N端。我们成功的在此感染性克隆(核酸序列1)中插入报道基因荧光素酶NanoLuc(Nluc)及荧光蛋白EGFP,分别构成带有Nluc的感染性克隆(核酸序列5)及带有EGFP的感染性克隆(核酸序列6)(图1B)。各报告基因通过融合PCR连接入pEV71-js1质粒(核酸序列1),分别命名为pEV71-js1-Nluc(核酸序列5)(图1B)及pEV71-js1-EGFP(核酸序列6)(图1C);此感染性克隆同上,在体外经HindIII线性化后,由T7转录试剂盒来转录出病毒全长RNA,体外转录的的病毒RNA经电转或转染的方法导入宿主细胞如Vero细胞后,可以起始病毒生活周期,产生子代病毒(图2)。病毒在复制过程中表达报道基因Nluc及EGFP。Nluc可以利用商品化的荧光素酶活性检测试剂盒进行检测(图5)。EGFP的表达可以利用荧光显微镜进行观察(图4)或利用流式细胞仪进行检测。产生的含有报道基因片段的子代病毒重新感染新细胞,在新细胞中可以有效复制。报道基因由于与病毒蛋白处于同一个开放阅读框,其表达水平反应病毒蛋白水平,亦可反应病毒复制水平。且含有报道基因的重组病毒在相当长的时间内连续传代报道基因无丢失(图4)。利用此含有报道基因的重组病毒,可以快速、方便的检测病毒复制及包装水平,可以用于研究病毒的生活周期、病毒-宿主相互作用、病毒的免疫学及抗病毒药物的开发等。
对此感染性克隆(核酸序列1)进行改造,参照肠道病毒属其他病毒,比如剔除病毒的结构蛋白VP4-VP3-VP2-VP1区域,可以构成病毒的亚基因组复制子(subgenomicreplicon)等复制非感染性病毒(replication competent non-infectious),该亚基因组复制子能进行病毒基因复制,但由于缺少病毒的结构蛋白不能包装出子代病毒。同时此亚基因组复制子RNA可以由表达的结构蛋白进行反式互补(trans complement),包装成重组亚病毒颗粒(recombinant subviral particles,RSPs)(Barclay,et al.J GenVirol.1998,79:1725-1734;Jia,et al.J Virol.1998,72:7972-7977),该亚病毒颗粒可以进行一轮感染,但由于基因组没有不编码结构蛋白,因此感染后不能再次病毒颗粒包装,是一种非复制性病毒(defective variants)颗粒。这些非复制性病毒颗粒可以作为一种型式的疫苗。
对此感染性克隆(核酸序列1)进行改造,可以构成减毒(live-attenuated)病毒,此减毒病毒可以作为疫苗。参考同为微小RNA病毒科的Polio病毒的减毒策略,在5’NTR上进行突变,可以构建减毒疫苗(Arita,et al.J Virol.2008,82:1787-1797)。
感染性克隆产生的病毒感染小鼠,建立方便、稳定的动物感染模型,本申请中,发现初始分离的毒株经过多于3次的传代后其感染新生小鼠后致死率下降,通过测序发现传代后的病毒其VP1的145位发生由E到G到突变,因此由分离的病毒进行感染建立老鼠模型一致性较差,利用感染性克隆产生病毒可以保证病毒序列不受细胞传代的影响。本申请利用上述感染性克隆得到的病毒感染不同品系(ICR,Balb/c,C57)的新生老鼠,均可以在9天内得到100%的死亡率(图6B),但携带有VP1的145G突变的病毒感染老鼠后不导致小鼠死亡(图6C),该动物模型可以方便的用于抗病毒药物以疫苗评价等。
新型肠道病毒71型(Human enterovirus type71,EV71)为微小RNA病毒科属于微小病毒科(picornaviridae)中的肠病毒群(enterovirus)成员。EV71是在全球范围内引起儿童手足口病的主要病原体,它可以导致儿童罹患轻症和重症手足口病。病毒可感染中枢神经系统,引起中枢神经系统损伤,但其机制未明。目前无有效的治疗EV71的抗病毒药物。本发明通过分离一株临床EV71毒株,利用分子克隆,构建了稳定的病毒的全长cDNA克隆,通过体外转录RNA、转染Vero细胞证实所述的cDNA克隆来源的病毒RNA能产生EV71病毒;进一步,本申请构建了含有报道基因Gluc(Gaussia luciferase)及EGFP的重组病毒,并证实含有报道Gluc及EGFP的重组病毒具有感染宿主细胞并引起细胞病变的能力,利用感染性克隆来源的EV71病毒感染免疫健全的ICR、Bab/C及C57乳鼠,在10天内导致100%的被感染老鼠出现神经损伤症状而死亡。
本发明提供了稳定的、基于一株临床分离的EV71毒株的感染性cDNA克隆及其含有各类报道基因的衍生克隆、及以其为母本构建的各种突变克隆;以及利用这些克隆产生的各种重组病毒、亚单位病毒颗粒;以及利用这些克隆产生的各种重组病毒感染动物建立的动物模型;以及利用这些病毒或亚单位病毒颗粒用于疫苗的开发及诊断试剂的应用;以及利用此病毒作为基因治疗载体或表达载体。
本发明的优点还有:
本发明包括利用这些克隆质粒为母本,通过分子生物学构建的各种重组病毒、亚单位病毒颗粒质粒。
本发明还包括利用这些克隆可以产生的各种重组病毒、亚单位病毒颗粒;其含有上述cDNA。
本发明还包括利用这些克隆可以产生的各种重组病毒构建的动物感染模型。
本发明还包括利用这些病毒或亚单位病毒颗粒及动物模型用于疫苗的开发及诊断试剂。
本发明还包括利用这些病毒或亚单位病毒颗粒建立的动物模型用于疫苗的开发及抗病毒药物的开发。
本发明还包括利用此病毒或亚病毒单位质粒作为基因治疗载体或表达载体质粒及利用这些质粒所产生的病毒或亚病毒颗粒。
本发明为EV71病毒感染的检测、预防、免疫提供了新的工具和途径,为利用此EV71毒株感染性克隆作为病毒载体进行基因治疗及疫苗开发提供了可能性。
附图说明
图1:EV71毒株js1的感染性cDNA克隆的构建,其中,
(A)感染性克隆构建策略;寨卡病毒全基因组模式图,两端黑色柱子分别表示5’-NTR及3’-NTR;病毒结构蛋白区域及非结构蛋白区域如图所示;病毒全长序列分成4段分别进行扩增,其中第一段F1中含有T7序列,第四段F4含有由PCR引物引入的polyA30序列;合成的序列通过限制性内切酶依图所示依次连接入pACNR载体,得到全长克隆;(B)通过融合PCR,在VP4的N端同框融合Nluc或EGFP基因,Nluc或EGFP基因C端添加额外的氨基酸序列AITTL,便于被病毒蛋白酶切割从而产生正确的VP4的N端。
图2:EV71毒株js1的感染性cDNA克隆产生病毒的复制能力及感染能力,其中,
感染性克隆质粒作为模版,经体外转录成病毒RNA,病毒RNA通过电转导入到Vero细胞,收集上清病毒,在Vero细胞上利用噬斑实验进行滴度滴定,感染性克隆产生(Clone-WT)的噬斑同母本病毒(Parent)产生的噬斑的比较如图(上),相同滴度的感染性克隆产生的病毒同母本病毒再次感染Vero细胞(MOI=0.1),收集感染后不同时间(h.p.i)的细胞上清,利用噬斑实验对其进行滴定,得到两者的生长曲线如图(下),病毒滴度由PFU/ml表示。
图3:含有报道基因Nluc及EGFP的重组病毒的产生,其中,
(A)含有报道基因Nluc及EGFP的感染性克隆质粒,同不含报道基因的感染性克隆质粒,经体外转录成病毒RNA,病毒RNA通过电转导入到Vero细胞,收集上清病毒,在Vero细胞上利用噬斑实验进行滴度滴定,含各报道基因的重组病毒产生的噬斑同不含报道基因的病毒产生的噬斑的比较;(B)相同滴度的含各报道基因的病毒同不含报道基因的病毒再次感染Vero细胞(MOI=0.1),收集感染后不同天数的上清,利用噬斑实验对其进行滴定,得到的生长曲线;病毒滴度由PFU/ml表示。
图4:含EGFP报道基因的重组病毒的稳定性,其中,
重组病毒EV71-EGFP感染的细胞上清以1:10稀释后,重新感染新的Vero细胞,感染二天后细胞用荧光显微镜观察及收集上清,再次以1:10稀释度重新感染新的Vero细胞(C+1),感染二天后同上细胞用荧光显微镜观察及收集上清进行再次感染;依次传代感染,观察感染细胞中EGFP的表达情况。
图5:含Nluc报道基因的重组病毒的产生Nluc的活性,其中,
含有报道基因Nluc的感染性克隆质粒同含有VP1 E145G及3C C147A突变的质粒,经体外转录成病毒RNA,病毒RNA通过电转导入到Vero细胞,电转后不同时间点收集细胞,检测细胞内Nluc活性,C147A为3C蛋白酶酶活性缺失突变。
图6:EV71毒株js1的感染性cDNA克隆产生病毒感染小鼠构建动物感染模型,其中,
(A)感染性cDNA克隆产生的病毒感染不同品系3日龄胎鼠(1.4×104pfu/只),感染后5天观察。(B)病毒感染后小鼠的生存曲线(n=5/group)。(C)感染性cDNA克隆(WT)及携带有VP1 E145G突变的克隆产生的病毒感染3日龄ICR小鼠,小鼠的生存曲线(n=5/group)。
具体实施方式
本发明所用的方法均为常规的分子生物学方法,其中具体的操作细节不再赘述。
实施例1:EV71毒株js1的感染性cDNA克隆的构建
如图1A所示,从粪便标本中分离的病毒,经RD细胞培养,待细胞出现明显细胞病变时,提取总的细胞RNA,利用superscript II(Invitrogen)逆转录酶,以序列特异性引物(GCTAGCGCTttt tttttttttttt tttttttttt ttttt)进行逆转录,以得到的cDNA为模版,利用高保真酶super Fi(Invitrogen)分4段进行PCR扩增,扩增引物为F1(S:GACGCGGCCGCTAA TAC GACTC ACTATAG GTTAAA ACAGC CTGT GGGT TGCAC CC;As:GCACTG CACGT GGATGCAGAAC),F2(S:GACGCGGCCGCG TTCT GCAT CCAC GTGCA GTGC;As:AAGTC GCGA GAGCTGTCTTC CC),F3(S:GACGCG GCCGCG GGAA GACAG CTCTCG CGACTT;As:AATTG TACAT CATGGTGC GATGG GTAGG),F4(S:GACGC GGCCGCCCTAC CCATCG CACCATG ATGTAC AATT;As:GCTAGC GCTtttttttt tttttttt tttttttt ttttttGCT ATTCT GGTTAT AACAA ATTTA CCCCCACCAG),扩增的F4片段首先经限制性内切酶NotI/AfeI消化后,与经同样限制性内切酶消化的pANCR载体连接,得到pANCR-F4质粒,PCR扩增的F3片段利用NruI/BsrGI连接入pANCR-F4得到pANCR-F34质粒,PCR扩增的F2片段利用PmlI/NruI连接入pANCR-F34得到pANCR-F234,PCR扩增的F1片段利用NotI/PmlI连接入pANCR-F234得到最后的全长cDNA克隆,命名为pEV71-js1。
为构建带有报道基因EGFP的感染性克隆质粒(如图1B所示),利用融合PCR,融合三段序列,其中EGFP-F1为EV71 5UTR序列,PCR扩增引物为S:CCTGA CGTG TCGA CGCGG,SEQ IDNO 18,As:cctc gccct tgctcac CATcatatgG TTTAGCTGT GTTAAG GGTCAAGA,SEQ ID NO19,EGFP-F2为含有EGFP的片段,PCR扩增引物为S:TCTT GACC CTTAAC ACAGC TAA ACcatatgATG gtga gcaag ggcg agg,SEQ ID NO 20,As:CGCT GTGT AGACAC TTGCGA ACCAAGAGTGGTG ATCGC atgcat cttgtac agctcgt ccatgc cg,SEQ ID NO 21,EGFP-F3为含有包含VP4及VP2区域的片段,PCR扩增引物为S:cggca tggac gagct gtaca agatgc atGCGA TCACCACT CTTGG TTCGC AAGTG TCTA CACAG CG,SEQ ID NO 22;As:CTGC ACGT GGAT GCA GAACCC,SEQ ID NO 23,三个片段经融合PCR融合后,利用NotI/PmlI连接入pEV71-js1质粒,替换原质粒中的序列,得到pEV71-js1-EGFP质粒。
为构建带有报道基因Nluc的感染性克隆质粒(如图1B所示),利用融合PCR,融合两段序列,其中Nluc-F1为EV715UTR序列,PCR扩增引物为S:CTGC ACGT GGAT GCA GAA CCC,SEQ ID NO 24,As:gaaa tcttcg agtgtga agaccattct agaGTT TAGC TGTG TTA AGGG TCAAG,SEQ ID NO 25,EGFP-F2为含有Nluc的片段,PCR扩增引物为S:CTTG ACCC TTAAC ACAGCTAA ACtct agaat ggtctt cacac tcgaa gatttc,SEQ ID NO 26;As:CGCat gcatcg ccagaatgcgt tcgca,SEQ ID NO 27。两个片段经融合PCR融合后,利用NotI/NsiI连接入pEV71-js1-EGFP质粒,替换原质粒中的序列,得到pEV71-js1-Nluc质粒。
实施例2:EV71毒株js1的感染性cDNA克隆产生病毒的复制能力及感染能力
感染性克隆质粒pEV71-js1用HindIII进行酶切,线性化,然后T7利用体外转录试剂盒(Ambion)。体外转录的RNA3g利用电转导的方法转入Vero细胞。电转后2天,待细胞出现病变,收集病毒上清,离心3000g,10min,然后经0.45m的滤膜过滤去掉细胞碎片。上清中的病毒利用噬斑实验进行滴定。感染性克隆质粒产生的病毒形成的噬斑与最初分离的母本病毒的噬斑比较如图2所示(上),两者噬斑的形态和大小无显著差异。相同滴度的感染性克隆产生的病毒同母本病毒再次感染Vero细胞(MOI=0.1),收集感染后不同时间的细胞上清,利用噬斑实验对其进行滴定(以PFU/ml表示),得到两者的生长曲线如图2所示(下),两者的生长曲线无显著差异。
实施例3:含有报道基因Nluc及EGFP的重组病毒的产生及其稳定性
含有报道基因Nluc及EGFP的感染性克隆质粒,同不含报道基因的感染性克隆质粒,同上经体外转录成病毒RNA,电转导入到Vero细胞,两天后收集细胞上清中的病毒,在Vero细胞上利用噬斑实验对其病毒滴度进行滴定。如图3A所示,含有报道基因EGFP及Nluc的病毒同不含报道基因的病毒其噬斑形态和大小类似。利用相同滴度的含各报道基因的病毒同不含报道基因的病毒再次感染Vero细胞(MOI=0.1),收集感染后不同天数的上清,利用噬斑实验对其进行滴定,得到的生长曲线,如图3B所示,携带有报道基因的病毒,相较于野生病毒,其生长周期表现为滞后,提示融合报道基因导致病毒复制周期的延缓。含有报道基因Nluc的感染性克隆质粒产出的病毒,其复制能力可以利用Nluc的底物(Promega),通过测定细胞内Nluc的活性进行判断。含有VP1 E145G及3C C147A突变的质粒,经体外转录成病毒RNA,病毒RNA通过电转导入到Vero细胞,不同时间测定细胞内Nluc活性,如图5所示,含有3C蛋白酶失活突变(C147A)的病毒RNA,其转染后,细胞内Nluc的活性在8小时后不再上升,其活性仅反应病毒RNA的起始翻译信号,但野生病毒活VP145G病毒RNA转染后,Nluc随时间延长表现为逐渐上升,表示正常病毒复制信号。为证明含有EGFP报道基因的病毒其报道基因的稳定性,我们利用EV71-EGFP病毒感染的细胞上清以1:10稀释后,重新感染新的Vero细胞,感染二天后细胞用荧光显微镜观察及收集上清,再次以1:10稀释度重新感染新的Vero细胞(C+1),感染二天后同上细胞用荧光显微镜观察及收集上清进行再次感染;依次传代感染,观察感染细胞中EGFP的表达情况,在连续传代至少6代后,EGFP基因仍然稳定。
实施例4:EV71毒株js1的感染性cDNA克隆产生病毒感染小鼠构建动物感染模型
如图6A所示,感染性cDNA克隆产生的病毒感染不同品系3日龄胎鼠(1.4×104pfu/只),感染后5天观察小鼠,相比较不感染小鼠,感染有病毒的小鼠均表现为四肢瘫痪。各不同品系的小鼠感染后其生存曲线如图6B所示,在10天内,均达到100%死亡率。携带有VP1E145G突变的感染性克隆产生的病毒感染3日龄ICR小鼠后,不同于野生型小鼠,不导致小鼠的死亡,说明E145位点为病毒感染小鼠致死的决定性位点,也解释了传代病毒随传代次数的增加,其感染致死率降低的原因。
序列表
<110> 复旦大学
<120> 基于EV71毒株的感染性cDNA克隆及其应用
<130> 20190601
<160> 27
<170> SIPOSequenceListing 1.0
<210> 1
<211> 9446
<212> DNA
<213> Artificial
<400> 1
gctagcggag tgtatactgg cttactatgt tggcactgat gagggtgtca gtgaagtgct 60
tcatgtggca ggagaaaaaa ggctgcaccg gtgcgtcagc agaatatgtg atacaggata 120
tattccgctt cctcgctcac tgactcgcta cgctcggtcg ttcgactgcg gcgagcggaa 180
atggcttacg aacggggcgg agatttcctg gaagatgcca ggaagatact taacagggaa 240
gtgagagggc cgcggcaaag ccgtttttcc ataggctccg cccccctgac aagcatcacg 300
aaatctgacg ctcaaatcag tggtggcgaa acccgacagg actataaaga taccaggcgt 360
ttcccctggc ggctccctcg tgcgctctcc tgttcctgcc tttcggttta ccggtgtcat 420
tccgctgtta tggccgcgtt tgtctcattc cacgcctgac actcagttcc gggtaggcag 480
ttcgctccaa gctggactgt atgcacgaac cccccgttca gtccgaccgc tgcgccttat 540
ccggtaacta tcgtcttgag tccaacccgg aaagacatgc aaaagcacca ctggcagcag 600
ccactggtaa ttgatttaga ggagttagtc ttgaagtcat gcgccggtta aggctaaact 660
gaaaggacaa gttttggtga ctgcgctcct ccaagccagt tacctcggtt caaagagttg 720
gtagctcaga gaaccttcga aaaaccgccc tgcaaggcgg ttttttcgtt ttcagagcaa 780
gagattacgc gcagaccaaa acgatctcaa gaagatcatc ttattaaggg gtctgacgct 840
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 900
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 960
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 1020
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 1080
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 1140
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 1200
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 1260
aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt 1320
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 1380
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 1440
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 1500
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 1560
cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga 1620
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 1680
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 1740
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 1800
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 1860
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 1920
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt gtcgacgcgg 1980
ccgctaatac gactcactat aggttaaaac agcctgtggg ttgcacccac tcacagggcc 2040
tactgggcgc aagcactctg gtacctcggt acctttgtgc gcctgtttta cacccccccc 2100
ccaatgaaac ttagaagcaa taaaccacga tcaatagcag gcataacgct ccagttatgt 2160
cttgatcaag cacttctgtt tccccggact gagtatcaat agactgctcg cgcggttgaa 2220
ggagaaaacg ttcgttatcc ggctaactac ttcggaaaac ctagtaacac catgaaagtt 2280
gcggagagct tcgttcagca ctcccccagt gtagatcagg tcgatgagtc accgcgttcc 2340
ccacgggcga ccgtggcggt ggctgcgttg gcggcctgcc catggggtaa cccatggggc 2400
gctctaatac ggacatggtg tgaagagtct actgagctag ttggtagtcc tccggcccct 2460
gaatgcggct aatcccaact gcggagcaca cgcccacaag ccagcgggta gtgtgtcgta 2520
acgggtaact ctgcagcgga accgactact ttgggtgtcc gtgtttcctt ttatctttat 2580
attggctgct tatggtgaca attaaagaat tgttaccata tagctattgg attagccatc 2640
cggtgtgcaa cagagcaatt atttacctat ttattggttt tgtaccatta acctcgaatt 2700
ctgtgaccac ccttaattat atcttgaccc ttaacacagc taaacatggg ttcgcaagtg 2760
tctacacagc gctccggttc ttacgaaaac tcaaactcag ccactgaggg ttctaccata 2820
aactacacca ccattaatta ctacaaagac tcctatgctg ccacagcagg caaacagagt 2880
ctcaagcagg atccagacaa gtttgcaaat cctgttaaag acatattcac cgaaatggca 2940
gcgccactga agtccccatc cgctgaggca tgtggataca gtgatcgagt ggcgcaatta 3000
actattggca actccaccat cacgacgcaa gaagcggcta acatcatagt cggctatggt 3060
gagtggcctt cctactgctc agattctgac gctacagcag tggataaacc aacgcgcccg 3120
gatgtttcag tgaacaggtt ttacacattg gacactaaat tgtgggagaa atcgtccaag 3180
ggatggtact ggaagttccc ggatgtgtta actgaaactg gggtttttgg gcaaaatgca 3240
caattccact acctctaccg atcagggttc tgcatccacg tgcagtgcaa tgccagtaaa 3300
ttccaccaag gagcactcct agtcgctgtc ctaccagagt atgtcattgg gacagtggca 3360
ggcggtacag ggacggaaga cacccacccc ccctacaagc agacccaacc cggcgccgat 3420
ggtttcgagt tgcaacaccc gtacgtgctt gatgctggca tcccaatatc acagttaaca 3480
gtgtgcccac accagtggat taatttgagg accaacaatt gtgctacaat aatagtgcca 3540
tacattaacg cactgccttt tgattctgcc ttgaaccatt gcaactttgg cctgttagtt 3600
gtgcctatta gcccactaga ctacgaccaa ggagcaacgc cagtaatccc tataactatc 3660
acattggccc caatgtgctc tgaattcgca ggtcttaggc aggcagtcac gcaagggttc 3720
cccaccgagc taaaacctgg cacaaatcaa tttttaacca ccgatgatgg cgtctcagca 3780
cctattctac caaacttcca ccccaccccg tgtatccaca tacctggtga agttaggaac 3840
ttgctagagt tatgccaggt ggagaccatt ctggaggtta acaatgtgcc cacgaatgcc 3900
actagcttaa tggagagact gcgcttcccg gtctcagcac aagcagggaa aggtgaactg 3960
tgtgcggtgt ttagagccga tcctgggcga aatggaccat ggcaatccac cttactgggc 4020
cagttgtgcg ggtactacac ccaatggtca gggtcattgg aagtcacctt catgtttact 4080
ggatccttca tggctaccgg caagatgctc atagcctata caccgccagg gggtcctctg 4140
cccaaggacc gggcgaccgc catgttgggc acgcacgtca tctgggattt tgggctgcaa 4200
tcgtctgtta cccttgtaat accatggatc agtaacactc attatagagc acatgcccga 4260
gatggagtgt ttgactatta cactacaggg ttagtcagta tatggtacca gacaaattac 4320
gtggttccaa tcggtgcgcc caacacagcc tatataatag cactagcggc agcccaaaag 4380
aacttcacta tgaaattgtg caaggatgct agtgatatcc tgcagacggg caccatccag 4440
ggagataggg tggcagatgt aattgaaagt tccataggag atagcgtgag cagagccctc 4500
actcacgctc taccagcacc cacaggccaa aacacacagg tgagcagtca tcgactggat 4560
acaggcaagg ttccagcact ccaagctgct gaaattgggg catcatcaaa tgctagtgac 4620
gagagcatga ttgaaacacg ttgtgttctt aactcgcata gtacagctga gaccactctt 4680
gatagtttct tcagtagggc aggattagtt ggagagatag atctccctct tgagggcaca 4740
actaacccaa atggttatgc caactgggac atagatataa caggttacgc gcaaatgcgt 4800
agaaaggtag agctattcac ctacatgcgt tttgatgcag agttcacttt tgttgcgtgc 4860
acacccaccg gggaggttgt cccacaattg ctccaatata tgtttgtgcc acctggagcc 4920
cctaagccag attctaggga atcccttgca tggcaaaccg ccaccaaccc ctcagttttt 4980
gtcaagctgt cagaccctcc ggcgcaggtt tcagtgccat tcatgtcacc tgcgagtgct 5040
tatcaatggt tttatgacgg atatcccaca ttcggagaac acaaacagga gaaagacctt 5100
gaatacgggg catgtcctaa taacatgatg ggtacattct cagtgcggac tgtggggacc 5160
tccaagtcca agtacccttt agtggttagg atttacatga gaatgaagca cgtcagggcg 5220
tggatacctc gcccgatgcg caaccagaac tacctgttca aagccaaccc aaattatgct 5280
ggcaactcta ttaagccaac tggtgccagt cgcacagcga tcaccactct tgggaaattt 5340
ggacaacagt ctggggctat ttatgtgggc aactttagag tggtcaaccg acatcttgcc 5400
acccataatg attgggcaaa tcttgtttgg gaagacagct ctcgcgactt gctcgtgtca 5460
tccaccactg cccaaggttg tgacacgatt gcccgttgcg attgccagac aggggtgtac 5520
tactgtaact cgatgagaaa acactaccca gtcagttttt caaaacccag cctgatctat 5580
gtagaggcta gcgagtatta cccagccagg taccaatcac atctcatgct cgcacagggt 5640
cactcggaac ctggtgattg cggtggtatc cttaggtgcc aacatggcgt catcggcata 5700
gtgtctactg gtggcaatgg gctcgttggc tttgcagacg tcagagacct cttgtggtta 5760
gatgaagaag ctatggaaca gggcgtgtcc gactacatta agggtctcgg agatgctttt 5820
ggaacaggct tcactgacgc agtctcaagg gaggttgaag ctctcaagaa ctatcttata 5880
gggtctgaag gagcagttga gaaaattttg aaaaatctta ttaaactaat ctctgcactg 5940
gtgattgtga tcagaagtga ttacgacatg gttaccctca ctgcaacctt agcgctgata 6000
ggttgtcatg gcagtccttg ggcttggatt aaagccaaaa cagcctccat cttaggtatc 6060
cctatcgccc aaaagcagag cgcttcctgg ctcaagaagt tcaatgacat ggccaacgcc 6120
gctaaggggt tagagtgggt ttccaacaag atcagcaaat ttattgattg gcttaaggag 6180
aaaatagtac cagcagccag ggagaaggtt gaattcctaa ataacttgaa acagctgcca 6240
ctgctagaga atcagatctc gaacttggaa caatctgctg cttcacaaga ggaccttgaa 6300
gtcatgtttg ggaatgtgtc gtacctagct cacttctgtc gcaagtttca accgctatac 6360
gccacggaag ctaaaagagt ctatgccctg gagaagagaa tgaataacta tatgcagttc 6420
aagagcaaac accgaattga acctgtatgt ctcattatta ggggctcacc aggcaccggg 6480
aagtctctag ccactggtat tattgctcga gcaatcgctg ataagtacca ctccagcgtg 6540
tactcgctcc caccagaccc ggatcatttt gacggttaca agcaacaggt ggttacagtg 6600
atggatgatt tgtgtcaaaa ccccgatggt aaggatatgt ccttattctg tcaaatggta 6660
tccaccgtag atttcattcc accaatggct tctctcgagg agaagggagt ttccttcacc 6720
tctaagtttg tcatcgcatc cactaatgcc agtaatatca tagtaccaac agtgtctgat 6780
tctgacgcta ttcgccgcag gttctacatg gactgtgaca ttgaagtgac agactcgtac 6840
aaaacagatc taggtagact ggatgcaggg cgagccgcta aactgtgttc tgaaaataac 6900
actgcaaatt tcaaacgttg cagcccatta gtgtgtggga aagccatcca acttagagat 6960
agaaagtcta aagtcagata cagtgtggat acggtggttt cagaacttat tagggaatac 7020
agcaataggt ccgccattgg taacacaatc gaggctcttt tccaaggtcc acccaagttc 7080
aggccaatta ggattagcct tgaagaaaaa ccagccccag acgctattag cgatctcctt 7140
gctagtgtag atagtgaaga agtgcgccag tactgcaggg atcaaggctg gattattcct 7200
gaagctccca ccaatgtgga gcggcacctt aatagagcgg tgctcgtcat gcaatccatc 7260
accacagtag tggcggttgt ttcgttggtg tacgtcatct acaagctctt tgcagggttt 7320
cagggtgcat attctggtgc tcctaagcaa gtgcttaaga aacctgctct tcgcacagca 7380
acagtgcagg gtccgagcct tgactttgct ctctccctac tgagaaggaa catcaggcag 7440
gtccaaacag accaagggca tttcaccatg ttgggtgtta gggatcgctt agcagtcctc 7500
ccacgccact cacaacctgg caaaaccatt tggattgagc acaaactcgt gaacgtcctt 7560
gatgcagttg aactggtgga tgagcaagga gtcaacctgg aattaaccct catcactctt 7620
gacaccaacg agaagtttag ggatatcacc aaattcatcc cagaaaatat cagcactgct 7680
agcgatgcca ccctagtgat caacacggag cacatgccgt caatgtttgt cccggtgggt 7740
gacgttgtgc agtatggctt tttgaatctc agtggcaagc ctacccatcg caccatgatg 7800
tacaattttc ctactaaagc aggacagtgt ggaggagtgg tgacatctgt tgggaaggtt 7860
gtcggtattc acattggtgg caatggcaga caaggttttt gcgcaggcct caaaaggagt 7920
tactttgcta gtgaacaagg agagatccag tgggttaagc ccaataaaga aactggaaga 7980
ctcaacatca atggaccaac ccgcaccaag ttagaaccta gtgtattcca tgacatcttc 8040
gagggaaata aggaaccagc tgtcttgcac agtaaagacc cccgacttga ggtagatttt 8100
gaacaggccc tgttctctaa gtatgtggga aacacactac atgagcctga cgagtacatc 8160
aaagaggcag ctctacatta tgcaaaccaa ttaaagcaac tagaaatcaa tacctctcaa 8220
atgagcatgg aggaggcctg ctatggtact gagaatcttg aggctattga tcttcacact 8280
agtgcaggtt acccctatag tgccctaggg ataaagaaaa gagacatctt agaccctacc 8340
accagggacg tgagtagaat gaagttctac atggacaagt atggtcttga tcttccctac 8400
tccacttatg tcaaggacga gctacgctcg attgataaaa tcaagaaagg gaagtcccgc 8460
ctgatcgagg ccagtagtct aaatgattca gtgtacctca gaatggcttt cgggcatttg 8520
tatgaggctt tccacgcaaa tcctgggacg ataactggat cggccgtggg gtgtaaccct 8580
gacacattct ggagcaagct gccaattttg ctccctggtt cactctttgc ctttgactac 8640
tcaggctatg atgccagcct tagccctgtc tggttcagag cattagaatt ggttcttagg 8700
gagatagggt atagtgaaga ggcaatctca ctcattgagg gaatcaacca cacacatcat 8760
gtgtatcgta ataagaccta ttgcgtgctt ggtgggatgc cctcaggctg ttcaggaaca 8820
tccatcttca actcaatgat caacaacatt attatcagag cactgctcat aaaaacattt 8880
aagggcattg atttggatga actcaacatg gtcgcttatg gagacgatgt gctcgctagc 8940
tatcccttcc caattgattg cttggaacta gcaaagactg gtaaggagta tggtctgacc 9000
atgacccctg ctgataaatc tccttgcttt aatgaggtca attggggtaa tgcgaccttc 9060
ctcaaaaggg gctttttgcc cgatgaacag tttccatttt tgattcaccc tactatgcca 9120
atgagggaga tccatgagtc cattcgatgg accaaggacg cacggaacac tcaagatcat 9180
gtgcggtcct tgtgcctcct agcatggcat aatggtaagc aagaatacga gaagtttgtg 9240
agcacaatta ggtctgtccc agtagggaga gcgttggcta ttccaaatta tgaaaatctt 9300
agacgaaatt ggctcgagtt attttagagg ttatacacac ctcaacccca ccagaaatct 9360
ggtcgtgaat gtgactggtg ggggtaaatt tgttataacc agaatagcaa aaaaaaaaaa 9420
aaaaaaaaaa aaaaaaaaaa gcttat 9446
<210> 2
<211> 7405
<212> DNA
<213> Artificial
<400> 2
ttaaaacagc ctgtgggttg cacccactca cagggcctac tgggcgcaag cactctggta 60
cctcggtacc tttgtgcgcc tgttttacac ccccccccca atgaaactta gaagcaataa 120
accacgatca atagcaggca taacgctcca gttatgtctt gatcaagcac ttctgtttcc 180
ccggactgag tatcaataga ctgctcgcgc ggttgaagga gaaaacgttc gttatccggc 240
taactacttc ggaaaaccta gtaacaccat gaaagttgcg gagagcttcg ttcagcactc 300
ccccagtgta gatcaggtcg atgagtcacc gcgttcccca cgggcgaccg tggcggtggc 360
tgcgttggcg gcctgcccat ggggtaaccc atggggcgct ctaatacgga catggtgtga 420
agagtctact gagctagttg gtagtcctcc ggcccctgaa tgcggctaat cccaactgcg 480
gagcacacgc ccacaagcca gcgggtagtg tgtcgtaacg ggtaactctg cagcggaacc 540
gactactttg ggtgtccgtg tttcctttta tctttatatt ggctgcttat ggtgacaatt 600
aaagaattgt taccatatag ctattggatt agccatccgg tgtgcaacag agcaattatt 660
tacctattta ttggttttgt accattaacc tcgaattctg tgaccaccct taattatatc 720
ttgaccctta acacagctaa acatgggttc gcaagtgtct acacagcgct ccggttctta 780
cgaaaactca aactcagcca ctgagggttc taccataaac tacaccacca ttaattacta 840
caaagactcc tatgctgcca cagcaggcaa acagagtctc aagcaggatc cagacaagtt 900
tgcaaatcct gttaaagaca tattcaccga aatggcagcg ccactgaagt ccccatccgc 960
tgaggcatgt ggatacagtg atcgagtggc gcaattaact attggcaact ccaccatcac 1020
gacgcaagaa gcggctaaca tcatagtcgg ctatggtgag tggccttcct actgctcaga 1080
ttctgacgct acagcagtgg ataaaccaac gcgcccggat gtttcagtga acaggtttta 1140
cacattggac actaaattgt gggagaaatc gtccaaggga tggtactgga agttcccgga 1200
tgtgttaact gaaactgggg tttttgggca aaatgcacaa ttccactacc tctaccgatc 1260
agggttctgc atccacgtgc agtgcaatgc cagtaaattc caccaaggag cactcctagt 1320
cgctgtccta ccagagtatg tcattgggac agtggcaggc ggtacaggga cggaagacac 1380
ccaccccccc tacaagcaga cccaacccgg cgccgatggt ttcgagttgc aacacccgta 1440
cgtgcttgat gctggcatcc caatatcaca gttaacagtg tgcccacacc agtggattaa 1500
tttgaggacc aacaattgtg ctacaataat agtgccatac attaacgcac tgccttttga 1560
ttctgccttg aaccattgca actttggcct gttagttgtg cctattagcc cactagacta 1620
cgaccaagga gcaacgccag taatccctat aactatcaca ttggccccaa tgtgctctga 1680
attcgcaggt cttaggcagg cagtcacgca agggttcccc accgagctaa aacctggcac 1740
aaatcaattt ttaaccaccg atgatggcgt ctcagcacct attctaccaa acttccaccc 1800
caccccgtgt atccacatac ctggtgaagt taggaacttg ctagagttat gccaggtgga 1860
gaccattctg gaggttaaca atgtgcccac gaatgccact agcttaatgg agagactgcg 1920
cttcccggtc tcagcacaag cagggaaagg tgaactgtgt gcggtgttta gagccgatcc 1980
tgggcgaaat ggaccatggc aatccacctt actgggccag ttgtgcgggt actacaccca 2040
atggtcaggg tcattggaag tcaccttcat gtttactgga tccttcatgg ctaccggcaa 2100
gatgctcata gcctatacac cgccaggggg tcctctgccc aaggaccggg cgaccgccat 2160
gttgggcacg cacgtcatct gggattttgg gctgcaatcg tctgttaccc ttgtaatacc 2220
atggatcagt aacactcatt atagagcaca tgcccgagat ggagtgtttg actattacac 2280
tacagggtta gtcagtatat ggtaccagac aaattacgtg gttccaatcg gtgcgcccaa 2340
cacagcctat ataatagcac tagcggcagc ccaaaagaac ttcactatga aattgtgcaa 2400
ggatgctagt gatatcctgc agacgggcac catccaggga gatagggtgg cagatgtaat 2460
tgaaagttcc ataggagata gcgtgagcag agccctcact cacgctctac cagcacccac 2520
aggccaaaac acacaggtga gcagtcatcg actggataca ggcaaggttc cagcactcca 2580
agctgctgaa attggggcat catcaaatgc tagtgacgag agcatgattg aaacacgttg 2640
tgttcttaac tcgcatagta cagctgagac cactcttgat agtttcttca gtagggcagg 2700
attagttgga gagatagatc tccctcttga gggcacaact aacccaaatg gttatgccaa 2760
ctgggacata gatataacag gttacgcgca aatgcgtaga aaggtagagc tattcaccta 2820
catgcgtttt gatgcagagt tcacttttgt tgcgtgcaca cccaccgggg aggttgtccc 2880
acaattgctc caatatatgt ttgtgccacc tggagcccct aagccagatt ctagggaatc 2940
ccttgcatgg caaaccgcca ccaacccctc agtttttgtc aagctgtcag accctccggc 3000
gcaggtttca gtgccattca tgtcacctgc gagtgcttat caatggtttt atgacggata 3060
tcccacattc ggagaacaca aacaggagaa agaccttgaa tacggggcat gtcctaataa 3120
catgatgggt acattctcag tgcggactgt ggggacctcc aagtccaagt accctttagt 3180
ggttaggatt tacatgagaa tgaagcacgt cagggcgtgg atacctcgcc cgatgcgcaa 3240
ccagaactac ctgttcaaag ccaacccaaa ttatgctggc aactctatta agccaactgg 3300
tgccagtcgc acagcgatca ccactcttgg gaaatttgga caacagtctg gggctattta 3360
tgtgggcaac tttagagtgg tcaaccgaca tcttgccacc cataatgatt gggcaaatct 3420
tgtttgggaa gacagctctc gcgacttgct cgtgtcatcc accactgccc aaggttgtga 3480
cacgattgcc cgttgcgatt gccagacagg ggtgtactac tgtaactcga tgagaaaaca 3540
ctacccagtc agtttttcaa aacccagcct gatctatgta gaggctagcg agtattaccc 3600
agccaggtac caatcacatc tcatgctcgc acagggtcac tcggaacctg gtgattgcgg 3660
tggtatcctt aggtgccaac atggcgtcat cggcatagtg tctactggtg gcaatgggct 3720
cgttggcttt gcagacgtca gagacctctt gtggttagat gaagaagcta tggaacaggg 3780
cgtgtccgac tacattaagg gtctcggaga tgcttttgga acaggcttca ctgacgcagt 3840
ctcaagggag gttgaagctc tcaagaacta tcttataggg tctgaaggag cagttgagaa 3900
aattttgaaa aatcttatta aactaatctc tgcactggtg attgtgatca gaagtgatta 3960
cgacatggtt accctcactg caaccttagc gctgataggt tgtcatggca gtccttgggc 4020
ttggattaaa gccaaaacag cctccatctt aggtatccct atcgcccaaa agcagagcgc 4080
ttcctggctc aagaagttca atgacatggc caacgccgct aaggggttag agtgggtttc 4140
caacaagatc agcaaattta ttgattggct taaggagaaa atagtaccag cagccaggga 4200
gaaggttgaa ttcctaaata acttgaaaca gctgccactg ctagagaatc agatctcgaa 4260
cttggaacaa tctgctgctt cacaagagga ccttgaagtc atgtttggga atgtgtcgta 4320
cctagctcac ttctgtcgca agtttcaacc gctatacgcc acggaagcta aaagagtcta 4380
tgccctggag aagagaatga ataactatat gcagttcaag agcaaacacc gaattgaacc 4440
tgtatgtctc attattaggg gctcaccagg caccgggaag tctctagcca ctggtattat 4500
tgctcgagca atcgctgata agtaccactc cagcgtgtac tcgctcccac cagacccgga 4560
tcattttgac ggttacaagc aacaggtggt tacagtgatg gatgatttgt gtcaaaaccc 4620
cgatggtaag gatatgtcct tattctgtca aatggtatcc accgtagatt tcattccacc 4680
aatggcttct ctcgaggaga agggagtttc cttcacctct aagtttgtca tcgcatccac 4740
taatgccagt aatatcatag taccaacagt gtctgattct gacgctattc gccgcaggtt 4800
ctacatggac tgtgacattg aagtgacaga ctcgtacaaa acagatctag gtagactgga 4860
tgcagggcga gccgctaaac tgtgttctga aaataacact gcaaatttca aacgttgcag 4920
cccattagtg tgtgggaaag ccatccaact tagagataga aagtctaaag tcagatacag 4980
tgtggatacg gtggtttcag aacttattag ggaatacagc aataggtccg ccattggtaa 5040
cacaatcgag gctcttttcc aaggtccacc caagttcagg ccaattagga ttagccttga 5100
agaaaaacca gccccagacg ctattagcga tctccttgct agtgtagata gtgaagaagt 5160
gcgccagtac tgcagggatc aaggctggat tattcctgaa gctcccacca atgtggagcg 5220
gcaccttaat agagcggtgc tcgtcatgca atccatcacc acagtagtgg cggttgtttc 5280
gttggtgtac gtcatctaca agctctttgc agggtttcag ggtgcatatt ctggtgctcc 5340
taagcaagtg cttaagaaac ctgctcttcg cacagcaaca gtgcagggtc cgagccttga 5400
ctttgctctc tccctactga gaaggaacat caggcaggtc caaacagacc aagggcattt 5460
caccatgttg ggtgttaggg atcgcttagc agtcctccca cgccactcac aacctggcaa 5520
aaccatttgg attgagcaca aactcgtgaa cgtccttgat gcagttgaac tggtggatga 5580
gcaaggagtc aacctggaat taaccctcat cactcttgac accaacgaga agtttaggga 5640
tatcaccaaa ttcatcccag aaaatatcag cactgctagc gatgccaccc tagtgatcaa 5700
cacggagcac atgccgtcaa tgtttgtccc ggtgggtgac gttgtgcagt atggcttttt 5760
gaatctcagt ggcaagccta cccatcgcac catgatgtac aattttccta ctaaagcagg 5820
acagtgtgga ggagtggtga catctgttgg gaaggttgtc ggtattcaca ttggtggcaa 5880
tggcagacaa ggtttttgcg caggcctcaa aaggagttac tttgctagtg aacaaggaga 5940
gatccagtgg gttaagccca ataaagaaac tggaagactc aacatcaatg gaccaacccg 6000
caccaagtta gaacctagtg tattccatga catcttcgag ggaaataagg aaccagctgt 6060
cttgcacagt aaagaccccc gacttgaggt agattttgaa caggccctgt tctctaagta 6120
tgtgggaaac acactacatg agcctgacga gtacatcaaa gaggcagctc tacattatgc 6180
aaaccaatta aagcaactag aaatcaatac ctctcaaatg agcatggagg aggcctgcta 6240
tggtactgag aatcttgagg ctattgatct tcacactagt gcaggttacc cctatagtgc 6300
cctagggata aagaaaagag acatcttaga ccctaccacc agggacgtga gtagaatgaa 6360
gttctacatg gacaagtatg gtcttgatct tccctactcc acttatgtca aggacgagct 6420
acgctcgatt gataaaatca agaaagggaa gtcccgcctg atcgaggcca gtagtctaaa 6480
tgattcagtg tacctcagaa tggctttcgg gcatttgtat gaggctttcc acgcaaatcc 6540
tgggacgata actggatcgg ccgtggggtg taaccctgac acattctgga gcaagctgcc 6600
aattttgctc cctggttcac tctttgcctt tgactactca ggctatgatg ccagccttag 6660
ccctgtctgg ttcagagcat tagaattggt tcttagggag atagggtata gtgaagaggc 6720
aatctcactc attgagggaa tcaaccacac acatcatgtg tatcgtaata agacctattg 6780
cgtgcttggt gggatgccct caggctgttc aggaacatcc atcttcaact caatgatcaa 6840
caacattatt atcagagcac tgctcataaa aacatttaag ggcattgatt tggatgaact 6900
caacatggtc gcttatggag acgatgtgct cgctagctat cccttcccaa ttgattgctt 6960
ggaactagca aagactggta aggagtatgg tctgaccatg acccctgctg ataaatctcc 7020
ttgctttaat gaggtcaatt ggggtaatgc gaccttcctc aaaaggggct ttttgcccga 7080
tgaacagttt ccatttttga ttcaccctac tatgccaatg agggagatcc atgagtccat 7140
tcgatggacc aaggacgcac ggaacactca agatcatgtg cggtccttgt gcctcctagc 7200
atggcataat ggtaagcaag aatacgagaa gtttgtgagc acaattaggt ctgtcccagt 7260
agggagagcg ttggctattc caaattatga aaatcttaga cgaaattggc tcgagttatt 7320
ttagaggtta tacacacctc aaccccacca gaaatctggt cgtgaatgtg actggtgggg 7380
gtaaatttgt tataaccaga atagc 7405
<210> 3
<211> 1987
<212> DNA
<213> Artificial
<400> 3
agcgctagcg gagtgtatac tggcttacta tgttggcact gatgagggtg tcagtgaagt 60
gcttcatgtg gcaggagaaa aaaggctgca ccggtgcgtc agcagaatat gtgatacagg 120
atatattccg cttcctcgct cactgactcg ctacgctcgg tcgttcgact gcggcgagcg 180
gaaatggctt acgaacgggg cggagatttc ctggaagatg ccaggaagat acttaacagg 240
gaagtgagag ggccgcggca aagccgtttt tccataggct ccgcccccct gacaagcatc 300
acgaaatctg acgctcaaat cagtggtggc gaaacccgac aggactataa agataccagg 360
cgtttcccct ggcggctccc tcgtgcgctc tcctgttcct gcctttcggt ttaccggtgt 420
cattccgctg ttatggccgc gtttgtctca ttccacgcct gacactcagt tccgggtagg 480
cagttcgctc caagctggac tgtatgcacg aaccccccgt tcagtccgac cgctgcgcct 540
tatccggtaa ctatcgtctt gagtccaacc cggaaagaca tgcaaaagca ccactggcag 600
cagccactgg taattgattt agaggagtta gtcttgaagt catgcgccgg ttaaggctaa 660
actgaaagga caagttttgg tgactgcgct cctccaagcc agttacctcg gttcaaagag 720
ttggtagctc agagaacctt cgaaaaaccg ccctgcaagg cggttttttc gttttcagag 780
caagagatta cgcgcagacc aaaacgatct caagaagatc atcttattaa ggggtctgac 840
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 900
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 960
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 1020
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 1080
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 1140
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 1200
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 1260
gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg 1320
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 1380
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 1440
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 1500
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 1560
atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc gccacatagc 1620
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 1680
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 1740
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 1800
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 1860
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 1920
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtgtcgacg 1980
cggccgc 1987
<210> 4
<211> 2193
<212> PRT
<213> Artificial
<400> 4
Met Gly Ser Gln Val Ser Thr Gln Arg Ser Gly Ser Tyr Glu Asn Ser
1 5 1015
Asn Ser Ala Thr Glu Gly Ser Thr Ile Asn Tyr Thr Thr Ile Asn Tyr
202530
Tyr Lys Asp Ser Tyr Ala Ala Thr Ala Gly Lys Gln Ser Leu Lys Gln
354045
Asp Pro Asp Lys Phe Ala Asn Pro Val Lys Asp Ile Phe Thr Glu Met
505560
Ala Ala Pro Leu Lys Ser Pro Ser Ala Glu Ala Cys Gly Tyr Ser Asp
65707580
Arg Val Ala Gln Leu Thr Ile Gly Asn Ser Thr Ile Thr Thr Gln Glu
859095
Ala Ala Asn Ile Ile Val Gly Tyr Gly Glu Trp Pro Ser Tyr Cys Ser
100 105 110
Asp Ser Asp Ala Thr Ala Val Asp Lys Pro Thr Arg Pro Asp Val Ser
115 120 125
Val Asn Arg Phe Tyr Thr Leu Asp Thr Lys Leu Trp Glu Lys Ser Ser
130 135 140
Lys Gly Trp Tyr Trp Lys Phe Pro Asp Val Leu Thr Glu Thr Gly Val
145 150 155 160
Phe Gly Gln Asn Ala Gln Phe His Tyr Leu Tyr Arg Ser Gly Phe Cys
165 170 175
Ile His Val Gln Cys Asn Ala Ser Lys Phe His Gln Gly Ala Leu Leu
180 185 190
Val Ala Val Leu Pro Glu Tyr Val Ile Gly Thr Val Ala Gly Gly Thr
195 200 205
Gly Thr Glu Asp Thr His Pro Pro Tyr Lys Gln Thr Gln Pro Gly Ala
210 215 220
Asp Gly Phe Glu Leu Gln His Pro Tyr Val Leu Asp Ala Gly Ile Pro
225 230 235 240
Ile Ser Gln Leu Thr Val Cys Pro His Gln Trp Ile Asn Leu Arg Thr
245 250 255
Asn Asn Cys Ala Thr Ile Ile Val Pro Tyr Ile Asn Ala Leu Pro Phe
260 265 270
Asp Ser Ala Leu Asn His Cys Asn Phe Gly Leu Leu Val Val Pro Ile
275 280 285
Ser Pro Leu Asp Tyr Asp Gln Gly Ala Thr Pro Val Ile Pro Ile Thr
290 295 300
Ile Thr Leu Ala Pro Met Cys Ser Glu Phe Ala Gly Leu Arg Gln Ala
305 310 315 320
Val Thr Gln Gly Phe Pro Thr Glu Leu Lys Pro Gly Thr Asn Gln Phe
325 330 335
Leu Thr Thr Asp Asp Gly Val Ser Ala Pro Ile Leu Pro Asn Phe His
340 345 350
Pro Thr Pro Cys Ile His Ile Pro Gly Glu Val Arg Asn Leu Leu Glu
355 360 365
Leu Cys Gln Val Glu Thr Ile Leu Glu Val Asn Asn Val Pro Thr Asn
370 375 380
Ala Thr Ser Leu Met Glu Arg Leu Arg Phe Pro Val Ser Ala Gln Ala
385 390 395 400
Gly Lys Gly Glu Leu Cys Ala Val Phe Arg Ala Asp Pro Gly Arg Asn
405 410 415
Gly Pro Trp Gln Ser Thr Leu Leu Gly Gln Leu Cys Gly Tyr Tyr Thr
420 425 430
Gln Trp Ser Gly Ser Leu Glu Val Thr Phe Met Phe Thr Gly Ser Phe
435 440 445
Met Ala Thr Gly Lys Met Leu Ile Ala Tyr Thr Pro Pro Gly Gly Pro
450 455 460
Leu Pro Lys Asp Arg Ala Thr Ala Met Leu Gly Thr His Val Ile Trp
465 470 475 480
Asp Phe Gly Leu Gln Ser Ser Val Thr Leu Val Ile Pro Trp Ile Ser
485 490 495
Asn Thr His Tyr Arg Ala His Ala Arg Asp Gly Val Phe Asp Tyr Tyr
500 505 510
Thr Thr Gly Leu Val Ser Ile Trp Tyr Gln Thr Asn Tyr Val Val Pro
515 520 525
Ile Gly Ala Pro Asn Thr Ala Tyr Ile Ile Ala Leu Ala Ala Ala Gln
530 535 540
Lys Asn Phe Thr Met Lys Leu Cys Lys Asp Ala Ser Asp Ile Leu Gln
545 550 555 560
Thr Gly Thr Ile Gln Gly Asp Arg Val Ala Asp Val Ile Glu Ser Ser
565 570 575
Ile Gly Asp Ser Val Ser Arg Ala Leu Thr His Ala Leu Pro Ala Pro
580 585 590
Thr Gly Gln Asn Thr Gln Val Ser Ser His Arg Leu Asp Thr Gly Lys
595 600 605
Val Pro Ala Leu Gln Ala Ala Glu Ile Gly Ala Ser Ser Asn Ala Ser
610 615 620
Asp Glu Ser Met Ile Glu Thr Arg Cys Val Leu Asn Ser His Ser Thr
625 630 635 640
Ala Glu Thr Thr Leu Asp Ser Phe Phe Ser Arg Ala Gly Leu Val Gly
645 650 655
Glu Ile Asp Leu Pro Leu Glu Gly Thr Thr Asn Pro Asn Gly Tyr Ala
660 665 670
Asn Trp Asp Ile Asp Ile Thr Gly Tyr Ala Gln Met Arg Arg Lys Val
675 680 685
Glu Leu Phe Thr Tyr Met Arg Phe Asp Ala Glu Phe Thr Phe Val Ala
690 695 700
Cys Thr Pro Thr Gly Glu Val Val Pro Gln Leu Leu Gln Tyr Met Phe
705 710 715 720
Val Pro Pro Gly Ala Pro Lys Pro Asp Ser Arg Glu Ser Leu Ala Trp
725 730 735
Gln Thr Ala Thr Asn Pro Ser Val Phe Val Lys Leu Ser Asp Pro Pro
740 745 750
Ala Gln Val Ser Val Pro Phe Met Ser Pro Ala Ser Ala Tyr Gln Trp
755 760 765
Phe Tyr Asp Gly Tyr Pro Thr Phe Gly Glu His Lys Gln Glu Lys Asp
770 775 780
Leu Glu Tyr Gly Ala Cys Pro Asn Asn Met Met Gly Thr Phe Ser Val
785 790 795 800
Arg Thr Val Gly Thr Ser Lys Ser Lys Tyr Pro Leu Val Val Arg Ile
805 810 815
Tyr Met Arg Met Lys His Val Arg Ala Trp Ile Pro Arg Pro Met Arg
820 825 830
Asn Gln Asn Tyr Leu Phe Lys Ala Asn Pro Asn Tyr Ala Gly Asn Ser
835 840 845
Ile Lys Pro Thr Gly Ala Ser Arg Thr Ala Ile Thr Thr Leu Gly Lys
850 855 860
Phe Gly Gln Gln Ser Gly Ala Ile Tyr Val Gly Asn Phe Arg Val Val
865 870 875 880
Asn Arg His Leu Ala Thr His Asn Asp Trp Ala Asn Leu Val Trp Glu
885 890 895
Asp Ser Ser Arg Asp Leu Leu Val Ser Ser Thr Thr Ala Gln Gly Cys
900 905 910
Asp Thr Ile Ala Arg Cys Asp Cys Gln Thr Gly Val Tyr Tyr Cys Asn
915 920 925
Ser Met Arg Lys His Tyr Pro Val Ser Phe Ser Lys Pro Ser Leu Ile
930 935 940
Tyr Val Glu Ala Ser Glu Tyr Tyr Pro Ala Arg Tyr Gln Ser His Leu
945 950 955 960
Met Leu Ala Gln Gly His Ser Glu Pro Gly Asp Cys Gly Gly Ile Leu
965 970 975
Arg Cys Gln His Gly Val Ile Gly Ile Val Ser Thr Gly Gly Asn Gly
980 985 990
Leu Val Gly Phe Ala Asp Val Arg Asp Leu Leu Trp Leu Asp Glu Glu
995 10001005
Ala Met Glu Gln Gly Val Ser Asp Tyr Ile Lys Gly Leu Gly Asp Ala
101010151020
Phe Gly Thr Gly Phe Thr Asp Ala Val Ser Arg Glu Val Glu Ala Leu
1025103010351040
Lys Asn Tyr Leu Ile Gly Ser Glu Gly Ala Val Glu Lys Ile Leu Lys
104510501055
Asn Leu Ile Lys Leu Ile Ser Ala Leu Val Ile Val Ile Arg Ser Asp
106010651070
Tyr Asp Met Val Thr Leu Thr Ala Thr Leu Ala Leu Ile Gly Cys His
107510801085
Gly Ser Pro Trp Ala Trp Ile Lys Ala Lys Thr Ala Ser Ile Leu Gly
109010951100
Ile Pro Ile Ala Gln Lys Gln Ser Ala Ser Trp Leu Lys Lys Phe Asn
1105111011151120
Asp Met Ala Asn Ala Ala Lys Gly Leu Glu Trp Val Ser Asn Lys Ile
112511301135
Ser Lys Phe Ile Asp Trp Leu Lys Glu Lys Ile Val Pro Ala Ala Arg
114011451150
Glu Lys Val Glu Phe Leu Asn Asn Leu Lys Gln Leu Pro Leu Leu Glu
115511601165
Asn Gln Ile Ser Asn Leu Glu Gln Ser Ala Ala Ser Gln Glu Asp Leu
117011751180
Glu Val Met Phe Gly Asn Val Ser Tyr Leu Ala His Phe Cys Arg Lys
1185119011951200
Phe Gln Pro Leu Tyr Ala Thr Glu Ala Lys Arg Val Tyr Ala Leu Glu
120512101215
Lys Arg Met Asn Asn Tyr Met Gln Phe Lys Ser Lys His Arg Ile Glu
122012251230
Pro Val Cys Leu Ile Ile Arg Gly Ser Pro Gly Thr Gly Lys Ser Leu
123512401245
Ala Thr Gly Ile Ile Ala Arg Ala Ile Ala Asp Lys Tyr His Ser Ser
125012551260
Val Tyr Ser Leu Pro Pro Asp Pro Asp His Phe Asp Gly Tyr Lys Gln
1265127012751280
Gln Val Val Thr Val Met Asp Asp Leu Cys Gln Asn Pro Asp Gly Lys
128512901295
Asp Met Ser Leu Phe Cys Gln Met Val Ser Thr Val Asp Phe Ile Pro
130013051310
Pro Met Ala Ser Leu Glu Glu Lys Gly Val Ser Phe Thr Ser Lys Phe
131513201325
Val Ile Ala Ser Thr Asn Ala Ser Asn Ile Ile Val Pro Thr Val Ser
133013351340
Asp Ser Asp Ala Ile Arg Arg Arg Phe Tyr Met Asp Cys Asp Ile Glu
1345135013551360
Val Thr Asp Ser Tyr Lys Thr Asp Leu Gly Arg Leu Asp Ala Gly Arg
136513701375
Ala Ala Lys Leu Cys Ser Glu Asn Asn Thr Ala Asn Phe Lys Arg Cys
138013851390
Ser Pro Leu Val Cys Gly Lys Ala Ile Gln Leu Arg Asp Arg Lys Ser
139514001405
Lys Val Arg Tyr Ser Val Asp Thr Val Val Ser Glu Leu Ile Arg Glu
141014151420
Tyr Ser Asn Arg Ser Ala Ile Gly Asn Thr Ile Glu Ala Leu Phe Gln
1425143014351440
Gly Pro Pro Lys Phe Arg Pro Ile Arg Ile Ser Leu Glu Glu Lys Pro
144514501455
Ala Pro Asp Ala Ile Ser Asp Leu Leu Ala Ser Val Asp Ser Glu Glu
146014651470
Val Arg Gln Tyr Cys Arg Asp Gln Gly Trp Ile Ile Pro Glu Ala Pro
147514801485
Thr Asn Val Glu Arg His Leu Asn Arg Ala Val Leu Val Met Gln Ser
149014951500
Ile Thr Thr Val Val Ala Val Val Ser Leu Val Tyr Val Ile Tyr Lys
1505151015151520
Leu Phe Ala Gly Phe Gln Gly Ala Tyr Ser Gly Ala Pro Lys Gln Val
152515301535
Leu Lys Lys Pro Ala Leu Arg Thr Ala Thr Val Gln Gly Pro Ser Leu
154015451550
Asp Phe Ala Leu Ser Leu Leu Arg Arg Asn Ile Arg Gln Val Gln Thr
155515601565
Asp Gln Gly His Phe Thr Met Leu Gly Val Arg Asp Arg Leu Ala Val
157015751580
Leu Pro Arg His Ser Gln Pro Gly Lys Thr Ile Trp Ile Glu His Lys
1585159015951600
Leu Val Asn Val Leu Asp Ala Val Glu Leu Val Asp Glu Gln Gly Val
160516101615
Asn Leu Glu Leu Thr Leu Ile Thr Leu Asp Thr Asn Glu Lys Phe Arg
162016251630
Asp Ile Thr Lys Phe Ile Pro Glu Asn Ile Ser Thr Ala Ser Asp Ala
163516401645
Thr Leu Val Ile Asn Thr Glu His Met Pro Ser Met Phe Val Pro Val
165016551660
Gly Asp Val Val Gln Tyr Gly Phe Leu Asn Leu Ser Gly Lys Pro Thr
1665167016751680
His Arg Thr Met Met Tyr Asn Phe Pro Thr Lys Ala Gly Gln Cys Gly
168516901695
Gly Val Val Thr Ser Val Gly Lys Val Val Gly Ile His Ile Gly Gly
170017051710
Asn Gly Arg Gln Gly Phe Cys Ala Gly Leu Lys Arg Ser Tyr Phe Ala
171517201725
Ser Glu Gln Gly Glu Ile Gln Trp Val Lys Pro Asn Lys Glu Thr Gly
173017351740
Arg Leu Asn Ile Asn Gly Pro Thr Arg Thr Lys Leu Glu Pro Ser Val
1745175017551760
Phe His Asp Ile Phe Glu Gly Asn Lys Glu Pro Ala Val Leu His Ser
176517701775
Lys Asp Pro Arg Leu Glu Val Asp Phe Glu Gln Ala Leu Phe Ser Lys
178017851790
Tyr Val Gly Asn Thr Leu His Glu Pro Asp Glu Tyr Ile Lys Glu Ala
179518001805
Ala Leu His Tyr Ala Asn Gln Leu Lys Gln Leu Glu Ile Asn Thr Ser
181018151820
Gln Met Ser Met Glu Glu Ala Cys Tyr Gly Thr Glu Asn Leu Glu Ala
1825183018351840
Ile Asp Leu His Thr Ser Ala Gly Tyr Pro Tyr Ser Ala Leu Gly Ile
184518501855
Lys Lys Arg Asp Ile Leu Asp Pro Thr Thr Arg Asp Val Ser Arg Met
186018651870
Lys Phe Tyr Met Asp Lys Tyr Gly Leu Asp Leu Pro Tyr Ser Thr Tyr
187518801885
Val Lys Asp Glu Leu Arg Ser Ile Asp Lys Ile Lys Lys Gly Lys Ser
189018951900
Arg Leu Ile Glu Ala Ser Ser Leu Asn Asp Ser Val Tyr Leu Arg Met
1905191019151920
Ala Phe Gly His Leu Tyr Glu Ala Phe His Ala Asn Pro Gly Thr Ile
192519301935
Thr Gly Ser Ala Val Gly Cys Asn Pro Asp Thr Phe Trp Ser Lys Leu
194019451950
Pro Ile Leu Leu Pro Gly Ser Leu Phe Ala Phe Asp Tyr Ser Gly Tyr
195519601965
Asp Ala Ser Leu Ser Pro Val Trp Phe Arg Ala Leu Glu Leu Val Leu
197019751980
Arg Glu Ile Gly Tyr Ser Glu Glu Ala Ile Ser Leu Ile Glu Gly Ile
1985199019952000
Asn His Thr His His Val Tyr Arg Asn Lys Thr Tyr Cys Val Leu Gly
200520102015
Gly Met Pro Ser Gly Cys Ser Gly Thr Ser Ile Phe Asn Ser Met Ile
202020252030
Asn Asn Ile Ile Ile Arg Ala Leu Leu Ile Lys Thr Phe Lys Gly Ile
203520402045
Asp Leu Asp Glu Leu Asn Met Val Ala Tyr Gly Asp Asp Val Leu Ala
205020552060
Ser Tyr Pro Phe Pro Ile Asp Cys Leu Glu Leu Ala Lys Thr Gly Lys
2065207020752080
Glu Tyr Gly Leu Thr Met Thr Pro Ala Asp Lys Ser Pro Cys Phe Asn
208520902095
Glu Val Asn Trp Gly Asn Ala Thr Phe Leu Lys Arg Gly Phe Leu Pro
210021052110
Asp Glu Gln Phe Pro Phe Leu Ile His Pro Thr Met Pro Met Arg Glu
211521202125
Ile His Glu Ser Ile Arg Trp Thr Lys Asp Ala Arg Asn Thr Gln Asp
213021352140
His Val Arg Ser Leu Cys Leu Leu Ala Trp His Asn Gly Lys Gln Glu
2145215021552160
Tyr Glu Lys Phe Val Ser Thr Ile Arg Ser Val Pro Val Gly Arg Ala
216521702175
Leu Ala Ile Pro Asn Tyr Glu Asn Leu Arg Arg Asn Trp Leu Glu Leu
218021852190
Phe
<210> 5
<211> 9982
<212> DNA
<213> Artificial
<400> 5
gctagcggag tgtatactgg cttactatgt tggcactgat gagggtgtca gtgaagtgct 60
tcatgtggca ggagaaaaaa ggctgcaccg gtgcgtcagc agaatatgtg atacaggata 120
tattccgctt cctcgctcac tgactcgcta cgctcggtcg ttcgactgcg gcgagcggaa 180
atggcttacg aacggggcgg agatttcctg gaagatgcca ggaagatact taacagggaa 240
gtgagagggc cgcggcaaag ccgtttttcc ataggctccg cccccctgac aagcatcacg 300
aaatctgacg ctcaaatcag tggtggcgaa acccgacagg actataaaga taccaggcgt 360
ttcccctggc ggctccctcg tgcgctctcc tgttcctgcc tttcggttta ccggtgtcat 420
tccgctgtta tggccgcgtt tgtctcattc cacgcctgac actcagttcc gggtaggcag 480
ttcgctccaa gctggactgt atgcacgaac cccccgttca gtccgaccgc tgcgccttat 540
ccggtaacta tcgtcttgag tccaacccgg aaagacatgc aaaagcacca ctggcagcag 600
ccactggtaa ttgatttaga ggagttagtc ttgaagtcat gcgccggtta aggctaaact 660
gaaaggacaa gttttggtga ctgcgctcct ccaagccagt tacctcggtt caaagagttg 720
gtagctcaga gaaccttcga aaaaccgccc tgcaaggcgg ttttttcgtt ttcagagcaa 780
gagattacgc gcagaccaaa acgatctcaa gaagatcatc ttattaaggg gtctgacgct 840
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 900
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 960
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 1020
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 1080
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 1140
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 1200
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 1260
aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt 1320
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 1380
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 1440
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 1500
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 1560
cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga 1620
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 1680
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 1740
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 1800
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 1860
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 1920
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt gtcgacgcgg 1980
ccgctaatac gactcactat aggttaaaac agcctgtggg ttgcacccac tcacagggcc 2040
tactgggcgc aagcactctg gtacctcggt acctttgtgc gcctgtttta cacccccccc 2100
ccaatgaaac ttagaagcaa taaaccacga tcaatagcag gcataacgct ccagttatgt 2160
cttgatcaag cacttctgtt tccccggact gagtatcaat agactgctcg cgcggttgaa 2220
ggagaaaacg ttcgttatcc ggctaactac ttcggaaaac ctagtaacac catgaaagtt 2280
gcggagagct tcgttcagca ctcccccagt gtagatcagg tcgatgagtc accgcgttcc 2340
ccacgggcga ccgtggcggt ggctgcgttg gcggcctgcc catggggtaa cccatggggc 2400
gctctaatac ggacatggtg tgaagagtct actgagctag ttggtagtcc tccggcccct 2460
gaatgcggct aatcccaact gcggagcaca cgcccacaag ccagcgggta gtgtgtcgta 2520
acgggtaact ctgcagcgga accgactact ttgggtgtcc gtgtttcctt ttatctttat 2580
attggctgct tatggtgaca attaaagaat tgttaccata tagctattgg attagccatc 2640
cggtgtgcaa cagagcaatt atttacctat ttattggttt tgtaccatta acctcgaatt 2700
ctgtgaccac ccttaattat atcttgaccc ttaacacagc taaactctag aatggtcttc 2760
acactcgaag atttcgttgg ggactggcga cagacagccg gctacaacct ggaccaagtc 2820
cttgaacagg gaggtgtgtc cagtttgttt cagaatctcg gggtgtccgt aactccgatc 2880
caaaggattg tcctgagcgg tgaaaatggg ctgaagatcg acatccatgt catcatcccg 2940
tatgaaggtc tgagcggcga ccaaatgggc cagatcgaaa aaatttttaa ggtggtgtac 3000
cctgtggatg atcatcactt taaggtgatc ctgcactatg gcacactggt aatcgacggg 3060
gttacgccga acatgatcga ctatttcgga cggccgtatg aaggcatcgc cgtgttcgac 3120
ggcaaaaaga tcactgtaac agggaccctg tggaacggca acaaaattat cgacgagcgc 3180
ctgatcaacc ccgacggctc cctgctgttc cgagtaacca tcaacggagt gaccggctgg 3240
cggctgtgcg aacgcattct ggcgatgcat gcgatcacca ctcttggttc gcaagtgtct 3300
acacagcgct ccggttctta cgaaaactca aactcagcca ctgagggttc taccataaac 3360
tacaccacca ttaattacta caaagactcc tatgctgcca cagcaggcaa acagagtctc 3420
aagcaggatc cagacaagtt tgcaaatcct gttaaagaca tattcaccga aatggcagcg 3480
ccactgaagt ccccatccgc tgaggcatgt ggatacagtg atcgagtggc gcaattaact 3540
attggcaact ccaccatcac gacgcaagaa gcggctaaca tcatagtcgg ctatggtgag 3600
tggccttcct actgctcaga ttctgacgct acagcagtgg ataaaccaac gcgcccggat 3660
gtttcagtga acaggtttta cacattggac actaaattgt gggagaaatc gtccaaggga 3720
tggtactgga agttcccgga tgtgttaact gaaactgggg tttttgggca aaatgcacaa 3780
ttccactacc tctaccgatc agggttctgc atccacgtgc agtgcaatgc cagtaaattc 3840
caccaaggag cactcctagt cgctgtccta ccagagtatg tcattgggac agtggcaggc 3900
ggtacaggga cggaagacac ccaccccccc tacaagcaga cccaacccgg cgccgatggt 3960
ttcgagttgc aacacccgta cgtgcttgat gctggcatcc caatatcaca gttaacagtg 4020
tgcccacacc agtggattaa tttgaggacc aacaattgtg ctacaataat agtgccatac 4080
attaacgcac tgccttttga ttctgccttg aaccattgca actttggcct gttagttgtg 4140
cctattagcc cactagacta cgaccaagga gcaacgccag taatccctat aactatcaca 4200
ttggccccaa tgtgctctga attcgcaggt cttaggcagg cagtcacgca agggttcccc 4260
accgagctaa aacctggcac aaatcaattt ttaaccaccg atgatggcgt ctcagcacct 4320
attctaccaa acttccaccc caccccgtgt atccacatac ctggtgaagt taggaacttg 4380
ctagagttat gccaggtgga gaccattctg gaggttaaca atgtgcccac gaatgccact 4440
agcttaatgg agagactgcg cttcccggtc tcagcacaag cagggaaagg tgaactgtgt 4500
gcggtgttta gagccgatcc tgggcgaaat ggaccatggc aatccacctt actgggccag 4560
ttgtgcgggt actacaccca atggtcaggg tcattggaag tcaccttcat gtttactgga 4620
tccttcatgg ctaccggcaa gatgctcata gcctatacac cgccaggggg tcctctgccc 4680
aaggaccggg cgaccgccat gttgggcacg cacgtcatct gggattttgg gctgcaatcg 4740
tctgttaccc ttgtaatacc atggatcagt aacactcatt atagagcaca tgcccgagat 4800
ggagtgtttg actattacac tacagggtta gtcagtatat ggtaccagac aaattacgtg 4860
gttccaatcg gtgcgcccaa cacagcctat ataatagcac tagcggcagc ccaaaagaac 4920
ttcactatga aattgtgcaa ggatgctagt gatatcctgc agacgggcac catccaggga 4980
gatagggtgg cagatgtaat tgaaagttcc ataggagata gcgtgagcag agccctcact 5040
cacgctctac cagcacccac aggccaaaac acacaggtga gcagtcatcg actggataca 5100
ggcaaggttc cagcactcca agctgctgaa attggggcat catcaaatgc tagtgacgag 5160
agcatgattg aaacacgttg tgttcttaac tcgcatagta cagctgagac cactcttgat 5220
agtttcttca gtagggcagg attagttgga gagatagatc tccctcttga gggcacaact 5280
aacccaaatg gttatgccaa ctgggacata gatataacag gttacgcgca aatgcgtaga 5340
aaggtagagc tattcaccta catgcgtttt gatgcagagt tcacttttgt tgcgtgcaca 5400
cccaccgggg aggttgtccc acaattgctc caatatatgt ttgtgccacc tggagcccct 5460
aagccagatt ctagggaatc ccttgcatgg caaaccgcca ccaacccctc agtttttgtc 5520
aagctgtcag accctccggc gcaggtttca gtgccattca tgtcacctgc gagtgcttat 5580
caatggtttt atgacggata tcccacattc ggagaacaca aacaggagaa agaccttgaa 5640
tacggggcat gtcctaataa catgatgggt acattctcag tgcggactgt ggggacctcc 5700
aagtccaagt accctttagt ggttaggatt tacatgagaa tgaagcacgt cagggcgtgg 5760
atacctcgcc cgatgcgcaa ccagaactac ctgttcaaag ccaacccaaa ttatgctggc 5820
aactctatta agccaactgg tgccagtcgc acagcgatca ccactcttgg gaaatttgga 5880
caacagtctg gggctattta tgtgggcaac tttagagtgg tcaaccgaca tcttgccacc 5940
cataatgatt gggcaaatct tgtttgggaa gacagctctc gcgacttgct cgtgtcatcc 6000
accactgccc aaggttgtga cacgattgcc cgttgcgatt gccagacagg ggtgtactac 6060
tgtaactcga tgagaaaaca ctacccagtc agtttttcaa aacccagcct gatctatgta 6120
gaggctagcg agtattaccc agccaggtac caatcacatc tcatgctcgc acagggtcac 6180
tcggaacctg gtgattgcgg tggtatcctt aggtgccaac atggcgtcat cggcatagtg 6240
tctactggtg gcaatgggct cgttggcttt gcagacgtca gagacctctt gtggttagat 6300
gaagaagcta tggaacaggg cgtgtccgac tacattaagg gtctcggaga tgcttttgga 6360
acaggcttca ctgacgcagt ctcaagggag gttgaagctc tcaagaacta tcttataggg 6420
tctgaaggag cagttgagaa aattttgaaa aatcttatta aactaatctc tgcactggtg 6480
attgtgatca gaagtgatta cgacatggtt accctcactg caaccttagc gctgataggt 6540
tgtcatggca gtccttgggc ttggattaaa gccaaaacag cctccatctt aggtatccct 6600
atcgcccaaa agcagagcgc ttcctggctc aagaagttca atgacatggc caacgccgct 6660
aaggggttag agtgggtttc caacaagatc agcaaattta ttgattggct taaggagaaa 6720
atagtaccag cagccaggga gaaggttgaa ttcctaaata acttgaaaca gctgccactg 6780
ctagagaatc agatctcgaa cttggaacaa tctgctgctt cacaagagga ccttgaagtc 6840
atgtttggga atgtgtcgta cctagctcac ttctgtcgca agtttcaacc gctatacgcc 6900
acggaagcta aaagagtcta tgccctggag aagagaatga ataactatat gcagttcaag 6960
agcaaacacc gaattgaacc tgtatgtctc attattaggg gctcaccagg caccgggaag 7020
tctctagcca ctggtattat tgctcgagca atcgctgata agtaccactc cagcgtgtac 7080
tcgctcccac cagacccgga tcattttgac ggttacaagc aacaggtggt tacagtgatg 7140
gatgatttgt gtcaaaaccc cgatggtaag gatatgtcct tattctgtca aatggtatcc 7200
accgtagatt tcattccacc aatggcttct ctcgaggaga agggagtttc cttcacctct 7260
aagtttgtca tcgcatccac taatgccagt aatatcatag taccaacagt gtctgattct 7320
gacgctattc gccgcaggtt ctacatggac tgtgacattg aagtgacaga ctcgtacaaa 7380
acagatctag gtagactgga tgcagggcga gccgctaaac tgtgttctga aaataacact 7440
gcaaatttca aacgttgcag cccattagtg tgtgggaaag ccatccaact tagagataga 7500
aagtctaaag tcagatacag tgtggatacg gtggtttcag aacttattag ggaatacagc 7560
aataggtccg ccattggtaa cacaatcgag gctcttttcc aaggtccacc caagttcagg 7620
ccaattagga ttagccttga agaaaaacca gccccagacg ctattagcga tctccttgct 7680
agtgtagata gtgaagaagt gcgccagtac tgcagggatc aaggctggat tattcctgaa 7740
gctcccacca atgtggagcg gcaccttaat agagcggtgc tcgtcatgca atccatcacc 7800
acagtagtgg cggttgtttc gttggtgtac gtcatctaca agctctttgc agggtttcag 7860
ggtgcatatt ctggtgctcc taagcaagtg cttaagaaac ctgctcttcg cacagcaaca 7920
gtgcagggtc cgagccttga ctttgctctc tccctactga gaaggaacat caggcaggtc 7980
caaacagacc aagggcattt caccatgttg ggtgttaggg atcgcttagc agtcctccca 8040
cgccactcac aacctggcaa aaccatttgg attgagcaca aactcgtgaa cgtccttgat 8100
gcagttgaac tggtggatga gcaaggagtc aacctggaat taaccctcat cactcttgac 8160
accaacgaga agtttaggga tatcaccaaa ttcatcccag aaaatatcag cactgctagc 8220
gatgccaccc tagtgatcaa cacggagcac atgccgtcaa tgtttgtccc ggtgggtgac 8280
gttgtgcagt atggcttttt gaatctcagt ggcaagccta cccatcgcac catgatgtac 8340
aattttccta ctaaagcagg acagtgtgga ggagtggtga catctgttgg gaaggttgtc 8400
ggtattcaca ttggtggcaa tggcagacaa ggtttttgcg caggcctcaa aaggagttac 8460
tttgctagtg aacaaggaga gatccagtgg gttaagccca ataaagaaac tggaagactc 8520
aacatcaatg gaccaacccg caccaagtta gaacctagtg tattccatga catcttcgag 8580
ggaaataagg aaccagctgt cttgcacagt aaagaccccc gacttgaggt agattttgaa 8640
caggccctgt tctctaagta tgtgggaaac acactacatg agcctgacga gtacatcaaa 8700
gaggcagctc tacattatgc aaaccaatta aagcaactag aaatcaatac ctctcaaatg 8760
agcatggagg aggcctgcta tggtactgag aatcttgagg ctattgatct tcacactagt 8820
gcaggttacc cctatagtgc cctagggata aagaaaagag acatcttaga ccctaccacc 8880
agggacgtga gtagaatgaa gttctacatg gacaagtatg gtcttgatct tccctactcc 8940
acttatgtca aggacgagct acgctcgatt gataaaatca agaaagggaa gtcccgcctg 9000
atcgaggcca gtagtctaaa tgattcagtg tacctcagaa tggctttcgg gcatttgtat 9060
gaggctttcc acgcaaatcc tgggacgata actggatcgg ccgtggggtg taaccctgac 9120
acattctgga gcaagctgcc aattttgctc cctggttcac tctttgcctt tgactactca 9180
ggctatgatg ccagccttag ccctgtctgg ttcagagcat tagaattggt tcttagggag 9240
atagggtata gtgaagaggc aatctcactc attgagggaa tcaaccacac acatcatgtg 9300
tatcgtaata agacctattg cgtgcttggt gggatgccct caggctgttc aggaacatcc 9360
atcttcaact caatgatcaa caacattatt atcagagcac tgctcataaa aacatttaag 9420
ggcattgatt tggatgaact caacatggtc gcttatggag acgatgtgct cgctagctat 9480
cccttcccaa ttgattgctt ggaactagca aagactggta aggagtatgg tctgaccatg 9540
acccctgctg ataaatctcc ttgctttaat gaggtcaatt ggggtaatgc gaccttcctc 9600
aaaaggggct ttttgcccga tgaacagttt ccatttttga ttcaccctac tatgccaatg 9660
agggagatcc atgagtccat tcgatggacc aaggacgcac ggaacactca agatcatgtg 9720
cggtccttgt gcctcctagc atggcataat ggtaagcaag aatacgagaa gtttgtgagc 9780
acaattaggt ctgtcccagt agggagagcg ttggctattc caaattatga aaatcttaga 9840
cgaaattggc tcgagttatt ttagaggtta tacacacctc aaccccacca gaaatctggt 9900
cgtgaatgtg actggtgggg gtaaatttgt tataaccaga atagcaaaaa aaaaaaaaaa 9960
aaaaaaaaaa aaaaaaagct ta 9982
<210> 6
<211> 10187
<212> DNA
<213> Artificial
<400> 6
gctagcggag tgtatactgg cttactatgt tggcactgat gagggtgtca gtgaagtgct 60
tcatgtggca ggagaaaaaa ggctgcaccg gtgcgtcagc agaatatgtg atacaggata 120
tattccgctt cctcgctcac tgactcgcta cgctcggtcg ttcgactgcg gcgagcggaa 180
atggcttacg aacggggcgg agatttcctg gaagatgcca ggaagatact taacagggaa 240
gtgagagggc cgcggcaaag ccgtttttcc ataggctccg cccccctgac aagcatcacg 300
aaatctgacg ctcaaatcag tggtggcgaa acccgacagg actataaaga taccaggcgt 360
ttcccctggc ggctccctcg tgcgctctcc tgttcctgcc tttcggttta ccggtgtcat 420
tccgctgtta tggccgcgtt tgtctcattc cacgcctgac actcagttcc gggtaggcag 480
ttcgctccaa gctggactgt atgcacgaac cccccgttca gtccgaccgc tgcgccttat 540
ccggtaacta tcgtcttgag tccaacccgg aaagacatgc aaaagcacca ctggcagcag 600
ccactggtaa ttgatttaga ggagttagtc ttgaagtcat gcgccggtta aggctaaact 660
gaaaggacaa gttttggtga ctgcgctcct ccaagccagt tacctcggtt caaagagttg 720
gtagctcaga gaaccttcga aaaaccgccc tgcaaggcgg ttttttcgtt ttcagagcaa 780
gagattacgc gcagaccaaa acgatctcaa gaagatcatc ttattaaggg gtctgacgct 840
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 900
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 960
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 1020
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 1080
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 1140
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 1200
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 1260
aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt 1320
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 1380
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 1440
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 1500
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 1560
cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga 1620
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 1680
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 1740
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 1800
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 1860
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 1920
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt gtcgacgcgg 1980
ccgctaatac gactcactat aggttaaaac agcctgtggg ttgcacccac tcacagggcc 2040
tactgggcgc aagcactctg gtacctcggt acctttgtgc gcctgtttta cacccccccc 2100
ccaatgaaac ttagaagcaa taaaccacga tcaatagcag gcataacgct ccagttatgt 2160
cttgatcaag cacttctgtt tccccggact gagtatcaat agactgctcg cgcggttgaa 2220
ggagaaaacg ttcgttatcc ggctaactac ttcggaaaac ctagtaacac catgaaagtt 2280
gcggagagct tcgttcagca ctcccccagt gtagatcagg tcgatgagtc accgcgttcc 2340
ccacgggcga ccgtggcggt ggctgcgttg gcggcctgcc catggggtaa cccatggggc 2400
gctctaatac ggacatggtg tgaagagtct actgagctag ttggtagtcc tccggcccct 2460
gaatgcggct aatcccaact gcggagcaca cgcccacaag ccagcgggta gtgtgtcgta 2520
acgggtaact ctgcagcgga accgactact ttgggtgtcc gtgtttcctt ttatctttat 2580
attggctgct tatggtgaca attaaagaat tgttaccata tagctattgg attagccatc 2640
cggtgtgcaa cagagcaatt atttacctat ttattggttt tgtaccatta acctcgaatt 2700
ctgtgaccac ccttaattat atcttgaccc ttaacacagc taaaccatat gatggtgagc 2760
aagggcgagg agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta 2820
aacggccaca agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg 2880
accctgaagt tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc 2940
accctgacct acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac 3000
ttcttcaagt ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac 3060
gacggcaact acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc 3120
atcgagctga agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag 3180
tacaactaca acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag 3240
gtgaacttca agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac 3300
cagcagaaca cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc 3360
acccagtccg ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag 3420
ttcgtgaccg ccgccgggat cactctcggc atggacgagc tgtacaagat gcatgcgatc 3480
accactcttg gttcgcaagt gtctacacag cgctccggtt cttacgaaaa ctcaaactca 3540
gccactgagg gttctaccat aaactacacc accattaatt actacaaaga ctcctatgct 3600
gccacagcag gcaaacagag tctcaagcag gatccagaca agtttgcaaa tcctgttaaa 3660
gacatattca ccgaaatggc agcgccactg aagtccccat ccgctgaggc atgtggatac 3720
agtgatcgag tggcgcaatt aactattggc aactccacca tcacgacgca agaagcggct 3780
aacatcatag tcggctatgg tgagtggcct tcctactgct cagattctga cgctacagca 3840
gtggataaac caacgcgccc ggatgtttca gtgaacaggt tttacacatt ggacactaaa 3900
ttgtgggaga aatcgtccaa gggatggtac tggaagttcc cggatgtgtt aactgaaact 3960
ggggtttttg ggcaaaatgc acaattccac tacctctacc gatcagggtt ctgcatccac 4020
gtgcagtgca atgccagtaa attccaccaa ggagcactcc tagtcgctgt cctaccagag 4080
tatgtcattg ggacagtggc aggcggtaca gggacggaag acacccaccc cccctacaag 4140
cagacccaac ccggcgccga tggtttcgag ttgcaacacc cgtacgtgct tgatgctggc 4200
atcccaatat cacagttaac agtgtgccca caccagtgga ttaatttgag gaccaacaat 4260
tgtgctacaa taatagtgcc atacattaac gcactgcctt ttgattctgc cttgaaccat 4320
tgcaactttg gcctgttagt tgtgcctatt agcccactag actacgacca aggagcaacg 4380
ccagtaatcc ctataactat cacattggcc ccaatgtgct ctgaattcgc aggtcttagg 4440
caggcagtca cgcaagggtt ccccaccgag ctaaaacctg gcacaaatca atttttaacc 4500
accgatgatg gcgtctcagc acctattcta ccaaacttcc accccacccc gtgtatccac 4560
atacctggtg aagttaggaa cttgctagag ttatgccagg tggagaccat tctggaggtt 4620
aacaatgtgc ccacgaatgc cactagctta atggagagac tgcgcttccc ggtctcagca 4680
caagcaggga aaggtgaact gtgtgcggtg tttagagccg atcctgggcg aaatggacca 4740
tggcaatcca ccttactggg ccagttgtgc gggtactaca cccaatggtc agggtcattg 4800
gaagtcacct tcatgtttac tggatccttc atggctaccg gcaagatgct catagcctat 4860
acaccgccag ggggtcctct gcccaaggac cgggcgaccg ccatgttggg cacgcacgtc 4920
atctgggatt ttgggctgca atcgtctgtt acccttgtaa taccatggat cagtaacact 4980
cattatagag cacatgcccg agatggagtg tttgactatt acactacagg gttagtcagt 5040
atatggtacc agacaaatta cgtggttcca atcggtgcgc ccaacacagc ctatataata 5100
gcactagcgg cagcccaaaa gaacttcact atgaaattgt gcaaggatgc tagtgatatc 5160
ctgcagacgg gcaccatcca gggagatagg gtggcagatg taattgaaag ttccatagga 5220
gatagcgtga gcagagccct cactcacgct ctaccagcac ccacaggcca aaacacacag 5280
gtgagcagtc atcgactgga tacaggcaag gttccagcac tccaagctgc tgaaattggg 5340
gcatcatcaa atgctagtga cgagagcatg attgaaacac gttgtgttct taactcgcat 5400
agtacagctg agaccactct tgatagtttc ttcagtaggg caggattagt tggagagata 5460
gatctccctc ttgagggcac aactaaccca aatggttatg ccaactggga catagatata 5520
acaggttacg cgcaaatgcg tagaaaggta gagctattca cctacatgcg ttttgatgca 5580
gagttcactt ttgttgcgtg cacacccacc ggggaggttg tcccacaatt gctccaatat 5640
atgtttgtgc cacctggagc ccctaagcca gattctaggg aatcccttgc atggcaaacc 5700
gccaccaacc cctcagtttt tgtcaagctg tcagaccctc cggcgcaggt ttcagtgcca 5760
ttcatgtcac ctgcgagtgc ttatcaatgg ttttatgacg gatatcccac attcggagaa 5820
cacaaacagg agaaagacct tgaatacggg gcatgtccta ataacatgat gggtacattc 5880
tcagtgcgga ctgtggggac ctccaagtcc aagtaccctt tagtggttag gatttacatg 5940
agaatgaagc acgtcagggc gtggatacct cgcccgatgc gcaaccagaa ctacctgttc 6000
aaagccaacc caaattatgc tggcaactct attaagccaa ctggtgccag tcgcacagcg 6060
atcaccactc ttgggaaatt tggacaacag tctggggcta tttatgtggg caactttaga 6120
gtggtcaacc gacatcttgc cacccataat gattgggcaa atcttgtttg ggaagacagc 6180
tctcgcgact tgctcgtgtc atccaccact gcccaaggtt gtgacacgat tgcccgttgc 6240
gattgccaga caggggtgta ctactgtaac tcgatgagaa aacactaccc agtcagtttt 6300
tcaaaaccca gcctgatcta tgtagaggct agcgagtatt acccagccag gtaccaatca 6360
catctcatgc tcgcacaggg tcactcggaa cctggtgatt gcggtggtat ccttaggtgc 6420
caacatggcg tcatcggcat agtgtctact ggtggcaatg ggctcgttgg ctttgcagac 6480
gtcagagacc tcttgtggtt agatgaagaa gctatggaac agggcgtgtc cgactacatt 6540
aagggtctcg gagatgcttt tggaacaggc ttcactgacg cagtctcaag ggaggttgaa 6600
gctctcaaga actatcttat agggtctgaa ggagcagttg agaaaatttt gaaaaatctt 6660
attaaactaa tctctgcact ggtgattgtg atcagaagtg attacgacat ggttaccctc 6720
actgcaacct tagcgctgat aggttgtcat ggcagtcctt gggcttggat taaagccaaa 6780
acagcctcca tcttaggtat ccctatcgcc caaaagcaga gcgcttcctg gctcaagaag 6840
ttcaatgaca tggccaacgc cgctaagggg ttagagtggg tttccaacaa gatcagcaaa 6900
tttattgatt ggcttaagga gaaaatagta ccagcagcca gggagaaggt tgaattccta 6960
aataacttga aacagctgcc actgctagag aatcagatct cgaacttgga acaatctgct 7020
gcttcacaag aggaccttga agtcatgttt gggaatgtgt cgtacctagc tcacttctgt 7080
cgcaagtttc aaccgctata cgccacggaa gctaaaagag tctatgccct ggagaagaga 7140
atgaataact atatgcagtt caagagcaaa caccgaattg aacctgtatg tctcattatt 7200
aggggctcac caggcaccgg gaagtctcta gccactggta ttattgctcg agcaatcgct 7260
gataagtacc actccagcgt gtactcgctc ccaccagacc cggatcattt tgacggttac 7320
aagcaacagg tggttacagt gatggatgat ttgtgtcaaa accccgatgg taaggatatg 7380
tccttattct gtcaaatggt atccaccgta gatttcattc caccaatggc ttctctcgag 7440
gagaagggag tttccttcac ctctaagttt gtcatcgcat ccactaatgc cagtaatatc 7500
atagtaccaa cagtgtctga ttctgacgct attcgccgca ggttctacat ggactgtgac 7560
attgaagtga cagactcgta caaaacagat ctaggtagac tggatgcagg gcgagccgct 7620
aaactgtgtt ctgaaaataa cactgcaaat ttcaaacgtt gcagcccatt agtgtgtggg 7680
aaagccatcc aacttagaga tagaaagtct aaagtcagat acagtgtgga tacggtggtt 7740
tcagaactta ttagggaata cagcaatagg tccgccattg gtaacacaat cgaggctctt 7800
ttccaaggtc cacccaagtt caggccaatt aggattagcc ttgaagaaaa accagcccca 7860
gacgctatta gcgatctcct tgctagtgta gatagtgaag aagtgcgcca gtactgcagg 7920
gatcaaggct ggattattcc tgaagctccc accaatgtgg agcggcacct taatagagcg 7980
gtgctcgtca tgcaatccat caccacagta gtggcggttg tttcgttggt gtacgtcatc 8040
tacaagctct ttgcagggtt tcagggtgca tattctggtg ctcctaagca agtgcttaag 8100
aaacctgctc ttcgcacagc aacagtgcag ggtccgagcc ttgactttgc tctctcccta 8160
ctgagaagga acatcaggca ggtccaaaca gaccaagggc atttcaccat gttgggtgtt 8220
agggatcgct tagcagtcct cccacgccac tcacaacctg gcaaaaccat ttggattgag 8280
cacaaactcg tgaacgtcct tgatgcagtt gaactggtgg atgagcaagg agtcaacctg 8340
gaattaaccc tcatcactct tgacaccaac gagaagttta gggatatcac caaattcatc 8400
ccagaaaata tcagcactgc tagcgatgcc accctagtga tcaacacgga gcacatgccg 8460
tcaatgtttg tcccggtggg tgacgttgtg cagtatggct ttttgaatct cagtggcaag 8520
cctacccatc gcaccatgat gtacaatttt cctactaaag caggacagtg tggaggagtg 8580
gtgacatctg ttgggaaggt tgtcggtatt cacattggtg gcaatggcag acaaggtttt 8640
tgcgcaggcc tcaaaaggag ttactttgct agtgaacaag gagagatcca gtgggttaag 8700
cccaataaag aaactggaag actcaacatc aatggaccaa cccgcaccaa gttagaacct 8760
agtgtattcc atgacatctt cgagggaaat aaggaaccag ctgtcttgca cagtaaagac 8820
ccccgacttg aggtagattt tgaacaggcc ctgttctcta agtatgtggg aaacacacta 8880
catgagcctg acgagtacat caaagaggca gctctacatt atgcaaacca attaaagcaa 8940
ctagaaatca atacctctca aatgagcatg gaggaggcct gctatggtac tgagaatctt 9000
gaggctattg atcttcacac tagtgcaggt tacccctata gtgccctagg gataaagaaa 9060
agagacatct tagaccctac caccagggac gtgagtagaa tgaagttcta catggacaag 9120
tatggtcttg atcttcccta ctccacttat gtcaaggacg agctacgctc gattgataaa 9180
atcaagaaag ggaagtcccg cctgatcgag gccagtagtc taaatgattc agtgtacctc 9240
agaatggctt tcgggcattt gtatgaggct ttccacgcaa atcctgggac gataactgga 9300
tcggccgtgg ggtgtaaccc tgacacattc tggagcaagc tgccaatttt gctccctggt 9360
tcactctttg cctttgacta ctcaggctat gatgccagcc ttagccctgt ctggttcaga 9420
gcattagaat tggttcttag ggagataggg tatagtgaag aggcaatctc actcattgag 9480
ggaatcaacc acacacatca tgtgtatcgt aataagacct attgcgtgct tggtgggatg 9540
ccctcaggct gttcaggaac atccatcttc aactcaatga tcaacaacat tattatcaga 9600
gcactgctca taaaaacatt taagggcatt gatttggatg aactcaacat ggtcgcttat 9660
ggagacgatg tgctcgctag ctatcccttc ccaattgatt gcttggaact agcaaagact 9720
ggtaaggagt atggtctgac catgacccct gctgataaat ctccttgctt taatgaggtc 9780
aattggggta atgcgacctt cctcaaaagg ggctttttgc ccgatgaaca gtttccattt 9840
ttgattcacc ctactatgcc aatgagggag atccatgagt ccattcgatg gaccaaggac 9900
gcacggaaca ctcaagatca tgtgcggtcc ttgtgcctcc tagcatggca taatggtaag 9960
caagaatacg agaagtttgt gagcacaatt aggtctgtcc cagtagggag agcgttggct 10020
attccaaatt atgaaaatct tagacgaaat tggctcgagt tattttagag gttatacaca 10080
cctcaacccc accagaaatc tggtcgtgaa tgtgactggt gggggtaaat ttgttataac 10140
cagaatagca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa agcttat 10187
<210> 7
<211> 19
<212> DNA
<213> Artificial
<400> 7
taatacgact cactatagg 19
<210> 8
<211> 30
<212> DNA
<213> Artificial
<400> 8
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 30
<210> 9
<211> 39
<212> DNA
<213> Artificial
<400> 9
gctagcgctt tttttttttt tttttttttt ttttttttt 39
<210> 10
<211> 55
<212> DNA
<213> Artificial
<400> 10
gacgcggccg ctaatacgac tcactatagg ttaaaacagc ctgtgggttg caccc 55
<210> 11
<211> 22
<212> DNA
<213> Artificial
<400> 11
gcactgcacg tggatgcaga ac 22
<210> 12
<211> 33
<212> DNA
<213> Artificial
<400> 12
gacgcggccg cgttctgcat ccacgtgcag tgc 33
<210> 13
<211> 22
<212> DNA
<213> Artificial
<400> 13
aagtcgcgag agctgtcttc cc 22
<210> 14
<211> 33
<212> DNA
<213> Artificial
<400> 14
gacgcggccg cgggaagaca gctctcgcga ctt 33
<210> 15
<211> 28
<212> DNA
<213> Artificial
<400> 15
aattgtacat catggtgcga tgggtagg 28
<210> 16
<211> 39
<212> DNA
<213> Artificial
<400> 16
gacgcggccg ccctacccat cgcaccatga tgtacaatt 39
<210> 17
<211> 73
<212> DNA
<213> Artificial
<400> 17
gctagcgctt tttttttttt tttttttttt tttttttttg ctattctggt tataacaaat 60
ttacccccac cag 73
<210> 18
<211> 18
<212> DNA
<213> Artificial
<400> 18
cctgacgtgt cgacgcgg 18
<210> 19
<211> 49
<212> DNA
<213> Artificial
<400> 19
cctcgccctt gctcaccatc atatggttta gctgtgttaa gggtcaaga 49
<210> 20
<211> 49
<212> DNA
<213> Artificial
<400> 20
tcttgaccct taacacagct aaaccatatg atggtgagca agggcgagg 49
<210> 21
<211> 66
<212> DNA
<213> Artificial
<400> 21
cgctgtgtag acacttgcga accaagagtg gtgatcgcat gcatcttgta cagctcgtcc 60
atgccg 66
<210> 22
<211> 66
<212> DNA
<213> Artificial
<400> 22
cggcatggac gagctgtaca agatgcatgc gatcaccact cttggttcgc aagtgtctac 60
acagcg 66
<210> 23
<211> 21
<212> DNA
<213> Artificial
<400> 23
ctgcacgtgg atgcagaacc c 21
<210> 24
<211> 21
<212> DNA
<213> Artificial
<400> 24
ctgcacgtgg atgcagaacc c 21
<210> 25
<211> 53
<212> DNA
<213> Artificial
<400> 25
gaaatcttcg agtgtgaaga ccattctaga gtttagctgt gttaagggtc aag 53
<210> 26
<211> 53
<212> DNA
<213> Artificial
<400> 26
cttgaccctt aacacagcta aactctagaa tggtcttcac actcgaagat ttc 53
<210> 27
<211> 27
<212> DNA
<213> Artificial
<400> 27
cgcatgcatc gccagaatgc gttcgca 27