欢迎光临小豌豆知识网!
当前位置:首页 > 生活技术 > 医学兽医> 治疗性细菌素独创技术220796字

治疗性细菌素

2021-04-25 19:45:49

治疗性细菌素

  发明领域

  本发明提供了减少微生物菌落生长(包括感染)的方法和组合物,并且包括可能是治疗性的抗微生物组合物、用于治疗感染的方法以及用于鉴定另外的此类组合物的方法。

  发明背景

  细菌无处不在,生态多样,并且为存活找到了不寻常的生态位。它们存在于整个环境中,例如土壤、灰尘、水和几乎所有表面上。许多是正常的和有益的菌株,其提供与宿主的协作关系。其他的则是有害的,或带来益处的同时也会引起问题。

  致病菌可以在人类、其它动物和植物中引起传染性疾病。一些细菌只能感染特定宿主或引起特定宿主的问题,而其它细菌具有更广泛的宿主特异性,并可能在许多宿主中引起麻烦。由细菌引起的疾病几乎与细菌本身一样多样化,例如食物中毒、龋齿、炭疽、一般传染性疾病、甚至某些形式的癌症。

  某些细菌通常是无害的,但是在适当的时机会变成致病的,或者在引入异常部位或情况时会变成问题。缺乏有效免疫系统的人最容易受到伤害,并且某些细菌利用弱化的宿主在整个群体中增殖和传播。

  在统计学上,传染病是主要的医学问题。参见例如Watstein和Jovanovic(2003)的《传染性疾病统计手册》(Statistical Handbook on Infectious Diseases)(Greenwood)。在美国,每年有大约40-70K的死亡是由血液医院内(源于医院的)感染引起的。

  在过去的半个世纪中,抗生素彻底改变了临床医学。自从最初发现抗生素现象以来,这类非凡的治疗性实体的作用机制和发展已经取得了巨大的进步。参见,例如,Therrien和Levesque(2000)FEMS Microbiol Rev.24:251-62;Durgess(1999)Chest 115(增刊3):19S-23S;Medeiros(1997)Clin.Infect.Dis.24(增刊1):S19-45;Jones(1996)Am.J.Med.100(6A):3S-12S;Ford和Hait(1993)Cytotechnology 12(1-3):171-212;和Liu(1992)Compr Ther.18:35-42。抗生素在2002年的全球销售额约为$32B。

  然而,抗生素抗性细菌的广泛出现强调了当前抗微生物治疗在细菌适应方面的弱点。参见,例如,Walsh(1992)Antibiotics:Actions,Origins,ResistanceAmer.Soc.Microbiol.,(1992);Cunha(1992)Antibiotic Essentials(内科医生出版社(Physicians Press));Amyes(2003)Magic Bullets,Lost Horizons:The Rise and Fall of Antibiotics(Taylor&Francis);Axelsen(2001)Essentials of Antimicrobial Pharmacology:A Guide to Fundamentals for Practice(Humana出版社);以及Mainous和Pomeroy(编辑2001)Management of Antimicrobials in Infectious Diseases: Impact of Antibiotic Resistance(Humana出版社)。最近,已经报道了高度令人担忧的多重抗性质粒NDM-1的发现(Kumarasamy等人,(2010)Lancet Infectious Diseases 10:597-602;and Walsh et al.(2011)Lancet Infectious Diseases,早期在线出版(Early OnlinePublication),2011年4月7日,doi:10.1016/S1473-3099(11)70059-7)。

  因此,用于降低靶细菌生长或存活或限制细菌致病性的改进方法具有很大的实用性,特别是对于抗生素抗性细菌,其最常见的是革兰氏阴性菌。抗微生物作用可应用于环境、局部、局部地区,特别是体内定殖。本发明解决了这些和其它重要的问题。

  发明概述

  本发明部分地基于以下认识:细菌素可以是天然发现的蛋白质,其具有可用于在适当情况下靶向某些宿主细菌的特定特征和功能。特别令人感兴趣的是靶向革兰氏阴性细菌组中的宿主细菌的那些细菌。

  在本发明的某些实施方案中,鉴定了天然序列的细菌素(例如细菌素或其部分),其具有被用于杀死或标记靶宿主的所期望特性的组合。在其它实施方案中,制备了某些嵌合细菌素构建体,其中将异源结构域组合以提供所期望的功能和/或特异性。在这些实施方案中,多肽中的组分被取代,其可以类似地实现或改善这些所期望的性质,例如,替代或取代细菌素上发现的组分。

  革兰氏阴性细菌的特征在于被外膜(其在革兰氏阳性细菌中是缺乏的)包围的薄的肽聚糖细胞壁。革兰氏阴性细菌的外膜用作渗透性屏障,其防止外部施用的肽接近细胞的周质空间和细胞内区室。

  本发明提供了使用细菌素(其包含天然存在的序列)或嵌合细菌素构建体的方法,所述细菌素或嵌合细菌素构建体选择性地识别和穿过靶菌株的膜屏障(此处被称为受体介导的易位),以将适当的被转运体(cargo)结构域递送到所期望的细胞区室中。一旦到达,被转运体结构域可以影响它们的预期活性,这可以是可检测的标记或杀死细胞。例如,当外膜通常阻止来自外部介质的胞壁质水解(muralytic)活性进入时,胞壁质水解酶可以消化革兰氏阴性细胞的薄肽聚糖层。将酶促活性的胞壁质水解区段(片段)连接到提供用于跨外膜转移胞壁质水解区段的易位细菌素区段上,允许酶活性接触肽聚糖层,这导致肽聚糖层的降解。肽聚糖层的失效会导致细胞破裂,这是由于跨内细胞膜上的巨大渗透压所致。可替代地,如果受体介导的易位细菌素区段可以将被转运体结构域易位到细胞中,则可以使用许多不同的机制来干扰细胞功能。核酸酶、毒素、毒性缀合物、代谢阻断物和易位到细胞质中的其它破坏性区段可严重影响细胞存活力和健康。可以引入可检测标记,例如,以允许检测细胞来评价生物体内的分布。

  在某些实施方案中,本发明提供了能够杀死靶革兰氏阴性细菌的基本上分离的细菌素多肽(即细菌素或嵌合细菌素构建体),其包含:(a)受体介导的易位区段,其任选地包含与细菌素的易位区段(TS)至少70%的匹配和/或与细菌素的受体结合区段(RBS)至少70%的匹配;和(b)杀伤性区段,其当与所述受体介导的易位区段可操作地连接时能够杀死所述靶细菌;其中所述细菌素多肽:(i)能够杀死与所述嵌合细菌素构建体接触时的所述靶细菌;和(ii)包含不同于天然S型绿脓杆菌素的序列。在某些实施方案中,所述细菌素多肽与另一种抗微生物剂、抗生素或其它治疗性干预组合使用。在其它优选的实施方案中,所述细菌素多肽是这样的多肽,其中一个区段的70%的匹配是至少80%;TS和RBS均源自单一细菌素;靶标是混合的细菌培养物;靶标包括不同种的细菌;靶标包括不同属的细菌;杀伤性区段衍生自细菌素;杀伤性区段衍生自同源细菌素;杀伤性区段衍生自异源细菌素;或者不同的序列包含纯化标签。在特别优选的实施方案中,所述细菌素多肽是如所述的一种,其中:所述靶细菌包括易感克雷伯氏菌属靶标;所述TS和/或RBS来自克雷伯氏菌素(klebicin);所述杀伤性区段来自克雷伯氏菌素;所有所述TS、RBS和杀伤性区段都来自克雷伯氏菌素;所有所述TS、RBS和杀伤性区段都来自单一克雷伯氏菌素;或者所述TS、RBS和杀伤性区段中的每一个来自不同的克雷伯氏菌素。本发明还提供了编码所述重组克雷伯氏菌素的分离的核酸。在其它具体实施方案中,所述细菌素多肽将是一种,其中:所述靶细菌含有易感假单胞菌靶标;所述TS和/或RBS来自S型绿脓杆菌素;所述杀伤性区段来自S型绿脓杆菌素;所有所述TS、RBS和杀伤性区段都来自S型绿脓杆菌素;所有所述TS、RBS和杀伤性区段都来自单一的S型绿脓杆菌素;或者所述TS、RBS和杀伤性区段中的每一个来自不同的S型绿脓杆菌素。本发明还提供了分离的核酸,其编码例如在高表达质粒或载体中的如所述的绿脓杆菌素多肽。另一个具体的实施方案提供了所述细菌素多肽,其中:所述靶细菌含有易感埃希氏杆菌属靶标;所述TS和/或RBS来自大肠杆菌鼠疫巴氏杆菌素(colipesticins);所述杀伤性区段来自大肠杆菌鼠疫巴氏杆菌素;所有所述TS、RBS和杀伤性区段都来自大肠杆菌鼠疫巴氏杆菌素;所有所述TS、RBS和杀伤性区段都来自单一大肠杆菌鼠疫巴氏杆菌素;或者所述TS、RBS和杀伤性区段中的每一个来自不同的大肠杆菌鼠疫巴氏杆菌素。提供了编码所述重组鼠疫巴氏杆菌素多肽的分离的核酸。

  在另一个实施方案中,本发明提供了向靶细菌引入细菌素敏感性的方法,其包括以下步骤:将引入细菌素受体的可迁移元件转移到所述靶标,从而将所述细菌素受体引入所述靶标,所述细菌素受体在所述靶标的外膜中表达。另外,方法还包括使所述表达受体的靶标与如所述的细菌素接触的步骤,导致杀死所述靶细菌。

  可替代的实施方案包括基本上分离的细菌素多肽,其能够跨靶革兰氏阴性细菌的外膜递送多肽区段,所述分离的细菌素多肽包含:(a)受体介导的易位区段,其通常包含与细菌素的易位区段(TS)至少70%匹配的区段;和/或包含与细菌素的受体结合区段(RBS)至少70%匹配的区段;和(b)被转运体多肽,其当与所述的受体介导的易位区段可操作地连接时,用于递送至所述靶细菌;其中当所述靶细菌与所述多肽接触时,所述分离的多肽能够跨所述靶细菌的外膜递送所述被转运体多肽。优选的实施方案包括那些分离的多肽,其中:一个区段的70%的匹配是至少80%;TS和RBS均源自单一细菌素;靶标是混合的细菌培养物;靶标包括不同种的细菌;靶标包括不同属的细菌;被转运体多肽衍生自细菌素;被转运体多肽衍生自同源细菌素;被转运体多肽衍生自异源细菌素;被转运体多肽调节靶细菌的存活力或生长;或分离的多肽包含纯化标签。

  发明详述

  I.引言

  本发明将受体介导的易位功能(例如衍生自细菌素)连接到如在细菌素中的另一个功能性被转运体结构域(例如杀伤性结构域),以实现可攻击革兰氏阴性菌靶标的实体。本文中所述的嵌合(和相关)“细菌素”构建体将细菌素衍生的受体介导的易位功能与标记或杀死功能结合,所述标记或杀死功能可以是肽聚糖降解酶活性。细菌素衍生的受体介导的易位功能是通过识别细菌上的外膜受体的蛋白质片段来实现的,所述蛋白质区段通常是帮助介导易位的蛋白质。通常,受体识别功能在进行易位的靶细胞中提供选择性和特异性。因此,易位可以表征为“受体介导的”过程。在许多实施方案中,易位涉及两个“功能性”步骤和细菌素内的结构域、结合步骤(涉及受体结合区段或RBS)以及易位步骤(涉及易位区段或TS),尽管这两个步骤可能不一定是物理上或时间上可分离的。结合步骤通常涉及细菌素与其同源受体结合的一些特异性,然后其可采取一些构象形状,这允许细菌素和被转运体结构域跨脂质双层膜运输或翻转。

  在某些实施方案中,受体介导的易位仅跨外膜,并且被转运体结构域可接近细菌宿主的周质空间。肽聚糖(胞壁质)球囊是大多数细菌的细胞壁的必要结构组分。由短肽交联的聚糖链制成的球囊形成围绕细菌细胞质膜的封闭的袋状结构。球囊必须承受高达25个大气压的渗透压。球囊是柔性的,允许在压力下可逆的膨胀,这允许甚至大的蛋白质分子的扩散。参见,例如,Silhavy等人,(2010)CSH Persp.Biol.,2:a000414;Vollmer等人,(2008)FEMS Microbio.Revs 32:149-167;Bos等人,(2007)Ann.Rev.Microbiol.61:191-214;和Costerton等人,(1974)Bact.Revs.38:87-110。

  许多抗生素作用于靶标细菌物种的肽聚糖层。因此,这种结构是细菌靶标存活中的关键组分。肽聚糖的攻击是杀死靶细菌宿主的合理策略。尽管肽聚糖层通常为约1-3层厚,但革兰氏阴性细菌的外膜用作渗透性屏障以防止外部施加的酶到达它们的底物。

  受体介导的易位结构域或区段允许蛋白质(例如具有胞壁质水解活性的蛋白质)跨细菌外膜转移。例如,受体介导的易位区段本身可以介导膜转移事件,从而将胞壁质水解活性从细菌外膜的外部移动到内部,并允许酶与其肽聚糖底物之间的接触。受体介导的易位区段可以以通过呈现向系统发信号以将分子导入周质空间的专用基序来利用外膜中的内源性易位系统。在一些实施方案中,受体介导的易位区段将构建体多肽导向至外膜的表达受体的外小叶,并且胞壁质水解多肽从外膜的外小叶翻转到内小叶,从而将胞壁质水解区段递送到肽聚糖底物。

  II.革兰氏阴性细菌

  A.外膜

  革兰氏阴性细菌的细胞包膜由两种膜组成(即内膜(IM)和外膜(OM)),它们被含有肽聚糖层的周质分开。两种膜具有完全不同的结构和组成。IM是磷脂双层,OM是分别由内小叶和外小叶中的磷脂和脂多糖(LPS)组成的不对称双层。另外,这些膜在整合的膜蛋白结构方面不同。尽管整合的IM蛋白通常以疏水性α-螺旋的形式跨越膜,但整合的OM蛋白(OMP)通常由反平行的两亲性β-链组成,所述反平行的两亲性β-链折叠成具有亲水性内部残基和指向外部的疏水性残基的圆柱形β-桶,以面向膜脂质(Koebnik等人,(2000)“Structure andfunction of bacterial outer membrane proteins:barrels in a nutshell”Mol.Microbiol.37:239–53)。两个膜都还含有脂蛋白,其经由N-末端N-酰基-二酰基甘油基半胱氨酸锚定到膜上,在大肠杆菌(Escherichia coli)的情况下,蛋白质部分通常面向周质(Pettersson等人,(1997)“Response of Neisseria meningitidis to ironlimitation”Antonie van Leeuwenhoek71:129-36)。LPS分子可以分成三个部分:脂质A、核心多糖和O-抗原重复序列。脂质A代表LPS的疏水组分,其位于外膜的外小叶中,而核心多糖和O-抗原重复序列被展现在细菌细胞的表面上(Raetz等人,(2007)“Lipid Amodification systems in Gram-negative bacteria”Annu Rev Biochem 76:295-329)。LPS的详细结构从一种细菌到另一种细菌不同,并且这种变化可以影响细菌的毒力。参见,例如,Galanos等人,(1985)“Synthetic and natural Escherichia coli free lipid Aexpress identical endotoxic activities”,Eur J Biochem 148:1-5;和Wilkinson(1996)“Bacterial lipopolysaccharides-themes and variations”Prog Lipid Res 35:283-343。

  B.肽聚糖层

  肽聚糖(胞壁质)是在几乎所有细菌的细胞质膜外部发现的细菌细胞壁的必需和特异性组分(Rogers等人,(1980);Park,(1996);Nanninga,(1998);Mengin-Lecreulx&Lemaitre,(2005))。它的主要功能是通过耐受内部渗透压来保持细胞完整性。细胞生长期间对它的生物合成或它的特异性降解的任何抑制将导致细胞裂解。肽聚糖还有助于维持确定的细胞形状并用作锚定其它细胞包膜组分(如蛋白质(Dramsi等人,2008)和磷壁酸(Neuhaus&Baddiley,(2003)))的支架。革兰氏阳性细菌和革兰氏阴性细菌的肽聚糖结构均包含N-乙酰基葡糖胺(NAG)和β-(1-4)-N-乙酰基胞壁酸(NAM)的重复二糖主链,其通过与NAM残基连接的肽干链交联。在革兰氏阴性细菌中,连接到每个胞壁酸的羧基上的干肽通常由L-Ala-D-Glu-(L)-内消旋-二氨基庚二酸(Dap)-D-Ala组成,尽管干肽通常缺少D-Ala或更少地终止于D-Ala-D-Ala。在相邻聚糖链之间的交联中涉及约一半的干肽(Rogers等人,(1980))。

  胞壁质水解结构域是本领域已知的。其中的一类为溶菌酶蛋白。参见,例如Salazar和Asenjo(2007)Biotechnol.Lett.29:985-94。肽聚糖结构的破坏在至少四个情况下自然发生。一种是结构本身的生物合成;当细菌细胞生长和分裂时,它必须破坏结构。参见,例如,Vollmer(2008)FEMS Microbiol Rev.32:287-306;Scheurwater等人,(2008)Int.J.Biochem.Cell Biol.40:586-91;Keep等人,(2006)Trends Microbiol.14:271-276;以及Baba和Schneewind(1998)EMBO J.17:4639-4646。当细胞本身必须重新排列或修改先前合成的结构时,存在另外的情况。第二,真核宿主在清除感染时降解结构,例如使用变溶菌素或溶菌酶。参见,例如,Callewaert和Michiels(2010)J.BioSci.35:127-60;Harder等人,(2007)Endocr.Metab.Immune Disord Drug Targets 7:75-82;和Lichtman等人,(1992)J.Clin.Invest.90:1313-1322。第三个领域是在噬菌体复制中,其中噬菌体通常使用细胞内溶素来释放复制的噬菌体并裂解细菌宿主细胞。参见,例如,Srividhya和Krishnaswamy(2007)J.BioSci.32:979-90;和Loessner(2005)Curr.Opin.Microbiol.8:480-487。这是从内部裂解细胞的肽聚糖层。如Padmanabhan等人的WO2007/130655所述的,第四种情况是其中噬菌体感染需要穿过肽聚糖屏障。这是肽聚糖层从细胞外部降解。

  这些机制中的每一种都涉及分解肽聚糖结构的一些方法。因此,在细菌的真核宿主的基因组,细菌基因组本身以及靶向细菌作为宿主的噬菌体(和相关的前噬菌体)中发现了胞壁质水解活性。可以通过与这些来源中的任何一个的同源性来发现胞壁质水解结构域,并且可以使用信息学来鉴定具有它们各自的标准基序的候选基因。虽然胞壁质水解活性是本发明所包括的一类杀伤性结构域,但是使用该实例描述了许多实例,并且本发明不限于这些实施方案,而是可以取代许多其它的杀伤性或毒性区段。

  肽聚糖“降解活性”可以被转化为高效的杀菌活性,用于在治疗条件下对抗革兰氏阴性细菌病原体,并且可以包括胞壁质酶(muraminidase)、氨基葡萄糖苷酶、酰胺酶或内肽酶活性。可以鉴定示例性胞壁质水解结构域,将其并入嵌合构建体中以递送至肽聚糖底物,产生、纯化并证实其对具有外膜的细菌宿主具有杀菌活性。包含此类活性的重组构建体作为抗微生物组合物和制剂具有显著的有利性质。

  本发明的连接多肽的实例使用胞壁质水解片段,例如包含来自假单胞菌噬菌体P134(其与噬菌体phiKMV密切相关)的溶菌酶结构域。对应于phiKMV中的ORF36的噬菌体P134中的ORF36裂解其外膜已被去除的革兰氏阴性细菌细胞。去除外膜后,将构建体与各种不同的革兰氏阴性细菌接触,导致细胞破碎。这些结果证明来自不同革兰氏阴性细菌物种的肽聚糖对胞壁质水解活性易感。

  序列同源性搜索鉴定了可以被用作肽聚糖降解活性的可替代来源的各种其它类似结构域。展现出这些活性的小尺寸多肽提供了有效的大规模生产。提供了在细菌靶标处对相关细胞壁靶组分(例如肽聚糖)的可及性,以及体内施用时的药理学分布。

  在溶菌酶样超家族、溶菌转糖基酶(LT)、鹅蛋清溶菌酶(GEWL)中可以发现相关的胞壁质水解活性;含有溶菌酶样结构域的超家族Cl00442,其含有几个成员,包括可溶性溶菌转糖基酶(SLT)、鹅蛋清溶菌酶(GEWL)、母鸡蛋清溶菌酶(HEWL)、几丁质酶、噬菌体λ溶菌酶、细胞内溶素、自溶素、壳聚糖酶。所有这些成员参与β-1,4-连接的多糖的水解。半胱氨酸组氨酸依赖性酰胺水解酶/肽酶(CHAP)结构域在噬菌体细胞内溶素和细菌自溶素中被发现。大多数含有CHAP结构域的蛋白质作为肽聚糖水解酶起作用,并且通常与酰胺酶相关。参见Bateman和Rawlings(2003)Trends Biochem.Sci.5:234-237;和Pritchard等人(2004)Microbiology 150:2079-2087。另参见在cazy.org发现的碳水化合物活性酶数据库(theCarbohydrate-Active enZYmes Database)。CAZY数据库描述了降解、修饰或产生糖苷键的酶的结构上相关的催化和碳水化合物结合模块(或功能结构域)家族。内肽酶的另一个来源是来自在merops.sanger.ac.uk/cgi-bin/clan_index?type=P发现的网站的数据库。

  类似的策略可以被用于鉴定和使用来自胞壁质水解结构域的其它杀伤性结构域,例如,基于下面描述的杀伤性功能。可以鉴定某些功能性杀伤性结构域,并且可以构建类似的或同源的可替代的取代。

  C.细胞膜

  降解原核生物宿主的脂双层的脂酶和其它功能活性可以杀死细胞。将杀死靶革兰氏阴性细胞的另外的毒性或毒素区段可能被取代,与被转运体肽缀合用于易位到细胞中的较小的分子毒素也可以被取代。优选地,仅作用于原核生物且对真核生物无作用的活性在效果上将是高度选择性的,仅作用于靶标但对被革兰氏阴性细菌感染的宿主生物体几乎没有或没有作用。

  I.细菌素多肽

  A.细菌素

  细菌素是由细菌产生的蛋白质抗生素的不同家族,其天然用于杀死相同或密切相关物种的成员。大肠杆菌(E.coli)产生的细菌素(被称为大肠杆菌素)是第一个待鉴定的细菌素,并被很好地研究,以及对其中的许多细菌素进行了表征。迄今为止表征的几乎所有的大肠杆菌素展现出具有N-末端易位结构域、受体结合结构域和C-末端杀伤性结构域的三结构域结构。杀伤性结构域通常是核酸酶或膜损伤成孔剂。产生细菌素的细菌受到由表达细菌素的菌株产生的免疫蛋白的保护而不受其自身作用,并且通过化学计量地结合杀伤性结构域并抑制其活性而起作用。

  表1中呈现了可用于本发明的细菌素多肽的实例以及它们的结构域边界。

  表1细菌素和嵌合细菌素构建体的结构域边界

  

  

  克雷伯氏菌素:

  由克雷伯氏菌属产生的细菌素被称为克雷伯氏菌素。克雷伯氏菌素具有与从大肠杆菌分离的大肠杆菌素的结构域结构类似的结构域结构。报道了四种不同类型的克雷伯氏菌素,并且它们的DNA序列被描述为-克雷伯氏菌素B、克雷伯氏菌素C、克雷伯氏菌素CCL和克雷伯氏菌素D(Riley等人(2001)和Chavan等人(2005))。

  S型绿脓杆菌素:

  可溶性或S型绿脓杆菌素是来自铜绿假单胞菌(P.aeruginosa)的蛋白酶和热敏感的染色体编码的细菌素,其能够杀死来自相同物种的细胞。这些抗细菌剂被分泌,其是具有杀伤性功能的大蛋白和与前者的细胞毒性结构域保持紧密结合的较小免疫蛋白组成的二元蛋白复合物。已经描述和表征了几种类型的S型绿脓杆菌素:绿脓杆菌素S1、S2、AP41、S3、S4和S5。结果证明,绿脓杆菌素Sa与绿脓杆菌素S2相同。为了杀死靶细胞,S型绿脓杆菌素将首先与位于细菌细胞外膜上的特异性受体结合,然后将它进一步易位以发挥它的抑制性功能。

  鼠疫巴氏杆菌素:

  来自鼠疫耶尔森氏菌(Yersinia pestis)的鼠疫巴氏杆菌素是杀死鼠疫耶尔森氏菌(Y.pestis)、小肠结肠炎耶尔森氏菌(Yersinia enterocolitica)和某些大肠杆菌菌株的毒素(Hu和Brubaker(1974)),其由9.5kb质粒pYP编码(Kol'tsova等人(1973);Ferber和Brubaker,(1981))。鼠疫巴氏杆菌素展现出N-乙酰基葡糖胺糖苷酶活性(Ferber和Brubaker(1979))。鼠疫巴氏杆菌素可以利用负责耶尔森氏菌铁螯合剂、耶尔森杆菌素转运的FyuA受体(Heesemann等人(1993);Rakin等人(1994);Fetherston等人(1995))。鼠疫巴氏杆菌素的表达被认为是由SOS系统控制的(Hu等人(1972)),并且它的通过外膜的转运以及与同源FyuA受体的相互作用是TonB依赖性的(Ferber等人(1981))。

  B.被转运体结构域

  为了制备本发明的嵌合构建体,将细菌素衍生的受体介导的易位结构域与提供所期望功能(例如标记或杀伤)的异源被转运体结构域连接。例如,杀伤性区段将包括可能少于完整的“结构域”的区段,并且包括保留功能但不同于经典定义的“结构域”的变异,其将杀死标细胞。该结构域可以是蛋白质(例如细菌素)的组分,其自然地用于杀死靶细胞。该结构域可以被另一个能够杀死靶细胞的结构域取代或替代,可以是能够杀死细胞的催化活性,或者可以是功能是阻断或干扰正常细胞活性以实现杀伤的一些结构特征。另一种选择是将实际的毒性化学物质或结构缀合或连接到载体肽或与受体介导的易位结构域可操作连接的其它化学键。实例可以是类似于在化学疗法中被用作靶向毒素的那些的毒性缀合物,其可以被吸收到靶细胞中并从细胞内的载体释放,具有可干扰靶酶或底物的许多不同拷贝的化学计量。在表2中提供了杀伤性区段的实例。

  表2:细菌素衍生的杀伤性区段

  

  大的细菌素(>60kDa)是通过靶向易感细菌的细胞质中的核酸(例如DNA和RNA、tRNA或rRNA)或细胞膜组分杀死与生产生物体密切相关的细菌的蛋白质毒素。编码细菌素的基因位于生产生物体的质粒或基因组上,并且可以使用各种生物信息学工具鉴定整个基因组序列。从数据库(例如NCBI基因组数据库)可获得的全基因组信息可以被用于鉴定推定的细菌素,并且多序列比对和序列同一性搜索将有助于缩小可能的细菌素。例如,使用隐马尔可夫模型(HMM)从分布于不同生态位(包括人类、动物、植物和环境)的53种不同细菌物种中鉴定出超过3000种核酸酶细菌素(Sharp等人(2017)Diversity and distribution ofnuclease bacteriocins in bacterial genomes revealed using Hidden MarkovModels.PLoS Comput Biol 13(7):e1005652)。除核酸酶和成孔活性外,细菌素还可以是脂酶;氧化的解耦剂(decouplers);可活化的诱变剂;转录/翻译的阻断剂;细胞凋亡的诱导物;干扰关键细胞功能(如cdc、能量代谢、细胞壁和膜生物发生和维持等)。

  除了衍生自细菌素的杀伤性结构域之外,还可以使用衍生自多种来源的抗微生物肽。在表3中提供了实例。

  表3:用于与细菌素融合的抗微生物肽(AMP)

  

  

  C.连接子、其它组分;免疫蛋白

  本发明的许多嵌合构建体将具有连接不同组分作为单一多肽的连接子。可替代地,构建体可以包含通常作为单个多肽合成但可以被二级结构或三级结构切割并保持结构完整性的多个多肽。

  可以通过多种方法测量跨外膜的转移速率。一种方法是间接评估转移的结果,例如杀伤性区段到达其周质底物的效果。测量的标准可以是可测量的细胞内容物的释放、底物释放或细胞裂解。细胞杀伤也可以是肽聚糖消化的测量。

  更直接的方法是例如使用可检测的标记追踪转移到周质空间中的分子的数目。通常通过测量所转移的过客(passenger)区段的量来评估特定转移区段的转移效率。可检测标记可以被用于区分周质空间条件(比OM外部的氧化程度更高)和细胞外环境。参见Rajarao等人(2002)FEMS Microbiology Letters 215:267-272。

  与不存在膜转移区段相比,有效的受体介导的易位区段将使杀伤性区段杀死靶宿主的水平增加至少3倍,或者使转移水平增加至少3倍。在一些实施方案中,与不存在膜转移区段相比,受体介导的易位区段将使杀死或转移的水平增加至少约5倍、7倍、10倍、15倍、20倍、30倍、50倍、80倍、100倍、150倍、250倍或更多倍。测定通常在接近可以根据应用使用的浓度的条件下进行。测定将通常在经从几分钟(例如约1、2、5、10、15或30分钟)至1小时或2小时的时间段范围内测量转移。

  II.定义

  “受体介导的易位结构域”(RMTD)是通常衍生自细菌素或相关蛋白的结构域,其功能是提供本发明的细菌素和嵌合构建体跨革兰氏阴性外膜的受体特异性易位。通常,结构域结构在设定边界时考虑二级或三级蛋白质结构。上面已经描述了所鉴定的区段。可以凭经验测试各种形式的诱变或方法以测试必要的序列匹配中的变异性。通常,当与天然序列最佳比对时,RMTD将展现出至少约60%的匹配,但优选在比对区域上具有更大的匹配(例如约65%、70%、75%、80%,优选85%、90%、95%或更多)。区段通常是展现出比整个结构域特别高的匹配率的区域,在通常可以是长度的至少约65%、70%、75%,优选80%、85%、90%或更多的区域上。在较短的比对区段上,区段匹配将是选定的较高的匹配数。

  在一些实施方案中,受体介导的易位结构域(RMTD)可以包含两个不同的区段。第一种是“受体结合区段”(RBS),通常衍生自细菌素或相关蛋白,其赋予嵌合构建体与同源受体相互作用的选择性或特异性。这种相互作用在构建体和靶标之间的初始相互作用中是重要的,并且通常提供选择性,其然后允许发生易位过程的时间步骤。当结构域的序列被修改(例如,通过取代或修饰)以逃避权利要求范围时,RBS将可能是可测试的以维持功能。与天然序列的匹配将通常在比对区域上为天然序列的至少约例如65%、约70%、75%、80%,优选约85%、90%、95%或更多。受体结合区段将是在较短区段上特别高匹配的区域。比对的长度通常可以是结构域长度的至少约65%、70%、75%,优选80%、85%、90%或更多,具有匹配测量的任何组合。第二区段是“易位区段”(TS),也被称为TMD(跨膜结构域)、易位结构域、转移区段和类似术语,其可能影响可操作地连接的被转运体结构域跨革兰氏阴性细菌的外膜的转移。此类结构域本身可以具有跨膜使相关区段易位的能力,或者可以被内源易位系统识别,所述内源转运系统将影响所连接的催化区段的转运。嵌合多肽可以被完整地跨膜转移,或者在易位过程中被修饰。膜转移结构域本身可以进一步具有损害内膜的能力,从而通过这种另外的机制来杀伤。

  “被转运体结构域”通常是功能性蛋白结构域,当其与RMTD可操作地连接时将被易位。“被转运体”描述符强调结构或区段可以是被动的也可以是主动的。在某些实施方案中,所述区段可以具有功能,例如杀伤性结构域或区段,其在易位时影响靶细胞的杀伤。杀伤可以是催化的(例如,酶促的)、作为核酸酶、蛋白酶、胞壁质水解酶、代谢破坏剂、结构分解剂,或任何可以直接或间接影响毒性或杀伤的许多活性功能。区段或结构域可以是被动的,例如作为标记区段,如GFP或各种化学连接的实体的载体。因此,被转运体结构域可以是用作毒性缀合物的载体的多肽,所述毒性缀合物被化学转运到细胞室,并且在那里被释放,其可以以化学计量的方式起作用。抗生素、抗微生物剂等的化学连接可以通过易位过程被递送到适当的细胞室中,并在靶细胞内的适当位置被释放。

  “可操作地连接的”是指元件的功能性连接。因此,如果第一区段(例如易位结构域)的功能起作用以易位被转运体结构域(例如胞壁质水解性或其它功能性(杀伤性)区段或结构域,则两个元件可操作地连接。

  “杀伤活性”可以包括杀死或降低靶细菌的存活力或生长速率的酶促活性。

  细菌的“环境”可以包括体外或体内环境。体外环境可以包括反应容器(例如,容纳分离的或纯化的细菌的容器)、待灭菌的表面(例如,在公共卫生设施中)、装备、动物区室的表面或公共卫生设施(如水设施、化粪(septic)设施或下水道设施。其它体外条件可以提供混合的物种群体,例如,包括紧密接近的许多共生或相互作用的物种。体内环境可以是被靶细菌感染的宿主生物体。体内环境包括器官,如膀胱、肾脏、肺、皮肤、心脏和血管、胃、毛皮、肠、肝脏、脑或脊髓、感觉器官(如眼、耳、鼻、舌)、胰腺、脾脏、甲状腺等。体内环境包括组织(如牙龈、神经组织、淋巴组织、腺组织)和生物流体(例如血液、痰)等。被引入或连接至身体的导管、管、植入物和监测或治疗装置可以是正常使用下的感染源。环境还包括食物(例如鱼、肉)或植物材料表面。肉类包括例如牛肉、猪肉、鸡肉、火鸡肉或其它家禽肉。植物材料包括蔬菜、水果或由水果和/或蔬菜制成的果汁,或者可以包括衣服或遮盖物。在一些实施方案中,用本发明的蛋白质(包括VAME构建体或嵌合体)处理已经与细菌感染的食品接触的表面。

  将组合物“引入”到环境中包括应用或施用化合物或组合物,并且使得靶细菌暴露于所述化合物或组合物。所述化合物或组合物的引入可以受到可能产生或释放此类细菌的活细菌或死细菌的影响。

  “细胞壁降解蛋白”是在可接近的细胞壁或其组分上具有可检测的(例如显著的)降解活性的蛋白。“胞壁质水解”活性可以是降解活性的结果。细胞壁降解结构域可以衍生自,例如,肌病毒科噬菌体的尾板或衍生自长尾病毒科噬菌体尾的末端,和其它噬菌体病毒体胞壁质水解多肽。

  “GMP条件”是指良好的制造实践,例如,如由美国政府食品药品监督管理局(theFood and Drug Administration of the United States Government)所限定的。在欧洲、日本和大多数发达国家都存在类似的实践和规定。

  在上述“基本上纯的”的限定中,术语“基本上”通常意指纯度为至少约60%、至少约70%、至少约80%、或更优选至少约90%,以及更优选至少约92%、95%、97%或99%,无论是蛋白质、核酸、或其它结构或其它种类的分子。

  术语“氨基酸”是指天然存在的和合成的氨基酸,以及以类似于天然存在的氨基酸的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的那些氨基酸,以及稍后被修饰的那些氨基酸(例如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸)。氨基酸类似物是指具有与天然存在的氨基酸相同的基本化学结构(例如,与氢、羧基、氨基和R基团结合的α碳)的化合物,例如,高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。此类类似物具有经修饰的R基团(例如正亮氨酸)或经修饰的肽主链,但保留如同天然存在的氨基酸的基本化学结构。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构,但以类似于天然存在的氨基酸的方式起作用的化合物。

  “蛋白质”、“多肽”或“肽”是指其中大部分或全部单体是氨基酸并且通过酰胺键连接在一起的聚合物,可替代地称为多肽。当氨基酸是α氨基酸时,可以使用L-旋光异构体或D-旋光异构体。此外,还包括非天然氨基酸,例如β-丙氨酸、苯基甘氨酸和高精氨酸。在本发明中也可以使用非基因编码的氨基酸。此外,在本发明中也可以使用已被修饰以包括适当结构或反应性基团的氨基酸。在本发明中使用的氨基酸可以是D-或L-异构体或它们的混合物。通常优选的是L-异构体。此外,其它肽模拟物也可用于本发明中。对于一般的综述,参见Spatola,A.F.、Weinstein等人(编辑,1983年)(氨基酸、多肽和蛋白质的化学和生物化学(Chemistry and Biochemistry of Amino Acids,Peptides and Proteins),MarcelDekker,纽约,第267页)。

  当用于细胞时,术语“重组的”表示细胞复制异源核酸,或表达由异源核酸编码的肽或蛋白质。重组细胞可以含有在细胞的天然(非重组的)形式中未发现的基因。重组细胞还可以含有在细胞的天然形式中发现的基因,其中基因被修饰并通过人工方法重新导入细胞中。该术语还涵盖含有细胞内源性核酸的细胞,所述核酸已经被修饰而不从细胞中除去所述核酸;此类修饰包括通过基因替换、位点特异性突变和相关技术获得的那些修饰。特别地,可以产生序列的融合体,例如,在所期望的序列上游掺入上游分泌盒以产生分泌的蛋白质产物。

  “融合蛋白”、“嵌合蛋白”、“蛋白缀合物”等术语是指包含除了编码原始或天然全长蛋白或其子序列的氨基酸序列之外的氨基酸、包含代替编码原始或天然全长蛋白或其子序列的氨基酸序列的氨基酸序列、包含少于编码原始或天然全长蛋白或其子序列的氨基酸序列的氨基酸序列和/或包含不同于编码原始或天然全长蛋白或其子序列的氨基酸序列的氨基酸序列的蛋白。可以将多于一个的另外的结构域添加至如本文中所述的细胞壁胞壁质水解蛋白,例如一个表位标签或纯化标签、或多个表位标签或纯化标签。可以连接另外的结构域,例如,其可以增加另外的杀伤性活性(在混合集落或生物膜的靶或相关生物上)、靶向功能,或其影响生理过程(例如血管通透性或生物膜的完整性)。可替代地,可以将结构域缔合以产生不同多肽之间的物理亲和力,从而产生多链聚合物复合物。

  术语“核酸”是指单链或双链形式的脱氧核糖核苷酸、核糖核苷酸或混合聚合物,并且除非另有限定,涵盖以类似于天然存在的核苷酸的方式与核酸杂交的天然核苷酸的已知类似物。除非另有说明或上下文所示,特定的核酸序列包括其互补序列。

  “重组表达盒”或简称“表达盒”是重组或合成产生的核酸构建体,其具有能够影响结构基因在与此类序列相容的宿主中表达的核酸元件。表达盒通常至少包括启动子和/或转录终止信号。通常,重组表达盒包括待转录的核酸(例如,编码所期望的多肽的核酸)和启动子。可以包括影响表达的其它因素。在某些实施方案中,表达盒还可以包括编码指导所表达的蛋白质从宿主细胞分泌的信号序列的核苷酸序列。转录终止信号、增强子和影响基因表达的其它核酸序列也可以被包括在表达盒中。在某些实施方案中,编码在细胞壁上具有胞壁质水解活性的氨基酸序列的重组表达盒在细菌宿主细胞中表达。

  如本文中所使用的“异源序列”或“异源核酸”是源自特定宿主细胞外源的来源,或如果来自相同来源,则从它的原始形式修饰的序列或核酸。异源序列的修饰可以例如通过用限制性酶处理DNA以产生能够与启动子可操作地连接的DNA片段来进行。诸如定点诱变的技术也可用于修饰异源序列。

  术语“分离的”是指基本上或本质上不含干扰酶活性的组分的物质。对于本发明的糖类、蛋白质或核酸,术语“分离的”是指基本上或本质上不含通常伴随在它的天然状态中发现的物质的组分的物质。通常,本发明的分离的糖类、蛋白质或核酸的纯度为至少约80%、通常至少约90%、或至少约95%,如通过银染色凝胶上的带强度或用于测定纯度的其它方法所测量的。纯度或同质性可以通过本领域熟知的多种方法来表示。例如,样品中的蛋白质或核酸可以通过聚丙烯酰胺凝胶电泳来分辨,然后可以通过染色来可视化蛋白质或核酸。为了某些目的,可能需要高分辨率的蛋白质或核酸,并且可以使用例如HPLC或质谱或类似方法来纯化。

  在两个或更多个核酸或蛋白质序列的上下文中,术语“相同的”或百分比“同一性”是指如使用序列比较算法之一或通过目视检查测量的,当进行比较和比对以获得最大的对应时,是相同的或具有指定百分比的相同的氨基酸残基或核苷酸的两个或更多个序列或子序列。在同一性的某些比对中,不允许缺口,而在其它算法中,可以使用适当的惩罚措施来允许缺口。

  在两个核酸或蛋白质的上下文中,短语“基本上相同”是指如使用以下序列比较算法之一或通过目视检查测量的,当进行比较和比对以获得最大的对应时,在适当的区段上具有至少大于约60%的核酸或氨基酸序列同一性,约65%、70%、75%、80%、85%、90%,优选约91%、92%、93%、94%、95%、96%、97%、98%或99%的核苷酸或氨基酸残基同一性的两个或更多个序列或子序列。优选地,基本同一性存在于对应于至少约13、15、17、23、27、31、35、40、50或更多个氨基酸残基的长度的序列的一个或多个区域上,更优选地存在于至少约60、70、80或100个残基的区域上,并且最优选地,所述序列在至少约150个残基上或在参考序列的整个长度上基本相同。

  对于序列比较,通常一个序列用作参考序列,将测试序列与该参考序列进行比较。当使用序列比较算法时,将测试序列和参考序列输入到计算机中,如果需要,指定子序列坐标,并且指定序列算法程序参数。然后序列比较算法基于指定的程序参数计算测试序列相对于参考序列的序列同一性百分比。

  用于比较的序列的最佳比对可以通过以下方式进行:例如Smith和Waterman(1981)Adv.Appl.Math.2:482的局部同源性算法、Needleman和Wunsch(1970)J.Mol.Biol.48:443的同源性比对算法、Pearson和Lipman(1988)Proc.Nat’l.Acad.Sci.USA 85:2444的搜索相似性的方法、通过这些和相关算法(威斯康星州遗传学软件包(the Wisconsin Genetics Software Package)中的GAP、BESTFIT、FASTA和TFASTA,遗传学计算机组,575Science Dr.,麦迪逊,WI)的计算机化实施、或通过目视检查(一般参见,分子生物学实验室指南(Current Protocols in Molecular Biology),F.M.Ausubel等人编辑,实验室指南为格林出版联合公司(Greene Publishing Associates,Inc.)和JohnWiley&Sons公司合资创办(1995和增刊)(Ausubel))。

  适于确定序列同一性和序列相似性百分比的算法的实例是BLAST和BLAST 2.0算法,其分别描述于Altschul等人(1990)J.Mol.Biol.215:403-410和Altschuel等人(1977)Nucleic Acids Res.25:3389-3402。用于进行BLAST分析的软件是通过国家生物技术信息中心(the National Center for Biotechnology Information,ncbi.nlm.nih.gov)或类似来源公开可获得的。

  如下所述的,两个核酸序列或蛋白质基本上相同的另一个指示是由第一核酸编码的蛋白质与由第二核酸编码的蛋白质在免疫学上交叉反应。因此,蛋白质通常与第二种蛋白质基本上相同,例如,其中两种肽的区别仅在于保守性取代。如下所述的,两个核酸序列基本上相同的另一个指示是两个分子在严格条件下彼此杂交。

  当提及抗体时,短语“与蛋白质特异性结合”或“与…特异性免疫反应”,是指结合反应,其在蛋白质和其它生物制剂的异质性群体存在下决定蛋白质的存在。因此,在指定的免疫测定条件下,指定的抗体优先结合特定的蛋白质,并且不会以显著的量结合样品中存在的其它蛋白质。在这种条件下与蛋白质的特异性结合需要选择对特定蛋白质具有特异性的抗体。可以使用多种免疫测定方式来选择与特定蛋白质特异性免疫反应的抗体。例如,固相ELISA免疫测定通常被用于选择与蛋白质特异性免疫反应的单克隆抗体。参见Harlow和Lane(1988)(抗体,实验室手册,冷泉港出版物,纽约(Antibodies,A Laboratory Manual,Cold Spring Harbor Publications,New York)),有关可用于确定特异性免疫反应性的免疫测定形式和条件的描述。

  特定多核苷酸序列的“保守性修饰的变异”是指编码相同或本质上相同的氨基酸序列的那些多核苷酸,或其中所述多核苷酸不编码氨基酸序列,是指本质上相同的序列的那些多核苷酸。由于遗传密码的简并性,大量功能上相同的核酸编码任何给定的蛋白质。例如,密码子CGU、CGC、CGA、CGG、AGA和AGG都编码氨基酸精氨酸。因此,在精氨酸被密码子指定的每个位置处,密码子可以被改变为所述的另一个相应的密码子,而不改变所编码的蛋白质。此类核酸变异是“沉默变异”,它们是“保守性修饰的变异”中的一种。除非另有说明,本文中所述的编码蛋白质的每种多核苷酸序列也描述了可能的沉默变异。本领域技术人员将认识到,核酸中的每个密码子(除AUG和UGG外,AUG通常是甲硫氨酸的唯一密码子,UGG通常是色氨酸的唯一密码子)可以通过标准技术进行修饰以产生功能相同的分子。因此,编码蛋白质的核酸的每个“沉默变异”通常隐含在每个所述序列中。

  本领域技术人员认识到,蛋白质中的许多氨基酸可以彼此取代而不影响蛋白质的功能,例如,保守性取代可以是蛋白质(如所公开的细胞壁胞壁质水解蛋白)的保守性修饰的变体的基础。下面是保守性氨基酸取代的不完全列表。以下八个组各自含有彼此通常为保守性取代的氨基酸:1)丙氨酸(A)、甘氨酸(G);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨酸(K);5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V)、丙氨酸(A);6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);7)丝氨酸(S)、苏氨酸(T)、半胱氨酸(C);和8)半胱氨酸(C)、甲硫氨酸(M)(参见,例如,Creighton(1984)Proteins)。

  此外,本领域技术人员将认识到,在编码的序列中改变、添加或删除单个氨基酸或小百分比的氨基酸(通常小于5%,更通常地小于1%)的单独的取代、缺失或添加是有效地“保守性修饰的变异”,其中改变导致氨基酸被化学上相似的氨基酸取代。提供功能上相似的氨基酸的保守性取代表在本领域是众所周知的。

  本领域技术人员将理解,蛋白质(例如杀伤性区段或细胞壁胞壁质水解蛋白)和编码蛋白质的核酸的许多保守性变异产生本质上相同的产物。例如,由于遗传密码的简并性,“沉默取代”(例如,不会导致所编码蛋白的改变的核酸序列的取代)是编码氨基酸的每个核酸序列的隐含特征。如本文中所述的,优选地优化序列以在用于产生杀伤性区段(例如细胞壁胞壁质水解蛋白)的特定宿主细胞(例如酵母菌、人等)中表达。类似地,在氨基酸序列中的一个或几个氨基酸中的“保守性氨基酸取代”被具有高度相似性质的不同氨基酸取代,也容易被鉴定为与特定氨基酸序列高度相似,或与编码氨基酸的特定核酸序列高度相似。任何特定序列的此类保守性取代的变异是本发明的特征。还参见Creighton(1984)Proteins,W.H.Freeman and Company。此外,在编码的序列中改变、添加或删除单个氨基酸或小百分比的氨基酸的单独取代、缺失或添加通常也是“保守性修饰的变异”。

  本发明的实践可以包括重组核酸的构建和基因在宿主细胞(优选细菌宿主细胞)中的表达。用于特定宿主的优化密码子使用将通常是可适用的。实现这些末端的分子克隆技术是本领域已知的。适用于构建重组核酸(如表达载体)的多种克隆和体外扩增方法是本领域技术人员熟知的。足以指导本领域技术人员进行许多克隆练习的这些技术和使用说明的实例发现于Berger和Kimmel,Guide to Molecular Cloning Techniques,Methods inEnzymology 152Academic Press,Inc.,圣地亚哥,CA(Berger));和Current Protocols inMolecular Biology,F.M.Ausubel等人编辑(实验室指南(Current Protocols)为GreenePublishing Associates,Inc.和John Wiley&Sons公司合资创办(1999年增刊)(Ausubel))中。用于表达重组多肽的合适的宿主细胞是本领域技术人员已知的,并且包括例如原核细胞(如大肠杆菌(E.coli))和真核细胞(包括昆虫(杆状病毒))、哺乳动物(CHO细胞)、真菌细胞(例如酵母菌、毕赤酵母属、黑曲霉(Aspergillus niger))和噬菌体表达系统。

  足以指导本领域技术人员通过体外扩增方法(包括聚合酶链式反应(PCR)、连接酶链式反应(LCR)、Qβ-复制酶扩增和其它RNA聚合酶介导的技术)的方案的实例发现于Berger、Sambrook和Ausubel以及Mullis等人(1987)的美国专利第4,683,202号;PCRProtocols A Guide to Methods and Applications(Innis等人编辑),Academic Press,Inc.,圣地亚哥,CA(1990)(Innis);Arnheim&Levinson(1990年10月1日)C&EN36-47;TheJournal Of NIH Research(1991)3:81-94;(Kwoh等人(1989)Proc.Natl.Acad.Sci.USA87:1874;Lomell等人(1989)J.Clin.Chem.35:1826;Landegren等人(1988)Science 241:1077-1080;Van Brunt(1990)Biotechnology 8:291-294;Wu和Wallace(1989)Gene 4:560;以及Barringer等人(1990)Gene 89:117。体外扩增核酸克隆的改进方法描述于Wallace等人的美国专利第5,426,039号中。

  III.商业应用

  本文中所描述的细菌素多肽的各种应用可以立即被认可。蛋白质可以被用于在正常使用中可能被污染的物品的抗菌处理。可以使用本文中所述的细菌素多肽处理其中靶细菌是公共健康危害的位置、表面、设备或环境。目标位置包括其中存在含有靶细菌的材料的公共卫生设施。这些材料可以包括废产物,例如液体、固体或空气。水性废物处理厂可以掺入所述的嵌合细菌素构建体以从流出物中消除靶细菌,无论是通过用嵌合细菌素构建体处理还是通过表达和释放这些多肽的细胞处理。固体废物地点可以引入这些多肽以最小化靶宿主爆发的可能性。

  可以使用所述细菌素组合物定期处理食物制备区域和设备,从而提供有效消除靶细菌的手段。受污染的医药和其它公共环境可以使用类似的手段来最小化靶微生物的生长和扩散。本发明的方法可以被用于需要消除靶细菌的环境中,包括例如用于重症监护病房的空气过滤系统。

  所述细菌素多肽可以被用作蛋白质稳定剂或防腐剂(即,其中靶细菌是去稳定剂)。此类组合物可以被用作药物制剂的一部分,或用作肉或其它食品的防腐剂。在一些实施方案中,这些嵌合细菌素构建体可以被用于水产食品中,例如作为稳定剂或作为防腐剂制剂的组分。此类应用对于必须保持防腐但不能含有传统抗生素的材料特别有用。

  可替代的应用包括在兽医或医药环境中的使用。确定特定细菌的存在或鉴定特定靶标的手段可以利用选择性试剂对种群或培养物的影响。可能需要将抑菌活性包含到清洁剂(包括洗涤动物和宠物的清洁剂)中。

  本文所述的细菌素多肽可以被用于治疗例如人、哺乳动物、动物和植物的细菌感染。可以预防性地或在其中对象患有细菌感染的情况下向对象施用这些多肽。此外,本发明的方法可以被应用于展示动物(例如,动物园或表演的)、伴侣动物(例如,狗、猫、其它宠物)、竞赛动物(例如,马)或农场动物(例如,奶牛和肉牛、绵羊、山羊、猪、鸡、鱼、虾、龙虾等),其中应用所述组合物以减少细菌的存在。这些嵌合细菌素构建体可以被用于治疗由缓慢复制的细菌引起的感染,因为杀伤性机制不依赖于宿主细胞复制。许多目前的抗细菌剂(例如抗生素)对于复制细菌是最有用的。例如,这些细菌素多肽可以被用于靶向以约例如1-72小时、1-48小时、1-24小时、1-12小时、1-6小时、1-3小时或1-2小时的倍增时间复制的细菌。

  医学上相关的革兰氏阴性球菌物种包括淋病奈瑟氏菌(Neisseria gonorrhoeae)和螺旋体属(引起性传播疾病);脑膜炎奈瑟氏球菌(Neisseria meningitides)(引起脑膜炎);和卡他莫拉菌(Moraxella catarrhalis)(引起呼吸症状)。相关的革兰氏阴性杆菌物种包括流感嗜血杆菌(Hemophilus influenzae)、肺炎克雷伯氏菌(Klebsiella pneumoniae)、嗜肺军团杆菌(Legionella pneumophia)、伯克霍尔德菌属和铜绿假单胞菌(Pseudomonas aeruginosa)(呼吸问题);大肠杆菌(Escherichia coli)、奇异变形杆菌(Proteus mirabilis)、阴沟肠杆菌(Enterobacter cloacae)和粘质沙雷氏菌(Serratia marcescens)(泌尿问题),以及幽门螺杆菌(Helicobacter pylori)、肠炎沙门氏菌(Salmonella enteritidis)、伤寒沙门氏菌(Salmonella typhi)(胃肠道问题)和螺旋体属(性传播疾病)。与医院感染相关的革兰氏阴性细菌包括鲍曼不动杆菌(Acinetobacter baumannii),其例如在医院机构的重症监护病房中引起菌血症、继发性脑膜炎和呼吸机相关的肺炎。

  可以使用当前所述的细菌素多肽靶向的其它相关物质包括革兰氏阴性物种,其包括寡养单胞菌(Stenotrophomonas)、蛭弧菌属(Bdellovibrio)、乙酸细菌和α-变形菌门(如沃尔巴克氏菌(Wolbachia))、蓝细菌、螺旋体属、绿色硫细菌和绿色非硫细菌。

  也可使用本发明的细菌素多肽靶向在某些条件下可具有外膜的革兰氏可变生物体(展示具有革兰氏染色的革兰氏可变模式)。革兰氏可变细菌包括例如放线菌属节杆菌棒状杆菌属分枝杆菌属丙酸杆菌属,它们具有在细胞分裂期间对破损特别敏感的细胞壁,并展示出革兰氏阴性染色。在芽孢杆菌属丁酸弧菌属梭菌属的培养物中,在生长期间肽聚糖厚度的降低与染色革兰氏阴性细胞数量的增加相一致。此外,细菌培养物的年龄可以影响革兰氏染色的结果。

  IV.施用

  本文中所述的这些细菌素多肽嵌合细菌素构建体的施用途径和剂量随感染细菌菌株、感染位点和程度(例如,局部或全身性)以及正在治疗的对象而变化。施用途径包括但不限于:口服、气溶胶或用于递送至肺的其他装置、鼻喷雾剂、静脉内(IV)、肌肉内、腹膜内、鞘内、眼内、阴道、直肠、局部、腰椎穿刺、鞘内和直接应用至脑和/或脑膜。可以被用作递送治疗剂的媒介物的赋形剂对于本领域技术人员而言是显而易见的。例如,胞壁质水解多肽可以是冻干形式并在施用前溶解(重悬)(例如通过IV注射)。预期剂量在宿主感染中每个细菌约0.03、0.1、0.3、1、3、10、30、100、300、1000、3000、10000或更多个嵌合细菌素构建体分子的范围内。取决于蛋白质的大小,其本身可以是串联的,或以多个亚基形式(二聚体、三聚体、四聚体、五聚体等)或与一种或多种其它实体(例如,具有不同特异性的酶或片段)组合,剂量可以是约1百万至约10万亿/kg/天,并且优选为约1万亿/kg/天,并且可以从约106个杀伤性单位/kg/天至约1013个杀伤性单位/kg/天。

  评估杀伤性能力的方法可以类似于本领域技术人员用来评估完整复制噬菌体(例如噬菌斑形成单位或pfu)的方法,尽管可以通过测定杀伤性单位滴定后存活细菌的数目来更好地评估杀伤性单位。杀伤性的定量是不同的,因为非复制噬菌体将不会在细菌宿主菌苔上形成噬菌斑。因此,可以使用连续稀释法代替标准pfu来评估“杀伤性”单位的量。暴露于杀伤性组合物的细菌培养物的连续稀释液可以被用于定量杀伤性单位。可以将总细菌计数与活菌落单位进行比较,可以确定细菌的活部分以及哪些部分对杀伤性构建体易感。用于评估停滞活性的其它方法可以包括细胞内内容物(无论是天然的还是加载的)的释放、或是在对应于天然细胞壁结构的明确的或制备的底物上的酶活性。

  通常施用治疗剂直到成功消除致病菌为止。本发明考虑了本发明组合物的单一剂型以及多种剂型,以及实现用于递送此类单一剂型和多种剂型的持续释放方式的方法。可以使用广谱制剂,同时确定感染菌株的特异性诊断。

  关于对肺或其它粘膜表面的气溶胶施用,将治疗组合物掺入专门设计用于施用的气溶胶制剂中。许多此类气溶胶是本领域已知的,并且本发明不限于任何特定的制剂。此类气溶胶的实例是由Schering-Plough制造的沙丁胺醇TM(ProventilTM)吸入器,其推进剂含有三氯一氟甲烷、二氯二氟甲烷和油酸。其它实施方案包括吸入器,其被设计用于向对象或患者的鼻和窦通道给药。如果有必要的话,推进剂成分和乳化剂的浓度可以基于治疗中所使用的特定组合物进行调节。每次气雾剂治疗所施用的酶杀伤单位的数量将通常在约106个至1013个杀伤单位的范围内,例如约1012个杀伤单位。

  通常,杀伤将宿主复制能力降低至少约3倍,例如10、30、100、300倍等,至许多数量级。在不杀死的情况下减慢宿主复制速率也可以具有显著的治疗或商业价值。遗传灭活效率可以是约4、5、6、7、8或更多个对数单位。

  V.制剂

  本发明还考虑了包含在药学上可接受的赋形剂中提供的至少一种本发明的细菌素多肽的药物组合物。因此,本发明的制剂和药物组合物考虑了包含特异性针对细菌宿主的分离的细菌素多肽的制剂;影响相同或典型的细菌宿主的两种、三种、五种、十种或二十种或更多种酶的混合物;和影响不同细菌宿主或相同细菌宿主的不同菌株的两种、三种、五种、十种或二十种或更多种酶的混合物(例如共同抑制多种革兰氏阴性细菌物种生长的细菌素多肽的混合物)。以这种方式,本发明的组合物可以根据患者的需要进行定制。化合物或组合物可以是无菌的或接近无菌的。

  “治疗有效剂量”是产生其施用的效果、抑菌(减少细菌生长)或杀菌(杀死细菌)的剂量。确切的剂量将取决于治疗的目的,并且将由本领域技术人员使用已知的技术可确定的。参见,例如,Ansel等人,Pharmaceutical Dosage Forms and Drug Delivery;Lieberman(1992)Pharmaceutical Dosage Forms(第1-3卷),Dekker;Lloyd(1999)The Art,Science and Technology of Pharmaceutical Compounding;和Pickar(1999)Dosage Calculations。如本领域中已知的,调节蛋白质降解、全身性递送与局部递送以及年龄、体重、总体健康状况、性别、饮食、施用时间、药物相互作用和病况的严重性可能是必需的,并且将是本领域技术人员可确定的。

  各种药学上可接受的赋形剂是本领域熟知的。如本文中所使用的,“药学上可接受的赋形剂”包括当与组合物的活性成分组合时允许所述成分保持生物活性并且不引起与对象的免疫系统的破坏性反应的物质。此类赋形剂包括稳定剂、防腐剂、盐或糖复合物或晶体等。

  示例性的药学载体包括无菌水性或非水性溶液、混悬液和乳剂。实例包括但不限于标准药物赋形剂(如磷酸盐缓冲盐溶液、水)、乳剂(如油/水乳剂)和各种类型的润湿剂。非水性溶剂的实例是丙二醇、聚乙二醇、植物油(如橄榄油)和可注射的有机酯类(如油酸乙酯)。水性载体包括水、醇/水性溶液、乳剂或混悬液,包括盐水和缓冲介质。肠胃外媒介物包括氯化钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸化林格氏油或不挥发性油。静脉内媒介物包括流体和营养补充剂、电解质补充剂(如基于林格氏右旋糖的那些)等。在其它实施方案中,将组合物掺入固体基质中,包括缓释颗粒、玻璃珠、绷带、眼睛上的插入物和局部形式。

  还包括用于脂质体递送的制剂和包含微胶囊化酶的制剂(包括糖晶体)。通过众所周知的常规方法配制包含此类赋形剂的组合物(参见,例如,Remington's Pharmaceutical Sciences,第43章,第14版,Mack Publishing Col)。可以对蛋白质进行PEG化以实现通常由其衍生的优势。参见,例如,Jevsevar等人,(2010),Biotechnol.J.5:113-128;Brocchini等人,(2008),Adv.Drug Delivery Revs.60:3-12;Jain和Jain(2008)Crit.Rev.Ther.Drug Carrier Syst.25:403-47,PMID:19062633l;以及Shaunak等人,(2006),Nature Chemical Biology 2:312-313。存在用于实现类似稳定结果的可方案。参见,例如,Schellenberger等人,(2009),Nature Biotechnology 27:1186-1192。

  通常,药物组合物可以被制备成各种形式,如颗粒剂、片剂、丸剂、胶囊剂(例如适于口服递送)、栓剂、微珠、微球体、脂质体、混悬剂、药膏、洗剂等。适于口服和局部使用的药物级有机或无机载体和/或稀释剂可以被用于组成包含治疗活性化合物的组合物。本领域已知的稀释剂包括水性介质、植物油和动物油以及脂肪。制剂可以掺入稳定剂、湿润剂和乳化剂,用于改变渗透压的盐或用于确保适当pH值的缓冲剂。

  药物组合物可以包含除细菌素多肽之外的其它组分,例如,多于一种的活性成分,例如,两种或更多种、三种或更多种、五种或更多种、或十种或更多种不同的酶,其中不同的酶可以特异性针对相同、不同或伴随的细菌。例如,药物组合物可以含有多种(例如,至少两种或更多种)限定的杀伤活性,其中组合物中的至少两种具有不同的细菌宿主特异性或不同的特异性。以这种方式,治疗性组合物可以适于治疗不同细菌的混合感染,或者可以是被选择为有效对抗在特定的机构环境中常见的各种类型的感染的组合物。选择的组合可以例如通过选择衍生自不同特异性的各种来源的杀伤性实体的不同组以靶向存在的或潜在地存在于感染中的多种菌株而产生。如上所述的,杀伤活性可以与其它试剂(如常规抗微生物剂或提供对抗生物膜或胶囊形成培养物的功效的试剂)联合施用。各种材料描述于例如Davies和Marques(2009)J.Bacteriology 191:393-403;Kimura和Itoh(2002)Appl.andEnv.Microbiology 69:2491-2497;Kim和Geider(2000)Phytopathology 90:1263-1268;Hughes等人(1998)J.Appl.Microbiology85:583-590;以及Bartell和Orr(1969)J.Virology 4:580-584。在一些实施方案中,添加剂(例如脂肪酸)或生物膜解聚酶可以作为附加结构域添加到嵌合构建体中,作为制剂中的附加组分,或与所述细菌素杀伤活性同时或序贯组合施用。组合可以改善或补充所选择的杀伤活性。

  VI.方法学

  实施本发明的一些方面包括众所周知的方法、一般临床微生物学、处理噬菌体的一般方法以及生物技术的一般基本原理、原理和方法。下面列出了此类方法的参考文献。

  A.一般临床微生物学

  一般微生物学是对微生物的研究。参见,例如,Sonenshein等人(2002年版)Bacillus Subtilis and Its Closest Relatives:From Genes to CellsAmer.Soc.Microbiol.;Alexander和Strete(2001)Microbiology:A Photographic Atlas for the Laboratory Benjamin/Cummings;Cann(2001)Principles of Molecular Virology(第3版);Garrity(2005年版)Bergey's Manual of Systematic Bacteriology(第2版第2卷)Plenum;Salyers和Whitt(2001)Bacterial Pathogenesis: A Molecular Approach(第2版)Amer.Soc.Microbiol.;Tierno(2001)The Secret Life of Germs:Observations and Lessons from a Microbe Hunter Pocket Star;Block(2000年版)Disinfection,Sterilization,and Preservation(第5版)Lippincott Williams&WilkinsPubl.;Cullimore(2000)Practical Atlas for Bacterial Identification Lewis Pub.;Madigan等人(2000)Brock Biology of Microorganisms(第9版)Prentice Hall;Maier等人(2000年版)Environmental Microbiology Academic Pr.;Tortora等人(2000)Microbiology:An Introduction including Microbiology Place(TM)Website,StudentTutorial CD-ROM,and Bacteria ID CD-ROM(第7版),Benjamin/Cummings;Demain等人(1999年版)Manual of Industrial Microbiology and Biotechnology(第2版)Amer.Soc.Microbiol.;Flint等人(1999年版)Principles of Virology:Molecular Biology,Pathogenesis,and Control Amer.Soc.Microbiol.;Murray等人(1999年版)Manual of Clinical Microbiology(第7版)Amer.Soc.Microbiol.;Burlage等人(1998年版)Techniques in Microbial Ecology Oxford Univ.Press;Forbes等人(1998)Bailey&Scott's Diagnostic Microbiology(第10版)Mosby;Schaechter等人(1998年版)Mechanisms of Microbial Disease(第3版)Lippincott,Williams&Wilkins;Tomes(1998)The Gospel of Germs:Men,Women,and the Microbe in American Life HarvardUniv.Pr.;Snyder和Champness(1997)Molecular Genetics of BacteriaAmer.Soc.Microbiol.,ISBN:1555811027;Karlen(1996)MAN AND MICROBES:Disease and Plagues in History and Modern Times Touchstone Books;以及Bergey(1994年版)Bergey's Manual of Determinative Bacteriology(第9版)Lippincott,Williams&Wilkins。可能可获得更新的版本。

  B.用于处理噬菌体的一般方法

  处理噬菌体的一般方法是众所周知的,参见,例如,Snustad和Dean(2002)Genetics Experiments with Bacterial Viruses Freeman;O'Brien和Aitken(2002年版)Antibody Phage Display:Methods and Protocols Humana;Ring和Blair(2000年版)Genetically Engineered Viruses BIOS Sci.Pub.;Adolf(1995年版)Methods in Molecular Genetics:Viral Gene Techniques,第6卷,Elsevier;Adolf(1995年版)Methods in Molecular Genetics:Viral Gene Techniques,第7卷,Elsevier;以及Hoban和Rott(1988年版)Molec.Biol.of Bacterial Virus Systems(第136名微生物学和免疫学热门话题)Springer-Verlag中。

  C.生物技术的一般基本原理、原理和方法

  生物技术的一般基本原理、原理和方法描述于例如,Alberts等人(2002)Molecular Biology of the Cell(第4版)Garland;Lodish等人(1999)Molecular Cell Biology(第4版)Freeman;Janeway等人(2001年版)Immunobiology(第5版)Garland;Flint等人(1999年版)Principles of Virology:Molecular Biology,Pathogenesis,and Control,Am.Soc.Microbiol.;Nelson等人(2000)Lehninger Principles of Biochemistry(第3版)Worth;Freshney(2000)Culture of Animal Cells:A Manual of Basic Technique(第4版)Wiley-Liss;Arias和Stewart(2002)Molecular Principles of Animal Development,牛津大学出版社(Oxford University Press);Griffiths等人(2000)An Introduction to Genetic Analysis(第7版)Freeman;Kierszenbaum(2001)Histology and Cell Biology,Mosby;Weaver(2001)Molecular Biology(第2版)McGraw-Hill;Barker(1998)At the Bench:A Laboratory Navigator CSH Laboratory;Branden和Tooze(1999)Introduction to Protein Structure(第2版),Garland Publishing;Sambrook和Russell(2001)Molecular Cloning:A Laboratory Manual(第3版第3卷),CSHLab.Press;以及Scopes(1994)Protein Purification:Principles and Practice(第3版)Springer Verlag。可能可获得更新的版本。

  D.诱变;位点特异性的、随机的、改组(shuffling)

  基于本文中提供的结构和功能性描述,可以产生同系物和功能性变体。通过结构同源性可以发现具有穿透功能的区段。这些也可以用作筛选结构变体的起始点,例如,将此类结构诱变处理并筛选具有所期望特性(例如,更广泛的底物特异性)的那些结构。可以使用标准的诱变方法,参见例如Johnson-Boaz等人(1994)Mol.Microbiol.13:495-504;美国专利第6,506,602号、第6,518,065号、第6,521,453号、第6,579,678号。

  E.筛选

  可以设计筛选方法来评股突变体或新的候选杀伤性区段。

  杀伤活性筛选可以使用粗细菌培养物、分离的底物组分、反应物制剂、合成底物或纯化试剂来确定靶细胞上底物位点的亲和力和数目。可掺入穿透测定来评估靶菌株的外膜的完整性,可以评估菌苔抑制测定、培养物的存活力力测试、对靶底物制剂或其它底物的活性或组分的释放。例如,在细胞壁胞壁质水解功能测定中,酰胺酶活性可以通过可溶性N-乙酰基己糖胺的释放(例如,改良的Morgan-Elson反应)来测量,或通过使用DNFB测定测定游离氨基基团(对于ala-gly内肽酶为L-丙氨酸,对于gly-gly内肽酶为L-甘氨酸)来测量内肽酶活性,所有这三种测定基于Petit等人(1966)Biochemistry 5:2764-76。也可以通过从N-乙酰化的六甘氨酸(乙酰基-Gly6)释放游离氨基基团来测量Gly-gly内肽酶活性,参见Kline等人(1994)Anal.Biochem.217:329-331。

  可以测试连接子以比较对膜转移或降解的影响,或比较活性片段的各种取向的活性。可以使用杀伤性区段筛选靶标(例如革兰氏阴性、革兰氏阳性、分枝杆菌和孢子)组,以确定哪些片段在较宽或较窄的靶标谱上是关键的或高效的。

  测试例如细胞壁降解活性的一种方法是用温和的去污剂或变性剂处理噬菌体以释放与病毒体相关的蛋白质。进一步测试这些蛋白质对细菌细胞的壁降解活性或胞壁质水解活性。另一种方法是在噬菌体抗性宿主上测定细胞壁降解活性或从无(LO)的裂解。评估与噬菌体结构组分相关的壁降解活性或胞壁质水解活性的第三种方法是进行酶谱(Zymogram)测定,例如,其中使纯噬菌体制备物在掺入经高压灭菌的宿主细胞的SDS聚丙烯酰胺凝胶上电泳。允许凝胶上的蛋白质原位复性,然后作用于细胞壁组分,当凝胶的其余部分用亚甲蓝染料染成蓝色时,产生清晰的“胞壁质水解”区。参见,例如,Lepeuple等人,(1998)Appl.Environ.Microbiol.64:4142-428。清楚的区域是可视化的,并且从每个区域洗脱蛋白质条带。可以通过例如N-末端测序或质谱来鉴定蛋白质。然后可以分离降解蛋白的编码序列。

  VII.分离编码细菌素的核酸;组分结构域

  本发明还提供了编码杀伤区段或膜转移蛋白的核酸。此类多核苷酸可以编码例如本文所述的细菌素和如上所述的其它杀伤性结构域。

  编码杀伤性区段多肽的核酸与本发明的核酸实施方案有关。这些核酸(例如,cDNA、基因组或子序列(探针))可以通过体外方法克隆或扩增,诸如聚合酶链式反应(PCR)、连接酶链式反应(LCR)、基于转录的扩增系统(TAS)或自持序列复制系统(the self-sustained sequence replication system,SSR)。除了合成方法外,多种克隆和体外扩增方法是本领域技术人员熟知的。足以指导本领域技术人员进行许多克隆练习的这些技术和使用说明的实例发现于Berger和Kimmel,Guide to Molecular Cloning Techniques,Methods in Enzymology 152Academic Press,Inc.;Sambrook等人(1989)MolecularCloning-A Laboratory Manual(第2版)第1-3卷,冷泉港实验室(Cold Spring HarborLaboratory),冷泉港出版社(Cold Spring Harbor Press);Current Protocols inMolecular Biology,Ausubel等人编辑,实验室指南(Current Protocols)(GreenePublishing Associates,Inc.和John Wiley&Sons,Inc.,1994年增刊);Cashion等人,US5017478;和Carr,欧洲专利第0246864号。

  可以通过上述合适的方法制备编码被转运体结构域的DNA,包括例如用限制性酶克隆和限制合适的序列。可以通过常规克隆方法分离编码所期望的杀伤性区段的核酸。可以使用例如例如登录号为YP_024486的细胞壁降解多肽的示例性核苷酸序列来设计与基因特异性杂交的探针;或与在总核酸样品(例如,在Southern或Northern印迹中)中的编码杀伤性蛋白或区段的mRNA特异性杂交的探针。一旦鉴定了编码杀伤性蛋白或区段的靶核酸,就可以根据本领域技术人员已知的标准方法分离。此外,可以用限制性酶切割分离的核酸以产生编码全长杀伤性多肽或其子序列的核酸,例如包含编码杀伤性多肽的催化结构域的至少一个子序列的子序列。这些编码杀伤性多肽或其子序列的限制性酶区段然后可以被连接,例如,以产生编码杀伤性多肽的核酸。

  类似的方法可以被用于在片段之间产生适当的连接子。

  可以通过分析所表达的产物来表征编码适当多肽或其子序列的核酸。可以使用基于检测所表达的多肽的物理、化学或免疫学性质的测定。例如,例如,如本文中所述的,可以通过由核酸编码的多肽杀死靶细菌细胞的能力来鉴定杀伤性区段多肽。

  同样,可以化学合成编码所期望的多肽或其子序列的核酸。合适的方法包括Narang等人(1979)Meth.Enzymol.68:90-99的磷酸三酯方法;Brown等人(1979)Meth.Enzymol.68:109-151的磷酸二酯方法;Beaucage等人(1981)Tetra.Lett.,22:1859-1862的二乙基亚磷酰胺方法;以及美国专利第4,458,066号的固体支撑方法。化学合成产生单链寡核苷酸。这可以通过与互补序列杂交,或通过使用单链作为模板与DNA聚合酶聚合而转化成双链DNA。本领域技术人员认识到,尽管DNA的化学合成通常限于约100个碱基的序列,但是通过连接更短的序列可以获得更长的序列。

  可以使用DNA扩增方法(如聚合酶链式反应(PCR))克隆编码所期望的多肽或其子序列的核酸。因此,例如,使用含有一个限制性酶位点(例如NdeI)的正义引物和含有另一个限制性酶位点(例如HindIII)的反义引物对核酸序列或子序列进行PCR扩增。这将产生编码所期望的多肽或子序列并具有末端限制性酶位点的核酸。然后可以将该核酸容易地连接到含有编码第二分子的核酸并具有适当的相应限制性酶位点的载体中。合适的PCR引物可以由本领域技术人员使用GenBank或其它来源中提供的序列信息来确定。也可以通过定点诱变将适当的限制性酶位点添加到编码被转运体多肽或其多肽子序列的核酸中。用适当的限制性核酸内切酶切割含有编码被转运体多肽的核苷酸序列或子序列的质粒,然后连接到适当的载体中,用于根据标准方法扩增和/或表达。足以指导技术人员通过体外扩增方法进行操作的技术实例发现于Berger、Sambrook和Ausubel以及Mullis等人(1987)美国专利第4,683,202号;PCR Protocols A Guide to Methods and Applications(Innis等人编辑)Academic Press Inc.(1990);Arnheim&Levinson(1990年10月1日)C&EN 36-47;TheJournal Of NIH Research(1991)3:81-94;Kwoh等人(1989)Proc.Natl.Acad.Sci.,美国,86:1173;Guatelli等人(1990)Proc.Natl.Acad.Sci.,美国,87,1874;Lomell等人(1989)J.Clin.Chem.,35:1826;Landegren等人,(1988)Science 241:1077-1080;Van Brunt(1990)Biotechnology 8:291-294;Wu和Wallace(1989)Gene 4:560;以及Barringer等人(1990)Gene 89:117。

  一些编码被转运体多肽的核酸可以使用基于经鉴定的多肽的序列的PCR引物来扩增。

  可以将例如从特定核酸表达的重组被转运体多肽的其它物理性质与已知的所期望的多肽的性质进行比较,以提供鉴定例如作为细菌特异性、结合特异性和/或催化活性决定因素的被转运体蛋白的合适序列或结构域的另一种方法。可替代地,编码被转运体多肽的核酸或重组被转运体多肽基因可以被突变,并且它作为被转运体多肽的作用,或者通过检测细菌“功能”中的变异而建立的特定序列或结构域的作用,所述细菌“功能”通常由未突变的、天然存在的或对照被转运体多肽增强。本领域技术人员将认识到,可以通过分子生物学技术(例如PCR)操纵编码多肽的核酸,来促进本发明的杀伤性多肽的突变或修饰。其它诱变或基因改组技术可以被应用于本文中所述的功能性片段,包括与嵌合构建体相容的连接子特征。

  如本文中所述的,新鉴定的杀伤性多肽的功能性结构域可以通过使用标准方法来鉴定,所述方法用于突变或修饰多肽并测试它们的活性(如受体底物活性和/或催化活性)。各种杀伤性蛋白的功能性结构域的序列可以被用于构建编码或组合一种或多种杀伤性多肽的功能性结构域的核酸。然后可以测试这些多活性多肽融合体的所期望的抑菌或溶菌活性。杀伤性多肽的来源的具体实例包括前噬菌体序列,其包括功能性噬菌体基因组的不完全剩余物,或绿脓杆菌素样结构,包括衍生自噬菌体样遗传区段的颗粒(例如保留在细菌DNA中的噬菌体的缺失或突变遗传剩余物)。

  编码杀伤性多肽的核酸可以通过与已知的杀伤性多肽的核酸或氨基酸序列进行比对和比较来鉴定,例如,以确定它们之间的序列同一性的量。该信息可以被用于鉴定和选择赋予或调节杀伤性多肽活性(例如基于目的多肽之间的序列同一性的量的靶细菌或结合特异性和/或降解活性)的多肽结构域。例如,在目的杀伤性多肽之间具有序列同一性并且与已知活性相关的结构域可以被用于构建含有该结构域和其它结构域并且具有与该结构域相关的活性(例如,细菌或结合特异性和/或杀伤活性)的多肽。类似的策略可以被应用于分离适当的结构域或基序,或用于结构域间间隔的连接子。

  VIII.期望多肽在宿主细胞中的表达

  本文中所期望的蛋白质可以在多种宿主细胞(包括大肠杆菌、其它细菌宿主和酵母菌)中表达。宿主细胞可以是微生物,如例如酵母菌细胞、细菌细胞或丝状真菌细胞。合适的宿主细胞的实例包括,例如,固氮菌属(Azotobacter sp.)(例如,棕色固氮菌(A.vinelandii))、假单胞菌属(Pseudomonas sp.)、根瘤菌属(Rhizobium sp.)、欧文氏菌属(Erwinia sp.)、埃希氏杆菌属(Escherichia sp.)(例如,大肠杆菌)、芽孢杆菌属、假单胞菌属、变形杆菌属、沙门氏菌属、沙雷氏菌属、志贺氏杆菌属、根瘤菌属、透明颤菌属、副球菌属、葡萄球菌属和克雷伯氏菌属(Klebsiella sp.)等。细胞可以是几个属中的任一个,包括酵母菌属(Saccharomyces)(例如,酿酒酵母菌(S.cerevisiae))、假丝酵母菌属(Candida)(例如,产朊假丝酵母菌(C.utilis)、近平滑假丝酵母菌(C.parapsilosis)、克鲁斯假丝酵母菌(C.krusei)、多变假丝酵母菌(C.versatilis)、解脂假丝酵母菌(C.lipolytica)、涎沫假丝酵母菌(C.zeylanoides)、高里假丝酵母菌(C.guilliermondii)、白假丝酵母菌(C.albicans)和土生假丝酵母菌(C.humicola))、毕赤酵母菌属(Pichia)(例如,粉状毕赤酵母菌(P.farinosa)和奥默毕赤酵母菌(P.ohmeri))、球拟酵母菌属(Torulopsis)(例如,球拟酵母菌(T.candida)、圆球形球拟酵母菌(T.sphaerica)、木醋球拟酵母菌(T.xylinus)、无名球拟酵母菌(T.famata)和多变球拟酵母菌(T.versatilis))、德巴利氏酵母菌属(Debaryomyces)(例如,类球形德巴利氏酵母菌(D.subglobosus)、肯特利德巴利氏酵母菌(D.cantarellii)、球形德巴利氏酵母菌(D.globosus)、汉斯德巴氏酵母菌(D.hansenii)和刺参德巴利氏酵母菌(D.japonicas))、接合酵母菌属(Zygosaccharomyces)(例如,鲁氏接合酵母菌(Z.rouxii)和拜氏接合酵母菌(Z.bailii))、克鲁维酵母菌属(Kluyveromyces)(例如,马克斯克鲁维酵母菌(K.marxianus))、汉逊酵母菌属(Hansenula)(例如,异常汉逊酵母菌(H.anomala)和杰丁汉逊酵母(H.jadinii))和酒香酵母菌属(例如,郎比可酒香酵母菌(B.lambicus)和异酒香酵母菌(B.anomalus))。有用的细菌的实例包括但不限于埃希氏杆菌属、肠杆菌属、固氮菌属、欧文氏菌属、克雷伯氏菌属、芽孢杆菌属、假单胞菌属、变形杆菌属和沙门氏菌属。真核细胞(例如CHO或酵母细胞)也可以被用于生产。

  一旦在宿主细胞中表达,嵌合细菌素构建体可以被用于防止生长或杀死靶细菌。在一些实施方案中,所述细菌素构建体被用于减少革兰氏阴性细菌的生长。在一些实施方案中,所述蛋白质被用于减少克雷伯氏菌属、假单胞菌属(例如铜绿假单胞菌)或埃希氏杆菌属细菌的生长。可以产生组合此类片段的融合构建体,包括含有多种杀伤活性的融合蛋白。

  通常,将编码细菌素或嵌合细菌素构建体的多核苷酸置于在所期望的宿主细胞中起作用的启动子的控制下。各种各样的启动子是众所周知的,并且可以被用于本发明的表达载体中,这取决于具体的应用。通常,所选择的启动子取决于启动子在其中具有活性的细胞。可以包括其它表达控制序列,诸如核糖体结合位点、转录终止位点等。包括一个或多个这些控制序列的构建体被称为“表达盒”。因此,本发明提供了表达盒,其中掺入了编码融合蛋白的核酸(例如将杀伤性区段与外膜易位片段组合),以便在所期望的宿主细胞中表达。

  适用于特定宿主细胞的表达控制序列可以通过克隆在该细胞中表达的基因获得。通常使用的原核控制序列(其在本文中被限定为包括用于转录起始的启动子,任选地与操纵子,以及与核糖体结合位点序列一起)包括此类通常使用的启动子,如β-内酰胺酶(青霉素酶)和乳糖(lac)启动子系统(Change等人,Nature(1977)198:1056)、色氨酸(trp)启动子系统(Goeddel等人,Nucleic Acids Res.(1980)8:4057)、tac启动子(DeBoer等人,Proc.Natl.Acad.Sci.,美国(1983)80:21-25);以及λ衍生的PL启动子和N-基因核糖体结合位点(Shimatake等人,Nature(1981)292:128)。

  为了在大肠杆菌以外的原核细胞中表达细菌素或嵌合细菌素构建体,使用在特定原核生产物种中起作用的启动子。此类启动子可以获自已经从物种中克隆的基因,或者可以使用异源启动子。例如,除了大肠杆菌外,杂合trp-lac启动子在芽孢杆菌中起作用。

  核糖体结合位点(RBS)方便地包括在本发明的表达盒中。大肠杆菌中的示例性RBS由位于起始密码子上游的3-11个核苷酸的长度为3-9个核苷酸处的核苷酸序列组成(Shine和Dalgarno(1975)Nature 254:34;Steitz,In Biological regulation anddevelopment:Gene expression(R.F.Goldberger编辑),第1卷,第349页,1979,PlenumPublishing,NY)。

  为了在酵母中表达蛋白质,实用的启动子包括GAL1-10(Johnson和Davies(1984)Mol.Cell.Biol.4:1440-1448)、ADH2(Russell等人(1983)J.Biol.Chem.258:2674-2682)、PHO5(EMBO J.(1982)6:675-680)和MFα(Herskowitz和Oshima(1982),in The MolecularBiology of the Yeast Saccharomyces(Strathern、Jones和Broach编辑)冷泉港实验室(Cold Spring Harbor Lab.),冷泉港(Cold Spring Harbor),N.Y.,第181-209页)。用于酵母的另一种合适的启动子是如Cousens等人,Gene 61:265-275(1987)中所述的ADH2/GAPDH杂合启动子。对于丝状真菌(如例如曲霉属真菌的菌株(McKnight等人,美国专利第4,935,349号)),有用的启动子的实例包括衍生自构巢曲霉菌(Aspergillus nidulans)糖酵解基因的那些启动子,如ADH3启动(McKnight等人,EMBO J.4:2093-2099(1985))和tpiA启动子。合适的终止子的实例是ADH3终止子(McKnight等人)。

  组成型或调节型启动子可以被用于本发明。调节型启动子可能是有利的,因为在诱导融合蛋白表达之前,宿主细胞可以生长到高密度。异源多肽的高水平表达在一些情况下减缓细胞生长。诱导型启动子是指导基因表达的启动子,其中表达水平通过环境因子或发育因子是可改变的,所述环境或发育因子如例如温度、pH、厌氧条件或需氧条件、光、转录因子和化学物质。此类启动子在本文中被称为“诱导型”启动子,其允许人们控制所期望多肽的表达时间。对于大肠杆菌和其它细菌宿主细胞,诱导型启动子是本领域技术人员已知的。这些启动子包括,例如,lac启动子、噬菌体λPL启动子、杂合trp-lac启动子(Amann等人(1983)Gene 25:167;de Boer等人(1983)Proc.Nat’l.Acad.Sci.,美国,80:21)、和噬菌体T7启动子(Studier等人(1986)J.mol.Biol.;Tabor等人(1985)Proc.Nat’l.Acad.Sci.,美国,82:1074-8)。这些启动子及它们的用途在Sambrook等人(同上)中有讨论。

  构建多核苷酸构建体通常需要使用能够在细菌中复制的载体。多种试剂盒是可商购的以用于从细菌纯化质粒(参见,例如,EasyPrepJ、FlexiPrepJ,均来自PharmaciaBiotech;StrataCleanJ,来自Stratagene;和QIAexpress表达系统,Qiagen)。然后可以进一步操作分离和纯化的质粒以产生其它质粒,并用于转染细胞。在链霉菌属或芽孢杆菌属中克隆也是可能的。

  可选择的标志物经常被掺入到用于表达本发明多核苷酸的表达载体中。这些基因可以编码在选择性培养基中生长的转化的宿主细胞的存活或生长所必需的基因产物(如多肽)。许多可选择的标志物是本领域技术人员已知的,并且例如描述于Sambrook等人中(同上)。

  含有一种或多种上述组分的合适载体的构建利用如上述引用的参考文献中所述的标准连接技术。分离的质粒或DNA片段被切割、剪裁和重新连接成所期望的形式以产生所需的质粒。为了证实所构建的质粒中的正确序列,可以通过标准技术(如通过限制性核酸内切酶消化,和/或根据已知方法测序)分析质粒。实现这些末端的分子克隆技术是本领域已知的。适用于构建重组核酸的多种克隆和体外扩增方法是本领域技术人员熟知的。

  适合用作构建本发明表达载体的起始材料的各种常用载体在本领域中是众所周知的。为了在细菌中克隆,常见的载体包括pBR322衍生的载体(如pBLUESCRIPTM)和λ-噬菌体衍生的载体。在酵母菌中,载体包括酵母菌整合质粒(例如YIp5)和酵母菌复制质粒(YRp系列质粒)以及PGPD-2。在哺乳动物细胞中的表达可以使用各种通常可获得的质粒实现,包括pSV2、pBC12BI和p91023,以及裂解病毒载体(例如痘苗病毒、腺病毒和杆状病毒)、附加型病毒载体(例如牛乳头瘤病毒)和逆转录病毒载体(例如鼠逆转录病毒)。

  可以使用本领域技术人员已知的标准方法将表达载体引入选定的宿主细胞。例如,可以通过氯化钙转化将表达载体导入原核细胞(包括大肠杆菌)中,并通过磷酸钙处理或电穿孔将表达载体导入真核细胞。

  翻译偶联(Translational coupling)可以被用于增强表达。该策略使用衍生自翻译系统天然的高表达基因的短上游开放读码框(其位于启动子的下游)和核糖体结合位点,随后是几个氨基酸密码子的终止密码子。仅在终止密码子之前的是第二核糖体结合位点,并且在终止密码子之后的是用于起始翻译的起始密码子。该系统溶解RNA中的二级结构,允许翻译的有效起始。参见Squires等人(1988),J.Biol.Chem.263:16297-16302。

  本发明的各种多肽可以在细胞内表达,或者可以从细胞分泌。细胞内表达通常导致高产率。如果必要的话,可以通过进行重折叠过程来增加可溶性活性融合多肽的量(参见,例如,Sambrook等人,同上;Marston等人(1984)Bio/Technology 2:800;Schoner等人(1985)Bio/Technology 3:151)。在其中多肽被分泌到周质或细胞外介质中的实施方案中,DNA序列通常与可切割的信号肽序列连接。信号序列指导融合多肽通过细胞膜易位。用于含有启动子-信号序列单元的大肠杆菌的合适载体的实例是pTA1529,其具有大肠杆菌phoA启动子和信号序列(参见,例如,Sambrook等人,同上;Oka等人Proc.Natl.Acad.Sci.,美国,82:7212;Talmadge等人(1980)Proc.Natl.Acad.Sci.,美国,77:3988;Takahara等人(1985)J.Biol.Chem.260:2670)。在另一个实施方案中,融合多肽与蛋白A或牛血清白蛋白(BSA)的子序列融合,例如,以促进纯化、分泌或稳定性。亲和力方法(例如使用用于催化片段的底物)可能是合适的。

  本发明的细菌素多肽还可以进一步与其它多肽区段(例如生物膜解聚酶区段)连接。这种方法经常导致高产率,因为正常的原核控制序列指导转录和翻译。在大肠杆菌中,通常使用lacZ融合体表达异源蛋白。合适的载体是容易获得的,如pUR、pEX和pMR100系列。对于某些应用,可能期望在纯化后从融合多肽切割外来序列。这可以通过本领域已知的几种方法中的任一种来实现,包括通过溴化氰、蛋白酶或因子Xa的切割(参见,例如,Sambrook等人,同上;Itakura等人(1977)Science198:1056;Goeddel等人(1979)Proc.Natl.Acad.Sci.,美国,76:106;Nagai等人(1984)Nature 309:810;Sung等人(1986)Proc.Natl.Acad.Sci.,美国,83:561)。切割位点可以在期望的切割点处被工程化入融合多肽的基因中。

  通过将多个转录盒置于单个表达载体中,或通过对克隆策略中利用的每个表达载体使用不同的可选择标志物,可以在单个宿主细胞中表达多于一种的重组多肽。

  从大肠杆菌获得保持其N-末端完整性的重组蛋白的合适系统已经被描述于Miller等人(1989)Biotechnology 7:698-704。在该系统中,目的基因作为与含有肽酶切割位点的酵母菌泛素基因的前76个残基的C-末端融合而产生。在两个部分的连接处的切割导致产生具有完整的真实N-末端残基的蛋白质。

  IX.纯化所期望的多肽

  含有本文所述表达的细胞内或分泌的多肽的粗细胞提取物可以被用于本发明的方法中。

  也可以根据本领域的标准程序纯化细菌素多肽,所述标准程序包括硫酸铵沉淀、亲和柱、柱色谱分析、凝胶电泳等(通常参见R.Scope,Protein Purification,Springer-Verlag,N.Y.(1982),Deutscher,Methods in Enzymology,第.182卷:Guide to ProteinPurification.,Academic Press,Inc.N.Y.(1990))。因为降解区段至少衍生自选择用于稳定性的噬菌体蛋白,所以纯化可能涉及污染物质的变性。基本上纯的组合物通常为约70%、75%、80%、85%、90%、92%、95%、98%至99%或更高的同质。纯化的多肽也可以被用作例如用于抗体产生的免疫原,所述抗体可以被用于免疫选择纯化方法。

  为了便于纯化本发明的多肽,编码它们的核酸还可以包括可获得的亲和结合试剂的表位或“标签”的编码序列(例如纯化标签)。合适的表位的实例包括myc和V-5报告基因;用于重组产生具有这些表位的融合多肽的表达载体是可商购的(例如,Invitrogen(卡尔斯巴德CA)的载体pcDNA3.1/Myc-His和pcDNA3.1/V5-His适于在哺乳动物细胞中表达)。适用于将标签连接到本发明多肽上的其它表达载体和相应的检测系统是本领域技术人员已知的,并且一些是可商购的(例如FLAG、Kodak、罗切斯特市,NY)。合适的标签的另一个实例是能够与金属螯合物亲和配体结合的聚组氨酸序列。通常,使用六个相邻的组氨酸,尽管可以使用多于或少于六个。可以用作聚组氨酸标签的结合部分的合适的金属螯合物亲和配体包括次氮基三乙酸(NTA)(Hochuli(1990)Genetic Engineering:Principles and Methods,J.K.Setlow编辑,Plenum Press,NY;可商购自Qiagen(圣克拉里塔,CA))。纯化标签还包括麦芽糖结合结构域和淀粉结合结构域。麦芽糖结合结构域蛋白的纯化是本领域技术人员已知的。

  适合用作标签的其它半抗原是本领域技术人员已知的,并描述于例如《荧光探针和研究化学品手册》(the Handbook of Fluorescent Probes and Research Chemicals(第6版,Molecular Probes,Inc.,Eugene OR)。例如,二硝基苯酚(DNP)、地高辛、巴比妥酸盐(参见,例如,美国专利号第5,414,085号)和几种类型的荧光团可用作半抗原,这些化合物的衍生物也可用作半抗原。试剂盒可商购用于将半抗原和其它部分连接到蛋白质和其它分子上。例如,在半抗原包括巯基的情况下,异双功能连接子(如SMCC)可以被用于将标签连接到捕获试剂上存在的赖氨酸残基上。

  本领域技术人员将认识到,可以对细菌素多肽的催化或功能性结构域进行某些修饰,而不会降低它们的生物活性。可以进行一些修饰以促进催化结构域克隆、表达或掺入融合多肽。此类修饰是本领域技术人员熟知的,并且包括,例如,在编码催化结构域的多核苷酸的任一末端添加密码子,例如,在氨基末端添加甲硫氨酸以提供起始位点,或者在任一末端放置其他氨基酸(例如,聚His)以产生方便定位的限制性酶位点或终止密码子或纯化序列。

  本发明的以下讨论是为了说明和描述的目的,而不是要将本发明限制于本文中公开的一种或多种形式。尽管本发明的描述已经包括一个或多个实施方案的描述以及某些变化和修改,但是在理解本公开之后,其它变化和修改也在本发明的范围内(例如,可以在本领域技术人员的技能和知识范围内)。本文中所引用的所有出版物、专利、专利申请、Genbank号和网站均出于所有目的在此通过引入整体并入。稍后版本的教科书可能包括更新的方法。

  实施例

  实施例I:克雷伯氏菌型细菌素;克雷伯氏菌素

  克雷伯氏菌素是由克雷伯氏菌属(Klebsiella spp.)产生的高分子量(>30kDa)细菌素。与其它细菌素一样,克雷伯氏菌素也是具有三个结构域的模块蛋白。尽管对克雷伯氏菌素(如克雷伯氏菌素B、克雷伯氏菌素C、克雷伯氏菌素CCL和克雷伯氏菌素D)进行了测序,并且提出了其中一些用于克雷伯氏菌属菌株的流行病学分型,但是关于它们的抗菌特性知道的非常少。

  P628(野生型克雷伯氏菌素CCL)

  克雷伯氏菌素CCL与由阴沟肠杆菌(Enterobacter cloacae)产生的细菌素阴沟肠杆菌素(Cloacin)DF13相同。阴沟肠杆菌素DF13利用Tol-ABQR途径进行易位,并利用LutA作为细胞表面受体。预期克雷伯氏菌素的受体会因铁的存在而受到调节。细菌使用铁载体从环境中清除铁,并且这些铁载体使用在细胞表面上表达的受体进入细胞。

  DF13和克雷伯氏菌素CCL的近同一性表明Tol途径和LutA受体在这些物种之间共有。预期克雷伯氏菌素CCL是具有rRNA特异性降解的核酸酶。由于LutA作为细胞表面受体分布在许多肠杆菌科中,所以克雷伯氏菌素CCL可能具有广泛的杀伤范围。预期克雷伯氏菌素的受体会因铁的存在而受到调节。细菌使用这些受体通过释放铁载体从环境中清除铁,并且这些铁载体使用在细胞表面上表达的受体进入细胞。

  基于已发布的DNA序列(AF190857.1),我们在GangaGen细菌收集物中从克雷伯氏菌属(Klebsiella spp.)分离了克雷伯氏菌素CCL,并与其免疫基因一起克隆到大肠杆菌表达载体中以进行异源表达。

  克雷伯氏菌属菌株中克雷伯氏菌素CCL免疫基因的筛选:

  使用数据库中可获得的序列,设计引物以筛选克雷伯氏菌素CCL的存在。由于免疫基因是小产物并且总是与克雷伯氏菌素相关,因此进行免疫基因PCR。通过菌落PCR筛选几种临床克雷伯氏菌属(Klebsiella spp.)分离株。在所测试的19株分离株中,4株是免疫基因阳性的,并且这4株菌株预期含有克雷伯氏菌素CCL基因。结果示于表4中。菌株B2092被用于分离CCL基因以进行克隆。

  表4

  克雷伯氏菌素CCL的克隆和表达:

  从克雷伯菌属菌株B2092中PCR扩增编码克雷伯氏菌素CCL的基因及其免疫基因,并在NdeI-XhoI位点克隆到大肠杆菌表达载体pET26b中,以天然形式表达而没有任何亲和标签。通过PCR筛选大肠杆菌转化株,从阳性克隆中分离质粒DNA,并通过限制性消化分析确认插入片段的存在。

  测试的6个克隆中有5个释放~1.9kb的克隆插入片段。对克隆进行序列确认并进行测试蛋白表达。

  蛋白质表达:

  通过在37℃下用1mM IPTG诱导4小时,在大肠杆菌ER2566中进行测试蛋白表达。融合蛋白的预期大小为~60kDa。IPTG诱导4hr时后,沉淀细胞,重悬于20mM磷酸钠缓冲液(pH7)中并超声裂解细胞。通过在10000rpm下离心15分钟分离细胞的可溶性和不溶性级分。在12%丙烯酰胺凝胶上分析上清液和沉淀。

  克隆1、3和4表达目的蛋白,并排他地以可溶性形式存在。克隆#1被命名为p GDC628。

  P628的纯化:

  由于表达的P628没有任何亲和标签,通过常规的离子交换色谱分析纯化。简言之,将超声处理的上清液级分通过阴离子交换色谱分析基质UnoQ并收集流过物(flowthrough)。然后将收集的流过物加载到阳离子交换色谱分析基质UnoS上。洗涤结合蛋白质的基质,并用增加浓度的含NaCl的缓冲液洗脱蛋白质。用100mM、300mM、500mM和1MNaCl进行逐步梯度洗脱,并在12%丙烯酰胺凝胶上分析样品。

  与阳离子交换基质结合的P628和结合的蛋白质在300和500mM NaCl中洗脱。将这些级分分别用20mM SPB(pH7.0)透析过夜,以去除NaCl。通过Bradford测定估算蛋白质浓度为1mg/ml和1.3mg/ml。

  纯化的P628的活性:

  纯化的P628的抗菌活性通过三种试验测定:a)菌苔抑制试验,b)CFU滴定试验和c)MIC试验。

  a)菌苔抑制试验

  菌苔抑制试验是测定测试蛋白的抗菌活性的简单定性试验。在该试验中,使用测试分离株在LB琼脂板上制备细菌菌苔,并将确定浓度的测试蛋白置于菌苔上、风干并在37℃下孵育16-18hr。阳性结果将指示菌苔上清楚的抑制区。

  由于细胞表面受体LutA存在于肠杆菌科家族中,P628在克雷伯氏菌属(Klebsiella spp.)分离株和大肠杆菌分离株的菌苔上测试。在69株克雷伯氏菌属(Klebsiella spp.)临床分离株和41株大肠杆菌临床分离株上测试P628。将20μL的1mg/mL(20μg)P628置于在LB琼脂上制备的临床分离株的菌苔上。将平板在37℃孵育16-18hr。

  P628显示对85株克雷伯氏菌属分离株的抑制区(对应于70%的总测试分离株)和对6株大肠杆菌分离株的抑制区(对应于15%的测试分离株)。菌苔上的裂解区是可变的,具有非常清晰的裂解区(等级为3+),中等裂解区(等级为2+)和混浊的裂解区(1+)。在下表5中表示了百分比。

  表5

  

  P628显示在76%的经测试克雷伯氏菌属(Klebsiella spp.)上的裂解,提示这可能是一种有效的蛋白质。尽管LutA受体也分布在大肠杆菌中,但仅28%的经测试大肠杆菌菌株对P628敏感。

  b)CFU滴定测定:

  在LB培养基和胎牛血清(FBS)中测试了P628对肺炎克雷伯氏菌临床分离株B2094的抗细菌活性。简言之,将~106个细胞/mL的B2094重悬于LB或FBS中,并用体积为200μL的含100μg/mL和200μg/mL的P628的20mM SPB(pH7.0)处理。将反应混合物在37℃下孵育2小时,并通过在LB平板上稀释铺平板并在37℃下孵育18hr来对剩余数量的活细胞计数。

  P628在LB和FBS中均杀死肺炎克雷伯氏菌。然而,在FBS中活性好得多,其中在FBS中获得~4个对数的细胞杀伤并且在LB培养基中获得1个对数的细胞杀伤。结果示于图1中。

  P628对临床肺炎克雷伯氏菌菌株B2094具有有效的抗细菌活性,并且在血清中具有活性。

  c)使用另外的菌株的CFU滴定测定:

  在生长培养基和FBS中用另外的菌株进行CFU滴定测定。在该测定中,对肺炎克雷伯氏菌B2064和B2065的另外两种临床分离株测试P628的抗细菌活性。在阳离子调节的Muller Hinton肉汤(CA-MHB培养基)、50%FBS和75%FBS中,用200μg/mL的P628处理这些菌株。将反应混合物在37℃下孵育2小时,并通过在LB平板上稀释铺平板计数剩余数量的活细胞,并在37℃下孵育18hr。

  P628在CA-MHB和FBS两者中对测试的分离株均具有活性,在两种培养基中均获得至少2个对数的细胞杀伤(图2A和图2B)。

  P628对测试的肺炎克雷伯氏菌临床分离株显示出有效的抗细菌活性。

  d)MIC:

  在CA-MHB、酸水解酪蛋白培养基(Casamino acids media,CAA)和FBS中,使用改良的临床和实验室标准协会(Clinical and Laboratory Standards Institute,CLSI)肉汤微量稀释程序在肺炎克雷伯菌菌株2094上测定最小抑制浓度(MIC)。在微量滴定板中一式两份设置10个点的MIC,以875μg/mL开始进行两倍稀释。用5×105个细胞的测试分离株接种每个孔。将微量滴定板在35℃下孵育18-20hr。该测定的终点是在孵育结束时生长的完全抑制,这是通过添加碘硝基四氮唑蓝(INT)染料后,通过无色孔测定的。

  在菌株B2094上在CA-MHB中以100μg/mL、在CAA中以14μg/mL和在FBS中以219μg/mL获得MIC。

  用CAA和FBS获得了更好的MIC,表明P628在铁充足条件下效果更好。

  e)另外的临床分离株的MIC:

  通过MIC在CAMHB和FBS中测试对几种抗生素具有抗性的16株另外的临床菌株对P628的敏感性。结果示于表6中

  表6

  

  

  耐药临床肺炎克雷伯氏菌临床分离株对P628敏感。

  f)P628对肺炎克雷伯氏菌的剂量反应:

  使用CFU滴定测定,用两种肺炎克雷伯氏菌菌株评估P628在胎牛血清(FCS)中的剂量反应。简言之,在50%FCS中将~106个细胞在不同浓度的蛋白质下于37℃孵育2小时,并通过在LB平板上铺平板来计数剩余数量的活细胞。实验设置为一式两份,并且将结果绘制为一式两份的平均值。

  对分离自患者的肺炎克雷伯氏菌B2094的临床分离株进行剂量反应。使用浓度范围为100μg/ml至1μg/ml的P628。结果示于图3中。

  尽管1μg/mL展现出静态效果,但用10μg/mL的P628获得3个对数的细胞杀伤。用这种菌株,杀伤似乎在10μg/mL饱和,用25、50和100μg/mL获得类似的杀伤。

  肺炎克雷伯氏菌ATCC13883是用于测试抗生素的质量控制菌株并且对P628高度敏感。使用100μg/ml至0.25μg/ml的P628浓度。结果示于图4中。

  在ATCC 13883上获得剂量依赖性杀伤,用0.25μg/ml获得~1个对数的细胞杀伤。用10μg/ml的P628获得超过5个对数的细胞杀伤。

  实施例II:P628在肺炎克雷伯氏菌肺感染的中性粒细胞减少的小鼠模型中的体内功效的评估:

  将肺炎克雷伯杆菌肺感染模型的标准中性粒细胞减少小鼠模型用于该研究(W.A.Craig和D.R.Andes.2008.In Vivo Pharmacodynamics of Ceftobiprole againstMultiple Bacterial Pathogens in Murine Thigh and Lung InfectionModels.Antimicrob.Agents And Chemother.52,[10]3492–3496)。

  通过施用环磷酰胺使六至八周龄雌性BALB/c小鼠中性粒细胞减少。用106个CFU的肺炎克雷伯氏菌菌株ATCC13883鼻内攻击这些免疫受损的小鼠。在感染后2小时,经由静脉内(IV)途径用27mg/kg的P628治疗一组动物,经由鼻内途径用0.27mg的50微升的P628治疗另一组动物,并且通过口服途径用10mg/kg的环丙沙星治疗另一组动物。在用IV P628和环丙沙星治疗的组中,治疗方案在12小时内一次持续三天,并且用鼻内P628治疗的组的治疗方案是每天一次,直至三天。感染对照中的所有动物在72小时后都死于肺部感染。尽管用鼻内施用P628治疗动物完全保护动物免于致死性肺感染,得到100%的保护,但是在用IVP628治疗的组中只有一只动物死亡,得到83%的保护。用口服环丙沙星治疗也完全保护小鼠免于致死性感染。结果示于表7中。

  表7

  

  经由鼻内和静脉内途径施用的P628保护小鼠免受肺炎克雷伯氏菌诱导的致死性肺感染。P628在该动物模型中是有效的。

  实施例III:P636:KLEBICNCClTDRD-克雷伯氏菌素BKD:

  引言:

  细菌素是由细菌产生的蛋白质抗生素的不同家族,其杀死相同或密切相关物种的成员。很少有来自克雷伯氏菌属(Klebsiella spp.)的细菌素(克雷伯氏菌素)的报道,它们中没有一个被表征,并且对于它们的抗细菌性能一无所知。克雷伯氏菌素已经被用于对克雷伯氏菌属(Klebsiella spp)进行分型的目的数十年了,但尚未就其体外或体内抗细菌特性进行表征。

  这些蛋白质通过与受体结合并转移到周质或细胞质中以非常特异性的方式发挥它们的抗细菌活性,其中克雷伯氏菌素的杀伤性结构域由于其脱氧核糖核酸酶/核糖核酸酶活性而表现出杀菌作用。克雷伯氏菌素中的结构域组织包括易位结构域、受体结合结构域和杀伤性结构域。在某些菌株中缺乏杀伤的原因是由于受体的缺乏或免疫蛋白的存在。因此,应该可以通过用不能被免疫蛋白中和的类似结构域取代克雷伯氏菌素的杀伤性结构域来扩大宿主范围。

  克雷伯氏菌素CCL具有核糖核酸酶活性并且由克雷伯氏菌属(Klebsiella spp.)产生。它与来自阴沟肠杆菌的细菌素(阴沟肠杆菌素DF13)具有大于99%的序列同源性。克雷伯氏菌素B具有脱氧核糖核酸酶活性并且由克雷伯氏菌属(Klebsiella spp.)产生。策略是用克雷伯氏菌素B的杀伤性结构域取代克雷伯氏菌素CCL的杀伤性结构域,以克服免疫问题,从而用该嵌合分子增加抗细菌宿主范围。

  产生克雷伯氏菌素CCL(易位结构域-受体结合结构域)-克雷伯氏菌素B(杀伤性结构域):克隆策略:

  PCR扩增克雷伯氏菌素CCL易位结构域(TD)-受体结合结构域(RBD),并与克雷伯氏菌素B杀伤性结构域(KD)的PCR扩增产物以及克雷伯氏菌素B免疫蛋白(该免疫蛋白仅在转录上融合,并且对于融合蛋白的表达是必需的)通过重叠延伸PCR融合。将所得PCR产物克隆到pET26b中作为NdeI-XhoI。

  克隆经序列确认并标记为pGDC 636,克雷伯氏菌素CCL(易位结构域-受体结合结构域)-克雷伯氏菌素B(杀伤性结构域)。

  蛋白质表达研究:

  在0.8OD600下,在大肠杆菌ER2566中通过用1mM IPTG在37℃下诱导4小时来进行蛋白表达并在SDS-PAGE上检查。

  为了确定蛋白质是否可溶,超声处理细胞沉淀,通过离心分离上清液和沉淀,并加载到SDS-PAGE上。在上清液部分中观察到蛋白质。

  将诱导的蛋白质细胞沉淀重悬于缓冲液中,超声处理以裂解细胞,通过10,000rpm离心分离上清液和沉淀。通过用磷酸钠缓冲液(pH7)的阴离子交换色谱分析(unoQ)从可溶性级分中进行蛋白质纯化,以将污染蛋白质保留在基质上,并允许目的蛋白质流过,然后进行用磷酸钠缓冲液(pH7)的阳离子交换色谱分析(unoS),用氯化钠洗脱。蛋白纯化至~90%同质。

  P636对肺炎克雷伯氏菌2094的杀菌活性:

  使用CFU滴定测定测试P636的抗细菌活性。在200μg/ml下,将~106个细胞在Cas氨基酸(CAA)肉汤中和50%FCS于37℃孵育2小时,并对剩余数量的活细胞计数。实验设置为一式两份,并且结果以一式两份的平均值列出。结果示于图5中。P636在CAA中是有活性的并且显示出4个对数的下降,然而在50%中它没有显示出任何显著的cfu下降。

  P636的细胞结合活性:

  进行细胞结合测定以确定P636与肺炎克雷伯氏菌细胞的结合潜能。将在含有150mM盐的10mM SPB中的肺炎克雷伯氏菌B2094(108个细胞)的细胞与10μg的蛋白P636孵育,并在37℃下孵育30分钟,将小瓶以10,000rpm离心以沉淀细胞,并将细胞沉淀用缓冲液洗涤。将上清液和沉淀加载到SDS-PAGE上。保持单独的没有细胞的蛋白质作为对照。在上清液中观察到P636,表明蛋白质可溶于测定缓冲液中。此外,在上清液中观察到P636,表明在测试条件下蛋白质不与细胞结合。

  实施例IVS5绿脓杆菌素-溶菌酶嵌合融合体:

  引言:

  细菌素是由细菌产生的蛋白质分子以杀死密切相关的细菌。几种细菌素是已知的,例如:大肠杆菌素、绿脓杆菌素、鼠疫巴氏杆菌素等。绿脓杆菌素是由超过70%的假单胞菌属(Pseudomonas spp.)产生的细菌素。高分子量绿脓杆菌素是R型和F型绿脓杆菌素,小分子量绿脓杆菌素是S型绿脓杆菌素。S型绿脓杆菌素进入的特异性由细胞表面上存在的受体决定。这些受体被细胞用于吸收铁并被称为铁铁载体受体。S型绿脓杆菌素的结构域组织是受体结合结构域(RD)、易位结构域(TD)和杀伤性结构域(KD)。

  S型绿脓杆菌素和S型绿脓杆菌素-溶菌酶嵌合融合体的克隆:

  通过克隆到pET26b质粒中并证实序列,实现了S型绿脓杆菌素以及S型绿脓杆菌素易位结构域和结合结构域与溶菌酶结构域(肽聚糖降解结构域)的融合。溶菌酶结构域的来源来自:

  a.来自铜绿假单胞菌噬菌体P134的GP36CD

  b.来自枯草芽孢杆菌噬菌体Phi29的Phi29溶菌酶

  c.来自大肠杆菌噬菌体BP7的BP7e溶菌酶

  图6中呈现了构建体的物理图谱。

  蛋白质纯化:

  在OD600为0.8时,在大肠杆菌ER2566中通过用1mM IPTG在37℃下诱导4小时来进行蛋白表达。将诱导的细胞沉淀重悬于20mM磷酸钠缓冲液中,超声处理以裂解细胞,通过在10,000rpm离心分离上清液和沉淀。使用两步离子交换色谱分析法从可溶性级分中纯化蛋白质P624、P625、P626和P652。简言之,使澄清的细胞裂解物通过使用unosphere Q基质(Biorad)的阴离子交换色谱,并收集含有目的蛋白质的流过物。然后使流过物通过使用unosphere S基质(Biorad)的阳离子交换色谱,并用分级梯度的NaCl洗脱结合的蛋白质。将目的蛋白在300mM NaCl中洗脱P624、P625、P626和P652。对于P624、P626和P652,用20mM SPB(pH7.0)+150mM NaCl透析蛋白质,对于p625,用20mM SPB(pH7.0)透析蛋白质。

  通过Ni-NTA色谱分析纯化His标记的蛋白P623和P638,在300mM咪唑中洗脱,并用20mM SPB(pH7.0)+150mM NaCl透析P638和用20mM SPB(pH7.0)透析P623。将所有蛋白质纯化至约80%同质性。OD下降测定:

  通过使用氯仿处理的铜绿假单胞菌PA01细胞作为底物的浊度降低OD下降测定来测定所有溶菌酶结构域-GP36CD、Phi29溶菌酶和BP7e溶菌酶的催化活性。在该测定中使用50μg/ml的纯化蛋白质。通过OD下降测定的活性蛋白也提示融合蛋白中溶菌酶结构域的正确折叠。所有这三个溶菌酶结构域都是具有催化活性的。结果示于图7中。

  菌苔抑制试验:

  铜绿假单胞菌KGN 1665菌苔是通过在LB肉汤中生长菌落至OD600为0.8来制备的,并且在LB琼脂平板上制备菌苔。融合蛋白在下面提到的浓度下被点样。将P626点样在铜绿假单胞菌PAO1上的CAA琼脂上,并将P652点样在铜绿假单胞菌DSMZ 50071上的LB琼脂上。P623:20μg;P624:38μg;P625:32μg;P626:60μg;P638:12μg;P652:30μg。用除P625外的所有测试蛋白观察抑制区。

  杀菌活性:

  使用CFU滴定测定测试S5绿脓杆菌素和嵌合融合体P623、P624、P625、P626、P638和P652对铜绿假单胞菌PAO1的抗细菌活性。简言之,在200μg/ml时,将~106个细胞在CAA肉汤中的和的50%胎牛血清(FCS)中于37℃下孵育2小时,并通过在LB琼脂平板上将适当稀释液铺平板来计数剩余数量的活细胞。实验设置为一式两份,并且结果以一式两份的平均值列出。将相应的溶菌酶(P200、P198和P501)用作阴性对照。结果示于图8A-图8C中。P623和P624(S5绿脓杆菌素-GP36融合体)在CAA中显示出对PAO1杀菌活性。在50%FCS中,没有一种蛋白质对PAO1具有杀菌活性。

  实施例V使用克雷伯氏菌素和绿脓杆菌素靶向混合感染(肺炎克雷伯氏菌和铜绿假单胞菌)

  引言

  肺炎克雷伯氏菌和铜绿假单胞菌是两种形成生物膜的生物体,其可以在泌尿道、呼吸道和烧伤伤口的感染期间共存,并且与异物有关(Childers等人,(2013))。

  细菌素是细菌天然产生的蛋白质分子以杀死密切相关的细菌。几种细菌素是已知的,例如,克雷伯氏菌素、绿脓杆菌素、大肠杆菌素、鼠疫巴氏杆菌素等。

  克雷伯氏菌素已经被用于对克雷伯氏菌属(Klebsiella spp.)进行分型的目的数十年了,但尚未就其体外或体内抗细菌特性进行表征。

  绿脓杆菌素是由超过70%的假单胞菌属(Pseudomonas spp.)产生的细菌素。高分子量绿脓杆菌素是R型和F型绿脓杆菌素,小分子量绿脓杆菌素是S型绿脓杆菌素。S型绿脓杆菌素进入的特异性由细胞表面上存在的受体决定。

  克隆克雷伯氏菌素CCL和S5绿脓杆菌素

  从肺炎克雷伯氏菌基因组中PCR扩增出克雷伯氏菌素CCL基因及其免疫基因,并将它们克隆到pET26b质粒中,在大肠杆菌ER2566中表达,并通过常规色谱法(阴离子和阳离子交换色谱法)纯化。构建体经序列确认并标记(命名)为pGDC 628。

  从铜绿假单胞菌基因组PCR扩增S5型绿脓杆菌素并克隆到pET26b质粒中,在大肠杆菌ER2566中表达,并通过常规色谱法(阴离子和阳离子交换色谱法)纯化。构建体经序列确认并命名为pGDC 652。

  菌苔抑制试验:

  在LB琼脂平板上制备肺炎克雷伯氏菌B2094和铜绿假单胞菌KGN 1665的菌苔。将25μg浓度的两种蛋白质点样在CAA琼脂板上。P628和P652的组合在混合培养物中显示出菌苔抑制。

  P628和P652对铜绿假单胞菌KGN 1665和肺炎克雷伯氏菌B2094的杀菌活性

  使用CFU滴定测定测试P628和P652的抗细菌活性。在200μg/mL和400μg/mL时,将~106个细胞的铜绿假单胞菌KGN 1665(约1×106个)和肺炎克雷伯氏菌B2094(约1×106个)混合在CAA肉汤中,在37℃下孵育2小时,并计数剩余数量的活细胞。实验设置为一式两份,并且结果以一式两份的平均值列出。结果示于图9A和图9B中。P628和P652的组合在400μg/ml和200μg/ml的混合培养物中展示出杀菌活性。

  用混合培养物进行剂量依赖性研究以确定杀死细胞至少3个数量级所需的P628和P652的最小量。结果示于图10A中。在CAA和FCS两者中,P628和P652的组合甚至以10μg/ml在混合培养物中展现出杀菌活性。

  P628和P652对铜绿假单胞菌KGN 1665和大肠杆菌B563的杀菌活性

  使用CFU滴定测定测试P628和P652的抗细菌活性。将~106个细胞的铜绿假单胞菌KGN 1665(~1×106个)和大肠杆菌B563(~1×106个)在CAA肉汤中混合,并将以10μg/ml单独和组合添加的蛋白质在37℃下孵育2小时,并计数剩余数量的活细胞。实验设置为一式两份,并且结果以一式两份的平均值列出。结果示于图10B中。P628和P652的组合在10μg/ml的混合培养物中展示出杀菌活性。

  实施例VIFYUA结合结构域-溶菌酶结构域融合体:

  引言:

  细菌通过细胞表面上的受体利用铁来摄取铁。摄取由被称为铁载体的分子介导,其中铁载体结合游离铁并通过受体进入,随后铁从铁载体被释放并利用。

  鼠疫巴氏杆菌素是由鼠疫耶尔森氏菌产生的细菌素,并且用于鼠疫巴氏杆菌素摄取的受体是存在于假结核耶尔森氏菌(Yersinia pseudotuberculosis)和大肠杆菌的某些致病菌株中的铁摄取受体FyuA。鼠疫巴氏杆菌素含有Fyu A结合结构域(FyuA BD)和肽聚糖降解结构域(PGD)。Lukacik等人,(2012)“Structural engineering of a phage lysinthat targets Gram-negative pathogens”Proc Natl Acad Sci,美国,109:9857-62。作者证明用来自结构类似于其天然溶菌酶结构域的T4溶菌酶的异源溶菌酶结构域取代PGD结构域,能够进入并杀死细菌细胞。

  产生Fyu A结合结构域-T4溶菌酶和Fyu A结合结构域-铜绿假单胞菌噬菌体P134病毒体相关溶菌酶GP36(克隆策略)

  将Fyu A结合结构域与作为pET26b中NdeI-XhoI位点的T4溶菌酶融合为合成构建体。将Fyu A结合结构域与大肠杆菌表达载体pET26b中铜绿假单胞菌噬菌体P134病毒体相关溶菌酶GP36融合到克隆位点NdeI-XhoI中。克隆经序列确认并命名为pGDC 558(Fyu ABD-T4溶菌酶融合体)和pGDC 567(Fyu A BD-GP36融合体)。

  蛋白质表达研究:

  在OD600为0.8时,在大肠杆菌ER2566中通过用1mM IPTG在37℃下诱导4小时来进行蛋白表达测试。将诱导的细胞沉淀、重悬于20mM磷酸钠缓冲液中,并超声裂解细胞。然后通过10,000rpm离心15分钟使裂解物沉淀,分别收集上清液和沉淀并在SDS-PAGE凝胶上分析。在细胞的可溶性级分中的丙烯酰胺凝胶上,在~37kDa的P558和42kDa的P567处观察到蛋白质表达。

  蛋白质纯化:

  在0.8OD600时,在大肠杆菌ER2566中通过用1mM IPTG在37℃下诱导4小时来进行蛋白表达。将诱导的细胞沉淀重悬于20mM磷酸钠缓冲液中,超声处理以裂解细胞,通过在10,000rpm离心分离上清液和沉淀。使用两步离子交换色谱分析法从可溶性级分中纯化蛋白质。简言之,使澄清的细胞裂解物通过使用unosphere Q基质(Biorad)的阴离子交换色谱,并收集含有目的蛋白质的流过物。然后使流过物通过使用unosphere S基质(Biorad)的阳离子交换色谱,并用分级梯度的NaCl洗脱结合的蛋白质。将目的蛋白在500mM NaCl中洗脱。用20mM SPB(pH7.0)+300mM NaCl透析蛋白质。

  OD下降测定

  通过使用氯仿处理的铜绿假单胞菌PA01细胞作为底物的浊度降低OD下降测定来测定融合蛋白中T4溶菌酶和GP36溶菌酶的催化活性。在该测定中使用50μg/ml的纯化蛋白质。通过OD下降测定的活性蛋白也提示融合蛋白中溶菌酶结构域的正确重折叠。结果示于图11中。纯化的蛋白P558和p567具有催化活性。

  大肠杆菌ER2566中FyuA受体的克隆和表达

  FyuA BD融合体利用fyuA受体进入细菌。大肠杆菌的实验室菌株不含有该受体,因此对这些蛋白不敏感。然而,如果受体可以在实验室大肠杆菌中从质粒异源表达,则菌株可能对融合蛋白敏感。为此,从大肠杆菌临床分离株中分离FyuA受体,并克隆到pET26b中的NcoI-XhoI用于表达,作为PelB信号序列融合标签用于受体的周质定位。

  蛋白质表达研究

  在OD600为0.8时,在大肠杆菌ER2566中通过用1mM IPTG在37℃下诱导4小时来进行蛋白表达测试。在诱导的细胞中观察到预期大小的蛋白质。克隆经序列确认并命名为pGDC571。

  在表达FyuA的ER2566/pGDC571上测试P558和P567

  将pGDC571和pET26b转化到大肠杆菌ER2566中,并且使所得菌落生长至OD600为0.8,并在LB平板上制备菌苔。将50μg的P558和P567点样在ER2566/PGDC571+和ER2566pET26b(对照)上。用p558和P567观察到菌苔抑制,表明这些蛋白对表达FyuA的大肠杆菌菌株具有活性。

  P558和P567对表达FyuA的大肠杆菌的作用

  使用CFU滴定测定测试P558和P567对表达FyuA的大肠杆菌的抗细菌活性。用30μg/ml和300μg/ml的P558以及用300μg/ml的p567处理LB培养基中的~107个ER2566/PGDC 571细胞,在37℃下孵育2小时和4小时,并对剩余数量的活细胞计数。实验设置为一式两份,并且结果以两份的平均值列出。结果示于图12中。用P558以300μg/ml直到4小时观察到的静态效果。

  通过在LB平板上将适当稀释液铺平板并在37℃下孵育这些平板16-18hr来确定细胞在各个时间点的存活力。结果示于图13中。用P558(300μg/ml)观察抑菌效果,即使在4小时后细胞数仍保持恒定。

  如上所述,在蛋白浓度为300μg/ml和1350μg/ml(对于P558)以及1250μg/ml(对于p567)下进行P558和P567对表达FyuA的大肠杆菌的作用。作为对照,也用相同浓度的P558和P567处理具有载体对照(ER2566/pET26b)的ER2566。结果示于图14中。P558抑制表达FyuA受体的ER2566细胞的生长,并且在对照(ER2566/pET26b)中没有观察到生长抑制。

  P558对大肠杆菌ER2566/FyuA+作用的活性

  使用CFU滴定测定测试P558针对表达FyuA的大肠杆菌的抗细菌活性。简言之,用P558以300μg/ml处理在50%LB肉汤和50%胎牛血清(FCS)中的~107个ER2566/FyuA细胞,在37℃孵育2小时和4小时,并通过对剩余数量的活细胞计数来确定细胞杀伤。实验设置为一式两份,并且结果以一式两份的平均值列出。结果示于图15A和图15B中。

  P558对假结核耶尔森氏菌作用的活性:

  使用CFU滴定测定测试P558对假结核耶尔森氏菌的抗细菌活性。简言之,用P558以300μg/ml处理在50%LB肉汤和50%胎牛血清(FCS)中的~107个假结核耶尔森氏菌细胞,在37℃孵育2小时和4小时,并通过对剩余数量的活细胞计数来确定细胞杀伤。实验设置为一式两份,并且结果以一式两份的平均值列出。结果示于图16中。在50%LB培养基和50%FCS中,P558都显示出对假结核耶尔森氏菌的静态效果。

  P558对大肠杆菌SLC-6作用的活性

  使用CFU滴定测定测试P558对大肠杆菌SLC-6(泌尿道感染分离株)的抗细菌活性。已知UTI分离株含有FyuA基因并在泌尿道中表达受体,这有助于细菌定殖和存活。简言之,以300μg/ml,在50%LB肉汤和50%胎牛血清(FCS)中的~107个细胞在37℃下孵育2小时和4小时,并对剩余数量的活细胞计数。实验设置为一式两份,并且结果以一式两份的平均值列出。结果示于图17中。在50%LB培养基和50%FCS中,P558对大肠杆菌SLC-6显示出静态效果。

  P558对FyuA基因PCR阳性的大肠杆菌UTI分离株作用的活性

  通过PCR筛选从尿中分离的临床大肠杆菌菌株中fyuA基因的存在。将少数阳性菌株作为测定P558活性的测试菌株。测定条件:50%LB肉汤和50%胎牛血清(FCS),反应体积:2ml。持续时间:在37℃,200rpm下2小时和4小时。测试的菌株:大肠杆菌ER2566/FyuA,B5031、B5113(大肠杆菌UTI分离株)。结果示于图18A和图18B中。在50%LB和50%FCS中,P558对大肠杆菌B5031显示出静态效果。

  P558对FyuA基因PCR阳性的克雷伯氏菌属临床分离株:(FyuA+)作用的活性

  通过PCR筛选从尿中分离的临床克雷伯氏菌属菌株中FyuA基因的存在。将少数阳性菌株作为测定P558活性的测试菌株。测定条件:50%LB肉汤和50%胎牛血清(FCS),反应体积:2ml。持续时间:在37℃,200rpm下2小时和4小时。测试的菌株:大肠杆菌ER2566/FyuA、克雷伯氏菌属(Klebsiella spp)B2103、克雷伯氏菌属(Klebsiella spp)B2096(克雷伯氏菌属的FyuA+PCR阳性)。结果示于图19中。在50%LB中,P558对大肠杆菌B2103显示出静态效果。

  P558在LB(50%)和FCS(50%)中的MIC

  通过CLSI方法,在50%LB和50%FCS中,用P558在大肠杆菌ER2566/FyuA、大肠杆菌ER2566/pET26b、假结核耶尔森氏菌和大肠杆菌SLC-6上进行MIC测定。在6小时和18小时都观察到MIC。结果示于表8和表9中。P558仅在6h时对大肠杆菌ER2566(FyuA)显示出非常低的MIC,然而在测试的其它菌株上没有观察到MIC。

  表8

  

  表9

  

  其他FyuABD融合体:

  通过克隆到pET26b质粒中产生FyuA结合结构域和肽聚糖降解结构域的融合体,并证实序列。

  a.FyuA BD-来自枯草芽孢杆菌噬菌体Phi29的Phi29溶菌酶

  b.FyuA BD-来自大肠杆菌噬菌体BP7的BP7e溶菌酶

  c.FyuA BD-来自丁香假单胞菌(P.syringiae)噬菌体Phi6的Phi6 P5裂解酶

  d.FyuA BD-GS连接子-GP36 CD

  通过离子交换色谱分析法将蛋白质纯化至90%的同质性。

  OD下降测定:

  使用氯仿处理的铜绿假单胞菌细胞作为底物,通过OD下降测定测定FyuA融合体的催化活性。在该测定中使用50μg/ml的纯化蛋白质。通过OD下降测定的活性蛋白也将提示溶菌酶的正确重折叠。结果示于图20中。如所获得的OD下降所观察到的,纯化的蛋白P581、P583和P580具有催化活性。P578没有活性,表明催化结构域是非功能性的。

  FyuA BD融合体对表达FyuA的大肠杆菌的作用:

  使用CFU滴定测定测试融合蛋白对表达FyuA的大肠杆菌的抗细菌活性。简言之,用P558以300μg/ml处理在50%LB肉汤中的~107个ER2566/FyuA细胞,在37℃下孵育2小时和4小时,并通过对剩余数量的活细胞计数来确定细胞杀伤。实验设置为一式两份,并且结果以一式两份的平均值列出。结果示于图21中。P558和P581抑制表达FyuA受体的ER2566细胞的生长。在其它蛋白质中没有观察到抑制作用。

  通过在LB平板上将适当稀释液铺平板并在37℃下孵育这些平板16-18hr来确定细胞在各个时间点的存活力。结果示于图22中。在50%LB培养基中,P558显示~1个对数的下降和P581显示~2个对数的下降

  菌苔抑制试验:

  将fyuA构建体pGDC571转化到大肠杆菌ER2566中,并且将所得菌落在LB肉汤中生长至OD600为0.8,以及在LB琼脂平板上制备菌苔。将融合蛋白点样在ER2566/pGDC 571和假结核耶尔森氏菌上。用P581观察到表达FyuA的ER2566和假结核耶尔森氏菌的透明抑制区。

  在LB和FCS中P581对临床UTI菌株(FyuA+)作用的活性

  假结核耶尔森氏菌、大肠杆菌B5501、B5503和B5504。测定条件:50%LB肉汤和50%胎牛血清(FCS)。反应体积:2ml。持续时间:在37℃、200rpm下2小时和4小时。细胞:105个CFU/mL。蛋白质:300μg/mL。孵育:37℃、200rpm,2h,4h。结果示于图23中。在LB和FCS中,P581对假结核耶尔森氏菌有活性。

  实施例VII将选择的细菌素受体转移至靶标埃希氏菌属细菌

  使用含有大肠杆菌信号序列(例如,pelB)的引物从假结核耶尔森氏菌基因组(登录号:Z35107.1)PCR扩增编码FyuA受体的基因。从鼠伤寒沙门氏菌(Salmonellatyphimurium)LT2分离出宽宿主范围缀合质粒(例如pLM2),并在合适的限制性位点克隆上述PCR产物,通过电穿孔转化到大肠杆菌实验室菌株中,并通过PCR筛选重组克隆。含有目的基因的菌落是“供体”细菌。使5ml供体和受体细胞(其中必须表达FyuA受体的大肠杆菌)生长至OD600为0.5-0.7。混合100微升供体和受体培养物(对照:仅100微升供体和受体细胞),离心以用0.85%盐水洗涤细胞两次。将沉淀重悬于20微升盐水中,并点样在干燥良好的LB琼脂陪替氏培养板上。使平板干燥并在30摄氏度下孵育过夜,然后将培养物刮入500微升盐水中并涡旋以破坏配对。将悬浮液以各种适当的稀释涂布在各自的选择平板(例如双抗菌素平板)上。通常通过PCR确认用于缀合的合适菌落是否存在缀合质粒。在LB肉汤中使转化接合子菌落生长至OD600为0.8。将培养物稀释至OD600为0.2并铺展在LB琼脂平板上并使其干燥。将蛋白P558(FyuA结合域-T4溶菌酶)融合体点样(10μg)在菌苔上,并将平板在37℃孵育17小时。被视为清除的抑制区表示由于FyuA受体的表达而引起的细菌的易感性。受体细菌的对照培养物也用P558点样。

  实施例VIII构建与AMP融合的细菌素:

  将编码细菌素的基因克隆到大肠杆菌表达载体(如pET质粒)中并证实重组细菌素的表达。通过基于PCR的方法在细菌素的5’或3’末端克隆编码AMP的DNA序列以获得融合基因。将上表中列出的不同AMP序列与各种细菌素融合。将这些融合基因克隆到细菌表达载体中并确认DNA序列。可替代地,编码AMP的DNA序列被合成为具有适当限制性酶识别位点的寡核苷酸,以克隆到已经含有细菌素基因的质粒中。

  蛋白质表达、纯化和重折叠:

  所有经证实的DNA序列的嵌合细菌素在适当的实验室大肠杆菌中表达。例如,使携带质粒的大肠杆菌ER2566生长,例如在37℃下直至OD600达到~0.8至1.0,并通过添加IPTG至最终浓度1mM来诱导蛋白质表达,并进行诱导,例如在37℃下4小时。IPTG诱导4小时后,收集细胞并在丙烯酰胺凝胶上检测蛋白质表达。一旦证实了测试重组嵌合细菌素的表达,例如通过亲和色谱分析法纯化。例如,使用天然纯化条件纯化在细胞的可溶性级分中表达的蛋白质,并且使用尿素或胍盐酸盐在变性条件下纯化表达为包涵体(IB)的蛋白质以使IB变性。变性蛋白质的重折叠例如通过除去变性剂来进行,例如通过在4℃下在适当的缓冲液中透析16-18hr来进行。在重折叠后,在丙烯酰胺凝胶上分析纯化的、重折叠的蛋白质的同质性,并通过Bradford测定确定蛋白质浓度。

  杀菌测定:

  a)在缓冲液和缓冲盐水中的CFU滴定测定:

  将革兰氏阴性细胞例如在LB培养基中生长直到对数中期(OD600为~0.6),在适当的缓冲液(如20mM HEPES(pH7.0)或20mM SPB(pH7.0))中,在有或没有150mM NaCl的情况下稀释100倍至~106个CFU/ml的密度。用不同浓度(例如,50-200μg/mL)的纯化的测试蛋白处理100μL的细胞。调节反应混合物的最终体积,例如,用适当的缓冲液调节至200μL。将反应混合物例如在37℃下孵育2小时,并通过在LB平板上将适当的稀释液铺平板,然后在37℃下孵育过夜来对剩余数量的活细胞计数。通过将未处理细胞的初始数量除以以对数单位计的残余细胞数量并将数据绘制为条形图来计算抗细菌活性。

  生长培养基中的GCFU滴定测定:

  将革兰氏阴性细胞例如在LB培养基中生长直到对数中期(OD600为~0.6),在LB或CA-MHB培养基中稀释100倍至最终密度为~106个CFU/ml。用不同浓度(例如,50-200μg/mL)的纯化的测试蛋白处理100μL的细胞。调节反应混合物的最终体积,例如,用适当的缓冲液调节至200μL。将反应混合物例如在37℃下孵育2小时,并通过在LB平板上将适当的稀释液铺平板,然后在37℃下孵育过夜来对剩余数量的活细胞计数。通过将未处理细胞的初始数量除以以对数单位的残余细胞数量并将数据绘制为条形图来计算抗细菌活性。

  胎牛血清(FBS)中的CFU滴定测定:

  将革兰氏阴性细胞例如在LB培养基中生长直到对数中期(OD600为~0.6),在FBS中稀释100倍至~106个CFU/ml的最终密度。用不同浓度(例如,100-400μg/mL)的纯化的测试蛋白处理100μL的细胞。调节反应混合物的最终体积,例如用CA-MHB培养基调节至200μL。将反应混合物例如在37℃下孵育2小时,并通过在LB平板上将适当的稀释液铺平板,然后在37℃下孵育过夜来对剩余数量的活细胞计数。通过将未处理细胞的初始数量除以以对数单位的残余细胞数量并将数据绘制为条形图来计算抗细菌活性。

  最小抑制浓度(MIC)测定:

  例如,在阳离子调节的Mueller Hinton肉汤(CA-MHB培养基)或在50%FBS中,使用改良的临床和实验室标准协会(CLSI)肉汤微量稀释程序在革兰氏阴性细胞上测定MIC。在微量滴定板中设置10个点的MIC,一式两份,稀释两倍。将96孔的铺有聚苯乙烯的孔例如用0.5%BSA在37℃下包被1小时,并将每个孔例如用5×105个细胞/mL的革兰氏阴性细菌接种。在测定中包括缺乏测试蛋白的生长阳性对照。将微量滴定板在例如35℃下孵育18-20hr。MIC被确定为在孵育结束时完全抑制细菌生长的最小浓度,例如,如在添加碘硝基四氮唑蓝(INT)染料后,通过无色孔测定的。

  序列表

  <110> 冈戈根股份有限公司(Gangagen Inc.)

  <120> 治疗性细菌素

  <130> PD027683IN-SC

  <160> 30

  <170> PatentIn version 3.5

  <210> 1

  <211> 1689

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> NCBI登录号AF190857

  <400> 1

  atgagtggtg gagacggtcg aggtccgggt aattcaggtc tgggacataa tggtggtcag 60

  gccagtggga atgtgaacgg tacgtctggt aaaggcggcc cttcatcagg tgggggtacg 120

  gatccaaaca gcgggccggg ctggggtacg acgcatacgc ctaacggaga tattcataac 180

  tacaatccgg gggagtttgg tcacggaggg aataaacccg gtggcaatgg cggtaacagc 240

  ggcaatcatc ccggtagttc tggtggcaga cagtcttcgg ccacagcgat ggccttcggt 300

  ctgcctgctc tggctactcc gggctccggg gggctggctt tagccgtttc cggcgatgcg 360

  ttgtcggcag ccgttgctag tgtgctggct gccctgaaag ggccgtttaa gtttggtctg 420

  tgggggattg cgatctacgg tgtgctgcct tctgagattg caaaagatga tccgaaaatg 480

  atgtcaaaaa ttatgacgtc attaccggcc gatgcggtga cggagactcc ggcaagtact 540

  ttaccactgg accaggcgac ggttcgtgtc agacaacggg ttgtggatgt ggtgaaggat 600

  gagcggcagc atattgcggt tgtcgcaggt cggccaatga gtgtccctgt ggtggatgcg 660

  aaaccgacaa aacgtccggg ggtattcagt gtgtcgattc cgggtctccc gtctctgcag 720

  gtgagcgtac cgaaaggtgt tccgacagcg aaagccccgc caaaaggcat tgttgctgaa 780

  aaaggtgatt cacgtccggc tggttttaca gccggtggta actcccgtga ggccgttatt 840

  cgtttcccga aagagaccgg acagaagccg gtttatgtgt cggtgacaga tgttcttacc 900

  ccggcacagg taaaacagcg tcaggaggaa gaaaagcgtc gccagcaggc atgggacgcc 960

  gctcatccgg aagaggggct gaaaagagac tatgataaag cgaaagccga gctggatgcc 1020

  gaagataaaa atattgcgac cttaaacagc cgcattgcat cgacagagaa ggcgctcccc 1080

  ggtgcaaggg ctgctgttca ggaagccgat aaaaaggtga aagaggcaga ggcgaataag 1140

  gatgattttg tgacttataa ccctcctcat gaatatggct ccgggtggca ggatcaggtt 1200

  cgctatcttg ataaggatat tcagaatcag aatgcgaaat taaaagcggc tcaggcatct 1260

  ttaaacgcaa tgaatgaatc cttatccaga gataaggctt gcacttcccg ggcgatggag 1320

  agccggaaac aaaaggagaa aaaagcgaag gatgcagaaa ataagttaaa tgaggaaaag 1380

  aaaaaacctc gcaagggagc taaagactac ggccatgatt atcatccagc cccgaaaact 1440

  gaagacataa agggactggg tgacctcaaa aaaggtacac ctaaaacacc aatgcaggga 1500

  ggtggaggta ggcgtaaacg ctggattggt gataaaggcc gtaagattta tgaatgggac 1560

  tcccagcacg gtgagcttga agggtatcgt gccagtgatg gcgaacacct cggggcattt 1620

  gatcctaaaa cgggtaagca aattaaaggt ccggatccga aagggcgaaa cattaaaaaa 1680

  tatctttaa 1689

  <210> 2

  <211> 562

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 由SEQ ID NO: 1编码的氨基酸序列

  <400> 2

  Met Ser Gly Gly Asp Gly Arg Gly Pro Gly Asn Ser Gly Leu Gly His

  1 5 1015

  Asn Gly Gly Gln Ala Ser Gly Asn Val Asn Gly Thr Ser Gly Lys Gly

  202530

  Gly Pro Ser Ser Gly Gly Gly Thr Asp Pro Asn Ser Gly Pro Gly Trp

  354045

  Gly Thr Thr His Thr Pro Asn Gly Asp Ile His Asn Tyr Asn Pro Gly

  505560

  Glu Phe Gly His Gly Gly Asn Lys Pro Gly Gly Asn Gly Gly Asn Ser

  65707580

  Gly Asn His Pro Gly Ser Ser Gly Gly Arg Gln Ser Ser Ala Thr Ala

  859095

  Met Ala Phe Gly Leu Pro Ala Leu Ala Thr Pro Gly Ser Gly Gly Leu

  100 105 110

  Ala Leu Ala Val Ser Gly Asp Ala Leu Ser Ala Ala Val Ala Ser Val

  115 120 125

  Leu Ala Ala Leu Lys Gly Pro Phe Lys Phe Gly Leu Trp Gly Ile Ala

  130 135 140

  Ile Tyr Gly Val Leu Pro Ser Glu Ile Ala Lys Asp Asp Pro Lys Met

  145 150 155 160

  Met Ser Lys Ile Met Thr Ser Leu Pro Ala Asp Ala Val Thr Glu Thr

  165 170 175

  Pro Ala Ser Thr Leu Pro Leu Asp Gln Ala Thr Val Arg Val Arg Gln

  180 185 190

  Arg Val Val Asp Val Val Lys Asp Glu Arg Gln His Ile Ala Val Val

  195 200 205

  Ala Gly Arg Pro Met Ser Val Pro Val Val Asp Ala Lys Pro Thr Lys

  210 215 220

  Arg Pro Gly Val Phe Ser Val Ser Ile Pro Gly Leu Pro Ser Leu Gln

  225 230 235 240

  Val Ser Val Pro Lys Gly Val Pro Thr Ala Lys Ala Pro Pro Lys Gly

  245 250 255

  Ile Val Ala Glu Lys Gly Asp Ser Arg Pro Ala Gly Phe Thr Ala Gly

  260 265 270

  Gly Asn Ser Arg Glu Ala Val Ile Arg Phe Pro Lys Glu Thr Gly Gln

  275 280 285

  Lys Pro Val Tyr Val Ser Val Thr Asp Val Leu Thr Pro Ala Gln Val

  290 295 300

  Lys Gln Arg Gln Glu Glu Glu Lys Arg Arg Gln Gln Ala Trp Asp Ala

  305 310 315 320

  Ala His Pro Glu Glu Gly Leu Lys Arg Asp Tyr Asp Lys Ala Lys Ala

  325 330 335

  Glu Leu Asp Ala Glu Asp Lys Asn Ile Ala Thr Leu Asn Ser Arg Ile

  340 345 350

  Ala Ser Thr Glu Lys Ala Leu Pro Gly Ala Arg Ala Ala Val Gln Glu

  355 360 365

  Ala Asp Lys Lys Val Lys Glu Ala Glu Ala Asn Lys Asp Asp Phe Val

  370 375 380

  Thr Tyr Asn Pro Pro His Glu Tyr Gly Ser Gly Trp Gln Asp Gln Val

  385 390 395 400

  Arg Tyr Leu Asp Lys Asp Ile Gln Asn Gln Asn Ala Lys Leu Lys Ala

  405 410 415

  Ala Gln Ala Ser Leu Asn Ala Met Asn Glu Ser Leu Ser Arg Asp Lys

  420 425 430

  Ala Cys Thr Ser Arg Ala Met Glu Ser Arg Lys Gln Lys Glu Lys Lys

  435 440 445

  Ala Lys Asp Ala Glu Asn Lys Leu Asn Glu Glu Lys Lys Lys Pro Arg

  450 455 460

  Lys Gly Ala Lys Asp Tyr Gly His Asp Tyr His Pro Ala Pro Lys Thr

  465 470 475 480

  Glu Asp Ile Lys Gly Leu Gly Asp Leu Lys Lys Gly Thr Pro Lys Thr

  485 490 495

  Pro Met Gln Gly Gly Gly Gly Arg Arg Lys Arg Trp Ile Gly Asp Lys

  500 505 510

  Gly Arg Lys Ile Tyr Glu Trp Asp Ser Gln His Gly Glu Leu Glu Gly

  515 520 525

  Tyr Arg Ala Ser Asp Gly Glu His Leu Gly Ala Phe Asp Pro Lys Thr

  530 535 540

  Gly Lys Gln Ile Lys Gly Pro Asp Pro Lys Gly Arg Asn Ile Lys Lys

  545 550 555 560

  Tyr Leu

  <210> 3

  <211> 2298

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> NCBI登录号: NC_002610.1

  <400> 3

  atgggtggtg gatttaacta taacggggaa ggtgctactg gcaccggatt ggatcgtgat 60

  ccatatgttc gcgacagcaa tggtaatgct attggtgtta aatcacgcta tcacgcggag 120

  tcctatggga cgtcaagtcc agccttaggg cctaatggcg ctattcagat tactgctggg 180

  gttattgctg tgcctggaga taagccccga cctgacggtg gtagtggtgg tgggaatact 240

  gttaacaccg gacctgcagg acagctcctg gtgatgaata aaggtcagct tggatactgg 300

  gaaactcgtt ctacgggcgc gggtaacaat gagcataata cgagtgtatt tgttgctgta 360

  ggtccttctg aggcagaaaa aactgcttct gcagagaagg cgttaaagga aaaacagcag 420

  gcagaagcag cagcaaaaga ctttgcggct aaaactgctg ccgcatcagc cacggcggaa 480

  aaagaacgcc agcaggcaat tgctgctgca actgcagcgg gtcagcatca gtcagtttct 540

  gatgcccgta atagcctgaa taacgcgacg tcagatgtgt ctcgtctgaa atcagctgca 600

  gacagtgcac tgcaggaggc aaaggcaaaa cggaaggctg ctattgatgc tgtacctgtt 660

  gcaacccagg cggaaaataa atatcaggag ctgcagcaga agattaaagg cctgaagctg 720

  aaaaatggtg agtatggtac ggataaatgg gaaataattg gctctaataa ggagcatgat 780

  cactggggat acaggtttta tccatccgga attaccaaag ctcaggttga tgcggcgcag 840

  atcgatgctg tgaataagcg aaatcaggct accagtcttg ccagtcaggc aacagcagca 900

  gaacaggaca gcctgaaagc tacagctgcc tataatgcgg cagaaacgcg ccgtcaggct 960

  gctcaggcgg cgttaaattc tgctgaacag gctgctgctg ctgaacgtaa gcggcaggaa 1020

  gctgaggcgg ctgcagcagc tgctgctgag aaaaaacgtc aggcagacgc agcagcaaaa 1080

  gctgcagagg aagcgcgtgc ggcagcggaa aaagccaggc tgatgcagga gcgtcaggca 1140

  gcagcagata agctgaaatc cacagatatt cagtctgttc gcgggatccc gtctacggct 1200

  gcgcctgcag cgtcacccat ttcctgggcc gttgcatcac ttggtggtat atcgctggat 1260

  agtgttactg cagggaaagc atggacgcag attgctgagg tgatggctaa actacgaggt 1320

  attgccggtg cgagtcttgt tggtcccgtg gtggcaactg ctgtagggct gttttggtca 1380

  cgtgatgttg gtattggcag tgatgtggtg cccggacgtg acatcagcgg gctgatgccg 1440

  ggtgatgcac tgtcattacc tgatctggcc actttgatta aagctgctga cagtaaaacg 1500

  ggtgtcagta tgccggttcg aggccggatt atcgtgcgtg aaggcgatta tctggagtct 1560

  cagttcgttc gaacacctgt tgccggtagt gttccggttg ttcgggctgc tctggataaa 1620

  gctactggtt actggggata tacgttgccg gcgatacagg gtgtgcccgg acagacaata 1680

  ctggtgagtc cgtcagatgc gccgggcgtt aatggtcctc tgggacttgc tgggccggtt 1740

  cctttgcctg aaactattat acataccggt gggcaaacta cggttcctca gggggggact 1800

  gtgacagttt cgccggcaga agacgatatt gatttcaatg atttgattct ggtatttccg 1860

  ccggagtccg gtcttaaacc gttgtatgtg atgtaccgta gccctcgtaa catgccgggg 1920

  acagccagtg gtaaaggtca gaacgttgga aataactgga tgggggggac cagtaccggg 1980

  gatggtgctc ctgttccttc ccagattgca gataaattac gtgggaaggc tttcggtagt 2040

  tttgattctt tctgtcgggc tttctggaaa gcggttgctg ctgatccgga cctcagtaag 2100

  cagttttatc ctgatgatat agagcgaatg aaattagggc gagctccaac agttcgattc 2160

  cgagattctg taggtaaaag ggttaaggtt gaactacacc ataaagttga aatttctaaa 2220

  ggtggtgatg tctataacgt agataacctg aatgcattaa cacctaaacg tcatattgaa 2280

  attcataagg ggaactga 2298

  <210> 4

  <211> 765

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 由SEQ ID NO: 3编码的氨基酸序列

  <400> 4

  Met Gly Gly Gly Phe Asn Tyr Asn Gly Glu Gly Ala Thr Gly Thr Gly

  1 5 1015

  Leu Asp Arg Asp Pro Tyr Val Arg Asp Ser Asn Gly Asn Ala Ile Gly

  202530

  Val Lys Ser Arg Tyr His Ala Glu Ser Tyr Gly Thr Ser Ser Pro Ala

  354045

  Leu Gly Pro Asn Gly Ala Ile Gln Ile Thr Ala Gly Val Ile Ala Val

  505560

  Pro Gly Asp Lys Pro Arg Pro Asp Gly Gly Ser Gly Gly Gly Asn Thr

  65707580

  Val Asn Thr Gly Pro Ala Gly Gln Leu Leu Val Met Asn Lys Gly Gln

  859095

  Leu Gly Tyr Trp Glu Thr Arg Ser Thr Gly Ala Gly Asn Asn Glu His

  100 105 110

  Asn Thr Ser Val Phe Val Ala Val Gly Pro Ser Glu Ala Glu Lys Thr

  115 120 125

  Ala Ser Ala Glu Lys Ala Leu Lys Glu Lys Gln Gln Ala Glu Ala Ala

  130 135 140

  Ala Lys Asp Phe Ala Ala Lys Thr Ala Ala Ala Ser Ala Thr Ala Glu

  145 150 155 160

  Lys Glu Arg Gln Gln Ala Ile Ala Ala Ala Thr Ala Ala Gly Gln His

  165 170 175

  Gln Ser Val Ser Asp Ala Arg Asn Ser Leu Asn Asn Ala Thr Ser Asp

  180 185 190

  Val Ser Arg Leu Lys Ser Ala Ala Asp Ser Ala Leu Gln Glu Ala Lys

  195 200 205

  Ala Lys Arg Lys Ala Ala Ile Asp Ala Val Pro Val Ala Thr Gln Ala

  210 215 220

  Glu Asn Lys Tyr Gln Glu Leu Gln Gln Lys Ile Lys Gly Leu Lys Leu

  225 230 235 240

  Lys Asn Gly Glu Tyr Gly Thr Asp Lys Trp Glu Ile Ile Gly Ser Asn

  245 250 255

  Lys Glu His Asp His Trp Gly Tyr Arg Phe Tyr Pro Ser Gly Ile Thr

  260 265 270

  Lys Ala Gln Val Asp Ala Ala Gln Ile Asp Ala Val Asn Lys Arg Asn

  275 280 285

  Gln Ala Thr Ser Leu Ala Ser Gln Ala Thr Ala Ala Glu Gln Asp Ser

  290 295 300

  Leu Lys Ala Thr Ala Ala Tyr Asn Ala Ala Glu Thr Arg Arg Gln Ala

  305 310 315 320

  Ala Gln Ala Ala Leu Asn Ser Ala Glu Gln Ala Ala Ala Ala Glu Arg

  325 330 335

  Lys Arg Gln Glu Ala Glu Ala Ala Ala Ala Ala Ala Ala Glu Lys Lys

  340 345 350

  Arg Gln Ala Asp Ala Ala Ala Lys Ala Ala Glu Glu Ala Arg Ala Ala

  355 360 365

  Ala Glu Lys Ala Arg Leu Met Gln Glu Arg Gln Ala Ala Ala Asp Lys

  370 375 380

  Leu Lys Ser Thr Asp Ile Gln Ser Val Arg Gly Ile Pro Ser Thr Ala

  385 390 395 400

  Ala Pro Ala Ala Ser Pro Ile Ser Trp Ala Val Ala Ser Leu Gly Gly

  405 410 415

  Ile Ser Leu Asp Ser Val Thr Ala Gly Lys Ala Trp Thr Gln Ile Ala

  420 425 430

  Glu Val Met Ala Lys Leu Arg Gly Ile Ala Gly Ala Ser Leu Val Gly

  435 440 445

  Pro Val Val Ala Thr Ala Val Gly Leu Phe Trp Ser Arg Asp Val Gly

  450 455 460

  Ile Gly Ser Asp Val Val Pro Gly Arg Asp Ile Ser Gly Leu Met Pro

  465 470 475 480

  Gly Asp Ala Leu Ser Leu Pro Asp Leu Ala Thr Leu Ile Lys Ala Ala

  485 490 495

  Asp Ser Lys Thr Gly Val Ser Met Pro Val Arg Gly Arg Ile Ile Val

  500 505 510

  Arg Glu Gly Asp Tyr Leu Glu Ser Gln Phe Val Arg Thr Pro Val Ala

  515 520 525

  Gly Ser Val Pro Val Val Arg Ala Ala Leu Asp Lys Ala Thr Gly Tyr

  530 535 540

  Trp Gly Tyr Thr Leu Pro Ala Ile Gln Gly Val Pro Gly Gln Thr Ile

  545 550 555 560

  Leu Val Ser Pro Ser Asp Ala Pro Gly Val Asn Gly Pro Leu Gly Leu

  565 570 575

  Ala Gly Pro Val Pro Leu Pro Glu Thr Ile Ile His Thr Gly Gly Gln

  580 585 590

  Thr Thr Val Pro Gln Gly Gly Thr Val Thr Val Ser Pro Ala Glu Asp

  595 600 605

  Asp Ile Asp Phe Asn Asp Leu Ile Leu Val Phe Pro Pro Glu Ser Gly

  610 615 620

  Leu Lys Pro Leu Tyr Val Met Tyr Arg Ser Pro Arg Asn Met Pro Gly

  625 630 635 640

  Thr Ala Ser Gly Lys Gly Gln Asn Val Gly Asn Asn Trp Met Gly Gly

  645 650 655

  Thr Ser Thr Gly Asp Gly Ala Pro Val Pro Ser Gln Ile Ala Asp Lys

  660 665 670

  Leu Arg Gly Lys Ala Phe Gly Ser Phe Asp Ser Phe Cys Arg Ala Phe

  675 680 685

  Trp Lys Ala Val Ala Ala Asp Pro Asp Leu Ser Lys Gln Phe Tyr Pro

  690 695 700

  Asp Asp Ile Glu Arg Met Lys Leu Gly Arg Ala Pro Thr Val Arg Phe

  705 710 715 720

  Arg Asp Ser Val Gly Lys Arg Val Lys Val Glu Leu His His Lys Val

  725 730 735

  Glu Ile Ser Lys Gly Gly Asp Val Tyr Asn Val Asp Asn Leu Asn Ala

  740 745 750

  Leu Thr Pro Lys Arg His Ile Glu Ile His Lys Gly Asn

  755 760 765

  <210> 5

  <211> 1855

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> NCBI登录号: AY578793.1

  <400> 5

  atggcagata atcaaccggt tcctcttacc cccgcaccac ctggaatggt atcacttggc 60

  gtcaatgaaa acggcgaaga ggagatgact gtcattggtg gagatggcag cggcacaggg 120

  ttttctggga atgaagcacc tattattcct ggaagtggta gcctccaggc cgacttaggt 180

  aaaaagtctc taacccgact acaggctgaa agttcagcag caattcatgc gactgcaaaa 240

  tggactacag agaatcttgc aaaaacgcag gctgcgcagg ctgaaagggc caaggctgcc 300

  atgctttctc agcaggcagc aaaagcaaaa caggccaaac tcacgctaca tctgaaagat 360

  gtagtggatc gcgcgcttca gaacaacaaa acgcggccta ctgttattga tcttgctcat 420

  cagaataacc aacaaatggc cgcaatggcc gagtttatag gccgtcaaaa ggcaattgaa 480

  gaagctcgta aaaaggctga aagggaagcc aaaagggctg aagaagctta tcaggctgct 540

  ttgagagcgc aggaagaaga acagcgcaag caggcagaaa ttgaacggaa attgcaggag 600

  gcaaggaagc aagaggcagc ggcaaaagca aaagctgaag ctgacagaat tgcggctgag 660

  aaagctgaag cagaggcaag agctaaagcg gaagctgagc gacggaaagc agaggaggct 720

  cgaaaggcgc tttttgcaaa ggctgggatt aaggacactc ctgtttatac actggagaag 780

  acaaaagcag ccactacgtt gtttttaaca ccgggtgtta ggttactgaa tcgtgctcca 840

  gcgatgatac agttatccgc tttggctgca gaaattaatg gcgtcttaac tactgctgct 900

  agtgcagtaa tgacggctac tgctgaattc tcaggttgga ttgcctcagc gttatggcga 960

  ggtgtagctg gtgttgcaac agctagtact gttggtccca tggttgccgc agcatcgacg 1020

  ctattctttt cacctcgcgc aggtggcgga agcgacagta aggttcctgg tagggatatc 1080

  gagatgttgg ctgcgcaagc caggttgttc acggcgggta agctgagtat cgaacatgaa 1140

  gagcgtcaac ctcccggtac gtggcttcat ctcttcggaa actgatgggc gccagtctct 1200

  gatgcttgta aaaaccggtt ctgatggagt accttccact gttcctgtat tggatgctgt 1260

  acgtgacagt actactggcc ttgataaaat aacggtaccg gcgatgtctg gtgcgccgtc 1320

  gcggaccatc ctcgtgaatc cggttccaat tggacctgct gctccgtggc ataccggcaa 1380

  tagcgggcca gtgccagtaa cacctgttca caccggtaca gaggtgaagc aggctgacag 1440

  tatcgtcacg acaactttgc cgattgcaga cattccgcca ctacaggact tcatctactg 1500

  gcagccggat gcttctggga caggtgttga acctatttat gtaatgacta gtcaacccag 1560

  gaaaggagta aaagactacg gacatgatta tcatccggct ccaaaaactg aagaaattaa 1620

  ggggttgggg gagttgattg agtctcggaa aaaaactcca aaacaagggg gaggtggacg 1680

  acgagatcga tgggtgggag ataaaggacg aaaaatctat gagtgggatt cgcagcatgg 1740

  agaacttgaa ggttacagag ctagcgacgg ctctcatctt ggagcatttg atccaaacac 1800

  cggcaagcaa cttaaaggtc cggaccctaa acgtaacatc aaaaaatatc tttga 1855

  <210> 6

  <211> 619

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 由SEQ ID NO: 5编码的氨基酸序列

  <400> 6

  Met Ala Asp Asn Gln Pro Val Pro Leu Thr Pro Ala Pro Pro Gly Met

  1 5 1015

  Val Ser Leu Gly Val Asn Glu Asn Gly Glu Glu Glu Met Thr Val Ile

  202530

  Gly Gly Asp Gly Ser Gly Thr Gly Phe Ser Gly Asn Glu Ala Pro Ile

  354045

  Ile Pro Gly Ser Gly Ser Leu Gln Ala Asp Leu Gly Lys Lys Ser Leu

  505560

  Thr Arg Leu Gln Ala Glu Ser Ser Ala Ala Ile His Ala Thr Ala Lys

  65707580

  Trp Thr Thr Glu Asn Leu Ala Lys Thr Gln Ala Ala Gln Ala Glu Arg

  859095

  Ala Lys Ala Ala Met Leu Ser Gln Gln Ala Ala Lys Ala Lys Gln Ala

  100 105 110

  Lys Leu Thr Leu His Leu Lys Asp Val Val Asp Arg Ala Leu Gln Asn

  115 120 125

  Asn Lys Thr Arg Pro Thr Val Ile Asp Leu Ala His Gln Asn Asn Gln

  130 135 140

  Gln Met Ala Ala Met Ala Glu Phe Ile Gly Arg Gln Lys Ala Ile Glu

  145 150 155 160

  Glu Ala Arg Lys Lys Ala Glu Arg Glu Ala Lys Arg Ala Glu Glu Ala

  165 170 175

  Tyr Gln Ala Ala Leu Arg Ala Gln Glu Glu Glu Gln Arg Lys Gln Ala

  180 185 190

  Glu Ile Glu Arg Lys Leu Gln Glu Ala Arg Lys Gln Glu Ala Ala Ala

  195 200 205

  Lys Ala Lys Ala Glu Ala Asp Arg Ile Ala Ala Glu Lys Ala Glu Ala

  210 215 220

  Glu Ala Arg Ala Lys Ala Glu Ala Glu Arg Arg Lys Ala Glu Glu Ala

  225 230 235 240

  Arg Lys Ala Leu Phe Ala Lys Ala Gly Ile Lys Asp Thr Pro Val Tyr

  245 250 255

  Thr Leu Glu Lys Thr Lys Ala Ala Thr Thr Leu Phe Leu Thr Pro Gly

  260 265 270

  Val Arg Leu Leu Asn Arg Ala Pro Ala Met Ile Gln Leu Ser Ala Leu

  275 280 285

  Ala Ala Glu Ile Asn Gly Val Leu Thr Thr Ala Ala Ser Ala Val Met

  290 295 300

  Thr Ala Thr Ala Glu Phe Ser Gly Trp Ile Ala Ser Ala Leu Trp Arg

  305 310 315 320

  Gly Val Ala Gly Val Ala Thr Ala Ser Thr Val Gly Pro Met Val Ala

  325 330 335

  Ala Ala Ser Thr Leu Phe Phe Ser Pro Arg Ala Gly Gly Gly Ser Asp

  340 345 350

  Ser Lys Val Pro Gly Arg Asp Ile Glu Met Leu Ala Ala Gln Ala Arg

  355 360 365

  Leu Phe Thr Ala Gly Lys Leu Ser Ile Glu Pro Gly Met Lys Ser Val

  370 375 380

  Asn Leu Pro Val Arg Gly Phe Ile Ser Ser Glu Thr Asp Gly Arg Gln

  385 390 395 400

  Ser Leu Met Leu Val Lys Thr Gly Ser Asp Gly Val Pro Ser Thr Val

  405 410 415

  Pro Val Leu Asp Ala Val Arg Asp Ser Thr Thr Gly Leu Asp Lys Ile

  420 425 430

  Thr Val Pro Ala Met Ser Gly Ala Pro Ser Arg Thr Ile Leu Val Asn

  435 440 445

  Pro Val Pro Ile Gly Pro Ala Ala Pro Trp His Thr Gly Asn Ser Gly

  450 455 460

  Pro Val Pro Val Thr Pro Val His Thr Gly Thr Glu Val Lys Gln Ala

  465 470 475 480

  Asp Ser Ile Val Thr Thr Thr Leu Pro Ile Ala Asp Ile Pro Pro Leu

  485 490 495

  Gln Asp Phe Ile Tyr Trp Gln Pro Asp Ala Ser Gly Thr Gly Val Glu

  500 505 510

  Pro Ile Tyr Val Met Thr Ser Gln Pro Arg Lys Gly Val Lys Asp Tyr

  515 520 525

  Gly His Asp Tyr His Pro Ala Pro Lys Thr Glu Glu Ile Lys Gly Leu

  530 535 540

  Gly Glu Leu Ile Glu Ser Arg Lys Lys Thr Pro Lys Gln Gly Gly Gly

  545 550 555 560

  Gly Arg Arg Asp Arg Trp Val Gly Asp Lys Gly Arg Lys Ile Tyr Glu

  565 570 575

  Trp Asp Ser Gln His Gly Glu Leu Glu Gly Tyr Arg Ala Ser Asp Gly

  580 585 590

  Ser His Leu Gly Ala Phe Asp Pro Asn Thr Gly Lys Gln Leu Lys Gly

  595 600 605

  Pro Asp Pro Lys Arg Asn Ile Lys Lys Tyr Leu

  610 615

  <210> 7

  <211> 2151

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> NCBI登录号: AY578792

  <400> 7

  atgagtgata tcacatataa tcctgaggac tataacaatg gtataccacc tgagccgggt 60

  ctggtgtgga agccgggagg ctcattcccc aatggcagtt acgttcccgg ctcatggggc 120

  tggccaacgc gcggatacga tgttcctccg ctgccgggtg ataccgaaat gctgacggtc 180

  accccaaaag gaacgccggc tgatacctgg cctaaaagac ctgatatcaa agagtggtat 240

  gttccgggtg aaaaaccctt cgacccgtca acaggtaatg gatgggtgcc tgatgtggac 300

  ggctacgccg aatcgctgcc tgccggtata ccggctgtgg tacaggctgc aatcagtaag 360

  gtgaaaggtg cgccactgaa aggcggcatg tccgccgtgg atatctggaa actgaaaccc 420

  gcaacggagt acccggggag atttaacagc accgacccgg cattcagctg gtttccggtt 480

  cgggcgctga ctgacactga tatatctgcg atgcccgttg cccctgagac tgttccggtg 540

  catacccgta tccttgataa tgttcatgat ggtgtacagt ttgtttctgc ggtgtttgcg 600

  ggtagcatgc agtacaatct gccggtggtg aaagcgcagg ccactgccgg cagtgattat 660

  tacactatcg gacgtctgcc gggcatcatg agtgctttca cattctcttt ctacacaaaa 720

  ggaacaccac aggactcccg tttcttccgg gatacagtga aagccggggg agatttacgc 780

  gaagcaggct tcactgtggg ggccaatacc agcgatttta tcatctggtt tccgcagggg 840

  agcggactgg agccgctgta tttttccatg accatgaata tgccggctgg gccgctgcag 900

  cgtcgccagg aagccgaaaa caaggccaga gcagaagctg acaggctccg ggcagaggcg 960

  gaggcaaaaa ttcgcgctga agcagaggcc cgggcgaaag cagaagcaga acgcaaagcc 1020

  ctgttcgcta aggccggtat tcaggataca ccggtttaca cgccggagat ggtgaaggcg 1080

  gcaaatgcgg cgctgtctgc cggaggctca atggcgctca gccgggcccc ggggatgata 1140

  cagcactctg ctgcaggcgt ggggacgcta cccttcaaca gtagtctggc gggatgggaa 1200

  gccggcgcgc tctggcgcgg tgtcgacgtg cttgccagga tcgcgccggt cgcgtccgcc 1260

  gtggccacgg ttgccacagt gctcaccctt gtcagggctg cactggatat ccctgcagcc 1320

  ggcgagggca gtgacagggt tcccggacgc aacattgaca tgcttgccgc ccaggccagc 1380

  ctgtacacgg ccatgaagac gaacattcag ccggggatga agaccgttga cctgccagtc 1440

  aggggatata tctcgtatga cggcaacggc cggcagtcgg tcaacttggt caggacgggg 1500

  acgggcgggg tttcggccac ggtgccggtg ctgagtgccg tgcgtgacaa aaccaccggc 1560

  ctggataaaa tcacggtacc ggccgtggcg ggcgccccgt cgcggaccat cctgattaac 1620

  cctgtaccgg tcggtcctgc gacaccatcg cataccggca gcagtacgcc ggttccggtg 1680

  acgccggtgc acactggtac cgatgttaag caggcggaca gcatcgtcac cacaacgttg 1740

  ccggcggcag atattcctgc gctgcaggac ttcatctact ggcagccgga tgcaaccggg 1800

  acgggcgtgg aacccatcta tgtcatgctg agtgatccgt tggattcggg gaaatatacc 1860

  cgcaggcagc tccagaagaa gtacaagcat gctatcgatt ttggtatcac agatacgaag 1920

  ataaatggtg aaacacttac taagttccgg gatgcaattg aagcacatct ttcagataag 1980

  gatacctttg aaaaaggaac atatcggcgt gataagggat cgaaggttta tttcaatcct 2040

  aaaacaatga atgctgttat tattcaggct aatggtgact ttctgtctgg atggaaaatt 2100

  aatcctgcgg cagataatgg tagaatttat ttagaaacgg gtgatttatg a 2151

  <210> 8

  <211> 716

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 由SEQ ID NO: 7编码的氨基酸序列

  <400> 8

  Met Ser Asp Ile Thr Tyr Asn Pro Glu Asp Tyr Asn Asn Gly Ile Pro

  1 5 1015

  Pro Glu Pro Gly Leu Val Trp Lys Pro Gly Gly Ser Phe Pro Asn Gly

  202530

  Ser Tyr Val Pro Gly Ser Trp Gly Trp Pro Thr Arg Gly Tyr Asp Val

  354045

  Pro Pro Leu Pro Gly Asp Thr Glu Met Leu Thr Val Thr Pro Lys Gly

  505560

  Thr Pro Ala Asp Thr Trp Pro Lys Arg Pro Asp Ile Lys Glu Trp Tyr

  65707580

  Val Pro Gly Glu Lys Pro Phe Asp Pro Ser Thr Gly Asn Gly Trp Val

  859095

  Pro Asp Val Asp Gly Tyr Ala Glu Ser Leu Pro Ala Gly Ile Pro Ala

  100 105 110

  Val Val Gln Ala Ala Ile Ser Lys Val Lys Gly Ala Pro Leu Lys Gly

  115 120 125

  Gly Met Ser Ala Val Asp Ile Trp Lys Leu Lys Pro Ala Thr Glu Tyr

  130 135 140

  Pro Gly Arg Phe Asn Ser Thr Asp Pro Ala Phe Ser Trp Phe Pro Val

  145 150 155 160

  Arg Ala Leu Thr Asp Thr Asp Ile Ser Ala Met Pro Val Ala Pro Glu

  165 170 175

  Thr Val Pro Val His Thr Arg Ile Leu Asp Asn Val His Asp Gly Val

  180 185 190

  Gln Phe Val Ser Ala Val Phe Ala Gly Ser Met Gln Tyr Asn Leu Pro

  195 200 205

  Val Val Lys Ala Gln Ala Thr Ala Gly Ser Asp Tyr Tyr Thr Ile Gly

  210 215 220

  Arg Leu Pro Gly Ile Met Ser Ala Phe Thr Phe Ser Phe Tyr Thr Lys

  225 230 235 240

  Gly Thr Pro Gln Asp Ser Arg Phe Phe Arg Asp Thr Val Lys Ala Gly

  245 250 255

  Gly Asp Leu Arg Glu Ala Gly Phe Thr Val Gly Ala Asn Thr Ser Asp

  260 265 270

  Phe Ile Ile Trp Phe Pro Gln Gly Ser Gly Leu Glu Pro Leu Tyr Phe

  275 280 285

  Ser Met Thr Met Asn Met Pro Ala Gly Pro Leu Gln Arg Arg Gln Glu

  290 295 300

  Ala Glu Asn Lys Ala Arg Ala Glu Ala Asp Arg Leu Arg Ala Glu Ala

  305 310 315 320

  Glu Ala Lys Ile Arg Ala Glu Ala Glu Ala Arg Ala Lys Ala Glu Ala

  325 330 335

  Glu Arg Lys Ala Leu Phe Ala Lys Ala Gly Ile Gln Asp Thr Pro Val

  340 345 350

  Tyr Thr Pro Glu Met Val Lys Ala Ala Asn Ala Ala Leu Ser Ala Gly

  355 360 365

  Gly Ser Met Ala Leu Ser Arg Ala Pro Gly Met Ile Gln His Ser Ala

  370 375 380

  Ala Gly Val Gly Thr Leu Pro Phe Asn Ser Ser Leu Ala Gly Trp Glu

  385 390 395 400

  Ala Gly Ala Leu Trp Arg Gly Val Asp Val Leu Ala Arg Ile Ala Pro

  405 410 415

  Val Ala Ser Ala Val Ala Thr Val Ala Thr Val Leu Thr Leu Val Arg

  420 425 430

  Ala Ala Leu Asp Ile Pro Ala Ala Gly Glu Gly Ser Asp Arg Val Pro

  435 440 445

  Gly Arg Asn Ile Asp Met Leu Ala Ala Gln Ala Ser Leu Tyr Thr Ala

  450 455 460

  Met Lys Thr Asn Ile Gln Pro Gly Met Lys Thr Val Asp Leu Pro Val

  465 470 475 480

  Arg Gly Tyr Ile Ser Tyr Asp Gly Asn Gly Arg Gln Ser Val Asn Leu

  485 490 495

  Val Arg Thr Gly Thr Gly Gly Val Ser Ala Thr Val Pro Val Leu Ser

  500 505 510

  Ala Val Arg Asp Lys Thr Thr Gly Leu Asp Lys Ile Thr Val Pro Ala

  515 520 525

  Val Ala Gly Ala Pro Ser Arg Thr Ile Leu Ile Asn Pro Val Pro Val

  530 535 540

  Gly Pro Ala Thr Pro Ser His Thr Gly Ser Ser Thr Pro Val Pro Val

  545 550 555 560

  Thr Pro Val His Thr Gly Thr Asp Val Lys Gln Ala Asp Ser Ile Val

  565 570 575

  Thr Thr Thr Leu Pro Ala Ala Asp Ile Pro Ala Leu Gln Asp Phe Ile

  580 585 590

  Tyr Trp Gln Pro Asp Ala Thr Gly Thr Gly Val Glu Pro Ile Tyr Val

  595 600 605

  Met Leu Ser Asp Pro Leu Asp Ser Gly Lys Tyr Thr Arg Arg Gln Leu

  610 615 620

  Gln Lys Lys Tyr Lys His Ala Ile Asp Phe Gly Ile Thr Asp Thr Lys

  625 630 635 640

  Ile Asn Gly Glu Thr Leu Thr Lys Phe Arg Asp Ala Ile Glu Ala His

  645 650 655

  Leu Ser Asp Lys Asp Thr Phe Glu Lys Gly Thr Tyr Arg Arg Asp Lys

  660 665 670

  Gly Ser Lys Val Tyr Phe Asn Pro Lys Thr Met Asn Ala Val Ile Ile

  675 680 685

  Gln Ala Asn Gly Asp Phe Leu Ser Gly Trp Lys Ile Asn Pro Ala Ala

  690 695 700

  Asp Asn Gly Arg Ile Tyr Leu Glu Thr Gly Asp Leu

  705 710 715

  <210> 9

  <211> 1386

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 克雷伯氏菌素CCL的DNA序列以及免疫基因。

  AF190857.1:166-1854肺炎克雷伯菌阴沟肠杆菌素操纵子,

  完整序列,1956个碱基

  <400> 9

  atgagtggtg gagacggtcg aggtccgggt aattcaggtc tgggacataa tggtggtcag 60

  gccagtggga atgtgaacgg tacgtctggt aaaggcggcc cttcatcagg tgggggtacg 120

  gatccaaaca gcgggccggg ctggggtacg acgcatacgc ctaacggaga tattcataac 180

  tacaatccgg gggagtttgg tcacggaggg aataaacccg gtggcaatgg cggtaacagc 240

  ggcaatcatc ccggtagttc tggtggcaga cagtcttcgg ccacagcgat ggccttcggt 300

  ctgcctgctc tggctactcc gggctccggg gggctggctt tagccgtttc cggcgatgcg 360

  ttgtcggcag ccgttgctag tgtgctggct gccctgaaag ggccgtttaa gaaaagagac 420

  tatgataaag cgaaagccga gctggatgcc gaagataaaa atattgcgac cttaaacagc 480

  cgcattgcat cgacagagaa ggcgctcccc ggtgcaaggg ctgctgttca ggaagccgat 540

  aaaaaggtga aagaggcaga ggcgaataag gatgattttg tgacttataa ccctcctcat 600

  gaatatggct ccgggtggca ggatcaggtt cgctatcttg ataaggatat tcagaatcag 660

  aatgcgaaat taaaagcggc tcaggcatct ttaaacgcaa tgaatgaatc cttatccaga 720

  gataaggctt gcacttcccg ggcgatggag agccggaaac aaaaggagaa aaaagcgaag 780

  gatgcagaaa ataagttaaa tgaggaaaag aaaaaacctc gcaagggagc taaagactac 840

  ggccatgatt atcatccagc cccgaaaact gaagacataa agggactggg tgacctcaaa 900

  aaaggtacac ctaaaacacc aatgcaggga ggtggaggta ggcgtaaacg ctggattggt 960

  gataaaggcc gtaagattta tgaatgggac tcccagcacg gtgagcttga agggtatcgt 1020

  gccagtgatg gcgaacacct cggggcattt gatcctaaaa cgggtaagca aattaaaggt 1080

  ccggatccga aagggcgaaa cattaaaaaa tatctttaag aggtaagtat gggacttaaa 1140

  ttaaatttaa cctggtttga taagaaaact gaagagttta aaggggaaga gtattctaaa 1200

  gactttggtg atgatggttc tgtcattgaa agtcttggga tgcctttaaa ggataatatt 1260

  aacaatggtt gttttgatgt gaaaaatgag tgggtttcat tattgcaacc ctactttaaa 1320

  cataaaatca atctttctga tagttcatat tttgtttcat ttgattatcg ggatggtaac 1380

  tggtaa 1386

  <210> 10

  <211> 562

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 克雷伯氏菌素CCL的氨基酸序列

  <400> 10

  Met Ser Gly Gly Asp Gly Arg Gly Pro Gly Asn Ser Gly Leu Gly His

  1 5 1015

  Asn Gly Gly Gln Ala Ser Gly Asn Val Asn Gly Thr Ser Gly Lys Gly

  202530

  Gly Pro Ser Ser Gly Gly Gly Thr Asp Pro Asn Ser Gly Pro Gly Trp

  354045

  Gly Thr Thr His Thr Pro Asn Gly Asp Ile His Asn Tyr Asn Pro Gly

  505560

  Glu Phe Gly His Gly Gly Asn Lys Pro Gly Gly Asn Gly Gly Asn Ser

  65707580

  Gly Asn His Pro Gly Ser Ser Gly Gly Arg Gln Ser Ser Ala Thr Ala

  859095

  Met Ala Phe Gly Leu Pro Ala Leu Ala Thr Pro Gly Ser Gly Gly Leu

  100 105 110

  Ala Leu Ala Val Ser Gly Asp Ala Leu Ser Ala Ala Val Ala Ser Val

  115 120 125

  Leu Ala Ala Leu Lys Gly Pro Phe Lys Phe Gly Leu Trp Gly Ile Ala

  130 135 140

  Ile Tyr Gly Val Leu Pro Ser Glu Ile Ala Lys Asp Asp Pro Lys Met

  145 150 155 160

  Met Ser Lys Ile Met Thr Ser Leu Pro Ala Asp Ala Val Thr Glu Thr

  165 170 175

  Pro Ala Ser Thr Leu Pro Leu Asp Gln Ala Thr Val Arg Val Arg Gln

  180 185 190

  Arg Val Val Asp Val Val Lys Asp Glu Arg Gln His Ile Ala Val Val

  195 200 205

  Ala Gly Arg Pro Met Ser Val Pro Val Val Asp Ala Lys Pro Thr Lys

  210 215 220

  Arg Pro Gly Val Phe Ser Val Ser Ile Pro Gly Leu Pro Ser Leu Gln

  225 230 235 240

  Val Ser Val Pro Lys Gly Val Pro Thr Ala Lys Ala Pro Pro Lys Gly

  245 250 255

  Ile Val Ala Glu Lys Gly Asp Ser Arg Pro Ala Gly Phe Thr Ala Gly

  260 265 270

  Gly Asn Ser Arg Glu Ala Val Ile Arg Phe Pro Lys Glu Thr Gly Gln

  275 280 285

  Lys Pro Val Tyr Val Ser Val Thr Asp Val Leu Thr Pro Ala Gln Val

  290 295 300

  Lys Gln Arg Gln Glu Glu Glu Lys Arg Arg Gln Gln Ala Trp Asp Ala

  305 310 315 320

  Ala His Pro Glu Glu Gly Leu Lys Arg Asp Tyr Asp Lys Ala Lys Ala

  325 330 335

  Glu Leu Asp Ala Glu Asp Lys Asn Ile Ala Thr Leu Asn Ser Arg Ile

  340 345 350

  Ala Ser Thr Glu Lys Ala Leu Pro Gly Ala Arg Ala Ala Val Gln Glu

  355 360 365

  Ala Asp Lys Lys Val Lys Glu Ala Glu Ala Asn Lys Asp Asp Phe Val

  370 375 380

  Thr Tyr Asn Pro Pro His Glu Tyr Gly Ser Gly Trp Gln Asp Gln Val

  385 390 395 400

  Arg Tyr Leu Asp Lys Asp Ile Gln Asn Gln Asn Ala Lys Leu Lys Ala

  405 410 415

  Ala Gln Ala Ser Leu Asn Ala Met Asn Glu Ser Leu Ser Arg Asp Lys

  420 425 430

  Ala Cys Thr Ser Arg Ala Met Glu Ser Arg Lys Gln Lys Glu Lys Lys

  435 440 445

  Ala Lys Asp Ala Glu Asn Lys Leu Asn Glu Glu Lys Lys Lys Pro Arg

  450 455 460

  Lys Gly Ala Lys Asp Tyr Gly His Asp Tyr His Pro Ala Pro Lys Thr

  465 470 475 480

  Glu Asp Ile Lys Gly Leu Gly Asp Leu Lys Lys Gly Thr Pro Lys Thr

  485 490 495

  Pro Met Gln Gly Gly Gly Gly Arg Arg Lys Arg Trp Ile Gly Asp Lys

  500 505 510

  Gly Arg Lys Ile Tyr Glu Trp Asp Ser Gln His Gly Glu Leu Glu Gly

  515 520 525

  Tyr Arg Ala Ser Asp Gly Glu His Leu Gly Ala Phe Asp Pro Lys Thr

  530 535 540

  Gly Lys Gln Ile Lys Gly Pro Asp Pro Lys Gly Arg Asn Ile Lys Lys

  545 550 555 560

  Tyr Leu

  <210> 11

  <211> 2107

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 克雷伯氏菌素CCL TDRD + 克雷伯氏菌素B KD + 免疫基因: 2107个碱基

  <400> 11

  atgagtggtg gagacggtcg aggtccgggt aattcaggtc tgggacataa tggtggtcag 60

  gccagtggga atgtgaacgg tacgtctggt aaaggcggcc cttcatcagg tgggggtacg 120

  gatccaaaca gcgggccggg ctggggtacg acgcatacgc ctaacggaga tattcataac 180

  tacaatccgg gggagtttgg tcacggaggg aataaacccg gtggcaatgg cggtaacagc 240

  ggcaatcatc ccggtagttc tggtggcaga cagtcttcgg ccacagcgat ggccttcggt 300

  ctgcctgctc tggctactcc gggctccggg gggctggctt tagccgtttc cggcgatgcg 360

  ttgtcggcag ccgttgctag tgtgctggct gccctgaaag ggccgtttaa gtttggtctg 420

  tgggggattg cgatctacgg tgtgctgcct tctgagattg caaaagatga tccgaaaatg 480

  atgtcaaaaa ttatgacgtc attaccggcc gatgcggtga cggagactcc ggcaagtact 540

  ttaccactgg accaggcgac ggttcgtgtc agacaacggg ttgtggatgt ggtgaaggat 600

  gagcggcagc atattgcggt tgtcgcaggt cggccaatga gtgtccctgt ggtggatgcg 660

  aaaccgacaa aacgtccggg ggtattcagt gtgtcgattc cgggtctccc gtctctgcag 720

  gtgagcgtac cgaaaggtgt tccgacagcg aaagccccgc caaaaggcat tgttgctgaa 780

  aaaggtgatt cacgtccggc tggttttaca gccggtggta actcccgtga ggccgttatt 840

  cgtttcccga aagagaccgg acagaagccg gtttatgtgt cggtgacaga tgttcttacc 900

  ccggcacagg taaaacagcg tcaggaggaa gaaaagcgtc gccagcaggc atgggacgcc 960

  gctcatccgg aagaggggct gaaaagagac tatgataaag cgaaagccga gctggatgcc 1020

  gaagataaaa atattgcgac cttaaacagc cgcattgcat cgacagagaa ggcgctcccc 1080

  ggtgcaaggg ctgctgttca ggaagccgat aaaaaggtga aagaggcaga ggcgaataag 1140

  gatgattttg tgacttataa ccctcctcat gaatatggct ccgggtggca ggatcaggtt 1200

  cgctatcttg ataaggatat tcagaatcag aatgcgaaat taaaagcggc tcaggcatct 1260

  ttaaacgcaa tgaatgaatc cttatccaga gataaggctt gcacttcccg ggcgatggag 1320

  agccggaaac aaaaggagaa aaaagcgaag gatgcagaaa ataagttaaa tgaggaaaag 1380

  aaaaaacctc gcaagggagc taaagactac ggccatgatg gtcttaaacc gttgtatgtg 1440

  atgtaccgta gccctcgtaa catgccgggg acagccagtg gtaaaggtca gaacgttgga 1500

  aataactgga tgggggggac cagtaccggg gatggtgctc ctgttccttc ccagattgca 1560

  gataaattac gtgggaaggc tttcggtagt tttgattctt tctgtcgggc tttctggaaa 1620

  gcggttgctg ctgatccgga cctcagtaag cagttttatc ctgatgatat agagcgaatg 1680

  aaattagggc gagctccaac agttcgattc cgagattctg taggtaaaag ggttaaggtt 1740

  gaactacacc ataaagttga aatttctaaa ggtggtgatg tctataacgt agataacctg 1800

  aatgcattaa cacctaaacg tcatattgaa attcataagg ggaactgaaa tggctaataa 1860

  aactttggct gactatacag agcaggaatt tattgagttt atcgaaaaaa ttaaaaaggc 1920

  agactttgct actgagtctg agcatgatga ggctatttat gagttcagcc agttgactga 1980

  gcatccagat ggttgggatc ttatttatca tcctcaagca ggagccgata actctcctgc 2040

  tggtgttgta aaaacagtaa aagagtggcg agcagctaac ggtaagccag gttttaaaaa 2100

  atcgtga 2107

  <210> 12

  <211> 615

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 克雷伯氏菌素 CCL TD RBD (1-1419); 克雷伯氏菌素 B KD (1420-1849); 克雷伯氏菌素 B

  免疫蛋白 (1850-末端)

  <400> 12

  Met Ser Gly Gly Asp Gly Arg Gly Pro Gly Asn Ser Gly Leu Gly His

  1 5 1015

  Asn Gly Gly Gln Ala Ser Gly Asn Val Asn Gly Thr Ser Gly Lys Gly

  202530

  Gly Pro Ser Ser Gly Gly Gly Thr Asp Pro Asn Ser Gly Pro Gly Trp

  354045

  Gly Thr Thr His Thr Pro Asn Gly Asp Ile His Asn Tyr Asn Pro Gly

  505560

  Glu Phe Gly His Gly Gly Asn Lys Pro Gly Gly Asn Gly Gly Asn Ser

  65707580

  Gly Asn His Pro Gly Ser Ser Gly Gly Arg Gln Ser Ser Ala Thr Ala

  859095

  Met Ala Phe Gly Leu Pro Ala Leu Ala Thr Pro Gly Ser Gly Gly Leu

  100 105 110

  Ala Leu Ala Val Ser Gly Asp Ala Leu Ser Ala Ala Val Ala Ser Val

  115 120 125

  Leu Ala Ala Leu Lys Gly Pro Phe Lys Phe Gly Leu Trp Gly Ile Ala

  130 135 140

  Ile Tyr Gly Val Leu Pro Ser Glu Ile Ala Lys Asp Asp Pro Lys Met

  145 150 155 160

  Met Ser Lys Ile Met Thr Ser Leu Pro Ala Asp Ala Val Thr Glu Thr

  165 170 175

  Pro Ala Ser Thr Leu Pro Leu Asp Gln Ala Thr Val Arg Val Arg Gln

  180 185 190

  Arg Val Val Asp Val Val Lys Asp Glu Arg Gln His Ile Ala Val Val

  195 200 205

  Ala Gly Arg Pro Met Ser Val Pro Val Val Asp Ala Lys Pro Thr Lys

  210 215 220

  Arg Pro Gly Val Phe Ser Val Ser Ile Pro Gly Leu Pro Ser Leu Gln

  225 230 235 240

  Val Ser Val Pro Lys Gly Val Pro Thr Ala Lys Ala Pro Pro Lys Gly

  245 250 255

  Ile Val Ala Glu Lys Gly Asp Ser Arg Pro Ala Gly Phe Thr Ala Gly

  260 265 270

  Gly Asn Ser Arg Glu Ala Val Ile Arg Phe Pro Lys Glu Thr Gly Gln

  275 280 285

  Lys Pro Val Tyr Val Ser Val Thr Asp Val Leu Thr Pro Ala Gln Val

  290 295 300

  Lys Gln Arg Gln Glu Glu Glu Lys Arg Arg Gln Gln Ala Trp Asp Ala

  305 310 315 320

  Ala His Pro Glu Glu Gly Leu Lys Arg Asp Tyr Asp Lys Ala Lys Ala

  325 330 335

  Glu Leu Asp Ala Glu Asp Lys Asn Ile Ala Thr Leu Asn Ser Arg Ile

  340 345 350

  Ala Ser Thr Glu Lys Ala Leu Pro Gly Ala Arg Ala Ala Val Gln Glu

  355 360 365

  Ala Asp Lys Lys Val Lys Glu Ala Glu Ala Asn Lys Asp Asp Phe Val

  370 375 380

  Thr Tyr Asn Pro Pro His Glu Tyr Gly Ser Gly Trp Gln Asp Gln Val

  385 390 395 400

  Arg Tyr Leu Asp Lys Asp Ile Gln Asn Gln Asn Ala Lys Leu Lys Ala

  405 410 415

  Ala Gln Ala Ser Leu Asn Ala Met Asn Glu Ser Leu Ser Arg Asp Lys

  420 425 430

  Ala Cys Thr Ser Arg Ala Met Glu Ser Arg Lys Gln Lys Glu Lys Lys

  435 440 445

  Ala Lys Asp Ala Glu Asn Lys Leu Asn Glu Glu Lys Lys Lys Pro Arg

  450 455 460

  Lys Gly Ala Lys Asp Tyr Gly His Asp Gly Leu Lys Pro Leu Tyr Val

  465 470 475 480

  Met Tyr Arg Ser Pro Arg Asn Met Pro Gly Thr Ala Ser Gly Lys Gly

  485 490 495

  Gln Asn Val Gly Asn Asn Trp Met Gly Gly Thr Ser Thr Gly Asp Gly

  500 505 510

  Ala Pro Val Pro Ser Gln Ile Ala Asp Lys Leu Arg Gly Lys Ala Phe

  515 520 525

  Gly Ser Phe Asp Ser Phe Cys Arg Ala Phe Trp Lys Ala Val Ala Ala

  530 535 540

  Asp Pro Asp Leu Ser Lys Gln Phe Tyr Pro Asp Asp Ile Glu Arg Met

  545 550 555 560

  Lys Leu Gly Arg Ala Pro Thr Val Arg Phe Arg Asp Ser Val Gly Lys

  565 570 575

  Arg Val Lys Val Glu Leu His His Lys Val Glu Ile Ser Lys Gly Gly

  580 585 590

  Asp Val Tyr Asn Val Asp Asn Leu Asn Ala Leu Thr Pro Lys Arg His

  595 600 605

  Ile Glu Ile His Lys Gly Asn

  610 615

  <210> 13

  <211> 1590

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> P623: S5 TD-RD-接头-GP36 CD-his: 1590个碱基

  <400> 13

  atgtccaatg acaacgaagt acctggttcc atggttattg tcgcacaagg tccagacgat 60

  caatacgcat acgaggttcc ccctatcgat agcgcggccg ttgccgggaa tatgtttggc 120

  gacttaattc aaagagaaat atatctacag aaaaacattt attatccagt ccgatctatt 180

  tttgaacaag gaacaaaaga aaagaaggag atcaacaaga aagtatctga tcaagtcgat 240

  ggcttgctaa agcagatcac tcaaggaaaa agggaggcca caaggcaaga gcgagtcgat 300

  gtcatgtcgg cagtcctgca caagatggaa tctgatcttg aaggatacaa aaagaccttt 360

  accaaaggcc cattcattga ctacgaaaag cagtcaagcc tctccatcta tgaggcctgg 420

  gtcaagatct gggagaagaa ctcttgggaa gaaagaaaga agtacccttt tcagcagctt 480

  gttagagatg aactggagcg ggcggttgcc tactacaaac aagattcact ctctgaagcg 540

  gtaaaagtgc taagacagga gctcaacaag caaaaagcgc taaaggaaaa agaggacctc 600

  tctcaactgg agcgggacta cagaacccga aaggcgaatc tcgagatgaa agtacaatcc 660

  gagcttgatc aagcgggaag tgctttgcct ccattggtca gtccaacgcc agagcaatgg 720

  cttgaacgtg ccacaagact ggttacgcaa gcaattgctg ataaaaagca gctgcagacc 780

  acaaacaata ctcttatcaa gaattcccca acccctctag aaaagcagaa agccatctac 840

  aatggtgagc tacttgtgga tgagatagcc agtctacagg cccgcttagt taagctgaac 900

  ggaggaggag gatcaggtgt ggccctggac cgcacgcggg ttgatcccca ggcagtcggc 960

  aacgaggtgc tcaagcgcaa cgcggataag ctgaatgcga tgcggggcgc cgagtacggt 1020

  gccaacgtca aggtcagcgg cacggacatt cgcatgaacg ggggtaacag tgccggcatg 1080

  ctgaagcagg acgtgttcaa ctggcggaag gaactggctc agttcgaggc ttaccgaggg 1140

  gaggcgtata aggatgccga tggttatagt gtgggcctgg ggcattacct gggcagtggc 1200

  aatgctgggg caggtactac agtcacgcct gagcaagccg cgcagtggtt cgccgaggac 1260

  accgaccgcg cactcgacca gggtgtgagg ttggccgacg agctgggcgt tacgaacaat 1320

  gcctctatcc tgggattggc cggtatggcc ttccagatgg gcgaaggacg tgcccggcag 1380

  ttccgtaaca ccttccaggc gatcaaggat cgcaacaagg aagccttcga ggctggtgtg 1440

  cgaaacagca agtggtacac gcagacgccc aaccgggccg aggcattcat caagcgcatg 1500

  gcgccccact tcgatacacc gagtcaaatc ggtgtcgatt ggtacagcgc cgcaacagcg 1560

  gagctcgagc accaccacca ccaccactaa 1590

  <210> 14

  <211> 529

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 蛋白质; 理论 pI/Mw: 6.56 / 59443.77

  <400> 14

  Met Ser Asn Asp Asn Glu Val Pro Gly Ser Met Val Ile Val Ala Gln

  1 5 1015

  Gly Pro Asp Asp Gln Tyr Ala Tyr Glu Val Pro Pro Ile Asp Ser Ala

  202530

  Ala Val Ala Gly Asn Met Phe Gly Asp Leu Ile Gln Arg Glu Ile Tyr

  354045

  Leu Gln Lys Asn Ile Tyr Tyr Pro Val Arg Ser Ile Phe Glu Gln Gly

  505560

  Thr Lys Glu Lys Lys Glu Ile Asn Lys Lys Val Ser Asp Gln Val Asp

  65707580

  Gly Leu Leu Lys Gln Ile Thr Gln Gly Lys Arg Glu Ala Thr Arg Gln

  859095

  Glu Arg Val Asp Val Met Ser Ala Val Leu His Lys Met Glu Ser Asp

  100 105 110

  Leu Glu Gly Tyr Lys Lys Thr Phe Thr Lys Gly Pro Phe Ile Asp Tyr

  115 120 125

  Glu Lys Gln Ser Ser Leu Ser Ile Tyr Glu Ala Trp Val Lys Ile Trp

  130 135 140

  Glu Lys Asn Ser Trp Glu Glu Arg Lys Lys Tyr Pro Phe Gln Gln Leu

  145 150 155 160

  Val Arg Asp Glu Leu Glu Arg Ala Val Ala Tyr Tyr Lys Gln Asp Ser

  165 170 175

  Leu Ser Glu Ala Val Lys Val Leu Arg Gln Glu Leu Asn Lys Gln Lys

  180 185 190

  Ala Leu Lys Glu Lys Glu Asp Leu Ser Gln Leu Glu Arg Asp Tyr Arg

  195 200 205

  Thr Arg Lys Ala Asn Leu Glu Met Lys Val Gln Ser Glu Leu Asp Gln

  210 215 220

  Ala Gly Ser Ala Leu Pro Pro Leu Val Ser Pro Thr Pro Glu Gln Trp

  225 230 235 240

  Leu Glu Arg Ala Thr Arg Leu Val Thr Gln Ala Ile Ala Asp Lys Lys

  245 250 255

  Gln Leu Gln Thr Thr Asn Asn Thr Leu Ile Lys Asn Ser Pro Thr Pro

  260 265 270

  Leu Glu Lys Gln Lys Ala Ile Tyr Asn Gly Glu Leu Leu Val Asp Glu

  275 280 285

  Ile Ala Ser Leu Gln Ala Arg Leu Val Lys Leu Asn Gly Gly Gly Gly

  290 295 300

  Ser Gly Val Ala Leu Asp Arg Thr Arg Val Asp Pro Gln Ala Val Gly

  305 310 315 320

  Asn Glu Val Leu Lys Arg Asn Ala Asp Lys Leu Asn Ala Met Arg Gly

  325 330 335

  Ala Glu Tyr Gly Ala Asn Val Lys Val Ser Gly Thr Asp Ile Arg Met

  340 345 350

  Asn Gly Gly Asn Ser Ala Gly Met Leu Lys Gln Asp Val Phe Asn Trp

  355 360 365

  Arg Lys Glu Leu Ala Gln Phe Glu Ala Tyr Arg Gly Glu Ala Tyr Lys

  370 375 380

  Asp Ala Asp Gly Tyr Ser Val Gly Leu Gly His Tyr Leu Gly Ser Gly

  385 390 395 400

  Asn Ala Gly Ala Gly Thr Thr Val Thr Pro Glu Gln Ala Ala Gln Trp

  405 410 415

  Phe Ala Glu Asp Thr Asp Arg Ala Leu Asp Gln Gly Val Arg Leu Ala

  420 425 430

  Asp Glu Leu Gly Val Thr Asn Asn Ala Ser Ile Leu Gly Leu Ala Gly

  435 440 445

  Met Ala Phe Gln Met Gly Glu Gly Arg Ala Arg Gln Phe Arg Asn Thr

  450 455 460

  Phe Gln Ala Ile Lys Asp Arg Asn Lys Glu Ala Phe Glu Ala Gly Val

  465 470 475 480

  Arg Asn Ser Lys Trp Tyr Thr Gln Thr Pro Asn Arg Ala Glu Ala Phe

  485 490 495

  Ile Lys Arg Met Ala Pro His Phe Asp Thr Pro Ser Gln Ile Gly Val

  500 505 510

  Asp Trp Tyr Ser Ala Ala Thr Ala Glu Leu Glu His His His His His

  515 520 525

  His

  <210> 15

  <211> 1566

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> P624: S5 TD-RD-连接-GP36 CD,无his标签: 1572个碱基

  <400> 15

  atgtccaatg acaacgaagt acctggttcc atggttattg tcgcacaagg tccagacgat 60

  caatacgcat acgaggttcc ccctatcgat agcgcggccg ttgccgggaa tatgtttggc 120

  gacttaattc aaagagaaat atatctacag aaaaacattt attatccagt ccgatctatt 180

  tttgaacaag gaacaaaaga aaagaaggag atcaacaaga aagtatctga tcaagtcgat 240

  ggcttgctaa agcagatcac tcaaggaaaa agggaggcca caaggcaaga gcgagtcgat 300

  gtcatgtcgg cagtcctgca caagatggaa tctgatcttg aaggatacaa aaagaccttt 360

  accaaaggcc cattcattga ctacgaaaag cagtcaagcc tctccatcta tgaggcctgg 420

  gtcaagatct gggagaagaa ctcttgggaa gaaagaaaga agtacccttt tcagcagctt 480

  gttagagatg aactggagcg ggcggttgcc tactacaaac aagattcact ctctgaagcg 540

  gtaaaagtgc taagacagga gctcaacaag caaaaagcgc taaaggaaaa agaggacctc 600

  tctcaactgg agcgggacta cagaacccga aaggcgaatc tcgagatgaa agtacaatcc 660

  gagcttgatc aagcgggaag tgctttgcct ccattggtca gtccaacgcc agagcaatgg 720

  cttgaacgtg ccacaagact ggttacgcaa gcaattgctg ataaaaagca gctgcagacc 780

  acaaacaata ctcttatcaa gaattcccca acccctctag aaaagcagaa agccatctac 840

  aatggtgagc tacttgtgga tgagatagcc agtctacagg cccgcttagt taagctgaac 900

  ggaggaggag gatcaggtgt ggccctggac cgcacgcggg ttgatcccca ggcagtcggc 960

  aacgaggtgc tcaagcgcaa cgcggataag ctgaatgcga tgcggggcgc cgagtacggt 1020

  gccaacgtca aggtcagcgg cacggacatt cgcatgaacg ggggtaacag tgccggcatg 1080

  ctgaagcagg acgtgttcaa ctggcggaag gaactggctc agttcgaggc ttaccgaggg 1140

  gaggcgtata aggatgccga tggttatagt gtgggcctgg ggcattacct gggcagtggc 1200

  aatgctgggg caggtactac agtcacgcct gagcaagccg cgcagtggtt cgccgaggac 1260

  accgaccgcg cactcgacca gggtgtgagg ttggccgacg agctgggcgt tacgaacaat 1320

  gcctctatcc tgggattggc cggtatggcc ttccagatgg gcgaaggacg tgcccggcag 1380

  ttccgtaaca ccttccaggc gatcaaggat cgcaacaagg aagccttcga ggctggtgtg 1440

  cgaaacagca agtggtacac gcagacgccc aaccgggccg aggcattcat caagcgcatg 1500

  gcgccccact tcgatacacc gagtcaaatc ggtgtcgatt ggtacagcgc cgcaacagcg 1560

  gagtaa 1566

  <210> 16

  <211> 521

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 蛋白质; 理论pI/Mw: 6.19 / 58620.92

  <400> 16

  Met Ser Asn Asp Asn Glu Val Pro Gly Ser Met Val Ile Val Ala Gln

  1 5 1015

  Gly Pro Asp Asp Gln Tyr Ala Tyr Glu Val Pro Pro Ile Asp Ser Ala

  202530

  Ala Val Ala Gly Asn Met Phe Gly Asp Leu Ile Gln Arg Glu Ile Tyr

  354045

  Leu Gln Lys Asn Ile Tyr Tyr Pro Val Arg Ser Ile Phe Glu Gln Gly

  505560

  Thr Lys Glu Lys Lys Glu Ile Asn Lys Lys Val Ser Asp Gln Val Asp

  65707580

  Gly Leu Leu Lys Gln Ile Thr Gln Gly Lys Arg Glu Ala Thr Arg Gln

  859095

  Glu Arg Val Asp Val Met Ser Ala Val Leu His Lys Met Glu Ser Asp

  100 105 110

  Leu Glu Gly Tyr Lys Lys Thr Phe Thr Lys Gly Pro Phe Ile Asp Tyr

  115 120 125

  Glu Lys Gln Ser Ser Leu Ser Ile Tyr Glu Ala Trp Val Lys Ile Trp

  130 135 140

  Glu Lys Asn Ser Trp Glu Glu Arg Lys Lys Tyr Pro Phe Gln Gln Leu

  145 150 155 160

  Val Arg Asp Glu Leu Glu Arg Ala Val Ala Tyr Tyr Lys Gln Asp Ser

  165 170 175

  Leu Ser Glu Ala Val Lys Val Leu Arg Gln Glu Leu Asn Lys Gln Lys

  180 185 190

  Ala Leu Lys Glu Lys Glu Asp Leu Ser Gln Leu Glu Arg Asp Tyr Arg

  195 200 205

  Thr Arg Lys Ala Asn Leu Glu Met Lys Val Gln Ser Glu Leu Asp Gln

  210 215 220

  Ala Gly Ser Ala Leu Pro Pro Leu Val Ser Pro Thr Pro Glu Gln Trp

  225 230 235 240

  Leu Glu Arg Ala Thr Arg Leu Val Thr Gln Ala Ile Ala Asp Lys Lys

  245 250 255

  Gln Leu Gln Thr Thr Asn Asn Thr Leu Ile Lys Asn Ser Pro Thr Pro

  260 265 270

  Leu Glu Lys Gln Lys Ala Ile Tyr Asn Gly Glu Leu Leu Val Asp Glu

  275 280 285

  Ile Ala Ser Leu Gln Ala Arg Leu Val Lys Leu Asn Gly Gly Gly Gly

  290 295 300

  Ser Gly Val Ala Leu Asp Arg Thr Arg Val Asp Pro Gln Ala Val Gly

  305 310 315 320

  Asn Glu Val Leu Lys Arg Asn Ala Asp Lys Leu Asn Ala Met Arg Gly

  325 330 335

  Ala Glu Tyr Gly Ala Asn Val Lys Val Ser Gly Thr Asp Ile Arg Met

  340 345 350

  Asn Gly Gly Asn Ser Ala Gly Met Leu Lys Gln Asp Val Phe Asn Trp

  355 360 365

  Arg Lys Glu Leu Ala Gln Phe Glu Ala Tyr Arg Gly Glu Ala Tyr Lys

  370 375 380

  Asp Ala Asp Gly Tyr Ser Val Gly Leu Gly His Tyr Leu Gly Ser Gly

  385 390 395 400

  Asn Ala Gly Ala Gly Thr Thr Val Thr Pro Glu Gln Ala Ala Gln Trp

  405 410 415

  Phe Ala Glu Asp Thr Asp Arg Ala Leu Asp Gln Gly Val Arg Leu Ala

  420 425 430

  Asp Glu Leu Gly Val Thr Asn Asn Ala Ser Ile Leu Gly Leu Ala Gly

  435 440 445

  Met Ala Phe Gln Met Gly Glu Gly Arg Ala Arg Gln Phe Arg Asn Thr

  450 455 460

  Phe Gln Ala Ile Lys Asp Arg Asn Lys Glu Ala Phe Glu Ala Gly Val

  465 470 475 480

  Arg Asn Ser Lys Trp Tyr Thr Gln Thr Pro Asn Arg Ala Glu Ala Phe

  485 490 495

  Ile Lys Arg Met Ala Pro His Phe Asp Thr Pro Ser Gln Ile Gly Val

  500 505 510

  Asp Trp Tyr Ser Ala Ala Thr Ala Glu

  515 520

  <210> 17

  <211> 1365

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> P625: S5 TD-RD-连接-Phi29CD: 1365个碱基

  <400> 17

  atgtccaatg acaacgaagt acctggttcc atggttattg tcgcacaagg tccagacgat 60

  caatacgcat acgaggttcc ccctatcgat agcgcggccg ttgccgggaa tatgtttggc 120

  gacttaattc aaagagaaat atatctacag aaaaacattt attatccagt ccgatctatt 180

  tttgaacaag gaacaaaaga aaagaaggag atcaacaaga aagtatctga tcaagtcgat 240

  ggcttgctaa agcagatcac tcaaggaaaa agggaggcca caaggcaaga gcgagtcgat 300

  gtcatgtcgg cagtcctgca caagatggaa tctgatcttg aaggatacaa aaagaccttt 360

  accaaaggcc cattcattga ctacgaaaag cagtcaagcc tctccatcta tgaggcctgg 420

  gtcaagatct gggagaagaa ctcttgggaa gaaagaaaga agtacccttt tcagcagctt 480

  gttagagatg aactggagcg ggcggttgcc tactacaaac aagattcact ctctgaagcg 540

  gtaaaagtgc taagacagga gctcaacaag caaaaagcgc taaaggaaaa agaggacctc 600

  tctcaactgg agcgggacta cagaacccga aaggcgaatc tcgagatgaa agtacaatcc 660

  gagcttgatc aagcgggaag tgctttgcct ccattggtca gtccaacgcc agagcaatgg 720

  cttgaacgtg ccacaagact ggttacgcaa gcaattgctg ataaaaagca gctgcagacc 780

  acaaacaata ctcttatcaa gaattcccca acccctctag aaaagcagaa agccatctac 840

  aatggtgagc tacttgtgga tgagatagcc agtctacagg cccgcttagt taagctgaac 900

  ggaggaggag gatcacaaat ttcacaagcg ggtatcaact taattaagag ctttgagggt 960

  ttacaactga aagcatataa agctgttccg actgagaagc attacaccat tggttacggt 1020

  cattacggtt ccgatgtttc acctaggcag gttatcactg ctaaacaggc tgaagacatg 1080

  ttgcgtgatg atgtgcaggc ttttgtggat ggtgtaaata aagcattaaa agtatctgtc 1140

  acccaaaatc aatttgatgc acttgtctca ttcgcttaca acgttgggtt aggggctttc 1200

  aggtcttctt ctctactgga atacttgaat gaaggaagaa cagctctagc ggcggctgaa 1260

  ttccctaaat ggaataagtc aggcggtaaa gtttatcaag ggttgattaa ccgtagagca 1320

  caggagcaag ccttgtttaa tagtggaaca cctaaaaatg tttaa 1365

  <210> 18

  <211> 454

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 蛋白质; 理论pI/Mw: 8.71 / 51160.99

  <400> 18

  Met Ser Asn Asp Asn Glu Val Pro Gly Ser Met Val Ile Val Ala Gln

  1 5 1015

  Gly Pro Asp Asp Gln Tyr Ala Tyr Glu Val Pro Pro Ile Asp Ser Ala

  202530

  Ala Val Ala Gly Asn Met Phe Gly Asp Leu Ile Gln Arg Glu Ile Tyr

  354045

  Leu Gln Lys Asn Ile Tyr Tyr Pro Val Arg Ser Ile Phe Glu Gln Gly

  505560

  Thr Lys Glu Lys Lys Glu Ile Asn Lys Lys Val Ser Asp Gln Val Asp

  65707580

  Gly Leu Leu Lys Gln Ile Thr Gln Gly Lys Arg Glu Ala Thr Arg Gln

  859095

  Glu Arg Val Asp Val Met Ser Ala Val Leu His Lys Met Glu Ser Asp

  100 105 110

  Leu Glu Gly Tyr Lys Lys Thr Phe Thr Lys Gly Pro Phe Ile Asp Tyr

  115 120 125

  Glu Lys Gln Ser Ser Leu Ser Ile Tyr Glu Ala Trp Val Lys Ile Trp

  130 135 140

  Glu Lys Asn Ser Trp Glu Glu Arg Lys Lys Tyr Pro Phe Gln Gln Leu

  145 150 155 160

  Val Arg Asp Glu Leu Glu Arg Ala Val Ala Tyr Tyr Lys Gln Asp Ser

  165 170 175

  Leu Ser Glu Ala Val Lys Val Leu Arg Gln Glu Leu Asn Lys Gln Lys

  180 185 190

  Ala Leu Lys Glu Lys Glu Asp Leu Ser Gln Leu Glu Arg Asp Tyr Arg

  195 200 205

  Thr Arg Lys Ala Asn Leu Glu Met Lys Val Gln Ser Glu Leu Asp Gln

  210 215 220

  Ala Gly Ser Ala Leu Pro Pro Leu Val Ser Pro Thr Pro Glu Gln Trp

  225 230 235 240

  Leu Glu Arg Ala Thr Arg Leu Val Thr Gln Ala Ile Ala Asp Lys Lys

  245 250 255

  Gln Leu Gln Thr Thr Asn Asn Thr Leu Ile Lys Asn Ser Pro Thr Pro

  260 265 270

  Leu Glu Lys Gln Lys Ala Ile Tyr Asn Gly Glu Leu Leu Val Asp Glu

  275 280 285

  Ile Ala Ser Leu Gln Ala Arg Leu Val Lys Leu Asn Gly Gly Gly Gly

  290 295 300

  Ser Gln Ile Ser Gln Ala Gly Ile Asn Leu Ile Lys Ser Phe Glu Gly

  305 310 315 320

  Leu Gln Leu Lys Ala Tyr Lys Ala Val Pro Thr Glu Lys His Tyr Thr

  325 330 335

  Ile Gly Tyr Gly His Tyr Gly Ser Asp Val Ser Pro Arg Gln Val Ile

  340 345 350

  Thr Ala Lys Gln Ala Glu Asp Met Leu Arg Asp Asp Val Gln Ala Phe

  355 360 365

  Val Asp Gly Val Asn Lys Ala Leu Lys Val Ser Val Thr Gln Asn Gln

  370 375 380

  Phe Asp Ala Leu Val Ser Phe Ala Tyr Asn Val Gly Leu Gly Ala Phe

  385 390 395 400

  Arg Ser Ser Ser Leu Leu Glu Tyr Leu Asn Glu Gly Arg Thr Ala Leu

  405 410 415

  Ala Ala Ala Glu Phe Pro Lys Trp Asn Lys Ser Gly Gly Lys Val Tyr

  420 425 430

  Gln Gly Leu Ile Asn Arg Arg Ala Gln Glu Gln Ala Leu Phe Asn Ser

  435 440 445

  Gly Thr Pro Lys Asn Val

  450

  <210> 19

  <211> 1404

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> P626: S5 TD-RD-连接-BP7e: 1422个碱基

  <400> 19

  atgtccaatg acaacgaagt acctggttcc atggttattg tcgcacaagg tccagacgat 60

  caatacgcat acgaggttcc ccctatcgat agcgcggccg ttgccgggaa tatgtttggc 120

  gacttaattc aaagagaaat atatctacag aaaaacattt attatccagt ccgatctatt 180

  tttgaacaag gaacaaaaga aaagaaggag atcaacaaga aagtatctga tcaagtcgat 240

  ggcttgctaa agcagatcac tcaaggaaaa agggaggcca caaggcaaga gcgagtcgat 300

  gtcatgtcgg cagtcctgca caagatggaa tctgatcttg aaggatacaa aaagaccttt 360

  accaaaggcc cattcattga ctacgaaaag cagtcaagcc tctccatcta tgaggcctgg 420

  gtcaagatct gggagaagaa ctcttgggaa gaaagaaaga agtacccttt tcagcagctt 480

  gttagagatg aactggagcg ggcggttgcc tactacaaac aagattcact ctctgaagcg 540

  gtaaaagtgc taagacagga gctcaacaag caaaaagcgc taaaggaaaa agaggacctc 600

  tctcaactgg agcgggacta cagaacccga aaggcgaatc tcgagatgaa agtacaatcc 660

  gagcttgatc aagcgggaag tgctttgcct ccattggtca gtccaacgcc agagcaatgg 720

  cttgaacgtg ccacaagact ggttacgcaa gcaattgctg ataaaaagca gctgcagacc 780

  acaaacaata ctcttatcaa gaattcccca acccctctag aaaagcagaa agccatctac 840

  aatggtgagc tacttgtgga tgagatagcc agtctacagg cccgcttagt taagctgaac 900

  ggaggaggag gatcaggtga catttttgat atgctgcgcc aagacgaagg cctggacctg 960

  aacctgtata aagacacgga aggctactgg acgattggta ttggtcagct ggtcaccaaa 1020

  aacccgagta aagatgtggc acgtgctgaa ctggacaaac tgatgggtcg tgtgtgcaat 1080

  ggccgcatta cgatggcgga agccgaacaa ctgtttaacc gtagcgttga aaatgcacgt 1140

  cgcgctatcc tgcgcaaccc gaaactgaaa ccggtgtatg atgttctgga cgaagtgcgt 1200

  cgctgtgcgc tgatcaacat ggtttttcag atgggcgaag cgggtgtcgc cggcttcacc 1260

  aatagcctgc gtatgctgca gcaaaaacgc tggaacgatg cggccgtcaa tctggcacag 1320

  tctcgctggt acaaacaaac gccgaatcgt gcgaaacgcg ttattgctac cttcaaaacg 1380

  ggcacctggg cggcgtatcg ttga 1404

  <210> 20

  <211> 467

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 蛋白质; 理论pI/Mw: 9.05 / 53373.88

  <400> 20

  Met Ser Asn Asp Asn Glu Val Pro Gly Ser Met Val Ile Val Ala Gln

  1 5 1015

  Gly Pro Asp Asp Gln Tyr Ala Tyr Glu Val Pro Pro Ile Asp Ser Ala

  202530

  Ala Val Ala Gly Asn Met Phe Gly Asp Leu Ile Gln Arg Glu Ile Tyr

  354045

  Leu Gln Lys Asn Ile Tyr Tyr Pro Val Arg Ser Ile Phe Glu Gln Gly

  505560

  Thr Lys Glu Lys Lys Glu Ile Asn Lys Lys Val Ser Asp Gln Val Asp

  65707580

  Gly Leu Leu Lys Gln Ile Thr Gln Gly Lys Arg Glu Ala Thr Arg Gln

  859095

  Glu Arg Val Asp Val Met Ser Ala Val Leu His Lys Met Glu Ser Asp

  100 105 110

  Leu Glu Gly Tyr Lys Lys Thr Phe Thr Lys Gly Pro Phe Ile Asp Tyr

  115 120 125

  Glu Lys Gln Ser Ser Leu Ser Ile Tyr Glu Ala Trp Val Lys Ile Trp

  130 135 140

  Glu Lys Asn Ser Trp Glu Glu Arg Lys Lys Tyr Pro Phe Gln Gln Leu

  145 150 155 160

  Val Arg Asp Glu Leu Glu Arg Ala Val Ala Tyr Tyr Lys Gln Asp Ser

  165 170 175

  Leu Ser Glu Ala Val Lys Val Leu Arg Gln Glu Leu Asn Lys Gln Lys

  180 185 190

  Ala Leu Lys Glu Lys Glu Asp Leu Ser Gln Leu Glu Arg Asp Tyr Arg

  195 200 205

  Thr Arg Lys Ala Asn Leu Glu Met Lys Val Gln Ser Glu Leu Asp Gln

  210 215 220

  Ala Gly Ser Ala Leu Pro Pro Leu Val Ser Pro Thr Pro Glu Gln Trp

  225 230 235 240

  Leu Glu Arg Ala Thr Arg Leu Val Thr Gln Ala Ile Ala Asp Lys Lys

  245 250 255

  Gln Leu Gln Thr Thr Asn Asn Thr Leu Ile Lys Asn Ser Pro Thr Pro

  260 265 270

  Leu Glu Lys Gln Lys Ala Ile Tyr Asn Gly Glu Leu Leu Val Asp Glu

  275 280 285

  Ile Ala Ser Leu Gln Ala Arg Leu Val Lys Leu Asn Gly Gly Gly Gly

  290 295 300

  Ser Gly Asp Ile Phe Asp Met Leu Arg Gln Asp Glu Gly Leu Asp Leu

  305 310 315 320

  Asn Leu Tyr Lys Asp Thr Glu Gly Tyr Trp Thr Ile Gly Ile Gly Gln

  325 330 335

  Leu Val Thr Lys Asn Pro Ser Lys Asp Val Ala Arg Ala Glu Leu Asp

  340 345 350

  Lys Leu Met Gly Arg Val Cys Asn Gly Arg Ile Thr Met Ala Glu Ala

  355 360 365

  Glu Gln Leu Phe Asn Arg Ser Val Glu Asn Ala Arg Arg Ala Ile Leu

  370 375 380

  Arg Asn Pro Lys Leu Lys Pro Val Tyr Asp Val Leu Asp Glu Val Arg

  385 390 395 400

  Arg Cys Ala Leu Ile Asn Met Val Phe Gln Met Gly Glu Ala Gly Val

  405 410 415

  Ala Gly Phe Thr Asn Ser Leu Arg Met Leu Gln Gln Lys Arg Trp Asn

  420 425 430

  Asp Ala Ala Val Asn Leu Ala Gln Ser Arg Trp Tyr Lys Gln Thr Pro

  435 440 445

  Asn Arg Ala Lys Arg Val Ile Ala Thr Phe Lys Thr Gly Thr Trp Ala

  450 455 460

  Ala Tyr Arg

  465

  <210> 21

  <211> 1515

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> P638: 具有6X-His标签的S5 绿脓杆菌素: 1497个碱基

  <400> 21

  atgtccaatg acaacgaagt acctggttcc atggttattg tcgcacaagg tccagacgat 60

  caatacgcat acgaggttcc ccctatcgat agcgcggccg ttgccgggaa tatgtttggc 120

  gacttaattc aaagagaaat atatctacag aaaaacattt attatccagt ccgatctatt 180

  tttgaacaag gaacaaaaga aaagaaggag atcaacaaga aagtatctga tcaagtcgat 240

  ggcttgctaa agcagatcac tcaaggaaaa agggaggcca caaggcaaga gcgagtcgat 300

  gtcatgtcgg cagtcctgca caagatggaa tctgatcttg aaggatacaa aaagaccttt 360

  accaaaggcc cattcattga ctacgaaaag cagtcaagcc tctccatcta tgaggcctgg 420

  gtcaagatct gggagaagaa ctcttgggaa gaaagaaaga agtacccttt tcagcagctt 480

  gttagagatg aactggagcg ggcggttgcc tactacaaac aagattcact ctctgaagcg 540

  gtaaaagtgc taagacagga gctcaacaag caaaaagcgc taaaggaaaa agaggacctc 600

  tctcaactgg agcgggacta cagaacccga aaggcgaatc tcgagatgaa agtacaatcc 660

  gagcttgatc aagcgggaag tgctttgcct ccattggtca gtccaacgcc agagcaatgg 720

  cttgaacgtg ccacaagact ggttacgcaa gcaattgctg ataaaaagca gctgcagacc 780

  acaaacaata ctcttatcaa gaattcccca acccctctag aaaagcagaa agccatctac 840

  aatggtgagc tacttgtgga tgagatagcc agtctacagg cccgcttagt taagctgaac 900

  gccgaaacga cacgacgcag gacagaagca gaacgcaagg cggccgagga acaagcgttg 960

  caagatgcta ttaaatttac tgccgacttt tataaggaag taactgagaa atttggcgca 1020

  cgaacatcgg agatggcgcg ccaactggcc gaaggcgcca gggggaaaaa tatcaggagt 1080

  tcggcggaag caatcaagtc gtttgaaaag cacaaggatg cgttaaataa aaaacttagc 1140

  cttaaagata ggcaagccat tgccaaagcc tttgattctc tagacaagca gatgatggcg 1200

  aagagccttg agaaatttag caaaggcttt ggagttgtag gcaaagctat tgacgccgcc 1260

  agcctgtacc aagagttcaa gatatctacg gaaaccgggg actggaaacc attctttgta 1320

  aaaattgaaa cactagctgc tggtgcggcc gccagttggc ttgtgggtat tgcatttgcc 1380

  acggcaacag ccactcctat aggcattctg gggttcgcac tggtaatggc agttaccggg 1440

  gcgatgattg acgaagacct tctagaaaaa gcaaacaatc ttgtaatatc cattcaccac 1500

  caccaccacc actaa 1515

  <210> 22

  <211> 504

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 理论pI/Mw: 8.50 / 56075.04

  <400> 22

  Met Ser Asn Asp Asn Glu Val Pro Gly Ser Met Val Ile Val Ala Gln

  1 5 1015

  Gly Pro Asp Asp Gln Tyr Ala Tyr Glu Val Pro Pro Ile Asp Ser Ala

  202530

  Ala Val Ala Gly Asn Met Phe Gly Asp Leu Ile Gln Arg Glu Ile Tyr

  354045

  Leu Gln Lys Asn Ile Tyr Tyr Pro Val Arg Ser Ile Phe Glu Gln Gly

  505560

  Thr Lys Glu Lys Lys Glu Ile Asn Lys Lys Val Ser Asp Gln Val Asp

  65707580

  Gly Leu Leu Lys Gln Ile Thr Gln Gly Lys Arg Glu Ala Thr Arg Gln

  859095

  Glu Arg Val Asp Val Met Ser Ala Val Leu His Lys Met Glu Ser Asp

  100 105 110

  Leu Glu Gly Tyr Lys Lys Thr Phe Thr Lys Gly Pro Phe Ile Asp Tyr

  115 120 125

  Glu Lys Gln Ser Ser Leu Ser Ile Tyr Glu Ala Trp Val Lys Ile Trp

  130 135 140

  Glu Lys Asn Ser Trp Glu Glu Arg Lys Lys Tyr Pro Phe Gln Gln Leu

  145 150 155 160

  Val Arg Asp Glu Leu Glu Arg Ala Val Ala Tyr Tyr Lys Gln Asp Ser

  165 170 175

  Leu Ser Glu Ala Val Lys Val Leu Arg Gln Glu Leu Asn Lys Gln Lys

  180 185 190

  Ala Leu Lys Glu Lys Glu Asp Leu Ser Gln Leu Glu Arg Asp Tyr Arg

  195 200 205

  Thr Arg Lys Ala Asn Leu Glu Met Lys Val Gln Ser Glu Leu Asp Gln

  210 215 220

  Ala Gly Ser Ala Leu Pro Pro Leu Val Ser Pro Thr Pro Glu Gln Trp

  225 230 235 240

  Leu Glu Arg Ala Thr Arg Leu Val Thr Gln Ala Ile Ala Asp Lys Lys

  245 250 255

  Gln Leu Gln Thr Thr Asn Asn Thr Leu Ile Lys Asn Ser Pro Thr Pro

  260 265 270

  Leu Glu Lys Gln Lys Ala Ile Tyr Asn Gly Glu Leu Leu Val Asp Glu

  275 280 285

  Ile Ala Ser Leu Gln Ala Arg Leu Val Lys Leu Asn Ala Glu Thr Thr

  290 295 300

  Arg Arg Arg Thr Glu Ala Glu Arg Lys Ala Ala Glu Glu Gln Ala Leu

  305 310 315 320

  Gln Asp Ala Ile Lys Phe Thr Ala Asp Phe Tyr Lys Glu Val Thr Glu

  325 330 335

  Lys Phe Gly Ala Arg Thr Ser Glu Met Ala Arg Gln Leu Ala Glu Gly

  340 345 350

  Ala Arg Gly Lys Asn Ile Arg Ser Ser Ala Glu Ala Ile Lys Ser Phe

  355 360 365

  Glu Lys His Lys Asp Ala Leu Asn Lys Lys Leu Ser Leu Lys Asp Arg

  370 375 380

  Gln Ala Ile Ala Lys Ala Phe Asp Ser Leu Asp Lys Gln Met Met Ala

  385 390 395 400

  Lys Ser Leu Glu Lys Phe Ser Lys Gly Phe Gly Val Val Gly Lys Ala

  405 410 415

  Ile Asp Ala Ala Ser Leu Tyr Gln Glu Phe Lys Ile Ser Thr Glu Thr

  420 425 430

  Gly Asp Trp Lys Pro Phe Phe Val Lys Ile Glu Thr Leu Ala Ala Gly

  435 440 445

  Ala Ala Ala Ser Trp Leu Val Gly Ile Ala Phe Ala Thr Ala Thr Ala

  450 455 460

  Thr Pro Ile Gly Ile Leu Gly Phe Ala Leu Val Met Ala Val Thr Gly

  465 470 475 480

  Ala Met Ile Asp Glu Asp Leu Leu Glu Lys Ala Asn Asn Leu Val Ile

  485 490 495

  Ser Ile His His His His His His

  500

  <210> 23

  <211> 1497

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> P652: 无His标签的S5绿脓杆菌素: 1497个碱基

  <400> 23

  atgtccaatg acaacgaagt acctggttcc atggttattg tcgcacaagg tccagacgat 60

  caatacgcat acgaggttcc ccctatcgat agcgcggccg ttgccgggaa tatgtttggc 120

  gacttaattc aaagagaaat atatctacag aaaaacattt attatccagt ccgatctatt 180

  tttgaacaag gaacaaaaga aaagaaggag atcaacaaga aagtatctga tcaagtcgat 240

  ggcttgctaa agcagatcac tcaaggaaaa agggaggcca caaggcaaga gcgagtcgat 300

  gtcatgtcgg cagtcctgca caagatggaa tctgatcttg aaggatacaa aaagaccttt 360

  accaaaggcc cattcattga ctacgaaaag cagtcaagcc tctccatcta tgaggcctgg 420

  gtcaagatct gggagaagaa ctcttgggaa gaaagaaaga agtacccttt tcagcagctt 480

  gttagagatg aactggagcg ggcggttgcc tactacaaac aagattcact ctctgaagcg 540

  gtaaaagtgc taagacagga gctcaacaag caaaaagcgc taaaggaaaa agaggacctc 600

  tctcaactgg agcgggacta cagaacccga aaggcgaatc tcgagatgaa agtacaatcc 660

  gagcttgatc aagcgggaag tgctttgcct ccattggtca gtccaacgcc agagcaatgg 720

  cttgaacgtg ccacaagact ggttacgcaa gcaattgctg ataaaaagca gctgcagacc 780

  acaaacaata ctcttatcaa gaattcccca acccctctag aaaagcagaa agccatctac 840

  aatggtgagc tacttgtgga tgagatagcc agtctacagg cccgcttagt taagctgaac 900

  gccgaaacga cacgacgcag gacagaagca gaacgcaagg cggccgagga acaagcgttg 960

  caagatgcta ttaaatttac tgccgacttt tataaggaag taactgagaa atttggcgca 1020

  cgaacatcgg agatggcgcg ccaactggcc gaaggcgcca gggggaaaaa tatcaggagt 1080

  tcggcggaag caatcaagtc gtttgaaaag cacaaggatg cgttaaataa aaaacttagc 1140

  cttaaagata ggcaagccat tgccaaagcc tttgattctc tagacaagca gatgatggcg 1200

  aagagccttg agaaatttag caaaggcttt ggagttgtag gcaaagctat tgacgccgcc 1260

  agcctgtacc aagagttcaa gatatctacg gaaaccgggg actggaaacc attctttgta 1320

  aaaattgaaa cactagctgc tggtgcggcc gccagttggc ttgtgggtat tgcatttgcc 1380

  acggcaacag ccactcctat aggcattctg gggttcgcac tggtaatggc agttaccggg 1440

  gcgatgattg acgaagacct tctagaaaaa gcaaacaatc ttgtaatatc catttaa 1497

  <210> 24

  <211> 498

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 理论pI/Mw: 8.50 / 56075.04

  <400> 24

  Met Ser Asn Asp Asn Glu Val Pro Gly Ser Met Val Ile Val Ala Gln

  1 5 1015

  Gly Pro Asp Asp Gln Tyr Ala Tyr Glu Val Pro Pro Ile Asp Ser Ala

  202530

  Ala Val Ala Gly Asn Met Phe Gly Asp Leu Ile Gln Arg Glu Ile Tyr

  354045

  Leu Gln Lys Asn Ile Tyr Tyr Pro Val Arg Ser Ile Phe Glu Gln Gly

  505560

  Thr Lys Glu Lys Lys Glu Ile Asn Lys Lys Val Ser Asp Gln Val Asp

  65707580

  Gly Leu Leu Lys Gln Ile Thr Gln Gly Lys Arg Glu Ala Thr Arg Gln

  859095

  Glu Arg Val Asp Val Met Ser Ala Val Leu His Lys Met Glu Ser Asp

  100 105 110

  Leu Glu Gly Tyr Lys Lys Thr Phe Thr Lys Gly Pro Phe Ile Asp Tyr

  115 120 125

  Glu Lys Gln Ser Ser Leu Ser Ile Tyr Glu Ala Trp Val Lys Ile Trp

  130 135 140

  Glu Lys Asn Ser Trp Glu Glu Arg Lys Lys Tyr Pro Phe Gln Gln Leu

  145 150 155 160

  Val Arg Asp Glu Leu Glu Arg Ala Val Ala Tyr Tyr Lys Gln Asp Ser

  165 170 175

  Leu Ser Glu Ala Val Lys Val Leu Arg Gln Glu Leu Asn Lys Gln Lys

  180 185 190

  Ala Leu Lys Glu Lys Glu Asp Leu Ser Gln Leu Glu Arg Asp Tyr Arg

  195 200 205

  Thr Arg Lys Ala Asn Leu Glu Met Lys Val Gln Ser Glu Leu Asp Gln

  210 215 220

  Ala Gly Ser Ala Leu Pro Pro Leu Val Ser Pro Thr Pro Glu Gln Trp

  225 230 235 240

  Leu Glu Arg Ala Thr Arg Leu Val Thr Gln Ala Ile Ala Asp Lys Lys

  245 250 255

  Gln Leu Gln Thr Thr Asn Asn Thr Leu Ile Lys Asn Ser Pro Thr Pro

  260 265 270

  Leu Glu Lys Gln Lys Ala Ile Tyr Asn Gly Glu Leu Leu Val Asp Glu

  275 280 285

  Ile Ala Ser Leu Gln Ala Arg Leu Val Lys Leu Asn Ala Glu Thr Thr

  290 295 300

  Arg Arg Arg Thr Glu Ala Glu Arg Lys Ala Ala Glu Glu Gln Ala Leu

  305 310 315 320

  Gln Asp Ala Ile Lys Phe Thr Ala Asp Phe Tyr Lys Glu Val Thr Glu

  325 330 335

  Lys Phe Gly Ala Arg Thr Ser Glu Met Ala Arg Gln Leu Ala Glu Gly

  340 345 350

  Ala Arg Gly Lys Asn Ile Arg Ser Ser Ala Glu Ala Ile Lys Ser Phe

  355 360 365

  Glu Lys His Lys Asp Ala Leu Asn Lys Lys Leu Ser Leu Lys Asp Arg

  370 375 380

  Gln Ala Ile Ala Lys Ala Phe Asp Ser Leu Asp Lys Gln Met Met Ala

  385 390 395 400

  Lys Ser Leu Glu Lys Phe Ser Lys Gly Phe Gly Val Val Gly Lys Ala

  405 410 415

  Ile Asp Ala Ala Ser Leu Tyr Gln Glu Phe Lys Ile Ser Thr Glu Thr

  420 425 430

  Gly Asp Trp Lys Pro Phe Phe Val Lys Ile Glu Thr Leu Ala Ala Gly

  435 440 445

  Ala Ala Ala Ser Trp Leu Val Gly Ile Ala Phe Ala Thr Ala Thr Ala

  450 455 460

  Thr Pro Ile Gly Ile Leu Gly Phe Ala Leu Val Met Ala Val Thr Gly

  465 470 475 480

  Ala Met Ile Asp Glu Asp Leu Leu Glu Lys Ala Asn Asn Leu Val Ile

  485 490 495

  Ser Ile

  <210> 25

  <211> 990

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> Fyu A BD- T4溶菌酶融合体

  <400> 25

  atgagcgaca cgatggttgt gaatggcagc ggcggcgttc cggcgttcct gtttagcggc 60

  agcaccctga gcagctatcg tccgaatttc gaggcgaaca gcatcaccat tgcgctgccg 120

  cactatgtgg acctgccggg ccgtagcaac ttcaagctga tgtatatcat gggttttccg 180

  attgacaccg agatggaaaa ggatagcgag tacagcaaca aaatccgtca agaaagcaag 240

  attagcaaaa ccgagggcac cgtgagctac gaacagaaaa tcaccgttga gaccggccaa 300

  gaaaaggatg gtgtgaaagt ttatcgtgtg atggttctgg agggcaccat cgcggagagc 360

  attgaacacc tggacaagaa agagaacgaa gacatcctga acaacaaccg taaccgtatt 420

  gtgctggcgg acaacaccgt tatcaacttc gataacatta gccagctgaa ggaatttctg 480

  cgtcgtagcg tgaacatcgt tattttcgag atgctgcgta tcgacgaacg tctgcgtctg 540

  aagatttata aagataccga gggctactat accatcggta ttggccacct gctgaccaaa 600

  agcccgagcc tgaacgcggc gaagagcgaa ctggacaaag cgatcggccg taactgcaac 660

  ggtgtgatta ccaaggatga ggcggaaaaa ctgtttaacc aggacgtgga tgcggcggtt 720

  cgtggtatcc tgcgtaacgc gaagctgaaa ccggtgtacg acagcctgga tgcggttcgt 780

  cgttgcgcgc tgattaacat ggtgttccaa atgggcgaga ccggcgttgc gggttttacc 840

  aacagcctgc gtatgctgca gcaaaagcgt tgggacgaag cggcggttaa cctggcgaaa 900

  agcatctggt ataaccagac cccgaaccgt gcgaaacgtg tgattaccac cttccgtacc 960

  ggcacctggg atgcgtataa aaacctgtaa 990

  <210> 26

  <211> 329

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 由SEQ ID NO: 25编码的氨基酸序列

  <400> 26

  Met Ser Asp Thr Met Val Val Asn Gly Ser Gly Gly Val Pro Ala Phe

  1 5 1015

  Leu Phe Ser Gly Ser Thr Leu Ser Ser Tyr Arg Pro Asn Phe Glu Ala

  202530

  Asn Ser Ile Thr Ile Ala Leu Pro His Tyr Val Asp Leu Pro Gly Arg

  354045

  Ser Asn Phe Lys Leu Met Tyr Ile Met Gly Phe Pro Ile Asp Thr Glu

  505560

  Met Glu Lys Asp Ser Glu Tyr Ser Asn Lys Ile Arg Gln Glu Ser Lys

  65707580

  Ile Ser Lys Thr Glu Gly Thr Val Ser Tyr Glu Gln Lys Ile Thr Val

  859095

  Glu Thr Gly Gln Glu Lys Asp Gly Val Lys Val Tyr Arg Val Met Val

  100 105 110

  Leu Glu Gly Thr Ile Ala Glu Ser Ile Glu His Leu Asp Lys Lys Glu

  115 120 125

  Asn Glu Asp Ile Leu Asn Asn Asn Arg Asn Arg Ile Val Leu Ala Asp

  130 135 140

  Asn Thr Val Ile Asn Phe Asp Asn Ile Ser Gln Leu Lys Glu Phe Leu

  145 150 155 160

  Arg Arg Ser Val Asn Ile Val Ile Phe Glu Met Leu Arg Ile Asp Glu

  165 170 175

  Arg Leu Arg Leu Lys Ile Tyr Lys Asp Thr Glu Gly Tyr Tyr Thr Ile

  180 185 190

  Gly Ile Gly His Leu Leu Thr Lys Ser Pro Ser Leu Asn Ala Ala Lys

  195 200 205

  Ser Glu Leu Asp Lys Ala Ile Gly Arg Asn Cys Asn Gly Val Ile Thr

  210 215 220

  Lys Asp Glu Ala Glu Lys Leu Phe Asn Gln Asp Val Asp Ala Ala Val

  225 230 235 240

  Arg Gly Ile Leu Arg Asn Ala Lys Leu Lys Pro Val Tyr Asp Ser Leu

  245 250 255

  Asp Ala Val Arg Arg Cys Ala Leu Ile Asn Met Val Phe Gln Met Gly

  260 265 270

  Glu Thr Gly Val Ala Gly Phe Thr Asn Ser Leu Arg Met Leu Gln Gln

  275 280 285

  Lys Arg Trp Asp Glu Ala Ala Val Asn Leu Ala Lys Ser Ile Trp Tyr

  290 295 300

  Asn Gln Thr Pro Asn Arg Ala Lys Arg Val Ile Thr Thr Phe Arg Thr

  305 310 315 320

  Gly Thr Trp Asp Ala Tyr Lys Asn Leu

  325

  <210> 27

  <211> 1152

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> Fyu A BD -GP36 融合体

  <400> 27

  atgagcgaca cgatggttgt gaatggcagc ggcggcgttc cggcgttcct gtttagcggc 60

  agcaccctga gcagctatcg tccgaatttc gaggcgaaca gcatcaccat tgcgctgccg 120

  cactatgtgg acctgccggg ccgtagcaac ttcaagctga tgtatatcat gggttttccg 180

  attgacaccg agatggaaaa ggatagcgag tacagcaaca aaatccgtca agaaagcaag 240

  attagcaaaa ccgagggcac cgtgagctac gaacagaaaa tcaccgttga gaccggccaa 300

  gaaaaggatg gtgtgaaagt ttatcgtgtg atggttctgg agggcaccat cgcggagagc 360

  attgaacacc tggacaagaa agagaacgaa gacatcctga acaacaaccg taaccgtatt 420

  gtgctggcgg acaacaccgt tatcaacttc gataacatta gccagctgaa ggaatttctg 480

  cgtcgtagcg tgaacatcgt tggtgtggcc ctggaccgca cgcgggttga tccccaggca 540

  gtcggcaacg aggtgctcaa gcgcaacgcg gataagctga atgcgatgcg gggcgccgag 600

  tacggtgcca acgtcaaggt cagcggcacg gacattcgca tgaacggggg taacagtgcc 660

  ggcatgctga agcaggacgt gttcaactgg cggaaggaac tggctcagtt cgaggcttac 720

  cgaggggagg cgtataagga tgccgatggt tatagtgtgg gcctggggca ttacctgggc 780

  agtggcaatg ctggggcagg tactacagtc acgcctgagc aagccgcgca gtggttcgcc 840

  gaggacaccg accgcgcact cgaccagggt gtgaggttgg ccgacgagct gggcgttacg 900

  aacaatgcct ctatcctggg attggccggt atggccttcc agatgggcga aggacgtgcc 960

  cggcagttcc gtaacacctt ccaggcgatc aaggatcgca acaaggaagc cttcgaggct 1020

  ggtgtgcgaa acagcaagtg gtacacgcag acgcccaacc gggccgaggc attcatcaag 1080

  cgcatggcgc cccacttcga tacaccgagt caaatcggtg tcgattggta cagcgccgca 1140

  acagcggagt ga 1152

  <210> 28

  <211> 383

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 由SEQ ID NO: 27编码的氨基酸序列

  <400> 28

  Met Ser Asp Thr Met Val Val Asn Gly Ser Gly Gly Val Pro Ala Phe

  1 5 1015

  Leu Phe Ser Gly Ser Thr Leu Ser Ser Tyr Arg Pro Asn Phe Glu Ala

  202530

  Asn Ser Ile Thr Ile Ala Leu Pro His Tyr Val Asp Leu Pro Gly Arg

  354045

  Ser Asn Phe Lys Leu Met Tyr Ile Met Gly Phe Pro Ile Asp Thr Glu

  505560

  Met Glu Lys Asp Ser Glu Tyr Ser Asn Lys Ile Arg Gln Glu Ser Lys

  65707580

  Ile Ser Lys Thr Glu Gly Thr Val Ser Tyr Glu Gln Lys Ile Thr Val

  859095

  Glu Thr Gly Gln Glu Lys Asp Gly Val Lys Val Tyr Arg Val Met Val

  100 105 110

  Leu Glu Gly Thr Ile Ala Glu Ser Ile Glu His Leu Asp Lys Lys Glu

  115 120 125

  Asn Glu Asp Ile Leu Asn Asn Asn Arg Asn Arg Ile Val Leu Ala Asp

  130 135 140

  Asn Thr Val Ile Asn Phe Asp Asn Ile Ser Gln Leu Lys Glu Phe Leu

  145 150 155 160

  Arg Arg Ser Val Asn Ile Val Gly Val Ala Leu Asp Arg Thr Arg Val

  165 170 175

  Asp Pro Gln Ala Val Gly Asn Glu Val Leu Lys Arg Asn Ala Asp Lys

  180 185 190

  Leu Asn Ala Met Arg Gly Ala Glu Tyr Gly Ala Asn Val Lys Val Ser

  195 200 205

  Gly Thr Asp Ile Arg Met Asn Gly Gly Asn Ser Ala Gly Met Leu Lys

  210 215 220

  Gln Asp Val Phe Asn Trp Arg Lys Glu Leu Ala Gln Phe Glu Ala Tyr

  225 230 235 240

  Arg Gly Glu Ala Tyr Lys Asp Ala Asp Gly Tyr Ser Val Gly Leu Gly

  245 250 255

  His Tyr Leu Gly Ser Gly Asn Ala Gly Ala Gly Thr Thr Val Thr Pro

  260 265 270

  Glu Gln Ala Ala Gln Trp Phe Ala Glu Asp Thr Asp Arg Ala Leu Asp

  275 280 285

  Gln Gly Val Arg Leu Ala Asp Glu Leu Gly Val Thr Asn Asn Ala Ser

  290 295 300

  Ile Leu Gly Leu Ala Gly Met Ala Phe Gln Met Gly Glu Gly Arg Ala

  305 310 315 320

  Arg Gln Phe Arg Asn Thr Phe Gln Ala Ile Lys Asp Arg Asn Lys Glu

  325 330 335

  Ala Phe Glu Ala Gly Val Arg Asn Ser Lys Trp Tyr Thr Gln Thr Pro

  340 345 350

  Asn Arg Ala Glu Ala Phe Ile Lys Arg Met Ala Pro His Phe Asp Thr

  355 360 365

  Pro Ser Gln Ile Gly Val Asp Trp Tyr Ser Ala Ala Thr Ala Glu

  370 375 380

  <210> 29

  <211> 1955

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> pelB-FyuA受体: 2028个碱基

  <400> 29

  atgaaatacc tgctgccgac cgctgctgct ggtctgctgc tcctcgctgc ccagccggcg 60

  atggccatgg gccagacttc acagcaagac gaaagcacgc tggtggttac cgccagtaaa 120

  caatcttccc gctcggcatc agccaacaac gtctcgtcta ctgttgtcag cgcgccggaa 180

  ttaagcgacg ccggcgtcac cgccagcgac aaactcccca gagtcttgcc cgggctcaat 240

  attgaaaata gcggcaacat gcttttttcg acgatctcgc tacgcggcgt ctcttcagcg 300

  caggacttct ataaccccgc cgtcaccctg tatgtcgatg gcgtccctca gctttccacc 360

  aacaccatcc aggcgcttac cgatgtgcaa agcgtggagt tgctgcgagg cccacaggga 420

  acgttatatg gcaaaagcgc tcagggcggg atcatcaaca tcgtcaccca gcagccggac 480

  agcacgccgc gcggctatat tgaaggcggc gtcagtagcc gcgacagtta tcgaagtaag 540

  ttcaacctga gcggccccat tcaggatggc ctgctgtacg gcagcgtcac cctgttacgc 600

  caggttgatg acggcgacat gattaacccc gcgacgggaa gcgatgactt aggcggcacc 660

  cgcgccagca tagggaatgt gaaactgcgt ctggcgccgg acgatcagcc ctgggaaatg 720

  ggctttgccg cctcacgcga atgtacccgc gccacccagg acgcctatgt gggatggaat 780

  gatattaagg gccgtaagct gtcgatcagc gatggttcac cagacccgta catgcggcgc 840

  tgcactgaca gccagaccct gagtgggaaa tacaccaccg atgactgggt tttcaacctg 900

  atcagcgcct ggcagcagca gcattattcg cgcaccttcc cttccggttc gttaatcgtc 960

  aatatgcctc agcgctggaa tcaggatgtg caggagctgc gcgccgcaac cctgggcgat 1020

  gcgcgtaccg ttgatatggt gtttgggctg taccggcaga acacccgcga gaagttaaat 1080

  tcagcctacg acatgccgac aatgccttat ttaagcagta ccggctatac caccgctgaa 1140

  acgctggccg catacagtga cctgacctgg catttaaccg atcgttttga tatcggcggc 1200

  ggcgtgcgct tctcgcatga taaatccagt acacaatatc acggcagcat gctcggcaac 1260

  ccgtttggcg accagggtaa gagcaatgac gatcaggtgc tcgggcagct atccgcaggc 1320

  tatatgctga ccgatgactg gagagtgtat acccgtgtag cccagggata taaaccttcc 1380

  gggtacaaca tcgtgcctac tgcgggtctt gatgccaaac cgttcgtcgc cgagaaatcc 1440

  atcaactatg aacttggcac ccgctacgaa accgctgacg tcacgctgca agccgcgacg 1500

  ttttataccc acaccaaaga catgcagctt tactctggcc cggtcgggat gcagacatta 1560

  agcaatgcgg gtaaagccga cgccaccggc gttgagcttg aagcgaagtg gcggtttgcg 1620

  ccaggctggt catgggatat caatggcaac gtgatccgtt ccgaattcac caatgacagt 1680

  gagttgtatc acggtaaccg ggtgccgttc gtaccacgtt atggcgcggg aagcagcgtg 1740

  aacggtgtga ttgatacgcg ctatggcgca ctgatgcccc gactggcggt taatctggtc 1800

  gggccgcatt atttcgatgg cgacaaccag ttgcggcaag gcacctatgc caccctggac 1860

  agcagcctgg gctggcaggc aacggcagca gcgccgtcgc gcaggtcaat atgggtcgca 1920

  ccgtcggtat caatacgcga attgatttct tctga 1955

  <210> 30

  <211> 675

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <220>

  <223> 理论pI/Mw: 5.35 / 73772.10

  <400> 30

  Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala

  1 5 1015

  Ala Gln Pro Ala Met Ala Met Gly Gln Thr Ser Gln Gln Asp Glu Ser

  202530

  Thr Leu Val Val Thr Ala Ser Lys Gln Ser Ser Arg Ser Ala Ser Ala

  354045

  Asn Asn Val Ser Ser Thr Val Val Ser Ala Pro Glu Leu Ser Asp Ala

  505560

  Gly Val Thr Ala Ser Asp Lys Leu Pro Arg Val Leu Pro Gly Leu Asn

  65707580

  Ile Glu Asn Ser Gly Asn Met Leu Phe Ser Thr Ile Ser Leu Arg Gly

  859095

  Val Ser Ser Ala Gln Asp Phe Tyr Asn Pro Ala Val Thr Leu Tyr Val

  100 105 110

  Asp Gly Val Pro Gln Leu Ser Thr Asn Thr Ile Gln Ala Leu Thr Asp

  115 120 125

  Val Gln Ser Val Glu Leu Leu Arg Gly Pro Gln Gly Thr Leu Tyr Gly

  130 135 140

  Lys Ser Ala Gln Gly Gly Ile Ile Asn Ile Val Thr Gln Gln Pro Asp

  145 150 155 160

  Ser Thr Pro Arg Gly Tyr Ile Glu Gly Gly Val Ser Ser Arg Asp Ser

  165 170 175

  Tyr Arg Ser Lys Phe Asn Leu Ser Gly Pro Ile Gln Asp Gly Leu Leu

  180 185 190

  Tyr Gly Ser Val Thr Leu Leu Arg Gln Val Asp Asp Gly Asp Met Ile

  195 200 205

  Asn Pro Ala Thr Gly Ser Asp Asp Leu Gly Gly Thr Arg Ala Ser Ile

  210 215 220

  Gly Asn Val Lys Leu Arg Leu Ala Pro Asp Asp Gln Pro Trp Glu Met

  225 230 235 240

  Gly Phe Ala Ala Ser Arg Glu Cys Thr Arg Ala Thr Gln Asp Ala Tyr

  245 250 255

  Val Gly Trp Asn Asp Ile Lys Gly Arg Lys Leu Ser Ile Ser Asp Gly

  260 265 270

  Ser Pro Asp Pro Tyr Met Arg Arg Cys Thr Asp Ser Gln Thr Leu Ser

  275 280 285

  Gly Lys Tyr Thr Thr Asp Asp Trp Val Phe Asn Leu Ile Ser Ala Trp

  290 295 300

  Gln Gln Gln His Tyr Ser Arg Thr Phe Pro Ser Gly Ser Leu Ile Val

  305 310 315 320

  Asn Met Pro Gln Arg Trp Asn Gln Asp Val Gln Glu Leu Arg Ala Ala

  325 330 335

  Thr Leu Gly Asp Ala Arg Thr Val Asp Met Val Phe Gly Leu Tyr Arg

  340 345 350

  Gln Asn Thr Arg Glu Lys Leu Asn Ser Ala Tyr Asp Met Pro Thr Met

  355 360 365

  Pro Tyr Leu Ser Ser Thr Gly Tyr Thr Thr Ala Glu Thr Leu Ala Ala

  370 375 380

  Tyr Ser Asp Leu Thr Trp His Leu Thr Asp Arg Phe Asp Ile Gly Gly

  385 390 395 400

  Gly Val Arg Phe Ser His Asp Lys Ser Ser Thr Gln Tyr His Gly Ser

  405 410 415

  Met Leu Gly Asn Pro Phe Gly Asp Gln Gly Lys Ser Asn Asp Asp Gln

  420 425 430

  Val Leu Gly Gln Leu Ser Ala Gly Tyr Met Leu Thr Asp Asp Trp Arg

  435 440 445

  Val Tyr Thr Arg Val Ala Gln Gly Tyr Lys Pro Ser Gly Tyr Asn Ile

  450 455 460

  Val Pro Thr Ala Gly Leu Asp Ala Lys Pro Phe Val Ala Glu Lys Ser

  465 470 475 480

  Ile Asn Tyr Glu Leu Gly Thr Arg Tyr Glu Thr Ala Asp Val Thr Leu

  485 490 495

  Gln Ala Ala Thr Phe Tyr Thr His Thr Lys Asp Met Gln Leu Tyr Ser

  500 505 510

  Gly Pro Val Gly Met Gln Thr Leu Ser Asn Ala Gly Lys Ala Asp Ala

  515 520 525

  Thr Gly Val Glu Leu Glu Ala Lys Trp Arg Phe Ala Pro Gly Trp Ser

  530 535 540

  Trp Asp Ile Asn Gly Asn Val Ile Arg Ser Glu Phe Thr Asn Asp Ser

  545 550 555 560

  Glu Leu Tyr His Gly Asn Arg Val Pro Phe Val Pro Arg Tyr Gly Ala

  565 570 575

  Gly Ser Ser Val Asn Gly Val Ile Asp Thr Arg Tyr Gly Ala Leu Met

  580 585 590

  Pro Arg Leu Ala Val Asn Leu Val Gly Pro His Tyr Phe Asp Gly Asp

  595 600 605

  Asn Gln Leu Arg Gln Gly Thr Tyr Ala Thr Leu Asp Ser Ser Leu Gly

  610 615 620

  Trp Gln Ala Thr Glu Arg Met Asn Ile Ser Val Tyr Val Asp Asn Leu

  625 630 635 640

  Phe Asp Arg Arg Tyr Arg Thr Tyr Gly Tyr Met Asn Gly Ser Ser Ala

  645 650 655

  Val Ala Gln Val Asn Met Gly Arg Thr Val Gly Ile Asn Thr Arg Ile

  660 665 670

  Asp Phe Phe

  675

《治疗性细菌素.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)