欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 真菌人工染色体、组成、方法和用途独创技术162273字

真菌人工染色体、组成、方法和用途

2021-02-04 20:13:26

真菌人工染色体、组成、方法和用途

  相关专利申请的交叉引用

  本申请要求2016年4月29日提交的美国非临时专利申请15/143,493的权益和优先权。

  政府支持

  本发明是在由国立卫生研究院提供的编号R43/44AI094885的政府支持下完成的。政府对发明有一定的权益。

  参考序列表

  序列表作为本发明的部分,包括text文件0749sequence_ST25.txt,一个于2016年4月29日创建的86kb的文件。该文件包含本发明的引物核苷酸和/或氨基酸序列。序列表的主题以引用方式整体纳入本文。

  前言

  真菌含有广泛但尚未开发的生物合成能力,可作为新型生物活性化合物的储库(Kobayashi,A.,et al.,Agric.Biol.Chem.,1988,52,3119-3123.;Kuno,F.,et al.,J.Antibiot.(Tokyo),1996,49,742-747;Kumar,C.G.,et al,Lett.Appl.Microbiol.,2011,53,350-358;Wu,M.C.,et al.,Curr.Opin.Biotechnol.,2012,23,931-940;Du,L.,et al.,Angew.Chem.Int.Ed.Engl.,2014,53,804-809;Fang,S.M.,et al.,Mar.Drugs,2014,12,1788-1814;A.L.and Enguita,F.J.,Microbiol.Res.,2014,169,652-665)。

  丝状真菌可产生次生代谢物(SM),其历来是制药工业先导化合物的丰富来源。真菌可产生所有微生物来源的生物活性分子的45%(Bérdy,J.,J.Antibiot.(Tokyo),2012,65,385-395)。衍生自萜类、聚酮化合物和非核糖体肽途径(Keller,N.P.,et al.,Nat Rev Microbiol.2005,3:937-947)的这些化合物显示出广泛的有用的抗生素活性和药物活性。最近对涵盖1993年至2001年分离和鉴定的1500种化合物的真菌代谢物的文献调查显示,超过一半的分子具有抗细菌、抗真菌或抗肿瘤活性(Pelaez,F.,Handbook of Industrial Mycology(ed.An,Z.)49–92(Marcel Dekker,New York.2005)。具有治疗或经济意义的真菌天然产物的实例包括来自产黄青霉(Penicillium chrysogenum)的抗生素青霉素、来自多孔木霉(Tolypocladium inflatum)的免疫抑制剂环孢菌素(环肽)和来自土曲霉(Aspergillus terreus)的降胆固醇的维诺林(mevinolin)(也称为洛伐他汀(lovastatin),一种聚酮化合物)。

  真菌基因组可包含50或更多不同的SM基因簇,其大小在从20kb到大于100kb的范围(Nordberg,H.et al.,Nucleic Acids Res.,2014,42(Database issue),D26-31)。保守估计有超过500万种真菌(Blackwell,M.,Am.J.Bot.,2011,98,426-438),其中已被描述的少于5%,可从世界培养物保藏中心(Colwell,R.R.,Microbial biodiversity and biotechnology.Washington,D.C.:Joseph Henry Press;p.279-88,1997)获得的不足1%。此外,由于每种所述真菌基因组可包含50或更多不同的SM基因簇,其大小在从20kb到大于100kb的范围(Nordberg,H.et al.,Nucleic Acids Res.,2014,42(Database issue),D26-31),未发现的SM数量可能非常巨大。

  已有数种诱导SM基因簇表达的方法是成功的。其包括超表达基因簇特异的转录因子或酶基因、缺失或超表达染色质修饰基因、超表达反式作用激活子或缺失反式作用抑制子(Palmer,J.M.and Keller,N.P.,Curr.Opin.Microbiol.2010,13:431-436;Brakhage,A.A.and Schroeckh,V.,Fungal Genet.Biol.,2011,48,15-22;Strauss,J.and Reyes-Dominguez,Y.,Fungal Genet.Biol.,2011,48,62-69;Hong,S.Y.,et al.,Toxins(Basel)2013,5,683-702)、表达异源SM基因(Itoh,T.et al.,Methods Mol Biol 2012,944,175-182;Chiang,Y.M.,et al.,J.Am.Chem.Soc.,2013,135,7720-7731;Nielsen,M.T.,et al.,PLoS ONE 2013,8:e72871;Tsunematsu,Y.,et al.,Nat Prod Rep 2013,30:1139-1149;Yin,W.B.,et al.ACS Synth Biol 2013,2:629-634)。

  在真菌中表达异源簇是可鉴定SM化合物、生物合成SM蛋白和基因的一种方法。近来,已报道该方法可用于合成土曲霉(A.terreus)编码的化合物地曲霉素和构巢曲霉(A.nidulans)中的去甲呋喃酮(asperfuranone)(Chiang,Y.M.,et al.,J.Am.Chem.Soc.,2013,135,7720-7731;Nielsen,M.T.,et al.,PLoS ONE,2013,8,e72871)。构巢曲霉还可用于异源表达负责新生霉素B(neosartoricin B)合成的皮肤真菌来源基因簇(Yin,W.B.,et al.,ACS Synth.Biol.,2013,2,629-634)。这些研究利用包含ColE1复制起点、酵母着丝粒序列和自主复制序列的穿梭载体。该载体可用于在构巢曲霉中产生单链全长簇。这些技术需要大量的时间和努力以表达仅一个异源簇。并且这些技术仅适用于插入小于约20kb的片段。

  大的插入DNA克隆载体已在多种体系中建立,包括:酵母人工染色体(YAC,Burke,D.,et al.,Science,1987,236,806-812)、细菌人工染色体(BAC,Shizuya,H.,et al.,Proc.Natl.Acad.Sci.USA.,1992,89,8794-8797)、P1-来源的人工染色体(PAC,Ioannou,P.A.,et al.,Nat.Genet.,1994,6,84-89)、大肠杆菌-植物穿梭BAC也称为双元BAC(BIBAC,Hamilton,C.M.,Gene,1997,200,107-116)、大肠杆菌-链霉菌人工染色体(ESAC,Sosio,M.,et al.,Nat.Biotechnol.,2000,18,343-345)。但是,这些质粒体系不适于真菌。之前报道的大肠杆菌-真菌穿梭质粒载体既不能容纳也无法保持100kb或更大的DNA片段(Yin,W.B.,et al.,ACS Synth.Biol.,2013,2,629-634)。

  构巢曲霉AMA1是一种真菌复制起点,已在小质粒的大肠杆菌-真菌穿梭载体中使用(Gems,D.,et al.,Gene,1991,98,61-67;Aleksenko,A.and Clutterbuck,A.,J.Fungal Genet.Biol.,1997,21,373-387;Kubodera,T.et al.Biosci.Biotechnol.Biochem.,2000,64,1416-1426)。还有真菌穿梭质粒或载体已报道可用于整合(Tiburn,J.,et al.,Gene.1983,26:205-221;Golduran,G.H.and Morris,N.R.,Methods in Molecular Genetics1995,6,48-65Microbial Gene Techniques Edited by Kenneth W.Adolph;Kubodera,T.,et al.,Biosci.Biotechnol.Biochem.,2000,64,1416-1426;Arentshorst,M.,et al.,Fungal Biology and Biotechnology,2015,2,2)、自主复制或染色体外保持(Gems,D.,et al.,Gene,1991,98,61-67;Golduran,G.H.and Morris,N.R.,Methods in Molecular Genetics1995,6,48-65Microbial Gene Techniques Edited by Kenneth W.Adolph;Kubodera,T.et al.Biosci.Biotechnol.Biochem.,2000,64,1416-1426)。但是,这些穿梭质粒或载体不可用于克隆和转化非常大的DNA(例如20kb或更大)。之前试图通过根癌土壤杆菌转化体系将长达75Kb的真菌DNA导入尖孢镰刀菌和泡盛曲霉(A.awamori),仅得到很少含有大DNA插入的转化子。此外,未尝试检测异源DNA的稳定性,更不用说检测表达(Takken,F.L.,et al.,Curr.Genet.,2004,45,242-248)。

  细菌人工染色体(BAC)已广泛被用于基因组DNA测序、定位克隆及在原核生物和真核生物包括丝状真菌中的绘制基因组图谱(Zhu,H.,et al.,Fungal Genet.Biol.,1997,21,337-347;Nishimura,M.,et al.,Biosci.Biotechnol.Biochem.,1998,62,1515-1521;Adler,H.et al.,Rev.Med.Virol.,2003,13,111-121;Diener,S.E.,et al.,Fungal Genet.Biol.,2004,41,1077-1087;Srivastava,S.K.,et al.,PLoS One 2014,9:e81832)。虽然大片段插入DNA体系也已用于异源表达微生物天然产物生物合成途径及宏基因组研究,但是少有成功的报道(Béjà,O.,Curr.Opin.Biotechnol.,2004,15,187-190;Lorenz,P.and Eck,J.,Nat.Rev.Microbiol.,2005,3,510-516;Ongley,S.E.,et al.,Nat.Prod.Rep.,2013,30,1121–1138)。这些体系的挑战包括:1)DNA克隆偏倚(bias);2)DNA插入片段小;3)缺少先进的异源表达宿主及4)缺少高分辨率化学和数据分析管道。这些挑战的一个原因是到目前为止几乎所有的BAC文库都是通过部分限制性消化产生的(Wu,C.C.,et al.,Encyclopedia of Molecular Cell Biology and Molecular Medicine Volume 3(2nd Edition),Edited by Meyers R.A.,Wiley-VCH Verlag GmbH:Weinheim,Germany2004,pp385-425 2004;Zhang,M.,et al.,Nat.Protoc.,2012,7,467-478)。部分限制性消化可能是有偏倚的,因为在任意基因组包括真菌基因组中限制性位点的产生是高度可变且非随机的。某些基因组区可包含过量的限制性位点或者整体上缺乏限制性位点,例如在含有高度重复序列的基因组DNA区域,如着丝粒和端粒(Godiska,R.,et al.,Bias-Free Cloning of‘Unclonable’DNA for Simplified Genomic Finishing.In DNA Sequencing III:Dealing with Difficult Templates.Sudbury,MA:Jones and Bartlett Publishers:2008)。结果,某些序列很难或者不可能克隆,即使使用多重偏倚的部分消化文库并达到50×覆盖。

  此外,来自稀少或频繁剪切基因组区域的DNA片段对于DNA片段分级可能太大或太小,都有可能被排除在克隆过程中。通过机械剪切如超声处理、喷雾法和水剪切(hydroshearing)可将高分子量(HMW)基因组DNA片段化,产生小的DNA片段(10kb或更小)。这些方法可能不适合制备100kb-300kb的片段。经报道,冻融循环可导致大的DNA断裂,但这些方法对于常规使用不够有效(Osoegawa,K.,et al.,Genomics.,2007,89,291-299)。

  已经开发了可有效用于基于大DNA或BAC重组工程的Red/ET(Redα/β或RecE/T)工具(Copeland,NG,et al.,Nat.Rev.Genet.2001,2:769-779;Muyrers,JPP,et al.,Trends in Bioch.Sci.,2001,26,325-331)。工程化的大DNA或BAC已经可常规用于产生转基因动物例如小鼠,以及用于哺乳动物(例如人)的大基因或途径的功能研究(Johnson,S.J.and Wade-Martins,R.A.,Biochem.Soc.Trans.2011,39,862-867)。

  动物模型中的基于BAC大基因的表达(Johnson,S.J.and Wade-Martins,R.A.,Biochem.Soc.Trans.2011,39,862-867)不能直接用于研究真菌SM途径或发现天然产物(NP)。

  因此,对于克隆大片真菌DNA例如参与次生代谢物生物合成的整个基因簇的新方法和组合物的需要尚未满足。

  概述

  由于研究真菌基因新工具的需要尚未满足,本发明人已经开发了用于产生可在真菌宿主中繁殖和表达的SM基因簇文库的载体和方法。

  在一些实施方案中,本发明的教导包括真菌人工染色体(FAC)。在多种方面,真菌人工染色体可以包含至少一个细菌复制起点、细菌选择标记基因、真菌选择标记基因和真菌自主复制元件。在多种方面,FAC可以是能够在细菌宿主例如但不限于大肠杆菌以及真菌宿主例如但不限于丝状真菌如曲霉菌属中复制的穿梭载体或质粒。在一些配置中,曲霉菌属可以是构巢曲霉。

  在一些配置中,本发明教导的真菌人工染色体可以是双功能真菌人工染色体(FACdual)。在多种配置中,FACdual可包含至少一个细菌复制起点、细菌选择标记基因、真菌自主复制元件、用于与宿主重组的整合位点、整合酶基因和真菌选择标记基因。在一些配置中,整合位点可以是但不限于attP位点。在一些配置中,整合酶基因可以是但不限于真菌密码子优化的phi31整合酶基因。在一些配置中,FACdual还可包含真菌有效启动子例如真菌诱导型启动子。在多种配置中,真菌有效启动子可以可操作地连接到整合酶基因。在多种方面,真菌诱导型启动子可以是alcA(p)(Romero,B.,et al.,Fungal Genet.Biol.200340,103-114)。在多种方面,真菌诱导型启动子可以是glaA(p)(Smith,T.L.,et al.,Gene,1990,88,259-262)。在多种方面,真菌诱导型启动子可以是sucA启动子(Roth,A.H.,et al.,Appl Microbiol Biotechnol.,2010,86,659-670)。

  在多种配置中,真菌自主复制元件可以是任何真菌自主复制元件,例如但不限于AMA1自主复制元件。

  在一些实施方案中,本发明的教导包括真菌人工染色体整合载体(FACint)。在多种配置中,真菌人工染色体整合载体可以包含至少一个细菌复制起点、细菌选择标记基因、两种相同取向的真菌DNA序列和真菌选择标记基因。在多种配置中,两种真菌序列可以是与宿主真菌DNA同源的序列。在多种配置中,两种真菌同源DNA序列可以是例如但不限于曲霉属1,007bp 5'trpC和1,000bp3'trpC的同源序列。在多个方面,FACint可以在原核宿主例如但不限于大肠杆菌中复制。在多个方面,FACint可以整合到真菌宿主例如但不限于曲霉菌属真菌例如构巢曲霉基因组中。在多个方面,FACint可以作为穿梭载体或质粒。在多个方面,细菌选择标记基因可以是本领域技术人员已知的任意细菌选择标记基因,例如但不限于卡那霉素抗性基因(kanR)。

  在多种配置中,本发明教导的载体即本发明教导的FAC、FACdual或FACint还可包含克隆位点,其包含可在特定序列结合并剪切DNA的多个核酸内切酶识别位点。核酸内切酶识别序列包括来自原核生物的限制性内切酶识别序列和来自真核生物的归巢核酸内切酶的识别序列(本文中称作“限制酶”)。在一些配置中,克隆位点可包含在消化FAC时产生不相容(即非互补或非回文)单链突出端的限制酶的多个识别位点。在一些方面,克隆位点可包括一种或多种限制酶例如但不限于Bsr I,I-CeuI,BstXI,I-SceI或其组合的识别序列。在一些方面,识别序列可以是限制酶例如但不限于BstXI,I-SceI或其组合的识别序列。在一些方面,克隆位点可以包括串联取向的一对限制酶识别位点。在一些方面,克隆位点可以包括相反的“头对头”取向的一对限制酶识别位点。在一些方面,克隆位点可以依次包括I-SceI、BstXI、BstXI和I-SceI的识别位点。在一些方面,I-SceI位点可以相互头对头取向。在一些方面,BstXI位点可以相互头对头取向。在一些配置中,克隆位点还可包含一种或多种其他限制酶例如Bam HI、Hind III、EcoRI或NotI的识别位点。

  在多种配置中,本发明教导的载体可在原核宿主例如但不限于大肠杆菌或真核真菌宿主例如但不限于曲霉菌属例如构巢曲霉中保持并复制。

  在一些配置中,本发明的载体可以包括低拷贝数细菌复制起点、诱导型高拷贝数细菌复制起点或其组合,即低拷贝数和诱导型高拷贝数细菌复制起点。在多个方面,低拷贝数细菌复制起点可以是例如但不限于oriS。在多个方面,诱导型高拷贝数细菌复制起点可以是例如但不限于oriV。在多种配置中,高拷贝数复制起点可以通过在大肠杆菌宿主基因组或质粒中编码的复制起始蛋白基因控制。在多种配置中,复制起始蛋白基因可以是TrfA。在多种配置中,诱导型启动子可以可操作地连接到复制起始蛋白基因。在多种配置中,诱导型启动子可以是任何细菌诱导型启动子,例如但不限于阿拉伯糖诱导型启动子、lac启动子、IPTG诱导型T3启动子、IPTG诱导型T5启动子或鼠李糖诱导型(rhaBAD)启动子。

  在一些配置中,本发明教导的载体可包括用于细菌如大肠杆菌的选择标记的一种或多种基因,例如但不限于氯霉素抗性基因(camR或CAT)、kanR、ampR、genR、tetA、strepR、galK或其组合。在多个方面,选择标记可用于阳性筛选(例如选择存在氨苄青霉素抗性或galK(半乳糖激酶)活性)或阴性筛选(例如选择不存在galK活性(Warming,S.,et al.,Nucleic Acids Res.2005,Vol.33,No.4e36))。

  在一些配置中,本发明教导的载体可以包括真菌选择标记基因,例如但不限于pyrG、ptrA、trpC或其组合。在一些方面,真菌选择标记基因可以是pyrG基因。

  在一些配置中,本发明教导的载体可以包括来自外源的DNA的插入。在多种配置中,DNA插入可以是插入克隆位点。在多种配置中,DNA插入物可以来自任意来源,例如病毒、原核微生物、真核微生物、植物、动物、人或由RNA产生的cDNA。在一些配置中,DNA源可以是真核微生物例如酵母或丝状真菌的基因组。在一些配置中,DNA源可以是曲霉菌属真菌,包括任何曲霉菌属物种。在一些配置中,DNA源可以是除构巢曲霉以外的曲霉菌属真菌。在一些配置中,DNA插入源可以是曲霉菌属真菌,例如但不限于A.acidus,A.aculeatinus,棘孢曲霉(A.aculeatus),A.aeneus,A.affinis,A.alabamensis,洋葱曲霉(A.alliaceus),亚马逊曲霉(A.amazonicus),A.ambiguus,A.amoenus,阿姆斯特丹曲霉(A.amstelodami),解淀粉曲霉(A.amyloliquefaciens),A.amylovorus,阿诺玛鲁斯曲霉(A.anomalus),A.anthodesmis,A.apicalis,A.appendiculatus,A.arachidicola,A.arenarius,A.arvii,A.asperescens,A.assulatus,A.astellatus,A.aurantiobrunneus,A.aureofulgens,A.aureolatus,A.aureoterreus,A.aureus,A.auricomus,A.australensis,A.austroafricanus,A.avenaceus,A.awamori,A.baeticus,A.bahamensis,A.biplanus,A.bisporus,香素曲霉(A.bombycis),巴西曲霉(A.brasiliensis),A.brevipes,A.brevistipitatus,A.bridgeri,A.brunneo-uniseriatus,A.brunneoviolaceu,A.caelatus,A.caesiellus,A.caespitosus,A.calidoustus,A.campestris,闪白曲霉(A.candidus),A.capensis,A.carbonarius,肉色曲霉(A.carneus),A.cavernicola,A.cavernicola,A.cervinus,谢瓦氏曲霉(A.chevalieri),A.chungii,A.cibarius,A.clavatoflavus,A.clavatonanicus,棒曲霉(A.clavatus),圆锥曲霉(A.conicus),A.conjunctus,A.conversis,A.coreanus,A.coremiiformis,A.costaricensis,A.costiformis,A.creber,A.cretensis,冠突曲霉(A.cristatus),A.crustosus,A.crystallinus,A.cvjetkovicii,A.deflectus,A.delacroixii,A.delicatus,A.densus,A.dentatulus,A.depauperatus,A.dessyi,A.digitatus,A.dimorphicus,A.diplocystis,A.discophorus,A.disjunctus,A.diversus,A.dorothicus,A.dubius,A.dubius,A.duricaulis,A.dybowskii,A.eburneocremeus,A.eburneus,A.echinosporus,A.echinulatus,A.ecuadorensis,A.effusus,埃及曲霉(A.egyptiacus),A.elatior,线虫曲霉(A.elegans),A.ellipsoideus,A.ellipticus,A.elongatus,A.equitis,A.erythrocephalus,A.falconensis,A.fasciculatus,A.fennelliae,A.ferrugineus,A.ferrugineus,A.ficuum,A.fiemonthi,A.filifera,A.fimetarius,A.fimeti,费氏曲霉(A.fischeri),A.fischerianus,A.flaschentraegeri,A.flavescens,A.flavidus,A.flavipes,A.flavofurcatus,A.flavoviridescens,黄曲霉(A.flavus),A.flocculosus,A.floriformis,A.foeniculicola,臭曲霉(A.foetidus),A.fonsecaeus,A.foutoynontii,A.foveolatus,A.fresenii,A.fruticans,A.fruticulosus,A.fujiokensis,A.fuliginosus,A.fulvus,A.fumaricus,A.fumigatiaffinis,A.fumigatoides,烟曲霉(A.fumigatus),烟束曲霉(A.fumisynnematus),A.fungoides,A.funiculosus,A.fuscus,A.galeritus,巨大曲霉(A.giganteus),A.gigantosulphureus,A.gigas,平滑曲霉(A.glaber),A.glaucoaffinis,A.glauconiveus,灰绿曲霉(A.glaucus),A.globosus,A.godfrini,A.gorakhpurensis,A.gracilis,A.granulatus,A.granulosus,A.gratioti,A.greconis,A.griseus,藤黄曲霉(A.guttifer),A.gymnosardae,A.halophilicus,A.halophilus,A.helicothrix,A.hennebergii,A.herbariorum,A.heterocaryoticus,A.heteromorphus,A.heterothallicus,A.heyangensis,A.hiratsukae,A.hollandicus,A.homomorphus,A.hortae,腐质曲霉(A.humicola),腐殖质曲霉(A.humus),A.ibericus,红色曲霉(A.igneus),A.iizukae,A.implicatus,A.incrassatus,A.indicusA.,A.indohii,A.ingratus,A.insecticola,A.insuetus,A.insulicola,A.intermedius,A.inuii,衣康酸曲霉(A.itaconicus),A.ivoriensis,雅努斯曲霉(A.janus),日本曲霉(A.japonicus),A.jeanselmei,A.kambarensis,A.kanagawaensis,A.kassunensis,A.katsuobushi,A.keveii,A.koningii,A.laciniosus,A.lacticoffeatus,A.laneus,A.lanosus,A.laokiashanensis,A.lateralis,A.lentulus,A.lepidophyton,A.leporis,A.leucocarpus,A.lignieresii,A.longivesica,A.longobasidia,A.luchensi,A.luchuensis,A.lucknowensis,A.luteoniger,A.luteovirescens,土黄色曲霉(A.lutescens),黄色曲霉(A.luteus),A.macfiei,A.macrosporus,A.malignus,A.malodoratus,A.malvaceus,A.mandshuricus,A.manginii,A.mannitosus,A.maritimus,A.mattletii,A.maximus,A.medius,波状热曲霉(A.melitensis),蜂蜜曲霉(A.melleus),A.mellinus,A.mencieri,A.michelii,A.microcephalus,A.microcysticus,A.microsporus,A.microthecius,A.microviridicitrinus,A.minimus,A.minisclerotigenes,A.minor,A.minutus,A.miyajii,A.miyakoensis,A.mollis,A.montenegroi,A.montevidensis,粘液样曲霉(A.mucoroides),A.mucoroideus,A.muelleri,多色曲霉(A.multicolor),A.multiplicatus,A.muricatus,A.muscivora,A.mutabilis,A.mycetomi-villabruzzii,A.mycobanche,A.nakazawae,A.nantae,A.nanus,A.navahoensis,A.neobridgeri,A.neocarnoyi,A.neoellipticus,A.neoglaber,A.nidulellus,黑曲霉(A.niger),A.nigrescens,微黑曲霉(A.nigricans),A.nishimurae,A.niveoglaucus,霉白曲霉(A.niveus),A.noelting,A.nominus,集峰曲霉(A.nomius),A.novofumigatus,A.novus,A.ochraceopetaliformis,赭曲霉(A.ochraceoroseus),A.ochraceoruber,赭曲霉(A.ochraceus),A.okazakii,A.olivaceofuscus,A.olivaceus,A.olivascens,A.olivicola,A.omanensis,A.onikii,A.oosporus,A.ornatulus,A.ornatus,米曲霉(A.oryzae),A.ostianus,A.otanii,A.ovalispermus,A.paleaceus,A.pallidus,A.panamensis,A.paradoxus,寄生曲霉(A.parasiticus),A.parrulus,A.parvathecius,A.parvisclerotigenus,A.parviverruculosus,A.parvulu,A.paulistensi,A.penicillatus,A.penicilliformis,帚状曲霉(A.penicillioides),A.penicillioideum,A.penicillopsis,A.periconioides,A.perniciosus,A.persii,A.petrakii,A.peyronelii,A.phaeocephalus,A.phialiseptatus,海枣曲霉(A.phoenicis),A.pidoplichknovii,A.piperis,A.polychromus,A.pouchetii,A.primulinus,A.profusus,A.proliferans,A.protuberus,,A.pseudocaelatus,A.pseudocarbonarius,A.pseudocitricus,假棒曲霉(A.pseudoclavatus),A.pseudodeflectus,A.pseudoelatior,假线虫曲霉(A.pseudoelegans),A.pseudoflavus,假灰绿曲霉(A.pseudoglaucus),A.pseudoheteromorphus,A.pseudoniger,A.pseudoniger,假集峰曲霉(A.pseudonomius),假溜曲霉(A.pseudotamarii),A.pulchellus,A.pulmonum-hominis,粉状曲霉(A.pulverulentus),A.pulvinus,A.puniceus,A.purpureofuscus,紫红曲霉(A.purpureus),A.pusillus,A.pyramidus,A.pyri,A.qinqixianii,A.qizutongii,A.quadricinctus,A.quadricingens,A.quadrifidus,A.quadrilineatus,A.quercinus,A.quininae,A.quitensis,A.racemosus,A.raianus,A.rambellii,多枝曲霉(A.ramosus),A.raperi,A.recurvatus,A.rehmii,A.repandus,A.repens,A.reptans,局限曲霉(A.restrictus),A.rhizopodus,A.robustus,A.roseoglobosus,A.roseoglobulosus,A.roseovelutinus,A.roseus,A.roseus,赤曲霉(A.ruber),A.rubrobrunneus,赤曲霉(A.rubrum),A.rufescens,A.rugulosus,A.rugulovalvus,A.rutilans,A.sacchari,A.saitoi,A.salviicola,A.sartoryi,A.scheelei,A.schiemanniae,A.sclerogenus,A.sclerotiicarbonarius,A.sclerotioniger,A.sclerotiorum,A.sejunctus,分隔曲霉(A.septatus),A.sepultus,A.silvaticus,简单曲霉(A.simplex),酱油曲霉(A.sojae),A.sparsus,A.spathulatus,赤松曲霉(A.spectabilis),A.spelunceus,A.spiculosus,具刺曲霉(A.spinosus),A.spinulosus,腋索曲霉(A.spiralis),A.stella-maris,A.stellatus,A.stellifer,A.stercoreus,A.sterigmatophorus,A.steynii,A.stramenius,A.striatulus,A.striatus,A.stromatoides,A.strychni,A.subfuscus,A.subgriseus,A.sublatus,A.sublevisporus,近绿曲霉(A.subolivaceus),A.subsessilis,A.subunguis,硫色曲霉(A.sulphureus),硫色曲霉(A.sulphureus),A.sunderbanii,萨氏曲霉(A.sydowii),A.sylvaticus,集珠曲霉(A.syncephalis),A.tabacinus,A.taichungensis,A.takakii,A.taklimakanensis,溜曲霉(A.tamari),A.tapirirae,A.tardus,A.tatenoi,蒺藜曲霉(A.terrestris),土曲霉(A.terreus),栖土曲霉(A.terricola),A.testaceocolorans,A.tetrazonus,A.thermomutatus,A.thomi,A.tiraboschii,A.togoensis,A.tokelau,A.tonophilus,A.toxicarius,A.tritici,A.tsurutae,A.tuberculatus,塔宾曲霉(A.tubingensis),A.tunetanus,A.udagawae,A.umbrinus,嗜阴曲霉(A.umbrosus),波状曲霉(A.undulatus),A.unguis,A.unilateralis,宇佐美曲霉(A.usamii),黑粉菌曲霉(A.ustilago),A.ustus,A.uvarum,A.vadensis,A.vancampenhoutii,A.varanasensis,A.variabilis,A.varians,A.variecolor,A.variegatus,A.velutinus,A.venezuelensis,杂色曲霉(A.versicolor),A.vinosobubalinus,A.violaceobrunneus,A.violaceofuscus,A.violaceus,A.virens,A.viridigriseus,A.viridinutans,A.vitellinus,葡萄曲霉(A.vitis),A.vitricola,A.wangduanlii,A.warcupii,A.wehmeri,A.welwitschiae,温特曲霉(A.wentii),A.westendorpii,A.westerdijkiae,A.xerophilus,A.yezoensis,A.zhaoqingensis或环带曲霉(A.zonatus)。

  在多种配置中,本发明教导的载体(即本发明教导的FAC、FACdual或FACint)可以包括的插入物长度为至少10kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少110kb、至少120kb。在多种配置中,插入物长度可达500kb、400kb、300kb、200kb或150kb。因此,在多种配置中,本发明的载体可包括范围为例如但不限于30kb至500kb、40kb至400kb、50kb至300kb或100kb至500kb的插入物。

  在多种配置中,本发明教导的载体可含有包含至少一种次生代谢物(SM)基因簇,基本上由其组成,或由其组成的插入物。在多种配置中,本发明的载体可含有包含至少一种次生代谢物(SM)基因簇、基本上由其组成或由其组成的插入物,和编码真菌的代谢终产物的该基因簇的所有基因。在多个方面,SM基因簇可以来自与本发明教导载体的宿主真菌种异源的真菌种类。在多个方面,SM基因簇可以来自构巢曲霉以外的真菌物种,且宿主真菌种可以是构巢曲霉。在多种配置中,包含SM基因簇的插入物长度可达500kb、400kb、300kb、200kb或150kb。因此,在多种配置中,本发明教导的载体可以包含SM基因簇的范围例如但不限于30kb至500kb、40kb至400kb、50kb至300kb、100kb至500kb、100kb至400kb或100kb至300kb。在多种配置中,由本发明教导的载体包含的SM基因簇可以是完整的基因簇。在一些方面,在异源真菌宿主中表达SM基因簇可用于重建次生代谢物的生物合成途径。

  在多种配置中,本发明的教导包括包含本发明教导载体(即FAC、FACdual或FACint)的宿主真菌。在多个方面,宿主真菌可以是丝状真菌例如但不限于曲霉菌属真菌。在多个方面,真菌可以是构巢曲霉真菌。在多种配置中,含有包含SM基因簇的本发明教导载体的宿主真菌可以表达簇的基因。因为本发明教导的载体包含的SM基因簇的基因在真菌环境中,天然存在的基因表达、转录后和翻译后调节和修饰,以及次生代谢物的合成可被复制或非常接近。在一些方面,SM基因簇的一个或多个基因可被修饰以影响表达水平的增加或降低,或改变蛋白质结构。

  在多种配置中,本发明教导的载体包含的次生代谢物(SM)基因簇可通过一种或多种靶向插入、一种或多种靶向缺失或其组合来修饰。在多个方面,修饰可导致SM基因簇包含的一个或多个基因的表达增强。在多个方面,修饰可导致SM基因簇包含的一个或多个基因的表达降低。在多个方面,修饰可导致隐性基因的激活。在多个方面,修饰可以是靶向插入到SM基因簇中的具体位点。在多个方面,修饰可以是SM基因簇一部分的靶向缺失。在某些方面,载体可以是本发明教导的FAC、FACdual、FACint。

  在一些实施方案中,本发明的教导包括将DNA序列插入次生代谢物(SM)基因簇中目标位置的方法。在多种配置中,这些方法可包括提供包含次生代谢物(SM)基因簇的本发明教导的载体(即本发明教导的FAC、FACdual或FACint);提供包含、基本上由以下组成或由以下组成的插入DNA:a)与目标位置第一侧侧翼序列同源的第一序列,b)待插入的序列,c)与目标位置第二侧侧翼序列同源的第二序列,和d)细菌选择标记;将载体和插入DNA转化进入表达Red/ET重组酶的大肠杆菌菌株;以及选择包含细菌选择标记的转化的大肠杆菌细胞。不受理论的限制,据信可以通过插入DNA与载体所含SM基因簇之间的同源重组来实现在目标位置插入序列。在一些配置中,插入DNA的细菌选择性标记可以是不同于转化前载体所含细菌选择标记的标记。在多种配置中,细菌选择标记可以是阳性选择标记或阴性选择标记。在某些方面,载体可以是FAC。

  在一些实施方案中,本发明教导包括从次生代谢物(SM)基因簇中删除靶DNA序列的方法。在多种配置中,这些方法可以包括提供包含次生代谢物(SM)基因簇的本发明教导的载体(即本发明教导的FAC、FACdual或FACint);提供缺失DNA,其包含a)与靶DNA序列第一侧侧翼序列同源的第一序列,b)与靶DNA序列第二侧侧翼序列同源的第二序列,和c)细菌选择标记;将载体和插入DNA转化进入表达Red/ET重组酶的大肠杆菌菌株;以及选择包含细菌选择标记的转化的大肠杆菌细胞。不受理论的限制,据信可通过缺失DNA和载体所包含的SM基因簇之间的同源重组来实现靶序列的缺失。在一些配置中,缺失DNA的细菌选择标记可以是转化前载体所含的细菌选择标记以外的标记。在多种配置中,细菌选择标记可以是阳性选择标记或阴性选择标记。在一些方面,载体可以是本发明教导的FAC。

  在一些实施方案中,本发明教导包括在本发明教导的载体中构建非偏倚(unbiased)文库的方法。在多种配置中,这些方法可包括从DNA来源例如真菌提供高分子量(HMW)基因组DNA;将HMW基因组DNA机械剪切成长度为100kb-300kb的片段;在DNA片段上产生平末端;将限制酶接头如BstXI接头连接到平末端,以产生接头连接的DNA片段;通过脉冲场凝胶电泳纯化接头连接的DNA片段;并将纯化的接头连接的DNA片段连接到本发明教导的限制酶酶切载体如BstXI酶切载体中。在多个方面,所述方法还可包括用连接的限制酶酶切载体转化宿主微生物。在多种配置中,宿主微生物可以是大肠杆菌或第二种真菌,例如构巢曲霉。在多种配置中,限制酶可以是BstXI。在多种配置中,载体可以是本发明教导的FAC。在多个方面,DNA的来源可以是丝状真菌,例如但不限于曲霉菌属真菌如构巢曲霉以外的曲霉菌属真菌。在一些方面,宿主微生物可以是曲霉菌属真菌例如构巢曲霉。在多个方面,高分子量基因组DNA的来源可以是宿主真菌种以外的真菌种。在多个方面,HMW基因组DNA可以是与宿主真菌种异源的真菌基因组DNA。在多个方面,HMW基因组DNA可以是包含次生代谢物基因簇的真菌基因组DNA。

  附图说明

  图1A-C示出了本发明教导的FAC载体图;

  图2A-B示出了从温特曲霉制备HMW基因组DNA和随机剪切FAC克隆结果;

  3A-C CHEF凝胶,其显示大肠杆菌-曲霉菌属穿梭BAC或FAC成功地从构巢曲霉的转化菌株转移到大肠杆菌;

  图4A-B示出了成功融合PCR的一步精确FAC修饰和分子确认的示意图;

  图5CHEF凝胶示出了AtFAC9J20(FAC20)的5种精确基因缺失;

  图6通过FAC系统在构巢曲霉中装配合成SM基因簇的示意图。

  具体实施方式

  本发明的教导提供了用于生产非偏倚大片段插入基因组文库的载体和方法,可用于从真菌捕获整套大的完整的SM基因途径。载体可用于在真菌宿主和细菌宿主之间穿梭大的完整的SM基因簇。构巢曲霉可以用作异源表达SM基因簇的宿主。此外,本发明教导的载体允许使用同源重组通过插入和缺失来靶向修饰SM基因簇。

  本发明人从6种测序真菌构建了平均插入物大小为100kb或更大的非偏倚真菌穿梭BAC(FAC)文库:棘孢曲霉(Aspergillus aculeatus)、温特曲霉、土曲霉、茄腐镰孢菌(Fusarium solani)、扩展青霉(Penicillium expansum)和马尔尼菲青霉菌(P.marneffei)。每个文库中的平均插入物大小使得每种载体可包含完整的SM途径或真菌次生代谢物基因簇,其大小范围在20kb至超过80kb。在一些配置中,载体可以包含SM生物合成途径的所有基因。

  新的FAC文库是使用随机剪切的DNA产生的且不含限制性不完全消化,这是该领域的另一个里程碑,消除了偏倚从而可提高文库质量。使用FAC文库,本发明人已经成功地从6种测序真菌预测的271种完整SM基因簇或途径中获得263种,作为单个FAC克隆(表1)。

  本发明人已经证明,大载体例如包含完整SM基因簇的载体可穿梭进入真菌宿主中用于稳定的质粒保持。此外,已经实现了在构巢曲霉宿主中异源表达至少150kb的大的SM基因簇。在一些配置中,本发明教导的载体可包含能够被真菌宿主的调控元件调节的全长SM基因簇。

  在一些方面,可通过Red/ET技术修饰包含完整SM基因簇的载体(例如包含约100kb的插入片段的载体),用于真菌功能性SM研究。本发明的教导包括在任意选择的DNA序列位点精确修饰真菌完整SM基因簇的方法。可使用的方法例如但不限于激活隐性、沉默和或低表达SM基因簇、表征真菌SM基因簇内的基因或遗传元件,以及天然产物(NP)发现。表2列出了55种SM基因簇或途径的修饰实例。

  在一些配置中,可以使用抗生素抗性基因(例如但不限于卡那霉素、氨苄青霉素或羧苄西林、红霉素、四环素、硫酸庆大霉素、青霉素、链霉素、大观霉素(spectromycin)或氯霉素抗性基因)来选择含有包含修饰的SM基因簇载体的细菌克隆。所述载体可以在含有适于所述载体和RED/ET选择标记的抗生素的LB培养基上的大肠杆菌中生长。在一些方面,选择的菌落可以在一天之内生长。

  在一些配置中,本发明教导包括融合PCR方法,其将选择标记(例如KanR或galK基因)和启动子(例如但不限于gpdA(p)、alcA(p)、glaA(p)或pkiA(A))组合为一种PCR产物用于修饰SM基因簇(例如图4A-B和5)。

  在一些配置中,本发明教导包括用于表达毒性SM化合物的方法,而不需要共同表达能够将毒性SM化合物输送出细胞的抗性基因。这些方法使用包含诱导型强启动子如alcA(p)的载体。在这些方法中,细胞最初在没有诱导剂的情况下生长。当细胞达到足够的密度时,加入诱导剂,细胞表达次生代谢途径的基因。该方法可用于生产毒性SM化合物。

  在一些配置中,本发明的载体提供了通过真菌同源重组在构巢曲霉中组装合成的SM基因簇的工具(图6)。单个基因(例如Gene1、Gene2和Gene3或更多,总共约100kb)可以根据生物信息学设计完全合成,或者克隆并与诱导型强启动子(例如但不限于alcA(p))及侧翼同源序列(约1kb,H1、H2、H3、H4等)融合。这些基因和含有合成的SM基因簇的侧翼同源序列(例如H1和H4)的克隆就绪载体(pFAC或pFACdual)可以同时转化进入构巢曲霉以通过同源重组组装合成的SM基因簇。真菌选择标记如AfpyroA和AfriboB(Szewczyk,E,et al.,Nat.Protoc.,2006,1,311-3120)可用于选择具有合成的SM基因簇的载体。与本领域中先前报道的基因组整合(Szewczyk,E.,et al.,Nat.Protoc.,2006,1,311-3120;Chiang,YM,et al.,J.Am.Chem.Soc.,2013,135,7720-7731)不同,本发明教导的合成SM基因簇-FAC可以从构巢曲霉中分离,然后穿梭回大肠杆菌。在一些配置中,可以进一步修饰FAC,例如通过在大肠杆菌中或体外添加调节元件或基因。

  在一些配置中,本发明的教导包括通过真菌同源重组在构巢曲霉中组装新的合成的SM基因簇的方法(图6)。

  本发明的教导公开了三种类型的载体用于克隆大的插入片段。这些载体可用于复制和保持大的插入片段作为人工染色体或者用于将大插入片段整合到宿主真菌基因组中。在多种配置中,可用作真菌人工染色体的质粒可以是基于P1的载体、基于BAC的载体或穿梭BAC载体,其可用于在大肠杆菌和真菌宿主中复制大的插入片段。

  在多种配置中,本发明教导的载体可以包含用于在大肠杆菌中复制和保持质粒的特征。载体可以包含大肠杆菌的复制起点例如低拷贝数起点,例如但不限于F质粒的起点。低拷贝数复制起点可以包括但不限于oriS。载体还可以包含这样的大肠杆菌复制起点,其可以是诱导型高拷贝复制起点,例如但不限于oriV。载体还可以包括大肠杆菌选择标记基因,例如赋予抗生素抗性的基因,所述抗生素例如但不限于:氯霉素、卡那霉素、氨苄青霉素或羧苄青霉素、红霉素、四环素、硫酸庆大霉素、青霉素、链霉素或大观霉素。在一些配置中,载体还可以包含至少一个克隆位点,其可以是多克隆位点。在一些方面,克隆位点可以包含一对限制性位点,其中用限制酶消化可产生非互补单链突出端,其可以连接到特定接头。适合的酶包括的酶可产生非互补单链突出端例如非回文突出端,例如用酶例如但不限于BstXI、BseYI、I-CeuI、I-SceI、PI-PspI、PI-SceI、AlwNI、BglI、BslI、BstAPI、DrdI、MwoI、PflMI或SfiI消化产生的突出端。在一些配置中,第二个克隆位点可以包含一对限制性位点,位于第一个克隆位点酶切位点的侧翼,其中用靶向这些位点的第二种酶消化可产生非互补单链突出端。适合的酶包括可产生非互补单链突出端的稀有剪切酶,例如但不限于I-SceI、PI-PspI和I-Ceul。不受理论的限制,这两个限制酶位点对的组合可促进克隆的大DNA片段的清洁切除并与其他FAC质粒如FAC整合质粒交换。在多种配置中,高拷贝数的复制起点可受到诱导型启动子上的复制起始蛋白调节,所述复制起始蛋白可整合到宿主大肠杆菌细胞基因组中,所述诱导型启动子例如但不限于阿拉伯糖诱导型启动子、T5启动子、T7启动子、rhaBAD启动子或β-半乳糖苷酶启动子。复制起始蛋白可以是例如但不限于TrfA。

  在一些配置中,FAC载体可以包含其在真菌细胞中复制的特征。这些包括真菌复制起点,例如但不限于在曲霉菌属中自主保持(AMA1,SEQ ID NO:8)。FAC载体还可以含有真菌选择标记基因,例如但不限于乳清苷-5'-磷酸脱羧酶基因(pyrG,源自寄生曲霉,SEQ ID NO:9和SEQ ID NO:10)、ptrA或trpC。

  在一些配置中,本发明的教导包括FAC双功能载体,其可作为真菌人工染色体保持在大肠杆菌中、可被诱导整合到真菌基因组中、并且可以用作大肠杆菌-真菌穿梭BAC载体。双功能载体具有与上文所述的常规FAC载体相同的特征,以及另外的基因盒:attP位点和整合酶基因例如但不限于phi31整合酶基因,在真菌诱导型启动子例如但不限于alcA启动子或glaA(p)的控制下。在多种配置中,整合酶基因可以进行密码子优化用于真菌表达。

  在多种配置中,本发明教导的FAC系统可以用于多种真菌,例如但不限于棘孢曲霉、土曲霉、温特曲霉、茄腐镰孢菌、扩展青霉、马尔尼菲青霉菌、粗糙脉孢菌(Neurospora crassa)及子囊菌门的真菌。

  定义

  本文中使用多种术语来表示本发明教导的各个方面。为了帮助澄清这些教导的组件的描述,包括以下定义。

  本文所用的术语“真菌”是指包括真核生物中任意成员,其包括单细胞微生物(例如但不限于酵母和霉菌)以及产生称为蘑菇的熟知的子实体形式的多细胞真菌。更具体地,其是丝状真菌或霉菌,例如但不限于棘孢曲霉、土曲霉、温特曲霉、茄腐镰孢菌、扩展青霉和马尔尼菲青霉菌。

  本文中“次生代谢物(SM)”是指不参与初级代谢的化学化合物,因此与更常见的大分子如蛋白质和核酸不同。来自多种真核生物包括真菌的数千种SM已被描述(Donadio,S.,et al.,Nat.Prod.Rep.,2007,24,1073-1109)。

  本文中“SM基因簇或途径”是指一组生物合成基因,其包含编码次生代谢物合成和活性所需的蛋白质例如但不限于酶的多核苷酸序列。SM基因簇或途径可实现起始化合物(例如但不限于底物)转化为最终化合物或NP。

  本文中术语“完整或全长SM基因簇或途径”是指含有一整套生物合成基因和调控元件的SM基因簇或途径。每种真菌基因组可含有50或更多种不同的完整的SM基因簇,其大小在20kb至超过100kb(Nordberg,H.et al.,Nucleic Acids Res.,2014,42(Database issue),D26-31)。真菌SM簇通常包含一种或多种骨架基因,例如聚酮合成酶(PKS)、非核糖体肽合成酶(NRPS)、二甲基烯丙基色氨酸合成酶(DMAT)和萜烯环化酶(TC)),其被修饰酶包括但不限于氧化还原酶、加氧酶、脱氢酶、还原酶和转移酶的基因包围(Keller,N.P.and Hohn,T.M.,Fungal Genet.Biol.1997,21,17-29;Walton,J.D.,Fungal Genet.Biol.,2000,30,167-171)。

  本文中“调节元件”是指控制或影响基因(例如来自基因盒、遗传构建体或FAC载体的大的多核苷酸插入片段中的基因)表达的核酸序列元件。调节元件可以是例如但不限于启动子、增强子、转录因子或控制序列、翻译调控序列、时间或组织特异性调节元件、多腺苷酸化信号序列、5'或3'UTR、抑制子或终止子。调节元件可以与本文所述由FAC构建体或载体表达的大片段多核苷酸插入物或完整的SM基因簇同源或异源。当本文所述的FAC载体存在于细胞例如异源构巢曲霉细胞中时,调节元件可以相对于细胞是天然存在、内源的、外源的和/或工程化的。

  本文中与两个核酸末端相关的“相容的”表示两个末端都是平端或含有互补单链突出端,例如通过机械剪切DNA然后进行DNA末端修复、DNA接头连接或限制性内切核酸酶消化后产生的末端。至少一个末端可以含有5'磷酸基团,这可允许通过双链DNA连接酶连接末端。

  本文中“BstXI接头”(Klickstein,LB和Neve,RL,Current Protocols in Molecular Biology,John Wiley&Sons,Inc.1991,5.6.1-5.6.10)是指可相互退火以产生具有与上述BstXI酶切序列的一端互补的突出端的双链DNA分子的两条部分互补的DNA链。可用于连接大DNA片段的平末端的BstXI接头的实例如下:

  BstXI接头上链(TOP)5’-CTGGAAAG-3’(SEQ ID NO:5)。

  BstXI接头下链(Bottom)5’-CTTTCCAGCACA-3’(SEQ ID NO:6)。

  BstXI接头的平末端可以设计成与大DNA片段互补。例如,目标大DNA片段可以是机械剪切的DNA,其被DNA末端修复酶混合物(Intact Genomics,St.Louis,MO)补充并形成平末端。平末端DNA也可以通过Taq聚合酶对目标大片段DNA的每个末端非模板介导地添加单个A核苷酸来修饰。该情况下,上述接头可以通过在BstXI接头上链的3'端添加单个T核苷酸进行修饰。

  “穿梭细菌人工染色体(BAC)载体”是指可用于从一种(或多种)供体细菌种类或菌株到一种或多种宿主生物或菌株或种类转移并保持遗传信息的BAC载体。

  本文中“FAC载体”是指真菌人工染色体载体或大肠杆菌和构巢曲霉之间的穿梭BAC载体。

  本文中“文库”是指各自包含插入序列和载体的多个克隆。

  方法

  本文描述的方法和组合物利用本领域技术人员熟知的实验室技术,并且可以在实验室手册中找到,例如Sambrook,J.,et al.,Molecular Cloning:A Laboratory Manual,3rd ed.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,2001;Spector,D.L.et al.,Cells:A Laboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1998;Nagy,A.,Manipulating the Mouse Embryo:A Laboratory Manual(Third Edition),Cold Spring Harbor,NY,2003and Harlow,E.,Using Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1999。除非上下文另有说明,本说明书和任何所附权利要求中所使用的单数形式“一”、“一个”和“该”也旨在包括复数形式。

  以下材料和方法也用于本发明教导的多个方面。

  本发明的教导提供了从真菌制备超高质量的高分子量(HMW)基因组DNA,并通过随机剪切生成平均插入片段大小为100kb或更大的非偏倚大插入片段FAC文库。文库的大片段DNA群不仅包括真菌基因组中具有最小偏倚的所有生物合成基因座片段,而且每个DNA分子足够大(100kb或更大)以覆盖至少一个完整的SM基因簇。

  高分子量(HMW)基因组DNA可来自任何培养的、分离的、纯化的或混合的真菌,包括已公开基因组序列的真菌。HMW基因组DNA可以直接从其自然栖息地、环境或生物质制备,而不需要分离和培养真菌。

  用于BAC克隆的HMW基因组DNA的制备技术已有报道(Wu,C.C.,et al,Encyclopedia of Molecular Cell Biology and Molecular Medicine Volume 3(2nd Edition),Edited by Meyers R.A.,Wiley-VCH Verlag GmbH:Weinheim,Germany 2004,pp385-425;Zhang,M.,et al.,Nat.Protoc.,2012,7:467-478)。在一些配置中,HMW基因组DNA可以包括完整的染色体,或者可以是百万碱基大小。

  为制备HMW基因组DNA,可收集真菌细胞例如但不限于孢子、发芽孢子、原生质体或细胞核,并将其直接包埋在低熔点琼脂糖胶塞(plug)中。低熔点琼脂糖胶塞的浓度可以为约0.4%至约1%,并且可以具有约0.5%的终浓度。HMW基因组DNA可以通过用0.5M EDTA(pH 9.0)中的月桂基肌氨酸和蛋白酶K处理进行纯化。HMW基因组DNA可以通过制备真菌原生质体(Bok,J.W.and Keller,N.P.,Methods Mol.Biol.,2012,944,163-174),然后将真菌原生质体包埋在低熔点琼脂糖胶塞中来制备。

  HMW基因组DNA可用于产生非偏倚大片段插入重组DNA文库以覆盖大的完整SM基因簇,其中一个克隆含有完整的SM基因簇或途径。本发明教导提供了通过电洗脱或琼脂酶消化琼脂糖DNA胶塞来制备液体HMW基因组DNA。然后可以通过水剪切、重复移液、低速涡旋或其组合机械剪切液体HMW基因组DNA。用于给定真菌基因组的条件可以通过在CHEFF凝胶上运行剪切的HMW基因组DNA(其大小范围为约100kb到约300kb)来确定。

  本文公开的大肠杆菌-真菌穿梭BAC载体或FAC(图1)载体(参见实施例1)可用于具有100kb或更大的平均插入片段的BAC/FAC文库构建。本发明人已经证明,大插入片段FAC(至少150kb)可以穿梭到异源的构巢曲霉宿主中用于稳定保持和NP发现(图3,Bok,J.W.,et al.,BMC Genomics,2015,16,343)。

  用于构建非偏倚FAC文库的随机剪切BAC克隆法

  HMW基因组DNA按照方法所述进行剪切。向400μl剪切的HMW基因组DNA(100~300kb)中加入5μl DNA末端修复酶混合物(Intact Genomics,St.Louis MO)、100μl 5×DNA末端修复缓冲液至总共500μl。通过用宽口吸头轻轻吹吸将样品充分混合,并将反应物在室温下孵育30分钟。将大片段DNA末端修复反应在70℃孵育15分钟以热杀死DNA末端修复酶。将100μM BstXI接头上链和下链(接头比大片段DNA分子的摩尔比率过量106~107倍)分别加入20μl、加入61μl含ATP的10×T4连接缓冲液和10μl大片段DNA T4连接酶(Intact Genomics),然后使用宽口吸头轻轻吹吸将反应物混合均匀。接头连接反应在室温放置3-8小时。将连接接头的大DNA片段分级,并且通过1%琼脂糖CHEFF凝胶在0.5×TBE、6V/cm、90s/90s电泳16小时,4V/cm、5s/5s另外电泳8小时除去过量的BstXI接头。使用λDNA梯度标记物(Intact Genomics)作为对照,回收100~150kb、150~210kb、210~300kb大DNA片段凝胶切片,然后将凝胶切片置于透析管中,将DNA电洗脱,然后将纯化的接头连接的大DNA片段用100ml冰冷和高压灭菌的超纯水透析至少3次,每次1小时。将克隆就绪的BstXI-FAC载体(20ng/μl,Intact Genomics)与凝胶纯化的连接BstXI-接头连接的DNA(2~3ng/μl)以1:3摩尔比混合,并将连接反应置于16℃过夜。例如,将200μl大片段DNA(3ng/μl)与10μl FAC载体(20ng/μl)、60μl 5×T4连接缓冲液、30μl BAC克隆T4连接酶(Intact Genomics)混合,连接反应物置于16℃过夜,优选12~18小时。

  大插入片段FAC文库构建

  将文库的大DNA片段克隆到FAC载体中,作为大肠杆菌中覆盖真菌SM基因簇或途径的筛选文库。优选地,大片段插入FAC文库具有100kb或更大的平均插入片段,因此每个FAC克隆中包含至少一个完整的SM基因簇是足够的。此外,大片段插入FAC文库是非偏倚的,并且只有10×甚至5×基因组覆盖的FAC文库足以从测序的真菌基因组或真菌样品中捕获整套完整的SM基因簇。使用本文所述的方法,发明人可以从研究的所有6种真菌中使用4~5个384孔板的FAC克隆(平均约100kb,4~5x基因组覆盖)捕获整套完整的SM基因簇(表1;Bok,J.W.,et al.,BMC Genomics,2015,16,343)。

  因为FAC系统是穿梭BAC系统,本发明教导的载体可用于本领域已知的BAC/fosmid文库筛选技术中。为鉴定含有完整SM基因簇的FAC克隆,基于序列的方法可用于FAC文库筛选,如PCR或菌落杂交(Zhang,H.B.and Wu,C.C.,Plant Physiol.Biochem.,2001,39,1-15;Kang,H.S.and Brady,S.F.,Angew.Chem.Int.Ed.Engl.,2013,52,11063-11067)。基于序列的方法的一个应用涉及从已知基因或蛋白质家族的保守区域设计DNA探针或引物,例如但不限于使用设计用于扩增PKS或NRPS保守结构域/区域的简并引物筛选来自每种阵列文库的合并的FAC DNA(Kang,H.S.and Brady,S.F.,Angew.Chem.Int.Ed.Engl.,2013,52,11063-11067)。可通过PCR筛选相应的库(pool),然后筛选鉴定他们的板、列和行,从文库中回收阳性FAC克隆。另一种基于序列的方法是通过具有复用条形码的板-列-行高通量下一代测序合并的FAC文库。这种策略可以将整个真菌基因组的序列复杂度降低到FAC库水平(板-列-行),从而能够完整组装合并的FAC克隆(每个100kb或更大)。完整的SM基因簇将通过完全测序和组装的FAC克隆的注释来鉴定。然后,含有单个SM基因簇的FAC克隆将通过条形码和板-列-行坐标简化。这些基于序列的方法的优点是在没有预处理不可培养的真菌群落的基因组序列甚至宏基因组的情况下,可从真菌中鉴定SM基因簇及其FAC。在本发明教导中,使用另一种基于序列的方法通过传统的Sanger测序方法对FAC克隆末端测序,然后通过将FAC末端序列与真菌参考基因组序列比对来鉴定含整套完整的含SM基因簇的FAC。类似地,下一代序列方法可以用于此目的,用FAC DNA合并和条形码以降低测序成本。

  微生物菌种和培养条件

  通过LO4641(riboB2,pyroA4,ΔST::AfpyrG,ΔAN7909::afpyrG,Δnku70::argB,veA1)和RJW113.5(ΔveA::argB,pyrG89)之间的有性杂交获得亲本菌株RJW256(pyrG89,pyroA4,Δnku70::argB,ΔST::afpyrG,veA1)。用FAC质粒转化RJW256产生FAC重组菌株。ΔST::AfpyrG表示从构巢曲霉中去除了整个内源的杂色曲霉素基因簇。

  对于抗菌活性测试,我们使用A.nidulans RDIT9.32、A.fumigatus 293、Candida albicans、Pseudomonas aeroginosa PAO1、Bacillus cereus U85和Micrococcus luteus菌株。所有真菌和细菌菌株以冷冻甘油储液保持在-80℃。真菌菌株在37℃在葡萄糖基本培养基(GMM,Bok,J.W.and Keller,N.P.,Eukaryot.Cell,2004,3,527-535)上生长,细菌菌株在胰蛋白酶大豆肉汤培养基上培养。构巢曲霉转化和回收含SM簇的FAC

  应用改良的基于PEG-钙的转化方法以改进转化。所述方法(Bok,J.W.and Keller,N.P.,Eukaryot.Cell,2004,3,527-535)改良如下:将200μL含107A.nidulans RJW256原生质体与2μg FAC DNA混合温和放置在1.5mL离心管中200μL的30%PEG 4,000与50mM CaCl2上。将含有原生质体的离心管在冰上孵育30分钟。将孵育的混合物以250×g离心5分钟后,使用自动吹吸轻轻混合溶液。然后将该混合物在室温孵育10分钟,然后加入1mL山梨醇-Tris-HCl-CaCl2(STC:1.2M山梨醇、10mM Tris-HCl、10mM CaCl2、pH7.5)缓冲液并将其轻轻混入溶液中。将混合物转移到13mL管中后,再向管中加入5mL STC并轻轻混合。将1mL该最终溶液分配到再生培养基上以获得转化子。

  构巢曲霉FAC转化子在培养板上保持三代,用于表型和化学筛选。为FAC回收,我们由构巢曲霉FAC菌株制备~0.3mL的106/mL原生质体,通过常用碱裂解法分离FAC DNA,并将其重悬于10μL TE中。将1μL回收的DNA重新转化进入大肠杆菌细胞(BAC细胞,Intact Genomics)。

  真菌基因组DNA提取

  使用先前描述的技术(Bok,J.W.and Keller,N.P.,Methods Mol.Biol.,2012,944,163-174)从冻干菌丝体中提取真菌DNA以进行PCR反应。

  抗菌筛选

  使用盘扩散法(Bauer 1966)进行抗生素活性引导的筛选。将每种构巢曲霉FAC菌株的一个板接种在固体GMM上,并在37℃孵育7天。随后,收集板的全部内容物并冻干48小时。然后将样品用研钵和研杵粉碎,然后加入10mL甲醇。将空气干燥的甲醇提取物溶于150μL甲醇中进行活性测试。如前所述(Bok,J.W.和Keller,N.P.,Eukaryot.Cell,2004,3,527-535)进行抗细菌测定的培养基制备。对于抗真菌测定,将上述部分中提到的106个孢子埋入5mL软GMM琼脂(0.75%琼脂)中并覆盖在固体GMM上。对于每个测定,将上述150μL甲醇提取物中的10μL加载到1cm直径的纸盘上。将测定板在37℃孵育24-48小时,并观察抗菌活性。

  LC-HRMS测定

  将五块板的构巢曲霉FAC菌株例如但不限于AtFAC6J7,接种在固体GMM上,并在37℃孵育7天。随后,将板的全部内容物收集并冻干48小时。然后将样品用研钵和研杵粉碎,然后加入10mL甲醇。然后将空气干燥的甲醇提取物用有机溶剂(氯仿:甲醇:乙酸乙酯=8:1:1)进一步提取。将有机提取物蒸发至干燥,并在-20℃储存直到测定。

  将所得有机提取物重新悬浮于甲醇中至终浓度为2μg/μL。对于每个测定,将40μg样品加载到 C18柱(150mm×2mm,3μm粒径)(Phenomenex,Torrance,CA)上。使用1150LC系统(Agilent,Santa Clara,CA)以200μL/min的流速进行色谱。使用以下梯度(缓冲液A:含0.1%甲酸的水,缓冲液B:含0.1%甲酸的乙腈):时间0分钟,2%B;35分钟,70%B;54分钟,98%B。过柱后使用1:7分流,以25μL/min的流速被引导到质谱仪。使用Q-EXACTIVETM质谱仪(Thermo Fisher Scientific,Waltham,MA)进行MS测定,设置如下:毛细管温度275℃、鞘气4(任意单位)、喷射电压4.2kV。在35,000分辨率获得全部MS光谱,所有样品质量范围m/z 200至1500。在每次完整的MS扫描之后,选择前5个最强的离子进行依赖的MS2扫描。MS2使用更高能量的碰撞解离(HCD)进行,标准化的碰撞能量为30%。制备了AtFAC6J7提取物的三个生物重复,并以技术重复进行测定,然后进行以下数据处理。

  数据分析、信息学和软件

  SIEVE软件套件(Thermo Fisher Scientific,Waltham,MA)用于在小分子LC-HRMS期间电喷雾产生的离子的组分检测和相对定量。组分检测使用10百万分率(ppm)的质量公差和2.5分钟的保留时间窗口。选择最小强度5×106作为确定组分峰值的阈值。对于每种组分,产生选定的离子色谱图,并计算峰的积分强度。基于总离子电流对峰面积进行归一化。为了增加统计强度和最终测定的可靠度,本发明采用的程序包括多重假设检验的诱饵方法。具体地说,将重复数据AtFAC6J7进行唯一性过滤,对照从含有空载体的对照组菌株以及含有多种具有独特遗传组分的其他FAC的其它13个菌株产生的LC-HRMS数据。为了去重复,所有组分都是通过含有构巢曲霉产生的已知真菌代谢物的目标精确的质量数据库进行搜索,使用质量公差3ppm。几乎所有样品中,已有十几种已知化合物以一致的水平存在,并经监控以快速识别高度扰动的系统。还对所有成分进行了全面的精确质量数据库的搜索,该数据库含有超过13,000个已知真菌次生代谢产物。该真菌数据库是使用Antibase(2011),“天然产物词典”(2013)以及文献(Caboche et al.2008;Andersen et al.2013)中发现的其他真菌天然产物制备的。

  载体综合描述

  BstXI接头突出端不与自身互补,BstXI酶切载体(上述)也不与自身互补。连接接头的大DNA片段和载体连接后,优选的连接反应产物是包含一个载体与一个大DNA片段通过单一接头在每个末端连接的圆形物。可将该分子转化到宿主细胞中以产生克隆。

  实施例

  本发明教导包括实施例中提供的描述,其不旨在限制任何权利要求或方面的范围。除非以过去时态特别提出,否则实例可以是预测或实际的例子。提供以下非限制性实施例以进一步说明本发明的教导。鉴于本公开,本领域技术人员应理解可以在所公开的具体实施方案中进行许多改变,仍可获得相近或相似的结果,而不脱离本发明教导的精神和范围。

  实施例1

  本实施例描述了pFAC质粒,其是可在构巢曲霉中保持额外染色体的本发明教导的载体。

  本发明教导中,FAC载体(pFAC,图1A,SEQ ID NO:7)是基于BAC的穿梭载体,其可在大肠杆菌和构巢曲霉宿主之间穿梭大片段DNA。在大肠杆菌中保持质粒需要几个特征,包括两种大肠杆菌复制起点:oriS和oriV。第一种复制起点oriS来自低拷贝F质粒,可用于基于BAC的大片段DNA克隆和文库构建。第二种复制起点oriV是诱导型高拷贝复制起点oriV,其在含有TrfA基因的大肠杆菌(当其在含阿拉伯糖培养基上生长时)中生长、在阿拉伯糖启动子控制下时,其可以产生更高产量的大插入片段。pFAC还含有氯霉素抗性基因(cat)用于质粒选择。为克隆目的,质粒含有大的DNA克隆位点,其包含彼此相邻方向相反的一对BstXI位点。当用BstXI消化时,该配置产生一对相同的BstXI突出端,其不自身互补,而是与独特的BstXI接头互补。因此,消化的载体将不会自身复连接,接头也不会轻易连接。将两种I-SceI归巢限制性位点以相反方向插入BstXI克隆位点的侧翼。这些位点利于清除克隆的大DNA片段,并与pFACint克隆载体进行交换(参见实施例2)。

  pFAC还包含在构巢曲霉中使用所需的特征。其包括第三复制起点AMA1,可在曲霉菌属中自主保持(AMA1,SEQ ID NO:8)。该序列是保持大的完整SM途径作为额外染色体元件或FAC所必需的。pFAC还含有真菌选择标记基因,即乳清苷-5'-磷酸脱羧酶基因(来自寄生曲霉的pyrG,SEQ ID NO:9和10)。

  实施例2

  本实施例描述了pFACint,FAC整合载体。

  FAC整合载体(pFACint,图1B,SEQ ID NO:11)是可以在大肠杆菌和构巢曲霉宿主之间穿梭大片段DNA的基于BAC的穿梭BAC载体。在大肠杆菌中保持质粒需要数个特征,包括两种大肠杆菌复制起点:oriS和oriV。第一种复制起点oriS来自低拷贝F质粒,可用于基于BAC的大片段DNA克隆和文库构建。第二种复制起点oriV是诱导型高拷贝复制起点oriV,其在含有TrfA基因的大肠杆菌(当其在含阿拉伯糖培养基上生长)中生长、在阿拉伯糖启动子控制下时,其可以产生更高产量的大插入片段。pFACint携带卡那霉素抗性基因(kan)作为选择标记基因。为克隆目的,质粒含有大的DNA克隆位点,其包含彼此相邻方向相反的一对BstXI位点。当用BstXI消化时,该配置产生一对相同的BstXI突出端,其不自身互补,而是与独特的BstXI接头互补。因此,消化的载体不会自身连接,接头也不会轻易连接。将两种I-SceI归巢限制性位点以相反方向插入BstXI克隆位点的侧翼。这些位点利于清除克隆的大DNA片段,并与pFAC克隆载体交换。I-Sce-I归巢限制性位点还有助于从异源宿主构巢曲霉的的基因组整合位点清除大的完整的SM基因途径。

  pFACint还包含将质粒整合到构巢曲霉基因组中的特征:1,000bp的3'trpC(SEQ ID NO:12)和1,007bp的5'-tpC(SEQ ID NO:13)同源序列,其以相同方向插入I-Sce I限制性位点侧翼,从而使得大的pFACint克隆真菌位点特异性整合到构巢曲霉trpC基因中,其编码与聚酮化合物同源的多肽。该质粒还含有真菌选择标记基因,即乳清苷-5'-磷酸脱羧酶基因(pyrG,来自寄生曲霉)。

  实施例3

  本实施例描述pFACdual载体。

  pFACdual质粒,其基本上与pFAC质粒相对应,除了它包括另外的基因盒:attP位点和真菌密码子优化的phi31整合酶基因,其在真菌诱导型启动子如alcA(p)的控制下。因此,大片段DNA pFACdual克隆通常保持为FAC,并且还可以在需要时整合到真菌基因组的attB位点。

  pFACdual载体是真菌双功能载体(pFACdual,图1C,SEQ ID NO:14),且可作为真菌人工染色体和诱导型真菌基因组整合载体,或者可用作大肠杆菌-构巢曲霉穿梭BAC载体。pFACdual具有与pFAC相似的特征(参见实施例1),但是pFAC dual具有另外的基因盒:attP位点和真菌密码子优化的phi31整合酶基因(SEQ ID NO:16和SEQ ID NO:17),其受诱导型alcA真菌启动子(alcA(p),SEQ ID NO:15)的控制。因此,大片段DNA pFACdual克隆通常保持为FAC,但可以诱导整合入真菌基因组的attB位点。

  实施例4

  本实施例示出了高分子量A.wentii DNA的制备。

  温特曲霉菌株DTO 134E9用于概念证明。比较不同的真菌种类/菌株起始材料,以测试高分子量(HMW)基因组DNA的质量:孢子、发芽孢子、原生质体或从原生质体获得的胞核。原生质体制备方法如前所述(Bok,J.W.and Keller,N.P.,Eukaryot.Cell,2004,3:527-535)。为了分离胞核,用HMW DNA制备缓冲液(0.5M蔗糖、80mM KCl、10mM Tris、10mM EDTA、1mM亚精胺、1mM精胺、pH9.4)中的0.5%Triton X-100裂解原生质体。原生质体在缓冲液中轻轻混合,在冰上孵育30分钟,并以1,800×g离心20分钟沉淀得到细胞核。为了制备HMW DNA的低熔点琼脂糖胶塞,将胞核的沉淀(~5×108)、原生质体、发芽孢子或孢子用HMW DNA制备缓冲液重悬至总体积为0.6mL,然后在45℃时向所述缓冲液中加入等体积1%低熔点琼脂糖至总体积为1.2mL。这在4℃固化后足以制成10个胶塞(每个胶塞约100μL)。然后将胶塞在1mL裂解缓冲液/胶塞:0.5M EDTA、pH 9.0,1%月桂基肌氨酸、1mg/mL蛋白酶K中,在50℃孵育48小时。最后,将胶塞在10-20体积的下述缓冲液中彻底洗涤,每次洗涤1小时:缓冲液1(0.5M EDTA、pH 9.0-9.3,50℃)洗涤1次,缓冲液2(0.05M EDTA、pH8.0,冰上)洗涤1次,用缓冲液3(冰冷TE加0.1mM苯甲基磺酰氟(PMSF),冰上)洗涤3次,用缓冲液4(冰冷的TE,冰上)洗涤3次,最后将所有胶塞在4℃储存于TE中。为了估计提取的DNA的大小和产量,使用脉冲场凝胶电泳(PFGE)(Bio-Rad CHEF Mapper,Hercules,CA)评估胶塞。HMW基因组DNA的最终质量检查条件为6V/cm,10秒至1分钟的切换时间,在14℃下PFGE进行12-16小时,同时使用适当的HMW尺寸标记物(Zhang,M.et al.,Nat.Protoc.,2012,7,467-478)。从原生质体制剂获得最高质量和数量的HMW基因组DNA(图2A)。图2A示出了包含大于50 kb但主要是Mb大小的DNA片段的A.wentii HMW基因组DNA的CHEF凝胶。

  实施例5

  本实施例示出A.goii DNA的非偏倚穿梭BAC文库的构建。

  从实施例2的原生质体制剂获得的HMW基因组DNA范围为50~>1,000kb(主要是Mb大小的片段)。使用DNA末端修复酶试剂盒(Intact Genomics)对来自3个胶塞的HMW DNA进行末端修复,总体积为500μL,含10μL末端修复酶,然后将所述末端修复酶加热失活(70℃,15分钟)。将得到的DNA用BstXI接头(每个100μM,10μL),10μL连接酶(2U/μL,完整基因组)进行连接,总体积为700μL。将100至200kb的凝胶分级的DNA片段通过PFGE纯化。将纯化的大DNA片段(约100μL,1-3ng/μL)在16℃下连接进入适于克隆的BAC BstXI穿梭载体(pFAC),历时约18小时。然后,将连接的DNA混合物电穿孔到电穿孔感受态大肠杆菌细胞(BAC细胞,Intact Genomics)。使用小规模连接和转化(每20μL细胞1μL DNA)来判断克隆效率。确定大约50个BAC克隆的插入片段大小,并使用CHEF凝胶电泳和NotI消化随机选择的pFAC载体中的BAC克隆,证实其包括约100kb的插入片段。图2B显示平均插入尺寸估计为~100kb(M,λ梯度标记物)。一旦确定了连接的DNA适用,即进行大规模的连接和转化,以获得至少7680个菌落用于菌落挑选(20×384孔板)以构建非偏倚穿梭BAC文库。

  实施例6

  本实施例示出BAC/FAC末端测序,并选择含SM簇的候选FAC克隆。

  通过Sanger BigDye测序方法完成了来自温特曲霉的非偏倚随机剪切FAC文库中1536个克隆的BAC末端测序。Phred软件用于碱基读取和序列修整。使用DNAStar SeqMan Pro软件包进行载体屏蔽。通过BLAST组装基因组(NCBI)将BAC末端序列与A.wentii参考基因组序列比对。基于位于SM簇一个末端的侧翼的FAC末端序列,和位于相同SM簇另一末端的侧翼的另一FAC末端序列,成功鉴定了全部47个含SM簇的候选FAC克隆。

  实施例7

  本实施例示出构建温特曲霉DNA的非偏倚穿梭BAC文库及在构巢曲霉中异源表达SM簇作为FAC。

  温特曲霉用作穿梭BAC DNA文库构建的实例,并且其具有完整测序的、含有47个注释的SM基因簇的基因组(Cerqueira,G.C.,et al.,Nucleic Acids Res.,2013,42(Database issue),D705-D710)。高分子量基因组DNA从A.wentii制备(见实施例4),并且非偏倚FAC文库(见实施例5)的构建导致温特曲霉基因组的~20×基因组覆盖,或总共7,680个FAC克隆,平均插入片段大小为100kb(图2A-B)。将FAC文库排列到384孔板中,对1536个FAC克隆的两端进行测序。使用这些末端序列与温特曲霉参考基因组的序列比对来鉴定含有所有47个SM基因簇的SM-BAC克隆或候选FAC(表1)。此外,A.terreus中56个SM簇中的至少10个位于端粒附近,且一些端粒序列在整个基因组序列数据库中仍然不完整。这些数据表明,这些方法通过将随机剪切的基因组DNA引入FAC载体中成功地克服了常规BAC文库构建中对端粒序列的潜在偏倚。

  实施例8

  本实施例示出了FAC的穿梭功能的验证。

  迄今为止,数百种FAC(范围从70到150kb)用于通过转化进入构巢曲霉进行异源表达和分析。为了验证FAC的穿梭功能,我们还从转化的构巢曲霉菌株中提取了15个FAC DNA中的5个,并将FAC DNA成功转化回大肠杆菌(图3)。如通过在不含尿嘧啶和尿苷的培养基上自养型回归(return of prototropy)所测定的,用不同的FAC克隆转化构巢曲霉。然后从FAC的回收评估了40或更多的大肠杆菌菌落,分别见图3A-C。结果示出了从所有3种构巢曲霉转化体的FA C回收的实例,所述转化体分别为:AtFAC9O3(~100kb)、AtFAC9A23(~80kb)和AtFAC7A10(~90kb)。凝胶左侧的第二和第三(D)泳道是用于转化构巢曲霉的对照FAC。所有回收的FAC用NotI消化,没有观察到显著的大突变。M,λ梯度标记物。这第一次证明了AMA1在支持至少150kb的大片段DNA构建体在构巢曲霉中的自主复制(FAC)的能力。本发明人及其合作者第一次证明FAC系统可在构巢曲霉中染色体外复制至少150kb(Bok,J.W.,et al.BMC Genomics,2015,16,343)。

  实施例9

  本实施例示出了LC-HRMS连接的FAC SM发现。

  为通过FAC进行SM化合物的初始鉴别和结构鉴定,按照方法部分所述制备构巢曲霉AtFAC9D19菌株样品。已发现构巢曲霉AtFAC9D19可产生杀虫剂化合物:alantrypinone、serantrypinone、alantrypinene B、alantryleunone。构巢曲霉AtFAC6J7菌株也被选择用于初步概念验证实验,因为它含有与烟曲霉菌中最近表征的hexadehydroastechrome簇高度同源的簇(Yin,W.B.,et al.,ACS Synth.Biol.,2013,2,629-634)。AtFAC6J7包含在相应的烟曲霉菌簇中发现的8个基因中的7个。不存在于土曲霉菌簇中的基因hasG,编码FAD结合蛋白,负责将异戊烯基转化为甲基丁二烯基侧链以由astechrome产生hexadehydroastechrome。通过LC-HRMS测定构巢曲霉AtFAC6J7转化体和对照构巢曲霉的有机提取物,鉴定AtFAC6J7代谢物。数据采集后,采用Sieve软件进行组分检测和相对定量分析(见方法)。比较AtFAC6J7提取物与对照样品提取物(野生型及其他FAC菌株)时,仅存在于AtFAC6J7提取物中的化合物经精确质谱(0.3百万分率误差)和串联质谱法(MS/MS或MS2)鉴定为terezine D。terezine D是astechrome生物合成的稳定中间体(Watanabe,T.,et al.,Bioorg.Med.Chem.,2009,17,94-111;Bok,J.W.,et al.BMC Genomics,2015,16,343)。

  实施例10

  本实施例示出了针对FAC克隆的抗生素活性测试。

  进行14个FAC克隆的抗生素活性测试。由在GMM板上37℃培养7天的FAC转化体中提取的150μl甲醇提取物中的10μl装载在小盘(直径:1cm)上,用于对曲霉属spp.、白色念珠菌(Candida albicans)、蜡样芽孢杆菌(Bacillus cereus)、滕黄微球菌(Micrococcus luteus)和绿脓假单胞菌(Pseudomonas aeruginosa)的抗菌活性测试。使用两种FAC提取物观察对蜡样芽孢杆菌的抗生素活性(Bok,J.W.,et al.BMC Genomics,2015,16,343)。

  实施例11

  本实施例说明FAC重组工程和活化沉默SM基因簇。

  Red/ET 工具用于阐明来自土曲霉FAC AtFAC9J20的苯并锦葵色素苷(benzomalvin)的生物合成。使用NIH BAC重组工程工具和Red/ET同源重组,从FAC克隆AtFAC9J20(102.715kb)产生两个较小尺寸的构建体(33.372kb AtFAC9J20Δ#1和68.988kb AtFAC9J20Δ#2)。我们还删除了苯并锦葵色素苷簇中的5个基因(AtFAC9J20ΔMtase、AtFAC9J20ΔNRPS1、AtFAC9J20ΔNRPS2、AtFAC9J20ΔNRPS3和AtFAC9J20ΔPKS),以获得另外的5个FAC突变构建体,其有助于有效和高效地精确地阐明苯并锦葵色素苷的生物合成途径。

  为激活FAC AtFAC7O19中低表达的SM基因簇,我们成功地将真菌强启动子gpdAp插入到该簇中的转录因子(TF)基因起始密码子“ATG”之前。FAC重组工程分两步进行。本发明人插入galK基因并在加氯霉素和半乳糖的基本培养基上选择Gal+菌落放,然后通过在含氯霉素、2-脱氧半乳糖和甘油的基本培养基上反向筛选galK-菌落以用gpdA启动子替换galK。8项试验中有8项产生了FAC突变构建体。

  进行融合PCR(图4A)以将选择标记(例如KanR或galK基因)和启动子(gpdA(p)或任意遗传元件)组合为一个PCR产物用于FAC重组工程。将强真菌启动子gpdAp插入到具有卡那霉素抗性基因的FAC AtFAC7O19中SM簇基因中的ATG起始密码子之前。融合PCR反应示例于图4A(H1和H2,分别为同源序列1和2;cat,氯霉素乙酰转移酶基因;FAC,复制起点)。为了构建Kan基因和gpdA启动子的融合PCR产物,使用的引物是:38TF-Kan-左末端F(5’-TGGGACTTTGTCGCTCACGATTCGCCGAGTTGTATGGGCTGACCAGTGACcgacctgcagcctgttga-3’,SEQ ID NO:1)和Kan-左末端R(5’-GGTGCCCCAAGCCTTGGATCCGTCGAGGCTGATCAGCGAgctc-3’,SEQ ID NO:2);gpdA-右末端F(5’-TCGCTGATCAGCCTCGACGGATCCAAGGCTTGGGGCACCtgcgtt-3’,SEQ ID NO:3)和38TF-gpdA-右末端R(5’-TCCTCATGAATTAGATGGTTAGATGGACCTACCATCAGGATAGGTTCC ATtgtgatgtctgctcaagcggg-3’,SEQ ID NO:4)。一步靶向事件的结果是通过在含有卡那霉素和氯霉素的LB培养基上选择将gpdAp相邻的组成型活性Kan抗性基因插入FAC上确定的位置,用于保持工程化FAC。插入kan-gpdAp选择盒后,通过PCR确认融合PCR插入然后进行7个克隆的FAC DNA的NotI限制性分析,如图4B中凝胶所示。第一条泳道是未经修饰的FAC AtFAC7O19DNA,其作为对照纳入。所有测试的克隆显示相同的模式,具有预期的插入,但在脉冲场凝胶上没有明显的突变。M,Lambda梯度标记物。细菌现有表型为Kan+。

  使用修改的RED/ET工具进行重组的实例包括用galK选择盒分别缺失AtFAC9J20的5个基因。图5显示了来自4个克隆的FAC微量制备DNA的NotI限制性分析,每个克隆经PCR验证(M,λ梯度标记物)。第二到最后一个泳道包含未经修饰的AtFAC9J20DNA,其作为对照纳入。AtFAC9J20含有2个SM基因簇。5个基因,同一簇的全部成员,是1.239-kb Mtase(二甲基烯丙基色氨酸N-甲基转移酶)基因、3.334-kb NRPS1基因、7.284-kb NRPS2基因、7.815-kb NRPS3基因和7.741-kb PKS基因。每组4个测试克隆显示相同的模式,因此具有预期的缺失。通过PCR,测序或脉冲场凝胶检测,未检测到明显的突变。

  所有工程化的FAC被成功转化进入构巢曲霉宿主菌株。最初,完整FAC AtFAC9J20的异源表达鉴定了一组甲基化NRPS产物,我们成功鉴定为属于苯并锦葵色素苷(苯并锦葵色素苷A和苯并锦葵色素苷E)家族。苯并锦葵色素苷A是具有肿瘤的免疫治疗潜能的吲哚胺2,3-双加氧酶(IDO)抑制剂。通过所述FAC重组工程,我们观察到基因缺失突变体AtFAC9J20ΔNRPS1和AtFAC9J20ΔNRPS2中NRPS产物的信号平行下降10,000倍,其支持这两个NRPS直接参与生物合成。我们还观察到我们的缺失突变体中预期的生物合成前体积累。此外,在AtFAC9J20ΔMtase中非甲基化中间体的积累证实了负责NRPS定制(tailoring)的甲基转移酶的鉴定。总之,我们使用FAC技术和FAC缺失体,已经建立了已知的NRPS的生物合成,这是本领域长期的难题。这些缺失体不仅使我们看到相应的基因产物的缺失,还可积累生物合成前体。

  所有引用的参考文献以引用方式全文纳入本文。申请人保留质疑任何参考作者提交的任何结论的权利。

  表1

  覆盖完整SM基因簇/途径的经鉴别的FAC克隆

  

  表1-续

  覆盖完整SM基因簇/途径的经鉴别的FAC克隆

  

  表1-续

  覆盖完整SM基因簇/途径的经鉴别的FAC克隆

  表1-续

  覆盖完整SM基因簇/途径的经鉴别的FAC克隆

  表1-续

  覆盖完整SM基因簇/途径的经鉴别的FAC克隆

  

  表1-续

  覆盖完整SM基因簇/途径的经鉴别的FAC克隆

  表2

  SEQUENCE LISTING

  <110> Intact Genomics

  <120> 真菌人工染色体、组成、方法和用途

  FUNGAL ARTIFICIAL CHROMOSOMES, COMPOSITIONS, METHODS AND USES

  THERFOR

  <130> 1045-0749

  <150> 62/286,542

  <151> 2016-01-25

  <160> 17

  <170> PatentIn版本3.5

  <210> 1

  <211> 68

  <212> DNA

  <213> 人工序列

  <220>

  <223> 扩增引物

  <400> 1

  tgggactttg tcgctcacga ttcgccgagt tgtatgggct gaccagtgac cgacctgcag 60

  cctgttga 68

  <210> 2

  <211> 43

  <212> DNA

  <213> 人工序列

  <220>

  <223> 扩增引物

  <400> 2

  ggtgccccaa gccttggatc cgtcgaggct gatcagcgag ctc 43

  <210> 3

  <211> 45

  <212> DNA

  <213> 人工序列

  <220>

  <223> 扩增引物

  <400> 3

  tcgctgatca gcctcgacgg atccaaggct tggggcacct gcgtt 45

  <210> 4

  <211> 71

  <212> DNA

  <213> 人工序列

  <220>

  <223> 扩增引物

  <400> 4

  tcctcatgaa ttagatggtt agatggacct accatcagga taggttccat tgtgatgtct 60

  gctcaagcgg g 71

  <210> 5

  <211> 8

  <212> DNA

  <213> 人工序列

  <220>

  <223> 接头

  <400> 5

  ctggaaag 8

  <210> 6

  <211> 12

  <212> DNA

  <213> 人工序列

  <220>

  <223> 接头

  <400> 6

  ctttccagca ca 12

  <210> 7

  <211> 15684

  <212> DNA

  <213> 人工序列

  <220>

  <223> 载体

  <400> 7

  ccaccacagt gggatccgaa gcttggaatt cacgtgactt gaagtcatta ccctgttatc 60

  cctagcggcc gcactgaccc tatagtgagt cgtattaatt taaatcatac caacatggtc 120

  aaataaaacg aaaggctcag tcgaaagact ggccgcccag cttatttttt gtatactgtt 180

  ttgtgatagc acgaagtttt tccacggtat cttgttaaaa atatatattt gtggcgggct 240

  tacctacatc aaattaataa gagactaatt ataaactaaa cacacaagca agctacttta 300

  gggtaaaagt ttataaatgc ttttgacgta taaacgttgc ttgtatttat tattacaatt 360

  aaaggtggat agaaaaccta gagactagtt agaaactaat ctcaggtttg cgttaaacta 420

  aatcagagcc cgagaggtta acagaaccta gaaggggact agatatccgg gtagggaaac 480

  aaaaaaaaaa aacaagacag ccacatatta gggagactag ttagaagcta gttccaggac 540

  taggaaaata aaagacaatg ataccacagt ctagttgaca actagataga ttctagattg 600

  aggccaaagt ctctgagatc caggttagtt gcaactaata ctagttagta tctagtctcc 660

  tataactctg aagctagaat aacttactac tattatcctc accactgttc agctgcgcaa 720

  acggagtgat tgcaaggtgt tcagagacta gttattgact agtcagtgac tagcaataac 780

  taacaaggta ttaacctacc atgtctgcca tcaccctgca cttcctcggg ctcagcagcc 840

  ttttcctcct cattttcatg ctcattttcc ttgtttaaga ctgtgactag tcaaagacta 900

  gtccagaacc acaaaggaga aatgtcttac cactttcttc attgcttgtc tcttttgcat 960

  tatccatgtc tgcaactagt tagagtctag ttagtgacta gtccgacgag gacttgcttg 1020

  tctccggatt gttggaggaa ctctccaggg cctcaagatc cacaacagag ccttctagaa 1080

  gactggtcaa taactagttg gtctttgtct gagtctgact tacgaggttg catactcgct 1140

  ccctttgcct cgtcaatcga tgagaaaaag cgccaaaact cgcaatatgg ctttgaacca 1200

  cacggtgctg agactagtta gaatctagtc ccaaactagc ttggatagct tacctttgcc 1260

  ctttgcgttg cgacaggtct tgcagggtat ggttcctttc tcaccagctg atttagctgc 1320

  cttgctaccc tcacggcgga tctgcataaa gagtggctag aggttataaa ttagcactga 1380

  tcctaggtac ggggctgaat gtaacttgcc tttcctttct catcgcgcgg caagacaggc 1440

  ttgctcaaat tcctaccagt cacaggggta tgcacggcgt acggaccact tgaactagtc 1500

  acagattagt tagcaactag tctgcattga atggctgtac ttacgggccc tcgccattgt 1560

  cctgatcatt tccagcttca ccctcgttgc tgcaaagtag ttagtgacta gtcaaggact 1620

  agttgaaatg ggagaagaaa ctcacgaatt ctcgacaccc ttagtattgt ggtccttgga 1680

  cttggtgctg ctatatatta gctaatacac tagttagact cacagaaact tacgcagctc 1740

  gcttgcgctt cttggtagga gtcggggttg ggagaacagt gccttcaaac aagccttcat 1800

  accatgctac ttgactagtc agggactagt caccaagtaa tctagatagg acttgccttt 1860

  ggcctccatc agttccttca tagtgggagg tccattgtgc aatgtaaact ccatgccgtg 1920

  ggagttcttg tccttcaagt gcttgaccaa tatgtttctg ttggcagagg gaacctgtca 1980

  actagttaat aactagtcag aaactagtat agcagtagac tcactgtacg cttgaggcat 2040

  cccttcactc ggcagtagac ttcatatgga tggatatcag gcacgccatt gtcgtcctgt 2100

  ggactagtca gtaactaggc ttaaagctag tcgggtcggc ttactatctt gaaatccggc 2160

  agcgtaagct ccccgtcctt aactgcctcg agatagtgac agtactctgg ggactttcgg 2220

  agatcgttat cgcgaatgct cggcatacta atcgttgact agtcttggac tagtcccgag 2280

  caaaaaggat tggaggagga ggaggaaggt gagagtgaga caaagagcga aataagagct 2340

  tcaaaggcta tctctaagca gtatgaaggt taagtatcta gttcttgact agatttaaaa 2400

  gagatttcga ctagttatgt acctggagtt tggatatagg aatgtgttgt ggtaacgaaa 2460

  tgtaaggggg aggaaagaaa aagtcggtca agaggtaact ctaagtcggc cattcctttt 2520

  tgggaggcgc taaccataaa cggcatggtc gacttagagt tagctcaggg aatttaggga 2580

  gttatctgcg accaccgagg aacggcggaa tgccaaagaa tcccgatgga gctctagctg 2640

  gcggttgaca accccacctt ttggcgtttc tgcggcgttg caggcgggac tggatacttc 2700

  gtagaaccag aaaggcaagg cagaacgcgc tcagcaagag tgttggaagt gatagcatga 2760

  tgtgccttgt taactaggtc aaaatctgca ggtatgcttg atgttatcca aagtgtgaga 2820

  gaggaaggtc caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga 2880

  acgcatgtga gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg 2940

  ttagtacccc aatggaaagc ctgagagtcc agtggtcgca gataactccc taaattccct 3000

  gagctaactc taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg 3060

  acttagagtt acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa 3120

  cacattccta tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc 3180

  aagaactaga tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc 3240

  tctttgtctc actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc 3300

  aagactagtc aacgattagt atgccgagca ttcgcgataa cgatctccga aagtccccag 3360

  agtactgtca ctatctcgag gcagttaagg acggggagct tacgctgccg gatttcaaga 3420

  tagtaagccg acccgactag ctttaagcct agttactgac tagtccacag gacgacaatg 3480

  gcgtgcctga tatccatcca tatgaagtct actgccgagt gaagggatgc ctcaagcgta 3540

  cagtgagtct actgctatac tagtttctga ctagttatta actagttgac aggttccctc 3600

  tgccaacaga aacatattgg tcaagcactt gaaggacaag aactcccacg gcatggagtt 3660

  tacattgcac aatggacctc ccactatgaa ggaactgatg gaggccaaag gcaagtccta 3720

  tctagattac ttggtgacta gtccctgact agtcaagtag catggtatga aggcttgttt 3780

  gaaggcactg ttctcccaac cccgactcct accaagaagc gcaagcgagc tgcgtaagtt 3840

  tctgtgagtc taactagtgt attagctaat atatagcagc accaagtcca aggaccacaa 3900

  tactaagggt gtcgagaatt cgtgagtttc ttctcccatt tcaactagtc cttgactagt 3960

  cactaactac tttgcagcaa cgagggtgaa gctggaaatg atcaggacaa tggcgagggc 4020

  ccgtaagtac agccattcaa tgcagactag ttgctaacta atctgtgact agttcaagtg 4080

  gtccgtacgc cgtgcatacc cctgtgactg gtaggaattt gagcaagcct gtcttgccgc 4140

  gcgatgagaa aggaaaggca agttacattc agccccgtac ctaggatcag tgctaattta 4200

  taacctctag ccactcttta tgcagatccg ccgtgagggt agcaaggcag ctaaatcagc 4260

  tggtgagaaa ggaaccatac cctgcaagac ctgtcgcaac gcaaagggca aaggtaagct 4320

  atccaagcta gtttgggact agattctaac tagtctcagc accgtgtggt tcaaagccat 4380

  attgcgagtt ttggcgcttt ttctcatcga ttgacgaggc aaagggagcg agtatgcaac 4440

  ctcgtaagtc agactcagac aaagaccaac tagttattga ccagtcttct agaaggctct 4500

  gttgtggatc ttgaggccct ggagagttcc tccaacaatc cggagacaag caagtcctcg 4560

  tcggactagt cactaactag actctaacta gttgcagaca tggataatgc aaaagagaca 4620

  agcaatgaag aaagtggtaa gacatttctc ctttgtggtt ctggactagt ctttgactag 4680

  tcacagtctt aaacaaggaa aatgagcatg aaaatgagga ggaaaaggct gctgagcccg 4740

  aggaagtgca gggtgatggc agacatggta ggttaatacc ttgttagtta ttgctagtca 4800

  ctgactagtc aataactagt ctctgaacac cttgcaatca ctccgtttgc gcagctgaac 4860

  agtggtgagg ataatagtag taagttattc tagcttcaga gttataggag actagatact 4920

  aactagtatt agttgcaact aacctggatc tcagagactt tggcctcaat ctagaatcta 4980

  tctagttgtc aactagactg tggtatcatt gtcttttatt ttcctagtcc tggaactagc 5040

  ttctaactag tctccctaat atgtggctgt cttgtttttt ttttttgttt ccctacccgg 5100

  atatctagtc cccttctagg ttctgttaac ctctcgggct ctgatttagt ttaacgcaaa 5160

  cctgagatta gtttctaact agtctctagg ttttctatcc acctttaatt gtaataataa 5220

  atacaagcaa cgtttatacg tcaaaagcat ttataaactt ttaccctaaa gtagcttgct 5280

  tgtgtgttta gtttataatt agtctcttat taatttgatg taggtaagcc cgccacaaat 5340

  atatattttt aacaagatac cgtggaaaaa cttcgtgcta tcacaaaaca gtatacaaaa 5400

  aataagctga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat agtggctcca 5460

  agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc tccgagaacg 5520

  ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata gtgactggcg 5580

  atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat aaccaagcct 5640

  atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt gttagatttc 5700

  atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca ttaaagcttc 5760

  gacatcaccc ttacccaaac tatatccaat gagcaaagaa taacgagtca aagcgggcgc 5820

  atttttcatc acatacgagt atgcacagtc aggactccac gtcatacatc aaaaacttgg 5880

  aacgcatgag tctagctcag ctcggctctt ttccgatttt tgcgcagctt ctgttgcgga 5940

  tcttgctgct tgtggagtct atgccccggc tgatgcattg aaacacaacg cgcagatgat 6000

  ccaatcatac caaccagacg catcagcgcg tgtagctggg ggaagggtag gtggtgtagc 6060

  ccagaaagcg acacggctgg ctttcaagaa gtttatcaac cctagacagc tttggagcgg 6120

  atacccggct cttgtggcgc atagcttgcc agtgtcggcg atacagatgc ctctgtacga 6180

  gacttttcgg tatcgaattt ctgaatatag attcggagat cgagagaagg tgctagaaag 6240

  atcaagagat tatggaaaag aaacaggccc attcgacaat cggagaggct gcagcgacag 6300

  ccgcgataag tgctgcagcc tcgggcggta tagccagtgt cttgacagca cccatggata 6360

  tagtccggac acgaatcatg ctcgatgctg cagacacaac cgcacctcag aagaaaagga 6420

  tgatcaatac cgtacgggag attatacgaa cagatggccc gagaggacta ttccgagggt 6480

  gtgctatcaa cacgtttatg gccgctgtcg gatcagggtt atactttggt ctctacgaaa 6540

  gcaccaaatg gtggctaggc tcggactcga tggataatag tgccatgtta gagtaagggg 6600

  tgatgggaaa tcttgtatat aattgtgatt gtttgtacga tagtggccga ctgtacatta 6660

  gtgatacccc actcttagaa aatagaccaa tctccagctg caccttcaga caatccgggt 6720

  aaaaattctc gtctatgttg gagattggtg tgattttgaa acatgaccct tgactctgat 6780

  cttgaatatg tccatatctc gaggcaggca tattattcat atagagaggg tatcccttag 6840

  catcggtctg tcgtagtatc cgactgctga atttatgaat cgcatcatac ttgcgacata 6900

  ctgccataaa aagagtacgt atccaccact acttattgcg caccaacacg cttcaggtat 6960

  gcatcccatc cctctttctg gtaccgcttc gccgcctcca cgggatcagg agcagcataa 7020

  attccacgac cagcaatgat aaagtcggca ccgcgtccaa cagcagattc aggagtctgg 7080

  tattgctgtc ccagcttgtc tcccttcgag gagaggttga cacctgtcgt gaacacgacg 7140

  aaatcctcct cctccgaagg agagctaact tcagactgaa cctcgcccag gtgacgcgtc 7200

  gagacgaatc ccatcacaaa cttcttatac ttccgagcat agtcaacaga agaagtagta 7260

  tattgaccgg tagccaaaga tcccttggat gtcatctccg caaggatcaa aaggcccctc 7320

  tcagagccgt agggaaagtc ctcggccgaa gcagtctggg ctagagcctc gacgataccc 7380

  tcaccgggca gaatactgca gttgatgatg tgggcccact cggagatgcg cagagtgccg 7440

  ccatggtact gcttttggac tgtgtttccg atatcgatga acttgcgatc ttcgaagatg 7500

  aggaaattgt gcttctctgc aagggccttc agaccggtga tggtctcttc gctgaaatcg 7560

  gagaggatat cgatgtgagt tttgatcacg gcaatgtacg gaccgagtcc tgttaaataa 7620

  tccaccatta accattatta gatcattatg taagtggcat ccccggtgcg catacggtca 7680

  gccaaatcca gcagctcttt ggtggttgtc acgtcggccg aaacggtgac attggttttc 7740

  ttggcctcgg caacctcaaa gagcttcttt acgagggcat tggggtgctt gctagcgcgt 7800

  gcactgtagg tcaattgcga cttggaagac atgttggcga tggaggggta gcgcggggtt 7860

  ctgcaactat cgtagaaatg agcacttagt ggttgaaacc ggcttattca gtagattaat 7920

  acttgaagtt tttagtaatc agacagaata atcaggatgt ccaattacta cctcttaata 7980

  tgtggaatga atgatagata taaattgtac gacaattgcc gcgaaaaatt aaaatggatc 8040

  tatggagggg acagtcatgc actagccaca cgttcctccg cctgtggggt gagccacatg 8100

  cctcatctgg accaaacaca tcgatgcagt cacatgcaga taagattagg gcctatcctt 8160

  agggtacctg tccgcgcggg gattatgcct ggctttttgc ctgcttttga tatcctttca 8220

  aggacatagc gataagtcca accttatcgg ccataataat gtcaatgcca gcagcggctt 8280

  gggcctagaa tattccatca gctactgaac aacttctaca tcacaatttg aaagctctaa 8340

  gaattaatat agaagcactt accttcgcat tttctggtat attgttctga gatccatagg 8400

  atcagcttat cgatgataag ctgtcaaaca tgagaattcg ggccgtcgac caattctcat 8460

  gtttgacagc ttatcatcga atttctgcca ttcatccgct tattatcact tattcaggcg 8520

  tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc cccgccctgc 8580

  cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa gccatcacaa 8640

  acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat 8700

  ttgcccatgg tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa 8760

  ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta 8820

  gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac 8880

  tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg 8940

  aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc 9000

  atacgtaatt ccagatgtaa attcatcatc aggcgggcaa gaatgtgaat aaaggccgga 9060

  taaaacttgt gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg 9120

  gtctggttat aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc 9180

  cattgggata tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta 9240

  gctcctgaaa atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg 9300

  tgaaagttgg aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag 9360

  ggcttcccgg tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc 9420

  acaggtattt attcgcgata agctcatgga gcggcgtaac cgtcgcacag gaaggacaga 9480

  gaaagcgcgg atctgggaag tgacggacag aacggtcagg acctggattg gggaggcggt 9540

  tgccgccgct gctgctgacg gtgtgacgtt ctctgttccg gtcacaccac atacgttccg 9600

  ccattcctat gcgatgcaca tgctgtatgc cggtataccg ctgaaagttc tgcaaagcct 9660

  gatgggacat aagtccatca gttcaacgga agtctacacg aaggtttttg cgctggatgt 9720

  ggctgcccgg caccgggtgc agtttgcgat gccggagtct gatgcggttg cgatgctgaa 9780

  acaattatcc tgagaataaa tgccttggcc tttatatgga aatgtggaac tgagtggata 9840

  tgctgttttt gtctgttaaa cagagaagct ggctgttatc cactgagaag cgaacgaaac 9900

  agtcgggaaa atctcccatt atcgtagaga tccgcattat taatctcagg agcctgtgta 9960

  gcgtttatag gaagtagtgt tctgtcatga tgcctgcaag cggtaacgaa aacgatttga 10020

  atatgccttc aggaacaata gaaatcttcg tgcggtgtta cgttgaagtg gagcggatta 10080

  tgtcagcaat ggacagaaca acctaatgaa cacagaacca tgatgtggtc tgtcctttta 10140

  cagccagtag tgctcgccgc agtcgagcga cagggcgaag cccctggttg ccctcgccgc 10200

  tgggctggcg gccgtctatg gccctgcaaa cgcgccagaa acgccgtcga agccgtgtgc 10260

  gagacaccgc ggccggccgc cggcgttgtg gatacctcgc ggaaaacttg gccctcactg 10320

  acagatgagg ggcggacgtt gacacttgag gggccgactc acccggcgcg gcgttgacag 10380

  atgaggggca ggctcgattt cggccggcga cgtggagctg gccagcctcg caaatcggcg 10440

  aaaacgcctg attttacgcg agtttcccac agatgatgtg gacaagcctg gggataagtg 10500

  ccctgcggta ttgacacttg aggggcgcga ctactgacag atgaggggcg cgatccttga 10560

  cacttgaggg gcagagtgct gacagatgag gggcgcacct attgacattt gaggggctgt 10620

  ccacaggcag aaaatccagc atttgcaagg gtttccgccc gtttttcggc caccgctaac 10680

  ctgtctttta acctgctttt aaaccaatat ttataaacct tgtttttaac cagggctgcg 10740

  ccctgtgcgc gtgaccgcgc acgccgaagg ggggtgcccc cccttctcga accctcccgg 10800

  tcgagtgagc gaggaagcac cagggaacag cacttatata ttctgcttac acacgatgcc 10860

  tgaaaaaact tcccttgggg ttatccactt atccacgggg atatttttat aattattttt 10920

  tttatagttt ttagatcttc ttttttagag cgccttgtag gcctttatcc atgctggttc 10980

  tagagaaggt gttgtgacaa attgcccttt cagtgtgaca aatcaccctc aaatgacagt 11040

  cctgtctgtg acaaattgcc cttaaccctg tgacaaattg ccctcagaag aagctgtttt 11100

  ttcacaaagt tatccctgct tattgactct tttttattta gtgtgacaat ctaaaaactt 11160

  gtcacacttc acatggatct gtcatggcgg aaacagcggt tatcaatcac aagaaacgta 11220

  aaaatagccc gcgaatcgtc cagtcaaacg acctcactga ggcggcatat agtctctccc 11280

  gggatcaaaa acgtatgctg tatctgttcg ttgaccagat cagaaaatct gatggcaccc 11340

  tacaggaaca tgacggtatc tgcgagatcc atgttgctaa atatgctgaa atattcggat 11400

  tgacctctgc ggaagccagt aaggatatac ggcaggcatt gaagagtttc gcggggaagg 11460

  aagtggtttt ttatcgccct gaagaggatg ccggcgatga aaaaggctat gaatcttttc 11520

  cttggtttat caaacgtgcg cacagtccat ccagagggct ttacagtgta catatcaacc 11580

  catatctcat tcccttcttt atcgggttac agaaccggtt tacgcagttt cggcttagtg 11640

  aaacaaaaga aatcaccaat ccgtatgcca tgcgtttata cgaatccctg tgtcagtatc 11700

  gtaagccgga tggctcaggc atcgtctctc tgaaaatcga ctggatcata gagcgttacc 11760

  agctgcctca aagttaccag cgtatgcctg acttccgccg ccgcttcctg caggtctgtg 11820

  ttaatgagat caacagcaga actccaatgc gcctctcata cattgagaaa aagaaaggcc 11880

  gccagacgac tcatatcgta ttttccttcc gcgatatcac ttccatgacg acaggatagg 11940

  ctagtgataa taagtgactg aggtatgtgc tcttcttatc tccttttgta gtgttgctct 12000

  tattttaaac aactttgcgg ttttttgatg actttgcgat tttgttgttg ctttgcagta 12060

  aattgcaaga tttaataaaa aaacgcaaag caatgattaa aggatgttca gaatgaaact 12120

  catggaaaca cttaaccagt gcataaacgc tggtcatgaa atgacgaagg ctatcgccat 12180

  tgcacagttt aatgatgaca gcccggaagc gaggaaaata acccggcgct ggagaatagg 12240

  tgaagcagcg gatttagttg gggtttcttc tcaggctatc agagatgccg agaaagcagg 12300

  gcgactaccg cacccggata tggaaattcg aggacgggtt gagcaacgtg ttggttatac 12360

  aattgaacaa attaatcata tgcgtgatgt gtttggtacg cgattgcgac gtgctgaaga 12420

  cgtatttcca ccggtgatcg gggttgctgc ccataaagaa aggtggcgtt tacaaaacct 12480

  cagtttctgt tcatcttgct caggatctgg ctctgaaggg gctacgtgtt ttgctcgtgg 12540

  aaggtaacga cccccaggga acagcctcaa tgtatcacgg atgggtacca gatcttcata 12600

  ttcatgcaga agacactctc ctgcctttct atcttgggga aaaggacgat gtcacttatg 12660

  caataaagcc cacttgctgg ccggggcttg acattattcc ttcctgtctg gctctgcacc 12720

  gtattgaaac tgagttaatg ggcaaatttg atgaaggtaa actgcccacc gatccacacc 12780

  tgatgctccg actggccatt gaaactgttg ctcatgacta tgatgtcata gttattgaca 12840

  gcgcgcctaa cctgggtatc ggcacgatta atgtcgtatg tgctgctgat gtgctgattg 12900

  ttcccacgcc tgctgagttg tttgactaca cctccgcact gcagtttttc gatatgcttc 12960

  gtgatctgct caagaacgtt gatcttaaag ggttcgagcc tgatgtacgt attttgctta 13020

  ccaaatacag caatagtaat ggctctcagt ccccgtggat ggaggagcaa attcgggatg 13080

  cctggggaag catggttcta aaaaatgttg tacgtgaaac ggatgaagtt ggtaaaggtc 13140

  agatccggat gagaactgtt tttgaacagg ccattgatca acgctcttca actggtgcct 13200

  ggagaaatgc tctttctatt tgggaacctg tctgcaatga aattttcgat cgtctgatta 13260

  aaccacgctg ggagattaga taatgaagcg tgcgcctgtt attccaaaac atacgctcaa 13320

  tactcaaccg gttgaagata cttcgttatc gacaccagct gccccgatgg tggattcgtt 13380

  aattgcgcgc gtaggagtaa tggctcgcgg taatgccatt actttgcctg tatgtggtcg 13440

  ggatgtgaag tttactcttg aagtgctccg gggtgatagt gttgagaaga cctctcgggt 13500

  atggtcaggt aatgaacgtg accaggagct gcttactgag gacgcactgg atgatctcat 13560

  cccttctttt ctactgactg gtcaacagac accggcgttc ggtcgaagag tatctggtgt 13620

  catagaaatt gccgatggga gtcgccgtcg taaagctgct gcacttaccg aaagtgatta 13680

  tcgtgttctg gttggcgagc tggatgatga gcagatggct gcattatcca gattgggtaa 13740

  cgattatcgc ccaacaagtg cttatgaacg tggtcagcgt tatgcaagcc gattgcagaa 13800

  tgaatttgct ggaaatattt ctgcgctggc tgatgcggaa aatatttcac gtaagattat 13860

  tacccgctgt atcaacaccg ccaaattgcc taaatcagtt gttgctcttt tttctcaccc 13920

  cggtgaacta tctgcccggt caggtgatgc acttcaaaaa gcctttacag ataaagagga 13980

  attacttaag cagcaggcat ctaaccttca tgagcagaaa aaagctgggg tgatatttga 14040

  agctgaagaa gttatcactc ttttaacttc tgtgcttaaa acgtcatctg catcaagaac 14100

  tagtttaagc tcacgacatc agtttgctcc tggagcgaca gtattgtata agggcgataa 14160

  aatggtgctt aacctggaca ggtctcgtgt tccaactgag tgtatagaga aaattgaggc 14220

  cattcttaag gaacttgaaa agccagcacc ctgatgcgac cacgttttag tctacgttta 14280

  tctgtcttta cttaatgtcc tttgttacag gccagaaagc ataactggcc tgaatattct 14340

  ctctgggccc actgttccac ttgtatcgtc ggtctgataa tcagactggg accacggtcc 14400

  cactcgtatc gtcggtctga ttattagtct gggaccacgg tcccactcgt atcgtcggtc 14460

  tgattattag tctgggacca cggtcccact cgtatcgtcg gtctgataat cagactggga 14520

  ccacggtccc actcgtatcg tcggtctgat tattagtctg ggaccatggt cccactcgta 14580

  tcgtcggtct gattattagt ctgggaccac ggtcccactc gtatcgtcgg tctgattatt 14640

  agtctggaac cacggtccca ctcgtatcgt cggtctgatt attagtctgg gaccacggtc 14700

  ccactcgtat cgtcggtctg attattagtc tgggaccacg atcccactcg tgttgtcggt 14760

  ctgattatcg gtctgggacc acggtcccac ttgtattgtc gatcagacta tcagcgtgag 14820

  actacgattc catcaatgcc tgtcaagggc aagtattgac atgtcgtcgt aacctgtaga 14880

  acggagtaac ctcggtgtgc ggttgtatgc ctgctgtgga ttgctgctgt gtcctgctta 14940

  tccacaacat tttgcgcacg gttatgtgga caaaatacct ggttacccag gccgtgccgg 15000

  cacgttaacc gggctgcatc cgatgcaagt gtgtcgctgt cgacgagctc gcgagctcgg 15060

  acatgaggtt gccccgtatt cagtgtcgct gatttgtatt gtctgaagtt gtttttacgt 15120

  taagttgatg cagatcaatt aatacgatac ctgcgtcata attgattatt tgacgtggtt 15180

  tgatggcctc cacgcacgtt gtgatatgta gatgataatc attatcactt tacgggtcct 15240

  ttccggtgat ccgacaggtt acggggcggc gacctcgcgg gttttcgcta tttatgaaaa 15300

  ttttccggtt taaggcgttt ccgttcttct tcgtcataac ttaatgtttt tatttaaaat 15360

  accctctgaa aagaaaggaa acgacaggtg ctgaaagcga gctttttggc ctctgtcgtt 15420

  tcctttctct gtttttgtcc gtggaatgaa caatggaagt ccgagctcat cgctaataac 15480

  ttcgtatagc atacattata cgaagttata ttcgatgcgg ccaaggtgag ccagtgtgat 15540

  tacatttgcg gcctaactgt ggccagtcca gttacgctgg agtcactagt atttaggtga 15600

  cactatagaa gcggccgcta gggataacag ggtaatgaca acttgtccac gtggaattct 15660

  aagcttagga tcccactgtg gtgg 15684

  <210> 8

  <211> 5250

  <212> DNA

  <213> 人工序列

  <220>

  <223> 真菌复制起点

  <400> 8

  agcttatttt ttgtatactg ttttgtgata gcacgaagtt tttccacggt atcttgttaa 60

  aaatatatat ttgtggcggg cttacctaca tcaaattaat aagagactaa ttataaacta 120

  aacacacaag caagctactt tagggtaaaa gtttataaat gcttttgacg tataaacgtt 180

  gcttgtattt attattacaa ttaaaggtgg atagaaaacc tagagactag ttagaaacta 240

  atctcaggtt tgcgttaaac taaatcagag cccgagaggt taacagaacc tagaagggga 300

  ctagatatcc gggtagggaa acaaaaaaaa aaaacaagac agccacatat tagggagact 360

  agttagaagc tagttccagg actaggaaaa taaaagacaa tgataccaca gtctagttga 420

  caactagata gattctagat tgaggccaaa gtctctgaga tccaggttag ttgcaactaa 480

  tactagttag tatctagtct cctataactc tgaagctaga ataacttact actattatcc 540

  tcaccactgt tcagctgcgc aaacggagtg attgcaaggt gttcagagac tagttattga 600

  ctagtcagtg actagcaata actaacaagg tattaaccta ccatgtctgc catcaccctg 660

  cacttcctcg ggctcagcag ccttttcctc ctcattttca tgctcatttt ccttgtttaa 720

  gactgtgact agtcaaagac tagtccagaa ccacaaagga gaaatgtctt accactttct 780

  tcattgcttg tctcttttgc attatccatg tctgcaacta gttagagtct agttagtgac 840

  tagtccgacg aggacttgct tgtctccgga ttgttggagg aactctccag ggcctcaaga 900

  tccacaacag agccttctag aagactggtc aataactagt tggtctttgt ctgagtctga 960

  cttacgaggt tgcatactcg ctccctttgc ctcgtcaatc gatgagaaaa agcgccaaaa 1020

  ctcgcaatat ggctttgaac cacacggtgc tgagactagt tagaatctag tcccaaacta 1080

  gcttggatag cttacctttg ccctttgcgt tgcgacaggt cttgcagggt atggttcctt 1140

  tctcaccagc tgatttagct gccttgctac cctcacggcg gatctgcata aagagtggct 1200

  agaggttata aattagcact gatcctaggt acggggctga atgtaacttg cctttccttt 1260

  ctcatcgcgc ggcaagacag gcttgctcaa attcctacca gtcacagggg tatgcacggc 1320

  gtacggacca cttgaactag tcacagatta gttagcaact agtctgcatt gaatggctgt 1380

  acttacgggc cctcgccatt gtcctgatca tttccagctt caccctcgtt gctgcaaagt 1440

  agttagtgac tagtcaagga ctagttgaaa tgggagaaga aactcacgaa ttctcgacac 1500

  ccttagtatt gtggtccttg gacttggtgc tgctatatat tagctaatac actagttaga 1560

  ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag gagtcggggt tgggagaaca 1620

  gtgccttcaa acaagccttc ataccatgct acttgactag tcagggacta gtcaccaagt 1680

  aatctagata ggacttgcct ttggcctcca tcagttcctt catagtggga ggtccattgt 1740

  gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa gtgcttgacc aatatgtttc 1800

  tgttggcaga gggaacctgt caactagtta ataactagtc agaaactagt atagcagtag 1860

  actcactgta cgcttgaggc atcccttcac tcggcagtag acttcatatg gatggatatc 1920

  aggcacgcca ttgtcgtcct gtggactagt cagtaactag gcttaaagct agtcgggtcg 1980

  gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc ttaactgcct cgagatagtg 2040

  acagtactct ggggactttc ggagatcgtt atcgcgaatg ctcggcatac taatcgttga 2100

  ctagtcttgg actagtcccg agcaaaaagg attggaggag gaggaggaag gtgagagtga 2160

  gacaaagagc gaaataagag cttcaaaggc tatctctaag cagtatgaag gttaagtatc 2220

  tagttcttga ctagatttaa aagagatttc gactagttat gtacctggag tttggatata 2280

  ggaatgtgtt gtggtaacga aatgtaaggg ggaggaaaga aaaagtcggt caagaggtaa 2340

  ctctaagtcg gccattcctt tttgggaggc gctaaccata aacggcatgg tcgacttaga 2400

  gttagctcag ggaatttagg gagttatctg cgaccaccga ggaacggcgg aatgccaaag 2460

  aatcccgatg gagctctagc tggcggttga caaccccacc ttttggcgtt tctgcggcgt 2520

  tgcaggcggg actggatact tcgtagaacc agaaaggcaa ggcagaacgc gctcagcaag 2580

  agtgttggaa gtgatagcat gatgtgcctt gttaactagg tcaaaatctg caggtatgct 2640

  tgatgttatc caaagtgtga gagaggaagg tccaaacata cacgattggg agagggccta 2700

  ggtataagag tttttgagta gaacgcatgt gagcccagcc atctcgagga gattaaacac 2760

  gggccggcat ttgatggcta tgttagtacc ccaatggaaa gcctgagagt ccagtggtcg 2820

  cagataactc cctaaattcc ctgagctaac tctaagtcga ccatgccgtt tatggttagc 2880

  gcctcccaaa aaggaatggc cgacttagag ttacctcttg accgactttt tctttcctcc 2940

  cccttacatt tcgttaccac aacacattcc tatatccaaa ctccaggtac ataactagtc 3000

  gaaatctctt ttaaatctag tcaagaacta gatacttaac cttcatactg cttagagata 3060

  gcctttgaag ctcttatttc gctctttgtc tcactctcac cttcctcctc ctcctccaat 3120

  cctttttgct cgggactagt ccaagactag tcaacgatta gtatgccgag cattcgcgat 3180

  aacgatctcc gaaagtcccc agagtactgt cactatctcg aggcagttaa ggacggggag 3240

  cttacgctgc cggatttcaa gatagtaagc cgacccgact agctttaagc ctagttactg 3300

  actagtccac aggacgacaa tggcgtgcct gatatccatc catatgaagt ctactgccga 3360

  gtgaagggat gcctcaagcg tacagtgagt ctactgctat actagtttct gactagttat 3420

  taactagttg acaggttccc tctgccaaca gaaacatatt ggtcaagcac ttgaaggaca 3480

  agaactccca cggcatggag tttacattgc acaatggacc tcccactatg aaggaactga 3540

  tggaggccaa aggcaagtcc tatctagatt acttggtgac tagtccctga ctagtcaagt 3600

  agcatggtat gaaggcttgt ttgaaggcac tgttctccca accccgactc ctaccaagaa 3660

  gcgcaagcga gctgcgtaag tttctgtgag tctaactagt gtattagcta atatatagca 3720

  gcaccaagtc caaggaccac aatactaagg gtgtcgagaa ttcgtgagtt tcttctccca 3780

  tttcaactag tccttgacta gtcactaact actttgcagc aacgagggtg aagctggaaa 3840

  tgatcaggac aatggcgagg gcccgtaagt acagccattc aatgcagact agttgctaac 3900

  taatctgtga ctagttcaag tggtccgtac gccgtgcata cccctgtgac tggtaggaat 3960

  ttgagcaagc ctgtcttgcc gcgcgatgag aaaggaaagg caagttacat tcagccccgt 4020

  acctaggatc agtgctaatt tataacctct agccactctt tatgcagatc cgccgtgagg 4080

  gtagcaaggc agctaaatca gctggtgaga aaggaaccat accctgcaag acctgtcgca 4140

  acgcaaaggg caaaggtaag ctatccaagc tagtttggga ctagattcta actagtctca 4200

  gcaccgtgtg gttcaaagcc atattgcgag ttttggcgct ttttctcatc gattgacgag 4260

  gcaaagggag cgagtatgca acctcgtaag tcagactcag acaaagacca actagttatt 4320

  gaccagtctt ctagaaggct ctgttgtgga tcttgaggcc ctggagagtt cctccaacaa 4380

  tccggagaca agcaagtcct cgtcggacta gtcactaact agactctaac tagttgcaga 4440

  catggataat gcaaaagaga caagcaatga agaaagtggt aagacatttc tcctttgtgg 4500

  ttctggacta gtctttgact agtcacagtc ttaaacaagg aaaatgagca tgaaaatgag 4560

  gaggaaaagg ctgctgagcc cgaggaagtg cagggtgatg gcagacatgg taggttaata 4620

  ccttgttagt tattgctagt cactgactag tcaataacta gtctctgaac accttgcaat 4680

  cactccgttt gcgcagctga acagtggtga ggataatagt agtaagttat tctagcttca 4740

  gagttatagg agactagata ctaactagta ttagttgcaa ctaacctgga tctcagagac 4800

  tttggcctca atctagaatc tatctagttg tcaactagac tgtggtatca ttgtctttta 4860

  ttttcctagt cctggaacta gcttctaact agtctcccta atatgtggct gtcttgtttt 4920

  ttttttttgt ttccctaccc ggatatctag tccccttcta ggttctgtta acctctcggg 4980

  ctctgattta gtttaacgca aacctgagat tagtttctaa ctagtctcta ggttttctat 5040

  ccacctttaa ttgtaataat aaatacaagc aacgtttata cgtcaaaagc atttataaac 5100

  ttttacccta aagtagcttg cttgtgtgtt tagtttataa ttagtctctt attaatttga 5160

  tgtaggtaag cccgccacaa atatatattt ttaacaagat accgtggaaa aacttcgtgc 5220

  tatcacaaaa cagtatacaa aaaataagct 5250

  <210> 9

  <211> 3031

  <212> DNA

  <213> 人工序列

  <220>

  <223> 真菌选择标记

  <400> 9

  gatccacagg acgggtgtgg tcgccatgat cgcgtagtcg atagtggctc caagtagcga 60

  agcgagcagg actgggcggc ggccaaagcg gtcggacagt gctccgagaa cgggtgcgca 120

  tagaaattgc atcaacgcat atagcgctag cagcacgcca tagtgactgg cgatgctgtc 180

  ggaatggacg atatcccgca agaggcccgg cagtaccggc ataaccaagc ctatgcctac 240

  agcatccagg gtgacggtgc cgaggatgac gatgagcgca ttgttagatt tcatacacgg 300

  tgcctgactg cgttagcaat ttaactgtga taaactaccg cattaaagct tcgacatcac 360

  ccttacccaa actatatcca atgagcaaag aataacgagt caaagcgggc gcatttttca 420

  tcacatacga gtatgcacag tcaggactcc acgtcataca tcaaaaactt ggaacgcatg 480

  agtctagctc agctcggctc ttttccgatt tttgcgcagc ttctgttgcg gatcttgctg 540

  cttgtggagt ctatgccccg gctgatgcat tgaaacacaa cgcgcagatg atccaatcat 600

  accaaccaga cgcatcagcg cgtgtagctg ggggaagggt aggtggtgta gcccagaaag 660

  cgacacggct ggctttcaag aagtttatca accctagaca gctttggagc ggatacccgg 720

  ctcttgtggc gcatagcttg ccagtgtcgg cgatacagat gcctctgtac gagacttttc 780

  ggtatcgaat ttctgaatat agattcggag atcgagagaa ggtgctagaa agatcaagag 840

  attatggaaa agaaacaggc ccattcgaca atcggagagg ctgcagcgac agccgcgata 900

  agtgctgcag cctcgggcgg tatagccagt gtcttgacag cacccatgga tatagtccgg 960

  acacgaatca tgctcgatgc tgcagacaca accgcacctc agaagaaaag gatgatcaat 1020

  accgtacggg agattatacg aacagatggc ccgagaggac tattccgagg gtgtgctatc 1080

  aacacgttta tggccgctgt cggatcaggg ttatactttg gtctctacga aagcaccaaa 1140

  tggtggctag gctcggactc gatggataat agtgccatgt tagagtaagg ggtgatggga 1200

  aatcttgtat ataattgtga ttgtttgtac gatagtggcc gactgtacat tagtgatacc 1260

  ccactcttag aaaatagacc aatctccagc tgcaccttca gacaatccgg gtaaaaattc 1320

  tcgtctatgt tggagattgg tgtgattttg aaacatgacc cttgactctg atcttgaata 1380

  tgtccatatc tcgaggcagg catattattc atatagagag ggtatccctt agcatcggtc 1440

  tgtcgtagta tccgactgct gaatttatga atcgcatcat acttgcgaca tactgccata 1500

  aaaagagtac gtatccacca ctacttattg cgcaccaaca cgcttcaggt atgcatccca 1560

  tccctctttc tggtaccgct tcgccgcctc cacgggatca ggagcagcat aaattccacg 1620

  accagcaatg ataaagtcgg caccgcgtcc aacagcagat tcaggagtct ggtattgctg 1680

  tcccagcttg tctcccttcg aggagaggtt gacacctgtc gtgaacacga cgaaatcctc 1740

  ctcctccgaa ggagagctaa cttcagactg aacctcgccc aggtgacgcg tcgagacgaa 1800

  tcccatcaca aacttcttat acttccgagc atagtcaaca gaagaagtag tatattgacc 1860

  ggtagccaaa gatcccttgg atgtcatctc cgcaaggatc aaaaggcccc tctcagagcc 1920

  gtagggaaag tcctcggccg aagcagtctg ggctagagcc tcgacgatac cctcaccggg 1980

  cagaatactg cagttgatga tgtgggccca ctcggagatg cgcagagtgc cgccatggta 2040

  ctgcttttgg actgtgtttc cgatatcgat gaacttgcga tcttcgaaga tgaggaaatt 2100

  gtgcttctct gcaagggcct tcagaccggt gatggtctct tcgctgaaat cggagaggat 2160

  atcgatgtga gttttgatca cggcaatgta cggaccgagt cctgttaaat aatccaccat 2220

  taaccattat tagatcatta tgtaagtggc atccccggtg cgcatacggt cagccaaatc 2280

  cagcagctct ttggtggttg tcacgtcggc cgaaacggtg acattggttt tcttggcctc 2340

  ggcaacctca aagagcttct ttacgagggc attggggtgc ttgctagcgc gtgcactgta 2400

  ggtcaattgc gacttggaag acatgttggc gatggagggg tagcgcgggg ttctgcaact 2460

  atcgtagaaa tgagcactta gtggttgaaa ccggcttatt cagtagatta atacttgaag 2520

  tttttagtaa tcagacagaa taatcaggat gtccaattac tacctcttaa tatgtggaat 2580

  gaatgataga tataaattgt acgacaattg ccgcgaaaaa ttaaaatgga tctatggagg 2640

  ggacagtcat gcactagcca cacgttcctc cgcctgtggg gtgagccaca tgcctcatct 2700

  ggaccaaaca catcgatgca gtcacatgca gataagatta gggcctatcc ttagggtacc 2760

  tgtccgcgcg gggattatgc ctggcttttt gcctgctttt gatatccttt caaggacata 2820

  gcgataagtc caaccttatc ggccataata atgtcaatgc cagcagcggc ttgggcctag 2880

  aatattccat cagctactga acaacttcta catcacaatt tgaaagctct aagaattaat 2940

  atagaagcac ttaccttcgc attttctggt atattgttct gagatccata ggatcagctt 3000

  atcgatgata agctgtcaaa catgagaatt c 3031

  <210> 10

  <211> 277

  <212> PRT

  <213> 人工序列

  <220>

  <223> 真菌选择标记

  <400> 10

  Met Ser Ser Lys Ser Gln Leu Thr Tyr Ser Ala Arg Ala Ser Lys His

  1 5 1015

  Pro Asn Ala Leu Val Lys Lys Leu Phe Glu Val Ala Glu Ala Lys Lys

  202530

  Thr Asn Val Thr Val Ser Ala Asp Val Thr Thr Thr Lys Glu Leu Leu

  354045

  Asp Leu Ala Asp Arg Leu Gly Pro Tyr Ile Ala Val Ile Lys Thr His

  505560

  Ile Asp Ile Leu Ser Asp Phe Ser Glu Glu Thr Ile Thr Gly Leu Lys

  65707580

  Ala Leu Ala Glu Lys His Asn Phe Leu Ile Phe Glu Asp Arg Lys Phe

  859095

  Ile Asp Ile Gly Asn Thr Val Gln Lys Gln Tyr His Gly Gly Thr Leu

  100 105 110

  Arg Ile Ser Glu Trp Ala His Ile Ile Asn Cys Ser Ile Leu Pro Gly

  115 120 125

  Glu Gly Ile Val Glu Ala Leu Ala Gln Thr Ala Ser Ala Glu Asp Phe

  130 135 140

  Pro Tyr Gly Ser Glu Arg Gly Leu Leu Ile Leu Ala Glu Met Thr Ser

  145 150 155 160

  Lys Gly Ser Leu Ala Thr Gly Gln Tyr Thr Thr Ser Ser Val Asp Tyr

  165 170 175

  Ala Arg Lys Tyr Lys Lys Phe Val Met Gly Phe Val Ser Thr Arg His

  180 185 190

  Leu Gly Glu Val Gln Ser Glu Val Ser Ser Pro Ser Glu Glu Glu Asp

  195 200 205

  Phe Val Val Phe Thr Thr Gly Val Asn Leu Ser Ser Lys Gly Asp Lys

  210 215 220

  Leu Gly Gln Gln Tyr Gln Thr Pro Glu Ser Ala Val Gly Arg Gly Ala

  225 230 235 240

  Asp Phe Ile Ile Ala Gly Arg Gly Ile Tyr Ala Ala Pro Asp Pro Val

  245 250 255

  Glu Ala Ala Lys Arg Tyr Gln Lys Glu Gly Trp Asp Ala Tyr Leu Lys

  260 265 270

  Arg Val Gly Ala Gln

  275

  <210> 11

  <211> 12699

  <212> DNA

  <213> 人工序列

  <220>

  <223> 载体

  <400> 11

  ccaccacagt gggatccgaa gcttggaatt cacgtgactt gaagtcatta ccctgttatc 60

  cctatgattt aatagctcca tgtcaacaag aataaaacgc gttttcgggt ttacctcttc 120

  cagatacagc tcatctgcaa tgcattaatg cattgactgc aacctagtaa cgccttcagg 180

  ctccggcgaa gagaagaata gcttagcaga gctattttca ttttcgggag acgagatcaa 240

  gcagatcaac ggtcgtcaag agacctacga gactgaggaa tccgctcttg gctccacgcg 300

  actatatatt tgtctctaat tgtactttga catgctcctc ttctttactc tgatagcttg 360

  actatgaaaa ttccgtcacc agccctgggt tcgcaaagat aattgcatgt ttcttccttg 420

  aactctcaag cctacaggac acacattcat cgtaggtata aacctcgaaa tcattcctac 480

  taagatggta tacaatagta accatggttg cctagtgaat gctccgtaac acccaatacg 540

  ccggccgaaa cttttttaca actctcctat gagtcgttta cccagaatgc acaggtacac 600

  ttgtttagag gtaatccttc tttctagaag tcctcgtgta ctgtgtaagc gcccactcca 660

  catctccact cgagcctttt tcgagcgaac ctcccctgat ctcgaataat ctcatcgtca 720

  tgcgcggtcc aacttctgct agttcggcat ccttatatcc cgtcttaacg aaaacgtggt 780

  gacgaacctc aatgctatcc tctttattta caaaggtgac cacgcggttt ccaacttttc 840

  cagcttctcg gggagggaaa agatgcttca gaatttgaac cacgcgcttg cccagttttg 900

  tcttgaaacc ctcaaagatc aagtgcgggt agctctctga cacagtcccg cgggcagcgt 960

  tgggaatatc ggcacgtaga acaacattat gcagggagaa gctggctgtc gggccatgag 1020

  gaagatgtga gatcgtcatc gcagtagggg taccacggtg ttcggcggcc gcactgaccc 1080

  tatagtgagt cgtattaatt taaatcatac caacatggtc aaataaaacg aaaggctcag 1140

  tcgaaagact ggccgcccga tccacaggac gggtgtggtc gccatgatcg cgtagtcgat 1200

  agtggctcca agtagcgaag cgagcaggac tgggcggcgg ccaaagcggt cggacagtgc 1260

  tccgagaacg ggtgcgcata gaaattgcat caacgcatat agcgctagca gcacgccata 1320

  gtgactggcg atgctgtcgg aatggacgat atcccgcaag aggcccggca gtaccggcat 1380

  aaccaagcct atgcctacag catccagggt gacggtgccg aggatgacga tgagcgcatt 1440

  gttagatttc atacacggtg cctgactgcg ttagcaattt aactgtgata aactaccgca 1500

  ttaaagcttc gacatcaccc ttacccaaac tatatccaat gagcaaagaa taacgagtca 1560

  aagcgggcgc atttttcatc acatacgagt atgcacagtc aggactccac gtcatacatc 1620

  aaaaacttgg aacgcatgag tctagctcag ctcggctctt ttccgatttt tgcgcagctt 1680

  ctgttgcgga tcttgctgct tgtggagtct atgccccggc tgatgcattg aaacacaacg 1740

  cgcagatgat ccaatcatac caaccagacg catcagcgcg tgtagctggg ggaagggtag 1800

  gtggtgtagc ccagaaagcg acacggctgg ctttcaagaa gtttatcaac cctagacagc 1860

  tttggagcgg atacccggct cttgtggcgc atagcttgcc agtgtcggcg atacagatgc 1920

  ctctgtacga gacttttcgg tatcgaattt ctgaatatag attcggagat cgagagaagg 1980

  tgctagaaag atcaagagat tatggaaaag aaacaggccc attcgacaat cggagaggct 2040

  gcagcgacag ccgcgataag tgctgcagcc tcgggcggta tagccagtgt cttgacagca 2100

  cccatggata tagtccggac acgaatcatg ctcgatgctg cagacacaac cgcacctcag 2160

  aagaaaagga tgatcaatac cgtacgggag attatacgaa cagatggccc gagaggacta 2220

  ttccgagggt gtgctatcaa cacgtttatg gccgctgtcg gatcagggtt atactttggt 2280

  ctctacgaaa gcaccaaatg gtggctaggc tcggactcga tggataatag tgccatgtta 2340

  gagtaagggg tgatgggaaa tcttgtatat aattgtgatt gtttgtacga tagtggccga 2400

  ctgtacatta gtgatacccc actcttagaa aatagaccaa tctccagctg caccttcaga 2460

  caatccgggt aaaaattctc gtctatgttg gagattggtg tgattttgaa acatgaccct 2520

  tgactctgat cttgaatatg tccatatctc gaggcaggca tattattcat atagagaggg 2580

  tatcccttag catcggtctg tcgtagtatc cgactgctga atttatgaat cgcatcatac 2640

  ttgcgacata ctgccataaa aagagtacgt atccaccact acttattgcg caccaacacg 2700

  cttcaggtat gcatcccatc cctctttctg gtaccgcttc gccgcctcca cgggatcagg 2760

  agcagcataa attccacgac cagcaatgat aaagtcggca ccgcgtccaa cagcagattc 2820

  aggagtctgg tattgctgtc ccagcttgtc tcccttcgag gagaggttga cacctgtcgt 2880

  gaacacgacg aaatcctcct cctccgaagg agagctaact tcagactgaa cctcgcccag 2940

  gtgacgcgtc gagacgaatc ccatcacaaa cttcttatac ttccgagcat agtcaacaga 3000

  agaagtagta tattgaccgg tagccaaaga tcccttggat gtcatctccg caaggatcaa 3060

  aaggcccctc tcagagccgt agggaaagtc ctcggccgaa gcagtctggg ctagagcctc 3120

  gacgataccc tcaccgggca gaatactgca gttgatgatg tgggcccact cggagatgcg 3180

  cagagtgccg ccatggtact gcttttggac tgtgtttccg atatcgatga acttgcgatc 3240

  ttcgaagatg aggaaattgt gcttctctgc aagggccttc agaccggtga tggtctcttc 3300

  gctgaaatcg gagaggatat cgatgtgagt tttgatcacg gcaatgtacg gaccgagtcc 3360

  tgttaaataa tccaccatta accattatta gatcattatg taagtggcat ccccggtgcg 3420

  catacggtca gccaaatcca gcagctcttt ggtggttgtc acgtcggccg aaacggtgac 3480

  attggttttc ttggcctcgg caacctcaaa gagcttcttt acgagggcat tggggtgctt 3540

  gctagcgcgt gcactgtagg tcaattgcga cttggaagac atgttggcga tggaggggta 3600

  gcgcggggtt ctgcaactat cgtagaaatg agcacttagt ggttgaaacc ggcttattca 3660

  gtagattaat acttgaagtt tttagtaatc agacagaata atcaggatgt ccaattacta 3720

  cctcttaata tgtggaatga atgatagata taaattgtac gacaattgcc gcgaaaaatt 3780

  aaaatggatc tatggagggg acagtcatgc actagccaca cgttcctccg cctgtggggt 3840

  gagccacatg cctcatctgg accaaacaca tcgatgcagt cacatgcaga taagattagg 3900

  gcctatcctt agggtacctg tccgcgcggg gattatgcct ggctttttgc ctgcttttga 3960

  tatcctttca aggacatagc gataagtcca accttatcgg ccataataat gtcaatgcca 4020

  gcagcggctt gggcctagaa tattccatca gctactgaac aacttctaca tcacaatttg 4080

  aaagctctaa gaattaatat agaagcactt accttcgcat tttctggtat attgttctga 4140

  gatccatagg atcagcttat cgatgataag ctgtcaaaca tgagaattcg ggccgtcgac 4200

  caattctcat gtttgacagc ttatcatcga atttctgcca ttcatccgct tattatcact 4260

  tattcaggcg tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaagtcgag 4320

  gctgatcagc gagctctaga gaattgatcc cctcagaaga actcgtcaag aaggcgatag 4380

  aaggcgatgc gctgcgaatc gggagcggcg ataccgtaaa gcacgaggaa gcggtcagcc 4440

  cattcgccgc caagctcttc agcaatatca cgggtagcca acgctatgtc ctgatagcgg 4500

  tccgccacac ccagccggcc acagtcgatg aatccagaaa agcggccatt ttccaccatg 4560

  atattcggca agcaggcatc gccatgggtc acgacgagat catcgccgtc gggcatgcgc 4620

  gccttgagcc tggcgaacag ttcggctggc gcgagcccct gatgctcttc gtccagatca 4680

  tcctgatcga caagaccggc ttccatccga gtacgtgctc gctcgatgcg atgtttcgct 4740

  tggtggtcga atgggcaggt agccggatca agcgtatgca gccgccgcat tgcatcagcc 4800

  atgatggata ctttctcggc aggagcaagg tgagatgaca ggagatcctg ccccggcact 4860

  tcgcccaata gcagccagtc ccttcccgct tcagtgacaa cgtcgagcac agctgcgcaa 4920

  ggaacgcccg tcgtggccag ccacgatagc cgcgctgcct cgtcctgcag ttcattcagg 4980

  gcaccggaca ggtcggtctt gacaaaaaga accgggcgcc cctgcgctga cagccggaac 5040

  acggcggcat cagagcagcc gattgtctgt tgtgcccagt catagccgaa tagcctctcc 5100

  acccaagcgg ccggagaacc tgcgtgcaat ccatcttgtt caatggccga tcccatggtt 5160

  tagttcctca ccttgtcgta ttatactatg ccgatatact atgccgatga ttaattgtca 5220

  acaggctgca ggtcgtttag cttccttagc tcctgaaaat ctcgataact caaaaaatac 5280

  gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt gccgatcaac 5340

  gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga caccaggatt 5400

  tatttattct gcgaagtgat cttccgtcac aggtatttat tcgcgataag ctcatggagc 5460

  ggcgtaaccg tcgcacagga aggacagaga aagcgcggat ctgggaagtg acggacagaa 5520

  cggtcaggac ctggattggg gaggcggttg ccgccgctgc tgctgacggt gtgacgttct 5580

  ctgttccggt cacaccacat acgttccgcc attcctatgc gatgcacatg ctgtatgccg 5640

  gtataccgct gaaagttctg caaagcctga tgggacataa gtccatcagt tcaacggaag 5700

  tctacacgaa ggtttttgcg ctggatgtgg ctgcccggca ccgggtgcag tttgcgatgc 5760

  cggagtctga tgcggttgcg atgctgaaac aattatcctg agaataaatg ccttggcctt 5820

  tatatggaaa tgtggaactg agtggatatg ctgtttttgt ctgttaaaca gagaagctgg 5880

  ctgttatcca ctgagaagcg aacgaaacag tcgggaaaat ctcccattat cgtagagatc 5940

  cgcattatta atctcaggag cctgtgtagc gtttatagga agtagtgttc tgtcatgatg 6000

  cctgcaagcg gtaacgaaaa cgatttgaat atgccttcag gaacaataga aatcttcgtg 6060

  cggtgttacg ttgaagtgga gcggattatg tcagcaatgg acagaacaac ctaatgaaca 6120

  cagaaccatg atgtggtctg tccttttaca gccagtagtg ctcgccgcag tcgagcgaca 6180

  gggcgaagcc cctggttgcc ctcgccgctg ggctggcggc cgtctatggc cctgcaaacg 6240

  cgccagaaac gccgtcgaag ccgtgtgcga gacaccgcgg ccggccgccg gcgttgtgga 6300

  tacctcgcgg aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg 6360

  gccgactcac ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg 6420

  tggagctggc cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag 6480

  atgatgtgga caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact 6540

  actgacagat gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg 6600

  gcgcacctat tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt 6660

  ttccgcccgt ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt 6720

  ataaaccttg tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg 6780

  ggtgcccccc cttctcgaac cctcccggtc gagtgagcga ggaagcacca gggaacagca 6840

  cttatatatt ctgcttacac acgatgcctg aaaaaacttc ccttggggtt atccacttat 6900

  ccacggggat atttttataa ttattttttt tatagttttt agatcttctt ttttagagcg 6960

  ccttgtaggc ctttatccat gctggttcta gagaaggtgt tgtgacaaat tgccctttca 7020

  gtgtgacaaa tcaccctcaa atgacagtcc tgtctgtgac aaattgccct taaccctgtg 7080

  acaaattgcc ctcagaagaa gctgtttttt cacaaagtta tccctgctta ttgactcttt 7140

  tttatttagt gtgacaatct aaaaacttgt cacacttcac atggatctgt catggcggaa 7200

  acagcggtta tcaatcacaa gaaacgtaaa aatagcccgc gaatcgtcca gtcaaacgac 7260

  ctcactgagg cggcatatag tctctcccgg gatcaaaaac gtatgctgta tctgttcgtt 7320

  gaccagatca gaaaatctga tggcacccta caggaacatg acggtatctg cgagatccat 7380

  gttgctaaat atgctgaaat attcggattg acctctgcgg aagccagtaa ggatatacgg 7440

  caggcattga agagtttcgc ggggaaggaa gtggtttttt atcgccctga agaggatgcc 7500

  ggcgatgaaa aaggctatga atcttttcct tggtttatca aacgtgcgca cagtccatcc 7560

  agagggcttt acagtgtaca tatcaaccca tatctcattc ccttctttat cgggttacag 7620

  aaccggttta cgcagtttcg gcttagtgaa acaaaagaaa tcaccaatcc gtatgccatg 7680

  cgtttatacg aatccctgtg tcagtatcgt aagccggatg gctcaggcat cgtctctctg 7740

  aaaatcgact ggatcataga gcgttaccag ctgcctcaaa gttaccagcg tatgcctgac 7800

  ttccgccgcc gcttcctgca ggtctgtgtt aatgagatca acagcagaac tccaatgcgc 7860

  ctctcataca ttgagaaaaa gaaaggccgc cagacgactc atatcgtatt ttccttccgc 7920

  gatatcactt ccatgacgac aggataggct agtgataata agtgactgag gtatgtgctc 7980

  ttcttatctc cttttgtagt gttgctctta ttttaaacaa ctttgcggtt ttttgatgac 8040

  tttgcgattt tgttgttgct ttgcagtaaa ttgcaagatt taataaaaaa acgcaaagca 8100

  atgattaaag gatgttcaga atgaaactca tggaaacact taaccagtgc ataaacgctg 8160

  gtcatgaaat gacgaaggct atcgccattg cacagtttaa tgatgacagc ccggaagcga 8220

  ggaaaataac ccggcgctgg agaataggtg aagcagcgga tttagttggg gtttcttctc 8280

  aggctatcag agatgccgag aaagcagggc gactaccgca cccggatatg gaaattcgag 8340

  gacgggttga gcaacgtgtt ggttatacaa ttgaacaaat taatcatatg cgtgatgtgt 8400

  ttggtacgcg attgcgacgt gctgaagacg tatttccacc ggtgatcggg gttgctgccc 8460

  ataaagaaag gtggcgttta caaaacctca gtttctgttc atcttgctca ggatctggct 8520

  ctgaaggggc tacgtgtttt gctcgtggaa ggtaacgacc cccagggaac agcctcaatg 8580

  tatcacggat gggtaccaga tcttcatatt catgcagaag acactctcct gcctttctat 8640

  cttggggaaa aggacgatgt cacttatgca ataaagccca cttgctggcc ggggcttgac 8700

  attattcctt cctgtctggc tctgcaccgt attgaaactg agttaatggg caaatttgat 8760

  gaaggtaaac tgcccaccga tccacacctg atgctccgac tggccattga aactgttgct 8820

  catgactatg atgtcatagt tattgacagc gcgcctaacc tgggtatcgg cacgattaat 8880

  gtcgtatgtg ctgctgatgt gctgattgtt cccacgcctg ctgagttgtt tgactacacc 8940

  tccgcactgc agtttttcga tatgcttcgt gatctgctca agaacgttga tcttaaaggg 9000

  ttcgagcctg atgtacgtat tttgcttacc aaatacagca atagtaatgg ctctcagtcc 9060

  ccgtggatgg aggagcaaat tcgggatgcc tggggaagca tggttctaaa aaatgttgta 9120

  cgtgaaacgg atgaagttgg taaaggtcag atccggatga gaactgtttt tgaacaggcc 9180

  attgatcaac gctcttcaac tggtgcctgg agaaatgctc tttctatttg ggaacctgtc 9240

  tgcaatgaaa ttttcgatcg tctgattaaa ccacgctggg agattagata atgaagcgtg 9300

  cgcctgttat tccaaaacat acgctcaata ctcaaccggt tgaagatact tcgttatcga 9360

  caccagctgc cccgatggtg gattcgttaa ttgcgcgcgt aggagtaatg gctcgcggta 9420

  atgccattac tttgcctgta tgtggtcggg atgtgaagtt tactcttgaa gtgctccggg 9480

  gtgatagtgt tgagaagacc tctcgggtat ggtcaggtaa tgaacgtgac caggagctgc 9540

  ttactgagga cgcactggat gatctcatcc cttcttttct actgactggt caacagacac 9600

  cggcgttcgg tcgaagagta tctggtgtca tagaaattgc cgatgggagt cgccgtcgta 9660

  aagctgctgc acttaccgaa agtgattatc gtgttctggt tggcgagctg gatgatgagc 9720

  agatggctgc attatccaga ttgggtaacg attatcgccc aacaagtgct tatgaacgtg 9780

  gtcagcgtta tgcaagccga ttgcagaatg aatttgctgg aaatatttct gcgctggctg 9840

  atgcggaaaa tatttcacgt aagattatta cccgctgtat caacaccgcc aaattgccta 9900

  aatcagttgt tgctcttttt tctcaccccg gtgaactatc tgcccggtca ggtgatgcac 9960

  ttcaaaaagc ctttacagat aaagaggaat tacttaagca gcaggcatct aaccttcatg 10020

  agcagaaaaa agctggggtg atatttgaag ctgaagaagt tatcactctt ttaacttctg 10080

  tgcttaaaac gtcatctgca tcaagaacta gtttaagctc acgacatcag tttgctcctg 10140

  gagcgacagt attgtataag ggcgataaaa tggtgcttaa cctggacagg tctcgtgttc 10200

  caactgagtg tatagagaaa attgaggcca ttcttaagga acttgaaaag ccagcaccct 10260

  gatgcgacca cgttttagtc tacgtttatc tgtctttact taatgtcctt tgttacaggc 10320

  cagaaagcat aactggcctg aatattctct ctgggcccac tgttccactt gtatcgtcgg 10380

  tctgataatc agactgggac cacggtccca ctcgtatcgt cggtctgatt attagtctgg 10440

  gaccacggtc ccactcgtat cgtcggtctg attattagtc tgggaccacg gtcccactcg 10500

  tatcgtcggt ctgataatca gactgggacc acggtcccac tcgtatcgtc ggtctgatta 10560

  ttagtctggg accatggtcc cactcgtatc gtcggtctga ttattagtct gggaccacgg 10620

  tcccactcgt atcgtcggtc tgattattag tctggaacca cggtcccact cgtatcgtcg 10680

  gtctgattat tagtctggga ccacggtccc actcgtatcg tcggtctgat tattagtctg 10740

  ggaccacgat cccactcgtg ttgtcggtct gattatcggt ctgggaccac ggtcccactt 10800

  gtattgtcga tcagactatc agcgtgagac tacgattcca tcaatgcctg tcaagggcaa 10860

  gtattgacat gtcgtcgtaa cctgtagaac ggagtaacct cggtgtgcgg ttgtatgcct 10920

  gctgtggatt gctgctgtgt cctgcttatc cacaacattt tgcgcacggt tatgtggaca 10980

  aaatacctgg ttacccaggc cgtgccggca cgttaaccgg gctgcatccg atgcaagtgt 11040

  gtcgctgtcg acgagctcgc gagctcggac atgaggttgc cccgtattca gtgtcgctga 11100

  tttgtattgt ctgaagttgt ttttacgtta agttgatgca gatcaattaa tacgatacct 11160

  gcgtcataat tgattatttg acgtggtttg atggcctcca cgcacgttgt gatatgtaga 11220

  tgataatcat tatcacttta cgggtccttt ccggtgatcc gacaggttac ggggcggcga 11280

  cctcgcgggt tttcgctatt tatgaaaatt ttccggttta aggcgtttcc gttcttcttc 11340

  gtcataactt aatgttttta tttaaaatac cctctgaaaa gaaaggaaac gacaggtgct 11400

  gaaagcgagc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt ggaatgaaca 11460

  atggaagtcc gagctcatcg ctaataactt cgtatagcat acattatacg aagttatatt 11520

  cgatgcggcc aaggtgagcc agtgtgatta catttgcggc ctaactgtgg ccagtccagt 11580

  tacgctggag tcactagtat ttaggtgaca ctatagaagc ggccgcgaat tcatgccagt 11640

  tgttccagtg atcttcgttt cgaagatgga catccaattt gtgcaagtta ttcggcctac 11700

  ctggctgtgg ccgaggcagc gttatcatga ccgtcgctgt tcaaagataa ggcgagaagt 11760

  ttgcgggctg tcttgacgat atggcttcgt tcagacagat atagttcccg gagtcgcagg 11820

  ctgctattct tctccgaaac aaactcggct gcactgtttc catcaccggg tctggcgttt 11880

  gaggatgtca gcgaaactcg gccgcaagtg acaccgaaaa gtatcgactc cggtgcccgt 11940

  ttcaagctag tggcttcctc aacagcgagt cggccaggag acgtgaagca ggacgggttg 12000

  ccatccagac cgtgaccgaa cgcgttgatt tcatcaatcc cagccttttc gctcaaccaa 12060

  agagcatcgg ctttgatttc cttcaggtca tacgaggctt gtgcaatggt ctccgcatgg 12120

  atatcgcgtg ctgttctcct atcaactcgg aattttgtct taggggatgg cgtaggaacc 12180

  tcgaatgctg atcaggatgt gacaaaaacg actcgaaaac ccgggttcat cggtgtgctt 12240

  tcgggatcgc aagcgtaaag aaagattcac tcttccaaga cctagaagta tagcaaatca 12300

  gcagcagacc atcaatgtat agcgaatgcg cccatacaaa acgtgaactc cccggagaag 12360

  cactttgtcc agggacggga aataggcttc cggaacggga gcattggcag cacagctata 12420

  tcattctaag taaacaaatg taatgagcaa gcggacgagt gctgaaacct cctatgccgt 12480

  gaaggccgac gaaagcgcgt tgttggatta agtcgacaga agatgatatt gaaggagcat 12540

  ttttgggctt ggctggagct agtggaggtc aacacatcaa tgctattttg gtttagtcgt 12600

  ccaggcggat cacaaaattt gtgtcgtttg acatagggat aacagggtaa tgacaacttg 12660

  tccacgtgga attctaagct taggatccca ctgtggtgg 12699

  <210> 12

  <211> 1000

  <212> DNA

  <213> 人工序列

  <220>

  <223> 3'构巢曲菌trpC基因同源区

  <400> 12

  tgatttaata gctccatgtc aacaagaata aaacgcgttt tcgggtttac ctcttccaga 60

  tacagctcat ctgcaatgca ttaatgcatt gactgcaacc tagtaacgcc ttcaggctcc 120

  ggcgaagaga agaatagctt agcagagcta ttttcatttt cgggagacga gatcaagcag 180

  atcaacggtc gtcaagagac ctacgagact gaggaatccg ctcttggctc cacgcgacta 240

  tatatttgtc tctaattgta ctttgacatg ctcctcttct ttactctgat agcttgacta 300

  tgaaaattcc gtcaccagcc ctgggttcgc aaagataatt gcatgtttct tccttgaact 360

  ctcaagccta caggacacac attcatcgta ggtataaacc tcgaaatcat tcctactaag 420

  atggtataca atagtaacca tggttgccta gtgaatgctc cgtaacaccc aatacgccgg 480

  ccgaaacttt tttacaactc tcctatgagt cgtttaccca gaatgcacag gtacacttgt 540

  ttagaggtaa tccttctttc tagaagtcct cgtgtactgt gtaagcgccc actccacatc 600

  tccactcgag cctttttcga gcgaacctcc cctgatctcg aataatctca tcgtcatgcg 660

  cggtccaact tctgctagtt cggcatcctt atatcccgtc ttaacgaaaa cgtggtgacg 720

  aacctcaatg ctatcctctt tatttacaaa ggtgaccacg cggtttccaa cttttccagc 780

  ttctcgggga gggaaaagat gcttcagaat ttgaaccacg cgcttgccca gttttgtctt 840

  gaaaccctca aagatcaagt gcgggtagct ctctgacaca gtcccgcggg cagcgttggg 900

  aatatcggca cgtagaacaa cattatgcag ggagaagctg gctgtcgggc catgaggaag 960

  atgtgagatc gtcatcgcag taggggtacc acggtgttcg 1000

  <210> 13

  <211> 1007

  <212> DNA

  <213> 人工序列

  <220>

  <223> 构巢曲菌trpC基因的5'端

  <400> 13

  gaattcatgc cagttgttcc agtgatcttc gtttcgaaga tggacatcca atttgtgcaa 60

  gttattcggc ctacctggct gtggccgagg cagcgttatc atgaccgtcg ctgttcaaag 120

  ataaggcgag aagtttgcgg gctgtcttga cgatatggct tcgttcagac agatatagtt 180

  cccggagtcg caggctgcta ttcttctccg aaacaaactc ggctgcactg tttccatcac 240

  cgggtctggc gtttgaggat gtcagcgaaa ctcggccgca agtgacaccg aaaagtatcg 300

  actccggtgc ccgtttcaag ctagtggctt cctcaacagc gagtcggcca ggagacgtga 360

  agcaggacgg gttgccatcc agaccgtgac cgaacgcgtt gatttcatca atcccagcct 420

  tttcgctcaa ccaaagagca tcggctttga tttccttcag gtcatacgag gcttgtgcaa 480

  tggtctccgc atggatatcg cgtgctgttc tcctatcaac tcggaatttt gtcttagggg 540

  atggcgtagg aacctcgaat gctgatcagg atgtgacaaa aacgactcga aaacccgggt 600

  tcatcggtgt gctttcggga tcgcaagcgt aaagaaagat tcactcttcc aagacctaga 660

  agtatagcaa atcagcagca gaccatcaat gtatagcgaa tgcgcccata caaaacgtga 720

  actccccgga gaagcacttt gtccagggac gggaaatagg cttccggaac gggagcattg 780

  gcagcacagc tatatcattc taagtaaaca aatgtaatga gcaagcggac gagtgctgaa 840

  acctcctatg ccgtgaaggc cgacgaaagc gcgttgttgg attaagtcga cagaagatga 900

  tattgaagga gcatttttgg gcttggctgg agctagtgga ggtcaacaca tcaatgctat 960

  tttggtttag tcgtccaggc ggatcacaaa atttgtgtcg tttgaca 1007

  <210> 14

  <211> 17997

  <212> DNA

  <213> 人工序列

  <220>

  <223> 载体

  <400> 14

  ccaccacagt gggatccgaa gcttggaatt cacgtgactt gaagtcatta ccctgttatc 60

  cctagcggcc gctctagaac tagtggatct caggctgcca cgtcttcagt gccgtcctgc 120

  gcatcatcct catcgtcgtc tgtagggggc ttcgcccatg taatggaagc gcgcttctcg 180

  atgggcgttc cctggccccg gcctgttgta gatttggtta cgacaatctt gtccacaaac 240

  aagccaacga agaccctttt gtcatctaca ctcgctctac cccaccatga tttcggccca 300

  gtagggtctg catccgcatc ttccgggaac cactggtcca gcggcagctt cggagcctcc 360

  gcggcctcca gctcggccaa tctttcctcg gcaccctgct gacgcagggt gagcgcagct 420

  tgctgtttac ggaagtgctt gcgccccact gggccgtcgt acgcgcccgc agctcgatcc 480

  tcatacagct cttcaagagc attcagtgcg tcggctctct ctgcaacgag gttggctcgt 540

  tcgcccgact tctcaggggc ctcggtgagt ttaccgaatc ttctagcagc ctcccacagc 600

  agggccaggg tctcctcgtc gccttccgca tgccttatct tgttgaagat ccgctcagca 660

  acaaacttat ccaatgcagc catagaaaca ttacaggttc cctcgtgctg tccaggagcg 720

  gaggggtcaa caaccttccg gcggcggcag cgataagagt ccttgatact ttcctcccct 780

  ctcttcgatg tcataacagc gccgcattca cagtacaatt tatccattgc gctgagaatc 840

  gcctgaccac gactgagacc cttcccccgt cctcggccat ccagccacgc ctgcagctca 900

  taccactcag ccggttctat aatggggccg caatccagtt caaccggtcg tagagtgatt 960

  ggatcgcgtt gaattctgta cccctcgatc ttcgttgtcg gtgtgccatc gggcttcttc 1020

  ttataaatca cctcagcggc aaagccggcg atcctaggat cccgcagaat cctcatgaca 1080

  gtcgcgggat cccaggcaga cgaagcagtt ttcttcccaa tggtctcgcc gcgcgtcggt 1140

  acggcatctg cgtccatgcg cttgcagagg ccggtaatgc tccccgggtg gatggcagcc 1200

  tgtgagccag gcttaaaggg caagtgcttg tgagtcttga tctctcgcca ccaccatcgt 1260

  attacatcag gctcaaattc gaaagggccg gtcagtggtg tggtcgaatg tgccaatttg 1320

  ttaatcacta cgttcaccat gcgaccattc cttgtaatct ccttcgtttc cgaaaccagt 1380

  tcgaagccat aaggggcctt cccccccaca taacctccca attccctttg aaggttcttt 1440

  gtatccagga tcttagcgga tttgagggaa gattccttgt gtgatgcatc cagccgcata 1500

  attagatgaa tcaagtccat cacgttgccc tggcggaaga ccccttcttg cgtcgaaacg 1560

  atagtgacgc ccagggcgag caactctgag acgatcggaa tagcatccat aaccttcagc 1620

  ctgctgaagc gagaaacatc atatacaata atcatattga gtcttcccgc cctgcattca 1680

  ttgagaatcc gctcaaactc agggcgttcg gcggtgccaa aggcgctggt gcctggggcc 1740

  tctgaaaaat ggccaacaaa tctaaatctc ccgccatccc gctccacctc gcgctgaagg 1800

  tcagcggcct tgtcttcatt ggcagagcgc tgggtggctg gcgaagctgc agagctgttc 1860

  tcgcgttccc tcgactgtcg gtcgtacgct ccggcatagg tatctacacc tgtgactacg 1920

  ccttgtgtca ttttgaggcg aggtgatagg attggaagag ttctaattaa ctgagtagag 1980

  aactgttgat tgttggttga tgatgttggt gagactgaga accttggggg tctttatata 2040

  gatgttcagc tatgcgggga tgcgatcctg gggtaggaga gcacgtacgg ggccccgctc 2100

  gtttgtggct ctccgtgcgg acatcccgtg cggacagtac cagaaagtgc tccgtctctg 2160

  ctctatacgg ctctatacgc gtacctcttg aacggtgcgt ggagaggagt ggtgtgtcaa 2220

  tttccgcccc gccctcgtgc ggttccgcat gcatccaatc ctaggtcgga actatcccga 2280

  gctgcggatg ccgatgcgga cggacaagtg ggaactatca caatcagctt ttcagctggg 2340

  ggttattgga tggtagctcc acacaggcgg agaaatacga agggacttac agtgttccgg 2400

  ccgtgtcaaa gtgtctgtcg gcgaccctac gcccccaact gagagaactc aaaggttacc 2460

  ccagttgggg cagcttattt tttgtatact gttttgtgat agcacgaagt ttttccacgg 2520

  tatcttgtta aaaatatata tttgtggcgg gcttacctac atcaaattaa taagagacta 2580

  attataaact aaacacacaa gcaagctact ttagggtaaa agtttataaa tgcttttgac 2640

  gtataaacgt tgcttgtatt tattattaca attaaaggtg gatagaaaac ctagagacta 2700

  gttagaaact aatctcaggt ttgcgttaaa ctaaatcaga gcccgagagg ttaacagaac 2760

  ctagaagggg actagatatc cgggtaggga aacaaaaaaa aaaaacaaga cagccacata 2820

  ttagggagac tagttagaag ctagttccag gactaggaaa ataaaagaca atgataccac 2880

  agtctagttg acaactagat agattctaga ttgaggccaa agtctctgag atccaggtta 2940

  gttgcaacta atactagtta gtatctagtc tcctataact ctgaagctag aataacttac 3000

  tactattatc ctcaccactg ttcagctgcg caaacggagt gattgcaagg tgttcagaga 3060

  ctagttattg actagtcagt gactagcaat aactaacaag gtattaacct accatgtctg 3120

  ccatcaccct gcacttcctc gggctcagca gccttttcct cctcattttc atgctcattt 3180

  tccttgttta agactgtgac tagtcaaaga ctagtccaga accacaaagg agaaatgtct 3240

  taccactttc ttcattgctt gtctcttttg cattatccat gtctgcaact agttagagtc 3300

  tagttagtga ctagtccgac gaggacttgc ttgtctccgg attgttggag gaactctcca 3360

  gggcctcaag atccacaaca gagccttcta gaagactggt caataactag ttggtctttg 3420

  tctgagtctg acttacgagg ttgcatactc gctccctttg cctcgtcaat cgatgagaaa 3480

  aagcgccaaa actcgcaata tggctttgaa ccacacggtg ctgagactag ttagaatcta 3540

  gtcccaaact agcttggata gcttaccttt gccctttgcg ttgcgacagg tcttgcaggg 3600

  tatggttcct ttctcaccag ctgatttagc tgccttgcta ccctcacggc ggatctgcat 3660

  aaagagtggc tagaggttat aaattagcac tgatcctagg tacggggctg aatgtaactt 3720

  gcctttcctt tctcatcgcg cggcaagaca ggcttgctca aattcctacc agtcacaggg 3780

  gtatgcacgg cgtacggacc acttgaacta gtcacagatt agttagcaac tagtctgcat 3840

  tgaatggctg tacttacggg ccctcgccat tgtcctgatc atttccagct tcaccctcgt 3900

  tgctgcaaag tagttagtga ctagtcaagg actagttgaa atgggagaag aaactcacga 3960

  attctcgaca cccttagtat tgtggtcctt ggacttggtg ctgctatata ttagctaata 4020

  cactagttag actcacagaa acttacgcag ctcgcttgcg cttcttggta ggagtcgggg 4080

  ttgggagaac agtgccttca aacaagcctt cataccatgc tacttgacta gtcagggact 4140

  agtcaccaag taatctagat aggacttgcc tttggcctcc atcagttcct tcatagtggg 4200

  aggtccattg tgcaatgtaa actccatgcc gtgggagttc ttgtccttca agtgcttgac 4260

  caatatgttt ctgttggcag agggaacctg tcaactagtt aataactagt cagaaactag 4320

  tatagcagta gactcactgt acgcttgagg catcccttca ctcggcagta gacttcatat 4380

  ggatggatat caggcacgcc attgtcgtcc tgtggactag tcagtaacta ggcttaaagc 4440

  tagtcgggtc ggcttactat cttgaaatcc ggcagcgtaa gctccccgtc cttaactgcc 4500

  tcgagatagt gacagtactc tggggacttt cggagatcgt tatcgcgaat gctcggcata 4560

  ctaatcgttg actagtcttg gactagtccc gagcaaaaag gattggagga ggaggaggaa 4620

  ggtgagagtg agacaaagag cgaaataaga gcttcaaagg ctatctctaa gcagtatgaa 4680

  ggttaagtat ctagttcttg actagattta aaagagattt cgactagtta tgtacctgga 4740

  gtttggatat aggaatgtgt tgtggtaacg aaatgtaagg gggaggaaag aaaaagtcgg 4800

  tcaagaggta actctaagtc ggccattcct ttttgggagg cgctaaccat aaacggcatg 4860

  gtcgacttag agttagctca gggaatttag ggagttatct gcgaccaccg aggaacggcg 4920

  gaatgccaaa gaatcccgat ggagctctag ctggcggttg acaaccccac cttttggcgt 4980

  ttctgcggcg ttgcaggcgg gactggatac ttcgtagaac cagaaaggca aggcagaacg 5040

  cgctcagcaa gagtgttgga agtgatagca tgatgtgcct tgttaactag gtcaaaatct 5100

  gcaggtatgc ttgatgttat ccaaagtgtg agagaggaag gtccaaacat acacgattgg 5160

  gagagggcct aggtataaga gtttttgagt agaacgcatg tgagcccagc catctcgagg 5220

  agattaaaca cgggccggca tttgatggct atgttagtac cccaatggaa agcctgagag 5280

  tccagtggtc gcagataact ccctaaattc cctgagctaa ctctaagtcg accatgccgt 5340

  ttatggttag cgcctcccaa aaaggaatgg ccgacttaga gttacctctt gaccgacttt 5400

  ttctttcctc ccccttacat ttcgttacca caacacattc ctatatccaa actccaggta 5460

  cataactagt cgaaatctct tttaaatcta gtcaagaact agatacttaa ccttcatact 5520

  gcttagagat agcctttgaa gctcttattt cgctctttgt ctcactctca ccttcctcct 5580

  cctcctccaa tcctttttgc tcgggactag tccaagacta gtcaacgatt agtatgccga 5640

  gcattcgcga taacgatctc cgaaagtccc cagagtactg tcactatctc gaggcagtta 5700

  aggacgggga gcttacgctg ccggatttca agatagtaag ccgacccgac tagctttaag 5760

  cctagttact gactagtcca caggacgaca atggcgtgcc tgatatccat ccatatgaag 5820

  tctactgccg agtgaaggga tgcctcaagc gtacagtgag tctactgcta tactagtttc 5880

  tgactagtta ttaactagtt gacaggttcc ctctgccaac agaaacatat tggtcaagca 5940

  cttgaaggac aagaactccc acggcatgga gtttacattg cacaatggac ctcccactat 6000

  gaaggaactg atggaggcca aaggcaagtc ctatctagat tacttggtga ctagtccctg 6060

  actagtcaag tagcatggta tgaaggcttg tttgaaggca ctgttctccc aaccccgact 6120

  cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga gtctaactag tgtattagct 6180

  aatatatagc agcaccaagt ccaaggacca caatactaag ggtgtcgaga attcgtgagt 6240

  ttcttctccc atttcaacta gtccttgact agtcactaac tactttgcag caacgagggt 6300

  gaagctggaa atgatcagga caatggcgag ggcccgtaag tacagccatt caatgcagac 6360

  tagttgctaa ctaatctgtg actagttcaa gtggtccgta cgccgtgcat acccctgtga 6420

  ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga gaaaggaaag gcaagttaca 6480

  ttcagccccg tacctaggat cagtgctaat ttataacctc tagccactct ttatgcagat 6540

  ccgccgtgag ggtagcaagg cagctaaatc agctggtgag aaaggaacca taccctgcaa 6600

  gacctgtcgc aacgcaaagg gcaaaggtaa gctatccaag ctagtttggg actagattct 6660

  aactagtctc agcaccgtgt ggttcaaagc catattgcga gttttggcgc tttttctcat 6720

  cgattgacga ggcaaaggga gcgagtatgc aacctcgtaa gtcagactca gacaaagacc 6780

  aactagttat tgaccagtct tctagaaggc tctgttgtgg atcttgaggc cctggagagt 6840

  tcctccaaca atccggagac aagcaagtcc tcgtcggact agtcactaac tagactctaa 6900

  ctagttgcag acatggataa tgcaaaagag acaagcaatg aagaaagtgg taagacattt 6960

  ctcctttgtg gttctggact agtctttgac tagtcacagt cttaaacaag gaaaatgagc 7020

  atgaaaatga ggaggaaaag gctgctgagc ccgaggaagt gcagggtgat ggcagacatg 7080

  gtaggttaat accttgttag ttattgctag tcactgacta gtcaataact agtctctgaa 7140

  caccttgcaa tcactccgtt tgcgcagctg aacagtggtg aggataatag tagtaagtta 7200

  ttctagcttc agagttatag gagactagat actaactagt attagttgca actaacctgg 7260

  atctcagaga ctttggcctc aatctagaat ctatctagtt gtcaactaga ctgtggtatc 7320

  attgtctttt attttcctag tcctggaact agcttctaac tagtctccct aatatgtggc 7380

  tgtcttgttt tttttttttg tttccctacc cggatatcta gtccccttct aggttctgtt 7440

  aacctctcgg gctctgattt agtttaacgc aaacctgaga ttagtttcta actagtctct 7500

  aggttttcta tccaccttta attgtaataa taaatacaag caacgtttat acgtcaaaag 7560

  catttataaa cttttaccct aaagtagctt gcttgtgtgt ttagtttata attagtctct 7620

  tattaatttg atgtaggtaa gcccgccaca aatatatatt tttaacaaga taccgtggaa 7680

  aaacttcgtg ctatcacaaa acagtataca aaaaataagc tgatccacag gacgggtgtg 7740

  gtcgccatga tcgcgtagtc gatagtggct ccaagtagcg aagcgagcag gactgggcgg 7800

  cggccaaagc ggtcggacag tgctccgaga acgggtgcgc atagaaattg catcaacgca 7860

  tatagcgcta gcagcacgcc atagtgactg gcgatgctgt cggaatggac gatatcccgc 7920

  aagaggcccg gcagtaccgg cataaccaag cctatgccta cagcatccag ggtgacggtg 7980

  ccgaggatga cgatgagcgc attgttagat ttcatacacg gtgcctgact gcgttagcaa 8040

  tttaactgtg ataaactacc gcattaaagc ttcgacatca cccttaccca aactatatcc 8100

  aatgagcaaa gaataacgag tcaaagcggg cgcatttttc atcacatacg agtatgcaca 8160

  gtcaggactc cacgtcatac atcaaaaact tggaacgcat gagtctagct cagctcggct 8220

  cttttccgat ttttgcgcag cttctgttgc ggatcttgct gcttgtggag tctatgcccc 8280

  ggctgatgca ttgaaacaca acgcgcagat gatccaatca taccaaccag acgcatcagc 8340

  gcgtgtagct gggggaaggg taggtggtgt agcccagaaa gcgacacggc tggctttcaa 8400

  gaagtttatc aaccctagac agctttggag cggatacccg gctcttgtgg cgcatagctt 8460

  gccagtgtcg gcgatacaga tgcctctgta cgagactttt cggtatcgaa tttctgaata 8520

  tagattcgga gatcgagaga aggtgctaga aagatcaaga gattatggaa aagaaacagg 8580

  cccattcgac aatcggagag gctgcagcga cagccgcgat aagtgctgca gcctcgggcg 8640

  gtatagccag tgtcttgaca gcacccatgg atatagtccg gacacgaatc atgctcgatg 8700

  ctgcagacac aaccgcacct cagaagaaaa ggatgatcaa taccgtacgg gagattatac 8760

  gaacagatgg cccgagagga ctattccgag ggtgtgctat caacacgttt atggccgctg 8820

  tcggatcagg gttatacttt ggtctctacg aaagcaccaa atggtggcta ggctcggact 8880

  cgatggataa tagtgccatg ttagagtaag gggtgatggg aaatcttgta tataattgtg 8940

  attgtttgta cgatagtggc cgactgtaca ttagtgatac cccactctta gaaaatagac 9000

  caatctccag ctgcaccttc agacaatccg ggtaaaaatt ctcgtctatg ttggagattg 9060

  gtgtgatttt gaaacatgac ccttgactct gatcttgaat atgtccatat ctcgaggcag 9120

  gcatattatt catatagaga gggtatccct tagcatcggt ctgtcgtagt atccgactgc 9180

  tgaatttatg aatcgcatca tacttgcgac atactgccat aaaaagagta cgtatccacc 9240

  actacttatt gcgcaccaac acgcttcagg tatgcatccc atccctcttt ctggtaccgc 9300

  ttcgccgcct ccacgggatc aggagcagca taaattccac gaccagcaat gataaagtcg 9360

  gcaccgcgtc caacagcaga ttcaggagtc tggtattgct gtcccagctt gtctcccttc 9420

  gaggagaggt tgacacctgt cgtgaacacg acgaaatcct cctcctccga aggagagcta 9480

  acttcagact gaacctcgcc caggtgacgc gtcgagacga atcccatcac aaacttctta 9540

  tacttccgag catagtcaac agaagaagta gtatattgac cggtagccaa agatcccttg 9600

  gatgtcatct ccgcaaggat caaaaggccc ctctcagagc cgtagggaaa gtcctcggcc 9660

  gaagcagtct gggctagagc ctcgacgata ccctcaccgg gcagaatact gcagttgatg 9720

  atgtgggccc actcggagat gcgcagagtg ccgccatggt actgcttttg gactgtgttt 9780

  ccgatatcga tgaacttgcg atcttcgaag atgaggaaat tgtgcttctc tgcaagggcc 9840

  ttcagaccgg tgatggtctc ttcgctgaaa tcggagagga tatcgatgtg agttttgatc 9900

  acggcaatgt acggaccgag tcctgttaaa taatccacca ttaaccatta ttagatcatt 9960

  atgtaagtgg catccccggt gcgcatacgg tcagccaaat ccagcagctc tttggtggtt 10020

  gtcacgtcgg ccgaaacggt gacattggtt ttcttggcct cggcaacctc aaagagcttc 10080

  tttacgaggg cattggggtg cttgctagcg cgtgcactgt aggtcaattg cgacttggaa 10140

  gacatgttgg cgatggaggg gtagcgcggg gttctgcaac tatcgtagaa atgagcactt 10200

  agtggttgaa accggcttat tcagtagatt aatacttgaa gtttttagta atcagacaga 10260

  ataatcagga tgtccaatta ctacctctta atatgtggaa tgaatgatag atataaattg 10320

  tacgacaatt gccgcgaaaa attaaaatgg atctatggag gggacagtca tgcactagcc 10380

  acacgttcct ccgcctgtgg ggtgagccac atgcctcatc tggaccaaac acatcgatgc 10440

  agtcacatgc agataagatt agggcctatc cttagggtac ctgtccgcgc ggggattatg 10500

  cctggctttt tgcctgcttt tgatatcctt tcaaggacat agcgataagt ccaaccttat 10560

  cggccataat aatgtcaatg ccagcagcgg cttgggccta gaatattcca tcagctactg 10620

  aacaacttct acatcacaat ttgaaagctc taagaattaa tatagaagca cttaccttcg 10680

  cattttctgg tatattgttc tgagatccat aggatcagct tatcgatgat aagctgtcaa 10740

  acatgagaat tcgggccgtc gaccaattct catgtttgac agcttatcat cgaatttctg 10800

  ccattcatcc gcttattatc acttattcag gcgtagcaac caggcgttta agggcaccaa 10860

  taactgcctt aaaaaaatta cgccccgccc tgccactcat cgcagtactg ttgtaattca 10920

  ttaagcattc tgccgacatg gaagccatca caaacggcat gatgaacctg aatcgccagc 10980

  ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca tggtgaaaac gggggcgaag 11040

  aagttgtcca tattggccac gtttaaatca aaactggtga aactcaccca gggattggct 11100

  gagacgaaaa acatattctc aataaaccct ttagggaaat aggccaggtt ttcaccgtaa 11160

  cacgccacat cttgcgaata tatgtgtaga aactgccgga aatcgtcgtg gtattcactc 11220

  cagagcgatg aaaacgtttc agtttgctca tggaaaacgg tgtaacaagg gtgaacacta 11280

  tcccatatca ccagctcacc gtctttcatt gccatacgta attccagatg taaattcatc 11340

  atcaggcggg caagaatgtg aataaaggcc ggataaaact tgtgcttatt tttctttacg 11400

  gtctttaaaa aggccgtaat atccagctga acggtctggt tataggtaca ttgagcaact 11460

  gactgaaatg cctcaaaatg ttctttacga tgccattggg atatatcaac ggtggtatat 11520

  ccagtgattt ttttctccat tttagcttcc ttagctcctg aaaatctcga taactcaaaa 11580

  aatacgcccg gtagtgatct tatttcatta tggtgaaagt tggaacctct tacgtgccga 11640

  tcaacgtctc attttcgcca aaagttggcc cagggcttcc cggtatcaac agggacacca 11700

  ggatttattt attctgcgaa gtgatcttcc gtcacaggta tttattcgcg ataagctcat 11760

  ggagcggcgt aaccgtcgca caggaaggac agagaaagcg cggatctggg aagtgacgga 11820

  cagaacggtc aggacctgga ttggggaggc ggttgccgcc gctgctgctg acggtgtgac 11880

  gttctctgtt ccggtcacac cacatacgtt ccgccattcc tatgcgatgc acatgctgta 11940

  tgccggtata ccgctgaaag ttctgcaaag cctgatggga cataagtcca tcagttcaac 12000

  ggaagtctac acgaaggttt ttgcgctgga tgtggctgcc cggcaccggg tgcagtttgc 12060

  gatgccggag tctgatgcgg ttgcgatgct gaaacaatta tcctgagaat aaatgccttg 12120

  gcctttatat ggaaatgtgg aactgagtgg atatgctgtt tttgtctgtt aaacagagaa 12180

  gctggctgtt atccactgag aagcgaacga aacagtcggg aaaatctccc attatcgtag 12240

  agatccgcat tattaatctc aggagcctgt gtagcgttta taggaagtag tgttctgtca 12300

  tgatgcctgc aagcggtaac gaaaacgatt tgaatatgcc ttcaggaaca atagaaatct 12360

  tcgtgcggtg ttacgttgaa gtggagcgga ttatgtcagc aatggacaga acaacctaat 12420

  gaacacagaa ccatgatgtg gtctgtcctt ttacagccag tagtgctcgc cgcagtcgag 12480

  cgacagggcg aagcccctgg ttgccctcgc cgctgggctg gcggccgtct atggccctgc 12540

  aaacgcgcca gaaacgccgt cgaagccgtg tgcgagacac cgcggccggc cgccggcgtt 12600

  gtggatacct cgcggaaaac ttggccctca ctgacagatg aggggcggac gttgacactt 12660

  gaggggccga ctcacccggc gcggcgttga cagatgaggg gcaggctcga tttcggccgg 12720

  cgacgtggag ctggccagcc tcgcaaatcg gcgaaaacgc ctgattttac gcgagtttcc 12780

  cacagatgat gtggacaagc ctggggataa gtgccctgcg gtattgacac ttgaggggcg 12840

  cgactactga cagatgaggg gcgcgatcct tgacacttga ggggcagagt gctgacagat 12900

  gaggggcgca cctattgaca tttgaggggc tgtccacagg cagaaaatcc agcatttgca 12960

  agggtttccg cccgtttttc ggccaccgct aacctgtctt ttaacctgct tttaaaccaa 13020

  tatttataaa ccttgttttt aaccagggct gcgccctgtg cgcgtgaccg cgcacgccga 13080

  aggggggtgc ccccccttct cgaaccctcc cggtcgagtg agcgaggaag caccagggaa 13140

  cagcacttat atattctgct tacacacgat gcctgaaaaa acttcccttg gggttatcca 13200

  cttatccacg gggatatttt tataattatt ttttttatag tttttagatc ttctttttta 13260

  gagcgccttg taggccttta tccatgctgg ttctagagaa ggtgttgtga caaattgccc 13320

  tttcagtgtg acaaatcacc ctcaaatgac agtcctgtct gtgacaaatt gcccttaacc 13380

  ctgtgacaaa ttgccctcag aagaagctgt tttttcacaa agttatccct gcttattgac 13440

  tcttttttat ttagtgtgac aatctaaaaa cttgtcacac ttcacatgga tctgtcatgg 13500

  cggaaacagc ggttatcaat cacaagaaac gtaaaaatag cccgcgaatc gtccagtcaa 13560

  acgacctcac tgaggcggca tatagtctct cccgggatca aaaacgtatg ctgtatctgt 13620

  tcgttgacca gatcagaaaa tctgatggca ccctacagga acatgacggt atctgcgaga 13680

  tccatgttgc taaatatgct gaaatattcg gattgacctc tgcggaagcc agtaaggata 13740

  tacggcaggc attgaagagt ttcgcgggga aggaagtggt tttttatcgc cctgaagagg 13800

  atgccggcga tgaaaaaggc tatgaatctt ttccttggtt tatcaaacgt gcgcacagtc 13860

  catccagagg gctttacagt gtacatatca acccatatct cattcccttc tttatcgggt 13920

  tacagaaccg gtttacgcag tttcggctta gtgaaacaaa agaaatcacc aatccgtatg 13980

  ccatgcgttt atacgaatcc ctgtgtcagt atcgtaagcc ggatggctca ggcatcgtct 14040

  ctctgaaaat cgactggatc atagagcgtt accagctgcc tcaaagttac cagcgtatgc 14100

  ctgacttccg ccgccgcttc ctgcaggtct gtgttaatga gatcaacagc agaactccaa 14160

  tgcgcctctc atacattgag aaaaagaaag gccgccagac gactcatatc gtattttcct 14220

  tccgcgatat cacttccatg acgacaggat aggctagtga taataagtga ctgaggtatg 14280

  tgctcttctt atctcctttt gtagtgttgc tcttatttta aacaactttg cggttttttg 14340

  atgactttgc gattttgttg ttgctttgca gtaaattgca agatttaata aaaaaacgca 14400

  aagcaatgat taaaggatgt tcagaatgaa actcatggaa acacttaacc agtgcataaa 14460

  cgctggtcat gaaatgacga aggctatcgc cattgcacag tttaatgatg acagcccgga 14520

  agcgaggaaa ataacccggc gctggagaat aggtgaagca gcggatttag ttggggtttc 14580

  ttctcaggct atcagagatg ccgagaaagc agggcgacta ccgcacccgg atatggaaat 14640

  tcgaggacgg gttgagcaac gtgttggtta tacaattgaa caaattaatc atatgcgtga 14700

  tgtgtttggt acgcgattgc gacgtgctga agacgtattt ccaccggtga tcggggttgc 14760

  tgcccataaa gaaaggtggc gtttacaaaa cctcagtttc tgttcatctt gctcaggatc 14820

  tggctctgaa ggggctacgt gttttgctcg tggaaggtaa cgacccccag ggaacagcct 14880

  caatgtatca cggatgggta ccagatcttc atattcatgc agaagacact ctcctgcctt 14940

  tctatcttgg ggaaaaggac gatgtcactt atgcaataaa gcccacttgc tggccggggc 15000

  ttgacattat tccttcctgt ctggctctgc accgtattga aactgagtta atgggcaaat 15060

  ttgatgaagg taaactgccc accgatccac acctgatgct ccgactggcc attgaaactg 15120

  ttgctcatga ctatgatgtc atagttattg acagcgcgcc taacctgggt atcggcacga 15180

  ttaatgtcgt atgtgctgct gatgtgctga ttgttcccac gcctgctgag ttgtttgact 15240

  acacctccgc actgcagttt ttcgatatgc ttcgtgatct gctcaagaac gttgatctta 15300

  aagggttcga gcctgatgta cgtattttgc ttaccaaata cagcaatagt aatggctctc 15360

  agtccccgtg gatggaggag caaattcggg atgcctgggg aagcatggtt ctaaaaaatg 15420

  ttgtacgtga aacggatgaa gttggtaaag gtcagatccg gatgagaact gtttttgaac 15480

  aggccattga tcaacgctct tcaactggtg cctggagaaa tgctctttct atttgggaac 15540

  ctgtctgcaa tgaaattttc gatcgtctga ttaaaccacg ctgggagatt agataatgaa 15600

  gcgtgcgcct gttattccaa aacatacgct caatactcaa ccggttgaag atacttcgtt 15660

  atcgacacca gctgccccga tggtggattc gttaattgcg cgcgtaggag taatggctcg 15720

  cggtaatgcc attactttgc ctgtatgtgg tcgggatgtg aagtttactc ttgaagtgct 15780

  ccggggtgat agtgttgaga agacctctcg ggtatggtca ggtaatgaac gtgaccagga 15840

  gctgcttact gaggacgcac tggatgatct catcccttct tttctactga ctggtcaaca 15900

  gacaccggcg ttcggtcgaa gagtatctgg tgtcatagaa attgccgatg ggagtcgccg 15960

  tcgtaaagct gctgcactta ccgaaagtga ttatcgtgtt ctggttggcg agctggatga 16020

  tgagcagatg gctgcattat ccagattggg taacgattat cgcccaacaa gtgcttatga 16080

  acgtggtcag cgttatgcaa gccgattgca gaatgaattt gctggaaata tttctgcgct 16140

  ggctgatgcg gaaaatattt cacgtaagat tattacccgc tgtatcaaca ccgccaaatt 16200

  gcctaaatca gttgttgctc ttttttctca ccccggtgaa ctatctgccc ggtcaggtga 16260

  tgcacttcaa aaagccttta cagataaaga ggaattactt aagcagcagg catctaacct 16320

  tcatgagcag aaaaaagctg gggtgatatt tgaagctgaa gaagttatca ctcttttaac 16380

  ttctgtgctt aaaacgtcat ctgcatcaag aactagttta agctcacgac atcagtttgc 16440

  tcctggagcg acagtattgt ataagggcga taaaatggtg cttaacctgg acaggtctcg 16500

  tgttccaact gagtgtatag agaaaattga ggccattctt aaggaacttg aaaagccagc 16560

  accctgatgc gaccacgttt tagtctacgt ttatctgtct ttacttaatg tcctttgtta 16620

  caggccagaa agcataactg gcctgaatat tctctctggg cccactgttc cacttgtatc 16680

  gtcggtctga taatcagact gggaccacgg tcccactcgt atcgtcggtc tgattattag 16740

  tctgggacca cggtcccact cgtatcgtcg gtctgattat tagtctggga ccacggtccc 16800

  actcgtatcg tcggtctgat aatcagactg ggaccacggt cccactcgta tcgtcggtct 16860

  gattattagt ctgggaccat ggtcccactc gtatcgtcgg tctgattatt agtctgggac 16920

  cacggtccca ctcgtatcgt cggtctgatt attagtctgg aaccacggtc ccactcgtat 16980

  cgtcggtctg attattagtc tgggaccacg gtcccactcg tatcgtcggt ctgattatta 17040

  gtctgggacc acgatcccac tcgtgttgtc ggtctgatta tcggtctggg accacggtcc 17100

  cacttgtatt gtcgatcaga ctatcagcgt gagactacga ttccatcaat gcctgtcaag 17160

  ggcaagtatt gacatgtcgt cgtaacctgt agaacggagt aacctcggtg tgcggttgta 17220

  tgcctgctgt ggattgctgc tgtgtcctgc ttatccacaa cattttgcgc acggttatgt 17280

  ggacaaaata cctggttacc caggccgtgc cggcacgtta accgggctgc atccgatgca 17340

  agtgtgtcgc tgtcgacgag ctcgcgagct cggacatgag gttgccccgt attcagtgtc 17400

  gctgatttgt attgtctgaa gttgttttta cgttaagttg atgcagatca attaatacga 17460

  tacctgcgtc ataattgatt atttgacgtg gtttgatggc ctccacgcac gttgtgatat 17520

  gtagatgata atcattatca ctttacgggt cctttccggt gatccgacag gttacggggc 17580

  ggcgacctcg cgggttttcg ctatttatga aaattttccg gtttaaggcg tttccgttct 17640

  tcttcgtcat aacttaatgt ttttatttaa aataccctct gaaaagaaag gaaacgacag 17700

  gtgctgaaag cgagcttttt ggcctctgtc gtttcctttc tctgtttttg tccgtggaat 17760

  gaacaatgga agtccgagct catcgctaat aacttcgtat agcatacatt atacgaagtt 17820

  atattcgatg cggccaaggt gagccagtgt gattacattt gcggcctaac tgtggccagt 17880

  ccagttacgc tggagtcact agtatttagg tgacactata gaagcggccg ctagggataa 17940

  cagggtaatg acaacttgtc cacgtggaat tctaagctta ggatcccact gtggtgg 17997

  <210> 15

  <211> 485

  <212> DNA

  <213> 人工序列

  <220>

  <223> 真菌诱导型启动子

  <400> 15

  tttgaggcga ggtgatagga ttggaagagt tctaattaac tgagtagaga actgttgatt 60

  gttggttgat gatgttggtg agactgagaa ccttgggggt ctttatatag atgttcagct 120

  atgcggggat gcgatcctgg ggtaggagag cacgtacggg gccccgctcg tttgtggctc 180

  tccgtgcgga catcccgtgc ggacagtacc agaaagtgct ccgtctctgc tctatacggc 240

  tctatacgcg tacctcttga acggtgcgtg gagaggagtg gtgtgtcaat ttccgccccg 300

  ccctcgtgcg gttccgcatg catccaatcc taggtcggaa ctatcccgag ctgcggatgc 360

  cgatgcggac ggacaagtgg gaactatcac aatcagcttt tcagctgggg gttattggat 420

  ggtagctcca cacaggcgga gaaatacgaa gggacttaca gtgttccggc cgtgtcaaag 480

  tgtct 485

  <210> 16

  <211> 1842

  <212> DNA

  <213> 人工序列

  <220>

  <223> 真菌密码子优化的整合酶基因

  <400> 16

  tcaggctgcc acgtcttcag tgccgtcctg cgcatcatcc tcatcgtcgt ctgtaggggg 60

  cttcgcccat gtaatggaag cgcgcttctc gatgggcgtt ccctggcccc ggcctgttgt 120

  agatttggtt acgacaatct tgtccacaaa caagccaacg aagacccttt tgtcatctac 180

  actcgctcta ccccaccatg atttcggccc agtagggtct gcatccgcat cttccgggaa 240

  ccactggtcc agcggcagct tcggagcctc cgcggcctcc agctcggcca atctttcctc 300

  ggcaccctgc tgacgcaggg tgagcgcagc ttgctgttta cggaagtgct tgcgccccac 360

  tgggccgtcg tacgcgcccg cagctcgatc ctcatacagc tcttcaagag cattcagtgc 420

  gtcggctctc tctgcaacga ggttggctcg ttcgcccgac ttctcagggg cctcggtgag 480

  tttaccgaat cttctagcag cctcccacag cagggccagg gtctcctcgt cgccttccgc 540

  atgccttatc ttgttgaaga tccgctcagc aacaaactta tccaatgcag ccatagaaac 600

  attacaggtt ccctcgtgct gtccaggagc ggaggggtca acaaccttcc ggcggcggca 660

  gcgataagag tccttgatac tttcctcccc tctcttcgat gtcataacag cgccgcattc 720

  acagtacaat ttatccattg cgctgagaat cgcctgacca cgactgagac ccttcccccg 780

  tcctcggcca tccagccacg cctgcagctc ataccactca gccggttcta taatggggcc 840

  gcaatccagt tcaaccggtc gtagagtgat tggatcgcgt tgaattctgt acccctcgat 900

  cttcgttgtc ggtgtgccat cgggcttctt cttataaatc acctcagcgg caaagccggc 960

  gatcctagga tcccgcagaa tcctcatgac agtcgcggga tcccaggcag acgaagcagt 1020

  tttcttccca atggtctcgc cgcgcgtcgg tacggcatct gcgtccatgc gcttgcagag 1080

  gccggtaatg ctccccgggt ggatggcagc ctgtgagcca ggcttaaagg gcaagtgctt 1140

  gtgagtcttg atctctcgcc accaccatcg tattacatca ggctcaaatt cgaaagggcc 1200

  ggtcagtggt gtggtcgaat gtgccaattt gttaatcact acgttcacca tgcgaccatt 1260

  ccttgtaatc tccttcgttt ccgaaaccag ttcgaagcca taaggggcct tcccccccac 1320

  ataacctccc aattcccttt gaaggttctt tgtatccagg atcttagcgg atttgaggga 1380

  agattccttg tgtgatgcat ccagccgcat aattagatga atcaagtcca tcacgttgcc 1440

  ctggcggaag accccttctt gcgtcgaaac gatagtgacg cccagggcga gcaactctga 1500

  gacgatcgga atagcatcca taaccttcag cctgctgaag cgagaaacat catatacaat 1560

  aatcatattg agtcttcccg ccctgcattc attgagaatc cgctcaaact cagggcgttc 1620

  ggcggtgcca aaggcgctgg tgcctggggc ctctgaaaaa tggccaacaa atctaaatct 1680

  cccgccatcc cgctccacct cgcgctgaag gtcagcggcc ttgtcttcat tggcagagcg 1740

  ctgggtggct ggcgaagctg cagagctgtt ctcgcgttcc ctcgactgtc ggtcgtacgc 1800

  tccggcatag gtatctacac ctgtgactac gccttgtgtc at 1842

  <210> 17

  <211> 613

  <212> PRT

  <213> 人工序列

  <220>

  <223> 真菌密码子优化的整合酶

  <400> 17

  Met Thr Gln Gly Val Val Thr Gly Val Asp Thr Tyr Ala Gly Ala Tyr

  1 5 1015

  Asp Arg Gln Ser Arg Glu Arg Glu Asn Ser Ser Ala Ala Ser Pro Ala

  202530

  Thr Gln Arg Ser Ala Asn Glu Asp Lys Ala Ala Asp Leu Gln Arg Glu

  354045

  Val Glu Arg Asp Gly Gly Arg Phe Arg Phe Val Gly His Phe Ser Glu

  505560

  Ala Pro Gly Thr Ser Ala Phe Gly Thr Ala Glu Arg Pro Glu Phe Glu

  65707580

  Arg Ile Leu Asn Glu Cys Arg Ala Gly Arg Leu Asn Met Ile Ile Val

  859095

  Tyr Asp Val Ser Arg Phe Ser Arg Leu Lys Val Met Asp Ala Ile Pro

  100 105 110

  Ile Val Ser Glu Leu Leu Ala Leu Gly Val Thr Ile Val Ser Thr Gln

  115 120 125

  Glu Gly Val Phe Arg Gln Gly Asn Val Met Asp Leu Ile His Leu Ile

  130 135 140

  Met Arg Leu Asp Ala Ser His Lys Glu Ser Ser Leu Lys Ser Ala Lys

  145 150 155 160

  Ile Leu Asp Thr Lys Asn Leu Gln Arg Glu Leu Gly Gly Tyr Val Gly

  165 170 175

  Gly Lys Ala Pro Tyr Gly Phe Glu Leu Val Ser Glu Thr Lys Glu Ile

  180 185 190

  Thr Arg Asn Gly Arg Met Val Asn Val Val Ile Asn Lys Leu Ala His

  195 200 205

  Ser Thr Thr Pro Leu Thr Gly Pro Phe Glu Phe Glu Pro Asp Val Ile

  210 215 220

  Arg Trp Trp Trp Arg Glu Ile Lys Thr His Lys His Leu Pro Phe Lys

  225 230 235 240

  Pro Gly Ser Gln Ala Ala Ile His Pro Gly Ser Ile Thr Gly Leu Cys

  245 250 255

  Lys Arg Met Asp Ala Asp Ala Val Pro Thr Arg Gly Glu Thr Ile Gly

  260 265 270

  Lys Lys Thr Ala Ser Ser Ala Trp Asp Pro Ala Thr Val Met Arg Ile

  275 280 285

  Leu Arg Asp Pro Arg Ile Ala Gly Phe Ala Ala Glu Val Ile Tyr Lys

  290 295 300

  Lys Lys Pro Asp Gly Thr Pro Thr Thr Lys Ile Glu Gly Tyr Arg Ile

  305 310 315 320

  Gln Arg Asp Pro Ile Thr Leu Arg Pro Val Glu Leu Asp Cys Gly Pro

  325 330 335

  Ile Ile Glu Pro Ala Glu Trp Tyr Glu Leu Gln Ala Trp Leu Asp Gly

  340 345 350

  Arg Gly Arg Gly Lys Gly Leu Ser Arg Gly Gln Ala Ile Leu Ser Ala

  355 360 365

  Met Asp Lys Leu Tyr Cys Glu Cys Gly Ala Val Met Thr Ser Lys Arg

  370 375 380

  Gly Glu Glu Ser Ile Lys Asp Ser Tyr Arg Cys Arg Arg Arg Lys Val

  385 390 395 400

  Val Asp Pro Ser Ala Pro Gly Gln His Glu Gly Thr Cys Asn Val Ser

  405 410 415

  Met Ala Ala Leu Asp Lys Phe Val Ala Glu Arg Ile Phe Asn Lys Ile

  420 425 430

  Arg His Ala Glu Gly Asp Glu Glu Thr Leu Ala Leu Leu Trp Glu Ala

  435 440 445

  Ala Arg Arg Phe Gly Lys Leu Thr Glu Ala Pro Glu Lys Ser Gly Glu

  450 455 460

  Arg Ala Asn Leu Val Ala Glu Arg Ala Asp Ala Leu Asn Ala Leu Glu

  465 470 475 480

  Glu Leu Tyr Glu Asp Arg Ala Ala Gly Ala Tyr Asp Gly Pro Val Gly

  485 490 495

  Arg Lys His Phe Arg Lys Gln Gln Ala Ala Leu Thr Leu Arg Gln Gln

  500 505 510

  Gly Ala Glu Glu Arg Leu Ala Glu Leu Glu Ala Ala Glu Ala Pro Lys

  515 520 525

  Leu Pro Leu Asp Gln Trp Phe Pro Glu Asp Ala Asp Ala Asp Pro Thr

  530 535 540

  Gly Pro Lys Ser Trp Trp Gly Arg Ala Ser Val Asp Asp Lys Arg Val

  545 550 555 560

  Phe Val Gly Leu Phe Val Asp Lys Ile Val Val Thr Lys Ser Thr Thr

  565 570 575

  Gly Arg Gly Gln Gly Thr Pro Ile Glu Lys Arg Ala Ser Ile Thr Trp

  580 585 590

  Ala Lys Pro Pro Thr Asp Asp Asp Glu Asp Asp Ala Gln Asp Gly Thr

  595 600 605

  Glu Asp Val Ala Ala

  610

《真菌人工染色体、组成、方法和用途.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)