欢迎光临小豌豆知识网!
当前位置:首页 > 生活技术 > 其他技术> 藻类中过量产生原卟啉IX的方法及由此产生的组合物独创技术351543字

藻类中过量产生原卟啉IX的方法及由此产生的组合物

2021-03-01 19:44:29

藻类中过量产生原卟啉IX的方法及由此产生的组合物

  相关申请的交叉引用

  根据35U.S.C.§119(e),本申请要求2019年6月24日提交的美国临时申请No.62/865,800、2019年5月20日提交的美国临时申请No.62/850,227和2018年11月8日提交的美国临时申请No.62/757,534的优先权,其全部内容通过引用并入本文。

  序列表

  本申请包含序列表,该序列表已以ASCII格式电子提交,并通过引用整体并入本文。所述ASCII副本创建于2019年11月7日,名为20498-202380_SL.txt,大小为208KB。

  背景技术

  随着工业化畜牧业的出现,动物肉的消费量持续增长。迄今为止,畜牧业占温室气体产生的18%以上,是导致气候变化的主要原因之一。除了土地利用,畜牧业还需要大量淡水,而淡水是一种越来越难以获得的有限资源。据估计,生产一磅牛肉需要1799加仑的淡水,而生产一磅猪肉需要576加仑的水。相比之下,则需要216加仑淡水来生产1磅大豆或108加仑来生产1磅玉米。生产动物肉所需淡水的强度是使动物所消耗的植物生长所需的水以及动物将其消耗的食物转化为实际肉的效率低下的结果。

  为了解决有关动物食用肉类的可持续性和道德问题,食品行业一直在积极尝试开发植物基的替代品,这些替代品具有类似于肉类产品的味道、触感和气味。但是,当前许多植物基的替代品都无法渗透到更大的食品和消费者市场。通常,这些替代品由基于植物的材料组成,这些材料经挤压以产生紧致的质地以改善口感,并且然后与各种调味剂和形成香气的化合物混合以改善这些产品的味道和气味。不幸的是,这些替代品对已经致力于素食/素食生活方式的消费者,而不是那些更习惯于吃肉的消费者有着吸引力。为了改善食品生态系统的可持续性,必须开发出能够吸引目前偏爱肉类的消费者的产品。通过生产下一代植物基的产品,可以大大减少温室气体的贡献和畜牧业所产生的对水的需求。

  最近的进展表明,使用从宿主生物中纯化的含血红素的蛋白质来使产品的风味和香气与肉类更接近的潜力。据认为,来自含血红素的蛋白质的血红素负责赋予肉类产品“肉类”的风味和香气。但是,含血红素蛋白的可用来源昂贵且技术密集,限制了其用途。例如,血红素结合蛋白豆血红蛋白已从大豆根中提取出来,但事实证明该过程很昂贵,使其掺入肉类替代品的经济性较差。酵母,毕赤酵母已经被工程化以表达血红素结合蛋白,例如用于产生血红素分子的另外8种酶途径。该方法仍然需要在将血红素结合蛋白掺入最终产物之前将其从表达宿主中纯化出来,由于经济限制,该方法限制了可能产生的积极影响。除了经济不佳外,该产品还经过基因改造,因此对许多选择食用非基因工程食品的消费者而言吸引力较小。因此,存在掺入本文所述的含血红素蛋白的可食用产品的需要。

  发明内容

  本文提供了组合物和生产这些组合物的方法,其为食品和食品成分以及其他用途(诸如动物饲料)提供了风味、颜色、口感、味道、气味、质地和营养的新来源。本文提供了由过量产生原卟啉IX的藻类产生此类组合物的组合物和方法。因此,在一个示例性方面,本发明提供了一种组合物,该组合物包含来自藻株的制剂,其中,该藻株过表达或积累原卟啉IX(PPIX)。在一些实施方案中,制剂是来自藻株的生物质。在一些实施方案中,制剂是来自藻株的经分级(fractionated)的生物质。在这些实施方案中,预期经分级的生物质包含富含PPIX的级分(fraction)。进一步地,在这些实施方案中,还预期富含PPIX的级分进一步包含富含蛋白质的级分。在一些实施方案中,其中,制剂是来自藻类培养物的细胞外级分(extracellular fraction)。

  在一些实施方案中,制剂的颜色是红色或者类红色。可选地和/或另外地,制剂含有比血红素的量更多的PPIX。可选地和/或另外地,制剂包含少于约1%、约0.5%、约0.1%、约0.05%、约0.01%、约0.005%或约0.001%的血红素。可选地和/或另外地,制剂包含少于约1%、约0.5%、约0.1%、约0.05%、约0.01%、约0.005%或约0.001%的血红素蛋白质。

  在一些实施方案中,制剂不含可检测量的血红素蛋白质。可选地和/或另外地,制剂不含可检测量的血红素。可选地和/或另外地,制剂不含可检测量的蛋白质。在一些实施方案中,制剂的原卟啉IX含量大于叶绿素含量。

  在一些实施方案中,制剂向可食用组合物提供总蛋白质含量的至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%。可选地和/或另外地,制剂向组合物提供维生素A、β胡萝卜素或其组合。在这些实施方案中,优选维生素A、β胡萝卜素或其组合为每日推荐需求的至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%。在一些实施方案中,制剂提供少于约0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、1.2%、1.5%、2%、5%或10%的组合物中总饱和脂肪。可选地和/或另外地,该制剂向组合物提供至少约5mg、10mg、15mg、20mg、25mg、30mg、35mg、40mg、45mg、50mg、55mg、60mg、65mg、70mg、75mg、80mg、85mg、90mg、95mg、100mg、125mg、150mg、175mg、200mg、250mg、300mg、350mg、400mg、450mg或500mg的ω-3脂肪酸。

  在一些实施方案中,组合物具有源自制剂的红色或类红色。可选地和/或另外地,该组合物具有源自制剂的肉或类肉风味。可选地和/或另外地,该组合物具有源自制剂的肉或类肉质地。

  在一些实施方案中,藻类是衣藻属(Chlamydomonas sp.)。可选地,藻类是莱茵衣藻(Chlamydomonas reinhardtii)。在一些实施方案中,衣藻属是保藏在明尼苏达大学衣藻收集中心的株系CC-125或其衍生物。在一些实施方案中,藻类的亚铁螯合酶活性或亚铁螯合酶的表达降低或不存在。

  本发明的另一方面包括包含本文所述组合物的食品(food product)。在一些实施方案中,食品包括清洁肉、培养肉、合成肉、植物基肉或非动物细胞基肉。可选地和/或另外地,食品选自由类牛肉食品、类鱼肉产品、类鸡肉产品、类猪肉产品和肉复制品组成的组。可选地和/或另外地,食品是严格素食、素食或无麸质的。

  本发明的另一方面包括包含本文所述组合物的可食用的成分。在一些实施方案中,成分是成品的一部分,其中,成品具有源自成分的红色或类红色。在一些实施方案中,成分是成品的一部分,其中,成品具有源自成分的红色或类红色。可选地和/或另外地,成分是成品的一部分,其中,成品具有源自成分的血的Hasan外观。在一些实施方案中,成品是汉堡、鱼替代品、香肠、烤肉串(kebab)、肉片(filet)、碎肉类产品或肉丸的成分。在一些实施方案中,可食用组合物是成品的一部分,并且其中,成品是动物饲料。

  在一些实施方案中,可食用成分与蛋白质源、脂肪源、碳水化合物、淀粉、增稠剂、维生素、矿物质或其任意组合相组合。在一些实施方案中,蛋白质源是组织化小麦蛋白质、组织化大豆蛋白质、真菌蛋白质或藻类蛋白质。在这些实施方案中,预期成品不含动物蛋白质。在一些实施方案中,脂肪源包括精炼椰子油或葵花油中的至少一种。在一些实施方案中,可食用组合物进一步包含马铃薯淀粉、甲基纤维素、水和风味剂中的至少一种,其中,风味剂选自酵母提取物、大蒜粉、洋葱粉和盐中的至少一种。

  本发明的另一方面包括肉替代品,其包含本文所述的组合物或可食用成分。在一些实施方案中,肉替代品进一步包含(a)0.01%-5%(以肉复制品基质的重量计)的非动物原卟啉IX,(b)选自葡萄糖、核糖、果糖、乳糖、木糖、阿拉伯糖、葡萄糖-6-磷酸、麦芽糖和半乳糖及其任意组合的化合物,(c)至少1.5mM的选自半胱氨酸、胱氨酸、硫胺素、甲硫氨酸及其任意组合的化合物,和(d)选自植物蛋白、真菌蛋白和藻类蛋白的一种或更多种蛋白质。优选地,肉替代品是不含动物产品的磨碎的类牛肉食品;其中,烹饪磨碎的类牛肉食品使得产生具有牛肉相关香味的至少两种挥发性化合物。

  本发明的另一方面包括生产原卟啉IX组合物的方法。该方法包括以下步骤:使含作为原卟啉IX过量产生者的藻类的藻类群体生长;以及从培养物中分离原卟啉IX组合物。在一些实施方案中,培养步骤包括在有氧发酵条件下培养藻类培养物。在一些实施方案中,藻类含有叶绿体。在这些的实施方案中,原卟啉IX的生物合成发生在叶绿体中。

  在一些实施方案中,藻类缺乏产生叶绿素的能力。可选地和/或另外地,藻类缺乏产生功能性镁螯合酶的能力。可选地和/或另外地,藻类的ChlD1、ChlD2或ChlDH减少或缺乏。可选地和/或另外地,藻类的功能性光依赖的原叶绿素酸酯减少或缺乏。可选地和/或另外地,藻类的功能性光非依赖的原叶绿素酸酯减少或缺乏。可选地和/或另外地,藻类的ChlB、ChlL或ChlN减少或缺乏。可选地和/或另外地,藻类过表达谷氨酰-tRNA还原酶、谷氨酸-1-半醛氨基转移酶、ALA脱氢酶、胆色素原脱氨酶、UPG III合酶、UPG III脱羧酶、CPG氧化酶和PPG氧化酶中的一种或更多种。

  在一些实施方案中,藻类是通过交配产生的,并且其中,所生成的藻株的颜色是红色或类红色。可选地和/或另外地,藻类是通过诱变生成的。在一些实施方案中,藻类的颜色是红色或类红色。在一些实施方案中,经分离的原卟啉IX组合物是藻类生物质。在这些实施方案中,预期藻类生物质被分级。可选地和/或另外地,藻类生物质被分级以产生包含原卟啉IX的富含蛋白质的级分。

  在一些实施方案中,经分离的原卟啉IX组合物从藻类培养物的细胞外培养基中分离。可选地和/或另外地,经分离的原卟啉IX组合物从藻类蛋白质分离出。在一些实施方案中,藻类缺乏类胡萝卜素。在一些实施方案中,藻类是衣藻属。在一些实施方案中,藻类是莱茵衣藻。在一些实施方案中,衣藻属是保藏在明尼苏达大学衣藻收集中心的株系CC-125或其衍生物。

  在一些实施方案中,在与另一种藻类交配后,过表达的原卟啉IX藻株的后代比其亲代藻株生长得更快。可选地和/或另外地,原卟啉IX藻株是通过将类胡萝卜素缺乏的株系与呈现红色或类红色的株系交配而产生的。可选地和/或另外地,过表达原卟啉IX的藻类是通过诱变第一起始株系和选择在黑暗中比第一起始株系生长更快的第二株系而生成的。可选地和/或另外地,过表达原卟啉IX的藻类是通过诱变第一起始株系和从经诱变第一株系中选择缺乏一种或更多种类胡萝卜素的第二株系而生成的。

  在一些实施方案中,藻类缺乏功能性亚铁螯合酶。可选地和/或另外地,藻类亚铁螯合酶的量或活性降低。可选地和/或另外地,与野生型株系相比,藻类血红素的量减少或缺乏血红素。

  在一些实施方案中,该方法进一步包括以下步骤:a)在黑暗条件下培养藻株,其中,该株系不产生叶绿素或叶绿素产量减少,以及(b)收集一部分颜色为红色或类红色的藻类培养物以产生原卟啉IX组合物。优选地,藻类是衣藻属。在一些实施方案中,藻类是莱茵衣藻。在一些实施方案中,当在黑暗条件中生长时,藻类呈现出红色或类红色。

  在一些实施方案中,其中,经收集部分是来自藻类培养物的细胞外培养基。可选地和/或另外地,经收集部分是来自藻类培养物的生物质或经分级的生物质。在一些实施方案中,藻类在有氧发酵条件下生长。可选地和/或另外地,藻类生长至密度大于约10g/L、20g/L、30g/L、40g/L、50g/L、75g/L、100g/L、125g/L或150g/L。可选地和/或另外地,藻类以乙酸盐/酯作为还原碳源生长。可选地和/或另外地,其中,藻类以糖作为还原碳源生长。可选地和/或另外地,藻类培养物在培养步骤期间补充铁。在一些实施方案中,藻类培养物以大于约0.1g/L、1.0g/L、5.0g/L、10g/L、20g/L、50g/L、80g/L或100g/L的密度接种。

  在一些实施方案中,该方法进一步包括对经收集部分进行分级,其中,分级从经收集部分中除去基本上全部或大部分的选自由类胡萝卜素、淀粉和蛋白质组成的组的组分。可选地和/或另外地,该方法进一步包括对经收集部分进行分级,其中,分级从经收集部分中除去基本上全部或大部分的血红素、血红素结合蛋白或其组合。可选地和/或另外地,该方法进一步包括对经收集部分进行分级,其中,分级产生富含蛋白质的级分。

  在一些实施方案中,藻类的镁螯合酶、镁原卟啉原IX、原叶绿素酸酯、叶绿素酸酯和叶绿素中的一种或更多种缺乏或者减少。可选地和/或另外地,藻类中的亚铁螯合酶缺乏或者减少。在一些实施方案中,藻类不是转基因株系。

  本发明的另一个方面包括通过本文描述的方法生产的清洁肉(clean meat)产品,并且该方法进一步包括将经收集部分与制造清洁肉的组合物结合,其中,经收集部分为清洁肉产品提供红色或类红色的颜色。在一些实施方案中,经收集部分是富含PPIX的级分或经纯化的PPIX。

  本发明的另一方面包括通过本文所述方法生产的可食用成分,并且原卟啉IX组合物赋予可食用成分肉或类肉风味、肉或类肉质地、肉或类肉气味或其任意组合。在一些实施方案中,可食用成分被掺入选自由类牛肉(beef-like)食品、类鱼肉产品、类鸡肉产品、类猪肉产品和肉复制品组成的组的成品中。可选地和/或另外地,可食用成分是严格素食、素食或无麸质的。可选地和/或另外地,可食用成分是不含动物蛋白质的。可选地和/或另外地,可食用成分不含任何转基因的组分。

  本发明的另一方面包括通过本文所述方法生产的含原卟啉IX的组合物。在一些实施方案中,该组合物不含可检测水平的血红素、血红素结合蛋白或其组合。

  附图说明

  图1是显示藻类中血红素产生的示例性途径的示意图。这种示例性途径可以被野生型藻类用来产生叶绿素,但它也可以用来生成原卟啉IX(PPIX)。

  图2是显示过表达PPIX的藻类的示例性分级的示意图,其显示提取物的丰富红色。

  图3是显示用0.01克、0.1克、1.0克和5.0克富含PPIX的藻类制成的汉堡的示意图。

  图4是显示不含富含血红素的藻类、添加了富含PPIX的藻类的植物基汉堡的成分混合物,或者形成汉堡的添加了富含血红素的藻类的成分在烹饪前后的示意图。

  图5是显示富含PPIX的无肉“金枪鱼”的实例的示意图。

  图6显示了野生型绿藻和具有CHLH基因突变的红色藻的部分序列比对(上部序列(Seq_1)是绿藻CHLH基因的部分核酸序列(SEQ ID NO:27的残基1621-1679)和部分氨基酸序列(SEQ ID NO:28的残基451-460),下部序列(Seq_2)是具有突变的红色藻CHLH基因的部分核酸序列(SEQ ID NO:129的残基1621-1680)和部分氨基酸序列(SEQ ID NO:152的残基451-460)(星号)。如图所示,野生型叶绿素核酸序列(SEQ ID NO:27)在1678位插入了硫胺素,引起SEQ ID NO:28的野生型叶绿素氨基酸序列在560位的脯氨酸变为丝氨酸。

  具体实施方式

  在描述本发明的组合物和方法之前,应当理解,本发明不限于所描述的特定组合物、方法和实验条件,因为这些组合物、方法和条件可以变化。还应当理解,这里使用的术语仅仅是为了描述特定实施方案,而不是为了进行限制,因为本发明的范围将只限于所附权利要求。如在本说明书和所附权利要求书中所使用的,单数形式“a”、“an”和“the”包括复数引用,除非上下文另有明确指示。因此,例如,对“该方法”的引用包括一种或更多种方法和/或本文所述类型的步骤,这对于阅读本发明等的本领域技术人员来说将变得显而易见。此外,就详细描述和/或权利要求中使用的术语“including”、“includes”、“having”、“has”、“with”或其变体而言,这些术语旨在以类似于术语“comprising”的方式包含在内。

  术语“约”或“近似”是指在由本领域普通技术人员确定的具体值的可接受误差范围内,这将部分取决于如何测量或确定该值,例如测量系统的限制。例如,“约”可以指在给定值的实践中,1个或1个以上的标准偏差。在申请和权利要求书中描述了特定值的情况下,除非另有说明,否则术语“约”应该被假设为表示特定值的可接受误差范围。

  本文所用的一种或更多种基因和/或酶的“缺乏”或“缺少”,或“减少”包括例如基因序列的突变或缺失、基因(RNA和/或蛋白质)表达的减少或缺乏和/或基因产物(RNA和/或蛋白质)的积累或稳定性的缺少。

  如本文所用,酶或基因的“过表达(overexpress)”和“过表达(overexpressing)”包括例如基因(RNA和/或蛋白质)表达的增加和/或基因产物(RNA和/或蛋白质)积累或稳定性的增加。这种过表达能包括调节区和/或基因序列,以及拷贝数、基因组位置和翻译后修饰的改变。

  如本文所用,术语“工程藻类”用于指含有一种或更多种基因修饰的藻类。在某些情况下,当工程藻类通过重组技术将异源核酸整合到基因组中时,其也是重组修饰的生物体。在其他情况下,工程藻类不是重组修饰的生物体(例如,通过紫外线、化学或辐射诱变对其进行修饰)。在某些情况下,不是重组修饰生物体的藻类被称为非GMO,来自这种藻类的组分可以被称为非GMO组分。

  如本文所用,术语“基因修饰”用于指在自然条件下不会发生的对生物体遗传物质的任何操纵。基因修饰可以包括通过诱变(如紫外线、x光、γ射线和化学暴露)进行的修饰。基因修饰可以包括基因编辑。在某些情况下,能通过重组技术进行基因修饰。如本文所用,“重组修饰的生物体”用于指通过重组技术将异源核酸(例如重组核酸)整合到其基因组中的生物体。进行这种操作的方法是本领域普通技术人员已知的,包括但不限于利用载体转化具有感兴趣核酸序列的细胞的技术。定义中包括各种形式的基因编辑,其中使用工程核酸酶,或“分子剪刀”在活生物体基因组中插入、删除或替换DNA。这些核酸酶在基因组的期望位置产生位点特异性双链断裂(DSB)。诱导的双链断裂通过非同源末端连接(NHEJ)或同源重组(HR)得到修复,引起靶向突变(即编辑)。

  除非另有定义,这里使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。尽管在本发明的实践或测试中可以使用类似于或等同于本文所述的任何方法和材料,但是现在描述优选的方法和材料。

  本文提供了在食品和动物饲料成分和产品中选择、生长和掺入过表达原卟啉IX(PPIX)分子的藻类的方法。这些产品能包括非转基因和植物基替代食品。众所周知,藻类会产生许多化合物,使得这些水生生物呈现不同的颜色。这些化合物包括但不限于使藻类变绿的叶绿素、使藻类呈现黄色或橙色的β-胡萝卜素、使藻类呈现红色的虾青素或其他各种色素(诸如使藻类变蓝的藻蓝蛋白)。虽然上述每一种化合物都已添加到食品中,但迄今为止还没有产品掺入过量生产PPIX的藻类以赋予红色和/或肉味和气味。

  本文提供了使用过量生产PPIX的藻类的株系、方法和组合物。在一些实施方案中,当生长时,藻株的颜色是红色或者类红色。如本文所用,在一些实施方案中,类红色可以是波长在590纳米到750纳米之间的任何颜色或者该颜色的任何混合物。可选地和/或另外地,在一些实施方案中,类红色能被定义为在RGB(r.g.b)中r值在255和80之间,g或b值在0和80之间的任何颜色。在一些实施方案中,由藻类培养物制备的过量生产PPIX的制剂,当掺入食物和其它可食用产品中时,赋予粉色或红色。在一些实施方案中,由藻类培养物制备的过量生产PPIX的制剂,当掺入食物和其它可食用产品中时,赋予“肉的”风味、气味和/或质地。

  不受理论限制,血红素途径是从叶绿素生化途径分支的生化途径,如图1所示。简而言之,这一途径始于谷氨酸tRNA,谷氨酸tRNA还原酶和GSA氨基转移酶将其转化为5-氨基乙酰丙酸(ALA)。接下来,ALA被ALA脱氢酶转化为胆色素原。接下来,胆色素原通过胆色素原脱氨酶转化为羟甲基胆素。接下来,羟甲基胆素被UPG III合酶转化为尿卟啉原III。接下来,尿卟啉原III被UPGIII脱羧酶转化为粪卟啉原。接下来,粪卟啉原被CPG氧化酶转化为原卟啉原IX。接下来,原卟啉原IX被PPG氧化酶转化为原卟啉IX。原卟啉IX可穿梭于叶绿素产生途径或转向血红素B。最后,原卟啉IX被亚铁螯合酶转化为血红素B,亚铁螯合酶将铁附着于原卟啉IX上。

  通过减少通向叶绿素的代谢通量,可以增加通向PPIX以及血红素B的通量。通过减少或消除亚铁螯合酶,该途径产生PPIX,但从PPIX到血红素的转化被减少或消除。

  在本文的一些实施方案中,用于该方法和由此产生的组合物的藻株向叶绿素的代谢通量减少,而向血红素B的代谢通量增加。在本文的一些实施方案中,工程藻株在亚铁螯合酶中包含基因修饰(诸如在一个或更多个核苷酸序列(例如,SEQ ID NO:7)和/或氨基酸序列(例如,SEQ ID NO:8)),并包括一个或更多个调控区的基因修饰(诸如SEQ ID NO:114、115的那些),外显子(诸如SEQ ID NO:116-122的那些),以及内含子(例如SEQ ID NO:123-128的那些)。

  在一些实施方案中,藻株是其中叶绿素和类胡萝卜素合成减少的藻株。在一些实施方案中,藻株的叶绿素的量缺乏或减少。在一些实施方案中,与野生型藻类相比,藻株在亚铁螯合酶的功能、量或活性方面存在缺乏或减少至少10%、至少20%、至少30%、至少40%、至少50%。在一些实施方案中,藻株积累的血红素B的量缺乏或减少,并且藻株积累的PPIX增加。在一些实施方案中,藻株的颜色是红色或者类红色。

  在一些实施方案中,藻株缺乏叶绿素生物合成途径中的一种或更多种酶。这些缺陷包括但不限于基因缺失、突变和导致酶缺乏表达或酶功能缺陷的其他改变。在一些实施方案中,藻株缺乏镁螯合酶,镁螯合酶是将原卟啉IX转化为叶绿素的第一步。在一些实施方案中,藻株缺乏将原叶绿素酸酯转化为叶绿素的光依赖性原叶绿素酸酯。在一些实施方案中,藻株缺乏光非依赖性原叶绿素酸酯还原酶,该还原酶在黑暗中将原叶绿素酸酯转化为叶绿素酸酯。在一些实施方案中,藻株缺乏ChlB、ChlL或ChlN中一种或更多种。在一些实施方案中,藻株的镁螯合酶、镁原卟啉原IX、原叶绿素酸酯、叶绿素酸酯和叶绿素中的一种或更多种缺乏或者减少。

  在一些实施方案中,藻株缺乏镁螯合酶亚基CHLD、CHLH和CHLI中的一种或更多种。这些亚基也用与CHLD亚基相对应的基因名称CHLD1(也称为CHlD1),与CHLH亚基相对应的CHLH1(也称为CHlH1),以及与CHLI亚基相对应的CHLI1和CHLI2来指代,由两个基因CHLI1和CHLI2(也称为CHlI1和CHlI2)编码。

  在一些实施方案中,藻株缺乏CHLD1、CHLH1、CHLI1、CHLI2的一个或更多个或其部分(包括在一个或更多个内含子、外显子、调节区或完整基因序列中的基因修饰,诸如SEQID NO:45-69、70-88、89-113或130-150中的一个或更多个的基因修饰)。例如,一种红色藻株在CHLH基因座中具有基因修饰。与绿色藻株相比,该修饰缺失了CHLH中的单个碱基对,导致CHLH开放阅读框中的移码和/或产生终止密码子,使得蛋白质被翻译成截短的形式。图6显示了野生型绿藻和具有CHHLH基因突变的红色藻的部分序列比对(上部序列(Seq_1)是绿藻CHLH基因的部分核酸序列(SEQ ID NO:27的残基1621-1679)和部分氨基酸序列(SEQ IDNO:28的残基451-460),下部序列(Seq_2)是具有突变的红色藻CHLH基因的部分核酸序列(SEQ ID NO:129的残基1621-1680)和部分氨基酸序列(SEQ ID NO:152的残基451-460)(星号)。本文提供了可在这种藻株中改变的额外基因的核酸序列。

  在一些实施方案中,与本文的方法和组合物一起使用的工程藻株包括亚铁螯合酶基因的基因修饰,其减少或缺乏亚铁螯合酶的产生,并且还在从PPIX到叶绿素(例如CHLD、CHLI1、CHLI2和/或CHLH)的一种或更多种酶中具有修饰。

  在一些实施方案中,藻株过表达一种或更多种酶,使得途径的平衡有利于PPIX的产生。在一些实施方案中,藻株过表达谷氨酰-tRNA还原酶、谷氨酸-1-半醛氨基转移酶、ALA脱氢酶、胆色素原脱氨酶、UPG III合酶、UPG III脱羧酶、CPG氧化酶和PPG氧化酶中的一种或更多种。在一些实施方案中,藻株过表达一种或更多种这样的酶,并且还降低亚铁螯合酶的量或活性。在一些实施方案中,藻株产生ALA(血红素B合成的限速前体)的能力得到改善,并且可选地,亚铁螯合酶的量或活性降低。在一些实施方案中,藻株缺乏产生功能性亚铁螯合酶基因的能力,所述功能性亚铁螯合酶基因是负责原卟啉IX转化为血红素B的酶。在一些实施方案中,藻株产生UPG III合酶、UPG III脱羧酶、CPG氧化酶或PPG氧化酶的能力得到改善。在一些实施方案中,与野生型株系相比,藻株具有增加的原卟啉IX的量。

  在一些实施方案中,藻株产生类胡萝卜素或类胡萝卜素的前体。不受理论的束缚,类胡萝卜素赋予颜色,并能对植物基替代品的视觉外观产生影响。示例性类胡萝卜素包括但不限于γ-胡萝卜素、β-胡萝卜素、β隐黄质、玉米黄质、autheraxanthin、叶黄素、前番茄红素和番茄红素。

  在一些实施方案中,藻株缺乏类胡萝卜素或类胡萝卜素的前体。类胡萝卜素生物合成的缺陷能由于突变而发生,诸如影响类胡萝卜素生物合成的突变(例如八氢番茄红素合酶基因的突变)。

  在一些实施方案中,基于一种或更多种表型和/或基因型选择或鉴定用于本文方法和用于制备含PPIX组合物的藻株。在一些实施方案中,可以通过交配过程产生用于过量生产PPIX的藻株。在一些实施方案中,可以通过随机诱变(诸如紫外线诱变)产生用于过量生产PPIX的藻株。在一些实施方案中,可以通过用引起DNA改变的化合物的化学突变产生用于过量生产PPIX的藻株。

  在一些实施方案中,可以通过基因编辑产生修饰(诸如精确工程化的核酸酶(诸如通过CRISPR-CAS核酸酶))靶向以改变一种或更多种组分的表达。这些核酸酶可用于产生一个或更多个核苷酸或核苷酸区域的插入、缺失、突变和替换,以改变一种或更多种途径酶在该途径中的表达,从而减少叶绿素和/或增加PPIX的产生或积累。在修饰产生之后,藻株生长和/或交配,使得核酸酶和相关的导向核酸被去除,并且剩余的藻株不保留核酸酶和相关的编辑系统。在一些实施方案中,核酸酶(诸如CRISPR-CAS核酸酶)用于对叶绿素途径的组分进行修饰,使得叶绿素表达和/或积累减少或废除(abrogated)。在一些实施方案中,核酸酶(诸如CRISPR-CAS核酸酶)用于对叶绿素途径的组分进行修饰,使得PPIX表达和/或积累增加。在一些实施方案中,用核酸酶(诸如CRISPR-CAS核酸酶)对编码亚铁螯合酶的基因进行基因修饰,例如,使SEQ ID NO:114-128的一个或更多个基因表达降低或废除的修饰;或使编码该酶的基因(诸如SEQ ID NO:116-122)废除、截短或引起其移码的修饰,和/或使表达的蛋白改变或截短的修饰(诸如氨基酸SEQ ID NO:8的改变)。在一些实施方案中,核酸酶(诸如CRISPR-CAS核酸酶)用于在CHLD、CHLI1、CHLI2或CHLH1中的一种或更多种中进行修饰,产生富含PPIX的藻株。这些修饰是通过设计对一个或更多个SEQ ID NO:45-113、130-150或153进行修饰的导向RNA来进行的,以包括一个或更多个点突变、插入、缺失或其组合。在一些实施方案中,通过同时或相继的核酸酶工程和/或通过含有基因修饰的交配工程藻株,来结合在一个以上的靶序列中的这些基因修饰,诸如亚铁螯合酶序列和另一叶绿素途径序列(例如CHLD、CHLI1、CHLI2或CHLH1)中的基因修饰,。

  基因编辑中使用的工程核酸酶有几个家族,例如,但不限于,大范围核酸酶、锌指核酸酶(ZFN)、转录激活剂样效应子核酸酶(TALEN)、CRISPR-Cas系统和ARCUS。然而,应当理解,任何已知的利用工程核酸酶的基因编辑系统都可以用于本文所述的方法中。因此,在一些实施方案中,可以通过使用诸如CRISPR-Cas系统(例如CRISPR-CAS9)的技术或通过使用锌指核酸酶对过量生产PPIX的藻株进行基因修饰。

  CRISPR(簇状规则间隔短回文重复序列)是包含多个碱基序列的短直接重复的基因座的首字母缩略词。原核CRISPR/Cas系统已被改造为用于真核生物的基因编辑(沉默、增强或改变特定基因)(参见,例如Cong,Science,15:339(6121):819-823(2013)和Jinek,etal.,Science,337(6096):816-21(2012))。通过用包含Cas基因和特别设计的CRISPR的元件转染细胞,核酸序列可以在任何期望的位置被切割和修饰。使用CRISPR/Cas系统制备用于基因组编辑的用途的组合物的方法在US Pub.No.2016/0340661、US Pub.No.2016/0340662、US Pub.No.2016/0354487、US Pub.No.2016/0355796、US Pub.No.2016/0355797和WO2014/018423中详细描述,其通过引用特定地并入全文。

  锌指核酸酶(ZFNs)是通过将锌指DNA结合结构域融合到DNA切割结构域而产生的人工限制性内切酶。锌指结构域可以被设计成靶向特定的所需的DNA序列,这使得锌指核酸酶能够靶向复杂基因组中的独特序列。通过利用内源性的DNA修复机制,这些试剂可以用来精确地改变高等生物的基因组。最常见的切割结构域是IIS型酶Fok1。Fok1催化DNA的双链断裂,一条链上的识别位点有9个核苷酸,另一条链上的识别位点有13个核苷酸。参见,例如,U.S.Pat.No.5,356,802;5,436,150和5,487,994;以及Li et al.Proc.,Natl.Acad.Sci.USA 89(1992):4275-4279;Li et al.Proc.Natl.Acad.Sci.USA,90:2764-2768(1993);Kim et al.Proc.Natl.Acad.Sci.USA.91:883-887(1994a);Kim etal.J.Biol.Chem.269:31,978-31,982(1994b),其全部通过引用并入本文。一种或更多种这些酶(或其酶功能片段)可用作切割结构域的来源。

  藻类的选择方法包括但不限于对叶绿素生物合成途径和/或叶绿素积累中的缺陷、突变和变化进行基因筛选或表型筛选,对PPIX、PPIX生物合成中间体和血红素生物合成酶的表达和/或积累增加进行基因筛选或表型筛选。在一些实施方案中,基于其光谱分布和/或其红色或类红色来选择或鉴定用于本文方法和用于制备含PPIX组合物的藻株。在一些实施方案中,基于黑暗条件下它的生长率选择或鉴定用于本文方法和用于制备含PPIX组合物的藻株。在一些实施方案中,选择基于黑暗条件下的生长率和在黑暗条件下生长时红色或类红色的外观或增强。在一些实施方案中,选择类胡萝卜素产生或积累的量不足或减少的藻株。

  在一些实施方案中,交配藻株以结合或增强有助于PPIX产生、PPIX积累、叶绿素减少和/或类胡萝卜素减少的特性。在一些实施方案中,在黑暗条件下具有快速生长(例如,比野生型藻株更快)的藻株与呈现红色或类红色的藻株交配。因此,这种藻株不是转基因株系。在一些实施方案中,缺乏类胡萝卜素生产或积累的藻株与呈现红色或类红色的藻株交配。预期这种生成的藻类是原卟啉IX过表达的藻株,在与另一种藻类交配后,其生长速度快于其亲代藻株。

  在一些实施方案中,藻株被诱变,并然后选择或鉴定出新的藻株,该藻株表现出增加PPIX产量、PPIX积累、叶绿素减少和/或类胡萝卜素减少的特征的一种或更多种。在一些实施方案中,藻株通过诱变第一起始株系和选择在黑暗中比第一起始株系生长更快的第二株系而生成。在一些实施方案中,藻株通过诱变第一起始株系和选择缺乏一种或更多种类胡萝卜素的第二株系而生成。

  用于组合物和方法中的藻类

  在本文提供的用于生产PPIX和含有PPIX的组合物的组合物和方法中,使用了具有PPIX生物合成途径的藻株。在一些实施方案中,过量生产PPIX的藻株是绿藻门(绿藻)。在一些实施方案中,绿藻选自由衣藻、杜氏藻、红球藻、小球藻和栅藻组成的组。在一些实施方案中,衣藻是莱茵衣藻。在不同的实施方案中,绿藻能是绿藻、衣藻、莱茵衣藻、莱茵衣藻137c或psbA缺陷型莱茵衣藻株系。在一些实施方案中,经选择的宿主是莱茵衣藻,诸如在Rasala和Mayfield,Bioeng Bugs.(2011)2(1):50-4;Rasala,et al.,Plant Biotechnol J.(2011)May 2,PMID 21535358;Coragliotti,et al.,Mol Biotechnol.(2011)48(1):60-75;Specht,et al.,Biotechnol Lett.(2010)32(10):1373-83;Rasala,et al.,PlantBiotechnol J.(2010)8(6):719-33;Mulo,et al.,Biochim Biophys Acta.(2011)May 2,PMID:21565160;和Bonente,et al.,Photosynth Res.(2011)May 6,PMID:21547493;USPub.No.2012/0309939;US Pub.No.2010/0129394;和Intl.Pub.No.WO2012/170125中。出于所有目的,所有前述参考文献通过引用整体并入本文。

  在一些实施方案中,过量生产PPIX的藻株是单细胞藻类。令人感兴趣的示例性和额外微藻种包括但不限于东方曲壳藻(Achnanthes orientalis)、阿格门氏藻(Agmenellum)、透明茧形藻(Amphiprora hyaline)、咖啡形双眉藻(Amphoracoffeiformis)、咖啡形双眉藻线状(Amphora coffeiformis linea)、咖啡形双眉藻斑点(Amphora coffeiformis punctata)、咖啡形双眉藻泰勒氏(Amphora coffeiformistaylori)、咖啡形双眉藻细薄(Amphora coffeiformis tenuis)、Amphora delicatissima、Amphora delicatissima capitata、双眉藻sp.(Amphora sp.)、项圈藻(Anabaena)、纤维藻(Ankistrodesmus)、镰形纤维藻(Ankistrodesmus falcatus)、黄金色藻(Boekeloviahooglandii)、包特氏菌sp.(Borodinella sp.)、布朗葡萄藻(Botryococcus braunii)、苏台德葡萄籽(Botryococcus sudeticus)、四鞭藻(Carteria)、纤细角毛藻(Chaetocerosgracilis)、牟氏角毛藻(Chaetoceros muelleri)、牟氏角毛藻亚盐(Chaetocerosmuelleri subsalsum)、角毛藻属sp.(Chaetoceros sp.)、衣藻属sp.(Chlamydomonassp.)、莱茵衣藻(Chlamydomonas reinhardtii)、无硝小球藻(Chlorella anitrata)、南极小球藻(Chlorella antarctica)、金绿小球藻(Chlorella aureoviridis)、Chlorellacandida、包囊小球藻(Chlorella capsulate)、脱水小球藻(Chlorella desiccate)、椭圆小球藻(Chlorella ellipsoidea)、浮水小球藻(Chlorella emersonii)、淡褐小球藻(Chlorella fusca)、淡褐小球藻空腔变种(Chlorella fusca var.vacuolate)、谷氏小球藻(Chlorella glucotropha)、水溪小球藻(Chlorella infusionum)、水溪小球藻栖海岸变种(Chlorella infusionum var.actophila)、水溪小球藻增大变种(Chlorellainfusionum var.auxenophila)、凯氏小球藻(Chlorella kessleri)、匍扇小球藻(Chlorella lobophora)(株系SAG 37.88)、黄绿小球藻(Chlorella luteoviridis)、黄绿小球藻金绿变种(Chlorella luteoviridis var.aureoviridis)、黄绿小球藻淡黄变种(Chlorella luteoviridis var.lutescens)、Chlorella miniata、微小小球藻(Chlorellaminutissima)、突变小球藻(Chlorella mutabilis)、夜间小球藻(Chlorella nocturna)、巴夫氏小球藻(Chlorella parva)、嗜光小球藻(Chlorella photophila)、普氏小球藻(Chlorella pringsheimii)、原始小球藻(Chlorella protothecoides)、原始小球藻耐酸变种(Chlorella protothecoides var.acidicola)、规则小球藻(Chlorella regularis)、规则小球藻小型变种(Chlorella regularis var.minima)、规则小球藻伞状变种(Chlorella regularis var.umbricata)、瑞氏小球藻(Chlorella reisiglii)、嗜糖小球藻(Chlorella saccharophila)、嗜糖小球藻椭圆变种(Chlorella saccharophilavar.ellipsoidea)、盐生小球藻(Chlorella salina)、简单小球藻(Chlorella simplex)、耐热性小球藻(Chlorella sorokiniana)、小球藻sp.(Chlorella sp.)、球形小球藻(Chlorella sphaerica)、斯蒂格小球藻(Chlorella stigmatophora)、万尼氏小球藻(Chlorella vanniellii)、普通小球藻(Chlorella vulgaris)、普通小球藻(Chlorellavulgaris)、普通小球藻粗皮变种(Chlorella vulgaris f.tertia)、普通小球藻自养变种(Chlorella vulgaris var.autotrophica)、普通小球藻绿色变种(Chlorella vulgarisvar.viridis)、普通小球藻普通变种(Chlorella vulgaris var.vulgaris)、普通小球藻普通变种粗皮变种(Chlorella vulgaris var.vulgaris f.tertia)、普通小球藻普通变种绿色变种(Chlorella vulgaris var.vulgaris f.viridis)、黄色小球藻(Chlorellaxanthella)、左氏小球藻(Chlorella zofingiensis)、他伯氏小球藻(Chlorellatrebouxioides)、普通小球藻(Chlorella vulgaris)、水溪绿球藻(Chlorococcuminfusionum)、绿球藻sp.(Chlorococcum sp.)、绿梭藻(Chlorogonium)、蓝隐藻sp.(Chroomonas sp.)、金球藻sp.(Chrysosphaera sp.)、球钙板藻属(Cricosphaera sp.)、寇氏隐甲藻(Crypthecodinium cohnii)、隐藻sp.(Cryptomonas sp.)、隐蔽小环藻(Cyclotella cryptica)、梅尼小环藻(Cyclotella meneghiniana)、小环藻sp.(Cyclotella sp.)、杜氏藻sp.(Dunaliella sp.)、拜尔代维勒杜氏藻(Dunaliellabardawil)、双眼杜氏藻(Dunaliella bioculata)、颗粒状杜氏藻(Dunaliellagranulate)、海洋杜氏藻(Dunaliella maritime)、微小杜氏藻(Dunaliella minuta)、巴夫杜氏藻(Dunaliella parva)、比雷杜氏藻(Dunaliella peircei)、普林莫杜氏藻(Dunaliella primolecta)、盐生杜氏藻(Dunaliella salina)、陆生杜氏藻(Dunaliellaterricola)、特氏杜氏藻(Dunaliella tertiolecta)、绿色杜氏藻(Dunaliella viridis)、Dunaliella tertiolecta、绿色独球藻(Eremosphaera viridis)、独球藻sp.(Eremosphaera sp.)、椭圆藻sp.(Ellipsoidon sp.)、裸藻(Euglena)、伏氏藻sp.(Franceia sp.)、克罗脆杆藻(Fragilaria crotonensis)、脆杆藻sp.(Fragilaria sp.)、粘球藻sp.(Gleocapsa sp.)、丽丝藻sp.(Gloeothamnion sp.)、膜胞藻sp.(Hymenomonassp.)、球等鞭金藻亲近种(Isochrysis aff.galbana)、球等鞭金藻(Isochrysis galbana)、鳞孔藻属(Lepocinclis)、微星藻属(Micractinium)、微星藻属(Micractinium)(UTEX LB2614)、微小单针藻(Monoraphidium minutum)、单针藻sp.(Monoraphidium sp.)、微球藻sp.(Nannochloris sp.)、盐生拟微球藻(Nannochloropsis salina)、拟微球藻sp.(Nannochloropsis sp.)、适意舟形藻(Navicula acceptata)、毕氏舟形藻(Naviculabiskanterae)、假卵泡舟形藻(Navicula pseudotenelloides)、薄膜舟形藻(Naviculapelliculosa)、嗜腐舟形藻(Navicula saprophila)、舟形藻sp.(Navicula sp.)、肾鞭藻sp.(Nephrochloris sp.)、肾藻sp.(Nephroselmis sp.)、普通菱形藻(Nitschiacommunis)、亚历山大菱形藻(Nitzschia alexandrina)、普通菱形藻(Nitschiacommunis)、细端菱形藻(Nitzschia dissipata)、碎片菱形藻(Nitzschia frustulum)、汉氏菱形藻(Nitzschia hantzschiana)、平庸菱形藻(Nitzschia inconspicua)、中型菱形藻(Nitzschia intermedia)、小头菱形藻(Nitzschia microcephala)、微小菱形藻(Nitzschia pusilla)、微小菱形藻椭圆变种(Nitzschia pusilla elliptica)、微小菱形藻莫纳变种(Nitzschia pusilla monoensis)、四边形菱形藻(Nitzschia quadrangular)、菱形藻sp.(Nitzschia sp.)、掠鞭藻sp.(Ochromonas sp.)、小卵胞藻(Oocystis parva)、极小卵胞藻(Oocystis pusilla)、卵胞藻sp.(Oocystis sp.)、沼泽颤藻(Oscillatorialimnetica)、颤藻sp.(Oscillatoria sp.)、亚短颤藻(Oscillatoria subbrevis)、嗜酸帕氏藻(Pascheria acidophila)、巴夫藻sp.(Pavlova sp.)、噬菌体属(Phagus)、席藻属(Phormidium)、扁藻sp.(Platymonas sp.)、颗石藻(Pleurochrysis carterae)、齿状颗石藻(Pleurochrysis dentate)、颗石藻sp.(Pleurochrysis sp.)、魏氏原壁藻(Protothecawickerhamii)、雍滞原壁藻(Prototheca stagnora)、波多黎各原壁藻(Protothecaportoricensis)、桑堪形原壁藻(Prototheca moriformis)、饶氏原壁藻(Protothecazopfii)、塔胞藻sp.(Pyramimonas sp.)、桑堪藻属(Pyrobotrys)、囊状金藻(Sarcinoidchrysophyte)、被甲栅藻(Scenedesmus armatus)、裂壶藻属(Schizochytrium)、水绵属(Spirogyra)、钝顶螺旋藻(Spirulina platensis)、裂丝藻sp.(Stichococcus sp.)、聚球藻sp.(Synechococcus sp.)、四角藻(Tetraedron)、四爿藻sp.(Tetraselmis sp.)、Tetraselmis suecica、威氏海链藻(Thalassiosira weissflogii)和弗雷德鲜绿球藻(Viridiella fridericiana)。在一些实施方案中,藻类是衣藻种。在一些实施方案中,藻类是莱茵衣藻。在一些实施方案中,藻类是绿色衣藻藻株的衍生物,其通过诱变或与另一种藻株交配而制成。在一些实施方案中,衣藻属是保藏在明尼苏达大学衣藻收集中心的株系CC-125或其衍生物。

  过量产生PPIX株系的培养方法

  在液体培养基中培养藻类的方法包括多种选择,包括池塘、沟渠、小型实验室系统以及封闭和部分封闭的生物反应器系统。藻类也能在水中直接生长,例如,在大洋中、海中、湖中、河中、水库中等。

  在一些实施方案中,在本文提供的方法和组合物中有用的过量产生PPIX的藻类在受控培养系统中生长(诸如小规模实验室系统、大规模系统和/或封闭和部分封闭的生物反应器系统)。小型实验室系统指的是体积小于约6升的培养物,并且其范围可以从约1毫升或更小到约6升。大规模培养是指培养物的生长体积大于约6升,并且范围可从约6升至约200升,并且甚至更大规模的系统覆盖面积为5至2500平方米,或更大。大规模培养系统可以包括约10000至约20000升和高达约1000000升的液体培养系统。

  与生产本文组合物的方法一起使用的培养系统包括封闭结构(诸如生物反应器),在封闭结构中环境受到比开放系统或半封闭系统更严格的控制。光生物反应器是一种生物反应器,其结合了某种类型的光源以向反应器提供光子能量输入。术语生物反应器可以指的是与环境封闭并且没有气体和污染物与环境直接交换的系统。生物反应器能描述为封闭的培养容器,并且在光生物反应器的情况下,为液体细胞悬浮培养物的受控生物质生产而设计的照明培养容器。

  在一些实施方案中,在本文提供的方法和组合物中使用的藻类在发酵容器中生长。在一些实施方案中,容器是不锈钢发酵容器。在一些实施方案中,藻类在异养条件下生长,由此一种或更多种碳源提供至培养物。在一些实施方案中,藻类在有氧和异养条件下生长。在一些实施方案中,藻类生长至大于或约10g/L、约20g/L、约30g/L、约40g/L、约50g/L、约75g/L、约100g/L、约125g/L或约150g/L的密度。

  在一些实施方案中,从种子罐接种藻类至大于约0.1g/L、约1.0g/L、约5.0g/L、约10.0g/L、约20.0g/L、约50g/L、约80g/L或约100g/L的起始密度。一旦接种,藻类使用有氧发酵过程异养生长。在这个过程中,藻类被供给营养以维持它们的生长。在一些实施方案中,这些营养物包括还原碳源。示例性有氧发酵过程和/或还原碳源包括但不限于乙酸盐/酯、葡萄糖、蔗糖、果糖、甘油和其他类型的糖(例如右旋糖(dextrose)、麦芽糖、半乳糖、蔗糖、核糖等)。在一些实施方案中,藻类培养物补充有铁。

  在一些实施方案中,藻类在黑暗条件下培养。优选地,黑暗条件具有小于1000lux、小于750lux、小于500lux、小于400lux、小于300lux、小于200lux、小于100lux的亮度。在一些实施方案中,与在黑暗条件下培养的藻类相比,在黑暗条件下培养的藻类叶绿素产量缺乏或减少至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%。在一些实施方案中,在黑暗条件下生长的藻类补充有一种或更多种营养物。在一些实施方案中,在黑暗条件下生长的藻类在还原碳源的存在下生长,所述还原碳源诸如乙酸盐/酯、葡萄糖、蔗糖、果糖、甘油或其他类型的糖(例如右旋糖、麦芽糖、半乳糖、蔗糖、核糖等)。在一些实施方案中,在黑暗条件下生长的藻类在铁的存在下生长,或者补充铁。

  含有PPIX的制剂和产品

  过量产生PPIX的藻株和培养物(诸如本文所述的)能以多种形式和制剂使用。在一些实施方案中,含有PPIX的组合物由过量产生PPIX的藻类培养物制备,其中该组合物的颜色为红色或类红色。

  在一些实施方案中,含有PPIX的组合物由从经培养藻类中分离的生物质制备。在一些实施方案中,生物质被进一步分级以除去一种或更多种组分。在一些实施方案中,生物质被分级以除去淀粉。在一些实施方案中,生物质被分级以除去蛋白质。在一些实施方案中,生物质被分级或以其他方式处理以去除类胡萝卜素。在一些实施方案中,生物质被分级或以其他方式处理以富集某些组分。在一些实施方案中,经分级或处理过的生物质富含PPIX。在一些实施方案中,经分级或处理的生物质富含蛋白质,或蛋白质和PPIX。在一些实施方案中,分级或处理增强了制剂的红色或类红色。经分级或处理过的生物质可富含蛋白质含量,使得组合物为约10%蛋白质、大于约10%蛋白质、或大于约20%、约30%、约40%或约50%蛋白质。

  在一些实施方案中,生物质被分级或以其他方式处理以去除或降低任何血红素含量,并且可选地富集PPIX。因此,在一些实施方案中,级分或组合物可以包括比血红素的量多至少10%、至少20%、至少30%、至少40%、至少50%的PPIX。这种分级可以包括从血红素中分离PPIX。例如,血红素结合蛋白和与蛋白相关的血红素可以从不是蛋白偶联(protein-conjugated)或蛋白相关的化合物的PPIX中分离出来。基于血红素与铁的结合,游离血红素和蛋白质相关血红素都可以从PPIX中分离出来。PPIX不含铁部分,并且因此,这一特征可用于从含血红素的级分中分离PPIX。在一些实施方案中,本文中的藻类生物质被分级或以其他方式处理,使得血红素含量降低,诸如在含有PPIX的级分中降低至低于1%、低于0.1%、低于0.05%、低于0.01%、低于0.001%或低于可检测水平。或者,本文中的藻类生物质被分级或以其他方式处理,使得血红素蛋白含量降低,诸如在含有PPIX的级分中降低到低于1%、低于0.1%、低于0.05%、低于0.01%、低于0.001%或低于可检测水平。在一些实施方案中,藻类生物质或经分级生物质由亚铁螯合酶缺乏的株系或不产生或不积累血红素的株系产生,使得生物质或级分具有很少或没有血红素。

  在一些实施方案中,含有PPIX的组合物是由经培养藻类的培养基制备的含有PPIX的液体。在一些实施方案中,含有PPIX的组合物由藻类培养物细胞外发现的PPIX(细胞外级分)制备。在一些实施方案中,藻类培养物被裂解或以其他方式处理以从细胞中释放PPIX。在一些实施方案中,进一步分级含有PPIX的液体以除去一种或更多种组分。在一些实施方案中,含有PPIX的液体被分级以除去淀粉。在一些实施方案中,含有PPIX的液体被分级以除去蛋白质。在一些实施方案中,含有PPIX的液体被分级或以其他方式处理以去除类胡萝卜素。在一些实施方案中,含有PPIX的液体被分级或以其他方式处理以富集某些组分。在一些实施方案中,经分级或处理过的含有PPIX的液体富含PPIX。在一些实施方案中,分级或处理增强了制剂的红色或类红色。

  在一些实施方案中,将含有PPIX的液体分级或以其他方式处理,以除去或降低任何血红素含量,并可选地富集PPIX。这种分级能包括从血红素中分离PPIX。例如,液体中的血红素结合蛋白和与血红素相关的蛋白可以从不是蛋白偶联或蛋白相关的化合物的PPIX中分离出来,PPIX。基于血红素与铁的结合,游离血红素和蛋白质相关血红素都可以从PPIX中分离出来。PPIX不含铁部分,因此,这一特征可用于从含血红素的级分中分离PPIX。在一些实施方案中,将含有PPIX的液体分级或以其他方式处理,使得血红素含量降低,例如降低至低于1%、低于0.1%、低于0.05%、低于0.01%、低于0.001%或低于通常在含有PPIX的级分中可检测到的水平。在一些实施方案中,含有PPIX的液体由亚铁螯合酶缺乏的株系或不产生或不积累血红素的株系产生,使得含PPIX的液体具有很少或没有血红素含量。

  在一些实施方案中,生物质或含有PPIX的组合物是含有PPIX的液体,和/或含有占总重量百分比为约0.5%、1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.5%、5.0%、5.5%、6.0%、6.5%、7.0%、7.5%、8.0%、8.5%、9.0%、9.5%、10.0%或大于10%的原卟啉IX的经分级的含有PPIX的组合物或含有PPIX的液体。此外,在一些实施方案中,生物质或含有PPIX的组合物是含有PPIX的液体,和/或含有比叶绿素含量高至少5%、至少10%、至少20%、至少30%、至少40%或至少50%的原卟啉IX的经分级的含有PPIX的组合物或含有PPIX的液体。

  可以进一步加工含有PPIX的组合物,包括生物质、液体和经分级制剂。这种处理可以包括浓缩、干燥、冻干和冷冻。在各种实施方案中,例如,含有PPIX的组合物可以与额外的组分和成分结合,以产生可食用产品。在一些实施方案中,含有PPIX的组合物赋予可食用产品红色或类红色。在一些实施方案中,含有PPIX的组合物赋予可食用产品类肉特征,诸如类肉味道、香味和/或质地。在一些实施方案中,含有PPIX的组合物为可食用产品(诸如肉复制品、类牛肉产品、类鸡肉产品等)提供血液外观。

  在一些实施方案中,含有PPIX的组合物是含有PPIX的液体,和/或向可食用组合物提供至少1%、2%、3%、4%、5%、6%、7%、8%、9%或10%的蛋白质的经分级的含有PPIX的组合物或含有PPIX的液体。在一些实施方案中,含有PPIX的组合物是含有PPIX的液体,和/或在可食用产品中提供大于5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%的蛋白质的经分级的含有PPIX的组合物或含有PPIX的液体。在一些实施方案中,含有PPIX的组合物是含有PPIX的液体,和/或向可食用产品提供ω-3脂肪酸的每日推荐剂量或其一部分,例如,向可食用组合物中加入至少约5mg、10mg、15mg、20mg、25mg、30mg、35mg、40mg、45mg、50mg、55mg、60mg、65mg、70mg、75mg、80mg、85mg、90mg、95mg、100mg、125mg、150mg、175mg、200mg、250mg、300mg、350mg、400mg、450mg或500mgω-3脂肪酸,的经分级的含有PPIX的组合物或含有PPIX的液体。

  在一些实施方案中,含有PPIX的组合物是含有PPIX的液体,和/或提供维生素A每日推荐剂量的至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%或维生素A视黄醇活性当量(RAE)的至少约20μg、50μg、100μg、200μg、300μg、400μg、500μg、600μg、700μg、800μg、900μg或1000μg的经分级的含有PPIX的组合物或含有PPIX的液体。在一些实施方案中,含有PPIX的组合物是含有PPIX的液体,和/或提供不超过约2000μg、2500μg或3000μg的维生素A视黄醇活性当量(RAE)的经分级含有PPIX的组合物或含有PPIX的液体。可选地和/或另外地,含有PPIX的组合物是含有PPIX的液体,和/或经分级含有PPIX的液体。可选地和/或另外地,含PPIX的组合物是含PPIX的液体,和/或提供约0.25mg、0.5mg、1mg、1.5mg、2mg、2.5mg、3mg、4mg、5mg、6mg、9mg、10mg、12mg或15mgβ-胡萝卜素的经分级的含PPIX的组合物或含PPIX的液体。

  可选地和/或另外地,含有PPIX的组合物是含有PPIX的液体,和/或对可食用产品的饱和脂肪提供低于每日推荐的限度或其一部分,例如,不超过每日推荐的饱和脂肪的约1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的经分级的含有PPIX的组合物或含有PPIX的液体。可选地和/或另外地,含有PPIX的组合物是含有PPIX的液体,和/或提供不超过可食用组合物或由可食用组合物制成的成品中总饱和脂肪的0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、1.2%、1.5%、2%、5%或10%的经分级含有PPIX的组合物或含有PPIX的液体。

  在一些实施方案中,将含有PPIX的组合物与额外的成分结合以产生类肉产品(meat-likeproduct)。这些类肉产品可以包括清洁肉或培养的肉(由在实验室或动物体外生长的动物细胞制成)、植物基和非动物基肉(由植物成分和/或非动物源成分制成)。在一些实施方案中,由过度生产的藻类制成的含有PPIX的组合物与额外的成分结合以产生类肉产品,由此含有PPIX的组合物的添加赋予类肉产品红色或类红色、类肉香味、类肉味道和/或类肉质地。在一些实施方案中,由含有PPIX的组合物赋予的类肉特征赋予生的或未烹饪的产品。在一些实施方案中,由含有PPIX的组合物赋予的类肉特征被赋予至烹饪产品。或者,肉或类肉风味或香味、肉或类肉质地、血样外观、肉或类肉颜色中的至少一个特征源自藻类制剂。

  在一些实施方案中,整个藻类或经分级的藻类与可食用组合物中的额外蛋白质源结合。例如,蛋白质源可以是小麦蛋白质(诸如小麦蛋白质、组织化小麦蛋白质(texturedwheat protein))、豌豆蛋白质、组织化豌豆蛋白质、大豆蛋白质、组织化大豆蛋白质、马铃薯蛋白质、乳清蛋白质、酵母提取物、真菌蛋白质(诸如阔恩),或其他植物基蛋白质源或其任意组合。在一些实施方案中,整个藻类或经分级的藻类与可食用组合物中的油或脂肪源结合。例如,油或脂肪源可以是椰子油、菜籽油、葵花油、红花油、玉米油、橄榄油、鳄梨油、坚果油或其他植物基油或脂肪源或其任意组合。在一些实施方案中,整个藻类或经分级藻类与淀粉或其他碳水化合物源结合,诸如来自马铃薯、鹰嘴豆、小麦、大豆(soy)、豆类(beans)、玉米或其他植物基淀粉或碳水化合物或其任意组合。在一些实施方案中,整个藻类或经分级的藻类与可食用组合物中的增稠剂结合。例如,淀粉(诸如竹芋、玉米淀粉、卡他库里淀粉、马铃薯淀粉、西米、木薯淀粉)及其淀粉衍生物可用作增稠剂;用作食品增稠剂的微生物和植物胶包括褐藻胶、瓜尔胶、刺槐豆胶、魔芋和黄原胶;蛋白质如胶原蛋白和蛋清可以用作增稠剂;用作增稠剂的糖聚合物包括琼脂、甲基纤维素、羧甲基纤维素、果胶和角叉菜胶。在一些实施方案中,整个藻类或藻类级分可以与维生素和矿物质在可食用组合物中结合,诸如维生素E、维生素C、硫胺素(维生素B1)、锌、烟酸、维生素B6、核黄素(维生素B2)和维生素B12。

  在一些实施方案中,整个藻类或藻类级分可以与额外成分结合,使得可食用组合物和/或成品是素食的、严格素食的或无麸质的,并因此可以符合犹太教徒和清真教徒的饮食指南。因此,在一些实施方案中,可食用组合物和/或成品可以适合素食者、严格素食者、无麸质人群、犹太教徒和清真教徒食用。在一些实施方案中,整个藻类或藻类级分可以与额外成分结合,使得可食用组合物和/或成品不含GMO和/或不含任何源自基因工程生物体或细胞的成分。

  示例性编号实施方案

  以下实施方案列举了本文公开的特征组合的非限制性置换。也可以考虑特征组合的其他置换。具体而言,这些编号的实施方案中的每一个都被认为依赖于或涉及每个先前或随后的编号的实施方案,与它们所列出的顺序无关。

  实施方案1、一种组合物,该组合物包含来自藻株的制剂,其中,该藻株过表达或积累原卟啉IX(PPIX)。2、实施方案2所述的组合物,制剂是来自藻株的生物质。3、实施方案2所述的组合物,其中,制剂是来自藻株的经分级的生物质。4、实施方案3所述的组合物,其中,所述经分级的生物质包含富含PPIX的级分。5、实施方案4所述的组合物,其中,所述富含PPIX的级分进一步包含富含蛋白质的级分。6、实施方案1所述的组合物,其中,所述制剂是藻类培养物的细胞外级分。7、根据实施方案1-6任一项所述组合物,其中,所述制剂的颜色为红色或类红色。8、根据实施方案1-7任一项所述组合物,其中,所述制剂含有比血红素的量更多的PPIX。9、根据实施方案1-8任一项所述组合物,其中,所述制剂含有少于约1%、0.5%、0.1%、0.05%、0.01%、0.005%或0.001%的血红素。10、根据实施方案1-9任一项所述组合物,其中,所述制剂含有少于约1%、0.5%、0.1%、0.05%、0.01%、0.005%或0.001%的血红素蛋白质。11、根据实施方案1-10任一项所述组合物,其中,所述制剂不含有可检测量的血红素蛋白质。12、根据实施方案1-11任一项所述组合物,其中,所述制剂不含有可检测量的血红素。13、根据实施方案1-4任一项所述组合物,其中,所述制剂不含有可检测量的蛋白质。14、根据实施方案1-13任一项所述组合物,其中,所述制剂具有比叶绿素的含量更多的原卟啉IX的量。15、根据实施方案1-4和6任一项所述的组合物,其中,所述制剂向可食用组合物提供总蛋白质含量的至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%。16、根据实施方案1-15任一项所述的组合物,其中,所述制剂向组合物提供维生素A、β胡萝卜素以及其组合。17、实施方案16的组合物,其中,所述维生素A、β胡萝卜素或其组合为每日推荐需求的至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%。18、根据实施方案1-17任一项所述的组合物,其中,所述制剂提供少于约0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、1.2%、1.5%、2%、5%或10%的所述组合物中存在的总饱和脂肪。19、根据实施方案1-18任一项所述的组合物,其中,所述制剂向组合物提供至少约5mg、10mg、15mg、20mg、25mg、30mg、35mg、40mg、45mg、50mg、55mg、60mg、65mg、70mg、75mg、80mg、85mg、90mg、95mg、100mg、125mg、150mg、175mg、200mg、250mg、300mg、350mg、400mg、450mg或500mg的ω-3脂肪酸。20、根据实施方案1-19任一项所述组合物,其中,所述组合物具有源自制剂的红色或类红色。21、根据实施方案1-20任一项所述组合物,其中,所述组合物具有源自制剂的肉或类肉风味。22、根据实施方案1-21任一项所述组合物,其中,所述组合物具有源自制剂的肉或类肉质地。23、根据实施方案1-22任一项所述组合物,其中,所述衣藻是衣藻属。24、实施方案23的组合物,其中,所述藻类是莱茵衣藻。25、实施方案23的组合物,其中,所述衣藻属是保藏在明尼苏达大学衣藻收集中心的株系CC-125或其衍生物。26、实施方案23的组合物,其中,所述藻类的亚铁螯合酶活性或亚铁螯合酶的表达降低或不存在。

  实施方案27、一种食品,包含根据实施方案1-26的任一项所述的组合物。28、实施方案27的食品,其中,所述食品包括清洁肉、培养肉、合成肉、植物基肉或非动物细胞基肉。29、实施方案27-28的食品,其中,所述食品选自由类牛肉食品、类鱼肉产品、类鸡肉产品、类猪肉产品和肉复制品组成的组。30、实施方案27-29的食品,其中,所述食品是严格素食、素食或无麸质的。

  实施方案31、一种可食用成分,包含根据实施方案1-25的任一项所述的组合物。32、实施方案31的可食用成分,其中,所述成分是成品的一部分,其中,所述成品具有源自成分的红色或类红色。33、实施方案31的可食用成分,其中,所述成分是成品的一部分,其中,所述成品具有源自成分的肉或类肉风味。34、实施方案31的可食用成分,其中,所述成分是成品的一部分,其中,所述成品具有源自成分的血的Hasan外观。35、根据实施方案31-34的可食用成分,其中,所述成品是用于汉堡、香肠、烤肉串、肉片、碎肉类产品或肉丸的成分。36、根据实施方案31-34的可食用成分,其中,所述可食用组合物是成品的一部分,并且其中,所述成品是动物饲料。37、根据实施方案31-36的可食用成分,其中,所述可食用成分与蛋白质源、脂肪源、碳水化合物、淀粉、增稠剂、维生素、矿物质或其任意组合相组合。38、实施方案35的可食用成分,其中,所述蛋白质源是组织化小麦蛋白质、组织化大豆蛋白质、真菌蛋白质或藻类蛋白质。39、实施方案37或38的可食用成分,其中,所述成品不含有动物蛋白质。40、根据实施方案37-39的可食用成分,其中,所述脂肪源包括精炼椰子油或葵花油中的至少一种。41、根据实施方案37-40的可食用成分,其中,所述可食用组合物进一步包含马铃薯淀粉、甲基纤维素、水和风味剂中的至少一种,其中,所述风味剂选自酵母提取物、大蒜粉、洋葱粉和盐中的至少一种。

  实施方案42、一种肉替代品,包含根据实施方案1-26中任一项的组合物或根据实施方案31-41中任一项的可食用成分。43、实施方案42的肉替代品,进一步包含:(a)0.01%-5%(按肉复制品基质重量计)的非动物原卟啉IX;(b)选自葡萄糖、核糖、果糖、乳糖、木糖、阿拉伯糖、葡萄糖-6-磷酸、麦芽糖和半乳糖及其任意组合的化合物;(c)至少1.5mM的选自半胱氨酸、胱氨酸、硫胺素、甲硫氨酸及其任意组合的化合物;和(d)选自由植物蛋白质、真菌蛋白质和藻类蛋白质组成的组的一种或更多种蛋白质,其中,所述肉替代品是不含动物产品的磨碎类牛肉食品;其中,烹饪磨碎的类牛肉食品引起产生具有牛肉相关香味的至少两种挥发性化合物。

  实施方案44、一种产生原卟啉IX组合物的方法,包括:使含作为原卟啉IX过量生产者的藻类的藻类群体生长;以及从培养物中分离原卟啉IX组合物。45、实施方案44的方法,其中,所述生长步骤包括在有氧发酵条件下培养藻类培养物。46、实施方案44或实施方案45的方法,其中,所述藻类含有叶绿体。47、实施方案46的方法,其中,所述原卟啉IX的生物合成发生在所述叶绿体中。48、根据实施方案44-47任一项所述方法,其中,所述藻类缺乏产生叶绿素的能力。49、根据实施方案44-48任一项所述方法,其中,所述藻类缺乏产生功能性Mg螯合酶的能力。50、根据实施方案44-49任一项所述方法,其中,所述藻类的ChlD1、ChlD2或ChlDH减少或缺乏。51、根据实施方案44-50任一项所述方法,其中,所述藻类的功能性光依赖性原叶绿素酸酯减少或缺乏。52、根据实施方案44-51任一项所述方法,其中,所述藻类的功能性光非依赖性原叶绿素酸酯减少或缺乏。53、根据实施方案44-52任一项所述方法,其中,所述藻类的ChlB、ChlL或ChlN减少或缺乏。54、根据实施方案44-53任一项所述方法,其中,所述藻类过表达谷氨酰-tRNA还原酶、谷氨酸-1-半醛氨基转移酶、丙氨酸脱氢酶、胆色素原脱氨酶、UPG III合酶、UPG III脱羧酶、CPG氧化酶和PPG氧化酶中的一种或更多种。55、根据实施方案44-54任一项所述方法,其中,所述藻类是通过交配生成的,并且其中,所述经生成的藻株的颜色是红色或类红色。56、根据实施方案44-55任一项所述方法,其中,所述藻类通过诱变生成。57、根据实施方案44-56任一项所述方法,其中,所述制剂的颜色为红色或类红色。58、根据实施方案44-57任一项所述方法,其中,所述经分离的原卟啉IX组合物是藻类生物质。59、实施方案58的方法,其中,所述藻类生物质是经分级的。60、实施方案59的方法,其中,所述藻类生物质被分级以产生包含原卟啉IX的富含蛋白质的级分。61、根据实施方案44-57任一项所述方法,其中,所述经分离的原卟啉IX组合物从藻类培养物的胞外培养基中分离。62、根据实施方案44-61任一项所述方法,其中,所述经分离的原卟啉IX组合物从藻类蛋白质中分离出。63、根据实施方案44-62任一项所述方法,其中,所述藻类缺乏类胡萝卜素。64、根据实施方案44-63任一项所述方法,其中,所述藻类是衣藻属。65、根据实施方案44-64任一项所述方法,其中,所述藻类是莱茵衣藻。66、实施方案64的方法,其中,所述衣藻属是保藏在明尼苏达大学衣藻收集中心的株系CC-125或其衍生物。67、根据实施方案44-66任一项所述方法,其中,在与另一种藻类交配后,过表达的原卟啉IX藻株的后代比其亲代藻株生长得更快。68、根据实施方案44-66任一项所述方法,其中,所述原卟啉IX的藻株是通过将类胡萝卜素缺乏的株系与呈现红色或类红色的株系交配而产生的。69、根据实施方案44-66任一项所述方法,其中,过表达原卟啉IX的藻类是通过诱变第一起始株系和选择在黑暗中比第一起始株系生长更快的第二株系而生成的。70、根据实施方案44-66任一项所述方法,其中,过表达原卟啉IX的藻类是通过诱变第一株系和从经诱变第一株系中选择缺乏一种或更多种类胡萝卜素的第二株系而生成的。71、根据实施方案44-70任一项所述方法,其中,所述藻类缺乏功能性亚铁螯合酶。72、根据实施方案44-70任一项所述方法,其中,所述藻类的亚铁螯合酶的量或活性减少。73、根据实施方案44-70任一项所述方法,其中,相比野生型株系,所述藻类的血红素的量减少或缺乏血红素。

  实施方案74、一种含有原卟啉IX的组合物,其通过根据实施方案44-73所述的方法产生。75、实施方案74的组合物,其中,所述组合物不含可检测水平的血红素、血红素结合蛋白或其组合。76、根据实施方案44-73任一项所述的方法,进一步包括以下步骤:(a)在黑暗条件下培养藻株,其中,该株系不产生叶绿素或叶绿素产量减少,以及(b)收集一部分颜色为红色或类红色的藻类培养物以产生原卟啉IX组合物。77、根据实施方案76的方法,其中,所述藻类是衣藻属。78、根据实施方案77的方法,其中,所述藻类是莱茵衣藻。79、根据实施方案76的方法,其中,当在所述黑暗条件中生长时,所述藻类呈现出红色或类红色。80、实施方案76的方法,其中,经收集部分是来自所述藻类培养物的细胞外培养基。81、实施方案76的方法,其中,经收集部分是来自所述藻类培养物的生物质或经分级的生物质。82、实施方案76的方法,其中,所述藻类在有氧发酵条件下生长。83、实施方案76的方法,其中,所述藻类生长至密度大于约10g/L、20g/L、30g/L、40g/L、50g/L、75g/L、100g/L、125g/L或150g/L。84、实施方案76的方法,其中,所述藻类以乙酸盐/酯作为还原碳源生长。85、实施方案76的方法,其中,所述藻类以糖作为还原碳源生长。86、实施方案76的方法,其中,所述藻类培养物在所述培养步骤期间补充铁。87、实施方案76的方法,其中,所述藻类培养物以大于约0.1g/L、1.0g/L、5.0g/L、10g/L、20g/L、50g/L、80g/L或100g/L的密度接种。88、实施方案76的方法,进一步包括对经收集部分进行分级,其中,分级从经收集部分中除去基本上全部或大部分的选自由类胡萝卜素、淀粉和蛋白质组成的组的组分。89、实施方案76的方法,进一步包括对经收集部分进行分级,其中,分级从所述经收集部分中除去基本上全部或大部分的血红素、血红素结合蛋白或其组合。90、实施方案76的方法,进一步包括对经收集部分进行分级,其中,所述分级产生富含蛋白质的级分。91、实施方案76的方法,其中,所述藻类的镁螯合酶、镁原卟啉原IX、原叶绿素酸酯、叶绿素酸酯和叶绿素中的一种或更多种缺乏或者减少。92、实施方案76的方法,其中,所述藻类的亚铁螯合酶缺乏或减少。93、根据实施方案44-73和76-92任一项所述方法,其中,所述藻类不是转基因株系。

  实施方案94、通过根据实施方案76-93任一项所述方法生产的清洁肉产品,其中,所述方法进一步包括将经收集部分与制造清洁肉的组合物结合,其中,所述经收集部分为清洁肉产品提供红色或类红色的颜色。95、实施方案94的清洁肉产品,其中,所述经收集部分是富含PPIX的级分或经纯化的PPIX。

  实施方案96、通过根据实施方案44-73和76-93任一项所述方法产生的可食用成分,其中,所述原卟啉IX组合物赋予可食用成分肉或类肉风味、肉或类肉质地、肉或类肉气味或其任意组合。97、实施方案96的可食用成分,其中,所述可食用成分被掺入选自由类牛肉食品、类鱼肉产品、类鸡肉产品、类猪肉产品和肉复制品组成的组的成品中。98、实施方案96-97任一项所述的可食用成分,其中,所述可食用成分是严格素食、素食或无麸质的。99、实施方案96-98任一项所述的可食用成分,其中,所述可食用成分不含有动物蛋白质。100、实施方案96-99任一项所述的可食用成分,其中,所述可食用成分不含有任何转基因组分。

  实施方案101、一种具有基因修饰的工程藻类,其中,与缺乏所述基因修饰的藻类相比,所述基因修饰引起原卟啉IX在所述藻类中积累。102、实施方案101的工程藻类,其中,所述工程藻类的叶绿素产生减少或不存在叶绿素产生。103、实施方案101或102所述的工程藻类,其中,所述藻类为红色或类红色。104、根据实施方案101-103任一项所述的工程藻类,其中,所述藻类能够以葡萄糖作为单一碳源生长。105、根据实施方案101-104中任一项所述的工程藻类,其中,所述基因修饰包括叶绿素合成途径、原卟啉原IX合成途径或血红素合成途径的基因改变。106、根据实施方案101-105中任一项所述的工程藻类,其中,所述基因修饰与亚铁螯合酶表达的缺乏相关。107、根据实施方案101-106中任一项所述的工程藻类,其中,所述基因修饰包括CHLD、CHLI1、CHLI2或CHLH1的一种或更多种中的改变。108、实施方案106或107所述的工程藻类,其中,所述基因修饰包括上游调节区、下游调节区、外显子、内含子或其任意组合中的改变。109、根据实施方案105-108中任一项所述的工程藻类,其中,所述基因修饰包括插入、缺失、点突变、倒置、重复、移码或其任意组合。

  实施方案110、根据实施方案101-109任一项所述的工程藻类,其中,所述工程藻类的PPIX的含量比叶绿素的含量多。111、根据实施方案101-109任一项所述的工程藻类,其中,所述工程藻类的血红素的含量比叶绿素的含量多。112、根据实施方案101-111任一项所述的工程藻类,其中,所述工程藻类的一种或更多种脂肪酸的产生减少。113、根据实施方案101-112任一项所述的工程藻类,其中,所述工程藻类进一步包含减少或消除光非依赖性原叶绿素酸酯氧化还原酶表达的基因修饰。114、实施方案113的工程藻类,其中,所述基因修饰包括ChlB、ChlL或ChlN中一种或更多种的突变或缺失。115、根据实施方案101-114任一项所述的工程藻类,其中,所述工程藻类的亚铁螯合酶的表达下调。116、根据实施方案101-115任一项所述的工程藻类,其中,所述工程藻类的原卟啉原IX氧化酶的表达上调。

  实施方案117、根据实施方案101-116任一项所述的工程藻类,其中,所述藻类含有重组的或异源的核酸。118、根据实施方案101-117任一项所述的工程藻类,其中,所述工程藻类包括衣藻属。119、实施方案118所的工程藻类,其中,所述衣藻属是莱茵衣藻。

  实施方案120、一种包含藻类制剂的可食用组合物,其中,所述藻类制剂包含实施方案101-119中任一项的工程藻类或其部分。121、实施方案120的可食用组合物,其中,所述可食用组合物包含源自工程藻类的PPXI。122、实施方案120的组合物,其中,所述藻类制剂包含藻类细胞。123、实施方案120的组合物,其中,所述藻类制剂是经分级的藻类制剂。

  实施例

  实施例1:过量产生PPIX藻类的鉴定

  过量表达PPIX的藻株(莱茵衣藻)是通过它们不能产生叶绿素来鉴定的。此外,这些株系表现出红色、棕色、橙色或所列颜色的一些变化。所鉴定的株系表现出光敏性,不能在大于10μEm-2S-1的直射光中长时间生长。

  其中一个经鉴定的株系是在分批补料有氧发酵条件下生长的,其中乙酸盐/酯被用作培养物的还原碳营养源。该株系在发酵罐中生长,在那里最小的光可以到达培养物。该株系生长至大于50g/L的密度,并通过离心收获。经收获的株系是红色的,并且能添加到组合物(诸如食品)中,以赋予红色、橙色或棕色。

  表1-5显示了一种示例性鉴定的红色血红素藻类(株系编号:TAI114,物种名称:莱茵衣藻)的特征分析。

  表1:微生物分析

  

  

  表2:重金属分析

  表3:生物质分析

  表4:卟啉(血红素)分析

  表5:氨基酸组成

  

  

  实施例2:分级

  从发酵培养物中收获来自莱茵衣藻PPIX过量产生藻株的细胞。将细胞重新悬浮在10mL溶液(丙酮:1.6M盐酸的8:2v/v溶液)中,并涡旋30分钟。离心细胞碎片,并从细胞碎片中分离卟啉层(图2)。卟啉级分然后用H2O稀释1∶10,以从丙酮溶液中沉淀卟啉。样品进一步用水洗涤,并且可以在该点冷冻进行进一步分析。图2所示为最终步骤后的含有PPIX的级分。

  实施例3:富含PPIX的“无肉”汉堡的制备

  富含PPIX的样品用于制备由富含PPIX的植物材料和藻类生产的类肉产品的组合物。为了制作富含PPIX的汉堡,将各种成分按以下比例混合,并制成一种圆盘状藻类植物基汉堡:20%或约20%的组织化小麦蛋白、20%或约20%的精制椰子油、3%或约3%的葵花油、2%或约2%的马铃薯淀粉、0.5%或约0.5%的魔芋胶(Kojac gum)、0.5%或约0.5%的黄原胶、45%或约20%的水和4-9%或约4-9%的风味剂(包括酵母提取物、大蒜粉、洋葱粉、盐)和富含PPIX的(“红色”)藻类。图3中示出的是用0.01克、0.1克、1.0克和5.0克富含PPIX的藻类制成的汉堡。

  在该实施例中,富含PPIX的藻类的组成为4.5%PPIX、0.5%血红素、0%叶绿素、24.4%蛋白质、9%膳食纤维、40%淀粉、0.8%ω-3脂肪酸、3.9%其他脂肪、7.5%水分和8.4%灰分。

  实施例4:富含PPIX的植物基汉堡的制备

  富含PPIX的样品用于制备由富含PPIX的植物材料和藻类生产的汉堡组成。为了制作富含PPIX的植物基汉堡,将各种成分按以下比例混合,并形成一种圆盘状:20%或约20%的组织化小麦蛋白、20%或约20%的精制椰子油、3%或约3%的葵花油、2%或约2%的马铃薯淀粉、1%或约1%的甲基纤维素、45%或约45%的水和4-9%或约4-9%的风味剂(包括酵母提取物、大蒜粉、洋葱粉、盐)和富含PPIX的(“红色”)藻类。图4所示为不含富含PPIX藻类的植物基汉堡成分的成分混合物(最左边),添加了富含PPIX藻类的植物基汉堡成分的成分混合物((从左边第二个),烹饪前后的添加了富含PPIX藻类的成分成型为汉堡(分别为左起第三个和最右边的图片)。如图所示,富含PPIX的藻类的加入赋予成分混合物和汉堡一种红色/类红色的颜色(类似于带有动物血液),这种颜色在烹饪时会发生转变。

  在该实施例中,富含PPIX的藻类的组成为4.5%PPIX、0.5%血红素、0%叶绿素、24.4%蛋白质、9%膳食纤维、40%淀粉、0.8%ω-3脂肪酸、3.9%其他脂肪、7.5%水分和8.4%灰分。

  实施例5:富含PPIX的无肉“金枪鱼”的制备

  富含PPIX的样品用于制备类鱼肉组合物。为了生产富含PPIX的无肉“鱼肉”,成分按以下比例混合:20%组织化大豆蛋白、65%水和10%风味剂,和5%富含PPIX的藻类。图5所示为生产的无肉“金枪鱼”的正方形部分。

  在该实施例中,富含PPIX的藻类的组成为4.5%PPIX、0.5%血红素、0%叶绿素、24.4%蛋白质、9%膳食纤维、40%淀粉、0.8%ω-3脂肪酸、3.9%其他脂肪、7.5%水分和8.4%灰分。

  实施例6:从血红素和血红素结合蛋白中分离PPIX

  从血红素和血红素结合蛋白中分离PPIX通过如下完成。藻类生物质在缓冲液(诸如Tris-EDTA缓冲液(pH 7.2))中混合,并在室温下以约1600转/分搅拌1小时。然后将样品置于冰上,用超声波处理,诸如用1s脉冲处理5分钟。向超声处理过的藻类中加入乙腈,并且然后将混合物涡旋约5分钟,然后离心,(诸如在2500×g离心5分钟),制成经沉淀蛋白质的小球。除去含有卟啉(包括PPIX)的上清液中的乙腈,可以分析卟啉的含量并进一步使用。

  通过以下获得进一步地分离:向离心得到的沉淀中加入乙腈:1.7M盐酸(8:2,v/v),并置于振荡器中约20分钟,将蛋白质中的血红素提取到乙腈中。为了建立两相液-液体系,加入饱和MgSO4和NaCl,然后将溶液涡旋约5分钟,以2500×g离心5分钟。顶部有机层可以被去除,如果需要,在分析之前用纯乙腈稀释,并通过液相色谱/串联质谱法进一步分离。(Fyrestam andAnal Bioanal Chem(2017)409:6999–7010“Determination ofheme in microorganisms using HPLC-MS/MS and cobalt(III)protoporphyrin IXinhibition of heme acquisition in Escherichia coli”)。

  实施例7:对叶绿素途径进行靶向修饰以产生富含PPIX的株系

  可以针对亚铁螯合酶基因进行设计导向RNA(sgRNA)来引起使蛋白质复合物失去功能的缺失或插入,包括对一个或更多个SEQ ID NO:116-122的修饰。一旦设计了sgRNA,就可以通过在37℃下将它们与Cas9蛋白结合形成核糖核蛋白(RNP)。然后将这些携带sgRNA的RNP至靶向铁螯合酶,然后将其电穿孔到绿藻培养物中。将3x108个细胞放入用于藻类的MAX高效转化缓冲液中(Thermo fisher science),并以0.2cm的间隙放入比色皿中。电穿孔电压设置为250V,脉冲间隔设置为15ms。一旦将电穿孔的细胞回收到生长培养基中,添加40mM蔗糖以提高回收效率。然后将细胞铺板在含有琼脂的生长培养基上,由于叶绿素缺陷型突变体的光敏性,使其在黑暗中生长。一旦恢复,就可以将种群撤出并逐出各个菌落。再次将板置于黑暗中2-3周。当与未修饰的绿藻相比,当被波长为420nm的光激发时,可以通过在635nm处荧光增强来鉴定铁螯合酶的突变体。

  实施例8:富含PPIX的藻株的其他修饰,可针对不同的仿肉品和其他用途进行改进。

  过表达PPIX的藻株可以与ω-3s、ω-6s或ω-9s不足或过量生产的藻株交配。对于仿鱼肉,在过表达血红素的藻类中更多的ω油类是理想的。对于仿类牛肉产品,在过表达血红素的藻类中更少的ω油类是理想的。因此,可以将作为过表达或低表达的ω油类突变体的藻株与过表达血红素的藻株交配,以形成适用于各种类肉产品的更理想的藻类。

  可以通过识别相反交配类型的衣藻株系,然后使其缺乏氮来完成交配。缺氮后,将株系重新悬浮在水中以促进鞭毛的形成。不同交配类型的鞭毛有助于藻株的融合,这将引起合子的形成。然后将交配的培养物暴露于氯仿中以杀死未交配的株系。氯仿不会杀死合子。然后将合子置于生长培养基中并使其繁殖。然后鉴定单个克隆,并通过测量前体原卟啉IX的荧光增加或通过生化测定法(Abnova KA1617)以及过表达或表达不足的ω油类来筛选PPIX的增加。

  序列

  ALA脱氢酶(ALAD)核酸序列(SEQ ID NO:1):

  atgcagatgatgcagcgcaacgttgtgggccagcgccccgtcgctggctcccgccgctcgctggtggttgccaacgttgcggaggtgacccgccccgcggtcagcaccaacggcaagcaccggactggtgtgccggagggaactcccatcgtcacccctcaggacctgccctcgcgccctcgccgcaaccgccgcagcgagagcttccgtgcttccgttcgtgaggtgaacgtgtcgcccgccaacttcatcctgccgatcttcatccacgaggagagcaaccagaacgtgcccatcgcctccatgcctggcatcaaccgcctggcgtatggcaagaacgtgattgactacgttgctgaggctcgctcttacggtgtcaaccaggtcgtggttttccccaagacgcccgaccacctgaagacgcaaaccgcggaggaggcgttcaacaagaacggcctcagccagcgcacgatccgcctgctgaaggactctttccctgacctggaggtgtacacggacgtggctctggacccctacaactcggacggccacgacggtatcgtgtcggacgccggtgtgatcctgaacgacgagaccatcgagtacctgtgccgccaggccgtgagccaggccgaggccggtgccgacgtggtgtcgccctctgacatgatggacggccgcgtgggcgccatccgccgcgccctggaccgcgagggcttcaccaacgtgtccatcatgtcctacaccgccaagtacgcctccgcctactacggccccttccgtgacgccctggcgtccgcgcccaagcccggccaggcgcaccgccgcatcccccccaacaagaagacctaccagatggaccccgccaactaccgcgaggccatccgcgaggccaaggccgacgaggccgagggcgctgacatcatgatggtcaagcccggcatgccgtacctggacgtggtacgcctgctgcgtgagaccagcccgctgcccgtggccgtgtaccacgtgtcgggcgagtacgccatgctcaaggcggcggcggagcgcggctggctgaacgagaaggatgccgtgcttgaggccatgacctgcttccgccgcgccggcgctgacctcatcctcacctactacggcattgaggcctccaagtggctggcgggcgagaagtaa

  ALA脱氢酶(ALAD)氨基酸序列(SEQ ID NO:2):

  MQMMQRNVVGQRPVAGSRRSLVVANVAEVTRPAVSTNGKHRTGVPEGTPIVTPQDLPSRPRRNRRSESFRASVREVNVSPANFILPIFIHEESNQNVPIASMPGINRLAYGKNVIDYVAEARSYGVNQVVVFPKTPDHLKTQTAEEAFNKNGLSQRTIRLLKDSFPDLEVYTDVALDPYNSDGHDGIVSDAGVILNDETIEYLCRQAVSQAEAGADVVSPSDMMDGRVGAIRRALDREGFTNVSIMSYTAKYASAYYGPFRDALASAPKPGQAHRRIPPNKKTYQMDPANYREAIREAKADEAEGADIMMVKPGMPYLDVVRLLRETSPLPVAVYHVSGEYAMLKAAAERGWLNEKDAVLEAMTCFRRAGADLILTYYGIEASKWLAGEK

  粪卟啉原III氧化酶(CPX1)核酸序列(SEQ ID NO:3):

  atggcactgcaagcctcaacccgctcgctccagcagcgccgcgccttctcttcggcccagacctccaagcgtgtgtctgtgaccaaggtccgcgcgacggctatcgaggcggagaactatgtgaagcaggctccccagtcgctggtccgcccgggcatcgacactgaggactctatgcgcgctcgcttcgagaaggtgatccgcaacgcccaggactccatctgcaatgctatctccgagatcgatggcaagccgttccaccaggacgcctggacccgccccggcggcggtggcggcatcagccgcgtgctgcaggacggcaacgtgtgggagaaggccggcgtcaacgtgtccgtggtctacggcaccatgccccctgaggcctaccgcgctgccactggcaacgccgagaagctgaagaacaagggtgacggtggccgcgtgcccttcttcgccgccggcatctcgtcggtgatgcacccccgcaacccccactgccccaccatgcacttcaactaccgctacttcgagactgaggagtggaacggcatccccggccagtggtggttcggcggcggcaccgacatcacccccagctatgtggtgcccgaggacatgaagcacttccacggcacctacaaggcggtgtgcgaccgccacgatcccgcttactacgagaagttccgcacctggtgcgatgagtacttcctcatcaagcaccgcggcgagcgccgcggcctgggcggcatcttcttcgatgacctgaacgaccgcaaccccgaggacatcctgaagttctcgaccgacgccgtgaacaacgtggtggaggcatactgccccatcatcaagaagcacatgaacgacccctacacccccgaggagaaggagtggcagcagatccgccgcggccgctacgtggagttcaacctggtctatgaccgcggcaccaccttcggcctgaagaccggcggccgcattgagtcgatcctcatgtccatgccccagaccgcctcatggctgtacgaccaccagcccaaggccggctcgcccgaggccgagctgctcgacgcctgccgcaacccccgcgtctgggtgtaa

  粪卟啉原III氧化酶(CPX1)氨基酸序列(SEQ ID NO:4):

  MALQASTRSLQQRRAFSSAQTSKRVSVTKVRATAIEAENYVKQAPQSLVRPGIDTEDSMRARFEKVIRNAQDSICNAISEIDGKPFHQDAWTRPGGGGGISRVLQDGNVWEKAGVNVSVVYGTMPPEAYRAATGNAEKLKNKGDGGRVPFFAAGISSVMHPRNPHCPTMHFNYRYFETEEWNGIPGQWWFGGGTDITPSYVVPEDMKHFHGTYKAVCDRHDPAYYEKFRTWCDEYFLIKHRGERRGLGGIFFDDLNDRNPEDILKFSTDAVNNVVEAYCPIIKKHMNDPYTPEEKEWQQIRRGRYVEFNLVYDRGTTFGLKTGGRIESILMSMPQTASWLYDHQPKAGSPEAELLDACRNPRVWV

  粪卟啉原III氧化酶(CPX2)核酸序列(SEQ ID NO:5):

  atgctgaggaagcagattggtggatctggccagcagcgggcgggcctccgacgggtgaaccaaggacctgcgcgtcggcggttggcaccctgccgcgtggcggcccccgtgcaaacctcgtcctccgtcgccacattcaatggcttcgtggactacattcacggactccagaagaacattctgagcactgctgaggatctggagaacggcgagcggaagtttgttgttgaccgctgggagcgcgacgccagcaaccccaacgccgggtatggcattacgtgcgtgcttgaggacgggaaggtgctggagaaggccgcagccaatatctcagtggtgcgcgggacgctgtcggcgcagcgcgcagtggccatgagctcccgcggccgcagcagcatcgaccccaagggcgggcagccctacgccgcggccgccatgagcctagtgttccacagcgcgcacccgctcatccccacgctgcgcgcgacgtgcggttgttccaggtgggcgatgaggcgtggtacggcggtggctgtgacctgacgcccaactacctagacgtggaggactcgcagtccttccaccgctactggaaggacgtgtgcggcaagtacaagccgggcctgtacaccgagctcaaggagtggtgcgacaggtacttctacatcccggcccgcaaagagcaccgtggcattggcggcctgttctttgatgacatggccactgcggaggcgggctgcgatgtggaggcgtttgtgcgggaagtgggagatggcatcctgccctgctggctgcccatcgtggcgcggcaccgtggccagcccttcacggagcagcagcggcaatggcagctgctgcgccgcggtcgctacatcgagttcaacctgctgtacgaccgcggcatcaagttcggtctggacggcggccgcatcgagagcatcatggtgtcggcgccgccgctgatcgcgtggaagtacaacgtggtgccacagccgggcagccccgaggaggagatgctgaaggtgcttcagcagccccgcgagtgggcctga

  粪卟啉原III氧化酶(CPX2)氨基酸序列(SEQ ID NO:6):

  MLRKQIGGSGQQRAGLRRVNQGPARRRLAPCRVAAPVQTSSSVATFNGFVDYIHGLQKNILSTAEDLENGERKFVVDRWERDASNPNAGYGITCVLEDGKVLEKAAANISVVRGTLSAQRAVAMSSRGRSSIDPKGGQPYAAAAMSLVFHSAHPLIPTLRADVRLFQVGDEAWYGGGCDLTPNYLDVEDSQSFHRYWKDVCGKYKPGLYTELKEWCDRYFYIPARKEHRGIGGLFFDDMATAEAGCDVEAFVREVGDGILPCWLPIVARHRGQPFTEQQRQWQLLRRGRYIEFNLLYDRGIKFGLDGGRIESIMVSAPPLIAWKYNVVPQPGSPEEEMLKVLQQPREWA

  来自莱茵衣藻的亚铁螯合酶的核酸序列(SEQ ID NO:7):

  atggcgtcgtttggattgatgcaaaggacggtgcactgtccccagcttgtggaggagcggtgttcgccggtcgctggctgctctggtcgtggcctgccagttatccagcggcaacggcgtggcgtgtgcagtgccaccaacggtgtccagcgagggcgtgtgctgcgccggacggccgcttcgaccgacgtggtctccttcgtggaccccaatgacattagaaaacccgcagcagcagcagctggccctgcggtggataaggtcggcgttctgctgttaaaccttggcgggcccgaaaagctcgacgacgtcaagcctttcctgtataacctattcgccgacccagaaattattcgcctgccagcggcagctcagttcctgcagccgctgctcgcgacgatcatctccacgcttcgcgccccgaagagcgcggagggctatgaggccattggcggtggtagcccgttgcgtaggattacagacgagcaggcggaggcgctggcggagtctctgcgcgccaagggccaacctgcgaacgtgtacgtgggcatgcgctattggcacccctacacggaggaggcgctggagcacattaaggccgacggcgtcacgcgcctggtcatcctcccgctgtaccctcagttctccatctctaccagcggctccagccttcgactgcttgagtcgctcttcaagagcgacatcgcgctcaagtcgctgcggcacacggtcatcccgtcctggtaccagcggcggggctacgtgagcgcgatggcggacctgattgtagaggagctgaagaagttccgggacgtgcccagcgtggagctgtttttctccgcgcacggcgtgcccaagtcctacgtggaggaggcgggcgacccatacaaggaggagatggaggagtgcgtgcggctcattacggacgaggtcaagcggcgcggcttcgccaacacgcacacgctggcctaccagagccgcgtgggccccgcggaatggctcaagccgtacacggatgagtccatcaaggagctgggcaagcgcggcgtcaagtcgctgctggcggtgcccatcagctttgtcagcgagcacattgagacgttggaggagatcgacatggagtaccgcgagctggcggaggagagcggcatccgcaactggggccgcgtgccggcgctgaacaccaacgccgccttcatcgacgacctggcggacgcggtgatggaggcgctgccctacgtgggctgcctggccgggccgacagactcgctggtgccgctgggcgacctggagatgctgctgcaggcctacgaccgcgagcgccgcacgctgccgtcaccggtggtgatgtgggagtggggctggaccaagagcgcggagacgtggaacggccgcattgccatgattgccatcatcatcatcctggcgctggaggcagccagcggccagtccatcctcaaaaacctgttcctggcggagtag

  来自莱茵衣藻的亚铁螯合酶的氨基酸序列(SEQ ID NO:8):

  MASFGLMQRTVHCPQLVEERCSPVAGCSGRGLPVIQRQRRGVCSATNGVQRGRVLRRTAASTDVVSFVDPNDIRKPAAAAAGPAVDKVGVLLLNLGGPEKLDDVKPFLYNLFADPEIIRLPAAAQFLQPLLATIISTLRAPKSAEGYEAIGGGSPLRRITDEQAEALAESLRAKGQPANVYVGMRYWHPYTEEALEHIKADGVTRLVILPLYPQFSISTSGSSLRLLESLFKSDIALKSLRHTVIPSWYQRRGYVSAMADLIVEELKKFRDVPSVELFFSAHGVPKSYVEEAGDPYKEEMEECVRLITDEVKRRGFANTHTLAYQSRVGPAEWLKPYTDESIKELGKRGVKSLLAVPISFVSEHIETLEEIDMEYRELAEESGIRNWGRVPALNTNAAFIDDLADAVMEALPYVGCLAGPTDSLVPLGDLEMLLQAYDRERRTLPSPVVWEWGWTKSAETWNGRIAMIAIIIILALEAASGQSILKNLFLAE

  谷氨酸-1-半醛氨基转移酶(GSA)核酸序列(SEQ ID NO:9):

  atgcagatgcagctgaacgccaagaccgtgcagggcgccttcaaggcgcagcgccctcgctctgtccgcggcaacgtggcggtgcgcgcagtggccgctccccctaagctggtcaccaagcgctccgaggagatcttcaaggaggctcaggagctgctgcccggtggcgtgaactcgcccgtgcgcgctttccgctcggttggtggcggccccatcgtcttcgacagggtcaagggtgcctactgctgggacgtcgatggcaacaagtacatcgactacgttggctcttggggccctgccatttgcggccacggcaacgacgaggtcaacaacgccctgaaggcgcagatcgacaagggcacctcgttcggtgctccctgcgagctggagaacgtgctggccaagatggtgattgaccgcgtgccctcggtggagatggtgcgcttcgtgtcctcgggcactgaggcgtgcctgtcggtgctgcgcctgatgcgcgcatacaccggccgcgagaaggtgctgaagttcaccggctgctaccacggccacgccgactccttcctggtgaaggccggctccggtgtgatcaccctgggcctgcccgactcgcccggtgtgcccaagagcaccgccgccgccaccctgaccgccacctacaacaacctggactccgtgcgcgagctgttcgccgccaacaagggcgagattgccggtgtgatcctggagcccgtggtcggcaacagcggcttcattgtgcccaccaaggagttcctgcagggcctgcgcgagatctgcacggctgagggcgccgtgctgtgcttcgatgaggtcatgaccggcttccgcattgccaagggctgcgcccaggagcacttcggtatcacccccgacctgaccaccatgggcaaggtcattggtggcggcatgcctgtgggcgcctacggcggcaagaaggagatcatgaagatggtcgcccccgccggccccatgtaccaggccggcaccctttcgggcaaccccatggccatgactgccggcatcaagacgctggagatcctgggccgccccggcgcctacgagcacctggagaaggtgaccaagcgcctgatcgacggcatcatggccgccgccaaggagcacagccacgagatcaccggcggcaacatcagcggcatgtttggcttcttcttctgcaagggccctgtgacctgcttcgaggacgccctggcggccgacactgccaagttcgcgcgcttccaccgcggcatgctggaggagggcgtctacctggctccctcgcagttcgaggccggcttcacctctctggcccactccgaggcggacgtggatgccacgatcgccgccgctcgccgcgtgttcgcccgcatctaa

  谷氨酸-1-半醛氨基转移酶(GSA)氨基酸序列(SEQ ID NO:10):

  MQMQLNAKTVQGAFKAQRPRSVRGNVAVRAVAAPPKLVTKRSEEIFKEAQELLPGGVNSPVRAFRSVGGGPIVFDRVKGAYCWDVDGNKYIDYVGSWGPAICGHGNDEVNNALKAQIDKGTSFGAPCELENVLAKMVIDRVPSVEMVRFVSSGTEACLSVLRLMRAYTGREKVLKFTGCYHGHADSFLVKAGSGVITLGLPDSPGVPKSTAAATLTATYNNLDSVRELFAANKGEIAGVILEPVVGNSGFIVPTKEFLQGLREICTAEGAVLCFDEVMTGFRIAKGCAQEHFGITPDLTTMGKVIGGGMPVGAYGGKKEIMKMVAPAGPMYQAGTLSGNPMAMTAGIKTLEILGRPGAYEHLEKVTKRLIDGIMAAAKEHSHEITGGNISGMFGFFFCKGPVTCFEDALAADTAKFARFHRGMLEEGVYLAPSQFEAGFTSLAHSEADVDATIAAARRVFARI

  谷氨酰-trna还原酶(HEMA)核酸序列(SEQ ID NO:11):

  atgcagaccactatgcagcagcgtctccagggccgtaacgtggccgggcggagcgtcgctccctcggtccctgcccatcgctccttccactcacaccgggctgccactcaaaccgctacgatcagcgctgctgctagctcaaccaccaagctgccagcttcgcatctggagagcagcaagaaggcgctggattcgctgaagcagcaggccgtcaatcgctacgcgggtgacaagaagagctccattattgccattggtctcaccattcacaacgcacccgtggagctgcgcgagaagctggctgtgcctgaggctgaatggccgcgtgctattgaggagctctgccagttcccgcacatcgaggaggccgcggtgctgtcgacgtgcaatcgcatggagctctacgttgtcggtctgtcgtggcaccgcggcgttcgcgaggtggaggagtggctgtctcgcaccagcggcgtgcctctggatgagctgcgcccctacctgttcctgctgcgcgaccgcgacgccacgcaccacctgatgcgcgtgtcgggtggccttgactcgctggttatgggcgagggccagattctcgcccaagtgcgccaggtctacaaggtcggccagaactgccccggcttcggtcgccacctgaacggcctgttcaagcaggctatcaccgctggcaagcgcgtgcgtgccgagacctccatctccaccggctccgtctccgtctcatccgccgccgtcgagctggcgcagctcaagctccccacccacaactggtccgacgctaaggtctgcatcatcggcgctggcaagatgtctacgctgctggtgaagcacctgcagagcaagggctgcaaggaggtgacggtgctcaaccgctctctgccgcgcgcccaggcgctggcggaggagttccctgaggtcaagttcaacatccacctgatgcccgacctgctgcagtgcgtggaggccagcgacgtcatcttcgccgcctccggctctgaggagatcctcatccacaaggagcatgtcgaggccatgtccaagccatcggacgttgttggctccaagcgccgcttcgtcgacatctccgtgccccgcaacatcgcccccgccatcaacgagctggagcacggcatcgtctacaacgtcgacgacctgaaggaggttgtggccgccaacaaggagggccgcgcgcaggcggccgccgaggccgaggtgctgatccgcgaggagcagcgcgcgttcgaggcctggcgtgactctctggagaccgtgcccaccatcaaggcgctgcgctccaaggccgagaccatccgcgccgccgagtttgagaaggccgtgtctcgcctgggcgaggggctatccaagaagcagctcaaggcggtggaggagctcagcaagggcatcgtcaacaagctgctgcacgggcccatgacggcactgcgctgcgacggcaccgatccggatgccgtgggccagaccctcgcgaacatggaggccctggagcgcatgttccagctctcggaggtggacgtggccgcgctggcgggcaagcagtaa

  谷氨酰-trna还原酶(HEMA)氨基酸序列(SEQ ID NO:12):

  MQTTMQQRLQGRNVAGRSVAPSVPAHRSFHSHRAATQTATISAAASSTTKLPASHLESSKKALDSLKQQAVNRYAGDKKSSIIAIGLTIHNAPVELREKLAVPEAEWPRAIEELCQFPHIEEAAVLSTCNRMELYVVGLSWHRGVREVEEWLSRTSGVPLDELRPYLFLLRDRDATHHLMRVSGGLDSLVMGEGQILAQVRQVYKVGQNCPGFGRHLNGLFKQAITAGKRVRAETSISTGSVSVSSAAVELAQLKLPTHNWSDAKVCIIGAGKMSTLLVKHLQSKGCKEVTVLNRSLPRAQALAEEFPEVKFNIHLMPDLLQCVEASDVIFAASGSEEILIHKEHVEAMSKPSDVVGSKRRFVDISVPRNIAPAINELEHGIVYNVDDLKEVVAANKEGRAQAAAEAEVLIREEQRAFEAWRDSLETVPTIKALRSKAETIRAAEFEKAVSRLGEGLSKKQLKAVEELSKGIVNKLLHGPMTALRCDGTDPDAVGQTLANMEALERMFQLSEVDVAALAGKQ

  光非依赖性原叶绿素酸酯还原酶亚基N(ch1N)核酸序列(SEQ ID NO:13):

  atgttatactcacaatttaaacattcggtgcctttaggccgtaagtctccccttctttcagggggccccccttctgggggtcgcccaacaacggctgcctcaggcctaggtcgcaacgtggccgtaagaattgggaccccgttgggctttgcccttcgggcccaggtaattatggcagctgcgggcaatactagcggtgcgccgcaccccgtaggggagtcccagcctgcgttgtcccaggtggattctcaacttgtaattgagtgtgaaacaggaaattaccatactttttgcccaattagttgtgtttcttggttataccaaaaaattgaagatagttttttcttagttattggtacaaaaacgtgtgggtattttttacaaaatgctttaggggttatgatttttgccgaacctcgttacgctatggcggaattagaagaaagcgatatttcggcgcaattaaatgattacaaagaattaaaacgtctatgtttacaaattaaacaagaccgtaacccaagtgttattgtgtggattggcacatgcacaaccgaaattattaaaatggatttagaaggtatggcaccgaaactagaagctgaaatcggtattccaattgtggtagcacgcgcaaatggacttgattatgcttttacacaaggtgaagatactgttttagctgcgatggtccaaaaatgcccggaattaggcgctattccagctattgtacctcagattccttctgactctcgtacacttagccaactatctgtagcggcttcggtacccgaaaacagtgcgtctgggccagaaggggagccttcactagcccagaagggaatggattctaagttaacaaacaactctccatgccgagtagattctgtctcagaatctaccccggcgtttcctggacgtgctccgcacgtcgggaaaagtactcctcaaaatttagttttatttggttcattacctagcacgatggcaaatcaactggagtttgaattaaaacgccaaggtattaatgttactgggtggttacctgcggctcgctattcatctttacctgcattaggtgaaaacgtgtatgtttgtgggattaatccatttttaagtcgaactgctacttctttaatgcgtcgtcgtaaatgcaaattaatttcagctcctttcccaattggtccagatggtacaaaagcttgggtcgaaaaaatttgtaatgttttcggtgttacaccaactggtttagaagatcgtgaacgtcttgtttgggaaggtttaaaagattatttaaatttcgtaaaagggaaatctgttttctttatgggtgataatctgttagaaatttcattagcccgttttttaattcgctgtggtatgaccgtttatgaaatcggtattccgtacatggaccaacgatttcaagctggggaattagaattattaaaaaaaacatgcatggaaatgaacgtgcccctaccgcgtattgttgaaaaacctgataattactatcaaattcaacgtattaaagaattacaaccagatttagttattaccggcatggcccatgcaaacccactggaagcgcgcggcattactacgaaatggtccgttgaatttacgtttgcgcaaattcatgggtttggcaacgcacgtgatatcttagaattagttacaaaaccgttacgtcgtaataaaaatctatctaaatatcaatttccgttagatagctgggacaagcctgcttccgtaggcgctcacgaactgtcggcctaa

  光非依赖性原叶绿素酸酯还原酶亚基N(ch1N)氨基酸序列(SEQ ID NO:14):

  MLYSQFKHSVPLGRKSPLLSGGPPSGGRPTTAASGLGRNVAVRIGTPLGFALRAQVIMAAAGNTSGAPHPVGESQPALSQVDSQLVIECETGNYHTFCPISCVSWLYQKIEDSFFLVIGTKTCGYFLQNALGVMIFAEPRYAMAELEESDISAQLNDYKELKRLCLQIKQDRNPSVIVWIGTCTTEIIKMDLEGMAPKLEAEIGIPIVVARANGLDYAFTQGEDTVLAAMVQKCPELGAIPAIVPQIPSDSRTLSQLSVAASVPENSASGPEGEPSLAQKGMDSKLTNNSPCRVDSVSESTPAFPGRAPHVGKSTPQNLVLFGSLPSTMANQLEFELKRQGINVTGWLPAARYSSLPALGENVYVCGINPFLSRTATSLMRRRKCKLISAPFPIGPDGTKAWVEKICNVFGVTPTGLEDRERLVWEGLKDYLNFVKGKSVFFMGDNLLEISLARFLIRCGMTVYEIGIPYMDQRFQAGELELLKKTCMEMNVPLPRIVEKPDNYYQIQRIKELQPDLVITGMAHANPLEARGITTKWSVEFTFAQIHGFGNARDILELVTKPLRRNKNLSKYQFPLDSWDKPASVGAHELSA

  光非依赖性原叶绿素酸酯还原酶亚基B(ch1B)核酸序列(SEQ ID NO:15):

  atgaaattagcgtattggatgtatgcgggaccggctcatattggaacattacgagttgcaagctcgtttcgaaatgtgcatgctattatgcatgctcccttaggcgatgattattttaacgtaatgcgttcaatgttagaacgtgaacgtgattttacgccagtgacggcaagtattgttgatcgtcatgttttagctcgtggttcacaagaaaaagttgttgaaaacattcaacgaaaagataaagaagaatgtccggatttaattttattaacaccaacatgtacctcaagtattttgcaagaagatttacaaaattttgtaaatcgcgcggccgaagtagcaaagcgttcggatgttttattagctgacgttaaccattaccgagtgaatgaattacaagcggctgaccgtacgttagagcaaattgtacgcttttatttagaaaaagaagtaaataaacttcacgcggagttaggcggccttaaaaaaccgcttcgctttgcccagcgtacccaaaagccgtctgccaatattttaggcatgtttacactaggtttccataatcaacatgactgtcgtgaattaaaacgtttattaaatgatttaggtatcgaagtcaatgaagtgattcctgaaggtagttttgtacatggattaaaaaatttaccaaaagcgtggtttaacatcgtcccgtatcgtgaagttggtttaatgacggcaatttatttagaaaaagaatttggcatgccttatacctcaatcacgccaatgggcattattgacaccgcggcgtttattcgtgaaattgcggccatttgtagtcaaattagcacttcacaggcatctacaaactcaactgaaggactccagaggggagaaaatgtcagtttaactgaaactaattcgattatttttaataaagcaaaatatgaacaatacattaatcaacaaacgcattttgtttctcaagcagcttggttttcacgttctattgactgtcaaaatttaaccggtaaaaaaaccgttgtgtttggtgatgcaactcacgcggcaagtatgacgaaaattcttgtgcgcgaaatgggtattcatgttgtttgcgcgggcacgtattgtaaacatgatgcagattggtttagagagcaagtttcaggtttttgtgatcaagttttaattacagatgatcacagccaaattgcggaaatcattgctcaaattgaacctgcagccatttttggtacacaaatggaacgtcatgttgggaaaaggttagatattccttgtggggttatttctgcaccggtacatattcaaaacttcccactaggctttagaccgtttttagggtatgaaggtactaatcaaatttccgatttagtttataattcgtttagtttaggtatggaagatcacttactagaaattttcaacggtcatgacaataaagaagttattacacgttcgtattcttcagaaactgatttagaatggacaaaagaagcattagatgaactagctcgtgttcctggttttgttcgttcaaaagttaaacgtaatactgaaaaatttgcgcgtacaaataaaaatcaagttattactattgaagttatgtacgcagctaaagaagcggtatcagcgtaa

  光非依赖性原叶绿素酸酯还原酶亚基B(ch1B)氨基酸序列(SEQ ID NO:16):

  MKLAYWMYAGPAHIGTLRVASSFRNVHAIMHAPLGDDYFNVMRSMLERERDFTPVTASIVDRHVLARGSQEKVVENIQRKDKEECPDLILLTPTCTSSILQEDLQNFVNRAAEVAKRSDVLLADVNHYRVNELQAADRTLEQIVRFYLEKEVNKLHAELGGLKKPLRFAQRTQKPSANILGMFTLGFHNQHDCRELKRLLNDLGIEVNEVIPEGSFVHGLKNLPKAWFNIVPYREVGLMTAIYLEKEFGMPYTSITPMGIIDTAAFIREIAAICSQISTSQASTNSTEGLQRGENVSLTETNSIIFNKAKYEQYINQQTHFVSQAAWFSRSIDCQNLTGKKTVVFGDATHAASMTKILVREMGIHVVCAGTYCKHDADWFREQVSGFCDQVLITDDHSQIAEIIAQIEPAAIFGTQMERHVGKRLDIPCGVISAPVHIQNFPLGFRPFLGYEGTNQISDLVYNSFSLGMEDHLLEIFNGHDNKEVITRSYSSETDLEWTKEALDELARVPGFVRSKVKRNTEKFARTNKNQVITIEVMYAAKEAVSA

  光非依赖性原叶绿素酸酯还原酶亚基L(ch1L)核酸序列(SEQ ID NO:17):

  atgaaattagcagtttatggcaaaggtggtattggtaaatccacaacaagttgtaacatttcaattgcattagcaaaacgtggcaaaaaagtattacaaattggttgtgatccaaaacacgatagtacttttacattaaccggttttttaattccaacaattattgatactttacaaagtaaagattatcattacgaagatgtttggccggaagatgttatttaccaaggctacgggagtgtggattgtgttgaagcaggtggcccgccagccggcgccggctgtggtgggtatgttgttggtgaaacagttaaattattaaaagaattaaatgcattttatgaatatgatgttattctgtttgatgttttaggggatgttgtatgtggtgggtttgctgcacctttaaattacgccgactattgcattattgtcacagataatggctttgatgcgttatttgccgcaaaccgtattgctgcttcagtgcgcgaaaaagcgcgcattcacccattacgtttagctgggttaattgggaatcgtacagccaaacgcgatttaatcgataaatacgttgaagcgtgcccgatgccagtcttagaggtattaccgttaattgaagacattcgtgtgtcacgcgtaaaaggtaaaacattatttgaaatggcagaacatgattcatcattacactacatttgtgacttttatttaaatattgcggatcaattattaactgaaccagaaggtgttgttccgcgcgaattagcagaccgtgaattatttactctattatcagatttctatttaaacgctgggactcctagccctagtggatctgagttcggctcaggcgcccttagcggaacgagcggcgaaacagctcccggtaatatgggtcagcacatgagtaacgcagtaaaaacaaacgaacaggaaatgaatttctttcttgtgtaa

  光非依赖性原叶绿素酸酯还原酶亚基L(ch1L)氨基酸序列(SEQ ID NO:18):

  MKLAVYGKGGIGKSTTSCNISIALAKRGKKVLQIGCDPKHDSTFTLTGFLIPTIIDTLQSKDYHYEDVWPEDVIYQGYGSVDCVEAGGPPAGAGCGGYVVGETVKLLKELNAFYEYDVILFDVLGDVVCGGFAAPLNYADYCIIVTDNGFDALFAANRIAASVREKARIHPLRLAGLIGNRTAKRDLIDKYVEACPMPVLEVLPLIEDIRVSRVKGKTLFEMAEHDSSLHYICDFYLNIADQLLTEPEGVVPRELADRELFTLLSDFYLNAGTPSPSGSEFGSGALSGTSGETAPGNMGQHMSNAVKTNEQEMNFFLV

  镁螯合酶亚基H(CHLH2)核酸序列(SEQ ID NO:19):

  atgcggattgtgctggtcagcggcttcgagagctttaacgtgggcctgtacaaggatgcggcggagctgctgaagcgctccatgcccaacgtcacactccaggtgttctccgaccgcgacctggcctccgacgccacccgctcccggctggaggcggctctggggcgcgccgacatcttcttcggatcactgctgttcgactacgaccaggtggagtggctacgggcccggctggagcgggtgcctgtgcggctagtgtttgagtcggcgttggagctcatgagctgcaacaaggtggggtcgttcatgatgggcggcggcggtcccggcggcggcccgcccggcaaggcgcccggcccgccgcccgcggtgaagaaggttctctccatgtttggaagcggtcgcgaggaggacaagatgggcggctcctccaatgtggtggccatgttcagttacctggtggagaccctgatggagccaacgggtgggttatttggtagttggtggttgtgttatggttggccgtttcggttgggtgatctgggctggtatctacaacccccctcaaccctcacgcctccaggctacgtgccgccgcctgtggtggagactcccgcactgggctgcctccacccctccgcgcccggccgctacttcgagtcccccgccgagtacatgaagtggtacgccagggagggcccgctgcgcggcacgggcgccccggtggttggcgtgctgctgtaccgcaagcatgtgatcaccgaccagccgtacatcccgcagctggtcagccagctggaggcggaggggctgctgcccgtgcccatcttcatcaacggcgtggaggcgcacaccgtggttcgcgacctgctgacctccgtgcacgagcaggatctgcttgcacgcggcgagacgggcgccatcagccccaccctgaagcgggacgcggtcaaggtggacgcggtggtgagcaccattggcttcccgctggtgggcggccccgccggcaccatggagggcgggcggcaggcggaggtggccaaggccatcctgggcgccaaggacgtgccgtacacggtggcggcgccgctgcttattcaggacatggagagctggagcagggacggcgtggcgggtctccagagtgtggtgctgtactcgctgccggagctggacggcgcagtggacacggtgccactgggggggctggtgggggacgacatctacctggtgccggagcgggtgaagaagctggcggggcggctcaagtcgtggcgtacgacacgcactaagcatgcctctgtttgtgacgtccagcccctcccccccccgtctcccctctccaccctccctctcccttcctctcccttcctctcactctccaccctcttccccctccgcccaaacataacgaggcgggggctgctgggcgcaagcgggccctggagtacccgctgcgacctagctagtccaactccacccatcccccaatgccgcaatagctttccggagatgagcacacacacacacacacacacacacacacacacacacacacacacacacacacacacacgccacccacgcacacacacacacacacacgctccccccgctcgccacacccccatcccaccccacccgcaggagctgctgacgtaccccgcggactggggcccggccgagtggggcccgctgccctacctgcccgaccccgacgtgctggttcgccgcatggaggcgcagtggggcgagctgcgagcctaccgcggcctcaacacctcggcgcgcggcatgttccaggagtacggggctgacgtggtcctgcacttcggcatgcacggcaccgtggagtggttgcctggggcgccgctggggaacaacggcctcagctggagcgacgtgctgctcggcgagctgccaaacgtgtacgtgtacgctgccaacaacccctccgagtccatcgtggcaaagcggcgcggctacggcaccatcgtcagccacaacgtgccgccgtacgggcgggcgggtctgtacaagcagctttccagcctcaaggagacgcttcaggagtaccgcgaggccgcgcaggccgcacgtgcccgagcaggagccagcagcagcagcggcagtagcagcagtagcagtagcagcggcagtggcagtagcagcagcagtgtggagctgcgggcggcgttggcaccggtgttcgacgcctacactgaccgcctgtatgcctacctgcagctgctggaggggcggctgttcagcgaggggctacacgtactgggagcgccgccggcgccgccgcaggtgggtggttttcccgcgagcttccaacggtaccgtaaactgcccaactgcccaacttctccccaaacacaggaggctgtcaagatccggaacctgctcatgcagaacacgcaggagctggacgggctgctcaagggcctgggtgggcgttacgtgcttcccgaggcgggcggcgacctgctgcgggacgggtcgggcgtgctgcccaccggccgcaacatccacgcactggacccctaccgcatgccctcccccgccgccatggcccgtggggcggcggtggcggcggccattcttgagcagcaccgggcggctaacagcggggcgtggcccgagacctgcgccgtcaacctgtgggggctggactccatcaagagcaagggcgagagtgtgggggtggtgctggcgctggtgggggcggtgccggtgcgcgagggtacgggccgcgtcgcgcgcttccaactggtgccgctgtcagagttgggccggccgcgtgtggacgtgctttgtaacatgagcggcatcttccgcgactccttccagaacgtggtggagctgctcgacgacctgtttgcaagggccgccgccgccgctgacgagccagatgacatgaacttcatcgccaaacacgcccgagccatggagaagcagggcctgtccgccacctcggcccgcctgttctccaacccggctggcgactacgggtcgatggtcaacgagcgagtggggcagggcagctgggccaacggcgacgagctgggtgacacgtgggcggcccgcaacgccttcagctacggccgaggcaaggagcgaggcacggcgcggcccgaggtgctgcaggcgctgctcaagaccacggaccggatcgtgcagcagatcgacagtgtggagtacggcctgacagacatccaggagtactacgccaacacgggcgccctcaagagagccgccgaggtggccaaaggcgacccgggccccggtggccggcggccgcgcgtggggtgttccattgtggaggcctttggcggcgcgggcgcgggcgcgggcggcgccggtggagcgggcgtgccgccgcctcgcgagctggaggaggtgctgcgcctggagtaccgctcgaagctgctcaaccccaagtgggcccgggccatggcggcgcagggcagcggcggcgcctacgagatcagtcagcgcatgacggcgttggtgggctggggcgccaccaccgatttcagggagggctgggtgtgggacccaggcgccatggacacgtatgtgggcgatgaggagatggccagcaagctcaagaagaacaacccgcaggcctttgccaacgtgctgcggcgcatgctggaggcggcgggccgcggcatgtggagccccaacaaggaccagctggcacagctcaagtcgctgtacagcgagatggacgaccagctggagggggtgacg

  镁螯合酶亚基H(CHLH2)氨基酸序列(SEQ ID NO:20):

  MRIVLVSGFESFNVGLYKDAAELLKRSMPNVTLQVFSDRDLASDATRSRLEAALGRADIFFGSLLFDYDQVEWLRARLERVPVRLVFESALELMSCNKVGSFMMGGGGPGGGPPGKAPGPPPAVKKVLSMFGSGREEDKMGGSSNVVAMFSYLVETLMEPTGGLFGSWWLCYGWPFRLGDLGWYLQPPSTLTPPGYVPPPVVETPALGCLHPSAPGRYFESPAEYMKWYAREGPLRGTGAPVVGVLLYRKHVITDQPYIPQLVSQLEAEGLLPVPIFINGVEAHTVVRDLLTSVHEQDLLARGETGAISPTLKRDAVKVDAVVSTIGFPLVGGPAGTMEGGRQAEVAKAILGAKDVPYTVAAPLLIQDMESWSRDGVAGLQSVVLYSLPELDGAVDTVPLGGLVGDDIYLVPERVKKLAGRLKSWRTTRTKHASVCDVQPLPPPSPLSTLPLPSSPFLSLSTLFPLRPNITRRGLLGASGPWSTRCDLASPTPPIPQCRNSFPEMSTHTHTHTHTHTHTHTHTHTRHPRTHTHTHAPPARHTPIPPHPQELLTYPADWGPAEWGPLPYLPDPDVLVRRMEAQWGELRAYRGLNTSARGMFQEYGADVVLHFGMHGTVEWLPGAPLGNNGLSWSDVLLGELPNVYVYAANNPSESIVAKRRGYGTIVSHNVPPYGRAGLYKQLSSLKETLQEYREAAQAARARAGASSSSGSSSSSSSSGSGSSSSSVELRAALAPVFDAYTDRLYAYLQLLEGRLFSEGLHVLGAPPAPPQVGGFPASFQRYRKLPNCPTSPQTQEAVKIRNLLMQNTQELDGLLKGLGGRYVLPEAGGDLLRDGSGVLPTGRNIHALDPYRMPSPAAMARGAAVAAAILEQHRAANSGAWPETCAVNLWGLDSIKSKGESVGVVLALVGAVPVREGTGRVARFQLVPLSELGRPRVDVLCNMSGIFRDSFQNVVELLDDLFARAAAAADEPDDMNFIAKHARAMEKQGLSATSARLFSNPAGDYGSMVNERVGQGSWANGDELGDTWAARNAFSYGRGKERGTARPEVLQALLKTTDRIVQQIDSVEYGLTDIQEYYANTGALKRAAEVAKGDPGPGGRRPRVGCSIVEAFGGAGAGAGGAGGAGVPPPRELEEVLRLEYRSKLLNPKWARAMAAQGSGGAYEISQRMTALVGWGATTDFREGWVWDPGAMDTYVGDEEMASKLKKNNPQAFANVLRRMLEAAGRGMWSPNKDQLAQLKSLYSEMDDQLEGVT

  镁螯合酶亚基l(CHLI1)莱茵衣藻核酸序列(SEQ ID NO:21):

  atggccctgaacatgcgtgtttcctcttccaaggtcgctgccaagcagcagggccgcatctccgcggtgccggttgtgtcgagcaaggtggcctcctccgcccgcgtggcccccttccagggcgctcccgtggccgcgcagcgcgctgctctgctggtgcgcgccgctgccgctactgaggtcaaggctgctgagggccgcactgagaaggagctgggccaggcccgccccatcttccccttcaccgccatcgtgggccaggatgagatgaagctggcgctgattctgaacgtgatcgaccccaagatcggtggtgtcatgatcatgggcgaccgtggcactggcaagtccaccaccattcgtgccctggcggatctgctgcccgagatgcaggtggttgccaacgacccctttaactcggaccccaccgaccccgagctgatgagcgaggaggtgcgcaaccgcgtcaaggccggcgagcagctgcccgtgtcttccaagaagattcccatggtggacctgcccctgggcgccactgaggaccgcgtgtgcggcaccatcgacatcgagaaggcgctgaccgagggtgtcaaggcgttcgagcccggcctgctggccaaggccaaccgcggcatcctgtacgtggatgaggtcaacctgctggacgaccacctggtcgatgtgctgctggactcggccgcctccggctggaacaccgtggagcgcgagggtatctccatcagccaccccgcccgcttcatcctggtcggctcgggcaaccccgaggagggtgagctgcgcccccagctgctggatcgcttcggcatgcacgcccagatcggcaccgtcaaggacccccgcctgcgtgtgcagatcgtgtcgcagcgctcgaccttcgacgagaaccccgccgccttccgcaaggactacgaggccggccagatggcgctgacccagcgcatcgtggacgcgcgcaagctgctgaagcagggcgaggtcaactacgacttccgcgtcaagatcagccagatctgctcggacctgaacgtggacggcatccgcggcgacatcgtgaccaaccgcgccgccaaggccctggccgccttcgagggccgcaccgaggtgacccccgaggacatctaccgtgtcattcccctgtgcctgcgccaccgcctccggaaagaccccctggctgagatcgacgacggtgaccgcgtgcgtgagatcttcaagcaggtgttcggcatggagtaa

  镁螯合酶亚基l(CHLI1)莱茵衣藻氨基酸序列(SEQ ID NO:22):

  MALNMRVSSSKVAAKQQGRISAVPVVSSKVASSARVAPFQGAPVAAQRAALLVRAAAATEVKAAEGRTEKELGQARPIFPFTAIVGQDEMKLALILNVIDPKIGGVMIMGDRGTGKSTTIRALADLLPEMQVVANDPFNSDPTDPELMSEEVRNRVKAGEQLPVSSKKIPMVDLPLGATEDRVCGTIDIEKALTEGVKAFEPGLLAKANRGILYVDEVNLLDDHLVDVLLDSAASGWNTVEREGISISHPARFILVGSGNPEEGELRPQLLDRFGMHAQIGTVKDPRLRVQIVSQRSTFDENPAAFRKDYEAGQMALTQRIVDARKLLKQGEVNYDFRVKISQICSDLNVDGIRGDIVTNRAAKALAAFEGRTEVTPEDIYRVIPLCLRHRLRKDPLAEIDDGDRVREIFKQVFGME

  镁螯合酶亚基l(CHLI2)莱茵衣藻核酸序列(SEQ ID NO:23):

  atgcagagtctccagggtcagcgcgcgttcactgcggtgcgccagggtcgggcgggtcccctgcggactcgcctggtcgtgcgctcgtctgttgccttgccatccacgaaagccgcgaagaagccgaacttcccgttcgtcaagattcagggccaggaggagatgaagcttgcactgctgctgaacgtggtcgaccccaacatcggcggagtgcttattatgggtgaccgcggcactgccaagtcggtcgcggtccgcgccctggtggatatgcttcccgacattgacgtggttgagggcgacgccttcaacagctcccccaccgaccccaagttcatgggccccgacaccctgcagcgcttccgcaacggcgagaagctgcccaccgtccgcatgcggacccccctggtggagctgcctctgggcgccaccgaggaccgcatctgcggcaccatcgacatcgagaaggcgctgacgcagggcatcaaggcctacgagcccggcctgctggccaaggccaaccgcggcatcctgtatgtggacgaggtgaacctgctggatgatggcctggttgatgtcgtgctggactcgtcggctagcggcctgaacactgtggagcgtgagggtgtgtccattgtgcaccctgcccgcttcatcatgattggctcaggcaacccccaggagggtgagctgcgcccgcagctgctggatcgcttcggcatgagcgtcaacgtggccacgctgcaggacaccaagcagcgcacgcagctggtgctggaccggcttgcgtacgaggcggaccctgacgcatttgtggactcgtgcaaggccgagcagacggcgctcacggacaagctggaggcggcccgccagcgcctgcggtccgtcaagatcagcgaggagctgcagatcctgatctcggacatttgctcgcgcctggatgtggatggcctgcgcggtgacattgtgatcaaccgcgccgccaaggcgcttgtggccttcgagggccgcaccgaggtgaccacgaatgacgtggagcgcgtcatctcgggctgcctcaaccaccgcctgcgcaaggacccgctggaccccattgacaacggcaccaaggtggccatcctgttcaagcgcatgaccgaccccgagatcatgaagcgcgaggaggaggccaagaagaagcgcgaggaggcggccgccaaggccaaggcggagggcaaggcggaccgccccacgggcgccaaggctggcgcctgggctggcttgccccctcgtcggtaa

  镁螯合酶亚基l(CHLI2)莱茵衣藻氨基酸序列(SEQ ID NO:24):

  MQSLQGQRAFTAVRQGRAGPLRTRLVVRSSVALPSTKAAKKPNFPFVKIQGQEEMKLALLLNVVDPNIGGVLIMGDRGTAKSVAVRALVDMLPDIDVVEGDAFNSSPTDPKFMGPDTLQRFRNGEKLPTVRMRTPLVELPLGATEDRICGTIDIEKALTQGIKAYEPGLLAKANRGILYVDEVNLLDDGLVDVVLDSSASGLNTVEREGVSIVHPARFIMIGSGNPQEGELRPQLLDRFGMSVNVATLQDTKQRTQLVLDRLAYEADPDAFVDSCKAEQTALTDKLEAARQRLRSVKISEELQILISDICSRLDVDGLRGDIVINRAAKALVAFEGRTEVTTNDVERVISGCLNHRLRKDPLDPIDNGTKVAILFKRMTDPEIMKREEEAKKKREEAAAKAKAEGKADRPTGAKAGAWAGLPPRR

  镁螯合酶亚基D(CHLD)莱茵衣藻核酸序列(SEQ ID NO:25):

  atgaagtctctctgccatgagctcgctggccccagcgttactgggtgcggccggcgaagcctccggaaggctttcagcggtgccaagattgcgcaggtctctcgccccgctgtgcttaacagcgtgcagcgccaacagcgtctcgcctgttctgccgtggccgagctctccgctgctgagctgcgcgccatgaaggtgtctgaggaggactccaagggcttcgatgcggatgtgtcgacccgcctggcccgctcgtaccctctggcggccgtggtgggccaggacaacatcaagcaggcgctgctgctgggcgccgtggacaccgggctgggcggcatcgccatcgccggtcgccgcggtaccgccaagtccatcatggctcgcggcctgcacgctctgctgccgcccattgaggtggtggagggcagcatctgcaacgccgaccccgaggacccccgctcctgggaggctggcctggctgagaagtatgcgggcggccctgtgaagaccaagatgcgctcggcgccgtttgtgcagatccctctgggtgtgactgaggaccgcttggtgggcactgtggacattgaggcgtccatgaaggagggcaagactgtgttccagcccggcctgctggctgaggcgcaccgcggcatcctgtacgtggacgagatcaacctgctggatgacggcattgccaacctgctgctgtccatcctgtcggacggagtcaacgtggtggagcgcgagggcatctccatcagccacccctgccggccgctgctgattgccacctacaaccccgaggagggccctctgcgtgagcacctgctggaccgcatcgccattggcctcagcgccgacgtccccagcaccagcgacgagcgcgtcaaggccattgacgcagccatccgcttccaggacaagccgcaggacactattgacgacaccgcggagctcaccgacgccctgcgcacctcggtcatcctggctcgcgagtacctgaaggacgtgaccatcgcgccggagcaggtgacctacattgtggaggaggcgcgccgcggcggagtccaggggcaccgcgcggagctgtacgcggtcaagtgtgccaaggcgtgtgcggctctggagggccgtgagcgtgtgaacaaggatgacctgcgccaggccgtgcagctggtcatcctgccgcgcgccaccatcctggaccagcccccgcccgagcaggagcagcccccgccgccgcccccgccccctcccccgccgccgccgcaggaccaaatggaggacgaggaccaggaggagaaggaggacgagaaggaggaggaggagaaggagaacgaggaccaggacgagcccgagatccctcaggagttcatgtttgagtccgagggcgtcatcatggacccctccatcctcatgttcgcgcagcagcagcagcgcgcgcagggccgctccggccgcgccaagacgctcatcttcagcgacgaccgcggccgctacatcaagcccatgctgcccaagggtgacaaggtcaagcgcctggcagtggacgccacgcttcgcgccgccgcgccctaccagaagattcgccggcagcaggccatcagcgagggcaaggtgcagcgcaaggtgtacgtggacaagccagacatgcgctccaagaagctggcccgcaaggccggtgcgctggtgatttttgttgtggacgcgtccggctccatggctctgaaccgcatgagcgccgccaagggcgcctgcatgcgcctgctggctgagtcgtacaccagccgcgaccaggtgtgcctcatccccttctacggcgacaaggccgaggtgctgctgccgccctccaagtccatcgccatggcccgccgccgcctggactcgctgccctgcggcggcggctcgccccttgcgcacggcctgtccacggcggtacgtgtgggcatgcaggccagccaggcgggcgaggtgggccgcgtcatgatggtgctcatcacggacggccgcgccaacgtcagcctggccaagtccaacgaggaccccgaggcgctcaagcccgacgcgcccaagcccaccgccgactcgctgaaggacgaggtgcgcgacatggccaagaaggccgcgtccgccggcatcaacgtgcttgtcattgacacggagaacaagttcgtgagcaccggctttgcggaggagatctccaaggcagcgcagggcaagtactactacctgcccaacgccagcgacgccgccatcgcggcggccgcgtccggcgccatggccgcggccaagggcggctactag

  镁螯合酶亚基D(CHLD)莱茵衣藻氨基酸序列(SEQ ID NO:26):

  MKSLCHELAGPSVTGCGRRSLRKAFSGAKIAQVSRPAVLNSVQRQQRLACSAVAELSAAELRAMKVSEEDSKGFDADVSTRLARSYPLAAVVGQDNIKQALLLGAVDTGLGGIAIAGRRGTAKSIMARGLHALLPPIEVVEGSICNADPEDPRSWEAGLAEKYAGGPVKTKMRSAPFVQIPLGVTEDRLVGTVDIEASMKEGKTVFQPGLLAEAHRGILYVDEINLLDDGIANLLLSILSDGVNVVEREGISISHPCRPLLIATYNPEEGPLREHLLDRIAIGLSADVPSTSDERVKAIDAAIRFQDKPQDTIDDTAELTDALRTSVILAREYLKDVTIAPEQVTYIVEEARRGGVQGHRAELYAVKCAKACAALEGRERVNKDDLRQAVQLVILPRATILDQPPPEQEQPPPPPPPPPPPPPQDQMEDEDQEEKEDEKEEEEKENEDQDEPEIPQEFMFESEGVIMDPSILMFAQQQQRAQGRSGRAKTLIFSDDRGRYIKPMLPKGDKVKRLAVDATLRAAAPYQKIRRQQAISEGKVQRKVYVDKPDMRSKKLARKAGALVIFVVDASGSMALNRMSAAKGACMRLLAESYTSRDQVCLIPFYGDKAEVLLPPSKSIAMARRRLDSLPCGGGSPLAHGLSTAVRVGMQASQAGEVGRVMMVLITDGRANVSLAKSNEDPEALKPDAPKPTADSLKDEVRDMAKKAASAGINVLVIDTENKFVSTGFAEEISKAAQGKYYYLPNASDAAIAAAASGAMAAAKGGY

  镁螯合酶亚基H(CHLH1)莱茵衣藻核酸序列(SEQ ID NO:27):

  atgcagacttcctcgcttcttggccggcgcacggcccacccggctgcgggcgcgacgcccaagccggttgcgccctcgccccgcgtggctagcacccgccaggtcgcgtgcaatgtggcgactggaccccggccgcccatgaccaccttcaccggtggcaacaagggccctgctaagcagcaggtgtcgctggatctgcgcgacgagggcgctggcatgttcaccagcaccagcccggagatgcgccgtgtcgtccctgacgatgtgaagggtcgcgttaaggtgaaggttgtgtacgtggtgctggaggcccagtaccagtcggccatcagcgctgcggtgaagaacatcaacgccaagaactccaaggtgtgcttcgaggtggtgggctacctgctggaggagctgcgtgaccagaagaacctcgatatgctcaaggaggatgtggcctctgccaacatcttcatcggctcgctcatcttcattgaggagcttgccgagaagattgtggaggcggtgagccccctgcgcgagaagctggacgcgtgcctgatcttcccgtccatgccggcggtcatgaagctgaacaagctgggcacgttttcgatggctcagctgggccagtcgaagtcggtgttctcggagttcatcaagtctgctcgcaagaacaacgacaacttcgaggagggcttgctgaagctggtgcgcaccctgcctaaggtgctgaagtatctgccctcggacaaggcgcaggacgccaagaacttcgtgaacagcctgcagtactggctgggcggtaactcggacaacctggagaacctgctgctgaacaccgtcagcaactacgtgcccgctctgaagggcgtggacttcagcgtggctgagcccaccgcctaccccgatgtgggtatctggcaccctctggcctcgggcatgtacgaggacctgaaggagtacctgaactggtacgacacccgcaaggacatggtcttcgccaaggacgcccccgtcattggcctggtgctgcagcgctcgcacctggtgactggcgatgagggccactacagcggcgtggtcgctgagctggagagccgcggtgctaaggtcatccccgtctttgccggtggcctggacttctccgcccccgtcaagaagttcttctacgaccccctgggctctggccgcacgttcgtggacaccgttgtgtcgctgaccggcttcgcgctggtgggcggccccgcgcgccaggacgcgccgaaggccattgaggcgctgaagaacctgaacgtgccctacctggtgtcgctgccgctggtgttccagaccactgaggagtggctggacagcgagctgggcgtgcaccccgtccaggtggctctgcaggttgccctgcccgagctggatggtgccatggagcccatcgtgttcgctggccgtgactcgaacaccggcaagtcgcactcgctgcccgaccgcatcgcttcgctgtgcgctcgcgccgtgaactgggccaacctgcgcaagaagcgcaacgccgagaagaagctggccgtcaccgtgttcagcttcccccctgacaagggcaacgtcggcactgccgcctacctgaacgtgttcggctccatctaccgcgtgctgaagaacctgcagcgcgagggctacgacgtgggcgccctgccgccctcggaggaggatctgatccagtcggtgctgacccagaaggaggccaagttcaactcgaccgacctgcacatcgcctacaagatgaaggtggacgagtaccagaagctgtgcccttacgccgaggcgctggaggagaactggggcaagccccccggcaccctgaacaccaacggccaggagctgctggtgtacggccgccagtacggcaacgtcttcatcggcgtgcagcccaccttcggctacgagggcgacccgatgcgcctgctgttctcgaagtcggccagcccccaccacggcttcgccgcctactacaccttcctggagaagatcttcaaggccgacgccgtgctgcacttcggcacccacggctcgctggagttcatgcccggcaagcaggtcggcatgtcgggtgtgtgctaccccgactcgctgatcggcaccatccccaacctctactactacgccgccaacaacccgtctgaggccaccatcgccaagcgccgctcgtacgccaacaccatttcgtacctgacgccgcctgccgagaacgccggcctgtacaagggcctgaaggagctgaaggagctgatcagctcgtaccagggcatgcgtgagtctggccgcgccgagcagatctgcgccaccatcattgagaccgccaagctgtgcaacctggaccgcgacgtgaccctgcccgacgctgacgccaaggacctgaccatggacatgcgcgacagcgttgtgggccaggtgtaccgcaagctgatggagattgagtcccgcctgctgccctgcggcctgcacgtggtgggctgcccgcccaccgccgaggaggccgtggccaccctggtcaacatcgctgagctggaccgcccggacaacaacccccccatcaagggcatgcccggcatcctggcccgcgccattggtcgcgacatcgagtcgatttacagcggcaacaacaagggcgtcctggctgacgttgaccagctgcagcgcatcaccgaggcctcccgcacctgcgtgcgcgagttcgtgaaggaccgcaccggcctgaacggccgcatcggcaccaactggatcaccaacctgctcaagttcaccggcttctacgtggacccctgggtgcgcggcctgcagaacggcgagttcgccagcgccaaccgcgaggagctgatcaccctgttcaactacctggagttctgcctgacccaggtggtcaaggacaacgagctgggcgccctggtagaggcgctgaacggccagtacgtcgagcccggccccggcggtgaccccatccgcaaccccaacgtgctgcccaccggcaagaacatccacgccctggaccctcagtcgattcccactcaggccgcgctgaagagcgcccgcctggtggtggaccgcctgctggaccgcgagcgcgacaacaacggcggcaagtaccccgagaccatcgcgctggtgctgtggggcactgacaacatcaagacctacggcgagtcgctggcccaggtcatgatgatggtcggtgtcaagcccgtggccgacgccctgggccgcgtgaacaagctggaggtgatccctctggaggagctgggccgcccccgcgtggacgtggttgtcaactgctcgggtgtgttccgcgacctgttcgtgaaccagatgctgctgctggaccgcgccatcaagctggcggccgagcaggacgagcccgatgagatgaacttcgtgcgcaagcacgccaagcagcaggcggcggagctgggcctgcagagcctgcgcgacgcggccacccgtgtgttctccaacagctcgggctcctactcgtccaacgtcaacctggcggtggagaacagcagctggagcgacgagtcgcagctgcaggagatgtacctgaagcgcaagtcgtacgccttcaactcggaccgccccggcgccggtggcgagatgcagcgcgacgtgttcgagacggccatgaagaccgtggacgtgaccttccagaacctggactcgtccgagatctcgctgaccgatgtgtcgcactacttcgactccgaccccaccaagctggtggcgtcgctgcgcaacgacggccgcacccccaacgcctacatcgccgacaccaccaccgccaacgcgcaggtccgcactctgggtgagaccgtgcgcctggacgcccgcaccaagctgctcaaccccaagtggtacgagggcatgcttgcctcgggctacgagggcgtgcgcgagatccagaagcgcatgaccaacaccatgggctggtcggccacctcgggcatggtggacaactgggtgtacgacgaggccaactcgaccttcatcgaggatgcggccatggccgagcgcctgatgaacaccaaccccaacagcttccgcaagctggtggccaccttcctggaggccaacggccgcggctactgggacgccaagcccgagcagctggagcgcctgcgccagctgtacatggacgtggaggacaagattgagggcgtcgaataa

  镁螯合酶亚基H(CHLH1)莱茵衣藻氨基酸序列(SEQ ID NO:28):

  MQTSSLLGRRTAHPAAGATPKPVAPSPRVASTRQVACNVATGPRPPMTTFTGGNKGPAKQQVSLDLRDEGAGMFTSTSPEMRRVVPDDVKGRVKVKVVYVVLEAQYQSAISAAVKNINAKNSKVCFEVVGYLLEELRDQKNLDMLKEDVASANIFIGSLIFIEELAEKIVEAVSPLREKLDACLIFPSMPAVMKLNKLGTFSMAQLGQSKSVFSEFIKSARKNNDNFEEGLLKLVRTLPKVLKYLPSDKAQDAKNFVNSLQYWLGGNSDNLENLLLNTVSNYVPALKGVDFSVAEPTAYPDVGIWHPLASGMYEDLKEYLNWYDTRKDMVFAKDAPVIGLVLQRSHLVTGDEGHYSGVVAELESRGAKVIPVFAGGLDFSAPVKKFFYDPLGSGRTFVDTVVSLTGFALVGGPARQDAPKAIEALKNLNVPYLVSLPLVFQTTEEWLDSELGVHPVQVALQVALPELDGAMEPIVFAGRDSNTGKSHSLPDRIASLCARAVNWANLRKKRNAEKKLAVTVFSFPPDKGNVGTAAYLNVFGSIYRVLKNLQREGYDVGALPPSEEDLIQSVLTQKEAKFNSTDLHIAYKMKVDEYQKLCPYAEALEENWGKPPGTLNTNGQELLVYGRQYGNVFIGVQPTFGYEGDPMRLLFSKSASPHHGFAAYYTFLEKIFKADAVLHFGTHGSLEFMPGKQVGMSGVCYPDSLIGTIPNLYYYAANNPSEATIAKRRSYANTISYLTPPAENAGLYKGLKELKELISSYQGMRESGRAEQICATIIETAKLCNLDRDVTLPDADAKDLTMDMRDSVVGQVYRKLMEIESRLLPCGLHVVGCPPTAEEAVATLVNIAELDRPDNNPPIKGMPGILARAIGRDIESIYSGNNKGVLADVDQLQRITEASRTCVREFVKDRTGLNGRIGTNWITNLLKFTGFYVDPWVRGLQNGEFASANREELITLFNYLEFCLTQVVKDNELGALVEALNGQYVEPGPGGDPIRNPNVLPTGKNIHALDPQSIPTQAALKSARLVVDRLLDRERDNNGGKYPETIALVLWGTDNIKTYGESLAQVMMMVGVKPVADALGRVNKLEVIPLEELGRPRVDVVVNCSGVFRDLFVNQMLLLDRAIKLAAEQDEPDEMNFVRKHAKQQAAELGLQSLRDAATRVFSNSSGSYSSNVNLAVENSSWSDESQLQEMYLKRKSYAFNSDRPGAGGEMQRDVFETAMKTVDVTFQNLDSSEISLTDVSHYFDSDPTKLVASLRNDGRTPNAYIADTTTANAQVRTLGETVRLDARTKLLNPKWYEGMLASGYEGVREIQKRMTNTMGWSATSGMVDNWVYDEANSTFIEDAAMAERLMNTNPNSFRKLVATFLEANGRGYWDAKPEQLERLRQLYMDVEDKIEGVE

  原叶绿素酸酯还原酶亚基B(ch1B)核酸序列(SEQ ID NO:29):

  atgaaattagcttattggatgtacgcaggtcccgctcatatcggtgtgttgcgtgttagcagctcttttaaaaatgtacatgccattatgcatgctcctttaggagatgattattttaatgtaatgcgttccatgttagaacgtgaacgtgattttacaccagtaacagccagtattgtagatcgtcatgttttagcaagaggatcgcaagaaaaagtggttgaaaatattacgcgaaaaaataaagaagaaactcctgatttaattttattaactcctacttgtacgtcaagcattttacaagaagatttacacaattttgttgaatcggcattagctaaaccagtacaaatagatgaacatgcagaccataaagtaactcaacaaagtgcactttcaagtgtatcccctttactaccgcttgaagaaaatacattaatagtaagtgaactagataagaagcttagcccgtctagcaagttgcatattaatatgcccaatatttgtattcccgaaggagaaggggaaggggagcagactaaaaattcaatttttgttaaatctgcaactttaacaaatttgtcagaagaggaactattaaatcaagaacatcataccaaaacaagaaatcactctgacgttattttagctgatgtaaaccattatcgtgtaaatgaattacaagctgcagatcgtactcttgaacaaattgtacgttattatatttctcaagcacaaaaacaaaattgtttaaacattactaaaacagccaaaccatctgtaaatattattggtatttttactttgggttttcataatcaacatgattgtcgtgaattaaaacgtttatttaatgatttaggtattcaaatcaatgaaatcatacctgaaggcggaaatgtacacaacttaaaaaaattaccccaagcttggtttaattttgtgccctaccgtgaaattggcttaatgactgctatgtatttaaaatccgagtttaatatgccttacgtcgcaattactcctatgggattaattgatacggctgcttgtattcgttcaatttgtaaaatcattacaactcaattattaaatcagacggctacagtgcaggagccatcaaaatttatttacccgaaggcgacgtcattagaacaaaccaatattctcgaaacctctcaaaaagaaactattcttaaagacaatccagatagcggaaataccctttctacaactgtagaagaaattgaaactttatttaataaatatatcgatcaacaaactcgttttgtttcccaagcagcctggttttcacgttctattgactgtcaaaatttaacaggtaaaaaagccgtagttttcggagatgctacacattcagctgccatgacaaaattattagcacgtgaaatgggtattaaggtttcatgcgctggaacttattgcaaacacgatgcggattggtttagagagcaagttagtgggttttgtgatcaagttttaattaccgatgatcacacacaagtaggggatatgattgcacaattagaacctgcagccatttttgggacacaaatggaacgtcacgttggtaaacgtttagatattccatgtggtgttatatctgctcctgtgcatattcaaaactttccgttaggttatcgaccttttttaggttatgaaggtacaaatcaaatagctgatttagtgtataattcatttaatcttggaatggaagaccatttattacaaatttttggaggtcatgattcagaaaacaattcgtcaattgcaacgcatttgaatacaaataacgcaataaatttagcgccaggatatttacctgagggagaaggcagtagtagaacttcaaatgtagtgtctacaatttctagtgaaaaaaaagccattgtatggtctccagaaggtttagcagaattaaataaagtcccaggatttgttcgaggaaaagttaaacgtaatacggaaaaatatgctttacaaaaaaattgttcgatgattactgtagaagttatgtatgcagcaaaagaagctttgtcggcttaa

  原叶绿素酸酯还原酶亚基B(ch1B)氨基酸序列(SEQ ID NO:30):

  MKLAYWMYAGPAHIGVLRVSSSFKNVHAIMHAPLGDDYFNVMRSMLERERDFTPVTASIVDRHVLARGSQEKVVENITRKNKEETPDLILLTPTCTSSILQEDLHNFVESALAKPVQIDEHADHKVTQQSALSSVSPLLPLEENTLIVSELDKKLSPSSKLHINMPNICIPEGEGEGEQTKNSIFVKSATLTNLSEEELLNQEHHTKTRNHSDVILADVNHYRVNELQAADRTLEQIVRYYISQAQKQNCLNITKTAKPSVNIIGIFTLGFHNQHDCRELKRLFNDLGIQINEIIPEGGNVHNLKKLPQAWFNFVPYREIGLMTAMYLKSEFNMPYVAITPMGLIDTAACIRSICKIITTQLLNQTATVQEPSKFIYPKATSLEQTNILETSQKETILKDNPDSGNTLSTTVEEIETLFNKYIDQQTRFVSQAAWFSRSIDCQNLTGKKAVVFGDATHSAAMTKLLAREMGIKVSCAGTYCKHDADWFREQVSGFCDQVLITDDHTQVGDMIAQLEPAAIFGTQMERHVGKRLDIPCGVISAPVHIQNFPLGYRPFLGYEGTNQIADLVYNSFNLGMEDHLLQIFGGHDSENNSSIATHLNTNNAINLAPGYLPEGEGSSRTSNVVSTISSEKKAIVWSPEGLAELNKVPGFVRGKVKRNTEKYALQKNCSMITVEVMYAAKEALSA

  原叶绿素酸酯还原酶亚基L(chIL)核酸序列(SEQ ID NO:31):

  atgaaattagctgtttacggaaaaggtggtattggaaaatcaacgacaagttgtaatatttcgattgctttacgaaaacgtggtaaaaaagtgttacaaattggttgtgatcctaaacatgatagtacttttacattgacagggtttttaattccaaccattattgatacattaagttctaaagattatcattatgaagatatttggcccgaagatgttatttacggaggttatgggggtgtagattgtgttgaagctggaggaccacctgccggtgcggggtgtggtggttatgttgtaggtgaaacggtaaaacttttaaaagagttaaatgcttttttcgaatacgatgttattttatttgatgttttaggtgatgttgtttgtggtggctttgctgctccattaaactacgctgattattgtattattgtaactgataatggttttgatgctttatttgctgcaaatcgtattgcagcttcagttcgtgaaaaagcacgtacacatccattgcgtttagcgggtttaatcggaaatcgtacatcaaaacgtgatttaattgataaatatgtagaagcttgtcctatgccagtattagaagttttaccattaattgaagaaattcgtatttcacgtgttaaaggcaaaactttatttgaaatgtcaaataaaaataatatgacttcggctcatatggatggctctaaaggtgacaattctacagtaggagtgtcagaaactccatcggaagattatatttgtaatttttatttaaatattgctgatcaattattaacagaaccagaaggagttattccacgtgaattagcagataaagaactttttactcttttatcagatttctatcttaaaatttaa

  原叶绿素酸酯还原酶亚基L(chIL)氨基酸序列(SEQ ID NO:32):

  MKLAVYGKGGIGKSTTSCNISIALRKRGKKVLQIGCDPKHDSTFTLTGFLIPTIIDTLSSKDYHYEDIWPEDVIYGGYGGVDCVEAGGPPAGAGCGGYVVGETVKLLKELNAFFEYDVILFDVLGDVVCGGFAAPLNYADYCIIVTDNGFDALFAANRIAASVREKARTHPLRLAGLIGNRTSKRDLIDKYVEACPMPVLEVLPLIEEIRISRVKGKTLFEMSNKNNMTSAHMDGSKGDNSTVGVSETPSEDYICNFYLNIADQLLTEPEGVIPRELADKELFTLLSDFYLKI

  原叶绿素酸酯还原酶亚基N(ch1N)核酸序列(SEQ ID NO:33):

  atgttagatggtgccacaacgattttaaatttaaatagtttttttgaatgtgaaactggcaattatcatactttttgcccgattagctgtgtagcttggttatatcaaaaaatcgaagatagcttttttttagtaattgggacaaaaacatgtggttattttttacaaaatgcccttggagttatgatttttgccgaacctaggtatgctatggcagaattagaagaaagtgatatttcagcacaattaaacgattataaagaattaaaacgtttatgtttacaaattaaacaagatagaaatcccagcgttattgtttggattggaacttgtacaactgaaattatcaaaatggatttagaagggatggctccacgtttagaaactgaaatcggcatacccattgttgtagcacgtgctaatggtttagattatgcttttacacaaggtgaagacacagttttatcagcaatggccttagcatccttaaaaaaagatgttccttttttagtaggtaatactgggttaacaaacaaccagcttctccttgaaaaatcaacttcttcagttaatgggacagacggaaaggaattacttaaaaaatctcttgtattatttggttccgtaccaagtacagttactacacaattaactttagaattaaaaaaagaaggtattaatgtatctggatggcttccatctgctaattataaagatttacctacttttaataaagatacacttgtatgtggtataaatccttttttaagtcgaacagctaccacgttaatgcgtcgtagtaagtgcacattaatttgtgcaccctttccaataggccccgatggcacaagagtttggattgaaaaaatttgtggtgcttttggcattaatcctagtcttaatccaattactggtaatactaatttatatgatcgtgaacaaaaaattttcaacgggctagaagattatttaaaattattacgtggaaaatctgtattttttatgggtgataatttattagaaatttctttagcacgttttttaacacgttgtggtatgattgtttatgaaatcggaattccatatttagataaacgatttcaagcagcagaattagctttattagaacaaacttgtaaagaaatgaatgtaccaatgccgcgcattgtagaaaaaccagataattattatcaaattcgacgtatacgtgaattaaaacctgatttaacgattactggaatggcacatgcaaatccattagaagctcgaggtattacaacaaaatggtcagttgaatttacttttgctcaaattcatggatttactaatacacgtgaaattttagaattagtaacacagcctcttagacgcaatctaatgtcaaatcaatctgtaaatgctatttcttaa

  原叶绿素酸酯还原酶亚基N(ch1N)氨基酸序列(SEQ ID NO:34):

  MLDGATTILNLNSFFECETGNYHTFCPISCVAWLYQKIEDSFFLVIGTKTCGYFLQNALGVMIFAEPRYAMAELEESDISAQLNDYKELKRLCLQIKQDRNPSVIVWIGTCTTEIIKMDLEGMAPRLETEIGIPIVVARANGLDYAFTQGEDTVLSAMALASLKKDVPFLVGNTGLTNNQLLLEKSTSSVNGTDGKELLKKSLVLFGSVPSTVTTQLTLELKKEGINVSGWLPSANYKDLPTFNKDTLVCGINPFLSRTATTLMRRSKCTLICAPFPIGPDGTRVWIEKICGAFGINPSLNPITGNTNLYDREQKIFNGLEDYLKLLRGKSVFFMGDNLLEISLARFLTRCGMIVYEIGIPYLDKRFQAAELALLEQTCKEMNVPMPRIVEKPDNYYQIRRIRELKPDLTITGMAHANPLEARGITTKWSVEFTFAQIHGFTNTREILELVTQPLRRNLMSNQSVNAIS

  胆色素原脱氨酶(PBGD1)核酸序列(SEQ ID NO:35):

  atgcagcagtgcgttggccgctccgtccgcgctccgtccagcagggcggtcgcgcccaaggtcgctggcgctcgtgtcagccgccgcgtgtgccgcgtctatgcctccgctgttgctaccaagacggtgaagattggcacgcgcggctcgcccctggctctggcccaggcttacatgactcgcgacctgctgaagaagagcttccctgagctgagcgaggagggtgctctggagatcgtgatcatcaagaccaccggtgacaaaatcctgaaccagcccctggctgacatcggtggcaagggtctgtttaccaaggagatcgatgatgctctgctgagcggcaagattgacatcgccgtgcactccatgaaggacgtgcccacctacctgcccgagggcaccatcctgccctgcaacctgccccgcgaggatgtgcgcgatgtgttcatctcgcctgtcgccaaggacctgagcgagctgcccgccggcgccattgtgggctcggcctcgctgcgccgtcaggcccagatcctggccaagtacccccacctcaaggtggagaacttccgcggcaacgtgcagacccgcctgcgcaagctgaacgagggcgcctgctccgccaccctgctggctctggccggtctgaagcgcctggacatgactgagcacatcaccaagaccctcagcattgacgagatgctgcccgccgtgagccagggcgccattggcattgcctgccgcaccgacgacggcgccagccgcaacctgctggccgccctgaaccacgaggagacccgcatcgccgtggtgtgcgagcgcgccttcctgaccgccctggacggctcttgccgcacccccattgccggctacgcgcacaagggcgccgacggcatgctgcacttcagcggcctggtggccaccccggacggcaagcagatcatgcgcgctagccgcgtggtgcccttcacggaggcggatgccgtcaagtgcggcgaggaggccggcaaggagctcaaggccaacggccccaaggagctgttcatgtactaa

  胆色素原脱氨酶(PBGD1)氨基酸序列(SEQ ID NO:36):

  MQQCVGRSVRAPSSRAVAPKVAGARVSRRVCRVYASAVATKTVKIGTRGSPLALAQAYMTRDLLKKSFPELSEEGALEIVIIKTTGDKILNQPLADIGGKGLFTKEIDDALLSGKIDIAVHSMKDVPTYLPEGTILPCNLPREDVRDVFISPVAKDLSELPAGAIVGSASLRRQAQILAKYPHLKVENFRGNVQTRLRKLNEGACSATLLALAGLKRLDMTEHITKTLSIDEMLPAVSQGAIGIACRTDDGASRNLLAALNHEETRIAVVCERAFLTALDGSCRTPIAGYAHKGADGMLHFSGLVATPDGKQIMRASRVVPFTEADAVKCGEEAGKELKANGPKELFMY

  胆色素原脱氨酶(PBGD2)核酸序列(SEQ ID NO:37):

  atgcgatcgtatctgctcaaggctcaagtggcctcatgtcagttttcgcgcacgtcgaaggtctggagactggcgccgggttctgacagacgacggtgtcggggcctcactcggacaccgcactgcgcggcccccaccagcgagcccgccccgccatccagcagcggcaagagcgggcaacgaccactcgtgatagccacgcggccatctaagcttgcaaaggagcagacgcggcaggtgcagcagctgctgctggcggcggcgcagctcaaggacgagcagctgcagctgagcaccctggaactggcgtctaggggcgacacgactcagggtgtgtcgctgcgcagtctgggctcgggcgcattcaccgaggagctggaccaggctgtgctgtcgggcgctgccgacatgtcggtgcacagcctgaaggactgccccgccgccctggcgcccgggctgctgctggccgcctgcctgccgcgggccgacccccgggacgtcctcatcgcgcccgaggccacctcgctgggcgagctggtgccgggcagccgtgtgggcaccagcagcagccgccgcgcggcgcagatcaagcactccttcccccacctgcaggttgtgcagctgcgcggcaatgtggactcgcggctggggcgcatccgcagccgcgacatcggcgccacagtgctggcggcggcgggcctcaagcggctgggtgtgatgaactcggacgagggtgacactaccgctacgggcgccgtgggggtggtgtgcagggcagacgatgagtgggtggtcggcctgctggacgccatctcgcaccgcggcacggccctggaggtggcggcggagcgggcgtgcctggcagcgctgctgggcggcggcggcgcgtgccagcgttcagcgttcccggacattgcgtgggcctgccacacgcggcacgaccccgacagcaacacaatggacctggattgcctggtggcggacctggagggcaaggagctcttcaggtacacggagttctaccggccggtcattgacgaggtggacgcggtgtcgctggggtcgctgtacggcagcctgctgcgcatgatggcgccaccaggcgcggccccctgttggcagctaccttcctcgcggcattag

  胆色素原脱氨酶(PBGD2)氨基酸序列(SEQ ID NO:38):

  MRSYLLKAQVASCQFSRTSKVWRLAPGSDRRRCRGLTRTPHCAAPTSEPAPPSSSGKSGQRPLVIATRPSKLAKEQTRQVQQLLLAAAQLKDEQLQLSTLELASRGDTTQGVSLRSLGSGAFTEELDQAVLSGAADMSVHSLKDCPAALAPGLLLAACLPRADPRDVLIAPEATSLGELVPGSRVGTSSSRRAAQIKHSFPHLQVVQLRGNVDSRLGRIRSRDIGATVLAAAGLKRLGVMNSDEGDTTATGAVGVVCRADDEWVVGLLDAISHRGTALEVAAERACLAALLGGGGACQRSAFPDIAWACHTRHDPDSNTMDLDCLVADLEGKELFRYTEFYRPVIDEVDAVSLGSLYGSLLRMMAPPGAAPCWQLPSSRH

  原卟啉原氧化酶(PPX1)核酸序列(SEQ ID NO:39):

  atgatgttgacccagactcctgggaccgccacggcttctagccggcggtcgcagatccgctcggctgcgcacgtctccgccaaggtcgcgcctcggcccacgccattctcggtcgcgagccccgcgaccgctgcgagccccgcgaccgcggcggcccgccgcacactccaccgcactgctgcggcggccactggtgctcccacggcgtccggagccggcgtcgccaagacgctcgacaatgtgtatgacgtgatcgtggtcggtggaggtctctcgggcctggtgaccggccaggccctggcggctcagcacaaaattcagaacttccttgttacggaggctcgcgagcgcgtcggcggcaacattacgtccatgtcgggcgatggctacgtgtgggaggagggcccgaacagcttccagcccaacgatagcatgctgcagattgcggtggactctggctgcgagaaggaccttgtgttcggtgaccccacggctccccgcttcgtgtggtgggagggcaagctgcgccccgtgccctcgggcctggacgccttcaccttcgacctcatgtccatccccggcaagatccgcgccgggctgggcgccatcggcctcatcaacggagccatgccctccttcgaggagagtgtggagcagttcatccgccgcaacctgggcgatgaggtgttcttccgcctgatcgagcccttctgctccggcgtgtacgcgggcgacccctccaagctgtccatgaaggcggccttcaacaggatctggattctggagaagaacggcggcagcctggtgggaggtgccatcaagctgttccaggaacgccagtccaacccggccccgccgcgggacccgcgcctgccgcccaagcccaagggccagacggtgggctcgttccgcaagggcctgaagatgctgccggacgccattgagcgcaacatccccgacaagatccgcgtgaactggaagctggtgtctctgggccgcgaggcggacgggcggtacgggctggtgtacgacacgcccgagggccgtgtcaaggtgtttgcccgcgccgtggctctgaccgcgcccagctacgtggtggcggacctggtcaaggagcaggcgcccgccgccgccgaggccctgggctccttcgactacccgccggtgggcgccgtgacgctgtcgtacccgctgagcgccgtgcgggaggagcgcaaggcctcggacgggtccgtgccgggcttcggtcagctgcacccgcgcacgcagggcatcaccactctgggcaccatctacagctccagcctgttccccggccgcgcgcccgagggccacatgctgctgctcaactacatcggcggcaccaccaaccgcggcatcgtcaaccagaccaccgagcagctggtggagcaggtggacaaggacctgcgcaacatggtcatcaagcccgacgcgcccaagccccgtgtggtgggcgtgcgcgtgtggccgcgcgccatcccgcagttcaacctgggccacctggagcagctggacaaggcgcgcaaggcgctggacgcggcggggctgcagggcgtgcacctggggggcaactacgtcagcggtgtggccctgggcaaggtggtggagcacggctacgagtccgcagccaacctggccaagagcgtgtccaaggccgcagtcaaggcctaa

  原卟啉原氧化酶(PPX1)氨基酸序列(SEQ ID NO:40):

  MMLTQTPGTATASSRRSQIRSAAHVSAKVAPRPTPFSVASPATAASPATAAARRTLHRTAAAATGAPTASGAGVAKTLDNVYDVIVVGGGLSGLVTGQALAAQHKIQNFLVTEARERVGGNITSMSGDGYVWEEGPNSFQPNDSMLQIAVDSGCEKDLVFGDPTAPRFVWWEGKLRPVPSGLDAFTFDLMSIPGKIRAGLGAIGLINGAMPSFEESVEQFIRRNLGDEVFFRLIEPFCSGVYAGDPSKLSMKAAFNRIWILEKNGGSLVGGAIKLFQERQSNPAPPRDPRLPPKPKGQTVGSFRKGLKMLPDAIERNIPDKIRVNWKLVSLGREADGRYGLVYDTPEGRVKVFARAVALTAPSYVVADLVKEQAPAAAEALGSFDYPPVGAVTLSYPLSAVREERKASDGSVPGFGQLHPRTQGITTLGTIYSSSLFPGRAPEGHMLLLNYIGGTTNRGIVNQTTEQLVEQVDKDLRNMVIKPDAPKPRVVGVRVWPRAIPQFNLGHLEQLDKARKALDAAGLQGVHLGGNYVSGVALGKVVEHGYESAANLAKSVSKAAVKA

  尿卟啉原III脱羧酶(UROD1)核酸序列(SEQ ID NO:41):

  atgcagaccaaggctttcacctctgcgcgcccccagcgggccgctgcgctcaaggcgcagcgcacctcgtcggtgaccgtgcgcgcgaccgcggcccccgccgtggcctctgcccccgccgcctcgggctctgcctctgaccccctgatgctgcgcgccatccgcggcgacaaggtggagcgcccgcccgtgtggatgatgcgccaggccggccgctaccagaaggtgtaccaggacctgtgcaagaagcaccccacgttccgtgagcgctcggagcgcgtggacctggcggtggagatctctctgcagccgtggcacgcgttcaagcccgacggcgtcatcctgttcagcgacattctgacccccctgcccggcatgaacatccccttcgacatggcgcccggccccatcatcatggaccccatccgcaccatggcgcaagtggagaaggtgacgaagctggacgctgaggccgcctgccccttcgtgggcgagtcgctgcgccagctgcgcacctacatcggcaaccaggccgcggtcctgggcttcgtgggcgcccccttcaccctggccacctacattgtggagggcggcagctccaagaacttcgcgcacatcaagaagatggctttctccacccccgagatcctgcacgccctgctggacaagctggctgacaacgtggccgactacgtccgctaccaggccgacgccggcgcccaggtggtgcagatcttcgactcgtgggccagcgagctgcagccccaggacttcgacgtgttctccggcccctacatcaagaaggtgatcgacagcgtgcgcaagacccaccccgacctgcccatcatcctctacatcagcggctctggcggcctgctggagcgcatggcctcttgctcgcccgacatcatctcgctggaccagtcggtggacttcaccgacggcgtcaagcgctgcggcaccaacttcgccttccagggcaacatggaccccggcgtcctgttcggctccaaggacttcatcgagaagcgcgtcatggacaccatcaaggctgcccgcgacgccgacgtgcgccacgtgatgaacctgggccacggcgtgctgcccggcacccccgaggaccacgtgggccactacttccacgtcgcccgcaccgcccacgagcgcatgtaa

  尿卟啉原III脱羧酶(UROD1)氨基酸序列(SEQ ID NO:42):

  MQTKAFTSARPQRAAALKAQRTSSVTVRATAAPAVASAPAASGSASDPLMLRAIRGDKVERPPVWMMRQAGRYQKVYQDLCKKHPTFRERSERVDLAVEISLQPWHAFKPDGVILFSDILTPLPGMNIPFDMAPGPIIMDPIRTMAQVEKVTKLDAEAACPFVGESLRQLRTYIGNQAAVLGFVGAPFTLATYIVEGGSSKNFAHIKKMAFSTPEILHALLDKLADNVADYVRYQADAGAQVVQIFDSWASELQPQDFDVFSGPYIKKVIDSVRKTHPDLPIILYISGSGGLLERMASCSPDIISLDQSVDFTDGVKRCGTNFAFQGNMDPGVLFGSKDFIEKRVMDTIKAARDADVRHVMNLGHGVLPGTPEDHVGHYFHVARTAHERM

  尿卟啉原III合酶(HEM4)核酸序列(SEQ ID NO:43):

  atgtcggccctggacgccgccgccatcccctacgagctagtgccgggtgtgtcctccgctctggccgccccgctgttcgccggcgtcccgctcacacacgtcagcctgagcccctcgttcaccgtggtcagcgggcacgacgtggccggcaccgactgggcggcgttccgggggctgcccacgctggtggttctgatggcgggtcgtaacctggggcagatagcccggcggcttgtgcaggacgcggggtgggcgcccgatacacctgtaagtcaacctagtggctag

  尿卟啉原III合酶(HEM4)氨基酸序列(SEQ ID NO:44):

  MSALDAAAIPYELVPGVSSALAAPLFAGVPLTHVSLSPSFTVVSGHDVAGTDWAAFRGLPTLVVLMAGRNLGQIARRLVQDAGWAPDTPVSQPSG

  CHLD 5’未翻译区域(调控区域)(SEQ ID NO:45):

  ggcgtccccacaaccaggacagcctacttcttgaccttattaataagtcgctgcgtgtcgcgactgaccattttggcccggacttgcgtgcttgtgatttgtgcttcgactagatccgcgggcaccaagggacgcggacagctgatagtcaagaactagatcctctgggagcgtctggggctgtccccgctgctcgccaaggaa

  CHLD 3’未翻译区域(调控区域)(SEQ ID NO:46):

  gtgccgagtgactgaggtggcaaggtgcagtggcggcggaggcagttgtgctggggtggcaaggcggacaggcgaagctggtgggttgcgacgaggaggaggtgcacgtgcacgcgtaacataagaagaacagtgggaggacaggtagcgtgacttgactgggacgaggagcgtactgatgtgtggcgtgtgttggtatgtgagcgttacccctcccctagatagcggcggtctccactttcaggaggatgagagccatcatgaggctttgagggggcactggttcgtgtgtaggctgaggctgctgttgaagtcacaaggcagcactgcatgcgcgagtgagtgtggccggatatgcatcgagttgcaggtacactgaaatgaggtgactgcggcgtatatcgctgccagtacaggttgaagcggcgggcacggtgaatggagtactcggcctggaacgcttgcgatcagatggtcgagctcaagaagatttggttgagccgttgggtcgtgcgtcatattatggcttgcatcttcggggagcggcaagaaacggactccaatgcaggccctcgggcgagaaagattgggcgtgtccgggggtgcattctcgccgcgtggggctgcatcgaatttcgcttgagtgccccttcccggggagggggggcggtagttcaaccccatcatcgtaggggggttgtaaatgccagcccaaactaaa

  CHLD外显子1(SEQ ID NO:47):

  atgaagtctctctgccatgagctcgctggccccagcgttactgggtgcggccggcgaagcctccggaaggctttcagcggtgccaagattgcgcaggtctctcgccccgctgtgcttaacagcgtgcagcgccaacagcgtctcgcctgttctgccgtggccgagctctccgctgctgagctgcgcg

  CHLD外显子2(SEQ ID NO:48):

  ccatgaaggtgtctgaggaggactccaagggcttcgatgcggatgtgtcgacccgcctggcccgctcgtaccctctggcggccgtggtgggccaggacaacatcaagcaggcgctgctgctgggcgccgtggacaccgggctgggcggcatcgccatcgccggtcgccgcggtaccgccaagtccatcatggctcgcggcctgcacgctctgctgccgcccattgaggtggtggagggcagcatctgcaacgccgaccccgaggacccccgctcctgggag

  CHLD外显子3(SEQ ID NO:49):

  gctggcctggctgagaagtatgcgggcggccctgtgaagaccaagatgcgctcggcgccgtttgtgcagatccctctgggtgtgactgaggaccgcttggtgggcactgtggacattgaggcgtccatgaag

  CHLD外显子4(SEQ ID NO:50):

  gagggcaagactgtgttccagcccggcctgctggctgaggcgcaccgcggcatcctgtacgtggacgagatcaacctgctggatgacggcattgccaacctgctgctgtccatcctgtcggacggagtcaacgtggtggagcgcgagggcatctccatcagccaccc

  CHLD外显子5(SEQ ID NO:51):

  ctgccggccgctgctgattgccacctacaaccccgaggagggccctctgcgtgagcacctgctggaccgcatcgccattggcctcagcgccgacgtccccagcaccagcgacgagcgcgtcaaggc cattgacgcagccatccgcttccaggacaagccgcag

  CHLD外显子6(SEQ ID NO:52):

  gacactattgacgacacc gcggagctcaccgacgccctgcgcacctcg

  CHLD外显子7(SEQ ID NO:53):

  gtcatcctggctcgcgagtacctgaaggacgtgaccatcgcgccggagcaggtgacctacattgtggaggaggcgcgccgcggcggagtccaggggcacc gcgcggagctgtacgcggtcaag

  CHLD外显子8(SEQ ID NO:54):

  tgtgccaaggcgtgtgcggctctggagggccgtgagcgtgtgaacaaggatgacctgcgccaggccgtgcagctggtcatcctgccgcgcgccaccatcctggaccagcccccgcccgagcaggagcagcccccgccgccgcccccgccccctcccccgccgccgccgcag

  CHLD外显子9(SEQ ID NO:55):

  gaccaaatggaggacgaggaccaggaggagaaggaggacgagaaggaggaggaggagaaggagaacgaggaccaggacgagcccgag

  CHLD外显子10(SEQ ID NO:56):

  atccctcaggagttcatgtttgagtccgagggcgtcatcatggacccctccatcctcatgttcgcgcagcagcagcagcgcgcgcagggccgctccggccgcgccaagacgctcatcttcagcgacgaccgcggccgctacatcaagcccatgctgcccaagggtgacaaggtcaagcgcctggcagtggacgccacgcttcgcgccgccgcgccctaccagaag

  CHLD外显子11(SEQ ID NO:57):

  attcgccggcagcaggccatcagcgagggcaaggtgcagcgcaaggtgtacgtggacaagccagaca

  CHLD外显子12(SEQ ID NO:58):

  tgcgctccaagaagctggcccgcaaggccggtgcgctggtgatttttgttgtggacgcgtccggctccatggctctgaaccgcatgagcgccgccaagggcgcctgcatgcgcctgctggctgagtcgtacaccagccgcgaccaggtgtgcctcatccccttctacggcgacaaggccgaggtgctgctgccgccctccaagtccatcgccatggcccgccgccgcctggactcgctgccctgcggcggcggctcgccccttgcgcacggcctgtccacggcggtacgtgtgggcatgcaggccagccaggcgggcgaggtgggccgcgtcatgatggtgctcatcacggacggccgcgccaacgtcagcctggccaagtccaacgaggaccccgaggcgctcaagcccgacgcgcccaagcccaccgccgactcgctgaaggacgaggtgcgcgacatggccaagaaggccgcgtccgccggcatcaacgtgcttgtcattgacacggagaacaagttcgtgagcaccggctttgcggaggagatctccaaggcagcgcagggcaagtactactacctgcccaacgccagcgacgccgccatcgcggcggccgcgtccggcgccatggccgcggccaagggcggctactag

  CHLD内含子1(SEQ ID NO:59):

  gtgagcgcctactttgatatgtaccaaagataccactgataggtttaggcacggaagatctggacttggaccccgtttgcgcaagccgggcgatgcacccatttcgcggtcacgccgagcgctggggtgcaatttagcgtgcccgacaagctagaaaacagggaattaccatttgtttaattttgttgcgagagatctttgcttgtgtccaccggccgcgcgggggaacttccggtgttgcgcaaggttgcgtgcgtgcccaccatcaacacctgtgccaggtctgtgtcacccccaggttccaccaccctgcaatcttccaattgtgtctcgtttgctcgttgtctaatagtcgtcctttgctcatccctacctgcag

  CHLD内含子2(SEQ ID NO:60):

  gtgaggcagggaaggtgacacaggaggttttgaaagagagacagggaggcaaagatggatggcggggcgggcagtgactttggggcggcatggagtgggattggtggagtgggattgggcaccatgtatcacagatgttggcaacacagcgcagggccttgctctgtgcttgtgttgaccgtctagtcccccgtgccctgaaccaagtctttcctcctgacacggtcctccatgtcctccttccggcattcccttcctcgtccacag

  CHLD内含子3(SEQ ID NO:61):

  gtgagccagcaagggaggagaggggaacggccgggtagggcagccggagtttaaccacgccaattcaacggggagcaacggggaagaggaagggccggaagaggacggcaaaagcatttggtgggggcagcggctgtagtcagaagcgcaaaggctgccacagtgtggcccgcaccctcctcaccaccagtttggcatgatcgtttagcatgggctggaatactcaccgccagttctctcctctcccctctcctcccctgtccccgcctgcag

  CHLD内含子4(SEQ ID NO:62):

  gtgagtgcgcgcgctgggtgtgtttgtgggacggcgcggcattggagcgcaggtgcgggtgctgggccgtgcacttgtccgttggttcccttggaagcttcgatacacactcttactgcacgctctttaaccgccccccccctccacctctgcccgccccgtgcag

  CHLD内含子5(SEQ ID NO:63):

  gtgggtgggggaaagtgactggatgtcggtgggttttaggtatgtgcgtgtgtacgatgcggggagcagtacggaagcgggcacgagcggtgagggggcaggattgtggcgcacgctcgggccaagcccgggctcgcgacagagggtgggcttgtattcgtagtcaagcgcatcaggaagtgcagttgactggattcacctgaaacggcgctgagcgggcggctaatagaatcccgcttcctgtccgcccctccccttgcccttcaatccgtcag

  CHLD内含子6(SEQ ID NO:64):

  gtgagtggcgggggccgtgcgtttgtttgttgcgtgggctggctggctggctttgttggatgagggcgctgctcaccactcatctctttgaatccccacttatccagttgcctgcatgaaaccccgcctgactcactccccaccatcctgtaccgcttttccaaacatccttgcaaccatcccgccatccccacccgcag

  CHLD内含子7(SEQ ID NO:65):

  gtgaggagttggagggggaaggggcgaggggatgcgacagaagcgagggcgaggggagccggggtgggttgttgcaagtgtcgtgaattatagaatgaccccaaaagcgccggcccaacagggcctattacttgcgagtcaatccaacccctgatatagggagaatggggtagaggtcgtatcacgacagcaaggatgtacagtgggccttggggttgggaggtacagggaaaaaggagaggacatggggttgggtaagcggggaataacaaatatacacccagcgtttatggaagtgggagatggaaacgggggcggacgaacaggaacaggggccggatggaggggctatgggggcatggtgggtgggggtacggcgcggggcagagcagggtcttgggtgaatgggcaagatgctgatgcttgggatgaagacactatgagcaaagaaatggttgttgacgattgccatgatcatcgcagtgggggaggcggggtggcaataccggcagtcaacagttggggtgcgatcaagattgattggagtaccagcagtggccgggatctggctgacgtgtctcgagcgagttgctggggtggcaaggagatgcaggggcagacgacgttgtgcgaccacacttacacacatttccttccccttgcgtgtgtccgtgcgccctgtgcctccag

  CHLD内含子8(SEQ ID NO:66):

  gtacgtaaacgtatttgattgctcaggtggttagccttggtgtggctgctgtttgacttgtgcagctgtctttgtgtacatgttccacaaccctgtactccccatattccgcccccattccag

  CHLD内含子9(SEQ ID NO:67):

  gtgagaggcggcgcggcggcttgcgggcgaaggcggggggcggggcggaggcaatgcggccgcgcatggccagcaacggaagggctggctatcaacacggcgagcgcacgatattcatataagagtgccatcgtgcaatgctgaatacttgcgccaaccggatctcgctgctccgcttccaccggactgctttctcatctctccccttcaccctgtgtgtatccacag

  CHLD内含子10(SEQ ID NO:68):

  gtgagtgcccgaggtggtgggtggtgaattggggcacgagggtatgtgggcctaagggagctgaatggggcatgttttcttctgagcatcacggtcagagcttgacctgtcctccccgctgtacccccgtgcacggtccgacacag

  CHLD内含子11(SEQ ID NO:69):

  gtgagtacagcgcatcccggcgcaatcattgggcctagttactgctgcaggactcgtgtgctcttaagggctggcagctgtcagaagctctactcctcgcactgaccactgtgcctttctctccttcctctctccctccccgcacccctcctcccacttcctcaacag

  CHLI2 5’-未翻译区域(调控区域)(SEQ ID NO:70):

  gcagacttccataaagctcttgtaacgctgtaccaactagtaagcggtacaattcgcctgagcccgagcaacgcgacctttcttgctctgtggatctctgataatctaaccagaccaaaaccttttcactaatctaggcaaca

  CHLI2 3’-未翻译区域(调控区域)(SEQ ID NO:71):

  aaaaggctggtgtaggcctgtcgggtcgtgttaaaggttgctgcgtgaacgtgtaagtgtgacagtgtgccggtatgtgtgtgtatacatgtgttgcggtgtgcttttgtggcggtacatggtgatgactgagcgggtgggacagagcacggttaactgacgagggcagtccgtgcgagacggacgtttttgtagccgaggtgcaaggactgatgacgggctaagctgctggagacttggagttgagagtgcaggtggatcgacggtttctctaaggagtatgaataggcaggagggctggagacatttggggtgcaaggaggcggtagtatgggagatgtccatgggcggattttggcctctgtaacttcttaacgccca

  CHLI2外显子1(SEQ ID NO:72):

  atgcagagtctccagggtcagcgcgcgttcactgcggtgcgccagggtcgggcgggtcccctgcggactcgcctggtcgtgcgctcgtctgttgccttgccatccacgaaagccgcgaagaagccgaacttcccgttcgtcaagattcagggccaggaggagatgaagcttgcactgctgctgaacgtggtcgaccccaacatcggcggagtgcttattatgggtgaccgcggcactgccaagtcggtcgcg

  CHLI2外显子2(SEQ ID NO:73):

  gtccgcgccctggtggatatgcttcccgacattgacgtggttgagggcgacgccttcaacagctcccccaccgaccccaagttcatgggccccgacaccctgcagcgcttccgcaacggcgagaagctgcccaccgtccgcatgcggacccccctg

  CHLI2外显子3(SEQ ID NO:74):

  gtggagctgcctctgggcgccaccgaggaccgcatctgcggcaccatcgacatcgagaaggcgctgacgcagggcatcaaggcctacgagcccggcctgctg

  CHLI2外显子4(SEQ ID NO:75):

  gccaaggccaaccgcggcatcctgtatgtggacgaggtgaacctgctggatgatggcctg

  CHLI2外显子5(SEQ ID NO:76):

  gttgatgtcgtgctggactcgtcggctagcggcctgaacactgtggagcgtgagggtgtgtccattgtgcaccctgcccgcttcatcatgattggctcaggcaacccccag

  CHLI2外显子6(SEQ ID NO:77):

  gagggtgagctgcgcccgcagctgctggatcgcttcggcatgagcgtcaacgtggccacgctgcaggacaccaagcagcgcacgcagctggtgctggaccg

  CHLI2外显子7(SEQ ID NO:78):

  gcttgcgtacgaggcggaccctgacgcatttgtggactcgtgcaaggccgagcagacggcgctcacggacaagctggaggcggcccgccagcgcctgcggtccgtcaagatcagcgaggagctgcag

  CHLI2外显子8(SEQ ID NO:79):

  atcctgatctcggacatttgctcgcgcctggatgtggatggcctgcgcggtgacattgtgatcaaccgcgccgccaaggcgcttgtggccttcgagggccgcaccgaggtgaccacgaatgacgtggagcgcgtcatctcgggctgcctcaaccaccg

  CHLI2外显子9(SEQ ID NO:80):

  cctgcgcaaggacccgctggaccccattgacaacggcaccaaggtggccatcctgttcaagcgcatgaccgaccccgagatcatgaagcgcgaggaggaggccaagaagaagcgcgaggaggcggccgccaaggccaaggcggagggcaaggcggaccgccccacgggcgccaaggctggcgcctgggctggcttgccccctcgtcggtaa

  CHLI2内含子1(SEQ ID NO:81):

  gtaggtaacacaagcaattatggggcgaagatctaggctccgctgatccgggcgggcaatcggcatcgtcggtgcaaccgtggggcgtctgtgcaccctttgctggtgccaggttgcctgactcgcctgcattcctgtaccgagccacattggctgctttgcagcgtgcatgggacgggtgtaggataagcgctatgtatgcgatagcgcgggtgcaccggcttggcatggcaaggttgcggggtgcacatgcgtgccagcgtcccctcagcatcagagtctggatctaagggctcagcggcttcctgcgcatgtgggtctttgcgtagtgctacgaagccttataattaaagctcatgtattgagtggtccgggtttggggcactagtagtgccaggaggcgcgtgccaggttgatatgagcatatcagcacccgttccttgcgaaacgcttccgttgtgctcccttccccaccacctccccgctcatacccatacatatggctatccgtcctctcattgcttgcccctacag

  CHLI2内含子2(SEQ ID NO:82):

  gtgagcgggcctaccttctgaagacagtcttacgtgttgcactgcagcggtgttgcgcacctctgcttttgcgtgcgccgggaagcgcggattgcggcctcacagatcaagcccggaaacgcttgttgtttccagcgggtggcacacacgcgcgcgcgcgcacagtgacaccctcacggccgcgctgccctgcag

  CHLI2内含子3(SEQ ID NO:83):

  gtgcgtagtgcatggggagaggggacgaggggaggagggcagggccaataaaccgaaccccaagtcatcgagacacagaacccgataatagctcccagatcgccaaggggtgaggcgggaagccaaggatgatgcgttggccgcattgcgtgttgacgtcaggcttacacagggtctgactggctgtgcttggggtttggcacgcttcttgactggccccgtacgcatgctgcag

  CHLI2内含子4(SEQ ID NO:84):

  gtgagtggtggtggtttctgggtcagcagaggacttctgtagtaggtaatgtgggccagggaagtgtggctaacatgccaaacacgggggcgcaccagtgcaagctgcattcgctgacgtgcacgggtgcaatgggtgcaaggcgaactgcaatcgcggtgcacagttgccagggctgcgctcacgcttgagtgtctgcacacgcactgcag

  CHLI2内含子5(SEQ ID NO:85):

  gtgcgtagcgtgcgcgcatgtacttgtctcccttgtcatgttgggaaaggtcggtccccagcctgcttgcaagatgcggccggtcagcagctgcggacggtcagcacctacgtgccgaggttgtgtaacatgaatggcgttggggcggccgacctgccacaagctgaactgcgaccagcaaggcagctgccagcaacgcacacccgacgtgctacacgcttgtgttttgacctcctaaacacacccgcccgctgtctgtcacgtccacag

  CHLI2内含子6(SEQ ID NO:86):

  gtaagcggcggcggcgcggggacacggagggacatttcgcgagcatgggttgaggagtcgggaggattcggtggctggccggagtcgggagtcggagtcgcgagtcggaagtcaagcttctggcggcttcgtgctgtcgggtgcgctcgccatgatggcgctgaccggagggcgtcacgctgtgtatgtgggcgcgcag

  CHLI2内含子7(SEQ ID NO:87):

  gtacggggcgtacagcgggggcggctgcacggggccagtgaccgacagggcagcacgcggctggcgaagagcgacaaagtgacagggtgaccaagaccgggtgatgccacgagaggggcgcgggagccgtgcattgggtcgaggagggaggaatgcaactttacactgatgcctctgtatacggccgccttccgagccctgcaaaccttcgctttcccccgacgcacgcag

  CHLI2内含子8(SEQ ID NO:88):

  gtgagcgcagcgtgcggtggatgcggtgcgcgtgcgggttgccaacttattattttgtacgtggacgcgtggctggcgatggcatgtcatggcgcgaatggatattgggcgaatggataccggtaatggtagcacggggcggcagggcctggcggtagtggggttgagggggcgaggactccagcgcgcgatacatgccatgttcagcatggccccaactgacagcgcccgctgccctgtgcgccccgctccctccgcgcacccgctcctcctacacag

  CHLH1 5’-未翻译区域(调控区域)(SEQ ID NO:89):

  ctagtctagagggaactagggaggggcaacagagaa

  CHLH1 3’-未翻译区域(调控区域)(SEQ ID NO:90):

  gcggcctccccttcatggtagcactagttggcgggttgtggttggactaggcggctagggtatatacctagtagcggcggctgcggagtggagggctggcgcccagcgcgagggcgtggcctttcctcctggacccgagagcgctccgcgaggagacggcgagtgagataggcagcagcgagcggagatcgatttgtgaacagttttgtggcgggatcccatagcggatgcagagaagaccttagagcagcttcctcggtggagtgaacgagccagagcggagggaaggcgcatgagggaactgcagggactggaactgcgggagtgcaggtccggtgctaggtccgctaaacagtgcggtctacgcctgtgtgtgaggtgtgcgtgtgtgtgtgagctgtgcggttttgttgtgcaaagtaggagtgagccgagccgcgcgtactttgtggcgtgtttggctgctggcgctgagagccaagagagggtaaacgggtttggtattttatggtgcggggtgaaagcagccctcgcaggaatggagcgattctgcagcatgatgcacgtgtgcctgcgcgtggatggtggctgttgatatggctctgccactccggcagcaccgctacgatacctagcggtgcctggagtggtctctctgtttggtgcgtgatgtttgggtttgccgttttgattctttgtttcgtgctgaatggctgaggcggcaagacccctcgtgccagtgtacagagcctcacggctccctcggaccccgcgtggggacgtccattcccggtggcggtgtcgcctcggcggtgtaaagcaaaaaatatttt

  CHLH1外显子1(SEQ ID NO:91):

  atgcagacttcctcgcttcttggccggcgcacggcccacccggctgcgggcgcgacgcccaagccg

  CHLH1外显子2(SEQ ID NO:92):

  gttgcgccctcgccccgcgtggctagcacccgccag

  CHLH1外显子3(SEQ ID NO:93):

  gtcgcgtgcaatgtggcgactggaccccggccgcccatgaccaccttcaccggtggcaacaagggccctgctaagcagcaggtgtcgctggatctgcgcgacgagg

  CHLH1外显子4(SEQ ID NO:94):

  gcgctggcatgttcaccagcaccagcccggagatgcgccgtgtcgtccctgacgatgtgaagggtcgcgttaaggtgaaggttgtgtacgtggtgctggaggcccagtaccagtcggccatcagcgctgcggtgaagaacatcaacgccaagaactccaag

  CHLH1外显子5(SEQ ID NO:95):

  gtgtgcttcgaggtggtgggctacctgctggaggagctgcgtgaccagaagaacctcgatatgctcaaggaggatgtggcctctgccaacatcttcatcggctcgctcatcttcattgaggagcttgccgagaag

  CHLH1外显子6(SEQ ID NO:96):

  attgtggaggcggtgagccccctgcgcgagaagctggacgcgtgcctgatcttcccgtccatgccggcggtcatgaagctgaacaagctgggcacgttttcgatggctcagctgggccagtcgaagtcggtgttctcggagttcatcaagtctgctcgcaag

  CHLH1外显子7(SEQ ID NO:97):

  aacaacgacaacttcgaggagggcttgctgaagctggtgcgcaccctgcctaaggtgctgaagtatctgccctcggacaaggcgcaggacgccaagaacttcgtgaacagcctgcagtactggctgggcggtaactcggacaacctggagaacctgctgctgaacaccgtcagcaactacgtgcccgctctgaagggcgtggacttcagcgtggctgagcccaccgcctaccccgatgtgggtatctggcaccctctggcctcgggcatgtacgaggacctgaaggagtacctgaactg

  CHLH1外显子8(SEQ ID NO:98):

  gtacgacacccgcaaggacatggtcttcgccaaggacgcccccgtcattggcctggtgctgcagcgctcgcacctggtgactggcgatgagggccactacagcggcgtggtcgctgagctggagagccgcggtgctaaggtcatccccgtctttgccg

  CHLH1外显子9(SEQ ID NO:99):

  gtggcctggacttctccgcccccgtcaagaagttcttctacgaccccctgggctctggccgcacgttcgtggacaccgttgtgtcgctgaccggcttcgcgctggtgggcggccccgcgcgccaggacgcgccgaaggccattgaggcgctgaagaacctgaacgtgccctacctggtgtcgctgccgctggtgttccagaccactgaggagtggctggacagcgagctgggcgtgcaccccgtccaggtggctctgcag

  CHLH1外显子10(SEQ ID NO:100):

  gttgccctgcccgagctggatggtgccatggagcccatcgtgttcgctggccgtgactcgaacaccggcaagtcgcactcgctgcccgaccgcatcgcttcgctgtgcgctcgcgccgtgaactgggccaacctgcgcaagaagcgcaacgccgagaagaagctggccgtcaccgtgttcagcttcccccctgacaagggcaacgtcggcactgccgcctacctgaacgtgttcggctccatctaccgcgtgctgaagaacctgcagcgcgagggctacgacgtgggcgccctgccgccctcggaggaggatctgatccagtcggtgctgacccagaaggaggccaagttcaactcgaccgacctgcacatcgcctacaagatgaaggtggacgagtaccagaagctgtgcccttacgccgaggcgctggaggagaactggggcaagccccccggcaccctgaacaccaacggccaggagctgctggtgtacggccgccagtacggcaacgtcttcatcggcgtgcagcccaccttcggctacgagggcgacccgatgcgcctgctgttctcgaagtcggccagcccccaccacggcttcgccgcctactacaccttcctggagaagatcttcaaggccgacgccgtgctgcacttcggcacccacggctcgctggagttcatgcccggcaagcaggtcggcatgtcgggtgtgtgctaccccgactcgctgatcggcaccatccccaacctctactactacgccgccaacaacccgtctgaggccaccatcgccaagcgccgctcgtacgccaacaccatttcgtacctgacgccgcctgccgagaacgccggcctgtacaagggcctgaaggagctgaaggagctgatcagctcgtaccagggcatgcgtgagtctggccgcgccgagcagatctgcgccaccatcattgagaccgccaagctgtgcaacctggaccgcgacgtgaccctgcccgacgctgacgccaaggacctgaccatggacatgcgcgacagcgttgtgggccaggtgtaccgcaagctgatggagattgagtcccgcctgctgccctgcggcctgcacgtggtgggctgcccgcccaccgccgaggaggccgtggccaccctggtcaacatcgctgagctggaccgcccggacaacaacccccccatcaagggcatgcccggcatcctggcccgcgccattggtcgcgacatcgagtcgatttacagcggcaacaacaagggcgtcctggctgacgttgaccagctgcagcgcatcaccgaggcctcccgcacctgcgtgcgcgagttcgtgaaggaccgcaccggcctgaacggccgcatcggcaccaactggatcaccaacctgctcaagttcaccggcttctacgtggacccctgggtgcgcggcctgcagaacggcgagttcgccagcgccaaccgcgaggagctgatcaccctgttcaactacctggagttctgcctgacccag

  CHLH1外显子11(SEQ ID NO:101):

  gtggtcaaggacaacgagctgggcgccctggtagaggcgctgaacggccagtacgtcgagcccggccccggcggtgaccccatccgcaaccccaacgtgctgcccaccggcaagaacatccacgccctggaccctcagtcgattcccactcaggccgcgctgaagagcgcccgcctggtggtggaccgcctgctggaccgcgagcgcgacaacaacggcggcaagtaccccgagaccatcgcgctggtgctgtggggcactgacaacatcaagacctacggcgagtcgctggcccaggtcatgatgatggtcggtgtcaagcccgtggccgacgccctgggccgcgtgaacaagctggaggtgatccctctggaggagctgggccgcccccgcgtggacgtggttgtcaactgctcgggtgtgttccgcgacctgttcgtgaaccagatgctgctgctggaccgcgccatcaagctggcggccgagcaggacgagcccgatgagatgaacttcgtgcgcaagcacgccaagcagcaggcggcggagctgggcctgcagagcctgcgcgacgcggccacccgtgtgttctccaacagctcgggctcctactcgtccaacgtcaacctggcggtggagaacagcagctggagcgacgagtcgcagctgcaggagatgtacctgaagcgcaagtcgtacgccttcaactcggaccg

  CHLH1外显子12(SEQ ID NO:102):

  ccccggcgccggtggcgagatgcagcgcgacgtgttcgagacggccatgaagaccgtggacgtgaccttccagaacctggactcgtccgagatctcgctgaccgatgtgtcgcactacttcgactccgaccccaccaagctggtggcgtcgctgcgcaacgacggccgcacccccaacgcctacatcgccgacaccaccaccgccaacgcgcaggtccgcactctgggtgagaccgtgcgcctggacgcccgcaccaagctgctcaaccccaagtggtacgagggcatgcttgcctcgggctacgagggcgtgcgcgagatccagaagcgcatgaccaacaccatgggctggtcggccacctcgggcatggtggacaactgggtgtacgacgaggccaactcgaccttcatcgaggatgcggccatggccgagcgcctgatgaacaccaaccccaacagcttccgcaagctggtggccaccttcctggaggccaacggccgcggctactgggacgccaagcccgagcagctggagcgcctgcgccagctgtacatggacgtggaggacaagattgagggcgtcgaataa

  CHLH1内含子1(SEQ ID NO:103):

  gtaggtgtaattagaaggatcaaaacctagcggcctgatctgggactgacggcctcgcgcttcaatcactctgatgcag

  CHLH1内含子2(SEQ ID NO:104):

  gtaggcacggcagaatgctcaatgaacatgcagctacatatgtttgggatcatggctgatctctgtgcgacgggtccgcgcag

  CHLH1内含子3(SEQ ID NO:105):

  gtgagcagcgcggaccgagcaagcgctggcgatgcagttggatttgttgttcttgggtcaggcgctcgctcgatggccagcgcgtgtatttaatgggataagggttgagacaaagcatctcttcgggtaaaaatcttagttttcgacagcacgttgagaggcatgcaacttgctctttcgcag

  CHLH1内含子4(SEQ ID NO:106):

  gtgggtaaggagttgcattatcagtgtggcatggtgttgcgggcgtctggggcgctgcaacagcggcatcgtgccgaactgaccgtgccgggctacccgcgtgcag

  CHLH1内含子5(SEQ ID NO:107):

  gtgcgctagggttggggtctggagggtgtggattgcgcccaagtgccctgttgcgcttggcggtcgctgtcatgatgtgagggtgacgtagtgcactcaattgcctgctacgtcaccacctttgatgggctggatctgaggcaggtcagctcggttccctgctgcatccagtgtccctgtcgccctgcacgtttgacgctgttcccccttccgcactgtctcgctttgcag

  CHLH1内含子6(SEQ ID NO:108):

  gtgtgggcacgcgctttgggaagggaggcatacatttttggttgcggttaggctgggcgcggacttggcactcacacggtcattgcacactcatgtctcaccttcatttacggtcccttgtgccgaactacctacag

  CHLH1内含子7(SEQ ID NO:109):

  gtgagcagcatcagggcagagtgcatgaacggattggtggcagtggggaatggaattagacggacacgtctgggcggcaatatgttgcgctgcagtttttggggtgtagtgaactagaaaatagggaagagataggccacataacatccgaaagctcatatttttgcaaccggcgcacctatcacagcccacctgaagggttttgtagtcaacgcgtgcaactgactagatgtccccttacctgtctgatttcag

  CHLH1内含子8(SEQ ID NO:110):

  gtgaggcggggcggcgctgccctcggtaggggttgcagatggtgatgggtaaccgaatgcatggccaatggggagtgaaatcaggaaaggaggggtaacacaatgcagggcagcacctgaatcgtgaaggcggagttaggcagggatctgtcagttcgcctgtcacgtggatgggcgcagctgacctttgtggtgttgtggtgtggcgcag

  CHLH1内含子9(SEQ ID NO:111):

  gtgagctcagctgggacatgtaggggctcgggtcgccggagcatcgatgtagaattacgggaggaggggagaggggagaggattgcacgaaccgagatgagggcggtggttcgggatttcgggcaaaagctcgtgcggcaagcgttcagtgactgaagagcagtgtgcttcaactgcccctctgtccctcag

  CHLH1内含子10(SEQ ID NO:112):

  gtgcgaccggtgccgctgcgtggccaacagcttggtgccaccttcctgcggtgttgatttacactgtgtgcgtggatgtgttggtttttcgcaactttagtctgggctccagctctttgccttcattgatcactcgtcttacctcctgcgccatcatttgaatacag

  CHLH1内含子11(SEQ ID NO:113):

  gtgagccttaatgcaacacgtgtagccgttcgcatgggtggctgggtcatgctatggttggatcggcgtccgcctgcttgctactgcctgttcggtaccagcgtttactgaccccgcgtgtgccattcccaccacctaccccctcgccttgcag

  亚铁螯合酶5’未翻译区域(调控区域)(SEQ ID NO:114):

  gacagtgatatagcaataccgatataataggtttggcgggcttcaccttgtccttacccagaatgtggccctgacagtcgatttccagcccccttgccactcgctccctgatttcttcaatcaactagttgggtcgttttctcgtaagg

  亚铁螯合酶3’未翻译区域(调控区域)(SEQ ID NO:115):

  gggggcgggtggcgagtaaggcgtatggcggagcgaggagatgggctgtggcgtggccggtgttcttttgtgtgattggaaacatagacggggtgcggcacgcggcctgactgctgcgcggttggtgtggttgcggggggagcggggtcgatggggcagcgcgcacgagttggttgaaggaggagggccaggcgctgggctacacccatggtttgaggatgctagtgagtgatgtgtgcggggggcatggtgtgtaccattcagagtccagatgcacgcacggttgcgtgggagcgttccctgctgtgcatgatgatggcgccttcgatgaatcatctcttgaaggtccaaatgaaacgtctgaagtctgcagagggtggtgctggacatgccatccaggcggaagtgggcagctgtgtctgactacaaagtaggtcttgttttgcttggatagcgtttggctatgtagcgtgtattctgctcatcaatcacgccaggcgtcagggactacccatgcaagtcgggagcgtggctggctctggaaaagttgtagctgctaggtggcgttggctggggtgtcatgcatctcggcaggtaggcggtagcggtggacgacctctgcagcggagcatgtgcacaagatgtgactgcgcatgcacccgtatatgacggcgttggcgtcagttgttgagagtgaacagaggagagacgagcgaagctgccatgcccttagtggctggtgcgagaggggaagaaagagagaggaaggactttgcggcagtgccccacgccggagttggggacacggtcatcaacagggcggcggagctgggcggagtgggtgtgtgatgggacagggttcaaggcaggttggcgaggtcggagtgggtagaccagtccttcagtgcaagggcattagggcatgatgtaagggctgaagcttg

  亚铁螯合酶外显子1(SEQ ID NO:116):

  atggcgtcgtttggattgatgcaaaggacggtgcactgtccccagcttgtggaggagcggtgttcgccggtcgctggctgctctggtcgtggcctgccagttatccagcggcaacg

  亚铁螯合酶外显子2(SEQ ID NO:117):

  gcgtggcgtgtgcagtgccaccaacggtgtccagcgagggcgtgtgctgcgccggacggccgcttcgaccgacgtggtctccttcgtggaccccaatgacattagaaaacccgcagcagcagcagctggccctgcggtggataaggtcggcgttctgctgttaaaccttggcgggcccgaaaagctcgacgacgtcaagcctttcctgtataacctattcgccgacccagaaattattcgcctgccagcggcagctcagttcctgcagccgctgctcgcgacgatcatctccacgcttcgcgccccgaagagcgcggagggctatgaggccattggcggtggtagcccgttgcgtaggattacagacgagcaggcggaggcgctggcggagtctctgcgcgccaagggccaacctgcgaacgtgtacgtgggcatgcgctattggcacccctacacggaggaggcgctggagcacattaaggccgacggcgtcacgcgcctggtcatcctcccgctgtaccctcagttctccatctctaccagcggctccagccttcgactgcttgagtcgctcttcaagagcgacatcgcgctcaagtcgctgcggcacacggtcatcccgtcctggtaccagcggcggggctacgtgagcgcgatggcggacctgattgtagag

  亚铁螯合酶外显子3(SEQ ID NO:118):

  gagctgaagaagttccgggacgtgcccagcgtggagctgtttttctccgcgcacggcgtgcccaagtcctacgtggaggaggcgggcgacccatacaaggaggagatggaggagtgcgtgcggctcattacggacgag

  亚铁螯合酶外显子4(SEQ ID NO:119):

  gtcaagcggcgcggcttcgccaacacgcacacgctggcctaccagagccgcgtgggccccgcggaatggctcaagccgtacacggatgagtccatcaa

  亚铁螯合酶外显子5(SEQ ID NO:120):

  ggagctgggcaagcgcggcgtcaagtcgctgctggcggtgcccatcagctttgtcagcgagcacattgagacgttggaggagatcgacatggagtaccgcgagctggcggaggagagcg

  亚铁螯合酶外显子6(SEQ ID NO:121):

  gcatccgcaactggggccgcgtgccggcgctgaacaccaacgccgccttcatcgacgacctggcggacgcggtgatggaggcgctgccctacgtgggctgcctggccgggccgacagactcgctggtgccgctgg

  亚铁螯合酶外显子7(SEQ ID NO:122):

  gcgacctggagatgctgctgcaggcctacgaccgcgagcgccgcacgctgccgtcaccggtggtgatgtgggagtggggctggaccaagagcgcggagacgtggaacggccgcattgccatgattgccatcatcatcatcctggcgctggaggcagccagcggccagtccatcctcaaaaacctgttcctggcggagtag

  亚铁螯合酶内含子1(SEQ ID NO:123):

  gtgcgataataaatttgcatccttatgaattgctcaatgactaacgagcagcgtccgcgaccacag

  亚铁螯合酶内含子2(SEQ ID NO:124):

  gtgagggtggcattctgtaaagggagttgtggagttgggcagagcgagtgggtttggtcgccagggcgaggatgttgcgcgggcgttggcaggaacagggctgctagggcttgcgtggccagcgactagggtttcgactggccagcgccgccggggcgcgcttgccgaagctgcacagccccaagcgcttctgtggatcaaatggaaacttgtggcagtgtgtatgctagcgccttggcgcaagaccaattttagtggtattactgttattactgtggtagcggtgggtattcggcggcgtggttgttgttgcagccccgtgcgactaagaccgctggcaacgacagcaagccgccgcacccaggcatatacggcccaccagcaccaccgtacacaaccacgtgcctttgcactctacgcaccacagcgcgctgctgccgctcccacctcccatcccaacggcccctcttacccccacttcacaacccctcctctcacacgccctcctcttccccctcctcttccag

  亚铁螯合酶内含子3(SEQ ID NO:125):

  gtgggccgggcgcagcgggcgggcgggaggggcaggaggggcaggaggggaggaagggaggggaggaagggatggaaagctggcgcagcggcagcggcgggacaggtagagggcgctgccccagcggcggcaggtgggcatggtgggcgggtaggggcgacgcgtgagggactcgtcaggcatccgcatggcggcgacttgctgctcctcaccgctgacggctgcatctgctgtgtgcgtaacctggcctggctggcaccgcag

  亚铁螯合酶内含子4(SEQ ID NO:126):

  gtgaggcccgtgggtgggacgcggggagggacgcggggagggggagacgcgggagcgggacaagggtgaggatacggggagggaataggagaggccatggggagggatggggacacgggaggatgcacgggcctgggtggagccagggggaagtggacgacgagcccggcgggaggagggctgggtagaaggacgcgggaggtggttgggacaggtggacggggcgtgtggagcatacggcgcaagaagcgggactgagcgggttgcagggatggatgtaatcacggcaagtaagaaccccgagtggggctcagcgtgtcagcctgccttatctttcgcgcaagcgctggggttttatttcgctgtacacacgtcgcgcctttctgccgcag

  亚铁螯合酶内含子5(SEQ ID NO:127):

  gtgaggaggcgccggagttttgggggaaggggtgcggcgtgaagcgagatggcaggggcgaaggaaggagcggatggtggctgggtgcaagcggagaggcgacagagagtggaggttttggtggagcggttggggagaggggcgcagcagggatgcggccctggggatggcgggacagaagggagcaagtttgccaagtgaagggggggggtgctcaagaggagagggcggtggaggttaagacggccgtgctggttatgctggggttgcaaggcgcatgggcgcatggagccgggggagtttggctgtggatgggcactgcggatgggcacggcttgctactcatgtgcggtcgcggtccgcggtgtgtcagccagccaggacccatcccactgggtcttcctgcgtgcctgggactgcttgccgccacccacccattcatcaccaccactgcgcagacccaccaacaccgctgccctgaactgctctgactcttggcgctcctcag

  亚铁螯合酶内含子6(SEQ ID NO:128):

  gtgagtcgcgccgtcgcggttggttcgcggatgccggttggcggatgacgttcggcggttggcattgggtttgggtttgaggggttgttgggtgaggtcgggattggggtcgggattgggggtcgagcgtggggctggcgtggatgatggcgtggtctttggaaggggcttggggaggttgcgcgtgtggatgcggacagcatgggcgcgacagtgcgcatgtgcatgtgctgtgtcaaacgtctggtgcgttcagtgtgtccttgcgtgcctcccaccgtacgcagccatcccgcgcgcctggaccgtagagaccgcctacgtgtccgctagcggcctcggcctcagcctaagcgccagtagcgccagcgacacaagcaacactgtcgctaatggcagcagcggcagcagcagcagtcacgagaatgcccgcggccgggagaaagtgctcctagccgggggccgccgctagctggtttcctcagcgcgtggacggtggtgccttcatcccgaccaccccaggcgcgtccccagtcccgtcgagctcgcctgccttgtggcccgccttgaccgccctggcgccacccggtggctcgcataacgactcgctttccgttctccgcctgacgctgtccgcctgacgctctgcgcttgactctttgcgccttcctcccctcttcccccag

  突变测序的红色藻CHLH DNA(SEQ ID NO:129):

  atgcagacttcctcgcttcttggccggcgcacggcccacccggctgcgggcgcgacgcccaagccggttgcgccctcgccccgcgtggctagcacccgccaggtcgcgtgcaatgtggcgactggaccccggccgcccatgaccaccttcaccggtggcaacaagggccctgctaagcagcaggtgtcgctggatctgcgcgacgagggcgctggcatgttcaccagcaccagcccggagatgcgccgtgtcgtccctgacgatgtgaagggtcgcgttaaggtgaaggttgtgtacgtggtgctggaggcccagtaccagtcggccatcagcgctgcggtgaagaacatcaacgccaagaactccaaggtgtgcttcgaggtggtgggctacctgctggaggagctgcgtgaccagaagaacctcgatatgctcaaggaggatgtggcctctgccaacatcttcatcggctcgctcatcttcattgaggagcttgccgagaagattgtggaggcggtgagccccctgcgcgagaagctggacgcgtgcctgatcttcccgtccatgccggcggtcatgaagctgaacaagctgggcacgttttcgatggctcagctgggccagtcgaagtcggtgttctcggagttcatcaagtctgctcgcaagaacaacgacaacttcgaggagggcttgctgaagctggtgcgcaccctgcctaaggtgctgaagtatctgccctcggacaaggcgcaggacgccaagaacttcgtgaacagcctgcagtactggctgggcggtaactcggacaacctggagaacctgctgctgaacaccgtcagcaactacgtgcccgctctgaagggcgtggacttcagcgtggctgagcccaccgcctaccccgatgtgggtatctggcaccctctggcctcgggcatgtacgaggacctgaaggagtacctgaactggtacgacacccgcaaggacatggtcttcgccaaggacgcccccgtcattggcctggtgctgcagcgctcgcacctggtgactggcgatgagggccactacagcggcgtggtcgctgagctggagagccgcggtgctaaggtcatccccgtctttgccggtggcctggacttctccgcccccgtcaagaagttcttctacgaccccctgggctctggccgcacgttcgtggacaccgttgtgtcgctgaccggcttcgcgctggtgggcggccccgcgcgccaggacgcgccgaaggccattgaggcgctgaagaacctgaacgtgccctacctggtgtcgctgccgctggtgttccagaccactgaggagtggctggacagcgagctgggcgtgcaccccgtccaggtggctctgcaggttgccctgcccgagctggatggtgccatggagcccatcgtgttcgctggccgtgactcgaacaccggcaagtcgcactcgctgcccgaccgcatcgcttcgctgtgcgctcgcgccgtgaactgggccaacctgcgcaagaagcgcaacgccgagaagaagctggccgtcaccgtgttcagcttcccccctgacaagggcaacgtcggcactgccgcctacctgaacgtgttcggctccatctaccgcgtgctgaagaacctgcagcgcgagggctacgacgtgggcgccctgtccgccctcggaggaggatctgatccagtcggtgctgacccagaaggaggccaagttcaactcgaccgacctgcacatcgcctacaagatgaaggtggacgagtaccagaagctgtgcccttacgccgaggcgctggaggagaactggggcaagccccccggcaccctgaacaccaacggccaggagctgctggtgtacggccgccagtacggcaacgtcttcatcggcgtgcagcccaccttcggctacgagggcgacccgatgcgcctgctgttctcgaagtcggccagcccccaccacggcttcgccgcctactacaccttcctggagaagatcttcaaggccgacgccgtgctgcacttcggcacccacggctcgctggagttcatgcccggcaagcaggtcggcatgtcgggtgtgtgctaccccgactcgctgatcggcaccatccccaacctctactactacgccgccaacaacccgtctgaggccaccatcgccaagcgccgctcgtacgccaacaccatttcgtacctgacgccgcctgccgagaacgccggcctgtacaagggcctgaaggagctgaaggagctgatcagctcgtaccagggcatgcgtgagtctggccgcgccgagcagatctgcgccaccatcattgagaccgccaagctgtgcaacctggaccgcgacgtgaccctgcccgacgctgacgccaaggacctgaccatggacatgcgcgacagcgttgtgggccaggtgtaccgcaagctgatggagattgagtcccgcctgctgccctgcggcctgcacgtggtgggctgcccgcccaccgccgaggaggccgtggccaccctggtcaacatcgctgagctggaccgcccggacaacaacccccccatcaagggcatgcccggcatcctggcccgcgccattggtcgcgacatcgagtcgatttacagcggcaacaacaagggcgtcctggctgacgttgaccagctgcagcgcatcaccgaggcctcccgcacctgcgtgcgcgagttcgtgaaggaccgcaccggcctgaacggccgcatcggcaccaactggatcaccaacctgctcaagttcaccggcttctacgtggacccctgggtgcgcggcctgcagaacggcgagttcgccagcgccaaccgcgaggagctgatcaccctgttcaactacctggagttctgcctgacccaggtggtcaaggacaacgagctgggcgccctggtagaggcgctgaacggccagtacgtcgagcccggccccggcggtgaccccatccgcaaccccaacgtgctgcccaccggcaagaacatccacgccctggaccctcagtcgattcccactcaggccgcgctgaagagcgcccgcctggtggtggaccgcctgctggaccgcgagcgcgacaacaacggcggcaagtaccccgagaccatcgcgctggtgctgtggggcactgacaacatcaagacctacggcgagtcgctggcccaggtcatgatgatggtcggtgtcaagcccgtggccgacgccctgggccgcgtgaacaagctggaggtgatccctctggaggagctgggccgcccccgcgtggacgtggttgtcaactgctcgggtgtgttccgcgacctgttcgtgaaccagatgctgctgctggaccgcgccatcaagctggcggccgagcaggacgagcccgatgagatgaacttcgtgcgcaagcacgccaagcagcaggcggcggagctgggcctgcagagcctgcgcgacgcggccacccgtgtgttctccaacagctcgggctcctactcgtccaacgtcaacctggcggtggagaacagcagctggagcgacgagtcgcagctgcaggagatgtacctgaagcgcaagtcgtacgccttcaactcggaccgccccggcgccggtggcgagatgcagcgcgacgtgttcgagacggccatgaagaccgtggacgtgaccttccagaacctggactcgtccgagatctcgctgaccgatgtgtcgcactacttcgactccgaccccaccaagctggtggcgtcgctgcgcaacgacggccgcacccccaacgcctacatcgccgacaccaccaccgccaacgcgcaggtccgcactctgggtgagaccgtgcgcctggacgcccgcaccaagctgctcaaccccaagtggtacgagggcatgcttgcctcgggctacgagggcgtgcgcgagatccagaagcgcatgaccaacaccatgggctggtcggccacctcgggcatggtggacaactgggtgtacgacgaggccaactcgaccttcatcgaggatgcggccatggccgagcgcctgatgaacaccaaccccaacagcttccgcaagctggtggccaccttcctggaggccaacggccgcggctactgggacgccaagcccgagcagctggagcgcctgcgccagctgtacatggacgtggaggacaagattgagggcgtcgaataa

  CHLI1 5’-未翻译区域(调控区域)(SEQ ID NO:130):

  tcctacagagtaaaggtctaggcgatgcgcgactgaaagactgtgaatcccggcgtcgccgtggtgggatgtgggccggtgcgctgtcgcagaggataaattacaggtatcaaacaaggttagggcgttggaaggagcggcgctagggaactgaaatcggatctgcatcggaccctcattccgcgacttgtccttcttttgcctcgccccgcagctcttgagttttgttcttgaccctttgacacgaaccaaccgatataaaa

  CHLI1 3’-未翻译区域(调控区域)(SEQ ID NO:131):

  gcggcaggccttcatggtcgtcgttggagcatttgcggaaaggctgatggcagcagatgcagccatgtcagttgtggctgaagttgttggctggggcgggagcgggcagcagctgctgcgagcggccgaagcagcggtgctgctttgcgtatgagaggaagaccagtgccctcgaggaggcgagtgcctgtgtgagtgtcaggacgtgtgacttcggaaactgagggcggtgagtagatgtgactggggcttgcaggaagcctactgaccctatcagaaaaggtgagcaggggtatatggtctaggagcgttgccggagcgtggctggccagtgctagccgcgcgggctctgttgctcgctggcgcgccgccgccttcacaacagatgccgtagaaatgcagcgatgtgacgaggcgtggcctattctgcaatgtgtgaggcgccaatggcgccactgacaaatggaggagtggtcaaagcttgggtacgttttgagagctgcatcgggcagcgaggatcagtgtgcggtaagaccgacggcagacggattggcaagggaataggagggacgtgggcgtgggcgcccgcgctttgtcgaggccgcatgagccggccgcttctagacccgtagcccattttgaacaagcgcccacgcgtgctcccgatgggggacatcgatcacgggaattgattaaggggcatgtgtggtgtgcaagtgagtgactggtggttccgtccctgtgaggttgtttcgttggacgtggctgccgggttgcgcgcgggctaagcgggcctgaggcagagcgctggcgtgtagccgcgagtatcgatctgtaacgtgc

  CHLI1外显子1(SEQ ID NO:132):

  atggccctgaacatgcgtgtttcctcttccaaggtcgctgccaagcagcagggccgcatctccgcggtgccggttgtgtcgagcaaggtggcctcctccgcccgcgtggcccccttccag

  CHLI1外显子2(SEQ ID NO:133):

  ggcgctcccgtggccgcgcagcgcgctgctctgctgg

  CHLI1外显子3(SEQ ID NO:134):

  tgcgcgccgctgccgctactgaggtcaaggctgctgagggccgcactgagaaggagctgg

  CHLI1外显子4(SEQ ID NO:135):

  gccaggcccgccccatcttccccttcaccgccatcgtgggccaggatgagatgaagctggcgctgattctgaacgtgatcgaccccaagatcggtggtgtcatgatcatgggcgaccgtggcactggcaagtccaccaccattcgtgccctggcggatctgctgcccgagatgcag

  CHLI1外显子5(SEQ ID NO:136):

  gtggttgccaacgacccctttaactcggaccccaccgaccccgagctgatgagcgaggaggtgcgcaaccgcgtcaaggccggcgagcagctgcccgtgtcttccaagaagattcccatggtggacctgcccctgggcgccactgaggaccgcgtgtgcggcaccatcgacatcgagaaggcgctgaccgagg

  CHLI1外显子6(SEQ ID NO:137):

  gtgtcaaggcgttcgagcccggcctgctggccaaggccaaccgcggcatcctgtacgtggatgaggtcaacctgctggacgaccacctg

  CHLI1外显子7(SEQ ID NO:138):

  gtcgatgtgctgctggactcggccgcctccggctggaacaccgtggagcgcgagggtatctccatcagccaccccgcccgcttcatcctggtcggctcgg

  CHLI1外显子8(SEQ ID NO:139):

  gcaaccccgaggagggtgagctgcgcccccagctgctggatcgcttcggcatgcacgcccagatcggcaccgtcaaggacccccgcctgcgtgtgcagatcgtgtcgcagcgctcgaccttcgacgagaaccccgccgccttccg

  CHLI1外显子9(SEQ ID NO:140):

  caaggactacgaggccggccagatggcgctgacccagcgcatcgtggacgcgcgcaagctgctgaagcagggcgaggtcaactacgacttccgcgtcaagatcagccagatctgctcggacctgaacgtggacggcatccgcggcgacatcgtgaccaaccgcgccgccaaggccctggccgccttcgagggccgcaccgag

  CHLI1外显子10(SEQ ID NO:141):

  gtgacccccgaggacatctaccgtgtcattcccctgtgcctgcgccaccgcctccggaaagaccccctggctgagatcgacgacggtgaccgcgtgcgtgagatcttcaagcaggtgttcggcatggagtaa

  CHLI1内含子1(SEQ ID NO:142):

  gtgtgcagttgcatctaaagaacgtccaattcatggttactgctcgtggatctaagcggttggctcaccagcgttccatggtccccgattcgtgcacgcag

  CHLI1内含子2(SEQ ID NO:143):

  gtgagaagccatgatacaaatataaggatttgaagcggtagatctaggacccatcgaacttgagcaccgacttgcagtccttgccttgtccggcgactgaacttctgcgcttgctttgcag

  CHLI1内含子3(SEQ ID NO:144):

  gtaagtgtcgcgcaaagattttctgccgggacgggtctccctcgcaacatctgaacccatggctcgtttttttgccccgcag

  CHLI1内含子4(SEQ ID NO:145):

  gtgcgcgcctcccccaaccccagtttggcaaatgtgtggttaagcgtcgaaagcgtgaacagaaacaggtgttgcgggggccgcggaatggctgcaatgggtgctgggggcttcggagggtctgggggcgagtttgggtatacacgggcgcgcacacttgaaggaacgctcaaggacgacagcggaggcgtggagacagcgccggcccaagcagcctgtacttgtagctgctggtcagctgaggcatcacgacttgggaccagcacccggcctcacggttgcacaaggccatcaccgcgcgccaccacccacgcctcttcaaacccatgccggcacctaccgctacccctgtgacacgctccgcacacgccgccccgcacaccccaccatgtgacag

  CHLI1内含子5(SEQ ID NO:146):

  gtgagagcgaggcgcggggcgtgctctgcaggctagggtgaagatcaggagagccgaagcgggcccgaacagcgcagagagaggcaagacgacacccctgccgcgttttgatcacaagattcacacccttgctctccccaacgctcccgcacatag

  CHLI1内含子6(SEQ ID NO:147):

  gtgagcaggggcagataggcggtcgggcggctgggcggcaggggctgtgttggctgtgttgggtgtgggctgaggctggtgggtgggctggcgggtggcagggatagcggtgaggggatggtgatggggcagaatgggcgggtgggcggacacgtggggtcgttgaagggtgtgtggggacggcaactggtatgcgatatgtcggcttggccctggcggggaaagcattcgcagaatggcgcacgaacgaggccggggagcgagcggggatgggagacgcaacctgcgctgcgaagtgcggcgcgcgctccagttgacacgttgcacgaatgtggccagtgttcgcctgagagttatgggttagaccgccagatgagccggttaagctggtggtcgcggttgatcggctgcttcccttccggttgcacgcctggcaccctaacattaccctgtccgctgctgccctttgcccacag

  CHLI1内含子7(SEQ ID NO:148):

  gtgagtgcagctgccgctgcggctgctgatggtgacctgtgcgaccacggggctccgcatttctggacgaagcgttgtaccatagccgtcttggtccctgatttgggccggctctggtccgaagccttgacatctacagttcaacatggccgtataacgatcctgtgcccacccacacgccaccccgccag

  CHLI1内含子8(SEQ ID NO:149):

  gtgagcgcgcgctctacgatacggcagacatgtacacactgcggcgcactgtagagcttgcattgcatttcaaggcctcgaaagagtagggtggtcgttctctggtggtgtccggccacaattatgcaccccggtgttggtgcagcagctgtgatgtcacaccttgcatcacccccctactgctgccgcctctcctctcttctcgcccgcag

  CHLI1内含子9(SEQ ID NO:150):

  gtgagcagagcaatattgcagagggaagggtggcggaagggtgataacggttggggatctagaggggcgagatggatgcacacagcgcggggttggttatgcatgcctgcatggacgcgtgcacgcacccctgatctgccggttttccaactggcgatgccgtattatgacctgcagctcaccatcctcatgcttgatttgcctcgctcag

  CHLI1蛋白质序列(SEQ ID NO:151):

  MALNMRVSSSKVAAKQQGRISAVPVVSSKVASSARVAPFQGAPVAAQRAALLVRAAAATEVKAAEGRTEKELGQARPIFPFTAIVGQDEMKLALILNVIDPKIGGVMIMGDRGTGKSTTIRALADLLPEMQVVANDPFNSDPTDPELMSEEVRNRVKAGEQLPVSSKKIPMVDLPLGATEDRVCGTIDIEKALTEGVKAFEPGLLAKANRGILYVDEVNLLDDHLVDVLLDSAASGWNTVEREGISISHPARFILVGSGNPEEGELRPQLLDRFGMHAQIGTVKDPRLRVQIVSQRSTFDENPAAFRKDYEAGQMALTQRIVDARKLLKQGEVNYDFRVKISQICSDLNVDGIRGDIVTNRAAKALAAFEGRTEVTPEDIYRVIPLCLRHRLRKDPLAEIDDGDRVREIFKQVFGME

  突变蛋白质序列红色藻CHLH(SEQ ID NO:152):

  MQTSSLLGRRTAHPAAGATPKPVAPSPRVASTRQVACNVATGPRPPMTTFTGGNKGPAKQQVSLDLRDEGAGMFTSTSPEMRRVVPDDVKGRVKVKVVYVVLEAQYQSAISAAVKNINAKNSKVCFEVVGYLLEELRDQKNLDMLKEDVASANIFIGSLIFIEELAEKIVEAVSPLREKLDACLIFPSMPAVMKLNKLGTFSMAQLGQSKSVFSEFIKSARKNNDNFEEGLLKLVRTLPKVLKYLPSDKAQDAKNFVNSLQYWLGGNSDNLENLLLNTVSNYVPALKGVDFSVAEPTAYPDVGIWHPLASGMYEDLKEYLNWYDTRKDMVFAKDAPVIGLVLQRSHLVTGDEGHYSGVVAELESRGAKVIPVFAGGLDFSAPVKKFFYDPLGSGRTFVDTVVSLTGFALVGGPARQDAPKAIEALKNLNVPYLVSLPLVFQTTEEWLDSELGVHPVQVALQVALPELDGAMEPIVFAGRDSNTGKSHSLPDRIASLCARAVNWANLRKKRNAEKKLAVTVFSFPPDKGNVGTAAYLNVFGSIYRVLKNLQREGYDVGALSALGGGSDPVGADPEGGQVQLDRPAHRLQDEGGRVPEAVPLRRGAGGELGQAPRHPEHQRPGAAGVRPPVRQRLHRRAAHLRLRGRPDAPAVLEVGQPPPRLRRLLHLPGEDLQGRRRAALRHPRLAGVHARQAGRHVGCVLPRLADRHHPQPLLLRRQQPV

  CHLI1DNA序列(SEQ ID NO:153):

  atggccctgaacatgcgtgtttcctcttccaaggtcgctgccaagcagcagggccgcatctccgcggtgccggttgtgtcgagcaaggtggcctcctccgcccgcgtggcccccttccagggcgctcccgtggccgcgcagcgcgctgctctgctggtgcgcgccgctgccgctactgaggtcaaggctgctgagggccgcactgagaaggagctgggccaggcccgccccatcttccccttcaccgccatcgtgggccaggatgagatgaagctggcgctgattctgaacgtgatcgaccccaagatcggtggtgtcatgatcatgggcgaccgtggcactggcaagtccaccaccattcgtgccctggcggatctgctgcccgagatgcaggtggttgccaacgacccctttaactcggaccccaccgaccccgagctgatgagcgaggaggtgcgcaaccgcgtcaaggccggcgagcagctgcccgtgtcttccaagaagattcccatggtggacctgcccctgggcgccactgaggaccgcgtgtgcggcaccatcgacatcgagaaggcgctgaccgagggtgtcaaggcgttcgagcccggcctgctggccaaggccaaccgcggcatcctgtacgtggatgaggtcaacctgctggacgaccacctggtcgatgtgctgctggactcggccgcctccggctggaacaccgtggagcgcgagggtatctccatcagccaccccgcccgcttcatcctggtcggctcgggcaaccccgaggagggtgagctgcgcccccagctgctggatcgcttcggcatgcacgcccagatcggcaccgtcaaggacccccgcctgcgtgtgcagatcgtgtcgcagcgctcgaccttcgacgagaaccccgccgccttccgcaaggactacgaggccggccagatggcgctgacccagcgcatcgtggacgcgcgcaagctgctgaagcagggcgaggtcaactacgacttccgcgtcaagatcagccagatctgctcggacctgaacgtggacggcatccgcggcgacatcgtgaccaaccgcgccgccaaggccctggccgccttcgagggccgcaccgaggtgacccccgaggacatctaccgtgtcattcccctgtgcctgcgccaccgcctccggaaagaccccctggctgagatcgacgacggtgaccgcgtgcgtgagatcttcaagcaggtgttcggcatggagtaa

  尽管已经参考以上实施例描述了本发明,但是应当理解,在本发明的精神和范围内包括修改和变化。因此,本发明仅由所附权利要求书限制。

  序列表

  <110> 特里同阿盖亚创新公司

  <120> 藻类中过量产生原卟啉IX的方法及由此产生的组合物

  <130> 20498-202380

  <150> 62/865,800

  <151> 2019-06-24

  <150> 62/850,227

  <151> 2019-05-20

  <150> 62/757,534

  <151> 2018-11-08

  <160> 153

  <170> PatentIn version 3.5

  <210> 1

  <211> 1173

  <212> DNA

  <213> 莱茵衣藻

  <400> 1

  atgcagatga tgcagcgcaa cgttgtgggc cagcgccccg tcgctggctc ccgccgctcg 60

  ctggtggttg ccaacgttgc ggaggtgacc cgccccgcgg tcagcaccaa cggcaagcac 120

  cggactggtg tgccggaggg aactcccatc gtcacccctc aggacctgcc ctcgcgccct 180

  cgccgcaacc gccgcagcga gagcttccgt gcttccgttc gtgaggtgaa cgtgtcgccc 240

  gccaacttca tcctgccgat cttcatccac gaggagagca accagaacgt gcccatcgcc 300

  tccatgcctg gcatcaaccg cctggcgtat ggcaagaacg tgattgacta cgttgctgag 360

  gctcgctctt acggtgtcaa ccaggtcgtg gttttcccca agacgcccga ccacctgaag 420

  acgcaaaccg cggaggaggc gttcaacaag aacggcctca gccagcgcac gatccgcctg 480

  ctgaaggact ctttccctga cctggaggtg tacacggacg tggctctgga cccctacaac 540

  tcggacggcc acgacggtat cgtgtcggac gccggtgtga tcctgaacga cgagaccatc 600

  gagtacctgt gccgccaggc cgtgagccag gccgaggccg gtgccgacgt ggtgtcgccc 660

  tctgacatga tggacggccg cgtgggcgcc atccgccgcg ccctggaccg cgagggcttc 720

  accaacgtgt ccatcatgtc ctacaccgcc aagtacgcct ccgcctacta cggccccttc 780

  cgtgacgccc tggcgtccgc gcccaagccc ggccaggcgc accgccgcat cccccccaac 840

  aagaagacct accagatgga ccccgccaac taccgcgagg ccatccgcga ggccaaggcc 900

  gacgaggccg agggcgctga catcatgatg gtcaagcccg gcatgccgta cctggacgtg 960

  gtacgcctgc tgcgtgagac cagcccgctg cccgtggccg tgtaccacgt gtcgggcgag 1020

  tacgccatgc tcaaggcggc ggcggagcgc ggctggctga acgagaagga tgccgtgctt 1080

  gaggccatga cctgcttccg ccgcgccggc gctgacctca tcctcaccta ctacggcatt 1140

  gaggcctcca agtggctggc gggcgagaag taa 1173

  <210> 2

  <211> 390

  <212> PRT

  <213> 莱茵衣藻

  <400> 2

  Met Gln Met Met Gln Arg Asn Val Val Gly Gln Arg Pro Val Ala Gly

  1 5 1015

  Ser Arg Arg Ser Leu Val Val Ala Asn Val Ala Glu Val Thr Arg Pro

  202530

  Ala Val Ser Thr Asn Gly Lys His Arg Thr Gly Val Pro Glu Gly Thr

  354045

  Pro Ile Val Thr Pro Gln Asp Leu Pro Ser Arg Pro Arg Arg Asn Arg

  505560

  Arg Ser Glu Ser Phe Arg Ala Ser Val Arg Glu Val Asn Val Ser Pro

  65707580

  Ala Asn Phe Ile Leu Pro Ile Phe Ile His Glu Glu Ser Asn Gln Asn

  859095

  Val Pro Ile Ala Ser Met Pro Gly Ile Asn Arg Leu Ala Tyr Gly Lys

  100 105 110

  Asn Val Ile Asp Tyr Val Ala Glu Ala Arg Ser Tyr Gly Val Asn Gln

  115 120 125

  Val Val Val Phe Pro Lys Thr Pro Asp His Leu Lys Thr Gln Thr Ala

  130 135 140

  Glu Glu Ala Phe Asn Lys Asn Gly Leu Ser Gln Arg Thr Ile Arg Leu

  145 150 155 160

  Leu Lys Asp Ser Phe Pro Asp Leu Glu Val Tyr Thr Asp Val Ala Leu

  165 170 175

  Asp Pro Tyr Asn Ser Asp Gly His Asp Gly Ile Val Ser Asp Ala Gly

  180 185 190

  Val Ile Leu Asn Asp Glu Thr Ile Glu Tyr Leu Cys Arg Gln Ala Val

  195 200 205

  Ser Gln Ala Glu Ala Gly Ala Asp Val Val Ser Pro Ser Asp Met Met

  210 215 220

  Asp Gly Arg Val Gly Ala Ile Arg Arg Ala Leu Asp Arg Glu Gly Phe

  225 230 235 240

  Thr Asn Val Ser Ile Met Ser Tyr Thr Ala Lys Tyr Ala Ser Ala Tyr

  245 250 255

  Tyr Gly Pro Phe Arg Asp Ala Leu Ala Ser Ala Pro Lys Pro Gly Gln

  260 265 270

  Ala His Arg Arg Ile Pro Pro Asn Lys Lys Thr Tyr Gln Met Asp Pro

  275 280 285

  Ala Asn Tyr Arg Glu Ala Ile Arg Glu Ala Lys Ala Asp Glu Ala Glu

  290 295 300

  Gly Ala Asp Ile Met Met Val Lys Pro Gly Met Pro Tyr Leu Asp Val

  305 310 315 320

  Val Arg Leu Leu Arg Glu Thr Ser Pro Leu Pro Val Ala Val Tyr His

  325 330 335

  Val Ser Gly Glu Tyr Ala Met Leu Lys Ala Ala Ala Glu Arg Gly Trp

  340 345 350

  Leu Asn Glu Lys Asp Ala Val Leu Glu Ala Met Thr Cys Phe Arg Arg

  355 360 365

  Ala Gly Ala Asp Leu Ile Leu Thr Tyr Tyr Gly Ile Glu Ala Ser Lys

  370 375 380

  Trp Leu Ala Gly Glu Lys

  385 390

  <210> 3

  <211> 1098

  <212> DNA

  <213> 莱茵衣藻

  <400> 3

  atggcactgc aagcctcaac ccgctcgctc cagcagcgcc gcgccttctc ttcggcccag 60

  acctccaagc gtgtgtctgt gaccaaggtc cgcgcgacgg ctatcgaggc ggagaactat 120

  gtgaagcagg ctccccagtc gctggtccgc ccgggcatcg acactgagga ctctatgcgc 180

  gctcgcttcg agaaggtgat ccgcaacgcc caggactcca tctgcaatgc tatctccgag 240

  atcgatggca agccgttcca ccaggacgcc tggacccgcc ccggcggcgg tggcggcatc 300

  agccgcgtgc tgcaggacgg caacgtgtgg gagaaggccg gcgtcaacgt gtccgtggtc 360

  tacggcacca tgccccctga ggcctaccgc gctgccactg gcaacgccga gaagctgaag 420

  aacaagggtg acggtggccg cgtgcccttc ttcgccgccg gcatctcgtc ggtgatgcac 480

  ccccgcaacc cccactgccc caccatgcac ttcaactacc gctacttcga gactgaggag 540

  tggaacggca tccccggcca gtggtggttc ggcggcggca ccgacatcac ccccagctat 600

  gtggtgcccg aggacatgaa gcacttccac ggcacctaca aggcggtgtg cgaccgccac 660

  gatcccgctt actacgagaa gttccgcacc tggtgcgatg agtacttcct catcaagcac 720

  cgcggcgagc gccgcggcct gggcggcatc ttcttcgatg acctgaacga ccgcaacccc 780

  gaggacatcc tgaagttctc gaccgacgcc gtgaacaacg tggtggaggc atactgcccc 840

  atcatcaaga agcacatgaa cgacccctac acccccgagg agaaggagtg gcagcagatc 900

  cgccgcggcc gctacgtgga gttcaacctg gtctatgacc gcggcaccac cttcggcctg 960

  aagaccggcg gccgcattga gtcgatcctc atgtccatgc cccagaccgc ctcatggctg 1020

  tacgaccacc agcccaaggc cggctcgccc gaggccgagc tgctcgacgc ctgccgcaac 1080

  ccccgcgtct gggtgtaa 1098

  <210> 4

  <211> 365

  <212> PRT

  <213> 莱茵衣藻

  <400> 4

  Met Ala Leu Gln Ala Ser Thr Arg Ser Leu Gln Gln Arg Arg Ala Phe

  1 5 1015

  Ser Ser Ala Gln Thr Ser Lys Arg Val Ser Val Thr Lys Val Arg Ala

  202530

  Thr Ala Ile Glu Ala Glu Asn Tyr Val Lys Gln Ala Pro Gln Ser Leu

  354045

  Val Arg Pro Gly Ile Asp Thr Glu Asp Ser Met Arg Ala Arg Phe Glu

  505560

  Lys Val Ile Arg Asn Ala Gln Asp Ser Ile Cys Asn Ala Ile Ser Glu

  65707580

  Ile Asp Gly Lys Pro Phe His Gln Asp Ala Trp Thr Arg Pro Gly Gly

  859095

  Gly Gly Gly Ile Ser Arg Val Leu Gln Asp Gly Asn Val Trp Glu Lys

  100 105 110

  Ala Gly Val Asn Val Ser Val Val Tyr Gly Thr Met Pro Pro Glu Ala

  115 120 125

  Tyr Arg Ala Ala Thr Gly Asn Ala Glu Lys Leu Lys Asn Lys Gly Asp

  130 135 140

  Gly Gly Arg Val Pro Phe Phe Ala Ala Gly Ile Ser Ser Val Met His

  145 150 155 160

  Pro Arg Asn Pro His Cys Pro Thr Met His Phe Asn Tyr Arg Tyr Phe

  165 170 175

  Glu Thr Glu Glu Trp Asn Gly Ile Pro Gly Gln Trp Trp Phe Gly Gly

  180 185 190

  Gly Thr Asp Ile Thr Pro Ser Tyr Val Val Pro Glu Asp Met Lys His

  195 200 205

  Phe His Gly Thr Tyr Lys Ala Val Cys Asp Arg His Asp Pro Ala Tyr

  210 215 220

  Tyr Glu Lys Phe Arg Thr Trp Cys Asp Glu Tyr Phe Leu Ile Lys His

  225 230 235 240

  Arg Gly Glu Arg Arg Gly Leu Gly Gly Ile Phe Phe Asp Asp Leu Asn

  245 250 255

  Asp Arg Asn Pro Glu Asp Ile Leu Lys Phe Ser Thr Asp Ala Val Asn

  260 265 270

  Asn Val Val Glu Ala Tyr Cys Pro Ile Ile Lys Lys His Met Asn Asp

  275 280 285

  Pro Tyr Thr Pro Glu Glu Lys Glu Trp Gln Gln Ile Arg Arg Gly Arg

  290 295 300

  Tyr Val Glu Phe Asn Leu Val Tyr Asp Arg Gly Thr Thr Phe Gly Leu

  305 310 315 320

  Lys Thr Gly Gly Arg Ile Glu Ser Ile Leu Met Ser Met Pro Gln Thr

  325 330 335

  Ala Ser Trp Leu Tyr Asp His Gln Pro Lys Ala Gly Ser Pro Glu Ala

  340 345 350

  Glu Leu Leu Asp Ala Cys Arg Asn Pro Arg Val Trp Val

  355 360 365

  <210> 5

  <211> 1049

  <212> DNA

  <213> 莱茵衣藻

  <400> 5

  atgctgagga agcagattgg tggatctggc cagcagcggg cgggcctccg acgggtgaac 60

  caaggacctg cgcgtcggcg gttggcaccc tgccgcgtgg cggcccccgt gcaaacctcg 120

  tcctccgtcg ccacattcaa tggcttcgtg gactacattc acggactcca gaagaacatt 180

  ctgagcactg ctgaggatct ggagaacggc gagcggaagt ttgttgttga ccgctgggag 240

  cgcgacgcca gcaaccccaa cgccgggtat ggcattacgt gcgtgcttga ggacgggaag 300

  gtgctggaga aggccgcagc caatatctca gtggtgcgcg ggacgctgtc ggcgcagcgc 360

  gcagtggcca tgagctcccg cggccgcagc agcatcgacc ccaagggcgg gcagccctac 420

  gccgcggccg ccatgagcct agtgttccac agcgcgcacc cgctcatccc cacgctgcgc 480

  gcgacgtgcg gttgttccag gtgggcgatg aggcgtggta cggcggtggc tgtgacctga 540

  cgcccaacta cctagacgtg gaggactcgc agtccttcca ccgctactgg aaggacgtgt 600

  gcggcaagta caagccgggc ctgtacaccg agctcaagga gtggtgcgac aggtacttct 660

  acatcccggc ccgcaaagag caccgtggca ttggcggcct gttctttgat gacatggcca 720

  ctgcggaggc gggctgcgat gtggaggcgt ttgtgcggga agtgggagat ggcatcctgc 780

  cctgctggct gcccatcgtg gcgcggcacc gtggccagcc cttcacggag cagcagcggc 840

  aatggcagct gctgcgccgc ggtcgctaca tcgagttcaa cctgctgtac gaccgcggca 900

  tcaagttcgg tctggacggc ggccgcatcg agagcatcat ggtgtcggcg ccgccgctga 960

  tcgcgtggaa gtacaacgtg gtgccacagc cgggcagccc cgaggaggag atgctgaagg 1020

  tgcttcagca gccccgcgag tgggcctga 1049

  <210> 6

  <211> 349

  <212> PRT

  <213> 莱茵衣藻

  <400> 6

  Met Leu Arg Lys Gln Ile Gly Gly Ser Gly Gln Gln Arg Ala Gly Leu

  1 5 1015

  Arg Arg Val Asn Gln Gly Pro Ala Arg Arg Arg Leu Ala Pro Cys Arg

  202530

  Val Ala Ala Pro Val Gln Thr Ser Ser Ser Val Ala Thr Phe Asn Gly

  354045

  Phe Val Asp Tyr Ile His Gly Leu Gln Lys Asn Ile Leu Ser Thr Ala

  505560

  Glu Asp Leu Glu Asn Gly Glu Arg Lys Phe Val Val Asp Arg Trp Glu

  65707580

  Arg Asp Ala Ser Asn Pro Asn Ala Gly Tyr Gly Ile Thr Cys Val Leu

  859095

  Glu Asp Gly Lys Val Leu Glu Lys Ala Ala Ala Asn Ile Ser Val Val

  100 105 110

  Arg Gly Thr Leu Ser Ala Gln Arg Ala Val Ala Met Ser Ser Arg Gly

  115 120 125

  Arg Ser Ser Ile Asp Pro Lys Gly Gly Gln Pro Tyr Ala Ala Ala Ala

  130 135 140

  Met Ser Leu Val Phe His Ser Ala His Pro Leu Ile Pro Thr Leu Arg

  145 150 155 160

  Ala Asp Val Arg Leu Phe Gln Val Gly Asp Glu Ala Trp Tyr Gly Gly

  165 170 175

  Gly Cys Asp Leu Thr Pro Asn Tyr Leu Asp Val Glu Asp Ser Gln Ser

  180 185 190

  Phe His Arg Tyr Trp Lys Asp Val Cys Gly Lys Tyr Lys Pro Gly Leu

  195 200 205

  Tyr Thr Glu Leu Lys Glu Trp Cys Asp Arg Tyr Phe Tyr Ile Pro Ala

  210 215 220

  Arg Lys Glu His Arg Gly Ile Gly Gly Leu Phe Phe Asp Asp Met Ala

  225 230 235 240

  Thr Ala Glu Ala Gly Cys Asp Val Glu Ala Phe Val Arg Glu Val Gly

  245 250 255

  Asp Gly Ile Leu Pro Cys Trp Leu Pro Ile Val Ala Arg His Arg Gly

  260 265 270

  Gln Pro Phe Thr Glu Gln Gln Arg Gln Trp Gln Leu Leu Arg Arg Gly

  275 280 285

  Arg Tyr Ile Glu Phe Asn Leu Leu Tyr Asp Arg Gly Ile Lys Phe Gly

  290 295 300

  Leu Asp Gly Gly Arg Ile Glu Ser Ile Met Val Ser Ala Pro Pro Leu

  305 310 315 320

  Ile Ala Trp Lys Tyr Asn Val Val Pro Gln Pro Gly Ser Pro Glu Glu

  325 330 335

  Glu Met Leu Lys Val Leu Gln Gln Pro Arg Glu Trp Ala

  340 345

  <210> 7

  <211> 1482

  <212> DNA

  <213> 莱茵衣藻

  <400> 7

  atggcgtcgt ttggattgat gcaaaggacg gtgcactgtc cccagcttgt ggaggagcgg 60

  tgttcgccgg tcgctggctg ctctggtcgt ggcctgccag ttatccagcg gcaacggcgt 120

  ggcgtgtgca gtgccaccaa cggtgtccag cgagggcgtg tgctgcgccg gacggccgct 180

  tcgaccgacg tggtctcctt cgtggacccc aatgacatta gaaaacccgc agcagcagca 240

  gctggccctg cggtggataa ggtcggcgtt ctgctgttaa accttggcgg gcccgaaaag 300

  ctcgacgacg tcaagccttt cctgtataac ctattcgccg acccagaaat tattcgcctg 360

  ccagcggcag ctcagttcct gcagccgctg ctcgcgacga tcatctccac gcttcgcgcc 420

  ccgaagagcg cggagggcta tgaggccatt ggcggtggta gcccgttgcg taggattaca 480

  gacgagcagg cggaggcgct ggcggagtct ctgcgcgcca agggccaacc tgcgaacgtg 540

  tacgtgggca tgcgctattg gcacccctac acggaggagg cgctggagca cattaaggcc 600

  gacggcgtca cgcgcctggt catcctcccg ctgtaccctc agttctccat ctctaccagc 660

  ggctccagcc ttcgactgct tgagtcgctc ttcaagagcg acatcgcgct caagtcgctg 720

  cggcacacgg tcatcccgtc ctggtaccag cggcggggct acgtgagcgc gatggcggac 780

  ctgattgtag aggagctgaa gaagttccgg gacgtgccca gcgtggagct gtttttctcc 840

  gcgcacggcg tgcccaagtc ctacgtggag gaggcgggcg acccatacaa ggaggagatg 900

  gaggagtgcg tgcggctcat tacggacgag gtcaagcggc gcggcttcgc caacacgcac 960

  acgctggcct accagagccg cgtgggcccc gcggaatggc tcaagccgta cacggatgag 1020

  tccatcaagg agctgggcaa gcgcggcgtc aagtcgctgc tggcggtgcc catcagcttt 1080

  gtcagcgagc acattgagac gttggaggag atcgacatgg agtaccgcga gctggcggag 1140

  gagagcggca tccgcaactg gggccgcgtg ccggcgctga acaccaacgc cgccttcatc 1200

  gacgacctgg cggacgcggt gatggaggcg ctgccctacg tgggctgcct ggccgggccg 1260

  acagactcgc tggtgccgct gggcgacctg gagatgctgc tgcaggccta cgaccgcgag 1320

  cgccgcacgc tgccgtcacc ggtggtgatg tgggagtggg gctggaccaa gagcgcggag 1380

  acgtggaacg gccgcattgc catgattgcc atcatcatca tcctggcgct ggaggcagcc 1440

  agcggccagt ccatcctcaa aaacctgttc ctggcggagt ag 1482

  <210> 8

  <211> 492

  <212> PRT

  <213> 莱茵衣藻

  <400> 8

  Met Ala Ser Phe Gly Leu Met Gln Arg Thr Val His Cys Pro Gln Leu

  1 5 1015

  Val Glu Glu Arg Cys Ser Pro Val Ala Gly Cys Ser Gly Arg Gly Leu

  202530

  Pro Val Ile Gln Arg Gln Arg Arg Gly Val Cys Ser Ala Thr Asn Gly

  354045

  Val Gln Arg Gly Arg Val Leu Arg Arg Thr Ala Ala Ser Thr Asp Val

  505560

  Val Ser Phe Val Asp Pro Asn Asp Ile Arg Lys Pro Ala Ala Ala Ala

  65707580

  Ala Gly Pro Ala Val Asp Lys Val Gly Val Leu Leu Leu Asn Leu Gly

  859095

  Gly Pro Glu Lys Leu Asp Asp Val Lys Pro Phe Leu Tyr Asn Leu Phe

  100 105 110

  Ala Asp Pro Glu Ile Ile Arg Leu Pro Ala Ala Ala Gln Phe Leu Gln

  115 120 125

  Pro Leu Leu Ala Thr Ile Ile Ser Thr Leu Arg Ala Pro Lys Ser Ala

  130 135 140

  Glu Gly Tyr Glu Ala Ile Gly Gly Gly Ser Pro Leu Arg Arg Ile Thr

  145 150 155 160

  Asp Glu Gln Ala Glu Ala Leu Ala Glu Ser Leu Arg Ala Lys Gly Gln

  165 170 175

  Pro Ala Asn Val Tyr Val Gly Met Arg Tyr Trp His Pro Tyr Thr Glu

  180 185 190

  Glu Ala Leu Glu His Ile Lys Ala Asp Gly Val Thr Arg Leu Val Ile

  195 200 205

  Leu Pro Leu Tyr Pro Gln Phe Ser Ile Ser Thr Ser Gly Ser Ser Leu

  210 215 220

  Arg Leu Leu Glu Ser Leu Phe Lys Ser Asp Ile Ala Leu Lys Ser Leu

  225 230 235 240

  Arg His Thr Val Ile Pro Ser Trp Tyr Gln Arg Arg Gly Tyr Val Ser

  245 250 255

  Ala Met Ala Asp Leu Ile Val Glu Glu Leu Lys Lys Phe Arg Asp Val

  260 265 270

  Pro Ser Val Glu Leu Phe Phe Ser Ala His Gly Val Pro Lys Ser Tyr

  275 280 285

  Val Glu Glu Ala Gly Asp Pro Tyr Lys Glu Glu Met Glu Glu Cys Val

  290 295 300

  Arg Leu Ile Thr Asp Glu Val Lys Arg Arg Gly Phe Ala Asn Thr His

  305 310 315 320

  Thr Leu Ala Tyr Gln Ser Arg Val Gly Pro Ala Glu Trp Leu Lys Pro

  325 330 335

  Tyr Thr Asp Glu Ser Ile Lys Glu Leu Gly Lys Arg Gly Val Lys Ser

  340 345 350

  Leu Leu Ala Val Pro Ile Ser Phe Val Ser Glu His Ile Glu Thr Leu

  355 360 365

  Glu Glu Ile Asp Met Glu Tyr Arg Glu Leu Ala Glu Glu Ser Gly Ile

  370 375 380

  Arg Asn Trp Gly Arg Val Pro Ala Leu Asn Thr Asn Ala Ala Phe Ile

  385 390 395 400

  Asp Asp Leu Ala Asp Ala Val Met Glu Ala Leu Pro Tyr Val Gly Cys

  405 410 415

  Leu Ala Gly Pro Thr Asp Ser Leu Val Pro Leu Gly Asp Leu Glu Met

  420 425 430

  Leu Leu Gln Ala Tyr Asp Arg Glu Arg Arg Thr Leu Pro Ser Pro Val

  435 440 445

  Val Trp Glu Trp Gly Trp Thr Lys Ser Ala Glu Thr Trp Asn Gly Arg

  450 455 460

  Ile Ala Met Ile Ala Ile Ile Ile Ile Leu Ala Leu Glu Ala Ala Ser

  465 470 475 480

  Gly Gln Ser Ile Leu Lys Asn Leu Phe Leu Ala Glu

  485 490

  <210> 9

  <211> 1392

  <212> DNA

  <213> 莱茵衣藻

  <400> 9

  atgcagatgc agctgaacgc caagaccgtg cagggcgcct tcaaggcgca gcgccctcgc 60

  tctgtccgcg gcaacgtggc ggtgcgcgca gtggccgctc cccctaagct ggtcaccaag 120

  cgctccgagg agatcttcaa ggaggctcag gagctgctgc ccggtggcgt gaactcgccc 180

  gtgcgcgctt tccgctcggt tggtggcggc cccatcgtct tcgacagggt caagggtgcc 240

  tactgctggg acgtcgatgg caacaagtac atcgactacg ttggctcttg gggccctgcc 300

  atttgcggcc acggcaacga cgaggtcaac aacgccctga aggcgcagat cgacaagggc 360

  acctcgttcg gtgctccctg cgagctggag aacgtgctgg ccaagatggt gattgaccgc 420

  gtgccctcgg tggagatggt gcgcttcgtg tcctcgggca ctgaggcgtg cctgtcggtg 480

  ctgcgcctga tgcgcgcata caccggccgc gagaaggtgc tgaagttcac cggctgctac 540

  cacggccacg ccgactcctt cctggtgaag gccggctccg gtgtgatcac cctgggcctg 600

  cccgactcgc ccggtgtgcc caagagcacc gccgccgcca ccctgaccgc cacctacaac 660

  aacctggact ccgtgcgcga gctgttcgcc gccaacaagg gcgagattgc cggtgtgatc 720

  ctggagcccg tggtcggcaa cagcggcttc attgtgccca ccaaggagtt cctgcagggc 780

  ctgcgcgaga tctgcacggc tgagggcgcc gtgctgtgct tcgatgaggt catgaccggc 840

  ttccgcattg ccaagggctg cgcccaggag cacttcggta tcacccccga cctgaccacc 900

  atgggcaagg tcattggtgg cggcatgcct gtgggcgcct acggcggcaa gaaggagatc 960

  atgaagatgg tcgcccccgc cggccccatg taccaggccg gcaccctttc gggcaacccc 1020

  atggccatga ctgccggcat caagacgctg gagatcctgg gccgccccgg cgcctacgag 1080

  cacctggaga aggtgaccaa gcgcctgatc gacggcatca tggccgccgc caaggagcac 1140

  agccacgaga tcaccggcgg caacatcagc ggcatgtttg gcttcttctt ctgcaagggc 1200

  cctgtgacct gcttcgagga cgccctggcg gccgacactg ccaagttcgc gcgcttccac 1260

  cgcggcatgc tggaggaggg cgtctacctg gctccctcgc agttcgaggc cggcttcacc 1320

  tctctggccc actccgaggc ggacgtggat gccacgatcg ccgccgctcg ccgcgtgttc 1380

  gcccgcatct aa 1392

  <210> 10

  <211> 463

  <212> PRT

  <213> 莱茵衣藻

  <400> 10

  Met Gln Met Gln Leu Asn Ala Lys Thr Val Gln Gly Ala Phe Lys Ala

  1 5 1015

  Gln Arg Pro Arg Ser Val Arg Gly Asn Val Ala Val Arg Ala Val Ala

  202530

  Ala Pro Pro Lys Leu Val Thr Lys Arg Ser Glu Glu Ile Phe Lys Glu

  354045

  Ala Gln Glu Leu Leu Pro Gly Gly Val Asn Ser Pro Val Arg Ala Phe

  505560

  Arg Ser Val Gly Gly Gly Pro Ile Val Phe Asp Arg Val Lys Gly Ala

  65707580

  Tyr Cys Trp Asp Val Asp Gly Asn Lys Tyr Ile Asp Tyr Val Gly Ser

  859095

  Trp Gly Pro Ala Ile Cys Gly His Gly Asn Asp Glu Val Asn Asn Ala

  100 105 110

  Leu Lys Ala Gln Ile Asp Lys Gly Thr Ser Phe Gly Ala Pro Cys Glu

  115 120 125

  Leu Glu Asn Val Leu Ala Lys Met Val Ile Asp Arg Val Pro Ser Val

  130 135 140

  Glu Met Val Arg Phe Val Ser Ser Gly Thr Glu Ala Cys Leu Ser Val

  145 150 155 160

  Leu Arg Leu Met Arg Ala Tyr Thr Gly Arg Glu Lys Val Leu Lys Phe

  165 170 175

  Thr Gly Cys Tyr His Gly His Ala Asp Ser Phe Leu Val Lys Ala Gly

  180 185 190

  Ser Gly Val Ile Thr Leu Gly Leu Pro Asp Ser Pro Gly Val Pro Lys

  195 200 205

  Ser Thr Ala Ala Ala Thr Leu Thr Ala Thr Tyr Asn Asn Leu Asp Ser

  210 215 220

  Val Arg Glu Leu Phe Ala Ala Asn Lys Gly Glu Ile Ala Gly Val Ile

  225 230 235 240

  Leu Glu Pro Val Val Gly Asn Ser Gly Phe Ile Val Pro Thr Lys Glu

  245 250 255

  Phe Leu Gln Gly Leu Arg Glu Ile Cys Thr Ala Glu Gly Ala Val Leu

  260 265 270

  Cys Phe Asp Glu Val Met Thr Gly Phe Arg Ile Ala Lys Gly Cys Ala

  275 280 285

  Gln Glu His Phe Gly Ile Thr Pro Asp Leu Thr Thr Met Gly Lys Val

  290 295 300

  Ile Gly Gly Gly Met Pro Val Gly Ala Tyr Gly Gly Lys Lys Glu Ile

  305 310 315 320

  Met Lys Met Val Ala Pro Ala Gly Pro Met Tyr Gln Ala Gly Thr Leu

  325 330 335

  Ser Gly Asn Pro Met Ala Met Thr Ala Gly Ile Lys Thr Leu Glu Ile

  340 345 350

  Leu Gly Arg Pro Gly Ala Tyr Glu His Leu Glu Lys Val Thr Lys Arg

  355 360 365

  Leu Ile Asp Gly Ile Met Ala Ala Ala Lys Glu His Ser His Glu Ile

  370 375 380

  Thr Gly Gly Asn Ile Ser Gly Met Phe Gly Phe Phe Phe Cys Lys Gly

  385 390 395 400

  Pro Val Thr Cys Phe Glu Asp Ala Leu Ala Ala Asp Thr Ala Lys Phe

  405 410 415

  Ala Arg Phe His Arg Gly Met Leu Glu Glu Gly Val Tyr Leu Ala Pro

  420 425 430

  Ser Gln Phe Glu Ala Gly Phe Thr Ser Leu Ala His Ser Glu Ala Asp

  435 440 445

  Val Asp Ala Thr Ile Ala Ala Ala Arg Arg Val Phe Ala Arg Ile

  450 455 460

  <210> 11

  <211> 1569

  <212> DNA

  <213> 莱茵衣藻

  <400> 11

  atgcagacca ctatgcagca gcgtctccag ggccgtaacg tggccgggcg gagcgtcgct 60

  ccctcggtcc ctgcccatcg ctccttccac tcacaccggg ctgccactca aaccgctacg 120

  atcagcgctg ctgctagctc aaccaccaag ctgccagctt cgcatctgga gagcagcaag 180

  aaggcgctgg attcgctgaa gcagcaggcc gtcaatcgct acgcgggtga caagaagagc 240

  tccattattg ccattggtct caccattcac aacgcacccg tggagctgcg cgagaagctg 300

  gctgtgcctg aggctgaatg gccgcgtgct attgaggagc tctgccagtt cccgcacatc 360

  gaggaggccg cggtgctgtc gacgtgcaat cgcatggagc tctacgttgt cggtctgtcg 420

  tggcaccgcg gcgttcgcga ggtggaggag tggctgtctc gcaccagcgg cgtgcctctg 480

  gatgagctgc gcccctacct gttcctgctg cgcgaccgcg acgccacgca ccacctgatg 540

  cgcgtgtcgg gtggccttga ctcgctggtt atgggcgagg gccagattct cgcccaagtg 600

  cgccaggtct acaaggtcgg ccagaactgc cccggcttcg gtcgccacct gaacggcctg 660

  ttcaagcagg ctatcaccgc tggcaagcgc gtgcgtgccg agacctccat ctccaccggc 720

  tccgtctccg tctcatccgc cgccgtcgag ctggcgcagc tcaagctccc cacccacaac 780

  tggtccgacg ctaaggtctg catcatcggc gctggcaaga tgtctacgct gctggtgaag 840

  cacctgcaga gcaagggctg caaggaggtg acggtgctca accgctctct gccgcgcgcc 900

  caggcgctgg cggaggagtt ccctgaggtc aagttcaaca tccacctgat gcccgacctg 960

  ctgcagtgcg tggaggccag cgacgtcatc ttcgccgcct ccggctctga ggagatcctc 1020

  atccacaagg agcatgtcga ggccatgtcc aagccatcgg acgttgttgg ctccaagcgc 1080

  cgcttcgtcg acatctccgt gccccgcaac atcgcccccg ccatcaacga gctggagcac 1140

  ggcatcgtct acaacgtcga cgacctgaag gaggttgtgg ccgccaacaa ggagggccgc 1200

  gcgcaggcgg ccgccgaggc cgaggtgctg atccgcgagg agcagcgcgc gttcgaggcc 1260

  tggcgtgact ctctggagac cgtgcccacc atcaaggcgc tgcgctccaa ggccgagacc 1320

  atccgcgccg ccgagtttga gaaggccgtg tctcgcctgg gcgaggggct atccaagaag 1380

  cagctcaagg cggtggagga gctcagcaag ggcatcgtca acaagctgct gcacgggccc 1440

  atgacggcac tgcgctgcga cggcaccgat ccggatgccg tgggccagac cctcgcgaac 1500

  atggaggccc tggagcgcat gttccagctc tcggaggtgg acgtggccgc gctggcgggc 1560

  aagcagtaa 1569

  <210> 12

  <211> 522

  <212> PRT

  <213> 莱茵衣藻

  <400> 12

  Met Gln Thr Thr Met Gln Gln Arg Leu Gln Gly Arg Asn Val Ala Gly

  1 5 1015

  Arg Ser Val Ala Pro Ser Val Pro Ala His Arg Ser Phe His Ser His

  202530

  Arg Ala Ala Thr Gln Thr Ala Thr Ile Ser Ala Ala Ala Ser Ser Thr

  354045

  Thr Lys Leu Pro Ala Ser His Leu Glu Ser Ser Lys Lys Ala Leu Asp

  505560

  Ser Leu Lys Gln Gln Ala Val Asn Arg Tyr Ala Gly Asp Lys Lys Ser

  65707580

  Ser Ile Ile Ala Ile Gly Leu Thr Ile His Asn Ala Pro Val Glu Leu

  859095

  Arg Glu Lys Leu Ala Val Pro Glu Ala Glu Trp Pro Arg Ala Ile Glu

  100 105 110

  Glu Leu Cys Gln Phe Pro His Ile Glu Glu Ala Ala Val Leu Ser Thr

  115 120 125

  Cys Asn Arg Met Glu Leu Tyr Val Val Gly Leu Ser Trp His Arg Gly

  130 135 140

  Val Arg Glu Val Glu Glu Trp Leu Ser Arg Thr Ser Gly Val Pro Leu

  145 150 155 160

  Asp Glu Leu Arg Pro Tyr Leu Phe Leu Leu Arg Asp Arg Asp Ala Thr

  165 170 175

  His His Leu Met Arg Val Ser Gly Gly Leu Asp Ser Leu Val Met Gly

  180 185 190

  Glu Gly Gln Ile Leu Ala Gln Val Arg Gln Val Tyr Lys Val Gly Gln

  195 200 205

  Asn Cys Pro Gly Phe Gly Arg His Leu Asn Gly Leu Phe Lys Gln Ala

  210 215 220

  Ile Thr Ala Gly Lys Arg Val Arg Ala Glu Thr Ser Ile Ser Thr Gly

  225 230 235 240

  Ser Val Ser Val Ser Ser Ala Ala Val Glu Leu Ala Gln Leu Lys Leu

  245 250 255

  Pro Thr His Asn Trp Ser Asp Ala Lys Val Cys Ile Ile Gly Ala Gly

  260 265 270

  Lys Met Ser Thr Leu Leu Val Lys His Leu Gln Ser Lys Gly Cys Lys

  275 280 285

  Glu Val Thr Val Leu Asn Arg Ser Leu Pro Arg Ala Gln Ala Leu Ala

  290 295 300

  Glu Glu Phe Pro Glu Val Lys Phe Asn Ile His Leu Met Pro Asp Leu

  305 310 315 320

  Leu Gln Cys Val Glu Ala Ser Asp Val Ile Phe Ala Ala Ser Gly Ser

  325 330 335

  Glu Glu Ile Leu Ile His Lys Glu His Val Glu Ala Met Ser Lys Pro

  340 345 350

  Ser Asp Val Val Gly Ser Lys Arg Arg Phe Val Asp Ile Ser Val Pro

  355 360 365

  Arg Asn Ile Ala Pro Ala Ile Asn Glu Leu Glu His Gly Ile Val Tyr

  370 375 380

  Asn Val Asp Asp Leu Lys Glu Val Val Ala Ala Asn Lys Glu Gly Arg

  385 390 395 400

  Ala Gln Ala Ala Ala Glu Ala Glu Val Leu Ile Arg Glu Glu Gln Arg

  405 410 415

  Ala Phe Glu Ala Trp Arg Asp Ser Leu Glu Thr Val Pro Thr Ile Lys

  420 425 430

  Ala Leu Arg Ser Lys Ala Glu Thr Ile Arg Ala Ala Glu Phe Glu Lys

  435 440 445

  Ala Val Ser Arg Leu Gly Glu Gly Leu Ser Lys Lys Gln Leu Lys Ala

  450 455 460

  Val Glu Glu Leu Ser Lys Gly Ile Val Asn Lys Leu Leu His Gly Pro

  465 470 475 480

  Met Thr Ala Leu Arg Cys Asp Gly Thr Asp Pro Asp Ala Val Gly Gln

  485 490 495

  Thr Leu Ala Asn Met Glu Ala Leu Glu Arg Met Phe Gln Leu Ser Glu

  500 505 510

  Val Asp Val Ala Ala Leu Ala Gly Lys Gln

  515 520

  <210> 13

  <211> 1779

  <212> DNA

  <213> 莱茵衣藻

  <400> 13

  atgttatact cacaatttaa acattcggtg cctttaggcc gtaagtctcc ccttctttca 60

  gggggccccc cttctggggg tcgcccaaca acggctgcct caggcctagg tcgcaacgtg 120

  gccgtaagaa ttgggacccc gttgggcttt gcccttcggg cccaggtaat tatggcagct 180

  gcgggcaata ctagcggtgc gccgcacccc gtaggggagt cccagcctgc gttgtcccag 240

  gtggattctc aacttgtaat tgagtgtgaa acaggaaatt accatacttt ttgcccaatt 300

  agttgtgttt cttggttata ccaaaaaatt gaagatagtt ttttcttagt tattggtaca 360

  aaaacgtgtg ggtatttttt acaaaatgct ttaggggtta tgatttttgc cgaacctcgt 420

  tacgctatgg cggaattaga agaaagcgat atttcggcgc aattaaatga ttacaaagaa 480

  ttaaaacgtc tatgtttaca aattaaacaa gaccgtaacc caagtgttat tgtgtggatt 540

  ggcacatgca caaccgaaat tattaaaatg gatttagaag gtatggcacc gaaactagaa 600

  gctgaaatcg gtattccaat tgtggtagca cgcgcaaatg gacttgatta tgcttttaca 660

  caaggtgaag atactgtttt agctgcgatg gtccaaaaat gcccggaatt aggcgctatt 720

  ccagctattg tacctcagat tccttctgac tctcgtacac ttagccaact atctgtagcg 780

  gcttcggtac ccgaaaacag tgcgtctggg ccagaagggg agccttcact agcccagaag 840

  ggaatggatt ctaagttaac aaacaactct ccatgccgag tagattctgt ctcagaatct 900

  accccggcgt ttcctggacg tgctccgcac gtcgggaaaa gtactcctca aaatttagtt 960

  ttatttggtt cattacctag cacgatggca aatcaactgg agtttgaatt aaaacgccaa 1020

  ggtattaatg ttactgggtg gttacctgcg gctcgctatt catctttacc tgcattaggt 1080

  gaaaacgtgt atgtttgtgg gattaatcca tttttaagtc gaactgctac ttctttaatg 1140

  cgtcgtcgta aatgcaaatt aatttcagct cctttcccaa ttggtccaga tggtacaaaa 1200

  gcttgggtcg aaaaaatttg taatgttttc ggtgttacac caactggttt agaagatcgt 1260

  gaacgtcttg tttgggaagg tttaaaagat tatttaaatt tcgtaaaagg gaaatctgtt 1320

  ttctttatgg gtgataatct gttagaaatt tcattagccc gttttttaat tcgctgtggt 1380

  atgaccgttt atgaaatcgg tattccgtac atggaccaac gatttcaagc tggggaatta 1440

  gaattattaa aaaaaacatg catggaaatg aacgtgcccc taccgcgtat tgttgaaaaa 1500

  cctgataatt actatcaaat tcaacgtatt aaagaattac aaccagattt agttattacc 1560

  ggcatggccc atgcaaaccc actggaagcg cgcggcatta ctacgaaatg gtccgttgaa 1620

  tttacgtttg cgcaaattca tgggtttggc aacgcacgtg atatcttaga attagttaca 1680

  aaaccgttac gtcgtaataa aaatctatct aaatatcaat ttccgttaga tagctgggac 1740

  aagcctgctt ccgtaggcgc tcacgaactg tcggcctaa 1779

  <210> 14

  <211> 592

  <212> PRT

  <213> 莱茵衣藻

  <400> 14

  Met Leu Tyr Ser Gln Phe Lys His Ser Val Pro Leu Gly Arg Lys Ser

  1 5 1015

  Pro Leu Leu Ser Gly Gly Pro Pro Ser Gly Gly Arg Pro Thr Thr Ala

  202530

  Ala Ser Gly Leu Gly Arg Asn Val Ala Val Arg Ile Gly Thr Pro Leu

  354045

  Gly Phe Ala Leu Arg Ala Gln Val Ile Met Ala Ala Ala Gly Asn Thr

  505560

  Ser Gly Ala Pro His Pro Val Gly Glu Ser Gln Pro Ala Leu Ser Gln

  65707580

  Val Asp Ser Gln Leu Val Ile Glu Cys Glu Thr Gly Asn Tyr His Thr

  859095

  Phe Cys Pro Ile Ser Cys Val Ser Trp Leu Tyr Gln Lys Ile Glu Asp

  100 105 110

  Ser Phe Phe Leu Val Ile Gly Thr Lys Thr Cys Gly Tyr Phe Leu Gln

  115 120 125

  Asn Ala Leu Gly Val Met Ile Phe Ala Glu Pro Arg Tyr Ala Met Ala

  130 135 140

  Glu Leu Glu Glu Ser Asp Ile Ser Ala Gln Leu Asn Asp Tyr Lys Glu

  145 150 155 160

  Leu Lys Arg Leu Cys Leu Gln Ile Lys Gln Asp Arg Asn Pro Ser Val

  165 170 175

  Ile Val Trp Ile Gly Thr Cys Thr Thr Glu Ile Ile Lys Met Asp Leu

  180 185 190

  Glu Gly Met Ala Pro Lys Leu Glu Ala Glu Ile Gly Ile Pro Ile Val

  195 200 205

  Val Ala Arg Ala Asn Gly Leu Asp Tyr Ala Phe Thr Gln Gly Glu Asp

  210 215 220

  Thr Val Leu Ala Ala Met Val Gln Lys Cys Pro Glu Leu Gly Ala Ile

  225 230 235 240

  Pro Ala Ile Val Pro Gln Ile Pro Ser Asp Ser Arg Thr Leu Ser Gln

  245 250 255

  Leu Ser Val Ala Ala Ser Val Pro Glu Asn Ser Ala Ser Gly Pro Glu

  260 265 270

  Gly Glu Pro Ser Leu Ala Gln Lys Gly Met Asp Ser Lys Leu Thr Asn

  275 280 285

  Asn Ser Pro Cys Arg Val Asp Ser Val Ser Glu Ser Thr Pro Ala Phe

  290 295 300

  Pro Gly Arg Ala Pro His Val Gly Lys Ser Thr Pro Gln Asn Leu Val

  305 310 315 320

  Leu Phe Gly Ser Leu Pro Ser Thr Met Ala Asn Gln Leu Glu Phe Glu

  325 330 335

  Leu Lys Arg Gln Gly Ile Asn Val Thr Gly Trp Leu Pro Ala Ala Arg

  340 345 350

  Tyr Ser Ser Leu Pro Ala Leu Gly Glu Asn Val Tyr Val Cys Gly Ile

  355 360 365

  Asn Pro Phe Leu Ser Arg Thr Ala Thr Ser Leu Met Arg Arg Arg Lys

  370 375 380

  Cys Lys Leu Ile Ser Ala Pro Phe Pro Ile Gly Pro Asp Gly Thr Lys

  385 390 395 400

  Ala Trp Val Glu Lys Ile Cys Asn Val Phe Gly Val Thr Pro Thr Gly

  405 410 415

  Leu Glu Asp Arg Glu Arg Leu Val Trp Glu Gly Leu Lys Asp Tyr Leu

  420 425 430

  Asn Phe Val Lys Gly Lys Ser Val Phe Phe Met Gly Asp Asn Leu Leu

  435 440 445

  Glu Ile Ser Leu Ala Arg Phe Leu Ile Arg Cys Gly Met Thr Val Tyr

  450 455 460

  Glu Ile Gly Ile Pro Tyr Met Asp Gln Arg Phe Gln Ala Gly Glu Leu

  465 470 475 480

  Glu Leu Leu Lys Lys Thr Cys Met Glu Met Asn Val Pro Leu Pro Arg

  485 490 495

  Ile Val Glu Lys Pro Asp Asn Tyr Tyr Gln Ile Gln Arg Ile Lys Glu

  500 505 510

  Leu Gln Pro Asp Leu Val Ile Thr Gly Met Ala His Ala Asn Pro Leu

  515 520 525

  Glu Ala Arg Gly Ile Thr Thr Lys Trp Ser Val Glu Phe Thr Phe Ala

  530 535 540

  Gln Ile His Gly Phe Gly Asn Ala Arg Asp Ile Leu Glu Leu Val Thr

  545 550 555 560

  Lys Pro Leu Arg Arg Asn Lys Asn Leu Ser Lys Tyr Gln Phe Pro Leu

  565 570 575

  Asp Ser Trp Asp Lys Pro Ala Ser Val Gly Ala His Glu Leu Ser Ala

  580 585 590

  <210> 15

  <211> 1644

  <212> DNA

  <213> 莱茵衣藻

  <400> 15

  atgaaattag cgtattggat gtatgcggga ccggctcata ttggaacatt acgagttgca 60

  agctcgtttc gaaatgtgca tgctattatg catgctccct taggcgatga ttattttaac 120

  gtaatgcgtt caatgttaga acgtgaacgt gattttacgc cagtgacggc aagtattgtt 180

  gatcgtcatg ttttagctcg tggttcacaa gaaaaagttg ttgaaaacat tcaacgaaaa 240

  gataaagaag aatgtccgga tttaatttta ttaacaccaa catgtacctc aagtattttg 300

  caagaagatt tacaaaattt tgtaaatcgc gcggccgaag tagcaaagcg ttcggatgtt 360

  ttattagctg acgttaacca ttaccgagtg aatgaattac aagcggctga ccgtacgtta 420

  gagcaaattg tacgctttta tttagaaaaa gaagtaaata aacttcacgc ggagttaggc 480

  ggccttaaaa aaccgcttcg ctttgcccag cgtacccaaa agccgtctgc caatatttta 540

  ggcatgttta cactaggttt ccataatcaa catgactgtc gtgaattaaa acgtttatta 600

  aatgatttag gtatcgaagt caatgaagtg attcctgaag gtagttttgt acatggatta 660

  aaaaatttac caaaagcgtg gtttaacatc gtcccgtatc gtgaagttgg tttaatgacg 720

  gcaatttatt tagaaaaaga atttggcatg ccttatacct caatcacgcc aatgggcatt 780

  attgacaccg cggcgtttat tcgtgaaatt gcggccattt gtagtcaaat tagcacttca 840

  caggcatcta caaactcaac tgaaggactc cagaggggag aaaatgtcag tttaactgaa 900

  actaattcga ttatttttaa taaagcaaaa tatgaacaat acattaatca acaaacgcat 960

  tttgtttctc aagcagcttg gttttcacgt tctattgact gtcaaaattt aaccggtaaa 1020

  aaaaccgttg tgtttggtga tgcaactcac gcggcaagta tgacgaaaat tcttgtgcgc 1080

  gaaatgggta ttcatgttgt ttgcgcgggc acgtattgta aacatgatgc agattggttt 1140

  agagagcaag tttcaggttt ttgtgatcaa gttttaatta cagatgatca cagccaaatt 1200

  gcggaaatca ttgctcaaat tgaacctgca gccatttttg gtacacaaat ggaacgtcat 1260

  gttgggaaaa ggttagatat tccttgtggg gttatttctg caccggtaca tattcaaaac 1320

  ttcccactag gctttagacc gtttttaggg tatgaaggta ctaatcaaat ttccgattta 1380

  gtttataatt cgtttagttt aggtatggaa gatcacttac tagaaatttt caacggtcat 1440

  gacaataaag aagttattac acgttcgtat tcttcagaaa ctgatttaga atggacaaaa 1500

  gaagcattag atgaactagc tcgtgttcct ggttttgttc gttcaaaagt taaacgtaat 1560

  actgaaaaat ttgcgcgtac aaataaaaat caagttatta ctattgaagt tatgtacgca 1620

  gctaaagaag cggtatcagc gtaa 1644

  <210> 16

  <211> 547

  <212> PRT

  <213> 莱茵衣藻

  <400> 16

  Met Lys Leu Ala Tyr Trp Met Tyr Ala Gly Pro Ala His Ile Gly Thr

  1 5 1015

  Leu Arg Val Ala Ser Ser Phe Arg Asn Val His Ala Ile Met His Ala

  202530

  Pro Leu Gly Asp Asp Tyr Phe Asn Val Met Arg Ser Met Leu Glu Arg

  354045

  Glu Arg Asp Phe Thr Pro Val Thr Ala Ser Ile Val Asp Arg His Val

  505560

  Leu Ala Arg Gly Ser Gln Glu Lys Val Val Glu Asn Ile Gln Arg Lys

  65707580

  Asp Lys Glu Glu Cys Pro Asp Leu Ile Leu Leu Thr Pro Thr Cys Thr

  859095

  Ser Ser Ile Leu Gln Glu Asp Leu Gln Asn Phe Val Asn Arg Ala Ala

  100 105 110

  Glu Val Ala Lys Arg Ser Asp Val Leu Leu Ala Asp Val Asn His Tyr

  115 120 125

  Arg Val Asn Glu Leu Gln Ala Ala Asp Arg Thr Leu Glu Gln Ile Val

  130 135 140

  Arg Phe Tyr Leu Glu Lys Glu Val Asn Lys Leu His Ala Glu Leu Gly

  145 150 155 160

  Gly Leu Lys Lys Pro Leu Arg Phe Ala Gln Arg Thr Gln Lys Pro Ser

  165 170 175

  Ala Asn Ile Leu Gly Met Phe Thr Leu Gly Phe His Asn Gln His Asp

  180 185 190

  Cys Arg Glu Leu Lys Arg Leu Leu Asn Asp Leu Gly Ile Glu Val Asn

  195 200 205

  Glu Val Ile Pro Glu Gly Ser Phe Val His Gly Leu Lys Asn Leu Pro

  210 215 220

  Lys Ala Trp Phe Asn Ile Val Pro Tyr Arg Glu Val Gly Leu Met Thr

  225 230 235 240

  Ala Ile Tyr Leu Glu Lys Glu Phe Gly Met Pro Tyr Thr Ser Ile Thr

  245 250 255

  Pro Met Gly Ile Ile Asp Thr Ala Ala Phe Ile Arg Glu Ile Ala Ala

  260 265 270

  Ile Cys Ser Gln Ile Ser Thr Ser Gln Ala Ser Thr Asn Ser Thr Glu

  275 280 285

  Gly Leu Gln Arg Gly Glu Asn Val Ser Leu Thr Glu Thr Asn Ser Ile

  290 295 300

  Ile Phe Asn Lys Ala Lys Tyr Glu Gln Tyr Ile Asn Gln Gln Thr His

  305 310 315 320

  Phe Val Ser Gln Ala Ala Trp Phe Ser Arg Ser Ile Asp Cys Gln Asn

  325 330 335

  Leu Thr Gly Lys Lys Thr Val Val Phe Gly Asp Ala Thr His Ala Ala

  340 345 350

  Ser Met Thr Lys Ile Leu Val Arg Glu Met Gly Ile His Val Val Cys

  355 360 365

  Ala Gly Thr Tyr Cys Lys His Asp Ala Asp Trp Phe Arg Glu Gln Val

  370 375 380

  Ser Gly Phe Cys Asp Gln Val Leu Ile Thr Asp Asp His Ser Gln Ile

  385 390 395 400

  Ala Glu Ile Ile Ala Gln Ile Glu Pro Ala Ala Ile Phe Gly Thr Gln

  405 410 415

  Met Glu Arg His Val Gly Lys Arg Leu Asp Ile Pro Cys Gly Val Ile

  420 425 430

  Ser Ala Pro Val His Ile Gln Asn Phe Pro Leu Gly Phe Arg Pro Phe

  435 440 445

  Leu Gly Tyr Glu Gly Thr Asn Gln Ile Ser Asp Leu Val Tyr Asn Ser

  450 455 460

  Phe Ser Leu Gly Met Glu Asp His Leu Leu Glu Ile Phe Asn Gly His

  465 470 475 480

  Asp Asn Lys Glu Val Ile Thr Arg Ser Tyr Ser Ser Glu Thr Asp Leu

  485 490 495

  Glu Trp Thr Lys Glu Ala Leu Asp Glu Leu Ala Arg Val Pro Gly Phe

  500 505 510

  Val Arg Ser Lys Val Lys Arg Asn Thr Glu Lys Phe Ala Arg Thr Asn

  515 520 525

  Lys Asn Gln Val Ile Thr Ile Glu Val Met Tyr Ala Ala Lys Glu Ala

  530 535 540

  Val Ser Ala

  545

  <210> 17

  <211> 957

  <212> DNA

  <213> 莱茵衣藻

  <400> 17

  atgaaattag cagtttatgg caaaggtggt attggtaaat ccacaacaag ttgtaacatt 60

  tcaattgcat tagcaaaacg tggcaaaaaa gtattacaaa ttggttgtga tccaaaacac 120

  gatagtactt ttacattaac cggtttttta attccaacaa ttattgatac tttacaaagt 180

  aaagattatc attacgaaga tgtttggccg gaagatgtta tttaccaagg ctacgggagt 240

  gtggattgtg ttgaagcagg tggcccgcca gccggcgccg gctgtggtgg gtatgttgtt 300

  ggtgaaacag ttaaattatt aaaagaatta aatgcatttt atgaatatga tgttattctg 360

  tttgatgttt taggggatgt tgtatgtggt gggtttgctg cacctttaaa ttacgccgac 420

  tattgcatta ttgtcacaga taatggcttt gatgcgttat ttgccgcaaa ccgtattgct 480

  gcttcagtgc gcgaaaaagc gcgcattcac ccattacgtt tagctgggtt aattgggaat 540

  cgtacagcca aacgcgattt aatcgataaa tacgttgaag cgtgcccgat gccagtctta 600

  gaggtattac cgttaattga agacattcgt gtgtcacgcg taaaaggtaa aacattattt 660

  gaaatggcag aacatgattc atcattacac tacatttgtg acttttattt aaatattgcg 720

  gatcaattat taactgaacc agaaggtgtt gttccgcgcg aattagcaga ccgtgaatta 780

  tttactctat tatcagattt ctatttaaac gctgggactc ctagccctag tggatctgag 840

  ttcggctcag gcgcccttag cggaacgagc ggcgaaacag ctcccggtaa tatgggtcag 900

  cacatgagta acgcagtaaa aacaaacgaa caggaaatga atttctttct tgtgtaa 957

  <210> 18

  <211> 318

  <212> PRT

  <213> 莱茵衣藻

  <400> 18

  Met Lys Leu Ala Val Tyr Gly Lys Gly Gly Ile Gly Lys Ser Thr Thr

  1 5 1015

  Ser Cys Asn Ile Ser Ile Ala Leu Ala Lys Arg Gly Lys Lys Val Leu

  202530

  Gln Ile Gly Cys Asp Pro Lys His Asp Ser Thr Phe Thr Leu Thr Gly

  354045

  Phe Leu Ile Pro Thr Ile Ile Asp Thr Leu Gln Ser Lys Asp Tyr His

  505560

  Tyr Glu Asp Val Trp Pro Glu Asp Val Ile Tyr Gln Gly Tyr Gly Ser

  65707580

  Val Asp Cys Val Glu Ala Gly Gly Pro Pro Ala Gly Ala Gly Cys Gly

  859095

  Gly Tyr Val Val Gly Glu Thr Val Lys Leu Leu Lys Glu Leu Asn Ala

  100 105 110

  Phe Tyr Glu Tyr Asp Val Ile Leu Phe Asp Val Leu Gly Asp Val Val

  115 120 125

  Cys Gly Gly Phe Ala Ala Pro Leu Asn Tyr Ala Asp Tyr Cys Ile Ile

  130 135 140

  Val Thr Asp Asn Gly Phe Asp Ala Leu Phe Ala Ala Asn Arg Ile Ala

  145 150 155 160

  Ala Ser Val Arg Glu Lys Ala Arg Ile His Pro Leu Arg Leu Ala Gly

  165 170 175

  Leu Ile Gly Asn Arg Thr Ala Lys Arg Asp Leu Ile Asp Lys Tyr Val

  180 185 190

  Glu Ala Cys Pro Met Pro Val Leu Glu Val Leu Pro Leu Ile Glu Asp

  195 200 205

  Ile Arg Val Ser Arg Val Lys Gly Lys Thr Leu Phe Glu Met Ala Glu

  210 215 220

  His Asp Ser Ser Leu His Tyr Ile Cys Asp Phe Tyr Leu Asn Ile Ala

  225 230 235 240

  Asp Gln Leu Leu Thr Glu Pro Glu Gly Val Val Pro Arg Glu Leu Ala

  245 250 255

  Asp Arg Glu Leu Phe Thr Leu Leu Ser Asp Phe Tyr Leu Asn Ala Gly

  260 265 270

  Thr Pro Ser Pro Ser Gly Ser Glu Phe Gly Ser Gly Ala Leu Ser Gly

  275 280 285

  Thr Ser Gly Glu Thr Ala Pro Gly Asn Met Gly Gln His Met Ser Asn

  290 295 300

  Ala Val Lys Thr Asn Glu Gln Glu Met Asn Phe Phe Leu Val

  305 310 315

  <210> 19

  <211> 3762

  <212> DNA

  <213> 莱茵衣藻

  <400> 19

  atgcggattg tgctggtcag cggcttcgag agctttaacg tgggcctgta caaggatgcg 60

  gcggagctgc tgaagcgctc catgcccaac gtcacactcc aggtgttctc cgaccgcgac 120

  ctggcctccg acgccacccg ctcccggctg gaggcggctc tggggcgcgc cgacatcttc 180

  ttcggatcac tgctgttcga ctacgaccag gtggagtggc tacgggcccg gctggagcgg 240

  gtgcctgtgc ggctagtgtt tgagtcggcg ttggagctca tgagctgcaa caaggtgggg 300

  tcgttcatga tgggcggcgg cggtcccggc ggcggcccgc ccggcaaggc gcccggcccg 360

  ccgcccgcgg tgaagaaggt tctctccatg tttggaagcg gtcgcgagga ggacaagatg 420

  ggcggctcct ccaatgtggt ggccatgttc agttacctgg tggagaccct gatggagcca 480

  acgggtgggt tatttggtag ttggtggttg tgttatggtt ggccgtttcg gttgggtgat 540

  ctgggctggt atctacaacc cccctcaacc ctcacgcctc caggctacgt gccgccgcct 600

  gtggtggaga ctcccgcact gggctgcctc cacccctccg cgcccggccg ctacttcgag 660

  tcccccgccg agtacatgaa gtggtacgcc agggagggcc cgctgcgcgg cacgggcgcc 720

  ccggtggttg gcgtgctgct gtaccgcaag catgtgatca ccgaccagcc gtacatcccg 780

  cagctggtca gccagctgga ggcggagggg ctgctgcccg tgcccatctt catcaacggc 840

  gtggaggcgc acaccgtggt tcgcgacctg ctgacctccg tgcacgagca ggatctgctt 900

  gcacgcggcg agacgggcgc catcagcccc accctgaagc gggacgcggt caaggtggac 960

  gcggtggtga gcaccattgg cttcccgctg gtgggcggcc ccgccggcac catggagggc 1020

  gggcggcagg cggaggtggc caaggccatc ctgggcgcca aggacgtgcc gtacacggtg 1080

  gcggcgccgc tgcttattca ggacatggag agctggagca gggacggcgt ggcgggtctc 1140

  cagagtgtgg tgctgtactc gctgccggag ctggacggcg cagtggacac ggtgccactg 1200

  ggggggctgg tgggggacga catctacctg gtgccggagc gggtgaagaa gctggcgggg 1260

  cggctcaagt cgtggcgtac gacacgcact aagcatgcct ctgtttgtga cgtccagccc 1320

  ctcccccccc cgtctcccct ctccaccctc cctctccctt cctctccctt cctctcactc 1380

  tccaccctct tccccctccg cccaaacata acgaggcggg ggctgctggg cgcaagcggg 1440

  ccctggagta cccgctgcga cctagctagt ccaactccac ccatccccca atgccgcaat 1500

  agctttccgg agatgagcac acacacacac acacacacac acacacacac acacacacac 1560

  acacacacac acacacgcca cccacgcaca cacacacaca cacacgctcc ccccgctcgc 1620

  cacaccccca tcccacccca cccgcaggag ctgctgacgt accccgcgga ctggggcccg 1680

  gccgagtggg gcccgctgcc ctacctgccc gaccccgacg tgctggttcg ccgcatggag 1740

  gcgcagtggg gcgagctgcg agcctaccgc ggcctcaaca cctcggcgcg cggcatgttc 1800

  caggagtacg gggctgacgt ggtcctgcac ttcggcatgc acggcaccgt ggagtggttg 1860

  cctggggcgc cgctggggaa caacggcctc agctggagcg acgtgctgct cggcgagctg 1920

  ccaaacgtgt acgtgtacgc tgccaacaac ccctccgagt ccatcgtggc aaagcggcgc 1980

  ggctacggca ccatcgtcag ccacaacgtg ccgccgtacg ggcgggcggg tctgtacaag 2040

  cagctttcca gcctcaagga gacgcttcag gagtaccgcg aggccgcgca ggccgcacgt 2100

  gcccgagcag gagccagcag cagcagcggc agtagcagca gtagcagtag cagcggcagt 2160

  ggcagtagca gcagcagtgt ggagctgcgg gcggcgttgg caccggtgtt cgacgcctac 2220

  actgaccgcc tgtatgccta cctgcagctg ctggaggggc ggctgttcag cgaggggcta 2280

  cacgtactgg gagcgccgcc ggcgccgccg caggtgggtg gttttcccgc gagcttccaa 2340

  cggtaccgta aactgcccaa ctgcccaact tctccccaaa cacaggaggc tgtcaagatc 2400

  cggaacctgc tcatgcagaa cacgcaggag ctggacgggc tgctcaaggg cctgggtggg 2460

  cgttacgtgc ttcccgaggc gggcggcgac ctgctgcggg acgggtcggg cgtgctgccc 2520

  accggccgca acatccacgc actggacccc taccgcatgc cctcccccgc cgccatggcc 2580

  cgtggggcgg cggtggcggc ggccattctt gagcagcacc gggcggctaa cagcggggcg 2640

  tggcccgaga cctgcgccgt caacctgtgg gggctggact ccatcaagag caagggcgag 2700

  agtgtggggg tggtgctggc gctggtgggg gcggtgccgg tgcgcgaggg tacgggccgc 2760

  gtcgcgcgct tccaactggt gccgctgtca gagttgggcc ggccgcgtgt ggacgtgctt 2820

  tgtaacatga gcggcatctt ccgcgactcc ttccagaacg tggtggagct gctcgacgac 2880

  ctgtttgcaa gggccgccgc cgccgctgac gagccagatg acatgaactt catcgccaaa 2940

  cacgcccgag ccatggagaa gcagggcctg tccgccacct cggcccgcct gttctccaac 3000

  ccggctggcg actacgggtc gatggtcaac gagcgagtgg ggcagggcag ctgggccaac 3060

  ggcgacgagc tgggtgacac gtgggcggcc cgcaacgcct tcagctacgg ccgaggcaag 3120

  gagcgaggca cggcgcggcc cgaggtgctg caggcgctgc tcaagaccac ggaccggatc 3180

  gtgcagcaga tcgacagtgt ggagtacggc ctgacagaca tccaggagta ctacgccaac 3240

  acgggcgccc tcaagagagc cgccgaggtg gccaaaggcg acccgggccc cggtggccgg 3300

  cggccgcgcg tggggtgttc cattgtggag gcctttggcg gcgcgggcgc gggcgcgggc 3360

  ggcgccggtg gagcgggcgt gccgccgcct cgcgagctgg aggaggtgct gcgcctggag 3420

  taccgctcga agctgctcaa ccccaagtgg gcccgggcca tggcggcgca gggcagcggc 3480

  ggcgcctacg agatcagtca gcgcatgacg gcgttggtgg gctggggcgc caccaccgat 3540

  ttcagggagg gctgggtgtg ggacccaggc gccatggaca cgtatgtggg cgatgaggag 3600

  atggccagca agctcaagaa gaacaacccg caggcctttg ccaacgtgct gcggcgcatg 3660

  ctggaggcgg cgggccgcgg catgtggagc cccaacaagg accagctggc acagctcaag 3720

  tcgctgtaca gcgagatgga cgaccagctg gagggggtga cg 3762

  <210> 20

  <211> 1254

  <212> PRT

  <213> 莱茵衣藻

  <400> 20

  Met Arg Ile Val Leu Val Ser Gly Phe Glu Ser Phe Asn Val Gly Leu

  1 5 1015

  Tyr Lys Asp Ala Ala Glu Leu Leu Lys Arg Ser Met Pro Asn Val Thr

  202530

  Leu Gln Val Phe Ser Asp Arg Asp Leu Ala Ser Asp Ala Thr Arg Ser

  354045

  Arg Leu Glu Ala Ala Leu Gly Arg Ala Asp Ile Phe Phe Gly Ser Leu

  505560

  Leu Phe Asp Tyr Asp Gln Val Glu Trp Leu Arg Ala Arg Leu Glu Arg

  65707580

  Val Pro Val Arg Leu Val Phe Glu Ser Ala Leu Glu Leu Met Ser Cys

  859095

  Asn Lys Val Gly Ser Phe Met Met Gly Gly Gly Gly Pro Gly Gly Gly

  100 105 110

  Pro Pro Gly Lys Ala Pro Gly Pro Pro Pro Ala Val Lys Lys Val Leu

  115 120 125

  Ser Met Phe Gly Ser Gly Arg Glu Glu Asp Lys Met Gly Gly Ser Ser

  130 135 140

  Asn Val Val Ala Met Phe Ser Tyr Leu Val Glu Thr Leu Met Glu Pro

  145 150 155 160

  Thr Gly Gly Leu Phe Gly Ser Trp Trp Leu Cys Tyr Gly Trp Pro Phe

  165 170 175

  Arg Leu Gly Asp Leu Gly Trp Tyr Leu Gln Pro Pro Ser Thr Leu Thr

  180 185 190

  Pro Pro Gly Tyr Val Pro Pro Pro Val Val Glu Thr Pro Ala Leu Gly

  195 200 205

  Cys Leu His Pro Ser Ala Pro Gly Arg Tyr Phe Glu Ser Pro Ala Glu

  210 215 220

  Tyr Met Lys Trp Tyr Ala Arg Glu Gly Pro Leu Arg Gly Thr Gly Ala

  225 230 235 240

  Pro Val Val Gly Val Leu Leu Tyr Arg Lys His Val Ile Thr Asp Gln

  245 250 255

  Pro Tyr Ile Pro Gln Leu Val Ser Gln Leu Glu Ala Glu Gly Leu Leu

  260 265 270

  Pro Val Pro Ile Phe Ile Asn Gly Val Glu Ala His Thr Val Val Arg

  275 280 285

  Asp Leu Leu Thr Ser Val His Glu Gln Asp Leu Leu Ala Arg Gly Glu

  290 295 300

  Thr Gly Ala Ile Ser Pro Thr Leu Lys Arg Asp Ala Val Lys Val Asp

  305 310 315 320

  Ala Val Val Ser Thr Ile Gly Phe Pro Leu Val Gly Gly Pro Ala Gly

  325 330 335

  Thr Met Glu Gly Gly Arg Gln Ala Glu Val Ala Lys Ala Ile Leu Gly

  340 345 350

  Ala Lys Asp Val Pro Tyr Thr Val Ala Ala Pro Leu Leu Ile Gln Asp

  355 360 365

  Met Glu Ser Trp Ser Arg Asp Gly Val Ala Gly Leu Gln Ser Val Val

  370 375 380

  Leu Tyr Ser Leu Pro Glu Leu Asp Gly Ala Val Asp Thr Val Pro Leu

  385 390 395 400

  Gly Gly Leu Val Gly Asp Asp Ile Tyr Leu Val Pro Glu Arg Val Lys

  405 410 415

  Lys Leu Ala Gly Arg Leu Lys Ser Trp Arg Thr Thr Arg Thr Lys His

  420 425 430

  Ala Ser Val Cys Asp Val Gln Pro Leu Pro Pro Pro Ser Pro Leu Ser

  435 440 445

  Thr Leu Pro Leu Pro Ser Ser Pro Phe Leu Ser Leu Ser Thr Leu Phe

  450 455 460

  Pro Leu Arg Pro Asn Ile Thr Arg Arg Gly Leu Leu Gly Ala Ser Gly

  465 470 475 480

  Pro Trp Ser Thr Arg Cys Asp Leu Ala Ser Pro Thr Pro Pro Ile Pro

  485 490 495

  Gln Cys Arg Asn Ser Phe Pro Glu Met Ser Thr His Thr His Thr His

  500 505 510

  Thr His Thr His Thr His Thr His Thr His Thr His Thr Arg His Pro

  515 520 525

  Arg Thr His Thr His Thr His Ala Pro Pro Ala Arg His Thr Pro Ile

  530 535 540

  Pro Pro His Pro Gln Glu Leu Leu Thr Tyr Pro Ala Asp Trp Gly Pro

  545 550 555 560

  Ala Glu Trp Gly Pro Leu Pro Tyr Leu Pro Asp Pro Asp Val Leu Val

  565 570 575

  Arg Arg Met Glu Ala Gln Trp Gly Glu Leu Arg Ala Tyr Arg Gly Leu

  580 585 590

  Asn Thr Ser Ala Arg Gly Met Phe Gln Glu Tyr Gly Ala Asp Val Val

  595 600 605

  Leu His Phe Gly Met His Gly Thr Val Glu Trp Leu Pro Gly Ala Pro

  610 615 620

  Leu Gly Asn Asn Gly Leu Ser Trp Ser Asp Val Leu Leu Gly Glu Leu

  625 630 635 640

  Pro Asn Val Tyr Val Tyr Ala Ala Asn Asn Pro Ser Glu Ser Ile Val

  645 650 655

  Ala Lys Arg Arg Gly Tyr Gly Thr Ile Val Ser His Asn Val Pro Pro

  660 665 670

  Tyr Gly Arg Ala Gly Leu Tyr Lys Gln Leu Ser Ser Leu Lys Glu Thr

  675 680 685

  Leu Gln Glu Tyr Arg Glu Ala Ala Gln Ala Ala Arg Ala Arg Ala Gly

  690 695 700

  Ala Ser Ser Ser Ser Gly Ser Ser Ser Ser Ser Ser Ser Ser Gly Ser

  705 710 715 720

  Gly Ser Ser Ser Ser Ser Val Glu Leu Arg Ala Ala Leu Ala Pro Val

  725 730 735

  Phe Asp Ala Tyr Thr Asp Arg Leu Tyr Ala Tyr Leu Gln Leu Leu Glu

  740 745 750

  Gly Arg Leu Phe Ser Glu Gly Leu His Val Leu Gly Ala Pro Pro Ala

  755 760 765

  Pro Pro Gln Val Gly Gly Phe Pro Ala Ser Phe Gln Arg Tyr Arg Lys

  770 775 780

  Leu Pro Asn Cys Pro Thr Ser Pro Gln Thr Gln Glu Ala Val Lys Ile

  785 790 795 800

  Arg Asn Leu Leu Met Gln Asn Thr Gln Glu Leu Asp Gly Leu Leu Lys

  805 810 815

  Gly Leu Gly Gly Arg Tyr Val Leu Pro Glu Ala Gly Gly Asp Leu Leu

  820 825 830

  Arg Asp Gly Ser Gly Val Leu Pro Thr Gly Arg Asn Ile His Ala Leu

  835 840 845

  Asp Pro Tyr Arg Met Pro Ser Pro Ala Ala Met Ala Arg Gly Ala Ala

  850 855 860

  Val Ala Ala Ala Ile Leu Glu Gln His Arg Ala Ala Asn Ser Gly Ala

  865 870 875 880

  Trp Pro Glu Thr Cys Ala Val Asn Leu Trp Gly Leu Asp Ser Ile Lys

  885 890 895

  Ser Lys Gly Glu Ser Val Gly Val Val Leu Ala Leu Val Gly Ala Val

  900 905 910

  Pro Val Arg Glu Gly Thr Gly Arg Val Ala Arg Phe Gln Leu Val Pro

  915 920 925

  Leu Ser Glu Leu Gly Arg Pro Arg Val Asp Val Leu Cys Asn Met Ser

  930 935 940

  Gly Ile Phe Arg Asp Ser Phe Gln Asn Val Val Glu Leu Leu Asp Asp

  945 950 955 960

  Leu Phe Ala Arg Ala Ala Ala Ala Ala Asp Glu Pro Asp Asp Met Asn

  965 970 975

  Phe Ile Ala Lys His Ala Arg Ala Met Glu Lys Gln Gly Leu Ser Ala

  980 985 990

  Thr Ser Ala Arg Leu Phe Ser Asn Pro Ala Gly Asp Tyr Gly Ser Met

  995 10001005

  Val Asn Glu Arg Val Gly Gln Gly Ser Trp Ala Asn Gly Asp Glu

  101010151020

  Leu Gly Asp Thr Trp Ala Ala Arg Asn Ala Phe Ser Tyr Gly Arg

  102510301035

  Gly Lys Glu Arg Gly Thr Ala Arg Pro Glu Val Leu Gln Ala Leu

  104010451050

  Leu Lys Thr Thr Asp Arg Ile Val Gln Gln Ile Asp Ser Val Glu

  105510601065

  Tyr Gly Leu Thr Asp Ile Gln Glu Tyr Tyr Ala Asn Thr Gly Ala

  107010751080

  Leu Lys Arg Ala Ala Glu Val Ala Lys Gly Asp Pro Gly Pro Gly

  108510901095

  Gly Arg Arg Pro Arg Val Gly Cys Ser Ile Val Glu Ala Phe Gly

  110011051110

  Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Val Pro

  111511201125

  Pro Pro Arg Glu Leu Glu Glu Val Leu Arg Leu Glu Tyr Arg Ser

  113011351140

  Lys Leu Leu Asn Pro Lys Trp Ala Arg Ala Met Ala Ala Gln Gly

  114511501155

  Ser Gly Gly Ala Tyr Glu Ile Ser Gln Arg Met Thr Ala Leu Val

  116011651170

  Gly Trp Gly Ala Thr Thr Asp Phe Arg Glu Gly Trp Val Trp Asp

  117511801185

  Pro Gly Ala Met Asp Thr Tyr Val Gly Asp Glu Glu Met Ala Ser

  119011951200

  Lys Leu Lys Lys Asn Asn Pro Gln Ala Phe Ala Asn Val Leu Arg

  120512101215

  Arg Met Leu Glu Ala Ala Gly Arg Gly Met Trp Ser Pro Asn Lys

  122012251230

  Asp Gln Leu Ala Gln Leu Lys Ser Leu Tyr Ser Glu Met Asp Asp

  123512401245

  Gln Leu Glu Gly Val Thr

  1250

  <210> 21

  <211> 1254

  <212> DNA

  <213> 莱茵衣藻

  <400> 21

  atggccctga acatgcgtgt ttcctcttcc aaggtcgctg ccaagcagca gggccgcatc 60

  tccgcggtgc cggttgtgtc gagcaaggtg gcctcctccg cccgcgtggc ccccttccag 120

  ggcgctcccg tggccgcgca gcgcgctgct ctgctggtgc gcgccgctgc cgctactgag 180

  gtcaaggctg ctgagggccg cactgagaag gagctgggcc aggcccgccc catcttcccc 240

  ttcaccgcca tcgtgggcca ggatgagatg aagctggcgc tgattctgaa cgtgatcgac 300

  cccaagatcg gtggtgtcat gatcatgggc gaccgtggca ctggcaagtc caccaccatt 360

  cgtgccctgg cggatctgct gcccgagatg caggtggttg ccaacgaccc ctttaactcg 420

  gaccccaccg accccgagct gatgagcgag gaggtgcgca accgcgtcaa ggccggcgag 480

  cagctgcccg tgtcttccaa gaagattccc atggtggacc tgcccctggg cgccactgag 540

  gaccgcgtgt gcggcaccat cgacatcgag aaggcgctga ccgagggtgt caaggcgttc 600

  gagcccggcc tgctggccaa ggccaaccgc ggcatcctgt acgtggatga ggtcaacctg 660

  ctggacgacc acctggtcga tgtgctgctg gactcggccg cctccggctg gaacaccgtg 720

  gagcgcgagg gtatctccat cagccacccc gcccgcttca tcctggtcgg ctcgggcaac 780

  cccgaggagg gtgagctgcg cccccagctg ctggatcgct tcggcatgca cgcccagatc 840

  ggcaccgtca aggacccccg cctgcgtgtg cagatcgtgt cgcagcgctc gaccttcgac 900

  gagaaccccg ccgccttccg caaggactac gaggccggcc agatggcgct gacccagcgc 960

  atcgtggacg cgcgcaagct gctgaagcag ggcgaggtca actacgactt ccgcgtcaag 1020

  atcagccaga tctgctcgga cctgaacgtg gacggcatcc gcggcgacat cgtgaccaac 1080

  cgcgccgcca aggccctggc cgccttcgag ggccgcaccg aggtgacccc cgaggacatc 1140

  taccgtgtca ttcccctgtg cctgcgccac cgcctccgga aagaccccct ggctgagatc 1200

  gacgacggtg accgcgtgcg tgagatcttc aagcaggtgt tcggcatgga gtaa 1254

  <210> 22

  <211> 417

  <212> PRT

  <213> 莱茵衣藻

  <400> 22

  Met Ala Leu Asn Met Arg Val Ser Ser Ser Lys Val Ala Ala Lys Gln

  1 5 1015

  Gln Gly Arg Ile Ser Ala Val Pro Val Val Ser Ser Lys Val Ala Ser

  202530

  Ser Ala Arg Val Ala Pro Phe Gln Gly Ala Pro Val Ala Ala Gln Arg

  354045

  Ala Ala Leu Leu Val Arg Ala Ala Ala Ala Thr Glu Val Lys Ala Ala

  505560

  Glu Gly Arg Thr Glu Lys Glu Leu Gly Gln Ala Arg Pro Ile Phe Pro

  65707580

  Phe Thr Ala Ile Val Gly Gln Asp Glu Met Lys Leu Ala Leu Ile Leu

  859095

  Asn Val Ile Asp Pro Lys Ile Gly Gly Val Met Ile Met Gly Asp Arg

  100 105 110

  Gly Thr Gly Lys Ser Thr Thr Ile Arg Ala Leu Ala Asp Leu Leu Pro

  115 120 125

  Glu Met Gln Val Val Ala Asn Asp Pro Phe Asn Ser Asp Pro Thr Asp

  130 135 140

  Pro Glu Leu Met Ser Glu Glu Val Arg Asn Arg Val Lys Ala Gly Glu

  145 150 155 160

  Gln Leu Pro Val Ser Ser Lys Lys Ile Pro Met Val Asp Leu Pro Leu

  165 170 175

  Gly Ala Thr Glu Asp Arg Val Cys Gly Thr Ile Asp Ile Glu Lys Ala

  180 185 190

  Leu Thr Glu Gly Val Lys Ala Phe Glu Pro Gly Leu Leu Ala Lys Ala

  195 200 205

  Asn Arg Gly Ile Leu Tyr Val Asp Glu Val Asn Leu Leu Asp Asp His

  210 215 220

  Leu Val Asp Val Leu Leu Asp Ser Ala Ala Ser Gly Trp Asn Thr Val

  225 230 235 240

  Glu Arg Glu Gly Ile Ser Ile Ser His Pro Ala Arg Phe Ile Leu Val

  245 250 255

  Gly Ser Gly Asn Pro Glu Glu Gly Glu Leu Arg Pro Gln Leu Leu Asp

  260 265 270

  Arg Phe Gly Met His Ala Gln Ile Gly Thr Val Lys Asp Pro Arg Leu

  275 280 285

  Arg Val Gln Ile Val Ser Gln Arg Ser Thr Phe Asp Glu Asn Pro Ala

  290 295 300

  Ala Phe Arg Lys Asp Tyr Glu Ala Gly Gln Met Ala Leu Thr Gln Arg

  305 310 315 320

  Ile Val Asp Ala Arg Lys Leu Leu Lys Gln Gly Glu Val Asn Tyr Asp

  325 330 335

  Phe Arg Val Lys Ile Ser Gln Ile Cys Ser Asp Leu Asn Val Asp Gly

  340 345 350

  Ile Arg Gly Asp Ile Val Thr Asn Arg Ala Ala Lys Ala Leu Ala Ala

  355 360 365

  Phe Glu Gly Arg Thr Glu Val Thr Pro Glu Asp Ile Tyr Arg Val Ile

  370 375 380

  Pro Leu Cys Leu Arg His Arg Leu Arg Lys Asp Pro Leu Ala Glu Ile

  385 390 395 400

  Asp Asp Gly Asp Arg Val Arg Glu Ile Phe Lys Gln Val Phe Gly Met

  405 410 415

  Glu

  <210> 23

  <211> 1278

  <212> DNA

  <213> 莱茵衣藻

  <400> 23

  atgcagagtc tccagggtca gcgcgcgttc actgcggtgc gccagggtcg ggcgggtccc 60

  ctgcggactc gcctggtcgt gcgctcgtct gttgccttgc catccacgaa agccgcgaag 120

  aagccgaact tcccgttcgt caagattcag ggccaggagg agatgaagct tgcactgctg 180

  ctgaacgtgg tcgaccccaa catcggcgga gtgcttatta tgggtgaccg cggcactgcc 240

  aagtcggtcg cggtccgcgc cctggtggat atgcttcccg acattgacgt ggttgagggc 300

  gacgccttca acagctcccc caccgacccc aagttcatgg gccccgacac cctgcagcgc 360

  ttccgcaacg gcgagaagct gcccaccgtc cgcatgcgga cccccctggt ggagctgcct 420

  ctgggcgcca ccgaggaccg catctgcggc accatcgaca tcgagaaggc gctgacgcag 480

  ggcatcaagg cctacgagcc cggcctgctg gccaaggcca accgcggcat cctgtatgtg 540

  gacgaggtga acctgctgga tgatggcctg gttgatgtcg tgctggactc gtcggctagc 600

  ggcctgaaca ctgtggagcg tgagggtgtg tccattgtgc accctgcccg cttcatcatg 660

  attggctcag gcaaccccca ggagggtgag ctgcgcccgc agctgctgga tcgcttcggc 720

  atgagcgtca acgtggccac gctgcaggac accaagcagc gcacgcagct ggtgctggac 780

  cggcttgcgt acgaggcgga ccctgacgca tttgtggact cgtgcaaggc cgagcagacg 840

  gcgctcacgg acaagctgga ggcggcccgc cagcgcctgc ggtccgtcaa gatcagcgag 900

  gagctgcaga tcctgatctc ggacatttgc tcgcgcctgg atgtggatgg cctgcgcggt 960

  gacattgtga tcaaccgcgc cgccaaggcg cttgtggcct tcgagggccg caccgaggtg 1020

  accacgaatg acgtggagcg cgtcatctcg ggctgcctca accaccgcct gcgcaaggac 1080

  ccgctggacc ccattgacaa cggcaccaag gtggccatcc tgttcaagcg catgaccgac 1140

  cccgagatca tgaagcgcga ggaggaggcc aagaagaagc gcgaggaggc ggccgccaag 1200

  gccaaggcgg agggcaaggc ggaccgcccc acgggcgcca aggctggcgc ctgggctggc 1260

  ttgccccctc gtcggtaa 1278

  <210> 24

  <211> 425

  <212> PRT

  <213> 莱茵衣藻

  <400> 24

  Met Gln Ser Leu Gln Gly Gln Arg Ala Phe Thr Ala Val Arg Gln Gly

  1 5 1015

  Arg Ala Gly Pro Leu Arg Thr Arg Leu Val Val Arg Ser Ser Val Ala

  202530

  Leu Pro Ser Thr Lys Ala Ala Lys Lys Pro Asn Phe Pro Phe Val Lys

  354045

  Ile Gln Gly Gln Glu Glu Met Lys Leu Ala Leu Leu Leu Asn Val Val

  505560

  Asp Pro Asn Ile Gly Gly Val Leu Ile Met Gly Asp Arg Gly Thr Ala

  65707580

  Lys Ser Val Ala Val Arg Ala Leu Val Asp Met Leu Pro Asp Ile Asp

  859095

  Val Val Glu Gly Asp Ala Phe Asn Ser Ser Pro Thr Asp Pro Lys Phe

  100 105 110

  Met Gly Pro Asp Thr Leu Gln Arg Phe Arg Asn Gly Glu Lys Leu Pro

  115 120 125

  Thr Val Arg Met Arg Thr Pro Leu Val Glu Leu Pro Leu Gly Ala Thr

  130 135 140

  Glu Asp Arg Ile Cys Gly Thr Ile Asp Ile Glu Lys Ala Leu Thr Gln

  145 150 155 160

  Gly Ile Lys Ala Tyr Glu Pro Gly Leu Leu Ala Lys Ala Asn Arg Gly

  165 170 175

  Ile Leu Tyr Val Asp Glu Val Asn Leu Leu Asp Asp Gly Leu Val Asp

  180 185 190

  Val Val Leu Asp Ser Ser Ala Ser Gly Leu Asn Thr Val Glu Arg Glu

  195 200 205

  Gly Val Ser Ile Val His Pro Ala Arg Phe Ile Met Ile Gly Ser Gly

  210 215 220

  Asn Pro Gln Glu Gly Glu Leu Arg Pro Gln Leu Leu Asp Arg Phe Gly

  225 230 235 240

  Met Ser Val Asn Val Ala Thr Leu Gln Asp Thr Lys Gln Arg Thr Gln

  245 250 255

  Leu Val Leu Asp Arg Leu Ala Tyr Glu Ala Asp Pro Asp Ala Phe Val

  260 265 270

  Asp Ser Cys Lys Ala Glu Gln Thr Ala Leu Thr Asp Lys Leu Glu Ala

  275 280 285

  Ala Arg Gln Arg Leu Arg Ser Val Lys Ile Ser Glu Glu Leu Gln Ile

  290 295 300

  Leu Ile Ser Asp Ile Cys Ser Arg Leu Asp Val Asp Gly Leu Arg Gly

  305 310 315 320

  Asp Ile Val Ile Asn Arg Ala Ala Lys Ala Leu Val Ala Phe Glu Gly

  325 330 335

  Arg Thr Glu Val Thr Thr Asn Asp Val Glu Arg Val Ile Ser Gly Cys

  340 345 350

  Leu Asn His Arg Leu Arg Lys Asp Pro Leu Asp Pro Ile Asp Asn Gly

  355 360 365

  Thr Lys Val Ala Ile Leu Phe Lys Arg Met Thr Asp Pro Glu Ile Met

  370 375 380

  Lys Arg Glu Glu Glu Ala Lys Lys Lys Arg Glu Glu Ala Ala Ala Lys

  385 390 395 400

  Ala Lys Ala Glu Gly Lys Ala Asp Arg Pro Thr Gly Ala Lys Ala Gly

  405 410 415

  Ala Trp Ala Gly Leu Pro Pro Arg Arg

  420 425

  <210> 25

  <211> 2304

  <212> DNA

  <213> 莱茵衣藻

  <400> 25

  atgaagtctc tctgccatga gctcgctggc cccagcgtta ctgggtgcgg ccggcgaagc 60

  ctccggaagg ctttcagcgg tgccaagatt gcgcaggtct ctcgccccgc tgtgcttaac 120

  agcgtgcagc gccaacagcg tctcgcctgt tctgccgtgg ccgagctctc cgctgctgag 180

  ctgcgcgcca tgaaggtgtc tgaggaggac tccaagggct tcgatgcgga tgtgtcgacc 240

  cgcctggccc gctcgtaccc tctggcggcc gtggtgggcc aggacaacat caagcaggcg 300

  ctgctgctgg gcgccgtgga caccgggctg ggcggcatcg ccatcgccgg tcgccgcggt 360

  accgccaagt ccatcatggc tcgcggcctg cacgctctgc tgccgcccat tgaggtggtg 420

  gagggcagca tctgcaacgc cgaccccgag gacccccgct cctgggaggc tggcctggct 480

  gagaagtatg cgggcggccc tgtgaagacc aagatgcgct cggcgccgtt tgtgcagatc 540

  cctctgggtg tgactgagga ccgcttggtg ggcactgtgg acattgaggc gtccatgaag 600

  gagggcaaga ctgtgttcca gcccggcctg ctggctgagg cgcaccgcgg catcctgtac 660

  gtggacgaga tcaacctgct ggatgacggc attgccaacc tgctgctgtc catcctgtcg 720

  gacggagtca acgtggtgga gcgcgagggc atctccatca gccacccctg ccggccgctg 780

  ctgattgcca cctacaaccc cgaggagggc cctctgcgtg agcacctgct ggaccgcatc 840

  gccattggcc tcagcgccga cgtccccagc accagcgacg agcgcgtcaa ggccattgac 900

  gcagccatcc gcttccagga caagccgcag gacactattg acgacaccgc ggagctcacc 960

  gacgccctgc gcacctcggt catcctggct cgcgagtacc tgaaggacgt gaccatcgcg 1020

  ccggagcagg tgacctacat tgtggaggag gcgcgccgcg gcggagtcca ggggcaccgc 1080

  gcggagctgt acgcggtcaa gtgtgccaag gcgtgtgcgg ctctggaggg ccgtgagcgt 1140

  gtgaacaagg atgacctgcg ccaggccgtg cagctggtca tcctgccgcg cgccaccatc 1200

  ctggaccagc ccccgcccga gcaggagcag cccccgccgc cgcccccgcc ccctcccccg 1260

  ccgccgccgc aggaccaaat ggaggacgag gaccaggagg agaaggagga cgagaaggag 1320

  gaggaggaga aggagaacga ggaccaggac gagcccgaga tccctcagga gttcatgttt 1380

  gagtccgagg gcgtcatcat ggacccctcc atcctcatgt tcgcgcagca gcagcagcgc 1440

  gcgcagggcc gctccggccg cgccaagacg ctcatcttca gcgacgaccg cggccgctac 1500

  atcaagccca tgctgcccaa gggtgacaag gtcaagcgcc tggcagtgga cgccacgctt 1560

  cgcgccgccg cgccctacca gaagattcgc cggcagcagg ccatcagcga gggcaaggtg 1620

  cagcgcaagg tgtacgtgga caagccagac atgcgctcca agaagctggc ccgcaaggcc 1680

  ggtgcgctgg tgatttttgt tgtggacgcg tccggctcca tggctctgaa ccgcatgagc 1740

  gccgccaagg gcgcctgcat gcgcctgctg gctgagtcgt acaccagccg cgaccaggtg 1800

  tgcctcatcc ccttctacgg cgacaaggcc gaggtgctgc tgccgccctc caagtccatc 1860

  gccatggccc gccgccgcct ggactcgctg ccctgcggcg gcggctcgcc ccttgcgcac 1920

  ggcctgtcca cggcggtacg tgtgggcatg caggccagcc aggcgggcga ggtgggccgc 1980

  gtcatgatgg tgctcatcac ggacggccgc gccaacgtca gcctggccaa gtccaacgag 2040

  gaccccgagg cgctcaagcc cgacgcgccc aagcccaccg ccgactcgct gaaggacgag 2100

  gtgcgcgaca tggccaagaa ggccgcgtcc gccggcatca acgtgcttgt cattgacacg 2160

  gagaacaagt tcgtgagcac cggctttgcg gaggagatct ccaaggcagc gcagggcaag 2220

  tactactacc tgcccaacgc cagcgacgcc gccatcgcgg cggccgcgtc cggcgccatg 2280

  gccgcggcca agggcggcta ctag 2304

  <210> 26

  <211> 767

  <212> PRT

  <213> 莱茵衣藻

  <400> 26

  Met Lys Ser Leu Cys His Glu Leu Ala Gly Pro Ser Val Thr Gly Cys

  1 5 1015

  Gly Arg Arg Ser Leu Arg Lys Ala Phe Ser Gly Ala Lys Ile Ala Gln

  202530

  Val Ser Arg Pro Ala Val Leu Asn Ser Val Gln Arg Gln Gln Arg Leu

  354045

  Ala Cys Ser Ala Val Ala Glu Leu Ser Ala Ala Glu Leu Arg Ala Met

  505560

  Lys Val Ser Glu Glu Asp Ser Lys Gly Phe Asp Ala Asp Val Ser Thr

  65707580

  Arg Leu Ala Arg Ser Tyr Pro Leu Ala Ala Val Val Gly Gln Asp Asn

  859095

  Ile Lys Gln Ala Leu Leu Leu Gly Ala Val Asp Thr Gly Leu Gly Gly

  100 105 110

  Ile Ala Ile Ala Gly Arg Arg Gly Thr Ala Lys Ser Ile Met Ala Arg

  115 120 125

  Gly Leu His Ala Leu Leu Pro Pro Ile Glu Val Val Glu Gly Ser Ile

  130 135 140

  Cys Asn Ala Asp Pro Glu Asp Pro Arg Ser Trp Glu Ala Gly Leu Ala

  145 150 155 160

  Glu Lys Tyr Ala Gly Gly Pro Val Lys Thr Lys Met Arg Ser Ala Pro

  165 170 175

  Phe Val Gln Ile Pro Leu Gly Val Thr Glu Asp Arg Leu Val Gly Thr

  180 185 190

  Val Asp Ile Glu Ala Ser Met Lys Glu Gly Lys Thr Val Phe Gln Pro

  195 200 205

  Gly Leu Leu Ala Glu Ala His Arg Gly Ile Leu Tyr Val Asp Glu Ile

  210 215 220

  Asn Leu Leu Asp Asp Gly Ile Ala Asn Leu Leu Leu Ser Ile Leu Ser

  225 230 235 240

  Asp Gly Val Asn Val Val Glu Arg Glu Gly Ile Ser Ile Ser His Pro

  245 250 255

  Cys Arg Pro Leu Leu Ile Ala Thr Tyr Asn Pro Glu Glu Gly Pro Leu

  260 265 270

  Arg Glu His Leu Leu Asp Arg Ile Ala Ile Gly Leu Ser Ala Asp Val

  275 280 285

  Pro Ser Thr Ser Asp Glu Arg Val Lys Ala Ile Asp Ala Ala Ile Arg

  290 295 300

  Phe Gln Asp Lys Pro Gln Asp Thr Ile Asp Asp Thr Ala Glu Leu Thr

  305 310 315 320

  Asp Ala Leu Arg Thr Ser Val Ile Leu Ala Arg Glu Tyr Leu Lys Asp

  325 330 335

  Val Thr Ile Ala Pro Glu Gln Val Thr Tyr Ile Val Glu Glu Ala Arg

  340 345 350

  Arg Gly Gly Val Gln Gly His Arg Ala Glu Leu Tyr Ala Val Lys Cys

  355 360 365

  Ala Lys Ala Cys Ala Ala Leu Glu Gly Arg Glu Arg Val Asn Lys Asp

  370 375 380

  Asp Leu Arg Gln Ala Val Gln Leu Val Ile Leu Pro Arg Ala Thr Ile

  385 390 395 400

  Leu Asp Gln Pro Pro Pro Glu Gln Glu Gln Pro Pro Pro Pro Pro Pro

  405 410 415

  Pro Pro Pro Pro Pro Pro Pro Gln Asp Gln Met Glu Asp Glu Asp Gln

  420 425 430

  Glu Glu Lys Glu Asp Glu Lys Glu Glu Glu Glu Lys Glu Asn Glu Asp

  435 440 445

  Gln Asp Glu Pro Glu Ile Pro Gln Glu Phe Met Phe Glu Ser Glu Gly

  450 455 460

  Val Ile Met Asp Pro Ser Ile Leu Met Phe Ala Gln Gln Gln Gln Arg

  465 470 475 480

  Ala Gln Gly Arg Ser Gly Arg Ala Lys Thr Leu Ile Phe Ser Asp Asp

  485 490 495

  Arg Gly Arg Tyr Ile Lys Pro Met Leu Pro Lys Gly Asp Lys Val Lys

  500 505 510

  Arg Leu Ala Val Asp Ala Thr Leu Arg Ala Ala Ala Pro Tyr Gln Lys

  515 520 525

  Ile Arg Arg Gln Gln Ala Ile Ser Glu Gly Lys Val Gln Arg Lys Val

  530 535 540

  Tyr Val Asp Lys Pro Asp Met Arg Ser Lys Lys Leu Ala Arg Lys Ala

  545 550 555 560

  Gly Ala Leu Val Ile Phe Val Val Asp Ala Ser Gly Ser Met Ala Leu

  565 570 575

  Asn Arg Met Ser Ala Ala Lys Gly Ala Cys Met Arg Leu Leu Ala Glu

  580 585 590

  Ser Tyr Thr Ser Arg Asp Gln Val Cys Leu Ile Pro Phe Tyr Gly Asp

  595 600 605

  Lys Ala Glu Val Leu Leu Pro Pro Ser Lys Ser Ile Ala Met Ala Arg

  610 615 620

  Arg Arg Leu Asp Ser Leu Pro Cys Gly Gly Gly Ser Pro Leu Ala His

  625 630 635 640

  Gly Leu Ser Thr Ala Val Arg Val Gly Met Gln Ala Ser Gln Ala Gly

  645 650 655

  Glu Val Gly Arg Val Met Met Val Leu Ile Thr Asp Gly Arg Ala Asn

  660 665 670

  Val Ser Leu Ala Lys Ser Asn Glu Asp Pro Glu Ala Leu Lys Pro Asp

  675 680 685

  Ala Pro Lys Pro Thr Ala Asp Ser Leu Lys Asp Glu Val Arg Asp Met

  690 695 700

  Ala Lys Lys Ala Ala Ser Ala Gly Ile Asn Val Leu Val Ile Asp Thr

  705 710 715 720

  Glu Asn Lys Phe Val Ser Thr Gly Phe Ala Glu Glu Ile Ser Lys Ala

  725 730 735

  Ala Gln Gly Lys Tyr Tyr Tyr Leu Pro Asn Ala Ser Asp Ala Ala Ile

  740 745 750

  Ala Ala Ala Ala Ser Gly Ala Met Ala Ala Ala Lys Gly Gly Tyr

  755 760 765

  <210> 27

  <211> 4200

  <212> DNA

  <213> 莱茵衣藻

  <400> 27

  atgcagactt cctcgcttct tggccggcgc acggcccacc cggctgcggg cgcgacgccc 60

  aagccggttg cgccctcgcc ccgcgtggct agcacccgcc aggtcgcgtg caatgtggcg 120

  actggacccc ggccgcccat gaccaccttc accggtggca acaagggccc tgctaagcag 180

  caggtgtcgc tggatctgcg cgacgagggc gctggcatgt tcaccagcac cagcccggag 240

  atgcgccgtg tcgtccctga cgatgtgaag ggtcgcgtta aggtgaaggt tgtgtacgtg 300

  gtgctggagg cccagtacca gtcggccatc agcgctgcgg tgaagaacat caacgccaag 360

  aactccaagg tgtgcttcga ggtggtgggc tacctgctgg aggagctgcg tgaccagaag 420

  aacctcgata tgctcaagga ggatgtggcc tctgccaaca tcttcatcgg ctcgctcatc 480

  ttcattgagg agcttgccga gaagattgtg gaggcggtga gccccctgcg cgagaagctg 540

  gacgcgtgcc tgatcttccc gtccatgccg gcggtcatga agctgaacaa gctgggcacg 600

  ttttcgatgg ctcagctggg ccagtcgaag tcggtgttct cggagttcat caagtctgct 660

  cgcaagaaca acgacaactt cgaggagggc ttgctgaagc tggtgcgcac cctgcctaag 720

  gtgctgaagt atctgccctc ggacaaggcg caggacgcca agaacttcgt gaacagcctg 780

  cagtactggc tgggcggtaa ctcggacaac ctggagaacc tgctgctgaa caccgtcagc 840

  aactacgtgc ccgctctgaa gggcgtggac ttcagcgtgg ctgagcccac cgcctacccc 900

  gatgtgggta tctggcaccc tctggcctcg ggcatgtacg aggacctgaa ggagtacctg 960

  aactggtacg acacccgcaa ggacatggtc ttcgccaagg acgcccccgt cattggcctg 1020

  gtgctgcagc gctcgcacct ggtgactggc gatgagggcc actacagcgg cgtggtcgct 1080

  gagctggaga gccgcggtgc taaggtcatc cccgtctttg ccggtggcct ggacttctcc 1140

  gcccccgtca agaagttctt ctacgacccc ctgggctctg gccgcacgtt cgtggacacc 1200

  gttgtgtcgc tgaccggctt cgcgctggtg ggcggccccg cgcgccagga cgcgccgaag 1260

  gccattgagg cgctgaagaa cctgaacgtg ccctacctgg tgtcgctgcc gctggtgttc 1320

  cagaccactg aggagtggct ggacagcgag ctgggcgtgc accccgtcca ggtggctctg 1380

  caggttgccc tgcccgagct ggatggtgcc atggagccca tcgtgttcgc tggccgtgac 1440

  tcgaacaccg gcaagtcgca ctcgctgccc gaccgcatcg cttcgctgtg cgctcgcgcc 1500

  gtgaactggg ccaacctgcg caagaagcgc aacgccgaga agaagctggc cgtcaccgtg 1560

  ttcagcttcc cccctgacaa gggcaacgtc ggcactgccg cctacctgaa cgtgttcggc 1620

  tccatctacc gcgtgctgaa gaacctgcag cgcgagggct acgacgtggg cgccctgccg 1680

  ccctcggagg aggatctgat ccagtcggtg ctgacccaga aggaggccaa gttcaactcg 1740

  accgacctgc acatcgccta caagatgaag gtggacgagt accagaagct gtgcccttac 1800

  gccgaggcgc tggaggagaa ctggggcaag ccccccggca ccctgaacac caacggccag 1860

  gagctgctgg tgtacggccg ccagtacggc aacgtcttca tcggcgtgca gcccaccttc 1920

  ggctacgagg gcgacccgat gcgcctgctg ttctcgaagt cggccagccc ccaccacggc 1980

  ttcgccgcct actacacctt cctggagaag atcttcaagg ccgacgccgt gctgcacttc 2040

  ggcacccacg gctcgctgga gttcatgccc ggcaagcagg tcggcatgtc gggtgtgtgc 2100

  taccccgact cgctgatcgg caccatcccc aacctctact actacgccgc caacaacccg 2160

  tctgaggcca ccatcgccaa gcgccgctcg tacgccaaca ccatttcgta cctgacgccg 2220

  cctgccgaga acgccggcct gtacaagggc ctgaaggagc tgaaggagct gatcagctcg 2280

  taccagggca tgcgtgagtc tggccgcgcc gagcagatct gcgccaccat cattgagacc 2340

  gccaagctgt gcaacctgga ccgcgacgtg accctgcccg acgctgacgc caaggacctg 2400

  accatggaca tgcgcgacag cgttgtgggc caggtgtacc gcaagctgat ggagattgag 2460

  tcccgcctgc tgccctgcgg cctgcacgtg gtgggctgcc cgcccaccgc cgaggaggcc 2520

  gtggccaccc tggtcaacat cgctgagctg gaccgcccgg acaacaaccc ccccatcaag 2580

  ggcatgcccg gcatcctggc ccgcgccatt ggtcgcgaca tcgagtcgat ttacagcggc 2640

  aacaacaagg gcgtcctggc tgacgttgac cagctgcagc gcatcaccga ggcctcccgc 2700

  acctgcgtgc gcgagttcgt gaaggaccgc accggcctga acggccgcat cggcaccaac 2760

  tggatcacca acctgctcaa gttcaccggc ttctacgtgg acccctgggt gcgcggcctg 2820

  cagaacggcg agttcgccag cgccaaccgc gaggagctga tcaccctgtt caactacctg 2880

  gagttctgcc tgacccaggt ggtcaaggac aacgagctgg gcgccctggt agaggcgctg 2940

  aacggccagt acgtcgagcc cggccccggc ggtgacccca tccgcaaccc caacgtgctg 3000

  cccaccggca agaacatcca cgccctggac cctcagtcga ttcccactca ggccgcgctg 3060

  aagagcgccc gcctggtggt ggaccgcctg ctggaccgcg agcgcgacaa caacggcggc 3120

  aagtaccccg agaccatcgc gctggtgctg tggggcactg acaacatcaa gacctacggc 3180

  gagtcgctgg cccaggtcat gatgatggtc ggtgtcaagc ccgtggccga cgccctgggc 3240

  cgcgtgaaca agctggaggt gatccctctg gaggagctgg gccgcccccg cgtggacgtg 3300

  gttgtcaact gctcgggtgt gttccgcgac ctgttcgtga accagatgct gctgctggac 3360

  cgcgccatca agctggcggc cgagcaggac gagcccgatg agatgaactt cgtgcgcaag 3420

  cacgccaagc agcaggcggc ggagctgggc ctgcagagcc tgcgcgacgc ggccacccgt 3480

  gtgttctcca acagctcggg ctcctactcg tccaacgtca acctggcggt ggagaacagc 3540

  agctggagcg acgagtcgca gctgcaggag atgtacctga agcgcaagtc gtacgccttc 3600

  aactcggacc gccccggcgc cggtggcgag atgcagcgcg acgtgttcga gacggccatg 3660

  aagaccgtgg acgtgacctt ccagaacctg gactcgtccg agatctcgct gaccgatgtg 3720

  tcgcactact tcgactccga ccccaccaag ctggtggcgt cgctgcgcaa cgacggccgc 3780

  acccccaacg cctacatcgc cgacaccacc accgccaacg cgcaggtccg cactctgggt 3840

  gagaccgtgc gcctggacgc ccgcaccaag ctgctcaacc ccaagtggta cgagggcatg 3900

  cttgcctcgg gctacgaggg cgtgcgcgag atccagaagc gcatgaccaa caccatgggc 3960

  tggtcggcca cctcgggcat ggtggacaac tgggtgtacg acgaggccaa ctcgaccttc 4020

  atcgaggatg cggccatggc cgagcgcctg atgaacacca accccaacag cttccgcaag 4080

  ctggtggcca ccttcctgga ggccaacggc cgcggctact gggacgccaa gcccgagcag 4140

  ctggagcgcc tgcgccagct gtacatggac gtggaggaca agattgaggg cgtcgaataa 4200

  <210> 28

  <211> 1399

  <212> PRT

  <213> 莱茵衣藻

  <400> 28

  Met Gln Thr Ser Ser Leu Leu Gly Arg Arg Thr Ala His Pro Ala Ala

  1 5 1015

  Gly Ala Thr Pro Lys Pro Val Ala Pro Ser Pro Arg Val Ala Ser Thr

  202530

  Arg Gln Val Ala Cys Asn Val Ala Thr Gly Pro Arg Pro Pro Met Thr

  354045

  Thr Phe Thr Gly Gly Asn Lys Gly Pro Ala Lys Gln Gln Val Ser Leu

  505560

  Asp Leu Arg Asp Glu Gly Ala Gly Met Phe Thr Ser Thr Ser Pro Glu

  65707580

  Met Arg Arg Val Val Pro Asp Asp Val Lys Gly Arg Val Lys Val Lys

  859095

  Val Val Tyr Val Val Leu Glu Ala Gln Tyr Gln Ser Ala Ile Ser Ala

  100 105 110

  Ala Val Lys Asn Ile Asn Ala Lys Asn Ser Lys Val Cys Phe Glu Val

  115 120 125

  Val Gly Tyr Leu Leu Glu Glu Leu Arg Asp Gln Lys Asn Leu Asp Met

  130 135 140

  Leu Lys Glu Asp Val Ala Ser Ala Asn Ile Phe Ile Gly Ser Leu Ile

  145 150 155 160

  Phe Ile Glu Glu Leu Ala Glu Lys Ile Val Glu Ala Val Ser Pro Leu

  165 170 175

  Arg Glu Lys Leu Asp Ala Cys Leu Ile Phe Pro Ser Met Pro Ala Val

  180 185 190

  Met Lys Leu Asn Lys Leu Gly Thr Phe Ser Met Ala Gln Leu Gly Gln

  195 200 205

  Ser Lys Ser Val Phe Ser Glu Phe Ile Lys Ser Ala Arg Lys Asn Asn

  210 215 220

  Asp Asn Phe Glu Glu Gly Leu Leu Lys Leu Val Arg Thr Leu Pro Lys

  225 230 235 240

  Val Leu Lys Tyr Leu Pro Ser Asp Lys Ala Gln Asp Ala Lys Asn Phe

  245 250 255

  Val Asn Ser Leu Gln Tyr Trp Leu Gly Gly Asn Ser Asp Asn Leu Glu

  260 265 270

  Asn Leu Leu Leu Asn Thr Val Ser Asn Tyr Val Pro Ala Leu Lys Gly

  275 280 285

  Val Asp Phe Ser Val Ala Glu Pro Thr Ala Tyr Pro Asp Val Gly Ile

  290 295 300

  Trp His Pro Leu Ala Ser Gly Met Tyr Glu Asp Leu Lys Glu Tyr Leu

  305 310 315 320

  Asn Trp Tyr Asp Thr Arg Lys Asp Met Val Phe Ala Lys Asp Ala Pro

  325 330 335

  Val Ile Gly Leu Val Leu Gln Arg Ser His Leu Val Thr Gly Asp Glu

  340 345 350

  Gly His Tyr Ser Gly Val Val Ala Glu Leu Glu Ser Arg Gly Ala Lys

  355 360 365

  Val Ile Pro Val Phe Ala Gly Gly Leu Asp Phe Ser Ala Pro Val Lys

  370 375 380

  Lys Phe Phe Tyr Asp Pro Leu Gly Ser Gly Arg Thr Phe Val Asp Thr

  385 390 395 400

  Val Val Ser Leu Thr Gly Phe Ala Leu Val Gly Gly Pro Ala Arg Gln

  405 410 415

  Asp Ala Pro Lys Ala Ile Glu Ala Leu Lys Asn Leu Asn Val Pro Tyr

  420 425 430

  Leu Val Ser Leu Pro Leu Val Phe Gln Thr Thr Glu Glu Trp Leu Asp

  435 440 445

  Ser Glu Leu Gly Val His Pro Val Gln Val Ala Leu Gln Val Ala Leu

  450 455 460

  Pro Glu Leu Asp Gly Ala Met Glu Pro Ile Val Phe Ala Gly Arg Asp

  465 470 475 480

  Ser Asn Thr Gly Lys Ser His Ser Leu Pro Asp Arg Ile Ala Ser Leu

  485 490 495

  Cys Ala Arg Ala Val Asn Trp Ala Asn Leu Arg Lys Lys Arg Asn Ala

  500 505 510

  Glu Lys Lys Leu Ala Val Thr Val Phe Ser Phe Pro Pro Asp Lys Gly

  515 520 525

  Asn Val Gly Thr Ala Ala Tyr Leu Asn Val Phe Gly Ser Ile Tyr Arg

  530 535 540

  Val Leu Lys Asn Leu Gln Arg Glu Gly Tyr Asp Val Gly Ala Leu Pro

  545 550 555 560

  Pro Ser Glu Glu Asp Leu Ile Gln Ser Val Leu Thr Gln Lys Glu Ala

  565 570 575

  Lys Phe Asn Ser Thr Asp Leu His Ile Ala Tyr Lys Met Lys Val Asp

  580 585 590

  Glu Tyr Gln Lys Leu Cys Pro Tyr Ala Glu Ala Leu Glu Glu Asn Trp

  595 600 605

  Gly Lys Pro Pro Gly Thr Leu Asn Thr Asn Gly Gln Glu Leu Leu Val

  610 615 620

  Tyr Gly Arg Gln Tyr Gly Asn Val Phe Ile Gly Val Gln Pro Thr Phe

  625 630 635 640

  Gly Tyr Glu Gly Asp Pro Met Arg Leu Leu Phe Ser Lys Ser Ala Ser

  645 650 655

  Pro His His Gly Phe Ala Ala Tyr Tyr Thr Phe Leu Glu Lys Ile Phe

  660 665 670

  Lys Ala Asp Ala Val Leu His Phe Gly Thr His Gly Ser Leu Glu Phe

  675 680 685

  Met Pro Gly Lys Gln Val Gly Met Ser Gly Val Cys Tyr Pro Asp Ser

  690 695 700

  Leu Ile Gly Thr Ile Pro Asn Leu Tyr Tyr Tyr Ala Ala Asn Asn Pro

  705 710 715 720

  Ser Glu Ala Thr Ile Ala Lys Arg Arg Ser Tyr Ala Asn Thr Ile Ser

  725 730 735

  Tyr Leu Thr Pro Pro Ala Glu Asn Ala Gly Leu Tyr Lys Gly Leu Lys

  740 745 750

  Glu Leu Lys Glu Leu Ile Ser Ser Tyr Gln Gly Met Arg Glu Ser Gly

  755 760 765

  Arg Ala Glu Gln Ile Cys Ala Thr Ile Ile Glu Thr Ala Lys Leu Cys

  770 775 780

  Asn Leu Asp Arg Asp Val Thr Leu Pro Asp Ala Asp Ala Lys Asp Leu

  785 790 795 800

  Thr Met Asp Met Arg Asp Ser Val Val Gly Gln Val Tyr Arg Lys Leu

  805 810 815

  Met Glu Ile Glu Ser Arg Leu Leu Pro Cys Gly Leu His Val Val Gly

  820 825 830

  Cys Pro Pro Thr Ala Glu Glu Ala Val Ala Thr Leu Val Asn Ile Ala

  835 840 845

  Glu Leu Asp Arg Pro Asp Asn Asn Pro Pro Ile Lys Gly Met Pro Gly

  850 855 860

  Ile Leu Ala Arg Ala Ile Gly Arg Asp Ile Glu Ser Ile Tyr Ser Gly

  865 870 875 880

  Asn Asn Lys Gly Val Leu Ala Asp Val Asp Gln Leu Gln Arg Ile Thr

  885 890 895

  Glu Ala Ser Arg Thr Cys Val Arg Glu Phe Val Lys Asp Arg Thr Gly

  900 905 910

  Leu Asn Gly Arg Ile Gly Thr Asn Trp Ile Thr Asn Leu Leu Lys Phe

  915 920 925

  Thr Gly Phe Tyr Val Asp Pro Trp Val Arg Gly Leu Gln Asn Gly Glu

  930 935 940

  Phe Ala Ser Ala Asn Arg Glu Glu Leu Ile Thr Leu Phe Asn Tyr Leu

  945 950 955 960

  Glu Phe Cys Leu Thr Gln Val Val Lys Asp Asn Glu Leu Gly Ala Leu

  965 970 975

  Val Glu Ala Leu Asn Gly Gln Tyr Val Glu Pro Gly Pro Gly Gly Asp

  980 985 990

  Pro Ile Arg Asn Pro Asn Val Leu Pro Thr Gly Lys Asn Ile His Ala

  995 10001005

  Leu Asp Pro Gln Ser Ile Pro Thr Gln Ala Ala Leu Lys Ser Ala

  101010151020

  Arg Leu Val Val Asp Arg Leu Leu Asp Arg Glu Arg Asp Asn Asn

  102510301035

  Gly Gly Lys Tyr Pro Glu Thr Ile Ala Leu Val Leu Trp Gly Thr

  104010451050

  Asp Asn Ile Lys Thr Tyr Gly Glu Ser Leu Ala Gln Val Met Met

  105510601065

  Met Val Gly Val Lys Pro Val Ala Asp Ala Leu Gly Arg Val Asn

  107010751080

  Lys Leu Glu Val Ile Pro Leu Glu Glu Leu Gly Arg Pro Arg Val

  108510901095

  Asp Val Val Val Asn Cys Ser Gly Val Phe Arg Asp Leu Phe Val

  110011051110

  Asn Gln Met Leu Leu Leu Asp Arg Ala Ile Lys Leu Ala Ala Glu

  111511201125

  Gln Asp Glu Pro Asp Glu Met Asn Phe Val Arg Lys His Ala Lys

  113011351140

  Gln Gln Ala Ala Glu Leu Gly Leu Gln Ser Leu Arg Asp Ala Ala

  114511501155

  Thr Arg Val Phe Ser Asn Ser Ser Gly Ser Tyr Ser Ser Asn Val

  116011651170

  Asn Leu Ala Val Glu Asn Ser Ser Trp Ser Asp Glu Ser Gln Leu

  117511801185

  Gln Glu Met Tyr Leu Lys Arg Lys Ser Tyr Ala Phe Asn Ser Asp

  119011951200

  Arg Pro Gly Ala Gly Gly Glu Met Gln Arg Asp Val Phe Glu Thr

  120512101215

  Ala Met Lys Thr Val Asp Val Thr Phe Gln Asn Leu Asp Ser Ser

  122012251230

  Glu Ile Ser Leu Thr Asp Val Ser His Tyr Phe Asp Ser Asp Pro

  123512401245

  Thr Lys Leu Val Ala Ser Leu Arg Asn Asp Gly Arg Thr Pro Asn

  125012551260

  Ala Tyr Ile Ala Asp Thr Thr Thr Ala Asn Ala Gln Val Arg Thr

  126512701275

  Leu Gly Glu Thr Val Arg Leu Asp Ala Arg Thr Lys Leu Leu Asn

  128012851290

  Pro Lys Trp Tyr Glu Gly Met Leu Ala Ser Gly Tyr Glu Gly Val

  129513001305

  Arg Glu Ile Gln Lys Arg Met Thr Asn Thr Met Gly Trp Ser Ala

  131013151320

  Thr Ser Gly Met Val Asp Asn Trp Val Tyr Asp Glu Ala Asn Ser

  132513301335

  Thr Phe Ile Glu Asp Ala Ala Met Ala Glu Arg Leu Met Asn Thr

  134013451350

  Asn Pro Asn Ser Phe Arg Lys Leu Val Ala Thr Phe Leu Glu Ala

  135513601365

  Asn Gly Arg Gly Tyr Trp Asp Ala Lys Pro Glu Gln Leu Glu Arg

  137013751380

  Leu Arg Gln Leu Tyr Met Asp Val Glu Asp Lys Ile Glu Gly Val

  138513901395

  Glu

  <210> 29

  <211> 2064

  <212> DNA

  <213> 莱茵衣藻

  <400> 29

  atgaaattag cttattggat gtacgcaggt cccgctcata tcggtgtgtt gcgtgttagc 60

  agctctttta aaaatgtaca tgccattatg catgctcctt taggagatga ttattttaat 120

  gtaatgcgtt ccatgttaga acgtgaacgt gattttacac cagtaacagc cagtattgta 180

  gatcgtcatg ttttagcaag aggatcgcaa gaaaaagtgg ttgaaaatat tacgcgaaaa 240

  aataaagaag aaactcctga tttaatttta ttaactccta cttgtacgtc aagcatttta 300

  caagaagatt tacacaattt tgttgaatcg gcattagcta aaccagtaca aatagatgaa 360

  catgcagacc ataaagtaac tcaacaaagt gcactttcaa gtgtatcccc tttactaccg 420

  cttgaagaaa atacattaat agtaagtgaa ctagataaga agcttagccc gtctagcaag 480

  ttgcatatta atatgcccaa tatttgtatt cccgaaggag aaggggaagg ggagcagact 540

  aaaaattcaa tttttgttaa atctgcaact ttaacaaatt tgtcagaaga ggaactatta 600

  aatcaagaac atcataccaa aacaagaaat cactctgacg ttattttagc tgatgtaaac 660

  cattatcgtg taaatgaatt acaagctgca gatcgtactc ttgaacaaat tgtacgttat 720

  tatatttctc aagcacaaaa acaaaattgt ttaaacatta ctaaaacagc caaaccatct 780

  gtaaatatta ttggtatttt tactttgggt tttcataatc aacatgattg tcgtgaatta 840

  aaacgtttat ttaatgattt aggtattcaa atcaatgaaa tcatacctga aggcggaaat 900

  gtacacaact taaaaaaatt accccaagct tggtttaatt ttgtgcccta ccgtgaaatt 960

  ggcttaatga ctgctatgta tttaaaatcc gagtttaata tgccttacgt cgcaattact 1020

  cctatgggat taattgatac ggctgcttgt attcgttcaa tttgtaaaat cattacaact 1080

  caattattaa atcagacggc tacagtgcag gagccatcaa aatttattta cccgaaggcg 1140

  acgtcattag aacaaaccaa tattctcgaa acctctcaaa aagaaactat tcttaaagac 1200

  aatccagata gcggaaatac cctttctaca actgtagaag aaattgaaac tttatttaat 1260

  aaatatatcg atcaacaaac tcgttttgtt tcccaagcag cctggttttc acgttctatt 1320

  gactgtcaaa atttaacagg taaaaaagcc gtagttttcg gagatgctac acattcagct 1380

  gccatgacaa aattattagc acgtgaaatg ggtattaagg tttcatgcgc tggaacttat 1440

  tgcaaacacg atgcggattg gtttagagag caagttagtg ggttttgtga tcaagtttta 1500

  attaccgatg atcacacaca agtaggggat atgattgcac aattagaacc tgcagccatt 1560

  tttgggacac aaatggaacg tcacgttggt aaacgtttag atattccatg tggtgttata 1620

  tctgctcctg tgcatattca aaactttccg ttaggttatc gacctttttt aggttatgaa 1680

  ggtacaaatc aaatagctga tttagtgtat aattcattta atcttggaat ggaagaccat 1740

  ttattacaaa tttttggagg tcatgattca gaaaacaatt cgtcaattgc aacgcatttg 1800

  aatacaaata acgcaataaa tttagcgcca ggatatttac ctgagggaga aggcagtagt 1860

  agaacttcaa atgtagtgtc tacaatttct agtgaaaaaa aagccattgt atggtctcca 1920

  gaaggtttag cagaattaaa taaagtccca ggatttgttc gaggaaaagt taaacgtaat 1980

  acggaaaaat atgctttaca aaaaaattgt tcgatgatta ctgtagaagt tatgtatgca 2040

  gcaaaagaag ctttgtcggc ttaa 2064

  <210> 30

  <211> 687

  <212> PRT

  <213> 莱茵衣藻

  <400> 30

  Met Lys Leu Ala Tyr Trp Met Tyr Ala Gly Pro Ala His Ile Gly Val

  1 5 1015

  Leu Arg Val Ser Ser Ser Phe Lys Asn Val His Ala Ile Met His Ala

  202530

  Pro Leu Gly Asp Asp Tyr Phe Asn Val Met Arg Ser Met Leu Glu Arg

  354045

  Glu Arg Asp Phe Thr Pro Val Thr Ala Ser Ile Val Asp Arg His Val

  505560

  Leu Ala Arg Gly Ser Gln Glu Lys Val Val Glu Asn Ile Thr Arg Lys

  65707580

  Asn Lys Glu Glu Thr Pro Asp Leu Ile Leu Leu Thr Pro Thr Cys Thr

  859095

  Ser Ser Ile Leu Gln Glu Asp Leu His Asn Phe Val Glu Ser Ala Leu

  100 105 110

  Ala Lys Pro Val Gln Ile Asp Glu His Ala Asp His Lys Val Thr Gln

  115 120 125

  Gln Ser Ala Leu Ser Ser Val Ser Pro Leu Leu Pro Leu Glu Glu Asn

  130 135 140

  Thr Leu Ile Val Ser Glu Leu Asp Lys Lys Leu Ser Pro Ser Ser Lys

  145 150 155 160

  Leu His Ile Asn Met Pro Asn Ile Cys Ile Pro Glu Gly Glu Gly Glu

  165 170 175

  Gly Glu Gln Thr Lys Asn Ser Ile Phe Val Lys Ser Ala Thr Leu Thr

  180 185 190

  Asn Leu Ser Glu Glu Glu Leu Leu Asn Gln Glu His His Thr Lys Thr

  195 200 205

  Arg Asn His Ser Asp Val Ile Leu Ala Asp Val Asn His Tyr Arg Val

  210 215 220

  Asn Glu Leu Gln Ala Ala Asp Arg Thr Leu Glu Gln Ile Val Arg Tyr

  225 230 235 240

  Tyr Ile Ser Gln Ala Gln Lys Gln Asn Cys Leu Asn Ile Thr Lys Thr

  245 250 255

  Ala Lys Pro Ser Val Asn Ile Ile Gly Ile Phe Thr Leu Gly Phe His

  260 265 270

  Asn Gln His Asp Cys Arg Glu Leu Lys Arg Leu Phe Asn Asp Leu Gly

  275 280 285

  Ile Gln Ile Asn Glu Ile Ile Pro Glu Gly Gly Asn Val His Asn Leu

  290 295 300

  Lys Lys Leu Pro Gln Ala Trp Phe Asn Phe Val Pro Tyr Arg Glu Ile

  305 310 315 320

  Gly Leu Met Thr Ala Met Tyr Leu Lys Ser Glu Phe Asn Met Pro Tyr

  325 330 335

  Val Ala Ile Thr Pro Met Gly Leu Ile Asp Thr Ala Ala Cys Ile Arg

  340 345 350

  Ser Ile Cys Lys Ile Ile Thr Thr Gln Leu Leu Asn Gln Thr Ala Thr

  355 360 365

  Val Gln Glu Pro Ser Lys Phe Ile Tyr Pro Lys Ala Thr Ser Leu Glu

  370 375 380

  Gln Thr Asn Ile Leu Glu Thr Ser Gln Lys Glu Thr Ile Leu Lys Asp

  385 390 395 400

  Asn Pro Asp Ser Gly Asn Thr Leu Ser Thr Thr Val Glu Glu Ile Glu

  405 410 415

  Thr Leu Phe Asn Lys Tyr Ile Asp Gln Gln Thr Arg Phe Val Ser Gln

  420 425 430

  Ala Ala Trp Phe Ser Arg Ser Ile Asp Cys Gln Asn Leu Thr Gly Lys

  435 440 445

  Lys Ala Val Val Phe Gly Asp Ala Thr His Ser Ala Ala Met Thr Lys

  450 455 460

  Leu Leu Ala Arg Glu Met Gly Ile Lys Val Ser Cys Ala Gly Thr Tyr

  465 470 475 480

  Cys Lys His Asp Ala Asp Trp Phe Arg Glu Gln Val Ser Gly Phe Cys

  485 490 495

  Asp Gln Val Leu Ile Thr Asp Asp His Thr Gln Val Gly Asp Met Ile

  500 505 510

  Ala Gln Leu Glu Pro Ala Ala Ile Phe Gly Thr Gln Met Glu Arg His

  515 520 525

  Val Gly Lys Arg Leu Asp Ile Pro Cys Gly Val Ile Ser Ala Pro Val

  530 535 540

  His Ile Gln Asn Phe Pro Leu Gly Tyr Arg Pro Phe Leu Gly Tyr Glu

  545 550 555 560

  Gly Thr Asn Gln Ile Ala Asp Leu Val Tyr Asn Ser Phe Asn Leu Gly

  565 570 575

  Met Glu Asp His Leu Leu Gln Ile Phe Gly Gly His Asp Ser Glu Asn

  580 585 590

  Asn Ser Ser Ile Ala Thr His Leu Asn Thr Asn Asn Ala Ile Asn Leu

  595 600 605

  Ala Pro Gly Tyr Leu Pro Glu Gly Glu Gly Ser Ser Arg Thr Ser Asn

  610 615 620

  Val Val Ser Thr Ile Ser Ser Glu Lys Lys Ala Ile Val Trp Ser Pro

  625 630 635 640

  Glu Gly Leu Ala Glu Leu Asn Lys Val Pro Gly Phe Val Arg Gly Lys

  645 650 655

  Val Lys Arg Asn Thr Glu Lys Tyr Ala Leu Gln Lys Asn Cys Ser Met

  660 665 670

  Ile Thr Val Glu Val Met Tyr Ala Ala Lys Glu Ala Leu Ser Ala

  675 680 685

  <210> 31

  <211> 882

  <212> DNA

  <213> 莱茵衣藻

  <400> 31

  atgaaattag ctgtttacgg aaaaggtggt attggaaaat caacgacaag ttgtaatatt 60

  tcgattgctt tacgaaaacg tggtaaaaaa gtgttacaaa ttggttgtga tcctaaacat 120

  gatagtactt ttacattgac agggttttta attccaacca ttattgatac attaagttct 180

  aaagattatc attatgaaga tatttggccc gaagatgtta tttacggagg ttatgggggt 240

  gtagattgtg ttgaagctgg aggaccacct gccggtgcgg ggtgtggtgg ttatgttgta 300

  ggtgaaacgg taaaactttt aaaagagtta aatgcttttt tcgaatacga tgttatttta 360

  tttgatgttt taggtgatgt tgtttgtggt ggctttgctg ctccattaaa ctacgctgat 420

  tattgtatta ttgtaactga taatggtttt gatgctttat ttgctgcaaa tcgtattgca 480

  gcttcagttc gtgaaaaagc acgtacacat ccattgcgtt tagcgggttt aatcggaaat 540

  cgtacatcaa aacgtgattt aattgataaa tatgtagaag cttgtcctat gccagtatta 600

  gaagttttac cattaattga agaaattcgt atttcacgtg ttaaaggcaa aactttattt 660

  gaaatgtcaa ataaaaataa tatgacttcg gctcatatgg atggctctaa aggtgacaat 720

  tctacagtag gagtgtcaga aactccatcg gaagattata tttgtaattt ttatttaaat 780

  attgctgatc aattattaac agaaccagaa ggagttattc cacgtgaatt agcagataaa 840

  gaacttttta ctcttttatc agatttctat cttaaaattt aa 882

  <210> 32

  <211> 293

  <212> PRT

  <213> 莱茵衣藻

  <400> 32

  Met Lys Leu Ala Val Tyr Gly Lys Gly Gly Ile Gly Lys Ser Thr Thr

  1 5 1015

  Ser Cys Asn Ile Ser Ile Ala Leu Arg Lys Arg Gly Lys Lys Val Leu

  202530

  Gln Ile Gly Cys Asp Pro Lys His Asp Ser Thr Phe Thr Leu Thr Gly

  354045

  Phe Leu Ile Pro Thr Ile Ile Asp Thr Leu Ser Ser Lys Asp Tyr His

  505560

  Tyr Glu Asp Ile Trp Pro Glu Asp Val Ile Tyr Gly Gly Tyr Gly Gly

  65707580

  Val Asp Cys Val Glu Ala Gly Gly Pro Pro Ala Gly Ala Gly Cys Gly

  859095

  Gly Tyr Val Val Gly Glu Thr Val Lys Leu Leu Lys Glu Leu Asn Ala

  100 105 110

  Phe Phe Glu Tyr Asp Val Ile Leu Phe Asp Val Leu Gly Asp Val Val

  115 120 125

  Cys Gly Gly Phe Ala Ala Pro Leu Asn Tyr Ala Asp Tyr Cys Ile Ile

  130 135 140

  Val Thr Asp Asn Gly Phe Asp Ala Leu Phe Ala Ala Asn Arg Ile Ala

  145 150 155 160

  Ala Ser Val Arg Glu Lys Ala Arg Thr His Pro Leu Arg Leu Ala Gly

  165 170 175

  Leu Ile Gly Asn Arg Thr Ser Lys Arg Asp Leu Ile Asp Lys Tyr Val

  180 185 190

  Glu Ala Cys Pro Met Pro Val Leu Glu Val Leu Pro Leu Ile Glu Glu

  195 200 205

  Ile Arg Ile Ser Arg Val Lys Gly Lys Thr Leu Phe Glu Met Ser Asn

  210 215 220

  Lys Asn Asn Met Thr Ser Ala His Met Asp Gly Ser Lys Gly Asp Asn

  225 230 235 240

  Ser Thr Val Gly Val Ser Glu Thr Pro Ser Glu Asp Tyr Ile Cys Asn

  245 250 255

  Phe Tyr Leu Asn Ile Ala Asp Gln Leu Leu Thr Glu Pro Glu Gly Val

  260 265 270

  Ile Pro Arg Glu Leu Ala Asp Lys Glu Leu Phe Thr Leu Leu Ser Asp

  275 280 285

  Phe Tyr Leu Lys Ile

  290

  <210> 33

  <211> 1410

  <212> DNA

  <213> 莱茵衣藻

  <400> 33

  atgttagatg gtgccacaac gattttaaat ttaaatagtt tttttgaatg tgaaactggc 60

  aattatcata ctttttgccc gattagctgt gtagcttggt tatatcaaaa aatcgaagat 120

  agcttttttt tagtaattgg gacaaaaaca tgtggttatt ttttacaaaa tgcccttgga 180

  gttatgattt ttgccgaacc taggtatgct atggcagaat tagaagaaag tgatatttca 240

  gcacaattaa acgattataa agaattaaaa cgtttatgtt tacaaattaa acaagataga 300

  aatcccagcg ttattgtttg gattggaact tgtacaactg aaattatcaa aatggattta 360

  gaagggatgg ctccacgttt agaaactgaa atcggcatac ccattgttgt agcacgtgct 420

  aatggtttag attatgcttt tacacaaggt gaagacacag ttttatcagc aatggcctta 480

  gcatccttaa aaaaagatgt tcctttttta gtaggtaata ctgggttaac aaacaaccag 540

  cttctccttg aaaaatcaac ttcttcagtt aatgggacag acggaaagga attacttaaa 600

  aaatctcttg tattatttgg ttccgtacca agtacagtta ctacacaatt aactttagaa 660

  ttaaaaaaag aaggtattaa tgtatctgga tggcttccat ctgctaatta taaagattta 720

  cctactttta ataaagatac acttgtatgt ggtataaatc cttttttaag tcgaacagct 780

  accacgttaa tgcgtcgtag taagtgcaca ttaatttgtg caccctttcc aataggcccc 840

  gatggcacaa gagtttggat tgaaaaaatt tgtggtgctt ttggcattaa tcctagtctt 900

  aatccaatta ctggtaatac taatttatat gatcgtgaac aaaaaatttt caacgggcta 960

  gaagattatt taaaattatt acgtggaaaa tctgtatttt ttatgggtga taatttatta 1020

  gaaatttctt tagcacgttt tttaacacgt tgtggtatga ttgtttatga aatcggaatt 1080

  ccatatttag ataaacgatt tcaagcagca gaattagctt tattagaaca aacttgtaaa 1140

  gaaatgaatg taccaatgcc gcgcattgta gaaaaaccag ataattatta tcaaattcga 1200

  cgtatacgtg aattaaaacc tgatttaacg attactggaa tggcacatgc aaatccatta 1260

  gaagctcgag gtattacaac aaaatggtca gttgaattta cttttgctca aattcatgga 1320

  tttactaata cacgtgaaat tttagaatta gtaacacagc ctcttagacg caatctaatg 1380

  tcaaatcaat ctgtaaatgc tatttcttaa 1410

  <210> 34

  <211> 469

  <212> PRT

  <213> 莱茵衣藻

  <400> 34

  Met Leu Asp Gly Ala Thr Thr Ile Leu Asn Leu Asn Ser Phe Phe Glu

  1 5 1015

  Cys Glu Thr Gly Asn Tyr His Thr Phe Cys Pro Ile Ser Cys Val Ala

  202530

  Trp Leu Tyr Gln Lys Ile Glu Asp Ser Phe Phe Leu Val Ile Gly Thr

  354045

  Lys Thr Cys Gly Tyr Phe Leu Gln Asn Ala Leu Gly Val Met Ile Phe

  505560

  Ala Glu Pro Arg Tyr Ala Met Ala Glu Leu Glu Glu Ser Asp Ile Ser

  65707580

  Ala Gln Leu Asn Asp Tyr Lys Glu Leu Lys Arg Leu Cys Leu Gln Ile

  859095

  Lys Gln Asp Arg Asn Pro Ser Val Ile Val Trp Ile Gly Thr Cys Thr

  100 105 110

  Thr Glu Ile Ile Lys Met Asp Leu Glu Gly Met Ala Pro Arg Leu Glu

  115 120 125

  Thr Glu Ile Gly Ile Pro Ile Val Val Ala Arg Ala Asn Gly Leu Asp

  130 135 140

  Tyr Ala Phe Thr Gln Gly Glu Asp Thr Val Leu Ser Ala Met Ala Leu

  145 150 155 160

  Ala Ser Leu Lys Lys Asp Val Pro Phe Leu Val Gly Asn Thr Gly Leu

  165 170 175

  Thr Asn Asn Gln Leu Leu Leu Glu Lys Ser Thr Ser Ser Val Asn Gly

  180 185 190

  Thr Asp Gly Lys Glu Leu Leu Lys Lys Ser Leu Val Leu Phe Gly Ser

  195 200 205

  Val Pro Ser Thr Val Thr Thr Gln Leu Thr Leu Glu Leu Lys Lys Glu

  210 215 220

  Gly Ile Asn Val Ser Gly Trp Leu Pro Ser Ala Asn Tyr Lys Asp Leu

  225 230 235 240

  Pro Thr Phe Asn Lys Asp Thr Leu Val Cys Gly Ile Asn Pro Phe Leu

  245 250 255

  Ser Arg Thr Ala Thr Thr Leu Met Arg Arg Ser Lys Cys Thr Leu Ile

  260 265 270

  Cys Ala Pro Phe Pro Ile Gly Pro Asp Gly Thr Arg Val Trp Ile Glu

  275 280 285

  Lys Ile Cys Gly Ala Phe Gly Ile Asn Pro Ser Leu Asn Pro Ile Thr

  290 295 300

  Gly Asn Thr Asn Leu Tyr Asp Arg Glu Gln Lys Ile Phe Asn Gly Leu

  305 310 315 320

  Glu Asp Tyr Leu Lys Leu Leu Arg Gly Lys Ser Val Phe Phe Met Gly

  325 330 335

  Asp Asn Leu Leu Glu Ile Ser Leu Ala Arg Phe Leu Thr Arg Cys Gly

  340 345 350

  Met Ile Val Tyr Glu Ile Gly Ile Pro Tyr Leu Asp Lys Arg Phe Gln

  355 360 365

  Ala Ala Glu Leu Ala Leu Leu Glu Gln Thr Cys Lys Glu Met Asn Val

  370 375 380

  Pro Met Pro Arg Ile Val Glu Lys Pro Asp Asn Tyr Tyr Gln Ile Arg

  385 390 395 400

  Arg Ile Arg Glu Leu Lys Pro Asp Leu Thr Ile Thr Gly Met Ala His

  405 410 415

  Ala Asn Pro Leu Glu Ala Arg Gly Ile Thr Thr Lys Trp Ser Val Glu

  420 425 430

  Phe Thr Phe Ala Gln Ile His Gly Phe Thr Asn Thr Arg Glu Ile Leu

  435 440 445

  Glu Leu Val Thr Gln Pro Leu Arg Arg Asn Leu Met Ser Asn Gln Ser

  450 455 460

  Val Asn Ala Ile Ser

  465

  <210> 35

  <211> 1050

  <212> DNA

  <213> 莱茵衣藻

  <400> 35

  atgcagcagt gcgttggccg ctccgtccgc gctccgtcca gcagggcggt cgcgcccaag 60

  gtcgctggcg ctcgtgtcag ccgccgcgtg tgccgcgtct atgcctccgc tgttgctacc 120

  aagacggtga agattggcac gcgcggctcg cccctggctc tggcccaggc ttacatgact 180

  cgcgacctgc tgaagaagag cttccctgag ctgagcgagg agggtgctct ggagatcgtg 240

  atcatcaaga ccaccggtga caaaatcctg aaccagcccc tggctgacat cggtggcaag 300

  ggtctgttta ccaaggagat cgatgatgct ctgctgagcg gcaagattga catcgccgtg 360

  cactccatga aggacgtgcc cacctacctg cccgagggca ccatcctgcc ctgcaacctg 420

  ccccgcgagg atgtgcgcga tgtgttcatc tcgcctgtcg ccaaggacct gagcgagctg 480

  cccgccggcg ccattgtggg ctcggcctcg ctgcgccgtc aggcccagat cctggccaag 540

  tacccccacc tcaaggtgga gaacttccgc ggcaacgtgc agacccgcct gcgcaagctg 600

  aacgagggcg cctgctccgc caccctgctg gctctggccg gtctgaagcg cctggacatg 660

  actgagcaca tcaccaagac cctcagcatt gacgagatgc tgcccgccgt gagccagggc 720

  gccattggca ttgcctgccg caccgacgac ggcgccagcc gcaacctgct ggccgccctg 780

  aaccacgagg agacccgcat cgccgtggtg tgcgagcgcg ccttcctgac cgccctggac 840

  ggctcttgcc gcacccccat tgccggctac gcgcacaagg gcgccgacgg catgctgcac 900

  ttcagcggcc tggtggccac cccggacggc aagcagatca tgcgcgctag ccgcgtggtg 960

  cccttcacgg aggcggatgc cgtcaagtgc ggcgaggagg ccggcaagga gctcaaggcc 1020

  aacggcccca aggagctgtt catgtactaa 1050

  <210> 36

  <211> 349

  <212> PRT

  <213> 莱茵衣藻

  <400> 36

  Met Gln Gln Cys Val Gly Arg Ser Val Arg Ala Pro Ser Ser Arg Ala

  1 5 1015

  Val Ala Pro Lys Val Ala Gly Ala Arg Val Ser Arg Arg Val Cys Arg

  202530

  Val Tyr Ala Ser Ala Val Ala Thr Lys Thr Val Lys Ile Gly Thr Arg

  354045

  Gly Ser Pro Leu Ala Leu Ala Gln Ala Tyr Met Thr Arg Asp Leu Leu

  505560

  Lys Lys Ser Phe Pro Glu Leu Ser Glu Glu Gly Ala Leu Glu Ile Val

  65707580

  Ile Ile Lys Thr Thr Gly Asp Lys Ile Leu Asn Gln Pro Leu Ala Asp

  859095

  Ile Gly Gly Lys Gly Leu Phe Thr Lys Glu Ile Asp Asp Ala Leu Leu

  100 105 110

  Ser Gly Lys Ile Asp Ile Ala Val His Ser Met Lys Asp Val Pro Thr

  115 120 125

  Tyr Leu Pro Glu Gly Thr Ile Leu Pro Cys Asn Leu Pro Arg Glu Asp

  130 135 140

  Val Arg Asp Val Phe Ile Ser Pro Val Ala Lys Asp Leu Ser Glu Leu

  145 150 155 160

  Pro Ala Gly Ala Ile Val Gly Ser Ala Ser Leu Arg Arg Gln Ala Gln

  165 170 175

  Ile Leu Ala Lys Tyr Pro His Leu Lys Val Glu Asn Phe Arg Gly Asn

  180 185 190

  Val Gln Thr Arg Leu Arg Lys Leu Asn Glu Gly Ala Cys Ser Ala Thr

  195 200 205

  Leu Leu Ala Leu Ala Gly Leu Lys Arg Leu Asp Met Thr Glu His Ile

  210 215 220

  Thr Lys Thr Leu Ser Ile Asp Glu Met Leu Pro Ala Val Ser Gln Gly

  225 230 235 240

  Ala Ile Gly Ile Ala Cys Arg Thr Asp Asp Gly Ala Ser Arg Asn Leu

  245 250 255

  Leu Ala Ala Leu Asn His Glu Glu Thr Arg Ile Ala Val Val Cys Glu

  260 265 270

  Arg Ala Phe Leu Thr Ala Leu Asp Gly Ser Cys Arg Thr Pro Ile Ala

  275 280 285

  Gly Tyr Ala His Lys Gly Ala Asp Gly Met Leu His Phe Ser Gly Leu

  290 295 300

  Val Ala Thr Pro Asp Gly Lys Gln Ile Met Arg Ala Ser Arg Val Val

  305 310 315 320

  Pro Phe Thr Glu Ala Asp Ala Val Lys Cys Gly Glu Glu Ala Gly Lys

  325 330 335

  Glu Leu Lys Ala Asn Gly Pro Lys Glu Leu Phe Met Tyr

  340 345

  <210> 37

  <211> 1143

  <212> DNA

  <213> 莱茵衣藻

  <400> 37

  atgcgatcgt atctgctcaa ggctcaagtg gcctcatgtc agttttcgcg cacgtcgaag 60

  gtctggagac tggcgccggg ttctgacaga cgacggtgtc ggggcctcac tcggacaccg 120

  cactgcgcgg cccccaccag cgagcccgcc ccgccatcca gcagcggcaa gagcgggcaa 180

  cgaccactcg tgatagccac gcggccatct aagcttgcaa aggagcagac gcggcaggtg 240

  cagcagctgc tgctggcggc ggcgcagctc aaggacgagc agctgcagct gagcaccctg 300

  gaactggcgt ctaggggcga cacgactcag ggtgtgtcgc tgcgcagtct gggctcgggc 360

  gcattcaccg aggagctgga ccaggctgtg ctgtcgggcg ctgccgacat gtcggtgcac 420

  agcctgaagg actgccccgc cgccctggcg cccgggctgc tgctggccgc ctgcctgccg 480

  cgggccgacc cccgggacgt cctcatcgcg cccgaggcca cctcgctggg cgagctggtg 540

  ccgggcagcc gtgtgggcac cagcagcagc cgccgcgcgg cgcagatcaa gcactccttc 600

  ccccacctgc aggttgtgca gctgcgcggc aatgtggact cgcggctggg gcgcatccgc 660

  agccgcgaca tcggcgccac agtgctggcg gcggcgggcc tcaagcggct gggtgtgatg 720

  aactcggacg agggtgacac taccgctacg ggcgccgtgg gggtggtgtg cagggcagac 780

  gatgagtggg tggtcggcct gctggacgcc atctcgcacc gcggcacggc cctggaggtg 840

  gcggcggagc gggcgtgcct ggcagcgctg ctgggcggcg gcggcgcgtg ccagcgttca 900

  gcgttcccgg acattgcgtg ggcctgccac acgcggcacg accccgacag caacacaatg 960

  gacctggatt gcctggtggc ggacctggag ggcaaggagc tcttcaggta cacggagttc 1020

  taccggccgg tcattgacga ggtggacgcg gtgtcgctgg ggtcgctgta cggcagcctg 1080

  ctgcgcatga tggcgccacc aggcgcggcc ccctgttggc agctaccttc ctcgcggcat 1140

  tag 1143

  <210> 38

  <211> 380

  <212> PRT

  <213> 莱茵衣藻

  <400> 38

  Met Arg Ser Tyr Leu Leu Lys Ala Gln Val Ala Ser Cys Gln Phe Ser

  1 5 1015

  Arg Thr Ser Lys Val Trp Arg Leu Ala Pro Gly Ser Asp Arg Arg Arg

  202530

  Cys Arg Gly Leu Thr Arg Thr Pro His Cys Ala Ala Pro Thr Ser Glu

  354045

  Pro Ala Pro Pro Ser Ser Ser Gly Lys Ser Gly Gln Arg Pro Leu Val

  505560

  Ile Ala Thr Arg Pro Ser Lys Leu Ala Lys Glu Gln Thr Arg Gln Val

  65707580

  Gln Gln Leu Leu Leu Ala Ala Ala Gln Leu Lys Asp Glu Gln Leu Gln

  859095

  Leu Ser Thr Leu Glu Leu Ala Ser Arg Gly Asp Thr Thr Gln Gly Val

  100 105 110

  Ser Leu Arg Ser Leu Gly Ser Gly Ala Phe Thr Glu Glu Leu Asp Gln

  115 120 125

  Ala Val Leu Ser Gly Ala Ala Asp Met Ser Val His Ser Leu Lys Asp

  130 135 140

  Cys Pro Ala Ala Leu Ala Pro Gly Leu Leu Leu Ala Ala Cys Leu Pro

  145 150 155 160

  Arg Ala Asp Pro Arg Asp Val Leu Ile Ala Pro Glu Ala Thr Ser Leu

  165 170 175

  Gly Glu Leu Val Pro Gly Ser Arg Val Gly Thr Ser Ser Ser Arg Arg

  180 185 190

  Ala Ala Gln Ile Lys His Ser Phe Pro His Leu Gln Val Val Gln Leu

  195 200 205

  Arg Gly Asn Val Asp Ser Arg Leu Gly Arg Ile Arg Ser Arg Asp Ile

  210 215 220

  Gly Ala Thr Val Leu Ala Ala Ala Gly Leu Lys Arg Leu Gly Val Met

  225 230 235 240

  Asn Ser Asp Glu Gly Asp Thr Thr Ala Thr Gly Ala Val Gly Val Val

  245 250 255

  Cys Arg Ala Asp Asp Glu Trp Val Val Gly Leu Leu Asp Ala Ile Ser

  260 265 270

  His Arg Gly Thr Ala Leu Glu Val Ala Ala Glu Arg Ala Cys Leu Ala

  275 280 285

  Ala Leu Leu Gly Gly Gly Gly Ala Cys Gln Arg Ser Ala Phe Pro Asp

  290 295 300

  Ile Ala Trp Ala Cys His Thr Arg His Asp Pro Asp Ser Asn Thr Met

  305 310 315 320

  Asp Leu Asp Cys Leu Val Ala Asp Leu Glu Gly Lys Glu Leu Phe Arg

  325 330 335

  Tyr Thr Glu Phe Tyr Arg Pro Val Ile Asp Glu Val Asp Ala Val Ser

  340 345 350

  Leu Gly Ser Leu Tyr Gly Ser Leu Leu Arg Met Met Ala Pro Pro Gly

  355 360 365

  Ala Ala Pro Cys Trp Gln Leu Pro Ser Ser Arg His

  370 375 380

  <210> 39

  <211> 1692

  <212> DNA

  <213> 莱茵衣藻

  <400> 39

  atgatgttga cccagactcc tgggaccgcc acggcttcta gccggcggtc gcagatccgc 60

  tcggctgcgc acgtctccgc caaggtcgcg cctcggccca cgccattctc ggtcgcgagc 120

  cccgcgaccg ctgcgagccc cgcgaccgcg gcggcccgcc gcacactcca ccgcactgct 180

  gcggcggcca ctggtgctcc cacggcgtcc ggagccggcg tcgccaagac gctcgacaat 240

  gtgtatgacg tgatcgtggt cggtggaggt ctctcgggcc tggtgaccgg ccaggccctg 300

  gcggctcagc acaaaattca gaacttcctt gttacggagg ctcgcgagcg cgtcggcggc 360

  aacattacgt ccatgtcggg cgatggctac gtgtgggagg agggcccgaa cagcttccag 420

  cccaacgata gcatgctgca gattgcggtg gactctggct gcgagaagga ccttgtgttc 480

  ggtgacccca cggctccccg cttcgtgtgg tgggagggca agctgcgccc cgtgccctcg 540

  ggcctggacg ccttcacctt cgacctcatg tccatccccg gcaagatccg cgccgggctg 600

  ggcgccatcg gcctcatcaa cggagccatg ccctccttcg aggagagtgt ggagcagttc 660

  atccgccgca acctgggcga tgaggtgttc ttccgcctga tcgagccctt ctgctccggc 720

  gtgtacgcgg gcgacccctc caagctgtcc atgaaggcgg ccttcaacag gatctggatt 780

  ctggagaaga acggcggcag cctggtggga ggtgccatca agctgttcca ggaacgccag 840

  tccaacccgg ccccgccgcg ggacccgcgc ctgccgccca agcccaaggg ccagacggtg 900

  ggctcgttcc gcaagggcct gaagatgctg ccggacgcca ttgagcgcaa catccccgac 960

  aagatccgcg tgaactggaa gctggtgtct ctgggccgcg aggcggacgg gcggtacggg 1020

  ctggtgtacg acacgcccga gggccgtgtc aaggtgtttg cccgcgccgt ggctctgacc 1080

  gcgcccagct acgtggtggc ggacctggtc aaggagcagg cgcccgccgc cgccgaggcc 1140

  ctgggctcct tcgactaccc gccggtgggc gccgtgacgc tgtcgtaccc gctgagcgcc 1200

  gtgcgggagg agcgcaaggc ctcggacggg tccgtgccgg gcttcggtca gctgcacccg 1260

  cgcacgcagg gcatcaccac tctgggcacc atctacagct ccagcctgtt ccccggccgc 1320

  gcgcccgagg gccacatgct gctgctcaac tacatcggcg gcaccaccaa ccgcggcatc 1380

  gtcaaccaga ccaccgagca gctggtggag caggtggaca aggacctgcg caacatggtc 1440

  atcaagcccg acgcgcccaa gccccgtgtg gtgggcgtgc gcgtgtggcc gcgcgccatc 1500

  ccgcagttca acctgggcca cctggagcag ctggacaagg cgcgcaaggc gctggacgcg 1560

  gcggggctgc agggcgtgca cctggggggc aactacgtca gcggtgtggc cctgggcaag 1620

  gtggtggagc acggctacga gtccgcagcc aacctggcca agagcgtgtc caaggccgca 1680

  gtcaaggcct aa 1692

  <210> 40

  <211> 563

  <212> PRT

  <213> 莱茵衣藻

  <400> 40

  Met Met Leu Thr Gln Thr Pro Gly Thr Ala Thr Ala Ser Ser Arg Arg

  1 5 1015

  Ser Gln Ile Arg Ser Ala Ala His Val Ser Ala Lys Val Ala Pro Arg

  202530

  Pro Thr Pro Phe Ser Val Ala Ser Pro Ala Thr Ala Ala Ser Pro Ala

  354045

  Thr Ala Ala Ala Arg Arg Thr Leu His Arg Thr Ala Ala Ala Ala Thr

  505560

  Gly Ala Pro Thr Ala Ser Gly Ala Gly Val Ala Lys Thr Leu Asp Asn

  65707580

  Val Tyr Asp Val Ile Val Val Gly Gly Gly Leu Ser Gly Leu Val Thr

  859095

  Gly Gln Ala Leu Ala Ala Gln His Lys Ile Gln Asn Phe Leu Val Thr

  100 105 110

  Glu Ala Arg Glu Arg Val Gly Gly Asn Ile Thr Ser Met Ser Gly Asp

  115 120 125

  Gly Tyr Val Trp Glu Glu Gly Pro Asn Ser Phe Gln Pro Asn Asp Ser

  130 135 140

  Met Leu Gln Ile Ala Val Asp Ser Gly Cys Glu Lys Asp Leu Val Phe

  145 150 155 160

  Gly Asp Pro Thr Ala Pro Arg Phe Val Trp Trp Glu Gly Lys Leu Arg

  165 170 175

  Pro Val Pro Ser Gly Leu Asp Ala Phe Thr Phe Asp Leu Met Ser Ile

  180 185 190

  Pro Gly Lys Ile Arg Ala Gly Leu Gly Ala Ile Gly Leu Ile Asn Gly

  195 200 205

  Ala Met Pro Ser Phe Glu Glu Ser Val Glu Gln Phe Ile Arg Arg Asn

  210 215 220

  Leu Gly Asp Glu Val Phe Phe Arg Leu Ile Glu Pro Phe Cys Ser Gly

  225 230 235 240

  Val Tyr Ala Gly Asp Pro Ser Lys Leu Ser Met Lys Ala Ala Phe Asn

  245 250 255

  Arg Ile Trp Ile Leu Glu Lys Asn Gly Gly Ser Leu Val Gly Gly Ala

  260 265 270

  Ile Lys Leu Phe Gln Glu Arg Gln Ser Asn Pro Ala Pro Pro Arg Asp

  275 280 285

  Pro Arg Leu Pro Pro Lys Pro Lys Gly Gln Thr Val Gly Ser Phe Arg

  290 295 300

  Lys Gly Leu Lys Met Leu Pro Asp Ala Ile Glu Arg Asn Ile Pro Asp

  305 310 315 320

  Lys Ile Arg Val Asn Trp Lys Leu Val Ser Leu Gly Arg Glu Ala Asp

  325 330 335

  Gly Arg Tyr Gly Leu Val Tyr Asp Thr Pro Glu Gly Arg Val Lys Val

  340 345 350

  Phe Ala Arg Ala Val Ala Leu Thr Ala Pro Ser Tyr Val Val Ala Asp

  355 360 365

  Leu Val Lys Glu Gln Ala Pro Ala Ala Ala Glu Ala Leu Gly Ser Phe

  370 375 380

  Asp Tyr Pro Pro Val Gly Ala Val Thr Leu Ser Tyr Pro Leu Ser Ala

  385 390 395 400

  Val Arg Glu Glu Arg Lys Ala Ser Asp Gly Ser Val Pro Gly Phe Gly

  405 410 415

  Gln Leu His Pro Arg Thr Gln Gly Ile Thr Thr Leu Gly Thr Ile Tyr

  420 425 430

  Ser Ser Ser Leu Phe Pro Gly Arg Ala Pro Glu Gly His Met Leu Leu

  435 440 445

  Leu Asn Tyr Ile Gly Gly Thr Thr Asn Arg Gly Ile Val Asn Gln Thr

  450 455 460

  Thr Glu Gln Leu Val Glu Gln Val Asp Lys Asp Leu Arg Asn Met Val

  465 470 475 480

  Ile Lys Pro Asp Ala Pro Lys Pro Arg Val Val Gly Val Arg Val Trp

  485 490 495

  Pro Arg Ala Ile Pro Gln Phe Asn Leu Gly His Leu Glu Gln Leu Asp

  500 505 510

  Lys Ala Arg Lys Ala Leu Asp Ala Ala Gly Leu Gln Gly Val His Leu

  515 520 525

  Gly Gly Asn Tyr Val Ser Gly Val Ala Leu Gly Lys Val Val Glu His

  530 535 540

  Gly Tyr Glu Ser Ala Ala Asn Leu Ala Lys Ser Val Ser Lys Ala Ala

  545 550 555 560

  Val Lys Ala

  <210> 41

  <211> 1173

  <212> DNA

  <213> 莱茵衣藻

  <400> 41

  atgcagacca aggctttcac ctctgcgcgc ccccagcggg ccgctgcgct caaggcgcag 60

  cgcacctcgt cggtgaccgt gcgcgcgacc gcggcccccg ccgtggcctc tgcccccgcc 120

  gcctcgggct ctgcctctga ccccctgatg ctgcgcgcca tccgcggcga caaggtggag 180

  cgcccgcccg tgtggatgat gcgccaggcc ggccgctacc agaaggtgta ccaggacctg 240

  tgcaagaagc accccacgtt ccgtgagcgc tcggagcgcg tggacctggc ggtggagatc 300

  tctctgcagc cgtggcacgc gttcaagccc gacggcgtca tcctgttcag cgacattctg 360

  acccccctgc ccggcatgaa catccccttc gacatggcgc ccggccccat catcatggac 420

  cccatccgca ccatggcgca agtggagaag gtgacgaagc tggacgctga ggccgcctgc 480

  cccttcgtgg gcgagtcgct gcgccagctg cgcacctaca tcggcaacca ggccgcggtc 540

  ctgggcttcg tgggcgcccc cttcaccctg gccacctaca ttgtggaggg cggcagctcc 600

  aagaacttcg cgcacatcaa gaagatggct ttctccaccc ccgagatcct gcacgccctg 660

  ctggacaagc tggctgacaa cgtggccgac tacgtccgct accaggccga cgccggcgcc 720

  caggtggtgc agatcttcga ctcgtgggcc agcgagctgc agccccagga cttcgacgtg 780

  ttctccggcc cctacatcaa gaaggtgatc gacagcgtgc gcaagaccca ccccgacctg 840

  cccatcatcc tctacatcag cggctctggc ggcctgctgg agcgcatggc ctcttgctcg 900

  cccgacatca tctcgctgga ccagtcggtg gacttcaccg acggcgtcaa gcgctgcggc 960

  accaacttcg ccttccaggg caacatggac cccggcgtcc tgttcggctc caaggacttc 1020

  atcgagaagc gcgtcatgga caccatcaag gctgcccgcg acgccgacgt gcgccacgtg 1080

  atgaacctgg gccacggcgt gctgcccggc acccccgagg accacgtggg ccactacttc 1140

  cacgtcgccc gcaccgccca cgagcgcatg taa 1173

  <210> 42

  <211> 390

  <212> PRT

  <213> 莱茵衣藻

  <400> 42

  Met Gln Thr Lys Ala Phe Thr Ser Ala Arg Pro Gln Arg Ala Ala Ala

  1 5 1015

  Leu Lys Ala Gln Arg Thr Ser Ser Val Thr Val Arg Ala Thr Ala Ala

  202530

  Pro Ala Val Ala Ser Ala Pro Ala Ala Ser Gly Ser Ala Ser Asp Pro

  354045

  Leu Met Leu Arg Ala Ile Arg Gly Asp Lys Val Glu Arg Pro Pro Val

  505560

  Trp Met Met Arg Gln Ala Gly Arg Tyr Gln Lys Val Tyr Gln Asp Leu

  65707580

  Cys Lys Lys His Pro Thr Phe Arg Glu Arg Ser Glu Arg Val Asp Leu

  859095

  Ala Val Glu Ile Ser Leu Gln Pro Trp His Ala Phe Lys Pro Asp Gly

  100 105 110

  Val Ile Leu Phe Ser Asp Ile Leu Thr Pro Leu Pro Gly Met Asn Ile

  115 120 125

  Pro Phe Asp Met Ala Pro Gly Pro Ile Ile Met Asp Pro Ile Arg Thr

  130 135 140

  Met Ala Gln Val Glu Lys Val Thr Lys Leu Asp Ala Glu Ala Ala Cys

  145 150 155 160

  Pro Phe Val Gly Glu Ser Leu Arg Gln Leu Arg Thr Tyr Ile Gly Asn

  165 170 175

  Gln Ala Ala Val Leu Gly Phe Val Gly Ala Pro Phe Thr Leu Ala Thr

  180 185 190

  Tyr Ile Val Glu Gly Gly Ser Ser Lys Asn Phe Ala His Ile Lys Lys

  195 200 205

  Met Ala Phe Ser Thr Pro Glu Ile Leu His Ala Leu Leu Asp Lys Leu

  210 215 220

  Ala Asp Asn Val Ala Asp Tyr Val Arg Tyr Gln Ala Asp Ala Gly Ala

  225 230 235 240

  Gln Val Val Gln Ile Phe Asp Ser Trp Ala Ser Glu Leu Gln Pro Gln

  245 250 255

  Asp Phe Asp Val Phe Ser Gly Pro Tyr Ile Lys Lys Val Ile Asp Ser

  260 265 270

  Val Arg Lys Thr His Pro Asp Leu Pro Ile Ile Leu Tyr Ile Ser Gly

  275 280 285

  Ser Gly Gly Leu Leu Glu Arg Met Ala Ser Cys Ser Pro Asp Ile Ile

  290 295 300

  Ser Leu Asp Gln Ser Val Asp Phe Thr Asp Gly Val Lys Arg Cys Gly

  305 310 315 320

  Thr Asn Phe Ala Phe Gln Gly Asn Met Asp Pro Gly Val Leu Phe Gly

  325 330 335

  Ser Lys Asp Phe Ile Glu Lys Arg Val Met Asp Thr Ile Lys Ala Ala

  340 345 350

  Arg Asp Ala Asp Val Arg His Val Met Asn Leu Gly His Gly Val Leu

  355 360 365

  Pro Gly Thr Pro Glu Asp His Val Gly His Tyr Phe His Val Ala Arg

  370 375 380

  Thr Ala His Glu Arg Met

  385 390

  <210> 43

  <211> 288

  <212> DNA

  <213> 莱茵衣藻

  <400> 43

  atgtcggccc tggacgccgc cgccatcccc tacgagctag tgccgggtgt gtcctccgct 60

  ctggccgccc cgctgttcgc cggcgtcccg ctcacacacg tcagcctgag cccctcgttc 120

  accgtggtca gcgggcacga cgtggccggc accgactggg cggcgttccg ggggctgccc 180

  acgctggtgg ttctgatggc gggtcgtaac ctggggcaga tagcccggcg gcttgtgcag 240

  gacgcggggt gggcgcccga tacacctgta agtcaaccta gtggctag 288

  <210> 44

  <211> 95

  <212> PRT

  <213> 莱茵衣藻

  <400> 44

  Met Ser Ala Leu Asp Ala Ala Ala Ile Pro Tyr Glu Leu Val Pro Gly

  1 5 1015

  Val Ser Ser Ala Leu Ala Ala Pro Leu Phe Ala Gly Val Pro Leu Thr

  202530

  His Val Ser Leu Ser Pro Ser Phe Thr Val Val Ser Gly His Asp Val

  354045

  Ala Gly Thr Asp Trp Ala Ala Phe Arg Gly Leu Pro Thr Leu Val Val

  505560

  Leu Met Ala Gly Arg Asn Leu Gly Gln Ile Ala Arg Arg Leu Val Gln

  65707580

  Asp Ala Gly Trp Ala Pro Asp Thr Pro Val Ser Gln Pro Ser Gly

  859095

  <210> 45

  <211> 204

  <212> DNA

  <213> 莱茵衣藻

  <400> 45

  ggcgtcccca caaccaggac agcctacttc ttgaccttat taataagtcg ctgcgtgtcg 60

  cgactgacca ttttggcccg gacttgcgtg cttgtgattt gtgcttcgac tagatccgcg 120

  ggcaccaagg gacgcggaca gctgatagtc aagaactaga tcctctggga gcgtctgggg 180

  ctgtccccgc tgctcgccaa ggaa 204

  <210> 46

  <211> 721

  <212> DNA

  <213> 莱茵衣藻

  <400> 46

  gtgccgagtg actgaggtgg caaggtgcag tggcggcgga ggcagttgtg ctggggtggc 60

  aaggcggaca ggcgaagctg gtgggttgcg acgaggagga ggtgcacgtg cacgcgtaac 120

  ataagaagaa cagtgggagg acaggtagcg tgacttgact gggacgagga gcgtactgat 180

  gtgtggcgtg tgttggtatg tgagcgttac ccctccccta gatagcggcg gtctccactt 240

  tcaggaggat gagagccatc atgaggcttt gagggggcac tggttcgtgt gtaggctgag 300

  gctgctgttg aagtcacaag gcagcactgc atgcgcgagt gagtgtggcc ggatatgcat 360

  cgagttgcag gtacactgaa atgaggtgac tgcggcgtat atcgctgcca gtacaggttg 420

  aagcggcggg cacggtgaat ggagtactcg gcctggaacg cttgcgatca gatggtcgag 480

  ctcaagaaga tttggttgag ccgttgggtc gtgcgtcata ttatggcttg catcttcggg 540

  gagcggcaag aaacggactc caatgcaggc cctcgggcga gaaagattgg gcgtgtccgg 600

  gggtgcattc tcgccgcgtg gggctgcatc gaatttcgct tgagtgcccc ttcccgggga 660

  gggggggcgg tagttcaacc ccatcatcgt aggggggttg taaatgccag cccaaactaa 720

  a 721

  <210> 47

  <211> 187

  <212> DNA

  <213> 莱茵衣藻

  <400> 47

  atgaagtctc tctgccatga gctcgctggc cccagcgtta ctgggtgcgg ccggcgaagc 60

  ctccggaagg ctttcagcgg tgccaagatt gcgcaggtct ctcgccccgc tgtgcttaac 120

  agcgtgcagc gccaacagcg tctcgcctgt tctgccgtgg ccgagctctc cgctgctgag 180

  ctgcgcg 187

  <210> 48

  <211> 281

  <212> DNA

  <213> 莱茵衣藻

  <400> 48

  ccatgaaggt gtctgaggag gactccaagg gcttcgatgc ggatgtgtcg acccgcctgg 60

  cccgctcgta ccctctggcg gccgtggtgg gccaggacaa catcaagcag gcgctgctgc 120

  tgggcgccgt ggacaccggg ctgggcggca tcgccatcgc cggtcgccgc ggtaccgcca 180

  agtccatcat ggctcgcggc ctgcacgctc tgctgccgcc cattgaggtg gtggagggca 240

  gcatctgcaa cgccgacccc gaggaccccc gctcctggga g 281

  <210> 49

  <211> 132

  <212> DNA

  <213> 莱茵衣藻

  <400> 49

  gctggcctgg ctgagaagta tgcgggcggc cctgtgaaga ccaagatgcg ctcggcgccg 60

  tttgtgcaga tccctctggg tgtgactgag gaccgcttgg tgggcactgt ggacattgag 120

  gcgtccatga ag 132

  <210> 50

  <211> 167

  <212> DNA

  <213> 莱茵衣藻

  <400> 50

  gagggcaaga ctgtgttcca gcccggcctg ctggctgagg cgcaccgcgg catcctgtac 60

  gtggacgaga tcaacctgct ggatgacggc attgccaacc tgctgctgtc catcctgtcg 120

  gacggagtca acgtggtgga gcgcgagggc atctccatca gccaccc 167

  <210> 51

  <211> 163

  <212> DNA

  <213> 莱茵衣藻

  <400> 51

  ctgccggccg ctgctgattg ccacctacaa ccccgaggag ggccctctgc gtgagcacct 60

  gctggaccgc atcgccattg gcctcagcgc cgacgtcccc agcaccagcg acgagcgcgt 120

  caaggccatt gacgcagcca tccgcttcca ggacaagccg cag 163

  <210> 52

  <211> 48

  <212> DNA

  <213> 莱茵衣藻

  <400> 52

  gacactattg acgacaccgc ggagctcacc gacgccctgc gcacctcg 48

  <210> 53

  <211> 123

  <212> DNA

  <213> 莱茵衣藻

  <400> 53

  gtcatcctgg ctcgcgagta cctgaaggac gtgaccatcg cgccggagca ggtgacctac 60

  attgtggagg aggcgcgccg cggcggagtc caggggcacc gcgcggagct gtacgcggtc 120

  aag 123

  <210> 54

  <211> 171

  <212> DNA

  <213> 莱茵衣藻

  <400> 54

  tgtgccaagg cgtgtgcggc tctggagggc cgtgagcgtg tgaacaagga tgacctgcgc 60

  caggccgtgc agctggtcat cctgccgcgc gccaccatcc tggaccagcc cccgcccgag 120

  caggagcagc ccccgccgcc gcccccgccc cctcccccgc cgccgccgca g 171

  <210> 55

  <211> 87

  <212> DNA

  <213> 莱茵衣藻

  <400> 55

  gaccaaatgg aggacgagga ccaggaggag aaggaggacg agaaggagga ggaggagaag 60

  gagaacgagg accaggacga gcccgag 87

  <210> 56

  <211> 225

  <212> DNA

  <213> 莱茵衣藻

  <400> 56

  atccctcagg agttcatgtt tgagtccgag ggcgtcatca tggacccctc catcctcatg 60

  ttcgcgcagc agcagcagcg cgcgcagggc cgctccggcc gcgccaagac gctcatcttc 120

  agcgacgacc gcggccgcta catcaagccc atgctgccca agggtgacaa ggtcaagcgc 180

  ctggcagtgg acgccacgct tcgcgccgcc gcgccctacc agaag 225

  <210> 57

  <211> 67

  <212> DNA

  <213> 莱茵衣藻

  <400> 57

  attcgccggc agcaggccat cagcgagggc aaggtgcagc gcaaggtgta cgtggacaag 60

  ccagaca 67

  <210> 58

  <211> 653

  <212> DNA

  <213> 莱茵衣藻

  <400> 58

  tgcgctccaa gaagctggcc cgcaaggccg gtgcgctggt gatttttgtt gtggacgcgt 60

  ccggctccat ggctctgaac cgcatgagcg ccgccaaggg cgcctgcatg cgcctgctgg 120

  ctgagtcgta caccagccgc gaccaggtgt gcctcatccc cttctacggc gacaaggccg 180

  aggtgctgct gccgccctcc aagtccatcg ccatggcccg ccgccgcctg gactcgctgc 240

  cctgcggcgg cggctcgccc cttgcgcacg gcctgtccac ggcggtacgt gtgggcatgc 300

  aggccagcca ggcgggcgag gtgggccgcg tcatgatggt gctcatcacg gacggccgcg 360

  ccaacgtcag cctggccaag tccaacgagg accccgaggc gctcaagccc gacgcgccca 420

  agcccaccgc cgactcgctg aaggacgagg tgcgcgacat ggccaagaag gccgcgtccg 480

  ccggcatcaa cgtgcttgtc attgacacgg agaacaagtt cgtgagcacc ggctttgcgg 540

  aggagatctc caaggcagcg cagggcaagt actactacct gcccaacgcc agcgacgccg 600

  ccatcgcggc ggccgcgtcc ggcgccatgg ccgcggccaa gggcggctac tag 653

  <210> 59

  <211> 379

  <212> DNA

  <213> 莱茵衣藻

  <400> 59

  gtgagcgcct actttgatat gtaccaaaga taccactgat aggtttaggc acggaagatc 60

  tggacttgga ccccgtttgc gcaagccggg cgatgcaccc atttcgcggt cacgccgagc 120

  gctggggtgc aatttagcgt gcccgacaag ctagaaaaca gggaattacc atttgtttaa 180

  ttttgttgcg agagatcttt gcttgtgtcc accggccgcg cgggggaact tccggtgttg 240

  cgcaaggttg cgtgcgtgcc caccatcaac acctgtgcca ggtctgtgtc acccccaggt 300

  tccaccaccc tgcaatcttc caattgtgtc tcgtttgctc gttgtctaat agtcgtcctt 360

  tgctcatccc tacctgcag 379

  <210> 60

  <211> 267

  <212> DNA

  <213> 莱茵衣藻

  <400> 60

  gtgaggcagg gaaggtgaca caggaggttt tgaaagagag acagggaggc aaagatggat 60

  ggcggggcgg gcagtgactt tggggcggca tggagtggga ttggtggagt gggattgggc 120

  accatgtatc acagatgttg gcaacacagc gcagggcctt gctctgtgct tgtgttgacc 180

  gtctagtccc ccgtgccctg aaccaagtct ttcctcctga cacggtcctc catgtcctcc 240

  ttccggcatt cccttcctcg tccacag 267

  <210> 61

  <211> 273

  <212> DNA

  <213> 莱茵衣藻

  <400> 61

  gtgagccagc aagggaggag aggggaacgg ccgggtaggg cagccggagt ttaaccacgc 60

  caattcaacg gggagcaacg gggaagagga agggccggaa gaggacggca aaagcatttg 120

  gtgggggcag cggctgtagt cagaagcgca aaggctgcca cagtgtggcc cgcaccctcc 180

  tcaccaccag tttggcatga tcgtttagca tgggctggaa tactcaccgc cagttctctc 240

  ctctcccctc tcctcccctg tccccgcctg cag 273

  <210> 62

  <211> 166

  <212> DNA

  <213> 莱茵衣藻

  <400> 62

  gtgagtgcgc gcgctgggtg tgtttgtggg acggcgcggc attggagcgc aggtgcgggt 60

  gctgggccgt gcacttgtcc gttggttccc ttggaagctt cgatacacac tcttactgca 120

  cgctctttaa ccgccccccc cctccacctc tgcccgcccc gtgcag 166

  <210> 63

  <211> 275

  <212> DNA

  <213> 莱茵衣藻

  <400> 63

  gtgggtgggg gaaagtgact ggatgtcggt gggttttagg tatgtgcgtg tgtacgatgc 60

  ggggagcagt acggaagcgg gcacgagcgg tgagggggca ggattgtggc gcacgctcgg 120

  gccaagcccg ggctcgcgac agagggtggg cttgtattcg tagtcaagcg catcaggaag 180

  tgcagttgac tggattcacc tgaaacggcg ctgagcgggc ggctaataga atcccgcttc 240

  ctgtccgccc ctccccttgc ccttcaatcc gtcag 275

  <210> 64

  <211> 200

  <212> DNA

  <213> 莱茵衣藻

  <400> 64

  gtgagtggcg ggggccgtgc gtttgtttgt tgcgtgggct ggctggctgg ctttgttgga 60

  tgagggcgct gctcaccact catctctttg aatccccact tatccagttg cctgcatgaa 120

  accccgcctg actcactccc caccatcctg taccgctttt ccaaacatcc ttgcaaccat 180

  cccgccatcc ccacccgcag 200

  <210> 65

  <211> 690

  <212> DNA

  <213> 莱茵衣藻

  <400> 65

  gtgaggagtt ggagggggaa ggggcgaggg gatgcgacag aagcgagggc gaggggagcc 60

  ggggtgggtt gttgcaagtg tcgtgaatta tagaatgacc ccaaaagcgc cggcccaaca 120

  gggcctatta cttgcgagtc aatccaaccc ctgatatagg gagaatgggg tagaggtcgt 180

  atcacgacag caaggatgta cagtgggcct tggggttggg aggtacaggg aaaaaggaga 240

  ggacatgggg ttgggtaagc ggggaataac aaatatacac ccagcgttta tggaagtggg 300

  agatggaaac gggggcggac gaacaggaac aggggccgga tggaggggct atgggggcat 360

  ggtgggtggg ggtacggcgc ggggcagagc agggtcttgg gtgaatgggc aagatgctga 420

  tgcttgggat gaagacacta tgagcaaaga aatggttgtt gacgattgcc atgatcatcg 480

  cagtggggga ggcggggtgg caataccggc agtcaacagt tggggtgcga tcaagattga 540

  ttggagtacc agcagtggcc gggatctggc tgacgtgtct cgagcgagtt gctggggtgg 600

  caaggagatg caggggcaga cgacgttgtg cgaccacact tacacacatt tccttcccct 660

  tgcgtgtgtc cgtgcgccct gtgcctccag 690

  <210> 66

  <211> 123

  <212> DNA

  <213> 莱茵衣藻

  <400> 66

  gtacgtaaac gtatttgatt gctcaggtgg ttagccttgg tgtggctgct gtttgacttg 60

  tgcagctgtc tttgtgtaca tgttccacaa ccctgtactc cccatattcc gcccccattc 120

  cag 123

  <210> 67

  <211> 228

  <212> DNA

  <213> 莱茵衣藻

  <400> 67

  gtgagaggcg gcgcggcggc ttgcgggcga aggcgggggg cggggcggag gcaatgcggc 60

  cgcgcatggc cagcaacgga agggctggct atcaacacgg cgagcgcacg atattcatat 120

  aagagtgcca tcgtgcaatg ctgaatactt gcgccaaccg gatctcgctg ctccgcttcc 180

  accggactgc tttctcatct ctccccttca ccctgtgtgt atccacag 228

  <210> 68

  <211> 146

  <212> DNA

  <213> 莱茵衣藻

  <400> 68

  gtgagtgccc gaggtggtgg gtggtgaatt ggggcacgag ggtatgtggg cctaagggag 60

  ctgaatgggg catgttttct tctgagcatc acggtcagag cttgacctgt cctccccgct 120

  gtacccccgt gcacggtccg acacag 146

  <210> 69

  <211> 168

  <212> DNA

  <213> 莱茵衣藻

  <400> 69

  gtgagtacag cgcatcccgg cgcaatcatt gggcctagtt actgctgcag gactcgtgtg 60

  ctcttaaggg ctggcagctg tcagaagctc tactcctcgc actgaccact gtgcctttct 120

  ctccttcctc tctccctccc cgcacccctc ctcccacttc ctcaacag 168

  <210> 70

  <211> 143

  <212> DNA

  <213> 莱茵衣藻

  <400> 70

  gcagacttcc ataaagctct tgtaacgctg taccaactag taagcggtac aattcgcctg 60

  agcccgagca acgcgacctt tcttgctctg tggatctctg ataatctaac cagaccaaaa 120

  ccttttcact aatctaggca aca 143

  <210> 71

  <211> 381

  <212> DNA

  <213> 莱茵衣藻

  <400> 71

  aaaaggctgg tgtaggcctg tcgggtcgtg ttaaaggttg ctgcgtgaac gtgtaagtgt 60

  gacagtgtgc cggtatgtgt gtgtatacat gtgttgcggt gtgcttttgt ggcggtacat 120

  ggtgatgact gagcgggtgg gacagagcac ggttaactga cgagggcagt ccgtgcgaga 180

  cggacgtttt tgtagccgag gtgcaaggac tgatgacggg ctaagctgct ggagacttgg 240

  agttgagagt gcaggtggat cgacggtttc tctaaggagt atgaataggc aggagggctg 300

  gagacatttg gggtgcaagg aggcggtagt atgggagatg tccatgggcg gattttggcc 360

  tctgtaactt cttaacgccc a 381

  <210> 72

  <211> 252

  <212> DNA

  <213> 莱茵衣藻

  <400> 72

  atgcagagtc tccagggtca gcgcgcgttc actgcggtgc gccagggtcg ggcgggtccc 60

  ctgcggactc gcctggtcgt gcgctcgtct gttgccttgc catccacgaa agccgcgaag 120

  aagccgaact tcccgttcgt caagattcag ggccaggagg agatgaagct tgcactgctg 180

  ctgaacgtgg tcgaccccaa catcggcgga gtgcttatta tgggtgaccg cggcactgcc 240

  aagtcggtcg cg 252

  <210> 73

  <211> 156

  <212> DNA

  <213> 莱茵衣藻

  <400> 73

  gtccgcgccc tggtggatat gcttcccgac attgacgtgg ttgagggcga cgccttcaac 60

  agctccccca ccgaccccaa gttcatgggc cccgacaccc tgcagcgctt ccgcaacggc 120

  gagaagctgc ccaccgtccg catgcggacc cccctg 156

  <210> 74

  <211> 102

  <212> DNA

  <213> 莱茵衣藻

  <400> 74

  gtggagctgc ctctgggcgc caccgaggac cgcatctgcg gcaccatcga catcgagaag 60

  gcgctgacgc agggcatcaa ggcctacgag cccggcctgc tg 102

  <210> 75

  <211> 60

  <212> DNA

  <213> 莱茵衣藻

  <400> 75

  gccaaggcca accgcggcat cctgtatgtg gacgaggtga acctgctgga tgatggcctg 60

  <210> 76

  <211> 111

  <212> DNA

  <213> 莱茵衣藻

  <400> 76

  gttgatgtcg tgctggactc gtcggctagc ggcctgaaca ctgtggagcg tgagggtgtg 60

  tccattgtgc accctgcccg cttcatcatg attggctcag gcaaccccca g 111

  <210> 77

  <211> 101

  <212> DNA

  <213> 莱茵衣藻

  <400> 77

  gagggtgagc tgcgcccgca gctgctggat cgcttcggca tgagcgtcaa cgtggccacg 60

  ctgcaggaca ccaagcagcg cacgcagctg gtgctggacc g 101

  <210> 78

  <211> 127

  <212> DNA

  <213> 莱茵衣藻

  <400> 78

  gcttgcgtac gaggcggacc ctgacgcatt tgtggactcg tgcaaggccg agcagacggc 60

  gctcacggac aagctggagg cggcccgcca gcgcctgcgg tccgtcaaga tcagcgagga 120

  gctgcag 127

  <210> 79

  <211> 158

  <212> DNA

  <213> 莱茵衣藻

  <400> 79

  atcctgatct cggacatttg ctcgcgcctg gatgtggatg gcctgcgcgg tgacattgtg 60

  atcaaccgcg ccgccaaggc gcttgtggcc ttcgagggcc gcaccgaggt gaccacgaat 120

  gacgtggagc gcgtcatctc gggctgcctc aaccaccg 158

  <210> 80

  <211> 211

  <212> DNA

  <213> 莱茵衣藻

  <400> 80

  cctgcgcaag gacccgctgg accccattga caacggcacc aaggtggcca tcctgttcaa 60

  gcgcatgacc gaccccgaga tcatgaagcg cgaggaggag gccaagaaga agcgcgagga 120

  ggcggccgcc aaggccaagg cggagggcaa ggcggaccgc cccacgggcg ccaaggctgg 180

  cgcctgggct ggcttgcccc ctcgtcggta a 211

  <210> 81

  <211> 534

  <212> DNA

  <213> 莱茵衣藻

  <400> 81

  gtaggtaaca caagcaatta tggggcgaag atctaggctc cgctgatccg ggcgggcaat 60

  cggcatcgtc ggtgcaaccg tggggcgtct gtgcaccctt tgctggtgcc aggttgcctg 120

  actcgcctgc attcctgtac cgagccacat tggctgcttt gcagcgtgca tgggacgggt 180

  gtaggataag cgctatgtat gcgatagcgc gggtgcaccg gcttggcatg gcaaggttgc 240

  ggggtgcaca tgcgtgccag cgtcccctca gcatcagagt ctggatctaa gggctcagcg 300

  gcttcctgcg catgtgggtc tttgcgtagt gctacgaagc cttataatta aagctcatgt 360

  attgagtggt ccgggtttgg ggcactagta gtgccaggag gcgcgtgcca ggttgatatg 420

  agcatatcag cacccgttcc ttgcgaaacg cttccgttgt gctcccttcc ccaccacctc 480

  cccgctcata cccatacata tggctatccg tcctctcatt gcttgcccct acag 534

  <210> 82

  <211> 195

  <212> DNA

  <213> 莱茵衣藻

  <400> 82

  gtgagcgggc ctaccttctg aagacagtct tacgtgttgc actgcagcgg tgttgcgcac 60

  ctctgctttt gcgtgcgccg ggaagcgcgg attgcggcct cacagatcaa gcccggaaac 120

  gcttgttgtt tccagcgggt ggcacacacg cgcgcgcgcg cacagtgaca ccctcacggc 180

  cgcgctgccc tgcag 195

  <210> 83

  <211> 235

  <212> DNA

  <213> 莱茵衣藻

  <400> 83

  gtgcgtagtg catggggaga ggggacgagg ggaggagggc agggccaata aaccgaaccc 60

  caagtcatcg agacacagaa cccgataata gctcccagat cgccaagggg tgaggcggga 120

  agccaaggat gatgcgttgg ccgcattgcg tgttgacgtc aggcttacac agggtctgac 180

  tggctgtgct tggggtttgg cacgcttctt gactggcccc gtacgcatgc tgcag 235

  <210> 84

  <211> 212

  <212> DNA

  <213> 莱茵衣藻

  <400> 84

  gtgagtggtg gtggtttctg ggtcagcaga ggacttctgt agtaggtaat gtgggccagg 60

  gaagtgtggc taacatgcca aacacggggg cgcaccagtg caagctgcat tcgctgacgt 120

  gcacgggtgc aatgggtgca aggcgaactg caatcgcggt gcacagttgc cagggctgcg 180

  ctcacgcttg agtgtctgca cacgcactgc ag 212

  <210> 85

  <211> 270

  <212> DNA

  <213> 莱茵衣藻

  <400> 85

  gtgcgtagcg tgcgcgcatg tacttgtctc ccttgtcatg ttgggaaagg tcggtcccca 60

  gcctgcttgc aagatgcggc cggtcagcag ctgcggacgg tcagcaccta cgtgccgagg 120

  ttgtgtaaca tgaatggcgt tggggcggcc gacctgccac aagctgaact gcgaccagca 180

  aggcagctgc cagcaacgca cacccgacgt gctacacgct tgtgttttga cctcctaaac 240

  acacccgccc gctgtctgtc acgtccacag 270

  <210> 86

  <211> 199

  <212> DNA

  <213> 莱茵衣藻

  <400> 86

  gtaagcggcg gcggcgcggg gacacggagg gacatttcgc gagcatgggt tgaggagtcg 60

  ggaggattcg gtggctggcc ggagtcggga gtcggagtcg cgagtcggaa gtcaagcttc 120

  tggcggcttc gtgctgtcgg gtgcgctcgc catgatggcg ctgaccggag ggcgtcacgc 180

  tgtgtatgtg ggcgcgcag 199

  <210> 87

  <211> 231

  <212> DNA

  <213> 莱茵衣藻

  <400> 87

  gtacggggcg tacagcgggg gcggctgcac ggggccagtg accgacaggg cagcacgcgg 60

  ctggcgaaga gcgacaaagt gacagggtga ccaagaccgg gtgatgccac gagaggggcg 120

  cgggagccgt gcattgggtc gaggagggag gaatgcaact ttacactgat gcctctgtat 180

  acggccgcct tccgagccct gcaaaccttc gctttccccc gacgcacgca g 231

  <210> 88

  <211> 279

  <212> DNA

  <213> 莱茵衣藻

  <400> 88

  gtgagcgcag cgtgcggtgg atgcggtgcg cgtgcgggtt gccaacttat tattttgtac 60

  gtggacgcgt ggctggcgat ggcatgtcat ggcgcgaatg gatattgggc gaatggatac 120

  cggtaatggt agcacggggc ggcagggcct ggcggtagtg gggttgaggg ggcgaggact 180

  ccagcgcgcg atacatgcca tgttcagcat ggccccaact gacagcgccc gctgccctgt 240

  gcgccccgct ccctccgcgc acccgctcct cctacacag 279

  <210> 89

  <211> 36

  <212> DNA

  <213> 莱茵衣藻

  <400> 89

  ctagtctaga gggaactagg gaggggcaac agagaa 36

  <210> 90

  <211> 833

  <212> DNA

  <213> 莱茵衣藻

  <400> 90

  gcggcctccc cttcatggta gcactagttg gcgggttgtg gttggactag gcggctaggg 60

  tatataccta gtagcggcgg ctgcggagtg gagggctggc gcccagcgcg agggcgtggc 120

  ctttcctcct ggacccgaga gcgctccgcg aggagacggc gagtgagata ggcagcagcg 180

  agcggagatc gatttgtgaa cagttttgtg gcgggatccc atagcggatg cagagaagac 240

  cttagagcag cttcctcggt ggagtgaacg agccagagcg gagggaaggc gcatgaggga 300

  actgcaggga ctggaactgc gggagtgcag gtccggtgct aggtccgcta aacagtgcgg 360

  tctacgcctg tgtgtgaggt gtgcgtgtgt gtgtgagctg tgcggttttg ttgtgcaaag 420

  taggagtgag ccgagccgcg cgtactttgt ggcgtgtttg gctgctggcg ctgagagcca 480

  agagagggta aacgggtttg gtattttatg gtgcggggtg aaagcagccc tcgcaggaat 540

  ggagcgattc tgcagcatga tgcacgtgtg cctgcgcgtg gatggtggct gttgatatgg 600

  ctctgccact ccggcagcac cgctacgata cctagcggtg cctggagtgg tctctctgtt 660

  tggtgcgtga tgtttgggtt tgccgttttg attctttgtt tcgtgctgaa tggctgaggc 720

  ggcaagaccc ctcgtgccag tgtacagagc ctcacggctc cctcggaccc cgcgtgggga 780

  cgtccattcc cggtggcggt gtcgcctcgg cggtgtaaag caaaaaatat ttt 833

  <210> 91

  <211> 66

  <212> DNA

  <213> 莱茵衣藻

  <400> 91

  atgcagactt cctcgcttct tggccggcgc acggcccacc cggctgcggg cgcgacgccc 60

  aagccg 66

  <210> 92

  <211> 36

  <212> DNA

  <213> 莱茵衣藻

  <400> 92

  gttgcgccct cgccccgcgt ggctagcacc cgccag 36

  <210> 93

  <211> 106

  <212> DNA

  <213> 莱茵衣藻

  <400> 93

  gtcgcgtgca atgtggcgac tggaccccgg ccgcccatga ccaccttcac cggtggcaac 60

  aagggccctg ctaagcagca ggtgtcgctg gatctgcgcg acgagg 106

  <210> 94

  <211> 161

  <212> DNA

  <213> 莱茵衣藻

  <400> 94

  gcgctggcat gttcaccagc accagcccgg agatgcgccg tgtcgtccct gacgatgtga 60

  agggtcgcgt taaggtgaag gttgtgtacg tggtgctgga ggcccagtac cagtcggcca 120

  tcagcgctgc ggtgaagaac atcaacgcca agaactccaa g 161

  <210> 95

  <211> 135

  <212> DNA

  <213> 莱茵衣藻

  <400> 95

  gtgtgcttcg aggtggtggg ctacctgctg gaggagctgc gtgaccagaa gaacctcgat 60

  atgctcaagg aggatgtggc ctctgccaac atcttcatcg gctcgctcat cttcattgag 120

  gagcttgccg agaag 135

  <210> 96

  <211> 162

  <212> DNA

  <213> 莱茵衣藻

  <400> 96

  attgtggagg cggtgagccc cctgcgcgag aagctggacg cgtgcctgat cttcccgtcc 60

  atgccggcgg tcatgaagct gaacaagctg ggcacgtttt cgatggctca gctgggccag 120

  tcgaagtcgg tgttctcgga gttcatcaag tctgctcgca ag 162

  <210> 97

  <211> 299

  <212> DNA

  <213> 莱茵衣藻

  <400> 97

  aacaacgaca acttcgagga gggcttgctg aagctggtgc gcaccctgcc taaggtgctg 60

  aagtatctgc cctcggacaa ggcgcaggac gccaagaact tcgtgaacag cctgcagtac 120

  tggctgggcg gtaactcgga caacctggag aacctgctgc tgaacaccgt cagcaactac 180

  gtgcccgctc tgaagggcgt ggacttcagc gtggctgagc ccaccgccta ccccgatgtg 240

  ggtatctggc accctctggc ctcgggcatg tacgaggacc tgaaggagta cctgaactg 299

  <210> 98

  <211> 158

  <212> DNA

  <213> 莱茵衣藻

  <400> 98

  gtacgacacc cgcaaggaca tggtcttcgc caaggacgcc cccgtcattg gcctggtgct 60

  gcagcgctcg cacctggtga ctggcgatga gggccactac agcggcgtgg tcgctgagct 120

  ggagagccgc ggtgctaagg tcatccccgt ctttgccg 158

  <210> 99

  <211> 260

  <212> DNA

  <213> 莱茵衣藻

  <400> 99

  gtggcctgga cttctccgcc cccgtcaaga agttcttcta cgaccccctg ggctctggcc 60

  gcacgttcgt ggacaccgtt gtgtcgctga ccggcttcgc gctggtgggc ggccccgcgc 120

  gccaggacgc gccgaaggcc attgaggcgc tgaagaacct gaacgtgccc tacctggtgt 180

  cgctgccgct ggtgttccag accactgagg agtggctgga cagcgagctg ggcgtgcacc 240

  ccgtccaggt ggctctgcag 260

  <210> 100

  <211> 1515

  <212> DNA

  <213> 莱茵衣藻

  <400> 100

  gttgccctgc ccgagctgga tggtgccatg gagcccatcg tgttcgctgg ccgtgactcg 60

  aacaccggca agtcgcactc gctgcccgac cgcatcgctt cgctgtgcgc tcgcgccgtg 120

  aactgggcca acctgcgcaa gaagcgcaac gccgagaaga agctggccgt caccgtgttc 180

  agcttccccc ctgacaaggg caacgtcggc actgccgcct acctgaacgt gttcggctcc 240

  atctaccgcg tgctgaagaa cctgcagcgc gagggctacg acgtgggcgc cctgccgccc 300

  tcggaggagg atctgatcca gtcggtgctg acccagaagg aggccaagtt caactcgacc 360

  gacctgcaca tcgcctacaa gatgaaggtg gacgagtacc agaagctgtg cccttacgcc 420

  gaggcgctgg aggagaactg gggcaagccc cccggcaccc tgaacaccaa cggccaggag 480

  ctgctggtgt acggccgcca gtacggcaac gtcttcatcg gcgtgcagcc caccttcggc 540

  tacgagggcg acccgatgcg cctgctgttc tcgaagtcgg ccagccccca ccacggcttc 600

  gccgcctact acaccttcct ggagaagatc ttcaaggccg acgccgtgct gcacttcggc 660

  acccacggct cgctggagtt catgcccggc aagcaggtcg gcatgtcggg tgtgtgctac 720

  cccgactcgc tgatcggcac catccccaac ctctactact acgccgccaa caacccgtct 780

  gaggccacca tcgccaagcg ccgctcgtac gccaacacca tttcgtacct gacgccgcct 840

  gccgagaacg ccggcctgta caagggcctg aaggagctga aggagctgat cagctcgtac 900

  cagggcatgc gtgagtctgg ccgcgccgag cagatctgcg ccaccatcat tgagaccgcc 960

  aagctgtgca acctggaccg cgacgtgacc ctgcccgacg ctgacgccaa ggacctgacc 1020

  atggacatgc gcgacagcgt tgtgggccag gtgtaccgca agctgatgga gattgagtcc 1080

  cgcctgctgc cctgcggcct gcacgtggtg ggctgcccgc ccaccgccga ggaggccgtg 1140

  gccaccctgg tcaacatcgc tgagctggac cgcccggaca acaacccccc catcaagggc 1200

  atgcccggca tcctggcccg cgccattggt cgcgacatcg agtcgattta cagcggcaac 1260

  aacaagggcg tcctggctga cgttgaccag ctgcagcgca tcaccgaggc ctcccgcacc 1320

  tgcgtgcgcg agttcgtgaa ggaccgcacc ggcctgaacg gccgcatcgg caccaactgg 1380

  atcaccaacc tgctcaagtt caccggcttc tacgtggacc cctgggtgcg cggcctgcag 1440

  aacggcgagt tcgccagcgc caaccgcgag gagctgatca ccctgttcaa ctacctggag 1500

  ttctgcctga cccag 1515

  <210> 101

  <211> 713

  <212> DNA

  <213> 莱茵衣藻

  <400> 101

  gtggtcaagg acaacgagct gggcgccctg gtagaggcgc tgaacggcca gtacgtcgag 60

  cccggccccg gcggtgaccc catccgcaac cccaacgtgc tgcccaccgg caagaacatc 120

  cacgccctgg accctcagtc gattcccact caggccgcgc tgaagagcgc ccgcctggtg 180

  gtggaccgcc tgctggaccg cgagcgcgac aacaacggcg gcaagtaccc cgagaccatc 240

  gcgctggtgc tgtggggcac tgacaacatc aagacctacg gcgagtcgct ggcccaggtc 300

  atgatgatgg tcggtgtcaa gcccgtggcc gacgccctgg gccgcgtgaa caagctggag 360

  gtgatccctc tggaggagct gggccgcccc cgcgtggacg tggttgtcaa ctgctcgggt 420

  gtgttccgcg acctgttcgt gaaccagatg ctgctgctgg accgcgccat caagctggcg 480

  gccgagcagg acgagcccga tgagatgaac ttcgtgcgca agcacgccaa gcagcaggcg 540

  gcggagctgg gcctgcagag cctgcgcgac gcggccaccc gtgtgttctc caacagctcg 600

  ggctcctact cgtccaacgt caacctggcg gtggagaaca gcagctggag cgacgagtcg 660

  cagctgcagg agatgtacct gaagcgcaag tcgtacgcct tcaactcgga ccg 713

  <210> 102

  <211> 589

  <212> DNA

  <213> 莱茵衣藻

  <400> 102

  ccccggcgcc ggtggcgaga tgcagcgcga cgtgttcgag acggccatga agaccgtgga 60

  cgtgaccttc cagaacctgg actcgtccga gatctcgctg accgatgtgt cgcactactt 120

  cgactccgac cccaccaagc tggtggcgtc gctgcgcaac gacggccgca cccccaacgc 180

  ctacatcgcc gacaccacca ccgccaacgc gcaggtccgc actctgggtg agaccgtgcg 240

  cctggacgcc cgcaccaagc tgctcaaccc caagtggtac gagggcatgc ttgcctcggg 300

  ctacgagggc gtgcgcgaga tccagaagcg catgaccaac accatgggct ggtcggccac 360

  ctcgggcatg gtggacaact gggtgtacga cgaggccaac tcgaccttca tcgaggatgc 420

  ggccatggcc gagcgcctga tgaacaccaa ccccaacagc ttccgcaagc tggtggccac 480

  cttcctggag gccaacggcc gcggctactg ggacgccaag cccgagcagc tggagcgcct 540

  gcgccagctg tacatggacg tggaggacaa gattgagggc gtcgaataa 589

  <210> 103

  <211> 79

  <212> DNA

  <213> 莱茵衣藻

  <400> 103

  gtaggtgtaa ttagaaggat caaaacctag cggcctgatc tgggactgac ggcctcgcgc 60

  ttcaatcact ctgatgcag 79

  <210> 104

  <211> 83

  <212> DNA

  <213> 莱茵衣藻

  <400> 104

  gtaggcacgg cagaatgctc aatgaacatg cagctacata tgtttgggat catggctgat 60

  ctctgtgcga cgggtccgcg cag 83

  <210> 105

  <211> 183

  <212> DNA

  <213> 莱茵衣藻

  <400> 105

  gtgagcagcg cggaccgagc aagcgctggc gatgcagttg gatttgttgt tcttgggtca 60

  ggcgctcgct cgatggccag cgcgtgtatt taatgggata agggttgaga caaagcatct 120

  cttcgggtaa aaatcttagt tttcgacagc acgttgagag gcatgcaact tgctctttcg 180

  cag 183

  <210> 106

  <211> 106

  <212> DNA

  <213> 莱茵衣藻

  <400> 106

  gtgggtaagg agttgcatta tcagtgtggc atggtgttgc gggcgtctgg ggcgctgcaa 60

  cagcggcatc gtgccgaact gaccgtgccg ggctacccgc gtgcag 106

  <210> 107

  <211> 231

  <212> DNA

  <213> 莱茵衣藻

  <400> 107

  gtgcgctagg gttggggtct ggagggtgtg gattgcgccc aagtgccctg ttgcgcttgg 60

  cggtcgctgt catgatgtga gggtgacgta gtgcactcaa ttgcctgcta cgtcaccacc 120

  tttgatgggc tggatctgag gcaggtcagc tcggttccct gctgcatcca gtgtccctgt 180

  cgccctgcac gtttgacgct gttccccctt ccgcactgtc tcgctttgca g 231

  <210> 108

  <211> 137

  <212> DNA

  <213> 莱茵衣藻

  <400> 108

  gtgtgggcac gcgctttggg aagggaggca tacatttttg gttgcggtta ggctgggcgc 60

  ggacttggca ctcacacggt cattgcacac tcatgtctca ccttcattta cggtcccttg 120

  tgccgaacta cctacag 137

  <210> 109

  <211> 255

  <212> DNA

  <213> 莱茵衣藻

  <400> 109

  gtgagcagca tcagggcaga gtgcatgaac ggattggtgg cagtggggaa tggaattaga 60

  cggacacgtc tgggcggcaa tatgttgcgc tgcagttttt ggggtgtagt gaactagaaa 120

  atagggaaga gataggccac ataacatccg aaagctcata tttttgcaac cggcgcacct 180

  atcacagccc acctgaaggg ttttgtagtc aacgcgtgca actgactaga tgtcccctta 240

  cctgtctgat ttcag 255

  <210> 110

  <211> 211

  <212> DNA

  <213> 莱茵衣藻

  <400> 110

  gtgaggcggg gcggcgctgc cctcggtagg ggttgcagat ggtgatgggt aaccgaatgc 60

  atggccaatg gggagtgaaa tcaggaaagg aggggtaaca caatgcaggg cagcacctga 120

  atcgtgaagg cggagttagg cagggatctg tcagttcgcc tgtcacgtgg atgggcgcag 180

  ctgacctttg tggtgttgtg gtgtggcgca g 211

  <210> 111

  <211> 192

  <212> DNA

  <213> 莱茵衣藻

  <400> 111

  gtgagctcag ctgggacatg taggggctcg ggtcgccgga gcatcgatgt agaattacgg 60

  gaggagggga gaggggagag gattgcacga accgagatga gggcggtggt tcgggatttc 120

  gggcaaaagc tcgtgcggca agcgttcagt gactgaagag cagtgtgctt caactgcccc 180

  tctgtccctc ag 192

  <210> 112

  <211> 167

  <212> DNA

  <213> 莱茵衣藻

  <400> 112

  gtgcgaccgg tgccgctgcg tggccaacag cttggtgcca ccttcctgcg gtgttgattt 60

  acactgtgtg cgtggatgtg ttggtttttc gcaactttag tctgggctcc agctctttgc 120

  cttcattgat cactcgtctt acctcctgcg ccatcatttg aatacag 167

  <210> 113

  <211> 154

  <212> DNA

  <213> 莱茵衣藻

  <400> 113

  gtgagcctta atgcaacacg tgtagccgtt cgcatgggtg gctgggtcat gctatggttg 60

  gatcggcgtc cgcctgcttg ctactgcctg ttcggtacca gcgtttactg accccgcgtg 120

  tgccattccc accacctacc ccctcgcctt gcag 154

  <210> 114

  <211> 149

  <212> DNA

  <213> 莱茵衣藻

  <400> 114

  gacagtgata tagcaatacc gatataatag gtttggcggg cttcaccttg tccttaccca 60

  gaatgtggcc ctgacagtcg atttccagcc cccttgccac tcgctccctg atttcttcaa 120

  tcaactagtt gggtcgtttt ctcgtaagg 149

  <210> 115

  <211> 944

  <212> DNA

  <213> 莱茵衣藻

  <400> 115

  gggggcgggt ggcgagtaag gcgtatggcg gagcgaggag atgggctgtg gcgtggccgg 60

  tgttcttttg tgtgattgga aacatagacg gggtgcggca cgcggcctga ctgctgcgcg 120

  gttggtgtgg ttgcgggggg agcggggtcg atggggcagc gcgcacgagt tggttgaagg 180

  aggagggcca ggcgctgggc tacacccatg gtttgaggat gctagtgagt gatgtgtgcg 240

  gggggcatgg tgtgtaccat tcagagtcca gatgcacgca cggttgcgtg ggagcgttcc 300

  ctgctgtgca tgatgatggc gccttcgatg aatcatctct tgaaggtcca aatgaaacgt 360

  ctgaagtctg cagagggtgg tgctggacat gccatccagg cggaagtggg cagctgtgtc 420

  tgactacaaa gtaggtcttg ttttgcttgg atagcgtttg gctatgtagc gtgtattctg 480

  ctcatcaatc acgccaggcg tcagggacta cccatgcaag tcgggagcgt ggctggctct 540

  ggaaaagttg tagctgctag gtggcgttgg ctggggtgtc atgcatctcg gcaggtaggc 600

  ggtagcggtg gacgacctct gcagcggagc atgtgcacaa gatgtgactg cgcatgcacc 660

  cgtatatgac ggcgttggcg tcagttgttg agagtgaaca gaggagagac gagcgaagct 720

  gccatgccct tagtggctgg tgcgagaggg gaagaaagag agaggaagga ctttgcggca 780

  gtgccccacg ccggagttgg ggacacggtc atcaacaggg cggcggagct gggcggagtg 840

  ggtgtgtgat gggacagggt tcaaggcagg ttggcgaggt cggagtgggt agaccagtcc 900

  ttcagtgcaa gggcattagg gcatgatgta agggctgaag cttg 944

  <210> 116

  <211> 116

  <212> DNA

  <213> 莱茵衣藻

  <400> 116

  atggcgtcgt ttggattgat gcaaaggacg gtgcactgtc cccagcttgt ggaggagcgg 60

  tgttcgccgg tcgctggctg ctctggtcgt ggcctgccag ttatccagcg gcaacg 116

  <210> 117

  <211> 676

  <212> DNA

  <213> 莱茵衣藻

  <400> 117

  gcgtggcgtg tgcagtgcca ccaacggtgt ccagcgaggg cgtgtgctgc gccggacggc 60

  cgcttcgacc gacgtggtct ccttcgtgga ccccaatgac attagaaaac ccgcagcagc 120

  agcagctggc cctgcggtgg ataaggtcgg cgttctgctg ttaaaccttg gcgggcccga 180

  aaagctcgac gacgtcaagc ctttcctgta taacctattc gccgacccag aaattattcg 240

  cctgccagcg gcagctcagt tcctgcagcc gctgctcgcg acgatcatct ccacgcttcg 300

  cgccccgaag agcgcggagg gctatgaggc cattggcggt ggtagcccgt tgcgtaggat 360

  tacagacgag caggcggagg cgctggcgga gtctctgcgc gccaagggcc aacctgcgaa 420

  cgtgtacgtg ggcatgcgct attggcaccc ctacacggag gaggcgctgg agcacattaa 480

  ggccgacggc gtcacgcgcc tggtcatcct cccgctgtac cctcagttct ccatctctac 540

  cagcggctcc agccttcgac tgcttgagtc gctcttcaag agcgacatcg cgctcaagtc 600

  gctgcggcac acggtcatcc cgtcctggta ccagcggcgg ggctacgtga gcgcgatggc 660

  ggacctgatt gtagag 676

  <210> 118

  <211> 138

  <212> DNA

  <213> 莱茵衣藻

  <400> 118

  gagctgaaga agttccggga cgtgcccagc gtggagctgt ttttctccgc gcacggcgtg 60

  cccaagtcct acgtggagga ggcgggcgac ccatacaagg aggagatgga ggagtgcgtg 120

  cggctcatta cggacgag 138

  <210> 119

  <211> 98

  <212> DNA

  <213> 莱茵衣藻

  <400> 119

  gtcaagcggc gcggcttcgc caacacgcac acgctggcct accagagccg cgtgggcccc 60

  gcggaatggc tcaagccgta cacggatgag tccatcaa 98

  <210> 120

  <211> 119

  <212> DNA

  <213> 莱茵衣藻

  <400> 120

  ggagctgggc aagcgcggcg tcaagtcgct gctggcggtg cccatcagct ttgtcagcga 60

  gcacattgag acgttggagg agatcgacat ggagtaccgc gagctggcgg aggagagcg 119

  <210> 121

  <211> 135

  <212> DNA

  <213> 莱茵衣藻

  <400> 121

  gcatccgcaa ctggggccgc gtgccggcgc tgaacaccaa cgccgccttc atcgacgacc 60

  tggcggacgc ggtgatggag gcgctgccct acgtgggctg cctggccggg ccgacagact 120

  cgctggtgcc gctgg 135

  <210> 122

  <211> 200

  <212> DNA

  <213> 莱茵衣藻

  <400> 122

  gcgacctgga gatgctgctg caggcctacg accgcgagcg ccgcacgctg ccgtcaccgg 60

  tggtgatgtg ggagtggggc tggaccaaga gcgcggagac gtggaacggc cgcattgcca 120

  tgattgccat catcatcatc ctggcgctgg aggcagccag cggccagtcc atcctcaaaa 180

  acctgttcct ggcggagtag 200

  <210> 123

  <211> 66

  <212> DNA

  <213> 莱茵衣藻

  <400> 123

  gtgcgataat aaatttgcat ccttatgaat tgctcaatga ctaacgagca gcgtccgcga 60

  ccacag 66

  <210> 124

  <211> 527

  <212> DNA

  <213> 莱茵衣藻

  <400> 124

  gtgagggtgg cattctgtaa agggagttgt ggagttgggc agagcgagtg ggtttggtcg 60

  ccagggcgag gatgttgcgc gggcgttggc aggaacaggg ctgctagggc ttgcgtggcc 120

  agcgactagg gtttcgactg gccagcgccg ccggggcgcg cttgccgaag ctgcacagcc 180

  ccaagcgctt ctgtggatca aatggaaact tgtggcagtg tgtatgctag cgccttggcg 240

  caagaccaat tttagtggta ttactgttat tactgtggta gcggtgggta ttcggcggcg 300

  tggttgttgt tgcagccccg tgcgactaag accgctggca acgacagcaa gccgccgcac 360

  ccaggcatat acggcccacc agcaccaccg tacacaacca cgtgcctttg cactctacgc 420

  accacagcgc gctgctgccg ctcccacctc ccatcccaac ggcccctctt acccccactt 480

  cacaacccct cctctcacac gccctcctct tccccctcct cttccag 527

  <210> 125

  <211> 264

  <212> DNA

  <213> 莱茵衣藻

  <400> 125

  gtgggccggg cgcagcgggc gggcgggagg ggcaggaggg gcaggagggg aggaagggag 60

  gggaggaagg gatggaaagc tggcgcagcg gcagcggcgg gacaggtaga gggcgctgcc 120

  ccagcggcgg caggtgggca tggtgggcgg gtaggggcga cgcgtgaggg actcgtcagg 180

  catccgcatg gcggcgactt gctgctcctc accgctgacg gctgcatctg ctgtgtgcgt 240

  aacctggcct ggctggcacc gcag 264

  <210> 126

  <211> 392

  <212> DNA

  <213> 莱茵衣藻

  <400> 126

  gtgaggcccg tgggtgggac gcggggaggg acgcggggag ggggagacgc gggagcggga 60

  caagggtgag gatacgggga gggaatagga gaggccatgg ggagggatgg ggacacggga 120

  ggatgcacgg gcctgggtgg agccaggggg aagtggacga cgagcccggc gggaggaggg 180

  ctgggtagaa ggacgcggga ggtggttggg acaggtggac ggggcgtgtg gagcatacgg 240

  cgcaagaagc gggactgagc gggttgcagg gatggatgta atcacggcaa gtaagaaccc 300

  cgagtggggc tcagcgtgtc agcctgcctt atctttcgcg caagcgctgg ggttttattt 360

  cgctgtacac acgtcgcgcc tttctgccgc ag 392

  <210> 127

  <211> 508

  <212> DNA

  <213> 莱茵衣藻

  <400> 127

  gtgaggaggc gccggagttt tgggggaagg ggtgcggcgt gaagcgagat ggcaggggcg 60

  aaggaaggag cggatggtgg ctgggtgcaa gcggagaggc gacagagagt ggaggttttg 120

  gtggagcggt tggggagagg ggcgcagcag ggatgcggcc ctggggatgg cgggacagaa 180

  gggagcaagt ttgccaagtg aagggggggg gtgctcaaga ggagagggcg gtggaggtta 240

  agacggccgt gctggttatg ctggggttgc aaggcgcatg ggcgcatgga gccgggggag 300

  tttggctgtg gatgggcact gcggatgggc acggcttgct actcatgtgc ggtcgcggtc 360

  cgcggtgtgt cagccagcca ggacccatcc cactgggtct tcctgcgtgc ctgggactgc 420

  ttgccgccac ccacccattc atcaccacca ctgcgcagac ccaccaacac cgctgccctg 480

  aactgctctg actcttggcg ctcctcag 508

  <210> 128

  <211> 686

  <212> DNA

  <213> 莱茵衣藻

  <400> 128

  gtgagtcgcg ccgtcgcggt tggttcgcgg atgccggttg gcggatgacg ttcggcggtt 60

  ggcattgggt ttgggtttga ggggttgttg ggtgaggtcg ggattggggt cgggattggg 120

  ggtcgagcgt ggggctggcg tggatgatgg cgtggtcttt ggaaggggct tggggaggtt 180

  gcgcgtgtgg atgcggacag catgggcgcg acagtgcgca tgtgcatgtg ctgtgtcaaa 240

  cgtctggtgc gttcagtgtg tccttgcgtg cctcccaccg tacgcagcca tcccgcgcgc 300

  ctggaccgta gagaccgcct acgtgtccgc tagcggcctc ggcctcagcc taagcgccag 360

  tagcgccagc gacacaagca acactgtcgc taatggcagc agcggcagca gcagcagtca 420

  cgagaatgcc cgcggccggg agaaagtgct cctagccggg ggccgccgct agctggtttc 480

  ctcagcgcgt ggacggtggt gccttcatcc cgaccacccc aggcgcgtcc ccagtcccgt 540

  cgagctcgcc tgccttgtgg cccgccttga ccgccctggc gccacccggt ggctcgcata 600

  acgactcgct ttccgttctc cgcctgacgc tgtccgcctg acgctctgcg cttgactctt 660

  tgcgccttcc tcccctcttc ccccag 686

  <210> 129

  <211> 4201

  <212> DNA

  <213> 人工序列

  <220>

  <223> 红藻CHLH DNA

  <400> 129

  atgcagactt cctcgcttct tggccggcgc acggcccacc cggctgcggg cgcgacgccc 60

  aagccggttg cgccctcgcc ccgcgtggct agcacccgcc aggtcgcgtg caatgtggcg 120

  actggacccc ggccgcccat gaccaccttc accggtggca acaagggccc tgctaagcag 180

  caggtgtcgc tggatctgcg cgacgagggc gctggcatgt tcaccagcac cagcccggag 240

  atgcgccgtg tcgtccctga cgatgtgaag ggtcgcgtta aggtgaaggt tgtgtacgtg 300

  gtgctggagg cccagtacca gtcggccatc agcgctgcgg tgaagaacat caacgccaag 360

  aactccaagg tgtgcttcga ggtggtgggc tacctgctgg aggagctgcg tgaccagaag 420

  aacctcgata tgctcaagga ggatgtggcc tctgccaaca tcttcatcgg ctcgctcatc 480

  ttcattgagg agcttgccga gaagattgtg gaggcggtga gccccctgcg cgagaagctg 540

  gacgcgtgcc tgatcttccc gtccatgccg gcggtcatga agctgaacaa gctgggcacg 600

  ttttcgatgg ctcagctggg ccagtcgaag tcggtgttct cggagttcat caagtctgct 660

  cgcaagaaca acgacaactt cgaggagggc ttgctgaagc tggtgcgcac cctgcctaag 720

  gtgctgaagt atctgccctc ggacaaggcg caggacgcca agaacttcgt gaacagcctg 780

  cagtactggc tgggcggtaa ctcggacaac ctggagaacc tgctgctgaa caccgtcagc 840

  aactacgtgc ccgctctgaa gggcgtggac ttcagcgtgg ctgagcccac cgcctacccc 900

  gatgtgggta tctggcaccc tctggcctcg ggcatgtacg aggacctgaa ggagtacctg 960

  aactggtacg acacccgcaa ggacatggtc ttcgccaagg acgcccccgt cattggcctg 1020

  gtgctgcagc gctcgcacct ggtgactggc gatgagggcc actacagcgg cgtggtcgct 1080

  gagctggaga gccgcggtgc taaggtcatc cccgtctttg ccggtggcct ggacttctcc 1140

  gcccccgtca agaagttctt ctacgacccc ctgggctctg gccgcacgtt cgtggacacc 1200

  gttgtgtcgc tgaccggctt cgcgctggtg ggcggccccg cgcgccagga cgcgccgaag 1260

  gccattgagg cgctgaagaa cctgaacgtg ccctacctgg tgtcgctgcc gctggtgttc 1320

  cagaccactg aggagtggct ggacagcgag ctgggcgtgc accccgtcca ggtggctctg 1380

  caggttgccc tgcccgagct ggatggtgcc atggagccca tcgtgttcgc tggccgtgac 1440

  tcgaacaccg gcaagtcgca ctcgctgccc gaccgcatcg cttcgctgtg cgctcgcgcc 1500

  gtgaactggg ccaacctgcg caagaagcgc aacgccgaga agaagctggc cgtcaccgtg 1560

  ttcagcttcc cccctgacaa gggcaacgtc ggcactgccg cctacctgaa cgtgttcggc 1620

  tccatctacc gcgtgctgaa gaacctgcag cgcgagggct acgacgtggg cgccctgtcc 1680

  gccctcggag gaggatctga tccagtcggt gctgacccag aaggaggcca agttcaactc 1740

  gaccgacctg cacatcgcct acaagatgaa ggtggacgag taccagaagc tgtgccctta 1800

  cgccgaggcg ctggaggaga actggggcaa gccccccggc accctgaaca ccaacggcca 1860

  ggagctgctg gtgtacggcc gccagtacgg caacgtcttc atcggcgtgc agcccacctt 1920

  cggctacgag ggcgacccga tgcgcctgct gttctcgaag tcggccagcc cccaccacgg 1980

  cttcgccgcc tactacacct tcctggagaa gatcttcaag gccgacgccg tgctgcactt 2040

  cggcacccac ggctcgctgg agttcatgcc cggcaagcag gtcggcatgt cgggtgtgtg 2100

  ctaccccgac tcgctgatcg gcaccatccc caacctctac tactacgccg ccaacaaccc 2160

  gtctgaggcc accatcgcca agcgccgctc gtacgccaac accatttcgt acctgacgcc 2220

  gcctgccgag aacgccggcc tgtacaaggg cctgaaggag ctgaaggagc tgatcagctc 2280

  gtaccagggc atgcgtgagt ctggccgcgc cgagcagatc tgcgccacca tcattgagac 2340

  cgccaagctg tgcaacctgg accgcgacgt gaccctgccc gacgctgacg ccaaggacct 2400

  gaccatggac atgcgcgaca gcgttgtggg ccaggtgtac cgcaagctga tggagattga 2460

  gtcccgcctg ctgccctgcg gcctgcacgt ggtgggctgc ccgcccaccg ccgaggaggc 2520

  cgtggccacc ctggtcaaca tcgctgagct ggaccgcccg gacaacaacc cccccatcaa 2580

  gggcatgccc ggcatcctgg cccgcgccat tggtcgcgac atcgagtcga tttacagcgg 2640

  caacaacaag ggcgtcctgg ctgacgttga ccagctgcag cgcatcaccg aggcctcccg 2700

  cacctgcgtg cgcgagttcg tgaaggaccg caccggcctg aacggccgca tcggcaccaa 2760

  ctggatcacc aacctgctca agttcaccgg cttctacgtg gacccctggg tgcgcggcct 2820

  gcagaacggc gagttcgcca gcgccaaccg cgaggagctg atcaccctgt tcaactacct 2880

  ggagttctgc ctgacccagg tggtcaagga caacgagctg ggcgccctgg tagaggcgct 2940

  gaacggccag tacgtcgagc ccggccccgg cggtgacccc atccgcaacc ccaacgtgct 3000

  gcccaccggc aagaacatcc acgccctgga ccctcagtcg attcccactc aggccgcgct 3060

  gaagagcgcc cgcctggtgg tggaccgcct gctggaccgc gagcgcgaca acaacggcgg 3120

  caagtacccc gagaccatcg cgctggtgct gtggggcact gacaacatca agacctacgg 3180

  cgagtcgctg gcccaggtca tgatgatggt cggtgtcaag cccgtggccg acgccctggg 3240

  ccgcgtgaac aagctggagg tgatccctct ggaggagctg ggccgccccc gcgtggacgt 3300

  ggttgtcaac tgctcgggtg tgttccgcga cctgttcgtg aaccagatgc tgctgctgga 3360

  ccgcgccatc aagctggcgg ccgagcagga cgagcccgat gagatgaact tcgtgcgcaa 3420

  gcacgccaag cagcaggcgg cggagctggg cctgcagagc ctgcgcgacg cggccacccg 3480

  tgtgttctcc aacagctcgg gctcctactc gtccaacgtc aacctggcgg tggagaacag 3540

  cagctggagc gacgagtcgc agctgcagga gatgtacctg aagcgcaagt cgtacgcctt 3600

  caactcggac cgccccggcg ccggtggcga gatgcagcgc gacgtgttcg agacggccat 3660

  gaagaccgtg gacgtgacct tccagaacct ggactcgtcc gagatctcgc tgaccgatgt 3720

  gtcgcactac ttcgactccg accccaccaa gctggtggcg tcgctgcgca acgacggccg 3780

  cacccccaac gcctacatcg ccgacaccac caccgccaac gcgcaggtcc gcactctggg 3840

  tgagaccgtg cgcctggacg cccgcaccaa gctgctcaac cccaagtggt acgagggcat 3900

  gcttgcctcg ggctacgagg gcgtgcgcga gatccagaag cgcatgacca acaccatggg 3960

  ctggtcggcc acctcgggca tggtggacaa ctgggtgtac gacgaggcca actcgacctt 4020

  catcgaggat gcggccatgg ccgagcgcct gatgaacacc aaccccaaca gcttccgcaa 4080

  gctggtggcc accttcctgg aggccaacgg ccgcggctac tgggacgcca agcccgagca 4140

  gctggagcgc ctgcgccagc tgtacatgga cgtggaggac aagattgagg gcgtcgaata 4200

  a 4201

  <210> 130

  <211> 263

  <212> DNA

  <213> 莱茵衣藻

  <400> 130

  tcctacagag taaaggtcta ggcgatgcgc gactgaaaga ctgtgaatcc cggcgtcgcc 60

  gtggtgggat gtgggccggt gcgctgtcgc agaggataaa ttacaggtat caaacaaggt 120

  tagggcgttg gaaggagcgg cgctagggaa ctgaaatcgg atctgcatcg gaccctcatt 180

  ccgcgacttg tccttctttt gcctcgcccc gcagctcttg agttttgttc ttgacccttt 240

  gacacgaacc aaccgatata aaa 263

  <210> 131

  <211> 843

  <212> DNA

  <213> 莱茵衣藻

  <400> 131

  gcggcaggcc ttcatggtcg tcgttggagc atttgcggaa aggctgatgg cagcagatgc 60

  agccatgtca gttgtggctg aagttgttgg ctggggcggg agcgggcagc agctgctgcg 120

  agcggccgaa gcagcggtgc tgctttgcgt atgagaggaa gaccagtgcc ctcgaggagg 180

  cgagtgcctg tgtgagtgtc aggacgtgtg acttcggaaa ctgagggcgg tgagtagatg 240

  tgactggggc ttgcaggaag cctactgacc ctatcagaaa aggtgagcag gggtatatgg 300

  tctaggagcg ttgccggagc gtggctggcc agtgctagcc gcgcgggctc tgttgctcgc 360

  tggcgcgccg ccgccttcac aacagatgcc gtagaaatgc agcgatgtga cgaggcgtgg 420

  cctattctgc aatgtgtgag gcgccaatgg cgccactgac aaatggagga gtggtcaaag 480

  cttgggtacg ttttgagagc tgcatcgggc agcgaggatc agtgtgcggt aagaccgacg 540

  gcagacggat tggcaaggga ataggaggga cgtgggcgtg ggcgcccgcg ctttgtcgag 600

  gccgcatgag ccggccgctt ctagacccgt agcccatttt gaacaagcgc ccacgcgtgc 660

  tcccgatggg ggacatcgat cacgggaatt gattaagggg catgtgtggt gtgcaagtga 720

  gtgactggtg gttccgtccc tgtgaggttg tttcgttgga cgtggctgcc gggttgcgcg 780

  cgggctaagc gggcctgagg cagagcgctg gcgtgtagcc gcgagtatcg atctgtaacg 840

  tgc 843

  <210> 132

  <211> 120

  <212> DNA

  <213> 莱茵衣藻

  <400> 132

  atggccctga acatgcgtgt ttcctcttcc aaggtcgctg ccaagcagca gggccgcatc 60

  tccgcggtgc cggttgtgtc gagcaaggtg gcctcctccg cccgcgtggc ccccttccag 120

  <210> 133

  <211> 37

  <212> DNA

  <213> 莱茵衣藻

  <400> 133

  ggcgctcccg tggccgcgca gcgcgctgct ctgctgg 37

  <210> 134

  <211> 60

  <212> DNA

  <213> 莱茵衣藻

  <400> 134

  tgcgcgccgc tgccgctact gaggtcaagg ctgctgaggg ccgcactgag aaggagctgg 60

  <210> 135

  <211> 176

  <212> DNA

  <213> 莱茵衣藻

  <400> 135

  gccaggcccg ccccatcttc cccttcaccg ccatcgtggg ccaggatgag atgaagctgg 60

  cgctgattct gaacgtgatc gaccccaaga tcggtggtgt catgatcatg ggcgaccgtg 120

  gcactggcaa gtccaccacc attcgtgccc tggcggatct gctgcccgag atgcag 176

  <210> 136

  <211> 193

  <212> DNA

  <213> 莱茵衣藻

  <400> 136

  gtggttgcca acgacccctt taactcggac cccaccgacc ccgagctgat gagcgaggag 60

  gtgcgcaacc gcgtcaaggc cggcgagcag ctgcccgtgt cttccaagaa gattcccatg 120

  gtggacctgc ccctgggcgc cactgaggac cgcgtgtgcg gcaccatcga catcgagaag 180

  gcgctgaccg agg 193

  <210> 137

  <211> 89

  <212> DNA

  <213> 莱茵衣藻

  <400> 137

  gtgtcaaggc gttcgagccc ggcctgctgg ccaaggccaa ccgcggcatc ctgtacgtgg 60

  atgaggtcaa cctgctggac gaccacctg 89

  <210> 138

  <211> 100

  <212> DNA

  <213> 莱茵衣藻

  <400> 138

  gtcgatgtgc tgctggactc ggccgcctcc ggctggaaca ccgtggagcg cgagggtatc 60

  tccatcagcc accccgcccg cttcatcctg gtcggctcgg 100

  <210> 139

  <211> 145

  <212> DNA

  <213> 莱茵衣藻

  <400> 139

  gcaaccccga ggagggtgag ctgcgccccc agctgctgga tcgcttcggc atgcacgccc 60

  agatcggcac cgtcaaggac ccccgcctgc gtgtgcagat cgtgtcgcag cgctcgacct 120

  tcgacgagaa ccccgccgcc ttccg 145

  <210> 140

  <211> 202

  <212> DNA

  <213> 莱茵衣藻

  <400> 140

  caaggactac gaggccggcc agatggcgct gacccagcgc atcgtggacg cgcgcaagct 60

  gctgaagcag ggcgaggtca actacgactt ccgcgtcaag atcagccaga tctgctcgga 120

  cctgaacgtg gacggcatcc gcggcgacat cgtgaccaac cgcgccgcca aggccctggc 180

  cgccttcgag ggccgcaccg ag 202

  <210> 141

  <211> 132

  <212> DNA

  <213> 莱茵衣藻

  <400> 141

  gtgacccccg aggacatcta ccgtgtcatt cccctgtgcc tgcgccaccg cctccggaaa 60

  gaccccctgg ctgagatcga cgacggtgac cgcgtgcgtg agatcttcaa gcaggtgttc 120

  ggcatggagt aa 132

  <210> 142

  <211> 101

  <212> DNA

  <213> 莱茵衣藻

  <400> 142

  gtgtgcagtt gcatctaaag aacgtccaat tcatggttac tgctcgtgga tctaagcggt 60

  tggctcacca gcgttccatg gtccccgatt cgtgcacgca g 101

  <210> 143

  <211> 121

  <212> DNA

  <213> 莱茵衣藻

  <400> 143

  gtgagaagcc atgatacaaa tataaggatt tgaagcggta gatctaggac ccatcgaact 60

  tgagcaccga cttgcagtcc ttgccttgtc cggcgactga acttctgcgc ttgctttgca 120

  g 121

  <210> 144

  <211> 82

  <212> DNA

  <213> 莱茵衣藻

  <400> 144

  gtaagtgtcg cgcaaagatt ttctgccggg acgggtctcc ctcgcaacat ctgaacccat 60

  ggctcgtttt tttgccccgc ag 82

  <210> 145

  <211> 397

  <212> DNA

  <213> 莱茵衣藻

  <400> 145

  gtgcgcgcct cccccaaccc cagtttggca aatgtgtggt taagcgtcga aagcgtgaac 60

  agaaacaggt gttgcggggg ccgcggaatg gctgcaatgg gtgctggggg cttcggaggg 120

  tctgggggcg agtttgggta tacacgggcg cgcacacttg aaggaacgct caaggacgac 180

  agcggaggcg tggagacagc gccggcccaa gcagcctgta cttgtagctg ctggtcagct 240

  gaggcatcac gacttgggac cagcacccgg cctcacggtt gcacaaggcc atcaccgcgc 300

  gccaccaccc acgcctcttc aaacccatgc cggcacctac cgctacccct gtgacacgct 360

  ccgcacacgc cgccccgcac accccaccat gtgacag 397

  <210> 146

  <211> 156

  <212> DNA

  <213> 莱茵衣藻

  <400> 146

  gtgagagcga ggcgcggggc gtgctctgca ggctagggtg aagatcagga gagccgaagc 60

  gggcccgaac agcgcagaga gaggcaagac gacacccctg ccgcgttttg atcacaagat 120

  tcacaccctt gctctcccca acgctcccgc acatag 156

  <210> 147

  <211> 476

  <212> DNA

  <213> 莱茵衣藻

  <400> 147

  gtgagcaggg gcagataggc ggtcgggcgg ctgggcggca ggggctgtgt tggctgtgtt 60

  gggtgtgggc tgaggctggt gggtgggctg gcgggtggca gggatagcgg tgaggggatg 120

  gtgatggggc agaatgggcg ggtgggcgga cacgtggggt cgttgaaggg tgtgtgggga 180

  cggcaactgg tatgcgatat gtcggcttgg ccctggcggg gaaagcattc gcagaatggc 240

  gcacgaacga ggccggggag cgagcgggga tgggagacgc aacctgcgct gcgaagtgcg 300

  gcgcgcgctc cagttgacac gttgcacgaa tgtggccagt gttcgcctga gagttatggg 360

  ttagaccgcc agatgagccg gttaagctgg tggtcgcggt tgatcggctg cttcccttcc 420

  ggttgcacgc ctggcaccct aacattaccc tgtccgctgc tgccctttgc ccacag 476

  <210> 148

  <211> 191

  <212> DNA

  <213> 莱茵衣藻

  <400> 148

  gtgagtgcag ctgccgctgc ggctgctgat ggtgacctgt gcgaccacgg ggctccgcat 60

  ttctggacga agcgttgtac catagccgtc ttggtccctg atttgggccg gctctggtcc 120

  gaagccttga catctacagt tcaacatggc cgtataacga tcctgtgccc acccacacgc 180

  caccccgcca g 191

  <210> 149

  <211> 212

  <212> DNA

  <213> 莱茵衣藻

  <400> 149

  gtgagcgcgc gctctacgat acggcagaca tgtacacact gcggcgcact gtagagcttg 60

  cattgcattt caaggcctcg aaagagtagg gtggtcgttc tctggtggtg tccggccaca 120

  attatgcacc ccggtgttgg tgcagcagct gtgatgtcac accttgcatc acccccctac 180

  tgctgccgcc tctcctctct tctcgcccgc ag 212

  <210> 150

  <211> 211

  <212> DNA

  <213> 莱茵衣藻

  <400> 150

  gtgagcagag caatattgca gagggaaggg tggcggaagg gtgataacgg ttggggatct 60

  agaggggcga gatggatgca cacagcgcgg ggttggttat gcatgcctgc atggacgcgt 120

  gcacgcaccc ctgatctgcc ggttttccaa ctggcgatgc cgtattatga cctgcagctc 180

  accatcctca tgcttgattt gcctcgctca g 211

  <210> 151

  <211> 417

  <212> PRT

  <213> 莱茵衣藻

  <400> 151

  Met Ala Leu Asn Met Arg Val Ser Ser Ser Lys Val Ala Ala Lys Gln

  1 5 1015

  Gln Gly Arg Ile Ser Ala Val Pro Val Val Ser Ser Lys Val Ala Ser

  202530

  Ser Ala Arg Val Ala Pro Phe Gln Gly Ala Pro Val Ala Ala Gln Arg

  354045

  Ala Ala Leu Leu Val Arg Ala Ala Ala Ala Thr Glu Val Lys Ala Ala

  505560

  Glu Gly Arg Thr Glu Lys Glu Leu Gly Gln Ala Arg Pro Ile Phe Pro

  65707580

  Phe Thr Ala Ile Val Gly Gln Asp Glu Met Lys Leu Ala Leu Ile Leu

  859095

  Asn Val Ile Asp Pro Lys Ile Gly Gly Val Met Ile Met Gly Asp Arg

  100 105 110

  Gly Thr Gly Lys Ser Thr Thr Ile Arg Ala Leu Ala Asp Leu Leu Pro

  115 120 125

  Glu Met Gln Val Val Ala Asn Asp Pro Phe Asn Ser Asp Pro Thr Asp

  130 135 140

  Pro Glu Leu Met Ser Glu Glu Val Arg Asn Arg Val Lys Ala Gly Glu

  145 150 155 160

  Gln Leu Pro Val Ser Ser Lys Lys Ile Pro Met Val Asp Leu Pro Leu

  165 170 175

  Gly Ala Thr Glu Asp Arg Val Cys Gly Thr Ile Asp Ile Glu Lys Ala

  180 185 190

  Leu Thr Glu Gly Val Lys Ala Phe Glu Pro Gly Leu Leu Ala Lys Ala

  195 200 205

  Asn Arg Gly Ile Leu Tyr Val Asp Glu Val Asn Leu Leu Asp Asp His

  210 215 220

  Leu Val Asp Val Leu Leu Asp Ser Ala Ala Ser Gly Trp Asn Thr Val

  225 230 235 240

  Glu Arg Glu Gly Ile Ser Ile Ser His Pro Ala Arg Phe Ile Leu Val

  245 250 255

  Gly Ser Gly Asn Pro Glu Glu Gly Glu Leu Arg Pro Gln Leu Leu Asp

  260 265 270

  Arg Phe Gly Met His Ala Gln Ile Gly Thr Val Lys Asp Pro Arg Leu

  275 280 285

  Arg Val Gln Ile Val Ser Gln Arg Ser Thr Phe Asp Glu Asn Pro Ala

  290 295 300

  Ala Phe Arg Lys Asp Tyr Glu Ala Gly Gln Met Ala Leu Thr Gln Arg

  305 310 315 320

  Ile Val Asp Ala Arg Lys Leu Leu Lys Gln Gly Glu Val Asn Tyr Asp

  325 330 335

  Phe Arg Val Lys Ile Ser Gln Ile Cys Ser Asp Leu Asn Val Asp Gly

  340 345 350

  Ile Arg Gly Asp Ile Val Thr Asn Arg Ala Ala Lys Ala Leu Ala Ala

  355 360 365

  Phe Glu Gly Arg Thr Glu Val Thr Pro Glu Asp Ile Tyr Arg Val Ile

  370 375 380

  Pro Leu Cys Leu Arg His Arg Leu Arg Lys Asp Pro Leu Ala Glu Ile

  385 390 395 400

  Asp Asp Gly Asp Arg Val Arg Glu Ile Phe Lys Gln Val Phe Gly Met

  405 410 415

  Glu

  <210> 152

  <211> 721

  <212> PRT

  <213> 人工序列

  <220>

  <223> 红藻CHLH突变蛋白质序列

  <400> 152

  Met Gln Thr Ser Ser Leu Leu Gly Arg Arg Thr Ala His Pro Ala Ala

  1 5 1015

  Gly Ala Thr Pro Lys Pro Val Ala Pro Ser Pro Arg Val Ala Ser Thr

  202530

  Arg Gln Val Ala Cys Asn Val Ala Thr Gly Pro Arg Pro Pro Met Thr

  354045

  Thr Phe Thr Gly Gly Asn Lys Gly Pro Ala Lys Gln Gln Val Ser Leu

  505560

  Asp Leu Arg Asp Glu Gly Ala Gly Met Phe Thr Ser Thr Ser Pro Glu

  65707580

  Met Arg Arg Val Val Pro Asp Asp Val Lys Gly Arg Val Lys Val Lys

  859095

  Val Val Tyr Val Val Leu Glu Ala Gln Tyr Gln Ser Ala Ile Ser Ala

  100 105 110

  Ala Val Lys Asn Ile Asn Ala Lys Asn Ser Lys Val Cys Phe Glu Val

  115 120 125

  Val Gly Tyr Leu Leu Glu Glu Leu Arg Asp Gln Lys Asn Leu Asp Met

  130 135 140

  Leu Lys Glu Asp Val Ala Ser Ala Asn Ile Phe Ile Gly Ser Leu Ile

  145 150 155 160

  Phe Ile Glu Glu Leu Ala Glu Lys Ile Val Glu Ala Val Ser Pro Leu

  165 170 175

  Arg Glu Lys Leu Asp Ala Cys Leu Ile Phe Pro Ser Met Pro Ala Val

  180 185 190

  Met Lys Leu Asn Lys Leu Gly Thr Phe Ser Met Ala Gln Leu Gly Gln

  195 200 205

  Ser Lys Ser Val Phe Ser Glu Phe Ile Lys Ser Ala Arg Lys Asn Asn

  210 215 220

  Asp Asn Phe Glu Glu Gly Leu Leu Lys Leu Val Arg Thr Leu Pro Lys

  225 230 235 240

  Val Leu Lys Tyr Leu Pro Ser Asp Lys Ala Gln Asp Ala Lys Asn Phe

  245 250 255

  Val Asn Ser Leu Gln Tyr Trp Leu Gly Gly Asn Ser Asp Asn Leu Glu

  260 265 270

  Asn Leu Leu Leu Asn Thr Val Ser Asn Tyr Val Pro Ala Leu Lys Gly

  275 280 285

  Val Asp Phe Ser Val Ala Glu Pro Thr Ala Tyr Pro Asp Val Gly Ile

  290 295 300

  Trp His Pro Leu Ala Ser Gly Met Tyr Glu Asp Leu Lys Glu Tyr Leu

  305 310 315 320

  Asn Trp Tyr Asp Thr Arg Lys Asp Met Val Phe Ala Lys Asp Ala Pro

  325 330 335

  Val Ile Gly Leu Val Leu Gln Arg Ser His Leu Val Thr Gly Asp Glu

  340 345 350

  Gly His Tyr Ser Gly Val Val Ala Glu Leu Glu Ser Arg Gly Ala Lys

  355 360 365

  Val Ile Pro Val Phe Ala Gly Gly Leu Asp Phe Ser Ala Pro Val Lys

  370 375 380

  Lys Phe Phe Tyr Asp Pro Leu Gly Ser Gly Arg Thr Phe Val Asp Thr

  385 390 395 400

  Val Val Ser Leu Thr Gly Phe Ala Leu Val Gly Gly Pro Ala Arg Gln

  405 410 415

  Asp Ala Pro Lys Ala Ile Glu Ala Leu Lys Asn Leu Asn Val Pro Tyr

  420 425 430

  Leu Val Ser Leu Pro Leu Val Phe Gln Thr Thr Glu Glu Trp Leu Asp

  435 440 445

  Ser Glu Leu Gly Val His Pro Val Gln Val Ala Leu Gln Val Ala Leu

  450 455 460

  Pro Glu Leu Asp Gly Ala Met Glu Pro Ile Val Phe Ala Gly Arg Asp

  465 470 475 480

  Ser Asn Thr Gly Lys Ser His Ser Leu Pro Asp Arg Ile Ala Ser Leu

  485 490 495

  Cys Ala Arg Ala Val Asn Trp Ala Asn Leu Arg Lys Lys Arg Asn Ala

  500 505 510

  Glu Lys Lys Leu Ala Val Thr Val Phe Ser Phe Pro Pro Asp Lys Gly

  515 520 525

  Asn Val Gly Thr Ala Ala Tyr Leu Asn Val Phe Gly Ser Ile Tyr Arg

  530 535 540

  Val Leu Lys Asn Leu Gln Arg Glu Gly Tyr Asp Val Gly Ala Leu Ser

  545 550 555 560

  Ala Leu Gly Gly Gly Ser Asp Pro Val Gly Ala Asp Pro Glu Gly Gly

  565 570 575

  Gln Val Gln Leu Asp Arg Pro Ala His Arg Leu Gln Asp Glu Gly Gly

  580 585 590

  Arg Val Pro Glu Ala Val Pro Leu Arg Arg Gly Ala Gly Gly Glu Leu

  595 600 605

  Gly Gln Ala Pro Arg His Pro Glu His Gln Arg Pro Gly Ala Ala Gly

  610 615 620

  Val Arg Pro Pro Val Arg Gln Arg Leu His Arg Arg Ala Ala His Leu

  625 630 635 640

  Arg Leu Arg Gly Arg Pro Asp Ala Pro Ala Val Leu Glu Val Gly Gln

  645 650 655

  Pro Pro Pro Arg Leu Arg Arg Leu Leu His Leu Pro Gly Glu Asp Leu

  660 665 670

  Gln Gly Arg Arg Arg Ala Ala Leu Arg His Pro Arg Leu Ala Gly Val

  675 680 685

  His Ala Arg Gln Ala Gly Arg His Val Gly Cys Val Leu Pro Arg Leu

  690 695 700

  Ala Asp Arg His His Pro Gln Pro Leu Leu Leu Arg Arg Gln Gln Pro

  705 710 715 720

  Val

  <210> 153

  <211> 1254

  <212> DNA

  <213> 莱茵衣藻

  <400> 153

  atggccctga acatgcgtgt ttcctcttcc aaggtcgctg ccaagcagca gggccgcatc 60

  tccgcggtgc cggttgtgtc gagcaaggtg gcctcctccg cccgcgtggc ccccttccag 120

  ggcgctcccg tggccgcgca gcgcgctgct ctgctggtgc gcgccgctgc cgctactgag 180

  gtcaaggctg ctgagggccg cactgagaag gagctgggcc aggcccgccc catcttcccc 240

  ttcaccgcca tcgtgggcca ggatgagatg aagctggcgc tgattctgaa cgtgatcgac 300

  cccaagatcg gtggtgtcat gatcatgggc gaccgtggca ctggcaagtc caccaccatt 360

  cgtgccctgg cggatctgct gcccgagatg caggtggttg ccaacgaccc ctttaactcg 420

  gaccccaccg accccgagct gatgagcgag gaggtgcgca accgcgtcaa ggccggcgag 480

  cagctgcccg tgtcttccaa gaagattccc atggtggacc tgcccctggg cgccactgag 540

  gaccgcgtgt gcggcaccat cgacatcgag aaggcgctga ccgagggtgt caaggcgttc 600

  gagcccggcc tgctggccaa ggccaaccgc ggcatcctgt acgtggatga ggtcaacctg 660

  ctggacgacc acctggtcga tgtgctgctg gactcggccg cctccggctg gaacaccgtg 720

  gagcgcgagg gtatctccat cagccacccc gcccgcttca tcctggtcgg ctcgggcaac 780

  cccgaggagg gtgagctgcg cccccagctg ctggatcgct tcggcatgca cgcccagatc 840

  ggcaccgtca aggacccccg cctgcgtgtg cagatcgtgt cgcagcgctc gaccttcgac 900

  gagaaccccg ccgccttccg caaggactac gaggccggcc agatggcgct gacccagcgc 960

  atcgtggacg cgcgcaagct gctgaagcag ggcgaggtca actacgactt ccgcgtcaag 1020

  atcagccaga tctgctcgga cctgaacgtg gacggcatcc gcggcgacat cgtgaccaac 1080

  cgcgccgcca aggccctggc cgccttcgag ggccgcaccg aggtgacccc cgaggacatc 1140

  taccgtgtca ttcccctgtg cctgcgccac cgcctccgga aagaccccct ggctgagatc 1200

  gacgacggtg accgcgtgcg tgagatcttc aagcaggtgt tcggcatgga gtaa 1254

《藻类中过量产生原卟啉IX的方法及由此产生的组合物.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)