欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 用于对核酸进行测序的组合物和方法独创技术319731字

用于对核酸进行测序的组合物和方法

2021-02-07 08:59:25

用于对核酸进行测序的组合物和方法

  序列表

  本申请含有以ASCII格式电子提交并整体通过参考并入本文的序列表。所述在2018年2月14日生成的ASCII拷贝名为51178-003WO2_Sequence_Listing_2.14.18_ST25,大小为125,690个字节。

  技术领域

  本发明总的来说涉及核酸(例如DNA)测序,并且更具体来说涉及人工核酸、包括人工核酸和转座酶的组合物以及将其用于例如文库制备和测序的方法。

  背景技术

  核酸(例如DNA)测序已变成现代生物学的不可或缺的部分,并具有广泛应用,例如物种(例如病原体)的鉴定和分类、遗传异常例如与疾病相关的突变的鉴定、测量细胞中存在的RNA转录本以及许多其他应用。当前的方法包括大规模并行或“下一代”测序(NGS),其允许在单次测序运行中并行处理许多核酸。NGS通过极大提高测序速度并在同时降低成本,已彻底改革了基因组学和分子生物学。一般来说,NGS方法包括从待测序的靶核酸制备模板核酸的文库,从所述文库获得序列数据,以及组装所述序列数据以推断所述靶核酸的序列。大多数NGS方法利用具有小片段(通常在数百个碱基对的量级上)的测序文库,这部分是由所述方法的技术限制造成的。得到的短读出数据通常通过与参比序列比对进行计算组装,以推断所述靶核酸的序列。

  当前用于NGS的文库制备方法的限制之一在于所述文库中的每个片段通常仅代表大得多的原始源靶核酸的非常小的碎片。例如,所述文库中的片段可能仅为几百个核苷酸长,而所述源靶核酸可能是染色体或整个基因组。这使得难以使用当前的文库制备方法来测序DNA、特别是全基因组,因为在较长距离(例如数千或数百万个碱基)内碱基的邻近关系,只能通过尝试将较小片段交叠进行计算推断(在被称为从头序列组装的计算过程中)。常规NGS文库制备方法的固有的“短程”限制,将当前的DNA测序方法的应用限制到可以使用相对均匀、高纯度样品进行的测序。另外,文库片段的小尺寸使得文库片段极不可能源自于同一个靶核酸分子。

  因此,对可用于文库制备和测序并能获得长距离连接和序列信息的以及可用于制备具有高比例的源自于同一个靶核酸分子的片段的文库的组合物和方法,仍存在着需求。

  发明内容

  总的来说,本发明涉及多价拴系突触复合体(TSC)、用于这些TSC的合成的试剂以及它们的使用方法。

  一方面,本发明提供了一种多价转座酶试剂,其具有水溶性多价核心、带有具有转座酶结合位点(TBS)的第一末端的第一人工核酸、带有具有TBS的第一末端的第二人工核酸、和带有具有连接水溶性多价核心的TBS的第一末端的第三人工核酸。

  在某些实施方式中,所述第一人工核酸、第二人工核酸或第三人工核酸通过由偶联反应产生的共价键连接到所述可溶性多价核心,所述偶联反应例如叠氮化物-炔烃Huisgen环加成、酰胺或硫代酰胺键形成、周环反应、Diels-Alder反应、磺酰胺键形成、醇或酚烷基化、缩合反应、二硫键形成或亲核取代。例如,所述偶联反应是叠氮化物-炔烃Huisgen环加成,例如铜(I)催化的叠氮化物-炔烃环加成(CuAAC)或应变助催的叠氮化物-炔烃环加成(SPAAC)。

  在其他实施方式中,所述第一人工核酸、第二人工核酸或第三人工核酸非共价地连接到所述可溶性多价核心。例如,所述第一人工核酸、第二人工核酸或第三人工核酸通过亲和结合对连接到所述可溶性多价核心,所述亲和结合对例如生物素-链亲和素、生物素-亲和素、配体-受体、抗原-抗体或抗原结合片段、或者Ig结合蛋白-Ig。在某些实施方式中,所述亲和结合对包括生物素-链亲和素或生物素-亲和素。所述亲和结合对可以包括结合第二亲和组分的第一亲和组分,其中所述第一亲和组分被连接到所述可溶性多价核心,并且所述第二亲和组分被连接到所述第一人工核酸、第二人工核酸或第三人工核酸。

  在其他实施方式中,所述试剂还包括结合到所述第一人工核酸、第二人工核酸和第三人工核酸的TBS的第一转座酶、第二转座酶和第三转座酶。所述试剂还可以包括带有具有TBS的第一末端并被连接到所述可溶性多价核心的第四人工核酸,并且第四转座酶可以被结合到所述第四人工核酸的TBS。当两种或更多种转座酶被结合到所述试剂时,它们可形成寡聚化对,例如所述第一转座酶、第二转座酶、第三转座酶和第四转座酶中的至少两者可形成寡聚化对。在其他实施方式中,所述第一转座酶和第二转座酶形成第一突触复合体,并且所述第三转座酶和第四转座酶形成第二突触复合体。

  所述试剂还可以包括第五转座酶和第六转座酶,其中所述第一转座酶和第五转座酶被寡聚化以形成第一突触复合体,并且所述第二转座酶和第六转座酶被寡聚化以形成第二突触复合体,其中所述第五转座酶和第六转座酶被结合到各自带有具有TBS的第一末端的接头核酸。

  在某些实施方式中,所述试剂还包括多个另外的人工核酸,每个另外的人工核酸带有具有TBS的第一末端,并且每个另外的人工核酸被连接到所述多价核心。多个另外的转座酶也可被结合到所述多个另外的人工核酸的TBS,其中成对的所述多个另外的转座酶被寡聚化以形成突触复合体。例如,所述试剂包括3至1000个之间的突触复合体,例如3至12个之间的突触复合体。

  另一方面,本发明提供了一种多价转座酶试剂,其包括水溶性多价核心和连接到所述可溶性多价核心的三个或更多个突触复合体,每个所述突触复合体包括第一转座酶和第二转座酶。所述第一转座酶被结合到具有TBS的第一人工核酸,所述第二转座酶被结合到具有TBS的第二人工核酸,并且所述第一转座酶和第二转座酶被寡聚化。在某些实施方式中,每个突触复合体的所述第一人工核酸和第二人工核酸被连接到所述可溶性多价核心。在可选实施方式中,至少一个突触复合体的所述第一人工核酸或第二人工核酸不被连接到所述可溶性多价核心。对本发明的任何所述试剂来说,所述可溶性多价核心可以是聚合物、核酸、肽、多肽、蛋白质或胶束。在某些实施方式中,所述可溶性多价核心是聚合物例如支化聚合物,如星状聚合物、梳状聚合物、刷状聚合物、超支化聚合物或树枝状聚合物。示例性的聚合物是基于聚乙二醇(PEG)的聚合物例如PEG树枝状聚合物或多臂PEG(例如3臂PEG、4臂PEG、6臂PEG或8臂PEG)。在其他实施方式中,所述可溶性多价核心是例如约20至约1000bp之间、例如约250至约500bp之间的核酸。例如,所述可溶性多价核心是DNA,例如双链DNA。在其他实施方式中,所述可溶性多价核心是蛋白质例如多亚基蛋白,例如亲和素或链亲和素。

  在本发明的任何所述试剂的其他实施方式中,所述试剂的多个所述人工核酸包括可识别序列标签(IST)。每个IST可以是一致的,或者至少两个IST不是一致的。

  另一方面,本发明描述了一种对靶核酸进行测序的方法,所述方法包括:将本文中描述的试剂中的任一者与靶核酸在一定条件下组合一定时间,所述条件和时间足以使所述试剂执行转座事件;将所述靶核酸片段化,并任选地向核酸片段的生成的末端添加多核苷酸;选择包括由所述转座事件产生的核酸序列的DNA片段;扩增所选择的片段;以及对扩增的片段进行测序。在某些实施方式中,所述片段化可以包括标签片段化(tagmentation)(例如通过将所述靶核酸与可溶性转座体复合体组合)或随机剪切和接头连接。在某些实施方式中,所述选择包括选择包含IST的核酸片段。在某些实施方式中,所述扩增包括聚合酶链反应(PCR)、多重置换扩增(MDA)、连接酶链反应(LCR)、环介导等温扩增(LAMP)、滚环扩增(RCA)或链置换扩增(SDA)。在某些实施方式中,所述测序包括合成法测序、连接法测序或纳米孔测序。在某些实施方式中,所述合成法测序包括IlluminaTM染料测序、单分子实时(SMRTTM)测序或焦磷酸测序。在某些实施方式中,所述连接法测序包括基于聚合酶克隆的测序(polony-based sequencing)或SOLiDTM测序。在某些实施方式中,所述方法还包括分析所测序的片段以鉴定由于存在从所述转座事件产生的核酸序列而可以被连接的所述靶核酸的片段。

  在任何上述方法的某些实施方式中,所述靶核酸包括来自于单个细胞的基因组DNA或cDNA。在其他实施方式中,所述靶核酸包括来自于多个单体型的核酸。在某些实施方式中,所述扩增的片段的序列被用于进行从头序列组装。在某些实施方式中,所述靶核酸通过来自于单个或多个细胞的组蛋白或染色质交联。在某些实施方式中,所述靶核酸已被凝缩或任选地用一种或多种凝缩剂处理。

  另一方面,本发明提供了一种试剂盒,其包含本文中描述的任一试剂和一种或多种另外的试剂。所述一种或多种另外的试剂可以包括一种或多种可溶性转座体(例如标签片段化试剂)、辅因子、缓冲溶液或参比核酸。在某些实施方式中,所述辅因子是二价金属阳离子(例如镁阳离子)。

  本文中描述的任何试剂盒还可以包括用于核酸测序的试剂。在某些实施方式中,所述试剂选自寡核苷酸引物、底物、酶、和核苷酸的混合物。另一方面,本发明提供了一种核酸,其包含在SEQ ID NO:1-480的任一者中阐明的核酸序列、其片段或与SEQ ID NO:1-480的任一者中阐明的核酸序列具有约80%、约85%、约90%、约95%、约96%、约97%、约98%或约99%序列一致性的序列或其互补序列,或者由这些序列组成。

  另一方面,本发明提供了本文中描述的多种任何试剂的混合物。在某些实施方式中,所述多种试剂中的至少两个成员包括不同的IST。所述混合物可以包括至少10、100、500、1000、10,000或100,000种不同试剂,例如不同之处在于IST。

  另一方面,本发明提供了一种文库,其通过将本文中描述的任何试剂与靶核酸在一定条件下组合一定时间而产生,所述条件和时间足以使所述试剂执行转座事件。在某些实施方式中,所述文库包括核酸,所述核酸包含在SEQ ID NO:1-480的任一者中阐明的核酸序列、其片段或与SEQ ID NO:1-480的任一者中阐明的核酸序列具有约80%、约85%、约90%、约95%、约96%、约97%、约98%或约99%序列一致性的序列或其互补序列,或者由这些序列组成。

  定义

  术语“约”在本文中用于指示一个值由于用于确定所述值的装置或方法而包括固有的误差变动,或指示所陈述的值的加或减10%,以较大者为准。

  术语“亲和结合对”是指一对结合并形成复合体的组成部分。一般来说,在本发明中使用的亲和结合对非共价地相互作用。示例性的亲和结合对包括但不限于生物素-生物素结合蛋白(例如生物素-链亲和素和生物素-亲和素)、配体-受体、抗原-抗体或抗原结合片段、半抗原-抗半抗原抗体和免疫球蛋白(Ig)结合蛋白-Ig。亲和结合对的成员可以具有任何适合的结合亲和性。例如,亲和结合对的成员可以以约10-5M、10-6M、10-7M、10-8M、10-9M、10-10M、10-11M、10-12M、10-13M、10-14M、10-15M或更低的平衡结合常数(KD)结合。

  当在本文中使用时,“氨基酸序列”是指肽、多肽或蛋白质序列及其片段或部分,并且是指天然存在的或合成的分子。术语“蛋白质”和“多肽”在本文中可互换使用。

  术语“生物活性变体”是指与参比组成部分(例如“母体”分子或模板)相似但不一致,并且表现出足够的活性使得可用于本文中描述的一种或多种组合物或方法(例如代替所述参比组成部分)的组成部分。在某些情况下,所述参比组成部分是天然存在的,其生物活性变体则不是。例如,在所述参比组成部分是天然存在的核酸序列的情况下,其生物活性变体包括有限数目的非天然存在的核苷酸,可以具有不同于它的天然存在的对应物的核酸序列(例如相差一个或多个插入、缺失和/或替换),或者可以在其他方面不同于它的天然存在的对应物。例如,本文中描述的核酸(和含有它们的多价转座酶试剂和拴系突触复合体)可以包括转座酶结合位点(TBS),其不同于天然存在的TBS,然而保留了结合转座酶并在本发明的组合物和方法中起作用的能力。在所述参比组成部分是天然存在的蛋白质的情况下,其生物活性变体可以包括有限数目的非天然存在的氨基酸,可以具有不同于它的天然存在的对应物的肽序列,或者可以在其他方面不同于它的天然存在的对应物(例如凭借翻译后修饰(例如它的糖基化模式可能不同))。所述参比组成部分也可以是非天然存在的。

  “偶联反应”是导致共价键形成的反应。出于本公开的目的,偶联反应不包括磷酸二酯键的形成。偶联反应的非限制性实例包括环加成(例如叠氮化物-炔烃Huisgen环加成(例如铜(I)催化的叠氮化物-炔烃环加成(CuAAC)或应变助催的叠氮化物-炔烃环加成(SPAAC)))、酰胺或硫代酰胺键形成、周环反应、Diels-Alder反应、磺酰胺键形成、醇或酚烷基化、缩合反应、二硫键形成和亲核取代。

  “远端位点”是靶DNA上位于距参比点约100碱基对(bp)至约2千万bp之间的位置。例如,远端位点可以距参比点约100bp、约200bp、约500bp、约1000bp、约5000bp、约10,000bp、约20,000bp、约50,000bp、约100,000bp、约250,000bp、约500,000bp、约750,000bp、约1百万bp、约5百万bp、约1千万bp、约1千5百万bp或约2千万bp。两个位点(例如“A”和“B”),当A位于距B约100bp至2千万bp之间时,这两个位点可以被称为远端位点。

  “可识别序列标签”(IST)是指可以被识别并用作可转座核酸已被转座到靶核酸中的标志物的任何核酸序列。所述IST可以是随机、半随机或非随机的。在某些实施方式中,IST可以是核酸条形码。IST可以包括例如约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100个或更多个连续核苷酸。可转座核酸可以包括例如1、2、3、4、5、6、7、8、9、10个或更多个IST。

  当在本文中使用时,术语“融合蛋白”是指含有两种或更多种蛋白质的所有或一部分氨基酸序列的组合物。例如,融合蛋白可以包括转座酶和多肽靶向组成部分。融合蛋白可以在所述蛋白的氨基酸序列之间包括一个或多个连接物。术语“部分”包括多肽的任何区域,例如片段(例如切割产物或重组生产的片段)或元件或结构域(例如多肽的具有活性例如核酸(例如DNA)结合活性的区域),其含有比全长或参比多肽更少的氨基酸(例如少约5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、95%或99%的氨基酸)。

  在本文中可互换使用的“连接区段”或“连接物”是指配置在两个序列(例如核酸或多肽序列)之间并且连接所述两个序列的元件。所述连接可以是共价或非共价的。连接区段可以包括例如核苷酸、核酸、非核苷酸化学组成部分(例如聚乙基链)、氨基酸、肽或多肽。核酸连接区段可以包括例如约1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、120、140、160、180、200、225、250、275、300、400、500、1000、2000、5000个或更多个核苷酸。多肽连接区段可以包括例如约1、2、3、4、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、120、140、160、180、200、225、250、275、300、400、500、1000个或更多个氨基酸。

  “多价核心”意指含有超过两个能够被连接到包括TBS的核酸的连接位点的组成部分。所述连接位点可以被共价(即通过共价键)或非共价(例如通过亲和结合对)连接到包括TBS的核酸。多价核心可以具有例如3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、100、200、500、1000个或更多个连接位点。术语“水溶性多价核心”具体排除了固体基材(例如孔或珠子的表面)。多价核心的非限制性实例包括:聚合物,包括支化聚合物(例如星状聚合物、梳状聚合物、刷状聚合物、超支化聚合物和树枝状聚合物(例如聚(酰胺-胺)(PAMAM)树枝状聚合物));核酸(例如寡核苷酸或更长的核酸分子);肽、多肽或蛋白质(例如链亲和素和抗体或其抗原结合片段);和胶束。多价核心(例如水溶性多价核心)可以具有约15fg或更小、约14fg或更小、约13fg或更小、约12fg或更小、约11fg或更小、约10fg或更小、约9fg或更小、约8fg或更小、约7fg或更小、约6fg或更小、约5fg或更小、约4fg或更小、约3fg或更小、约2fg或更小、约1fg或更小、约1x10-16g或更小、约1x10-17克或更小、约1x10-18克或更小、约1x10-19克或更小或约1x10-20克或更小的质量。例如,在某些情况下,所述多价核心(例如水溶性多价核心)具有约1x10-20克至约15fg(例如约1x10-20克至约15fg、约1x10-20克至约10fg、约1x10-20克至约5fg、约1x10-20克至约1fg、约1x10-20克至约1x10-16g、约1x10-20克至约1x10-17g、约1x10-20克至约1x10-18g或约1x10-20克至约1x10-19g)的质量。

  在本文中可互换使用的术语“核酸”和“多核苷酸”是指至少两个连接的核苷酸单体。所述术语涵盖了例如脱氧核糖核酸(DNA)、核糖核酸(RNA)、其杂合体及其混合物。在核酸中核苷酸通常通过磷酸二酯键连接,尽管术语“核酸”也涵盖具有其他类型的连接或骨架(例如磷酰胺、硫代磷酸酯、二硫代磷酸酯、O-甲基氨基磷酸酯、吗啉代、锁核酸(LNA)、甘油核酸(GNA)、苏阿糖核酸(TNA)和肽核酸(PNA)连接或骨架等)的核酸类似物。所述核酸可以是单链的、双链的,或者含有单链和双链序列两者的部分。核酸可以含有脱氧核糖核苷酸和核糖核苷酸的任何组合,以及碱基包括例如腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、尿嘧啶和修饰或非标准碱基(包括例如次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶和5-羟甲基胞嘧啶)的任何组合。

  “人工核酸”是指非天然存在的核酸。这些人工核酸在某些方面与没有人为干预的天然存在的核酸在序列、化学组成和/或功能性质上有差异。

  当在本文中使用时,术语“可操作的连接”和“可操作连接”是指所描述的组分在物理或功能上的并置,以便允许它们以它们想要的方式发挥作用。例如,靶向组成部分可以与转座酶可操作连接(例如通过作为融合蛋白中的融合配偶体或通过以其他方式共价或非共价偶联),以便促进靶核酸(例如DNA)中特定序列处的转座。

  “突触复合体”意指包括一对寡聚化的转座酶(例如二聚化转座酶或转座酶的四聚体(例如二聚体的二聚体))的结构,其中所述一对中的每个转座酶被结合到TBS。事实上,包括两个TBS的核酸可以通过结合到每个TBS的转座酶的寡聚化形成突触复合体,所述寡聚化导致所述核酸的环化。在本发明的背景中,突触复合体包括一对寡聚化的转座酶,其中每个转座酶被结合到不同核酸分子上存在的TBS。因此,突触复合体构成了本文中所描述的较大分子复合体的一部分。例如,两个突触复合体可以被在每个末端处具有TBS的核酸拴系以产生如下文所描述的TSC,使得当与靶核酸(例如DNA)组合时,所述TSC表现出转座酶活性,切开所述靶核酸,并将所述拴系核酸(其可以包括例如可识别序列标签)连接到所述靶核酸(例如DNA)内的远端位点。

  “靶向组成部分”是指可以促进与核酸序列的偏好性或特异性结合的任何化合物(例如核酸或多肽)。例如,靶向组成部分可以是包括DNA结合结构域(DBD)例如锌指基序或转录激活子样(TAL)效应蛋白的多肽,RNA指导的核酸内切酶(例如Cas9、Cpf1和C2c2)、DNA指导的核酸内切酶(例如Argonaute)或其生物活性变体,包括核酸酶缺乏或无核酸酶变体,或杂交到核酸序列的寡核苷酸(例如RNA或DNA)。

  “靶核酸”是指感兴趣的任何核酸(例如DNA),其被选择用于使用本文中所描述的本发明的组合物(例如TSC)进行修饰或分析(例如序列分析)。本发明的方法可以使用从超过一个来源汇集的靶核酸(例如DNA)来进行。应该理解,所述靶核酸可以是例如DNA或RNA。在某些情况下,在用本发明的组合物(例如TSC)处理之前可以将RNA转变成cDNA。

  “拴系突触复合体”(TSC)是包括通过多价核心(例如水溶性多价核心)拴系的多个突触复合体的分子复合体。在某些实施方式中,所述TSC的亚基包括包含可识别序列标签的子序列。这些标签可用于将TSC的一个亚基与另一个亚基识别或区分开,或类似地将一个TSC与另一个TSC识别或区分开。此外,在某些实施方式中,由于所述TSC的亚基中的可识别序列标签被并入到所述靶核酸(例如DNA)上的第一位点中,而一致或相关的可识别序列标签被并入到所述靶核酸上的第二位点中(所述第一和第二位点彼此远离),因此人们可以凭借附连到同一个TSC的一致和/或相关的序列标签的存在,得出两个被测序的片段源自于同一靶核酸分子上的远端位点的结论。所述子序列也可以包括确定的寡核苷酸可以与其杂交的序列,以便充当例如用于扩增或测序的引物结合位点。

  “转移的”或“转座的”核酸是在转座事件中(例如在本文中描述的测序方法的情形中)被连接到靶核酸(例如DNA)的任何核酸。

  “可转座核酸”是能够参与有功能活性的TSC的形成并凭借在一个或两个末端上包含转座酶结合位点(TBS)而附连到靶核酸(例如DNA)的任何核酸。

  术语“转座酶”是指结合到转座酶结合位点(TBS)并且能够催化所述TBS以及结合的可转座核酸序列移动到不同的核酸(例如DNA)分子的组成部分。本质上,转座酶结合到转座子(也被称为可转座元件)的末端处的TBS,然后催化所述转座子移动到宿主基因组的不同位置。转座酶通常使用剪切和粘贴机制或复制型转座机制来实现核酸(例如DNA)序列的转座。转座酶通常作为寡聚体催化核酸转座。例如,Tn5转座酶作为二聚体催化转座,其中单体结合每个TBS。其他转座酶例如Mu(也被称为MuA)作为四聚体(二聚体的二聚体)催化转座,其中二聚体结合每个TBS。当在本文中使用时,术语“转座酶”是指结合到TBS的最小单元,并且可以包括例如一个转座酶蛋白(例如单体)或超过一个转座酶蛋白(例如二聚体)。转座酶是RNA酶H蛋白质超家族的成员,其特征在于包括DDE残基的活性位点,DDE残基螯合两个对催化来说关键的Mg++离子,并且总体结构体系和活性位点DDE被认为是与反转录病毒的整合酶RuvC和RnaseH几乎一致(参见例如Reznikoff,Mol.Microbiol.47(5):1199-1206,2003)。考虑到转座酶和反转录病毒的整合酶享有共同的活性位点结构体系(包括DDE活性位点)以及催化机制(例如转座子-供体骨架DNA切口产生和链转移),因此特意设想了反转录病毒的整合酶(例如人免疫缺陷病毒(HIV)-1、HIV-2、猴免疫缺陷病毒(SIV)和劳氏肉瘤病毒整合酶)和其他相关整合酶(例如逆转录转座子的整合酶例如酵母Ty整合酶(例如Ty1、Ty2、Ty3、Ty4和Ty5整合酶))也可用于本发明的情形中作为落于“转座酶”的范围之内。

  “转座酶结合位点”(TBS)是可以被转座酶选择性结合的核酸(例如DNA)序列。在特定实施方式中,所述序列是DNA序列。至少在本文中规定的条件下和/或在本发明的测序方法的情形中,通过转座酶活性附连到所述靶核酸(例如DNA)的转座酶结合位点保持被所述TSC内的转座酶选择性结合。

  “转座事件”是突触复合体切割靶核酸(例如DNA)并将可转座核酸(例如可以包括可识别序列标签的所述可转座核酸的全部或一部分)连接到切割的靶核酸的反应。在特定实施方式中,所述靶核酸是DNA。

  附图说明

  图1示出了对于由带条形码的拴系突触复合体(TSC)产生的读出来说,在已知的参比样品(NA12878人类gDNA)上相邻转座位点之间的距离的分布。

  图2示出了在相同TSC支架(连接的)与非相同TSC支架(未连接的)上的转座所递送的读出之间的相邻转座位点距离的分布。

  图3示出了将炔基修饰的含TBS的接头通过点击化学共价附连到具有叠氮化物修饰的核酸支架的手段。

  图4示出了能够以图3的方式生产带不同条形码的TSC支架的手段。

  图5示出了使用叠氮化物修饰的dCTP来生产具有大量叠氮化物碱基修饰的dsDNA支架。

  图6示出了DBCO修饰的寡核苷酸与叠氮化物修饰的dsDNA底物的反应,目的在于支持添加含TBS的接头。

  图7示出了通过在具有共价附连的接头序列的dsDNA底物上的锚定PCR来合成多价的带条形码的TSC支架。

  图8示出了用于制造TSC支架的锚定PCR的带支架的产物。

  图9示出了用作TSC支架的多臂PEG。

  图10示出了通过向带有四臂支架的含TBS的PEG底物添加转座酶来形成拴系突触复合体。

  图11示出了通过向带有八臂支架的含TBS的PEG底物添加转座酶来形成拴系突触复合体。

  图12示出了通过向带有96臂支架的含TBS的PEG底物添加转座酶来形成拴系突触复合体。

  图13示出了由单一TSC支架上的多个SC通过靶DNA的多个位点的带支架的转座所递送的连接的读出集的生成。实施例1中描述的文库制备试剂在单一试管中含有480种不同类型的多价TSC,并且每个单个TSC携带数百个一致的带条形码的接头。所述文库制备试剂将含有相同条形码的序列插入到单个靶DNA分子的分立的区域中。所述文库制备试剂将来自于单一TSC的许多带条形码的序列插入到单一靶DNA分子中(多个邻近的顺式转座事件)。所述带阴影的部分指示了在将双索引读出进行绘图后,具有来自于同一TSC的分相测序覆盖的区域(其中箭头指示测序读出的方向),然而,不带阴影的部分指示不具有来自于同一TSC的分相测序覆盖的区域。

  图14示出了拴系突触复合体聚合物的分子结构。将带条形码的寡核苷酸接头分子共价附连到合成的支架,然后将转座酶蛋白装载到该合成结构上以产生多个共同结合的突触复合体。

  图15示出了从TSC产生文库分子(例如用于测序)的方法。通过附连到支架骨架的两个或更多个突触复合体,在多个串联位点处用含P7的接头对DNA分子进行标签化。接下来,通过在P7接头添加位点的侧翼位点处对含P5的接头进行转座,使用溶液相转座体以产生可扩增的文库片段。

  图16示出了拴系突触复合体聚合物的分子结构。将带条形码的寡核苷酸接头分子共价附连到合成的支架,然后将转座酶蛋白装载到该合成结构上以产生多个共同结合的突触复合体。下方的图是示出了根据相位读出距离的转座事件的百分率的图。大约20%的转座事件是近端连接的,约80%的转座事件是远端连接的。

  图17示出了使用带条形码的TSC的混合物处理人类基因组DNA样品的工作流程的示意图。所述TSC混合物允许复合体混合物中的各个DNA分子被统计学分配在具有大量条形码中的任一者的TSC复合体上。然后使用条形码信息将将得到的测序读出指派到原始的感兴趣的长DNA分子。

  图18示出了在人类靶DNA上由带支架的转座产生的观察到的连接转座事件的数目随所述连接转座事件之间的作图距离(bp)的变化。

  图19示出了在人类靶DNA上的转座事件的数目(深灰色条)随距离具有相同条形码的最近的转座事件的作图距离(bp)的变化,并与在所述条形码经历随机排列之后同一数据集的分析(浅灰色条)进行比较。

  详细描述

  本发明提供了核酸、多价转座酶试剂、多价拴系突触复合体(TSC)、TSC修饰的文库和它们的使用方法。下面将描述本发明所包括的具体组合物和方法,其实例和代表性实施方式示出在图1至图19中。这些实例和实施方式不应该被理解或解释为代表了所要求保护的方法和组合物的所有可能的实施方式或修改。

  一方面,本发明的组合物包括本文中描述的TSC,其被我们开发以允许发生多个不同的转座事件,导致已知的核酸(例如DNA)货物分子(例如可识别序列标签)插入到靶核酸(例如DNA)内相隔数百、数千或甚至数百万个碱基对的位点中。另一方面,本发明描述了使用本文中描述的组合物(例如TSC),从原始核酸源获得核酸(例如DNA)分子文库的方法。这些文库可用于确定感兴趣的模板核酸(例如基因组)的序列。所述方法可以从每个文库分子上的两个或更多较短的序列保留并制造可读信息,每个文库分子源自于同一原始核酸(例如DNA)分子上的两个潜在的远端区域。

  本文中描述的组合物(例如TSC)和方法可用于广泛类型的测序应用,特别是需要在靶核酸(例如DNA)中并入确定的核酸序列(例如可识别序列标签)的测序应用。本发明的方法通过连接存在于同一原始DNA分子上的区域,产生了核酸(例如DNA)长区段的完整序列信息的更准确且有价值的观察。所述组合物和方法可用于例如获得全相位解析序列信息,并且能够克服大多数NGS仪器强加的长度限制。正如在下文中新一步详细描述的,所述组合物和方法也提高组装更长区域、解析困难的重复区域、为复合杂合子分相和准确鉴定RNA剪接亚型的能力。

  用于拴系突触复合体的多价核心分子的制造方法

  本发明提供了包括一个或多个多价核心的TSC。可以使用任何适合的多价核心。例如,用于生产实施例1中描述的基于DNA的多价核心分子的模板源自于天然存在的DNA。本领域中已知的各种不同方法可用于获取具有特定所需或有利属性的核心分子;这些对TSC核心分子的修饰可以得到通过它们的长度、转座酶结合位点的密度和其他属性而特别适合于不同末端应用的TSC。

  例如,用于拴系突触复合体的位点之间的平均间距可以通过在聚合酶延伸反应中修改修饰核苷酸与天然核苷酸的比率来调整。修改用于拴系的位点之间的距离的另一种手段是选择具有不同G+C含量的天然存在的模板。或者,可以通过寡核苷酸合成来制造用于生产多价核心分子的非天然核酸模板。如果充当用于拴系的位点的修饰核苷酸或含有修饰核苷酸的寡核苷酸通过模板依赖性酶活性(例如通过聚合酶或通过连接)来并入,或者如果通过序列特异性杂交来并入,则用于拴系的位点之间的间距可以通过设计合成的模板分子来精确控制,所述合成模板分子产生以任何规定的间距带有修饰核苷酸的多价核心。所述多价核心分子的长度可以通过用于生产它的模板的长度来修改。用于生产多价核心的模板的实例可以是DNA、RNA或以模板依赖性方式支持核酸杂交的任何聚合物例如PNA(肽核酸)。RNA多价核心可以从天然或合成的DNA模板,使用DNA依赖性RNA聚合酶和修饰的核苷酸例如5-叠氮-PEG4-CTP(5-叠氮-PEG4-胞苷-5'-三磷酸)或通过将修饰的RNA在杂交到DNA模板后连接来生产。考虑到基于RNA的多价核心在DNA模板上的组装的上述描述,对本领域技术人员来说可以明显看出,基于DNA的多价核心可以在RNA模板上组装,或者基于RNA的多价核心可以在RNA模板上组装,并且此外,在杂交到所述模板分子后,所述模板的某些实施方式可以利用酶法扩增、连接、亲和或化学反应(例如叠氮化物炔烃Huisgen环加成反应,通常也被称为点击化学),用来附连多价核心组分。在某些实施方式中,所述模板可用于指导所述多价核心组装一次,而在其他实施方式中,所述模板可重复用于从单一模板组装许多多价核心分子。如实施例1中所述,核酸可以被适合地修饰用于附连到多价核心分子(参见图3和图4),其中用5’-DBCO(二苯并环辛基)修饰的寡核苷酸通过点击化学反应(SPAAC)被附连到所述多价核心分子上存在的叠氮化物基团。此外,对于通过点击化学反应的固定化来说,DBCO可以被提供在所述多价核心分子上,而叠氮化物基团可以作为修饰的碱基提供在待附连的核酸上。存在各种不同的可溶性聚合材料,它们具有可充当多价核心用于附连核酸的反应性基团。这些可溶性聚合材料包括但不限于含叠氮化物的聚乙二醇,可以从CreativePEGworks商购到不同分子量的聚乙二醇,例如:叠氮化物-PEG-叠氮化物,4臂PEG-叠氮化物(核酸接头通过点击化学附连到4臂PEG-叠氮化物和随后具有Tn5转座酶的两个TSC的形成,分别示出在图9和图10中),和8臂PEG-叠氮化物(在核酸接头的点击化学附连后具有Tn5转座酶的四个TSC的形成示出在图11中)。此外,来自于Polymer Factory的支化树枝状聚合物带有连接到三羟甲基丙烷核心的6–96个叠氮化物末端基团(示出在图12中),并且也可以使用点击化学反应与适合修饰的核酸反应。这些实例不应被解释为限制,已知用于将核酸稳定地连接到其他分子的几乎任何方法可用于将核酸附连到多价核心分子,其最终可以使用本文中描述的组合物和方法用于形成TSC。

  图13示出了如何可以将源自于单个靶DNA分子的连接的带条形码的读出组装成长读出序列。

  图14示出了示例性拴系突触复合体聚合物,其中每个支架的带条形码的接头分子是独特的。

  图17示出了使用TSC制备并测序靶DNA的示例性工作流程。

  本发明的组合物

  本发明提供了包括人工核酸的组合物,以及含有它们的多价转座酶试剂和TSC。通常,本发明的人工核酸包括一个或多个TBS。本发明还提供了包括一个或多个多价核心(例如水溶性多价核心)的组合物(例如TSC),所述多价核心可以被连接到一个或多个本文中描述的人工核酸。所述组合物还可以包括结合到所述组合物的TBS的一个或多个转座酶。所述转座酶能够寡聚化以形成突触复合体。在某些实施方式中,所述人工核酸在由一个或多个中间连接物区段隔开的每个末端处包括TBS。在某些实施方式中,通过例如将所述连接区段连接到多价核心,可以将这些人工核酸连接到所述多价核心(例如水溶性多价核心)。本发明的多价转座酶试剂包括连接到多价核心(例如水溶性多价核心)的人工核酸。这些多价转座酶试剂可以是TSC的亚基。

  本发明提供了多价转座酶试剂和TSC,其包括多价核心(例如水溶性多价核心)和连接到所述多价核心(例如水溶性多价核心)的三个或更多个人工核酸(例如3、4、5、6、7、8、9、约10、约20、约25、约30、约40、约50、约60、约70、约80、约90、约100、约125、约150、约175、约200、约225、约250、约275、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约875、约900、约925,约950、约975、约1000、约1100、约1200、约1300、约1400、约1500、约1750、约2000、约3000、约4000、约5000铬或更多个人工核酸),其中各个所述人工核酸包括包含TBS的第一末端。

  例如,本发明提供了多价转座酶试剂和TSC,其包括:多价核心(例如水溶性多价核心);第一人工核酸,其包括包含TBS的第一末端;第二人工核酸,其包括包含TBS的第一末端;和第三人工核酸,其包括包含TBS的第一末端,其中所述第一人工核酸、第二人工核酸和第三人工核酸被连接到所述可溶性多价核心。

  所述人工核酸可以被共价连接到所述多价核心(例如水溶性多价核心)。在某些情况下,所述人工核酸通过由偶联反应(例如叠氮化物-炔烃Huisgen环加成(例如铜(I)催化的叠氮化物-炔烃环加成(CuAAC)或应变助催的叠氮化物-炔烃环加成(SPAAC))、酰胺或硫代酰胺键形成、周环反应、Diels-Alder反应、磺酰胺键形成、醇或酚烷基化、缩合反应、二硫键形成和亲核取代)产生的共价键连接到所述可溶性多价核心。

  在其他情况下,所述人工核酸可以例如通过亲和结合对(例如生物素-链亲和素、生物素-亲和素、配体-受体、抗原-抗体或抗原结合片段、或者Ig结合蛋白-Ig)非共价连接到所述多价核心(例如所述水溶性多价核心)。在某些情况下,所述亲和结合对包含结合第二亲和组分的第一亲和组分,其中所述第一亲和组分被连接到所述可溶性多价核心,并且所述第二亲和组分被连接到所述人工核酸。

  在某些情况下,各自含有TBS的人工核酸的第一群体可以被共价连接到所述多价核心(例如水溶性多价核心),并且各自含有TBS的人工核酸的第二群体可以被非共价连接到所述多价核心。

  所述多价转座酶试剂和TSC可以包括结合到所述人工核酸的TBS的转座酶(例如3、4、5、6、7、8、9、约10、约20、约25、约30、约40、约50、约60、约70、约80、约90、约100、约125、约150、约175、约200、约225、约250、约275、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约875、约900、约925,约950、约975、约1000、约1100、约1200、约1300、约1400、约1500、约1750、约2000、约3000、约4000、约5000个或更多个转座酶)。所述转座酶能够寡聚化以形成突触复合体。

  在某些情况下,所述多价转座酶试剂和TSC可以包括3个或更多个突触复合体(例如3、4、5、6、7、8、9、约10、约20、约25、约30、约40、约50、约60、约70、约80、约90、约100、约125、约150、约175、约200、约225、约250、约275、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约725、约750、约775、约800、约825、约850、约875、约900、约925,约950、约975、约1000、约1100、约1200、约1300、约1400、约1500、约1750、约2000、约2500个或更多个突触复合体)。例如在某些情况下,所述试剂包括3至12个之间的突触复合体、3至25个之间的突触复合体、3至50个之间的突触复合体、3至75个之间的突触复合体、3至100个之间的突触复合体、3至125个之间的突触复合体、3至150个之间的突触复合体、3至175个之间的突触复合体、3至200个之间的突触复合体或3至250个之间的突触复合体。

  例如,本发明提供了多价转座酶试剂和TSC,其包括多价核心(例如水溶性多价核心)和连接到所述多价核心的三个或更多个突触复合体,其中每个所述突触复合体包括第一转座酶和第二转座酶,并且其中所述第一转座酶被结合到包含TBS的第一人工核酸,所述第二转座酶被结合到包含TBS的第二人工核酸,并且其中所述第一转座酶和第二转座酶被寡聚化。在某些情况下,每个突触复合体的所述第一人工核酸和第二人工核酸被连接到所述可溶性多价核心。在其他情况下,至少一个突触复合体的所述第一人工核酸或第二人工核酸不被连接到所述可溶性多价核心。

  在本发明的情形中可以使用任何适合的水溶性多价核心。例如,所述水溶性多价核心可以是核酸(例如DNA、RNA、PNA及其组合)、聚合物(例如支化聚合物,例如星状聚合物、梳状聚合物、刷状聚合物、超支化聚合物或树枝状聚合物)、肽、多肽、蛋白质或胶束。所述核酸可以是单链的、双链的或其组合。在某些情况下,所述核酸包括约10至约10,000bp(例如约10bp、约20bp、约30bp、约40bp、约50bp、约60bp、约70bp、约80bp、约90bp、约100bp、约200bp、约300bp、约400bp、约500bp、约600bp、约700bp、约800bp、约900bp、约1000bp、约1250bp、约1500bp、约1750bp、约2000bp、约3000bp、约4000bp、约5000bp、约6000bp、约7000bp、约8000bp、约9000bp、约10,000bp或更多bp)。所述聚合物可以是基于聚乙二醇(PEG)的聚合物例如PEG树枝状聚合物或多臂PEG(例如3臂PEG、4臂PEG、6臂PEG或8臂PEG)。所述蛋白质可以是多亚基蛋白(例如亲和素或链亲和素)。

  在任何本文中描述的多价试剂和TSC中,多个所述人工核酸可以包括IST(例如随机、半随机或非随机的IST)。每个IST可以是一致或不一致的。

  本发明提供了人工核酸,其包括包含TBS的第一末端和包含偶联组成部分或亲和结合对的组分的第二末端。这种人工核酸可以被连接到多价核心(例如水溶性多价核心)。

  所述人工核酸还可以包括一种或多种另外的元件。例如,所述连接区段可以包括可识别序列标签(IST)、引物结合位点或切割位点。所述IST可以是例如随机IST、半随机IST或非随机IST。用于产生IST例如条形码的方法在本领域中是已知的。所述切割位点可以是例如限制性核酸内切酶识别位点或切口酶位点。所述连接区段可以具有任何适合的长度,例如约20bp至约1000bp或更长的长度,其可以如本文中所述随着打算与所述人工核酸一起使用的转座酶的性质而变。例如,所述人工核酸的长度可以是约20、约25、约30、约35、约40、约45、约50,约55,约60、约65,约70,约75、约80、约85、约90,约100,约120、约140,约160、约180、约200、约225、约250、约275、约300、约400、约500、约1000、约2000、约5000或约10,000bp。

  在某些情况下,所述人工核酸可以具有约20至约5,000bp、约20至约2,000bp、约20至约1,000bp、约20至约900bp、约20至约800bp、约20至约700bp、约20至约700bp、约20至约600bp、约20至约500bp、约20至约400bp、约20至约300bp、约20至约200bp、约20and 100bp、约20至约65bp、约50至约5,000bp、约50至约2,000bp、约50至约1,000bp、约50至约900bp、约50至约800bp、约50至约700bp、约50至约700bp、约50至约600bp、约50至约500bp、约50至约400bp、约50至约300bp、约50至约200bp、约50至约100bp、约50至约65bp、约100至约5,000bp、约100至约2,000bp、约100至约1,000bp、约100至约900bp、约100至约800bp、约100至约700bp、约100至约700bp、约100至约600bp、约100至约500bp、约100至约400bp、约100至约300bp、约100至约200bp、约200至约5,000bp、约200至约2,000bp、约200至约1,000bp、约200至约900bp、约200至约800bp、约200至约700bp、约200至约700bp、约200至约600bp、约200至约500bp、约200至约400bp、约200至约300bp、约500至约5,000bp、约500至约2,000bp、约500至约1,000bp、约500至约900bp、约500至约800bp、约500至约700bp、约500至约700bp或约500至约600bp之间的长度。

  在任何前述人工核酸中,TBS可以是至少部分单链或双链的。转座酶蛋白通常结合到双链TBS。

  TSC可以包括例如2至1000个之间或更多突触复合体。例如,TSC可以包括2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200、300、400、500、600、700、800、900、1000个或更多个突触复合体。

  在某些情况下,TSC中的一个或多个或所有的人工核酸包括IST。所述TSC中存在的IST可以是一致的。在其他情况下,所述TSC可以包括多种不同的IST。例如,TSC可以包括至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200、300、400、500、600、700、800、900、1000种或更多种不同IST。

  本文中描述的任何转座酶可用于本发明的组合物中,包括下文中进一步描述的转座酶。例如,所述转座酶可以是Tn3、Tn5、Tn9、Tn10、γ-δ、Mu、piggyBac、Minos、Tc1或Sleeping Beauty转座酶或其生物活性变体。所述生物活性变体可以是高活性变体。其他转座酶在本领域中是已知的并且也可用于本发明。同样地,本文中描述的任何TBS可用于本发明的组合物中。在某些情况下,转座酶可以被可操作连接到靶向组成部分。所述靶向组成部分可以是本文中描述或本领域中已知的任何靶向组成部分。例如,所述靶向组成部分可以是包含DNA结合结构域(DBD)的多肽或RNA指导的核酸内切酶。所述DBD可以是锌指结构域或转录激活子样(TAL)效应物。所述RNA指导的效应物可以是Cas9、Cpf1、C2c2或其生物活性变体(例如核酸酶缺陷变体)。所述组合物中的转座酶可以是相同类型的(例如所述组合物中的每个转座酶可以是Tn5转座酶),或者所述组合物可以包括超过一种类型的转座酶(例如一个或多个Tn5转座酶和一个或多个Mu转座酶)。

  转座酶和转座酶结合位点

  本发明的组合物可以包括来自于本领域中已知的任何适合的转座系统的转座酶和转座酶结合位点(TBS)。所述转座系统可以来自于病毒(例如噬菌体或反转录病毒)、原核生物(例如细菌)或真核生物(例如真菌(例如酵母)或哺乳动物)。可以使用的示例性转座酶包括但不限于来自于转座子系统Tn1、Tn2、Tn3、Tn5、Tn7、Tn9、Tn10、Tn903、Tn1000/Γ-δ、Minos、Sleeping beauty、piggyBac、Tol2、Mos1、Himar1、Hermes、Tol2、Minos、P-element、Tc1/mariner、Tc3的转座酶或其生物活性变体。在某些情况下,所述转座酶的可以是天然存在的或工程化改造的,转座酶的生物活性变体相对于参比转座酶可以包括一个或多个修饰(例如一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20或更多个)氨基酸替换、插入和/或缺失),其可能影响所述转座酶的活性(例如转座活性)、结合(例如结合特异性或亲和性)或其他性质。在特定实施方式中,所述生物活性变体可以是高活性变体,其可能在体外或体内具有提高的转座活性。

  任何适合的TBS可用于本发明的组合物中。所述TBS可以是来自于转座系统Tn1、Tn2、Tn3、Tn5、Tn7、Tn9、Tn10、Tn903、Tn1000/Γ-δ、Minos、Sleeping beauty、piggyBac、Tol2、Mos1、Himar1、Hermes、Tol2、Minos、P-element、Tc1/mariner、Tc3的TBS或其生物活性变体。TBS可以是天然存在的TBS或其生物活性变体。生物活性变体可以是天然存在的或工程化改造的,并且可能相对于参比TBS包括插入、缺失和/或替换。所述生物活性变体TBS可能影响结合到所述TBS的转座酶的活性(例如转座活性)、结合(例如结合特异性或亲和性)或其他性质。所述TBS也可以包括所有天然存在的TBS或其最小的子集。例如,所述Tn7转座子具有在右端上的4个交叠的TnsB转座酶结合位点和左端上的3个宽间距的TnsB结合位点,但转座可以使用右端上的两个TnsB结合位点的最小子集发生(Parks等,Plasmid 61(1):1-14,2009)。在某些情况下,所述TBS可以是或包括自然界中不存在的序列(参见例如Goldhaber-Gordon等,J.Biol.Chem.277(10):7703-7712,2002),但仍允许通过转座酶转座。

  许多天然存在的TBS在可转座DNA片段的末端处包括反向重复核苷酸序列。这些末端反向重复序列存在于某些转座系统中,包括源自于Tn1、Tn2、Tn3、Tn5、Tn9、Tn10和Tn903的转座系统。在某些情况下,在本发明中使用的TBS可以包括末端反向重复序列。在其他情况下,所述TBS可以缺少反向重复序列,例如源自于噬菌体转座子Mu或细菌转座子Tn7的TBS。

  可以在本发明的情形中使用的示例性转座酶和TBS在下文进一步描述。

  Tn5

  Tn5是可用于本发明的情形中的一种充分研究的源自于大肠杆菌的转座系统(参见例如Reznikoff,Mol.Microbiol.47(5):1199-206,2003)。NCBI登记号U00004提供了大肠杆菌Tn5转座子的核酸序列。Tn5编码转座酶TnpA(UniProt登记号Q46731),其在本文中也被称为Tn5转座酶。野生型Tn5转座酶的氨基酸序列如下所示:

  MITSALHRAADWAKSVFSSAALGDPRRTARLVNVAAQLAKYSGKSITISSEGSEAMQEGAYRFIRNPNVSAEAIRKAGAMQTVKLAQEFPELLAIEDTTSLSYRHQVAEELGKLGSIQDKSRGWWVHSVLLLEATTFRTVGLLHQEWWMRPDDPADADEKESGKWLAAAATSRLRMGSMMSNVIAVCDREADIHAYLQDKLAHNERFVVRSKHPRKDVESGLYLYDHLKNQPELGGYQISIPQKGVVDKRGKRKNRPARKASLSLRSGRITLKQGNITLNAVLAEEINPPKGETPLKWLLLTSEPVESLAQALRVIDIYTHRWRIEEFHKAWKTGAGAERQRMEEPDNLERMVSILSFVAVRLLQLRESFTLPQALRAQGLLKEAEHVESQSAETVLTPDECQLLGYLDKGKRKRKEKAGSLQWAYMAIARLGGFMDSKRTGIASWGALWEGWEALQSKLDGFLAAKDLMAQGIKI(SEQ ID NO:494)

  Tn5转座酶的生物活性变体,包括具有氨基酸替换、插入和/或缺失的变体,可用于本发明的组合物中。具有氨基酸替换的有生物活性的Tn5转座酶变体在本领域中是已知的。在某些情况下,生物活性变体相对于野生型Tn5具有提高的转座率,并因此被认为是高活性的(参见例如美国专利号5,965,443、5,925,545和6,159,736)。例如,在54位氨基酸处用赖氨酸残基替换野生型Tn5转座酶中存在的谷氨酸(E54K),已显示提高修饰的转座酶对OE末端的亲和力,并将转座率提高约10倍。已与Tn5转座酶高活性相关联的其他突变包括将372位氨基酸(亮氨酸)用脯氨酸替换(L372P)和将56位氨基酸(甲硫氨酸)用丙氨酸替换(M56A)。所述替换突变可以相对于SEQ ID NO:494中示出的Tn5转座酶的示例性野生型序列。生物活性变体可以包括前述替换突变的任何组合。例如,在某些情况下,所述Tn5转座酶包括替换突变E54K、M56A和L372P。在其他情况下,所述Tn5转座酶包括替换突变E54K和L372P。高活性Tn5转座酶蛋白是可商购的,例如Ez-Tn5TM转座酶和Ez-Tn5TM自定义转座体构建试剂盒(Epicentre)。

  通常了解的是,为了进行转座,Tn5转座酶结合位于可转座DNA元件的每一侧侧翼的一对反向重复核苷酸序列。所述Tn5转座酶结合位点的反向重复序列被称为外端(OE)(CTGACTCTTATACACAAGT(SEQ ID NO:495))和内端(IE)(CTGTCTCTTGATCAGATCT(SEQ ID NO:496))(参见例如美国专利号5,965,443)。可以使用Tn5 TBS的生物活性变体,包括与较高的转座率相关的末端序列变体例如外端和内端的高活性杂合体(也被称为“镶嵌末端”(ME))CTGTCTCTTATACACATCT(SEQ ID NO:497),其在4、17和18位置处与野生型OE序列不同,以及CTGTCTCTTATACAGATCT(SEQ ID NO:498),其在4、15、17和18位置处与野生型OE序列不同(参见例如美国专利号5,925,545)。在某些情况下,本发明的核酸可以包括具有选自SEQ IDNO:495-498的核酸序列的一种或多种Tn5 TBS和/或其生物活性变体。

  尽管所述Tn5反向重复序列通常被称为末端重复序列,但它们不必须在供体DNA的末端处,并且只需在供体DNA的每一侧的侧翼以便能够转座(参见例如Johnson等,Nature304:280,1983和美国专利号5,965,443)。在某些情况下,在本发明的核酸中使用的TBS,可以是被Tn5转座酶识别的两个反向序列(包括OE序列、IE序列和/或任何其他序列变体(例如ME序列))的任何组合。

  Mu

  可以被本发明利用的另一种示例性转座系统来自于Mu噬菌体(参见例如Harshey,Microbiol.Spectr.2(5),2014)。Mu基因组的完整核酸序列提供在NCBI登记号AF083977.1中。Mu编码转座酶MuA(UniProt登记号P07636),其在本文中也被称为Mu转座酶。野生型Mu转座酶的氨基酸序列如下所示:

  MELWVSPKECANLPGLPKTSAGVIYVAKKQGWQNRTRAGVKGGKAIEYNANSLPVEAKAALLLRQGEIETSLGYFEIARPTLEAHDYDREALWSKWDNASDSQRRLAEKWLPAVQAADEMLNQGISTKTAFATVAGHYQVSASTLRDKYYQVQKFAKPDWAAALVDGRGASRRNVHKSEFDEDAWQFLIADYLRPEKPAFRKCYERLELAAREHGWSIPSRATAFRRIQQLDEAMVVACREGEHALMHLIPAQQRTVEHLDAMQWINGDGYLHNVFVRWFNGDVIRPKTWFWQDVKTRKILGWRCDVSENIDSIRLSFMDVVTRYGIPEDFHITIDNTRGAANKWLTGGAPNRYRFKVKEDDPKGLFLLMGAKMHWTSVVAGKGWGQAKPVERAFGVGGLEEYVDKHPALAGAYTGPNPQAKPDNYGDRAVDAELFLKTLAEGVAMFNARTGRETEMCGGKLSFDDVFEREYARTIVRKPTEEQKRMLLLPAEAVNVSRKGEFTLKVGGSLKGAKNVYYNMALMNAGVKKVVVRFDPQQLHSTVYCYTLDGRFICEAECLAPVAFNDAAAGREYRRRQKQLKSATKAAIKAQKQMDALEVAELLPQIAEPAAPESRIVGIFRPSGNTERVKNQERDDEYETERDEYLNHSLDILEQNRRKKAI(SEQ ID NO:499)。

  Mu转座酶的生物活性变体,包括具有缺失、插入或氨基酸替换的变体,在本领域中是已知的并可用于本发明。例如,截短的Mu转座酶变体例如含有野生型Mu转座酶的77-663位氨基酸的截短突变体Mu(77-663),已被描述为高活性变体(参见Goldhaber-Gordon等,J.Biol.Chem.277(10):7694-702,2002)。具有氨基酸替换突变的高活性Mu变体在本领域中也是已知的(参见例如美国专利号9,234,190)。例如,高活性Mu转座酶变体可以包括一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26或26个)氨基酸替换突变,所述替换突变选自A59V、D97G、W160R、E179V、E233K、E233V、Q254R、E258G、G302D、I335T、G340S、W345C、W345R、M374V、F447S、F464Y、R478H、R478C、E482K、E483G、E483V、M487I、V495A、V507A、Q539H、Q539R和I617T。所述突变可以相对于SEQID NO:499中所示的Mu转座酶的示例性野生型序列。例如,所述替换突变可以是E223V。在其他情况下,所述Mu变体可以包括替换突变W160R、E233K和W345R。

  所述Mu转座子的每个末端包括三个Mu结合位点:左侧末端上的L1、L2和L3,和右侧末端上的R1、R2和R3。这些Mu TBS的核酸如下:L1(TGTATTGATTCACTGAAGTACGAAAA(SEQ IDNO:500)),L2(CCTTAATCAATGAAACGCGAAAG,SEQ ID NO:501),L3(TTGTTTCATTGAAAATACGAAAA,SEQ ID NO:502),R1(TGAAGCGGCGCACGAAAAATGCGAAAA,SEQ IDNO:503),R2(GCGTTTCACGATAAATGCGAAAA,SEQ ID NO:504),和R3(CCGTTTCATTTGAAGCGCGAAAA,SEQ ID NO:505)。所述Mu结合位点具有22个核苷酸的共有序列YGTTTCAYNNRAARYRCGAAAR(SEQ ID NO:506),其中Y表示嘧啶(C或T),R表示嘌呤(G或A),并且N表示任何核苷酸。在某些实施方式中,本发明的核酸可以包括一个或多个Mu TBS,其包括选自SEQ ID NO:500、SEQ ID NO:501、SEQ ID NO:502、SEQ ID NO:503、SEQ ID NO:504、SEQ ID NO:505、SEQ ID NO:506的核酸序列和/或其生物活性变体。

  以前的研究表明,在某些条件下,Mu转座只需要极少数的元件,即包括R1(SEQ IDNO:503)和R2(SEQ ID NO:504)结合位点的短的Mu右末端供体DNA、Mu转座酶和线性靶DNA(参见例如Savilahti,EMBO J.14(19):4893-4903,1995)。因此,在某些情况下,本发明的核酸可以包括包含SEQ ID NO:503和SEQ ID NO:504的核酸序列的TBS。或者,所述Mu TBS可以包括在自然界中不存在,但允许通过Mu转座酶进行转座的序列。例如,Goldhaber-Gordon等,J.Biol.Chem.277(10):7703-7712,2002的图2示出了功能类似于Mu TBS的18种非Mu序列的核酸序列。

  Tn10

  Tn10转座系统的转座酶和TBS或其生物活性变体可用于本发明的情形中。NCBI登记号AY319289.1提供了大肠杆菌Tn10转座子的核酸序列。Tn10编码转座酶TnpA(UniProt登记号Q70BL4),其在本文中也被称为Tn10转座酶。野生型Tn10转座酶的氨基酸序列如下所示:

  MCELDILHDSLYQFCPELHLKRLNSLTLACHALLDCKTLTLTELGRNLPTKARTKHNIKRIDRLLGNRHLHKERLAVYRWHASFICSGNTMPIVLVDWSDIREQKRLMVLRASVALHGRSVTLYEKAFPLSEQCSKKAHDQFLADLASILPSNTTPLIVSDAGFKVPWYKSVEKLGWYWLSRVRGKVQYADLGAENWKPISNLHDMSSSHSKTLGYKRLTKSNPISCQILLYKSRSKGRKNQRSTRTHCHHPSPKIYSASAKEPWVLATNLPVEIRTPKQLVNIYSKRMQIEETFRDLKSPAYGLGLRHSRTSSSERFDIMLLIALMLQLTCWLAGVHAQKQGWDKHFQANTVRNRNVLSTVRLGMEVLRHSGYTITREDLLVAATLLAQNLFTHGYALGKL(SEQ ID NO:507)。

  高活性Tn10转座酶变体已被描述(参见例如Way,Gene32(3):369-79,1984),并且可用于本发明。

  类似于Tn5转座酶,Tn10转座酶通常结合位于可转座DNA元件的每一侧侧翼的一对反向重复核苷酸序列。Tn10 TBS可以包括通常被称为外端(OE)和内端(IE)的Tn10反向重复序列,其具有共有序列CTGAKRRATCCCCTMATRATTTY(SEQ ID NO:508),其中Y表示嘧啶(C或T),R表示嘌呤(G或A),M表示A或G,并且K表示G或T(Mizuuchi,Annu.Rev.Biochem.61:1011-51,1992)。在某些情况下,本发明的核酸可以包括一个或多个Tn10 TBS,其具有SEQ ID NO:508的核酸序列和/或其生物活性变体。

  Tn7

  在又一个实例中,可以使用Tn7转座系统的转座酶和TBS(参见例如Parks等,Plasmid.61(1):1-14,2009)。Tn7转座子编码转座酶TnsA(Uniprot登记号P13988;也被称为TnpA)和TnsB(Uniprot登记号P13989;也被称为TnpB)。

  野生型Tn7 TnsA的氨基酸序列如下所示:

  MAKANSSFSEVQIARRIKEGRGQGHGKDYIPWLTVQEVPSSGRSHRIYSHKTGRVHHLLSDLELAVFLSLEWESSVLDIREQFPLLPSDTRQIAIDSGIKHPVIRGVDQVMSTDFLVDCKDGPFEQFAIQVKPAAALQDERTLEKLELERRYWQQKQIPWFIFTDKEINPVVKENIEWLYSVKTEEVSAELLAQLSPLAHILQEKGDENIINVCKQVDIAYDLELGKTLSEIRALTANGFIKFNIYKSFRANKCADLCISQVVNMEELRYVAN(SEQ ID NO:509)

  野生型Tn7 TnsB的氨基酸序列如下所示:

  MWQINEVVLFDNDPYRILAIEDGQVVWMQISADKGVPQARAELLLMQYLDEGRLVRTDDPYVHLDLEEPSVDSVSFQKREEDYRKILPIINSKDRFDPKVRSELVEHVVQEHKVTKATVYKLLRRYWQRGQTPNALIPDYKNSGAPGERRSATGTAKIGRAREYGKGEGTKVTPEIERLFRLTIEKHLLNQKGTKTTVAYRRFVDLFAQYFPRIPQEDYPTLRQFRYFYDREYPKAQRLKSRVKAGVYKKDVRPLSSTATSQALGPGSRYEIDATIADIYLVDHHDRQKIIGRPTLYIVIDVFSRMITGFYIGFENPSYVVAMQAFVNACSDKTAICAQHDIEISSSDWPCVGLPDVLLADRGELMSHQVEALVSSFNVRVESAPPRRGDAKGIVESTFRTLQAEFKSFAPGIVEGSRIKSHGETDYRLDASLSVFEFTQIILRTILFRNNHLVMDKYDRDADFPTDLPSIPVQLWQWGMQHRTGSLRAVEQEQLRVALLPRRKVSISSFGVNLWGLYYSGSEILREGWLQRSTDIARPQHLEAAYDPVLVDTIYLFPQVGSRVFWRCNLTERSRQFKGLSFWEVWDIQAQEKHNKANAKQDELTKRRELEAFIQQTIQKANKLTPSTTEPKSTRIKQIKTNKKEAVTSERKKRAEHLKPSSSGDEAKVIPFNAVEADDQEDYSLPTYVPELFQDPPEKDES(SEQ ID NO:510)

  TnsA和TnsB据认为形成异聚转座酶。TnsB是一种DDE类型的转座酶,其催化协调的断裂和重连反应,将供体末端的3’-羟基联结到靶DNA的插入位点处的5’-磷酸酯基团。TnsA在结构上类似于限制性核酸内切酶,并在供体DNA分子的相反链上执行切口反应。辅助蛋白TnsC据认为调节所述异聚TnsAB转座酶的活性,并在与靶DNA和靶选择蛋白TnsD或TnsE复合时激活转座。已分离到能够在不存在TnsD或TnsE的情况下促进转座的TnsC变体。在某些情况下,TnsA、TnsB、TnsC、TnsD和/或TnsE的生物活性变体可用于本发明的情形中,包括具有缺失、插入或氨基酸替换的变体。高活性Tn7转座酶变体以前已被描述。例如,Lu等(EMBOJ.19(13):3446-57,2000)的表1描述了几种TnsA和TnsB替换突变体,其包括TnsA S69N、E73K、A65V、E185K、Q261Z、G239S、G239D、E185K和Q261Z以及TnsB M366I、A325T和A325V。在某些情况下,生物活性Tn7变体可以包括任何前述替换突变中的一者或多者。

  7个Tn7转座酶结合位点位于所述转座子的每个末端上,包括右端上的4个交叠的TnsB结合位点和左端上的3个宽间距的TnsB结合位点。所述7个Tn7转座酶结合位点的共有序列是TGAYAATAAAGTTGATTATACT(SEQ ID NO:511),其中Y表示嘧啶(C或T)(参见例如Parks等,Plasmid.61(1):1-14,2009)。在某些情况下,本发明的核酸可以包括一个或多个Tn7TBS,其包括SEQ ID NO:511的核酸序列和/或其生物活性变体。

  Tn3

  Tn3转座子是本领域中已知的另一种转座系统(参见例如Ichikawa等,Proc.Natl.Acad.Sci.USA 84(23):8220-4,1987)。NCBI登记号V00613.1提供了大肠杆菌Tn3转座子的核酸序列。Tn3转座子编码转座酶TnpA(UniProt登记号P03008),其在本文中也被称为Tn3转座酶,以及解离酶TnpR(Uniprot登记号P0ADI2)。Tn3利用复制型转座机制,其中由Tn3转座酶催化的复制性整合的第一阶段产生含有转座子的两个拷贝的“共整合”DNA分子,然后是由解离酶催化的解离阶段,其将供体和靶DNA分子分离开。

  所述Tn3转座酶结合到末端反向重复序列,其包含左侧末端反向重复序列GGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAG(SEQ ID NO:512)和右侧末端反向重复序列CTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCC(SEQ ID NO:513)。在某些情况下,本发明的核酸可以包括一个或多个Tn3 TBS,其包括SEQ ID NO:512、SEQ ID NO:513的核酸序列和/或其生物活性变体。

  γ-δ

  本发明的某些实施方式可以使用来自于γ-δ转座子(也被称为Tn1000)的转座酶和TBS(参见例如Broom,DNA Seq.5(3):185-9,1995)。γ-δ与Tn3相关。NCBI登记号D16449.1提供了大肠杆菌γδ转座子的核酸序列。所述γδ转座子编码转座酶TnpA(UniProt登记号Q00037),其在本文中也被称为γ-δ转座酶,以及解离酶TnpR(UniProt登记号P03012)。

  所述γ-δ转座酶结合到末端反向重复序列,其包括“δ端”末端反向重复序列GGGGTTTGAGGGCCAATGGAACGAAAACGTACGTTAAG(SEQ ID NO:514)和“γ端”末端反向重复序列ATAAACGTACGTTTTCGTTCCATTGGCCCTCAAACCCC(SEQ ID NO:515)。参见例如Maekawa等,Jpn.J.Genet.69(3):269-85,1994。在某些情况下,本发明的核酸可以包括一个或多个γ-δTBS,其包括SEQ ID NO:514、SEQ ID NO:515的核酸序列和/或其生物活性变体。

  piggyBacTM

  piggyBacTM(pB)转座酶、TBS及其生物活性变体可用于本发明中(参见例如Yusa,Microbiol.Spectr.3(2),2015)。pB转座子从甘蓝蠖度尺蛾粉纹夜蛾(Trichoplusia ni)基因组分离。在各种不同物种中也已鉴定到大量pB样转座子。NCBI登记号J04364.2提供了粉纹夜蛾pB转座子的核酸序列,其编码pB转座酶(UniProt登记号Q27026)。pB转座酶通常在TTAA位点处整合到靶DNA中。所述pB转座酶的生物活性变体,包括具有缺失、插入或氨基酸替换的变体,可用于本发明。具有氨基酸替换的高活性pB变体以前已被描述(参见例如Yusa等,Proc.Natl.Acad.Sci.USA 108(4):1531-6,2011和美国专利号8,399,643)。pB转座子系统是可商购的(Transposagen)。

  pB TBS在本领域中是已知的(参见例如Cary等,Virology 172(1):156-169,1989)。pB转座子包括13-bp的末端反向重复序列,并在相对于所述元件不对称的位置处具有长度为19bp的另外的反向重复序列。

  Minos

  Minos转座酶、TBS及其生物活性变体可用于本发明。Minos转座子在果蝇Drosophila hydei的基因组中鉴定到(参见例如Pavlopoulos等,Genome Biol.8(Suppl1),2007)。NCBI登记号X61695.1提供了所述Minos转座子的核酸序列,其编码Minos转座酶(Uniprot登记号Q9U986)。

  所述Minos转座酶结合到包括下述序列的5’反向末端重复序列(ITR):

  CGCTTAACTTAATACGAGCCCCAACCACTATTAATTCGAACAGCATGTTTTTTTTGCAGTGCGCAATGTTTAACACACTATATTATCAATACTACTAAAGATAACACATACCAATGCATTTCGTCTCAAAGAGAATTTTATTCTCTTCACGACGAAAAAAAAAGTTTTGCTCTATTTCCAACAACAACAAAAATATGAGTAATTTATTCAAACGGTTTGCTTAAGAGATAAGAAAAAAGTGACCACTATTAATTC(SEQ ID NO:516)

  和具有下述序列的3’ITR:

  ATAGTAAATCACATTACGCCGCGTTCGAATTAATAGTGGTCACTTTTTTCTTATCTCTTAAGCAAACCGTTTGAATAAATTACTCATATTTTTGTTGTTGTTGGAAATAGAGCAAAACTTTTTTTTTCGTCGTGAAGAGAATAAAATTCTCTTTGAGACGAAATGCATTGGTATGTGTTATCTTTAGTAGTATTGATAATATAGTGTGTTAAACATTGCGCACTGCAAAAAAAACATGCTGTTCGAATTAATAGT(SEQ.ID NO:517)。

  在某些实施方式中,本发明的核酸可以包括一个或多个Minos TBS,其选自SEQ IDNO:516、SEQ ID NO:517和/或其生物活性变体。

  Sleeping Beauty

  Sleeping Beauty(SB)转座酶、TBS及其生物活性变体可用于本发明。SB是一种合成的转座酶Tc1/mariner型转座酶,其从鲑鱼类鱼的基因组重构(Ivics等,Cell 91(4):501-510,1997)。SB转座酶在本领域中是已知的(参见例如国际专利申请公布号WO99/25817和美国专利号6,613,752)。参比SB转座酶的氨基酸序列如下所示:

  MGKSKEISQDLRKKIVDLHKSGSSLGAISKRLKVPRSSVQTIVRKYKHHGTTQPSYRSGRRRVLSPRDERTLVRKVQINPRTTAKDLVKMLEETGTKVSISTVKRVLYRHNLKGRSARKKPLLQNRHKKARLRFATAHGDKDRTFWRNVLWSDETKIELFGHNDHRYVWRKKGEACKPKNTIPTVKHGGGSIMLWCGFAAGGTGALHKIDGIMRKENYVDILKQHLKTSVRKLKLGRKWVFQMDNDPKHTSKVVAKWLKDNKVKVLEWPSQSPDLNPIENLWAELKKRVRARRPTNLTQLHQLCQEEWAKIHPTYCGKLVEGYPKRLTQVKQFKGNATKY(SEQ ID NO:518)

  包括氨基酸替换的高活性SB变体在本领域中是已知的(参见例如美国专利号7,985,739和9,228,180)。例如,高活性SB变体可以包括选自下述的一个或多个替换突变:K13A,K14R,K13D,K30R,K33A,T83A,I100L,R115H,R143L,R147E,A205K/H207V/K208R/D210E;H207V/K208R/D210E;R214D/K215A/E216V/N217Q;M243H;M243Q;E267D;T314N;和G317E(参见例如美国专利号9,228,180)。在某些情况下,所述高活性SB变体可以包括K14R替换突变。所述替换突变可以相对于SEQ ID NO:518中示出的SB转座酶的参比序列。

  SB TBS杂本领域中也是已知的(参见例如国际专利申请公布号WO98/40510和美国专利号6,613,752)。这些TBS和/或其生物活性变体可用于本发明的核酸中。

  靶向组成部分

  为了促进向靶核酸(例如DNA)的特定区域的转座,可以使用靶向组成部分将本发明的组合物(例如TSC)中存在的转座酶靶向特定核苷酸序列,这可以导致TSC中存在的可转座核酸的偏向或定向转座。可以使用本领域中已知或本文中描述的任何适合的靶向组成部分,只要它可以被可操作连接到所述转座酶即可。所述靶向组成部分可以是包括转座酶的融合蛋白中的融合配偶体。例如,融合蛋白可以包括转座酶和靶向组成部分,并且可以任选地包括中间连接物。所述靶向组成部分可以位于相对于所述转座酶的N-端或C-端。在其他实例中,所述靶向组成部分可以被共价或非共价偶联到所述转座酶。所述靶向组成部分可以是天然存在的或工程化改造的。

  所述靶向组成部分可以是包括为确定核苷酸序列提供结合偏好性或特异性的DNA结合结构域(DBD)的多肽。例如,DBD可以包括本领域中公知的锌指基序,包括但不限于锌指DBD Sp1、ZNF202、Gal4、Jazz、E2C、Zif268和TetR。所述锌指基序可以例如源自于Cys2-His2类型的锌指。包括转座酶和锌指基序的融合蛋白在本领域中是已知的。例如,已使用Sp1、ZNF202、Jazz、E2C、Gal4或TetR的DBD构建了包括Sleeping Beauty(SB)转座酶和锌指DBD的融合蛋白(参见例如Wilson等,FEBS Letters 579:6205-9,2005;Ivics等,Mol.Ther.5(6):1137-44,2007;和Yant等,Nucleic Acids Res.35(7):e50,2007)。已将piggyBac和Mos1转座酶各自融合到Gal4的DBD(参见例如Maragathavally等,FASEB J.20(11):1880-2,2006和Wu等,Proc.Natl.Acad.Sci.USA 103(41):15008-13,2006)。在另一个实例中,已将ISY100转座酶融合到Zif268的DBD(参见例如Feng等,Nucleic Acids Res.38(4):1204-1216)。

  锌指基序可以被工程化改造,以结合到所需DNA序列。将单个锌指基序的氨基酸关联到它的相关DNA靶的已知“识别码”可用作指导,用于使用例如模块式组装来设计结合到特定DNA序列的锌指基序DBD(参见例如Bhakta等,Methods Mol.Biol.649:3-30,2010)。或者,可以使用基于选择的方法(例如噬菌体展示或细菌双杂交系统)来获得结合到特定DNA序列的锌指基序(参见例如Maeder等,Mol.Cell.31:294-301,2008)。DBD可以包括例如2、3、4、5、6、7、8、9、10个或更多个锌指基序。

  可以使用的其他DBD包括属于转录调控物的DBD(参见例如Szabó等,FEBS Letters550(1-3):46-50,2003和Imre等,FEMS Microbiology Letters 317(1):52-9,2011)和属于转录激活子样效应物(TAL效应物)的DBD,所述TAL效应物是由黄单胞菌属(Xanthomonas)物种分泌并且可以结合到宿主植物中的启动子序列的III型效应物蛋白。类似于锌指基序,TAL效应物可以被工程化改造以结合到特定DNA序列(参见例如Boch等,Science 326(5959):1509-1512,2009)。其他类型的DBD在本领域中是已知的并且可用作靶向组成部分,包括例如螺旋-转角-螺旋基序、亮氨酸拉链结构域、有翼螺旋结构域、有翼螺旋转角螺旋结构域、螺旋-环-螺旋结构域和HMG盒结构域。

  在某些实施方式中,所述靶向组成部分可以包括RNA或DNA指导的核酸内切酶,包括但不限于Cas9、Cpf1、C2c2和Argonaute。在优选实施方式中,所述RNA或DNA指导的核酸内切酶是核酸酶缺陷或无核酸酶的。例如,在融合蛋白中,可以将所述转座酶融合到RNA或DNA指导的核酸内切酶。

  源自于II型CRISPR(簇生规则间隔短回文重复序列)系统的Cas9蛋白(CRISPR结合蛋白9)是一种RNA指导的DNA核酸内切酶,其可以通过修改它的指导RNA序列进行编程,以靶向新的位点(参见例如Wang等,Annu Rev Biochem 85:227-64,2016;和美国专利号8,795,965)。在某些情况下,核酸酶缺陷或无核酸酶的Cas9(例如dCas9,其在Cas9的两个催化残基中包括点突变(D10A和H840A))可以在本发明的情形中用作可以在体外利用的靶向组成部分。以前的工作已确立Cas9融合蛋白可用于各种不同的应用,包括转录激活、可靶向DNA甲基化和提高DNA切割的特异性(参见例如Mali等,Nat Biotechnol.31(9):833-8,2013;Vojta等,NucleicAcidsRes.44(12):5615-28,2016;Guilinger等,Nat.Biotechnol.32(6):577-82,2014;美国专利号9,388,430;和美国专利申请公布号2015/0291965和2016/0177304)。

  在本发明的情形中,也可以使用Cpf1或C2c2来代替Cas9。Cpf1与Cas9的区别在于它是一种单一RNA指导的核酸内切酶,其缺少反式激活crRNA(tracrRNA),但具有与Cas9可比的靶向特异性(参见例如Zetsche等,Cell 163(3):759-71,2015;Kleinstiver等,Nat.Biotechnol.34(8):869-74,2016;Kim等,Nat.Biotechnol.34(8):863-8,2016;和美国专利申请公布号2016/0208243)。C2c2是一种可编程的RNA指导的RNA核酸内切酶,其靶向单链RNA,具有核酸酶活性,并且类似于Cas9和Cpf1,可以被制造成核酸酶缺陷(参见例如Abudayyeh等,Science 353(6299):aaf5573,2016)。在某些情况下,可以使用Argonaute。已描述了充当DNA指导的DNA核酸内切酶的原核Argonaute变体,其带有也已被描述的失活突变(参见例如Swarts等,Nature507(7491):258-61,2014;Miyoshi等,Nat.Commun.7:11846,2016;和Gao等,Nat.Biotechnol.34(7):768-73,2016)。

  在某些实施方式中,通过非共价结合到包括序列特异性DBD的多肽,所述转座酶可以被靶向到确定的核苷酸序列。某些修饰DNA的酶天然地将这些蛋白质相互作用用于靶向转座。例如,在Ty5反转录转座系统中,通过DNA结合蛋白Sir4p将酵母的Ty5整合酶靶向到基因组DNA的特定区域。Ty5整合的特异性可以通过将可选的DBD融合到Sir4p来改变(参见例如Zhu等,Proc.Natl.Acad.Sci.USA100(10):5891-5,2003)。在转座酶不天然与DNA结合配偶体相互作用的情况下,可以将其他组分或结构域融合或偶联到所述转座酶和/或DNA结合蛋白,以促进蛋白质-蛋白质相互作用。此外,可以对所述相互作用蛋白的DBD进行修饰以提供所需的靶序列特异性。

  在另一个实施方式中,所述靶向组成部分可以包括DNA或RNA寡核苷酸,其具有与所述靶核酸(例如DNA)中存在的序列至少部分互补的核苷酸序列。所述寡核苷酸与所述靶核酸的杂交可以将所述转座酶靶向到所述靶序列。例如通过用互补的偶联组成部分修饰所述寡核苷酸和转座酶两者,可以将寡核苷酸靶向组成部分共价或非共价偶联到所述转座酶。寡核苷酸和蛋白质可以使用各种不同的偶联方法来偶联,包括在Mao等,Chem.Soc.Rev.40:5730-44,2011中概述的任何方法。例如,共价偶联的方法可以包括将通过二硫键形成产生的硫醇修饰的寡核苷酸位点特异性偶联到用可及的半胱氨酸残基(参见例如Corey等,J.Am.Chem.Soc.111(22):8523-5,1989)或α-硫酯(参见例如Takeda等,Bioorg.Med.Chem.Lett.14(10):2407-10,2004)工程化改造的转座酶。非共价寡聚物-蛋白质偶联方法的实例包括但不限于基于链亲和素-生物素、Ni-NTA-六聚组氨酸和抗体-半抗原的偶联方法。

  拴系突触复合体及其制造方法

  本发明提供了TSC以及制造TSC的方法。通常,所述方法涉及将本发明的包括一个或多个TBS的核酸与能够结合一个或多个所述TBS的转座酶相接触,以形成所述TSC的亚基,其中所述TBS已被工程化改造以通过多价支架共同拴系。

  正如在本文中描述的,本发明中的TSC可用于在同一靶DNA分子上的远离位置之间形成物理桥,其可以被用于例如确定连接和相位信息。TSC可以被设计成使得任何给定TSC亚基中的DNA末端将附连在同一靶DNA位置处,但第一突触复合体被拴系到的最近的突触复合体连接通常在同一靶DNA分子中远离位置处的DNA。在自然界中,核酸分子上的TBS之间的距离需要足够大,以允许编码蛋白质(例如编码用于抗生素抗性的蛋白质和转座酶)的转座子的成功转座,因为所述转座子提供了宿主存活所必需的性质。如果存在于核酸分子上的两个末端TBS过于靠近在一起,对核酸(例如DNA)弯折的限制将阻止结合到同一分子上的末端的转座酶形成突触复合体。然而,对在不同核酸分子上存在的末端TBS之间的突触形成不存在这样的空间限制,这是可用于制造TSC的性质。

  如果一致的转座酶结合位点的位置彼此足够接近,则在TSC中邻近的可转座核酸分子之间,与二聚化和突触复合体形成相关的精确几何学和DNA弯折在空间上是有利的。核酸分子上的末端TBS之间的长度(例如以bp为单位)可以改变,以便促进TSC中邻近核酸分子之间的寡聚化和突触复合体形成。专业技术人员将会认识到,在某些情况下,在不同类型的转座酶之间所述长度可以不同,但常规方法可用于确定给定长度是否适合用于制造TSC。例如,在大肠杆菌中,分隔质粒DNA上的两个Tn5 TBS的≤64bp的DNA显著抑制体内IS50转座活性(Goryshin等,Proc.Natl.Acad.Sci.USA91:10834-10838,1994)。同样地,在优选实施方式中,我们已经发现,当在体外从转座酶蛋白制备物和带有两个小间距TBS的合成的可转座核酸分子形成TSC时,远端转座得以促进。

  已显示许多转座酶在结合到TBS后扭曲邻近的DNA构象。例如对于Tn5转座酶来说,DNA上的弯折角约为119°,并且中心在所述19bp转座酶结合位点的第一核苷酸和第三核苷酸附近(Jilk等,J.Bacteriol.178:1671-1679,1996)。对于本领域普通技术人员来说将理解,可转座核酸的反应性末端的相对三维(3-D)取向可以通过改变所述转座酶结合位点之间的距离来修改,因为DNA螺旋的螺距和长度影响所述反应性末端在3-D空间中的取向。人们预测,当TBS之间的距离减小到小于100bp时,双链DNA的刚性最终将阻止同一DNA分子的两个末端上存在的TBS的相互作用。这个模型与Goryshin(同上)做出的体内观察相一致,Goryshin描述了对于66至174bp之间的长度来说,分隔质粒DNA上的TBS的DNA长度与IS50转座频率之间的显著周期性关系,其中转座活性最大值对应于10.5bp间隔,这与各种不同的线性DNA在溶液中的螺旋重复长度相一致。这表明在TSC的情形中,联系靶DNA中的远端转座事件的平均距离,可以通过改变拴系突触复合体的面上所述反应性末端的相对3-D取向(例如通过修改转座酶结合位点之间的距离)来调节。

  可用于控制远端转座事件之间的平均距离的方法,也可以广泛地包括已知提高核酸的刚性或扩散的方法,例如通过添加提高分隔可转座核酸上的TBS的间隔物区域(连接区段)的刚性的分子,包括但不限于具有已知的DNA结合性质的下述类别的分子:核酸染料和核酸嵌入剂(例如吖啶染料(例如吖啶橙)和溴化乙锭),某些抗生素,或DNA结合蛋白,通过用生物素修改可转座核酸上TBS之间的核酸含量,然后添加链亲和素蛋白以结合生物素修饰的间隔物区域,由此降低所述分隔转座酶结合位点的间隔物区域的柔性;通过添加已知结合、沉淀和/或缩聚DNA成超环面结构的分子,例如组蛋白或组蛋白样蛋白、鱼精蛋白、亚精胺、氯化六氨合钴、聚乙二醇等;通过将延长的拴系突触复合体固定化在固体基材上;或通过在固体或半固体表面上合成可转座核酸。

  当需要使用更长核酸来分隔转座酶结合位点时,TSC可能对本身而不是对靶DNA显示出不想要的转座酶活性。对于本领域技术人员来说还将理解,存在着可用于修饰所述TSC以使它对不想要的转座酶活性有抗性的手段。可以使TSC对转座酶活性更有抗性的示例性、非限制性方式包括下述方式:所述TSC可以含有对转座酶有抗性的核苷酸类似物;所述TSC可以被设计成具有低于30%的总G+C组成,其在Tn5转座酶的情况下已知是有转座酶抗性的;所述TSC可以被设计成富含已知是一种或多种转座酶的不良底物的序列;所述TSC可以被制造成部分单链;所述TSC可以用DNA结合蛋白包被;如果被生物素化,则所述转座酶结合位点之间的核酸可以用链亲和素或亲和素蛋白包被;或者所述TSC可以被固定化到固体基材或原位合成,以防止不想要地转座到TSC DNA中。

  正如本领域普通技术人员将会认识到的,在许多分子生物学程序,包括本文描述的所有程序和组合物中,核酸的合成类似物可以代替天然存在的核酸。修饰的碱基和/或核酸酶识别位点的并入可以允许晚些时候在任何程序中任选地分离所述TBS。本文中描述的制造TSC的任何方法可以涉及使用包含核酸类似物、修饰的碱基和/或核酸酶识别位点的核酸。

  TSC可以在它们被制造后立即使用,或储存以备晚些时候使用(例如储存数天、数周、数月或数年)。所述TSC可以在任何适合的温度(例如约-80℃、约-20℃、约0℃、约15℃、约20℃、约25℃、约37℃或更高温度)下储存。所述TSC可以被储存在任何适合的储存缓冲液中,所述缓冲液可以包括一种或多种另外的组分例如稳定剂、低温保护剂(例如甘油或蔗糖)、抗微生物剂、核酸酶抑制剂等。用于核酸或蛋白质(例如转座酶)的储存缓冲液在本领域中是已知的。

  TSC可以使用不同长度的可转座核酸制备,以获得不同水平的空间分辨率;或者所述TSC的排序可能受到向转座酶添加TSC亚基(或向亚基添加转座酶)的顺序影响。TSC的长度可以例如通过添加各自仅在一个末端处带有TBS的可转座核酸来调整。以这种方式终结所述TSC也可用于最小化或阻止TSC的不同子合并物的不想要的聚合。特定长度的TSC可以使用分子生物学领域的技术人员已知的各种不同的分离方法与未能形成高分子量TSC的较低分子量的核酸分离开,分离方法包括但不限于凝胶过滤、超滤、制备型凝胶电泳、层析或通过使用聚乙二醇或类似化合物选择性沉淀所需长度的聚合物至固体基材,或将所需长度的聚合物结合到固体基材。

  在体外从几种组分重建转座酶活性的容易性,是较简单的转座酶例如Tn5转座酶通常比需要明显更长的DNA结合位点和/或几种辅助蛋白来重建转座酶活性的转座酶更加优选的原因。然而,专业技术人员将会认识到,本发明的公开允许专业技术人员使用任何适合的转座酶、TBS和辅助蛋白(如果有关的话)来制造落于本发明的范围之内的TSC。

  亲和结合对

  本发明的组合物可以包括亲和结合对。亲和结合对可用于非共价地连接两个或更多个组成部分。例如,多价核心(例如水溶性多价核心)可以包括一个或多个亲和结合对,其将所述多价核心连接到含有TBS的核酸。可以使用本领域中已知的或本文中描述的任何适合的亲和结合对。示例性、非限制性的亲和结合对包括生物素-生物素结合蛋白(例如生物素-链亲和素、生物素-亲和素和生物素-中性亲和素TM)、配体-受体、抗原-抗体或抗原结合片段、半抗原-抗半抗原抗体和Ig结合蛋白-Ig。可以使用本文中描述的方法或本领域中已知的其他方法将亲和结合对的组分偶联到本发明的组合物(例如人工核酸(例如含有TBS的人工核酸))或多价核心(例如水溶性多价核心)。

  生物素-生物素结合蛋白是充分表征的亲和结合对。可以使用生物素或其生物活性变体和类似物。亲和素和其他生物素结合蛋白以相当高的亲和性结合到生物素。示例性的生物素结合蛋白包括亲和素、链亲和素、中性亲和素TM(亲和素的一种去糖基化的形式)、CaptAvidinTM等。所述生物素结合蛋白可以是例如四聚体、二聚体或单体。生物素和生物素结合蛋白可以使用常规方法偶联到核酸、蛋白质或非核苷酸化学组成部分(例如聚合物,例如聚醚如聚乙二醇(PEG))。例如,各种不同的胺反应性、巯基反应性、羧基反应性、糖类/醛反应性、光反应性和其他生物素化试剂是可商购的。生物素结合蛋白包括亲和素、链亲和素和中性亲和素TM是可商购的,并且可以使用常规方法偶联到核酸、蛋白质或非核苷酸化学组成部分(例如聚合物,例如聚醚如聚乙二醇(PEG))。

  所述结合对可以是配体-受体结合对。广泛类型的受体和它们相应的配体在本领域中是已知的。所述结合对可以包括结合到配体的受体片段。所述受体可以是例如细胞因子受体(例如血管内皮生长因子(VEGF)受体(例如VEGFR-1和VEGFR-2)、肿瘤坏死因子(TNF)受体(例如TNF受体2)等)。可溶性受体包括工程化改造的、包含融合到Fc区的受体的细胞外结合部分的可溶性受体,在本领域中是已知的(例如依那西普,一种结合到TNF的可溶性TNF受体2蛋白,和阿柏西普,一种结合到VEGF的可溶性VEGF受体)。

  广泛种类的抗体和它们所结合的抗原在本领域中是已知的,并且任何适合的抗原-抗体或其抗原结合片段可用于本发明。示例性的抗原-抗体(或抗原结合片段)结合对包括地高辛/抗地高辛抗体、2,4-二硝基苯基(DNP)-三乙二醇(TEG)/抗DNP抗体、荧光素/抗荧光素抗体等。

  许多Ig结合蛋白在本领域中是已知的并且可用于本发明,例如蛋白A、蛋白G、蛋白L、蛋白M、结合免疫球蛋白的蛋白(BiP)和免疫球蛋白结合蛋白1(IGBP1)或其生物活性变体。Ig结合蛋白可以结合到免疫球蛋白的Fc区或其片段。

  偶联方法

  任何适合的偶联方法可用于共价连接本发明的组合物。例如,含有TBS的核酸可以被偶联到多价核心(例如水溶性多价核心)。各种不同的偶联反应在本领域中是已知的并且可用于本发明的情形中,例如环加成(例如叠氮化物-炔烃Huisgen环加成(例如铜(I)催化的叠氮化物-炔烃环加成(CuAAC)或应变助催的叠氮化物-炔烃环加成(SPAAC)))、酰胺或硫代酰胺键形成、周环反应、Diels-Alder反应、磺酰胺键形成、醇或酚烷基化、缩合反应、二硫键形成或亲核取代。

  在某些情况下,本发明的组合物可以包括偶联组成部分。偶联组成部分包括能够经历偶联反应例如前一段中描述的任何偶联反应的至少一个官能团。所述偶联组成部分可以包括但不限于1,3-二烯、烯烃、烷基氨基、烷基卤化物、烷基假卤化物、炔烃、氨基、苯胺基、芳基、叠氮化物、氮杂环丙烷、羧基、羰基、环硫化物、环氧化物、杂环、有机醇、异氰酸酯基团、马来酰亚胺、琥珀酰亚胺基酯、磺基琥珀酰亚胺基酯、巯基、硫醇或硫代异氰酸酯基团。

  使用拴系突触复合体的方法

  本发明的组合物和方法可用于广泛种类的应用,例如其中需要将核酸序列(例如含有可识别序列标签和/或引物结合位点)引入到靶核酸(例如DNA,例如基因组DNA)中的应用,包括例如用于核酸测序的文库的制备。通常,本发明的TSC可以在方法中使用,所述方法可以涉及将靶核酸(例如DNA,例如基因组DNA)与本发明的一种或多种组合物在适合于可转座核酸分子在所述靶核酸的远端位点处转座的条件下组合。本发明的组合物和方法不同于本领域中已知的其他组合物和方法的主要模式在于在将靶核酸例如DNA与TSC组合后,拴系所述TSC中的两个突触复合体的每个可转座核酸分子在两个不同的分子转座事件中被共价附连在所述靶DNA中的远端位置处。相反,目前的做法通常在单一分子转座事件中在所述靶DNA中的同一位置处附连两个接头分子。将一个可转座核酸分子附连到两个远端位置的优点在于附连的概率与所述靶DNA中附连位点之间的距离相关。在同一DNA分子上的局部和远端位点之间建立的直接连接,揭示出在远超过当前DNA测序技术的读出长度限制的尺度上DNA的组织。

  本发明的广泛用途扩展到核酸(例如DNA)测序的许多领域。本发明的用途的一个实例是允许获得关于突变分相的信息,突变分相相对于感兴趣的靶DNA或参比序列已经以顺式产生或者反式产生。

  在其中使TSC与靶DNA发生接触的本发明的任何方法,可以包括修饰所述靶DNA的步骤,修饰靶DNA为了将通常远离的位点带入一个取向,在所述取向中TSC可以更容易地共价桥接所述靶DNA中的一个远端位点和另一个远端位点。本发明应对的一个明显挑战是克服转座酶的与可用的最近转座酶结合位点形成突触复合体,以将可转座DNA在所述靶DNA分子中的相同位置处准确地连接到反向链的自然倾向性。所述可用的最近转座酶结合位点通常存在于同一DNA分子上。通过产生其中TBS以规则间隔存在的TSC,潜在的分子相互作用的范围减小,由此提高了可以预测某些行为的可靠性。如果人们在同时限制所述靶DNA的移动范围(例如通过将它结合到底物或支架或将它暴露于引起DNA形成超螺旋、凝缩或沉淀的试剂),预期所述组合效应将产生更加高度有序的系统,其具有可以被修改以适合于应用需求的性质。例如,如果所述靶DNA的长度小于10千碱基,则人们可以将靶DNA以完全伸展的本源状态添加到TSC,因为所述靶DNA的压缩对于在这种相对短的跨度内检测连接的长程转座事件来说是不必要的。无论如何,本文中描述的任何TSC可以包括彼此近似等距离的多个突触复合体,并且这些TSC或任何其他TSC可用于包括限制所述靶DNA的移动范围的步骤的方法中。

  在某些优选实施方式中,TSC对由于结合、沉淀或凝缩剂的存在而改变拓扑学性质的靶DNA的作用将具有增强的实用性,因为事实上这些试剂可以引起通常在靶DNA分子中更加远离的位点进入更接近的物理近邻内。

  本发明的组合物(例如核酸和TSC)可用于许多转座方法中,例如用于制备测序用文库。示例性方法在下文进一步描述。

  一步转座方法的实例可以包括一个或多个(例如1、2、3、4或所有5个)下述步骤:(a)向靶DNA添加TSC;(b)添加DNA聚合酶以填充DNA中的间隙;(c)富集带有长距离连接信息的文库片段(例如通过用聚合酶链反应(PCR)或任何适合的方法扩增);(d)对文库片段并行测序(例如使用NGS);和(e)鉴定由转座的核酸序列(例如可识别序列标签)运输的文库片段之间的连接。

  本文中描述的任何方法可以包括使用TSC和使用可溶性转座体,以例如为了制备文库将DNA片段化并添加引物位点。参见例如图15。可以使用任何适合的可溶性转座体,例如任何适合的标签片段化试剂(例如Illumina NEXTERATM)。

  两步转座方法的实例可以包括一个或多个(例如1、2、3、4、5或所有6个)下述步骤:(a)向靶DNA添加TSC;(b)添加常规转座酶试剂以添加引物位点,用于连接的但分开的转座事件的产物的基于扩增(例如PCR)的富集;(c)添加DNA聚合酶以填充DNA中的间隙;(d)富集带有长距离连接信息的文库片段;(e)对文库片段并行测序(例如使用NGS);和(f)鉴定由转座的核酸序列(例如可识别序列标签)运输的文库片段之间的连接。

  一种可选的涉及使用第一转座酶和第二转座酶的两步转座方法的实例可以包括一个或多个(例如1、2、3、4、5、6或所有7个)下述步骤:(a)向在每个末端处包含TBS的核酸添加第一转座酶以形成突触复合体(剩下所述第二转座酶);(b)向靶DNA添加在前一步骤中制备的突触复合体,以起始第一转座反应并允许它进行到完成,其中大部分所述第一转座酶和突触复合体被消耗;(c)向所述第一转座反应的产物添加所述第二转座酶以起始第二转座反应;(d)添加DNA聚合酶以填充DNA中的间隙;(e)富集带有长距离连接信息的DNA片段,例如使用通过PCR的扩增;(f)对文库片段并行测序;和(g)鉴定由转座的核酸序列(例如可识别序列标签)运输的文库片段之间的连接。

  一种可选的涉及使用第一转座酶和第二转座酶的两步转座方法的实例可以包括一个或多个(例如1、2、3、4、5、6或所有7个)下述步骤:(a)向多价转座酶试剂添加第一转座酶,所述试剂具有包括可以被所述第一转座酶结合的TBS的人工核酸的第一群体和包括可以被所述第二转座酶结合的TBS的人工核酸的第二群体,以形成突触复合体(剩下所述第二转座酶);(b)向靶DNA添加在前一步骤中制备的突触复合体,以起始第一转座反应并允许它进行到完成,其中大部分所述第一转座酶和突触复合体被消耗;(c)向所述第一转座反应的产物添加所述第二转座酶以起始第二转座反应;(d)添加DNA聚合酶以填充DNA中的间隙;(e)富集带有长距离连接信息的DNA片段,例如使用通过PCR的扩增;(f)对文库片段并行测序;和(g)鉴定由转座的核酸序列(例如可识别序列标签)运输的文库片段之间的连接。

  前面段落中描述的可选的两步转座方法的示例性基本原理在于插入到靶DNA中的转座的核酸(例如可识别序列标签)之间的平均距离,可以通过相对于所述靶DNA的浓度调整所述第一突触复合体试剂的浓度来控制(其中所述第一突触复合体试剂的较高的相对浓度或靶DNA的较低的浓度将导致所述插入的可转座核酸分子的更近的间距)。在所述第一步骤中,所述突触复合体将插入在靶DNA中的单一位点处,因为在添加所述第二转座酶之前在一个末端处的TBS仍然是游离的。在所述第一转座反应完成后,添加所述第二转座酶,并且所述转座的核酸上的游离末端与所述第二转座酶形成活性突触复合体,并且第二转座反应进行,将所述转座的核酸的另一个末端附连到靶DNA中与由所述第一转座步骤催化的插入邻近的位置中。

  一种涉及使用第一转座酶和第二转座酶的三步转座方法的实例可以包括一个或多个(例如1、2、3、4、5、6、7、8或所有9个)下述步骤:(a)添加所述第一转座酶蛋白以将两个核酸分子通过TBS结合在一起,形成突触复合体(所述第二转座酶蛋白暂时被扣留);(b)向靶DNA添加在前一步骤中制备的突触复合体,以起始第一转座反应并允许所述反应进行到完成,其中所述第一转座酶和突触复合体被消耗;(c)向所述第一转座反应的产物添加所述第二转座酶,以起始第二转座反应;(d)任选地添加核酸酶以在特定位置(例如切割位点)处切开所述转座的核酸;(e)添加常规转座酶试剂(例如标签片段化试剂例如IlluminaNEXTERATM)以添加引物位点,用于第三转座反应中连接的但分开的转座事件的产物的PCR富集;(f)添加DNA聚合酶以填充DNA中的间隙;(g)富集带有长距离连接信息的文库片段,例如使用通过PCR的扩增;(h)对文库片段并行测序;和(i)鉴定由转座的核酸序列(例如可识别序列标签)运输的文库片段之间的连接。

  本发明可广泛用于确定连接的DNA分子隔开的距离的目的。如上所述,可以制造(例如合成)带有用于一个转座酶的至少一个完全形成的TBS和用于相同或不同转座酶的部分或完全形成的TBS的单一核酸分子。在所述两步转座反应的这个特定实施方式中,将所述可转座核酸制备物与第一转座酶蛋白温育,以形成突触复合体的第一混合物,然后添加到靶DNA样品以起始第一轮转座事件。向固定量的靶DNA添加更多的突触复合体,将导致分隔转座事件的平均距离更小。在所述第一转座反应后,添加DNA聚合酶和脱氧核苷酸三磷酸(dNTP),导致DNA延伸,以完成同一个接头上第二转座酶结合位点的形成。如果将不同的转座酶蛋白用于所述第二转座步骤(在下文描述),则可以从所述程序一开始就使用具有用于所述第二转座酶的完全形成的转座酶结合位点的核酸。为了从已被插入到靶DNA中的核酸制备另外的突触复合体,在所述第一转座反应完成后并在使所述用于第二转座步骤的转座酶结合位点有活性,添加更多转座酶。所述第二转座反应通过在适合于所述第二转座酶的活性的条件下向所述第二有活性的突触复合体添加第二DNA样品来起始。所述第二转座反应将所述第一DNA样品连接到第二DNA样品。

  在两步转座方法的另一个实例中,所述第一和第二DNA样品分别是靶样品和参比样品。所述靶DNA样品可以是合成或天然的DNA,来自于任何来源,不论是植物、动物、微生物、病毒、环境还是未知起源。参比DNA样品也可以来自于合成或天然来源,其中所有或某些所述参比DNA序列是已知的。所述参比DNA在分子生物学技术中可用于几种目的;例如,作为用于DNA标记和DNA测序的高度多样性的索引序列;通过共价连接到DNA序列和长度已知的参比DNA,用于鉴定从同一靶DNA分子产生的远程连接和紧邻的DNA文库片段;用于对DNA片段的群体的多样性进行定量;用于为DNA附加上具有独特索引的序列引发位点以备扩增;和使用所述参比DNA上的插入位点之间的已知距离作为“计量尺”,用于估算同一靶分子上的两个或更多个转座事件相隔的距离。

  本领域普通技术人员将会认识到,靶DNA或参比DNA可以充当所述第一转座的底物。在另一个实施方式中,所述参比DNA样品作为即用型制剂供应在试剂盒中,其中所述参比DNA试剂已经历所述第一转座并且已与所述第二转座酶复合,使得试剂盒的终端用户可以将靶DNA样品与所述提供在试剂盒中的参比DNA试剂混合,以起始下一个转座反应。这种形式的与功能完整的转座酶复合的参比DNA,被称为“活化的参比DNA”。

  另一方面,所述参比DNA被设计并生产成适合于特定DNA测序应用的要求。当靶DNA样品大且复杂,如同人类基因组DNA的情况时,可以选择或设计所述参比DNA以提供非常大量的独特插入位点,使得通过突触复合体转座到所述参比DNA上的独特位点中,可以已足够的测序深度自信地鉴定相邻的文库片段。对于任何给定的靶DNA样品来说,所述提供的独特参比DNA的长度(以bp为单位)通常应该比人们打算测序的靶分子的数目超出两个或更多个数量级。在已知的参比DNA中在某些点处插入混合碱基或以规则的间隔散置混合碱基,是人们可用于快速且廉价地产生多种多样的参比DNA以备DNA测序的一种手段。尽管来自于天然来源的已知DNA可以充当用于制备参比DNA的适合的DNA底物,但合成的参比DNA具有明显优点,因为可以随意改变用于DNA测序的所需性质。

  在另一个实施方式中,将参比DNA样品固定化以在与靶DNA样品反应时限制它的移动。例如,可以将生物素化的参比DNA通过特异性位点固定化在链亲和素顺磁性珠子上以使所述参比DNA定向,用于与溶液相靶DNA发生生产性相互作用。在与活化的参比DNA反应之前,也可以将靶DNA固定化或凝缩。

  另一方面,可以将参比DNA样品的集合以密集的格式在固体基材上排列成某些可识别的图案。固定化的参比DNA的图案,可以通过分子生物学的从业者和实验室产品的制造者广泛已知的、特别是微阵列和DNA测序平台的制造者已知的许多方法中的一者或组合来产生,例如用于在固体表面上或微孔中配置珠子或小液滴的方法;通过移液、点样、喷洒、声学点样或压电点样将DNA或带有DNA的珠子施加到用于固定化的表面上的方法;或用于在表面上直接合成DNA的方法。接下来,通过移液、点样、溢流或通过使溶液流经微流体通路(或通过以前提到的任何其他方法),将靶DNA分子的溶液施加到固定化的参比DNA的表面。在这个实施方式中,所述参比DNA样品的地址,在将所述靶DNA施加到所述固定化的参比物之前已知,在将所述靶DNA施加到所述固定化的参比物之前或之后通过DNA测序确定,或者通过分子生物学家已知用于查询DNA内含物的相对位置的某些其他方法或方法的组合确定,例如通过将标记的寡核苷酸杂交到所述参比DNA或靶DNA,或通过从结合到表面的核酸进行寡核苷酸的聚合酶延伸。在某些情况下,固定化的靶DNA样品可以代替这些实例中的固定化的参比DNA,而在其他情况下,可以将溶液相参比DNA施加到固定化的靶DNA。当参比DNA分子(例如大肠杆菌基因组DNA)被制备成拴系突触复合体以保留它的天然顺序并通过转座插入在沿着靶DNA分子的多个位点处时,所述参比DNA序列可以充当所述在可识别序列标签之间具有已知距离的参比物中的已知位置处的可识别序列标签,并因此传送关于所述靶DNA序列的顺序的有用信息。

  在另一个实例中,可以将活化的参比DNA与靶DNA在不进行转座反应的条件下(例如通过扣留镁离子)混合。已证实,与DNA复合的有活性的转座酶(例如TSC)是稳定的,但参比DNA也可以以无活性形式储存,在晚些的时点在使用前向其添加转座酶。靶DNA和活化的DNA混合物的混合物可以通过添加已知形成DNA螺旋管或沉淀DNA的试剂(例如聚乙二醇、精胺、鱼精蛋白、锰、氯化六氨合钴等)共同凝缩。通过将两个或更多个分子共同卷绕成螺旋管或通过共沉淀所述DNA混合物,可以使所述活化的参比和靶DNA十分靠近,以进行转座。所述DNA螺旋管或沉淀物可以通过离心、过滤、结合到固体表面或通过用于固定化和除去过量凝缩/沉淀剂的另一种方法来收集。

  在优选实施方式中,所述参比DNA相对不含不想要的重复序列、极端碱基组成(例如低或高GC偏倚)的区域、转座酶的插入热点、均聚物序列或可能干扰参比DNA或DNA测序的可靠产生的任何其他DNA序列。

  在本文中描述的任何实施方式中,每个被转座核酸的两条链上的可识别序列标签可以是例如连续或不连续的互补随机物,其在DNA测序中所谓的索引读出步骤后,可用于检测靶DNA中被单个转座的核酸桥接的远端位点之间的连接(图5),其中在不同文库片段中紧靠插入位点下游的靶DNA中的重复序列的检测,提供了TSC中邻近的一对亚基在同一转座事件中被附连到靶DNA中该位置处的相反链的证据。所述索引和复制序列的位置对应于所述被转座DNA和靶序列内的已知位置,正因为如此,这些位置可以被自动查询。如果存在可用于预期的靶DNA序列的参比序列信息,则扩展到远远超出所述复制序列的序列数据可以支持更高置信度的长虚拟测序读出。

  本发明的TSC具有大量意料之外的优点。例如,TSC表现出强的转座邻近偏倚,这可能是由于TSC的漂流行为与转座酶蛋白在转座后保持紧密结合到所述被转座核酸的倾向性相组合,所述倾向性极大提高了来自于同一TSC的可转座核酸分子多次附连到同一DNA分子的可能性。此外,连接远端转座事件的可识别序列标签的反向互补序列,可以在使用DNA聚合酶的填充步骤期间被复制。此外,TSC可以在具有独特标识物(例如可识别序列标签)的分开的子合并物中组装,允许在不同TSC子合并物的漂流行为的基础上更容易地鉴定DNA测序数据集内的靶DNA岛。

  文库制备和测序方法

  本文中描述的组合物(例如TSC)和方法可用于例如制备靶核酸(例如DNA),以用于测序例如用于文库制备。本发明还提供了对靶核酸(例如DNA)进行测序的方法。本文中描述的或本领域中已知的任何适合的测序技术可用于本发明的情形中。为了确定靶核酸的核苷酸序列的方法可以是自动的(例如在全自动装置中)。所述方法优选地利用NGS方法。这些方法和它们的应用在下文更详细描述。参见例如图15和17。

  制备用于测序的靶核酸(例如DNA)的方法可以包括将本发明的TSC与靶核酸在一定条件下组合一定时间,所述条件和时间足以使所述TSC执行转座事件。所述方法还可以包括将所述靶核酸片段化并任选地向所述核酸片段的生成的末端添加多核苷酸。通常,所述反应在与转座相容的缓冲溶液中进行,许多所述缓冲溶液在本领域中是已知的(例如基于N-三(羟基甲基)甲基-3-氨基丙磺酸(TAPS)的缓冲液,参见Picelli等,Genome Res.24:2033,2014)。所述缓冲溶液通常包括任何必需的辅因子,例如二价金属阳离子(例如镁阳离子)。专业技术人员应该认识到,所述反应的准确条件和时间可以随着例如TSC(例如使用的转座酶)、靶核酸和使用的测序方法而变。这些条件可以在本公开内容和本领域中已知的常规方法的基础上容易地确定。

  可以使用用于片段化核酸的任何适合的方法,例如物理片段化(例如超声处理、声学剪切、雾化、针剪切和流体力学剪切)、酶片段化(例如使用核酸酶(例如核酸内切酶如DNaseI、限制性核酸内切酶(例如EcoRI、BamHI、EcoRV和ClaI)、RNAseIII、转座酶(例如Tn5)等)、化学片段化(例如使用热和二价金属阳离子例如镁或锌,其可用于长RNA片段的片段化)。所述片段化可以是随机或非随机的。例如,限制性核酸内切酶通常在特定序列处切开DNA,而其他酶例如DNAseI通常以相对低的序列特异性片段化DNA。片段化可以产生具有例如约10bp、约50bp、约100bp、约200bp、约300bp、约400bp、约500bp、约600bp、约700bp、约800bp、约900bp、约1000bp、约2000bp、约3000bp、约4000bp、约5000bp或更大的所需长度(例如片段群体的平均长度)的片段。

  在大多数基于转座酶的片段化方法中,将靶DNA用与短的合成寡核苷酸(例如含有转座酶结合位点和感兴趣的其他序列例如引物结合位点和/或可识别序列标签)复合的纯化的转座酶(例如Tn5)处理,以促进产生多个DNA片段的分子转座事件,而不是将转座子整合到靶DNA中。将纯化的转座酶作为试剂用于人工转座以制备用于NGS的文库的方法,有时被称为“标签片段化”。标签片段化试剂是可商购的(例如Illumina NEXTERATM),或者可以使用标准方法来生产(参见例如Picelli等,Genome Res.24:2033,2014)。

  可以使用用于向所述核酸片段的生成的末端添加多核苷酸的任何适合的方法。例如,所述方法可以包括酶法“补齐”DNA片段的末端(例如使用DNA聚合酶例如DNA聚合酶IKlenow片段、T7聚合酶、Taq、Pfu等)以允许接头DNA的连接,随后可以将不同的接头序列连接到所述补齐的DNA上(例如使用DNA连接酶),这允许原始来源的DNA的随机片段随后被高效且无偏倚地扩增。在另一个实例中,标签片段化方法可以导致将接头或条形码添加到每个片段的末端上。

  对靶核酸进行测序的方法可以包括一个或多个(例如1、2、3、4或所有5个)下述步骤:(a)将TSC与靶核酸在一定条件下组合一定时间,所述条件和时间足以使所述TSC执行转座事件;(b)将所述靶核酸片段化并向所述核酸片段的生成的末端添加多核苷酸;(c)选择包含从所述转座事件产生的核酸序列的DNA片段;(d)扩增所选择的片段;和(e)对所述扩增的片段进行测序。在特定实施方式中,(b)可以包括随机剪切和接头连接(也被称为“鸟枪改造”)或标签片段化。所述(c)的选择可以包括选择包含可识别序列标签的核酸片段。可以使用任何适合的方法来扩增所选择的片段,包括例如聚合酶链反应(PCR)、多重置换扩增(MDA)、连接酶链反应(LCR)、环介导等温扩增(LAMP)、滚环扩增(RCA)或链置换扩增(SDA)。其他扩增方法在本领域中是已知的并且可用于本发明。所述(e)的测序可以包括任何适合的测序方法,优选为NGS测序方法例如合成法测序(SBS)、连接法测序(SBL)和纳米孔测序。示例性的测序方法在下文更详细描述。任何所述方法还可以包括(f)分析所述测序的片段以鉴定由于存在从转座事件产生的核酸序列而可以被连接的所述靶核酸的片段。

  在某些情况下,SBS可用于本发明的情形中。SBS技术通常涉及通过针对模板链反复地添加核苷酸而进行的新生核酸链的酶法延伸。SBS技术可以利用具有终止物组成部分的核苷酸单体或缺少任何终止物组成部分的核苷酸单体。不利用终止物组成部分的SBS的某些示例性类型包括离子半导体测序和焦磷酸测序(参见例如Margulies等,Nature437(7057):376-80,2005;Rothberg等,Nat.Biotechnol.10(26):1117-24,2005;Merriman等,Electrophoresis 23(33):3397-417,2012;和美国专利号7,323,305、8,546,128、8,574,835、8,673,627、8,748,102和8,765,380)。在焦磷酸测序方法中,想要的DNA序列能够依赖于在核苷酸掺入后焦磷酸释放的检测,通过在下一个互补核苷酸掺入后发射的光来确定。在离子半导体测序方法中,检测是基于DNA聚合期间氢离子的释放。

  对于利用具有终止物组成部分的核苷酸单体的SBS技术来说,在所使用的测序条件下所述终止物可以是不可逆的,如同在利用双脱氧核苷酸的传统的Sanger测序中那样,或者所述终止物可以是可逆的(参见例如美国专利号5,750,341、6,255,475和6,355,431)。在这种实施方式中,将待测序的DNA修饰,以便能够通过互补序列附连到流动池。当所述DNA被扩增时,带有荧光标签的核苷酸被添加到DNA链,其中作为每个核苷酸上的可逆终止物的结果每一个扩增轮次添加一个碱基,并通过相机检测光发射。

  也可以使用涉及DNA聚合酶活性的实时监测的SBS技术。例如,在SMRTTM测序中,使用零模式波导(ZMW),其中所述ZMW是产生足够小的观察体积,以在DNA的单个核苷酸被并入到新生链中时观察到发射的荧光信号的结构(参见例如Levene等,Science 299(5607):682-6,2003;Eid等,Science 323(5910):133-8,2009;Chin等,Nat.Methods 6(10):563-9,2013;和美国专利号7,181,122、7,302,146和7,313,308)。在这些实施方式中,照射可以被限制到表面拴系的聚合酶周围厌升(zeptoliter)规模的体积,使得可以以低背景观察荧光标记的核苷酸的掺入。

  SBL技术也可用于本发明的情形。SBL的实例包括但不限于聚合酶克隆测序和通过寡核苷酸连接和检测的测序(SOLiDTM)(参见例如Mitra等,Anal.,Biochem.320(1):55-65,2003;Shendure等,Science 309(5741):1728-32,2005;Cloonan等,Nat.Methods 5(7):613-9,2008;和美国专利号9,243,290)。SBL使用DNA连接酶识别DNA序列中给定位置处存在的核苷酸,其依赖于DNA连接酶的错配敏感性而不是第二链合成。荧光标记的探针寡核苷酸的检测通常随着连接的每个循环来进行。

  也可以使用纳米孔测序。纳米孔测序是一种实时DNA测序技术,其中靶核酸通过纳米孔(参见例如Cockroft等,J.Am.Chem.Soc.3(130):818-20,2008;Feng等,GenomicsProteomics Bioinformatics 1(13):4-16,2015;Fuller等,Proc.Natl.Acad.Sci.USA 19(113):5233-8,2016;美国专利号7,001,792;和美国专利申请公开号2011/0177493和2016/0076092)。所述纳米孔可以是合成的孔或生物膜蛋白。当所述靶核酸通过所述纳米孔时,可以通过测量所述孔的电导的波动来识别每个碱基对。

  本文中描述的组合物(例如核酸和TSC)和方法可用于任何测序应用,特别是需要将确定的核酸序列(例如可识别序列标签)并入到靶核酸(例如DNA)中的测序应用。所述组合物和方法可用于获得全相位、解析的序列信息,并且可以克服由大多数NGS仪器强加的长度限制。本发明的示例性、非限制性应用包括全基因组测序、单细胞基因组测序、外显子组测序、RNA测序(RNA-seq)、基因组广度单体型测序、表观基因组学和转录组学。下一代测序的其他应用在本领域中也是已知的,并且本发明的组合物和方法可用于任何适合的应用。

  在某些情况下,本文中描述的组合物(例如核酸和TSC)和方法可用于全基因组或全外显子组测序,例如用于鉴定引起疾病的遗传变异,包括插入缺失、非同义变体或剪接位点变体(参见例如Cirulli等,Nat.Rev.Genet.11(6):415-25,2010)。在某些实施方式中,本发明可用于高通量RNA测序(RNA-seq),其中具体应用包括基因表达情况分析和剪接点分析(参见例如Li等,Nat.Biotechnol.32(9):915-25,2014)。在其他实施方式中,所述组合物(例如核酸和TSC)和方法可用于基因组广度的单体型测序,其中具体应用包括突变相评估(参见例如Snyder等,Nat.Rev.Genet.16(6):344-58,2015)。作为实例,本发明的组合物和方法可用于获得相位解析人类白细胞抗原(HLA)分型。

  在其他情况下,本文中描述的组合物(例如核酸和TSC)和方法可用于表观基因组应用,包括染色质免疫沉淀和随后的高通量测序(ChIP-seq)、通过亚硫酸氢盐测序进行的DNA甲基化分析和染色质足迹分析(参见例如Zentner等,Nat.Rev.Genet.15(12):814-27,2014;Park,Nat.Rev.Genet.10(10):669-80,2009;Brunner等,Genome Res.19(6):1044-56,2009;和Buenrostro等,Nat.Methods 10(12):1213-8,2013)。在其他实施方式中,本文中描述的组合物(例如核酸和TSC)和方法可用于单细胞基因组测序,其中具体应用包括基因组的从头组装、拷贝数变体检测和单核苷酸变体检测(参见例如Gawad等,Nat.Rev.Genet.17(3):175-88,2016)。

  靶核酸

  可以将任何靶核酸与本发明的组合物(例如TSC)组合,以例如用于文库制备和测序。例如,所述靶核酸可以是DNA、RNA、肽核酸、吗啉代核酸、锁核酸、甘油核酸、其杂合体及其混合物。所述靶核酸可以具有任何适合的长度,例如约10bp、约20bp、约50bp、约100bp、约200bp、约500bp、约1000bp、约5000bp、约10,000bp、约20,000bp、约50,000bp、约100,000bp、约250,000bp、约500,000bp、约750,000bp、约1百万bp、约5百万bp、约1千万bp、约1千5百万bp、约2千万bp或更长。所述靶核酸可以包括任何序列,并且可以包括均聚物序列或重复序列。所述重复序列可以是多种长度中的任一者,例如约2、约5、约6、约7、约8、约9、约10、约12、约15、约20、约25、约30、约35、约40、约45、约50、约100、约250、约500、约1000个核苷酸或更长。重复序列可以连续地或不连续地重复例如2、3、4、5、6、7、8、9、10、20、30次或更多次。

  所述靶核酸可以是单个靶核酸,或者可能存在多个靶核酸(例如数十、数百、数千、数百万或更多靶核酸)。所述多个靶核酸中的每个成员可以是相同的,或者每个成员可以是不同的。所述靶核酸可以是合成或天然的DNA,来自于任何来源,无论是来自于植物、动物(特别是哺乳动物例如人类)、微生物(例如原核生物例如细菌(如大肠埃希氏杆菌、金黄色葡萄球菌)或古菌,或真核生物例如真菌(如出芽酵母))、病毒、环境,还是未知起源。所述靶核酸可以占生物体的基因组的至少一部分(例如生物体的基因组的至少约1%、5%、10%、20%、25%、30%、40%、50%、75%、80%、90%、95%、99%或100%)。所述靶核酸可以是染色体。所述靶核酸可以包括来自于单个细胞的基因组DNA或cDNA。所述靶核酸可以包括来自于多个单体型的核酸。

  试剂盒

  本发明提供了试剂盒,其包括一种或多种本发明的组合物(例如核酸、多价转座酶试剂和TSC)。所述试剂盒可以包括对例如执行本发明的方法有用的一种或多种另外的试剂。所述试剂盒可以包括用于容纳所述试剂盒的组分的一个或多个容器(例如管(例如微量离心管)、板(例如微量滴定板)、托盘、包装材料等)。所述试剂盒还可以包括说明书(例如使用所述试剂盒的印刷说明书)。

  试剂盒可以包括任何本文中描述的核酸。例如,示例性的试剂盒可以包括人工核酸,其包括包含第一TBS的第一末端。在某些实施方式中,试剂盒可以包括人工核酸,其包括包含第一TBS的第一末端、包含第二TBS的第二末端和配置在所述第一TBS与第二TBS之间的连接区段。在某些实施方式中,其中在将第一转座酶结合到所述第一TBS并将第二转座酶结合到第二TBS后,所述第一转座酶不与所述第二转座酶寡聚化。所述试剂盒也可以包括结合到所述第一TBS或第二TBS的纯化的转座酶。所述核酸和纯化的转座酶可以存在于同一容器中或不同容器中。在某些情况下,所述人工核酸包括可识别序列标签。所述试剂盒可以包括各自具有相同的可识别序列标签的人工核酸。在其他实例中,所述试剂盒可以包括多个人工核酸,其中每个成员具有不同的可识别序列标签和/或TBS。试剂盒也可以包括任何前述人工核酸、第一转座酶和任选地第二转座酶,其中所述第一转座酶结合到所述第一TBS,并且所述第二任选的转座酶结合到第二TBS。

  试剂盒还可以包括任何本文中描述的多价转座酶试剂。例如,试剂盒可以包括多价转座酶试剂,其包括多价核心(例如水溶性多价核心)和连接到所述多价核心的三个或更多个人工核酸,其中每个人工核酸包括包含TBS的第一末端。

  在另一个实例中,试剂盒可以包括TSC。任何本文中描述的TSC可以被包含在试剂盒中。所述TSC可以包括例如3至1000个之间的突触复合体。在某些情况下,所述TSC中的每个人工核酸包括可识别序列标签。所述TSC中的每个可识别序列标签可以是一致的,或者所述TSC可以包括多个不同的可识别序列标签。在某些实施方式中,所述TSC中的每个可识别序列标签是不同的。在某些情况下,所述试剂盒包括多个TSC。在某些情况下,所述多个TSC中的每一者包括IST。在某些情况下,所述多个TSC包括多个不同的IST。在一个实施方式中,至少两个TSC各自包括单个IST,其不同于其他TSC的IST。例如,在某些情况下,所述试剂盒包括多个TSC,其中所述多个TSC中的每一者包括选自如下文实施例1中所描述的SEQ NO.1至SEQ NO.480的人工核酸序列。

  任何前述试剂盒可以包括一种或多种另外的试剂。例如,所述一种或多种另外的试剂可以包括可溶性转座体、辅因子、缓冲溶液和/或参比核酸。所述辅因子可以是二价金属阳离子(例如镁阳离子)。任何所述试剂盒还可以包括用于核酸测序的试剂,其可以包括例如寡核苷酸引物、底物、酶(例如DNA聚合酶)、核苷酸的混合物和/或参比核酸。

  实施例

  下面的实施例是可用于制备和使用带支架的多价TSC试剂的代表性演示。

  步骤1:

  如图5中所示和下文中详细描述的,生产用于拴系突触复合体的具有修饰的核苷酸的基于DNA的多价核心。

  1.用5-叠氮-PEG4-dCTP代替dCTP,从噬菌体λDNA(New England Biolabs)通过PCR扩增308bp的多价核心分子。所述308bpλDNA扩增子的完整序列如下:

  5’_CTGGCGGCTATCCAGTACAGCGCCGTACCAAGATAACGCGTGCTGGTTTCAACCTGTCTGATATCCGCAATCTGCTTTTCCGAGAACCAGAACTCAAACTGTACCGTCGGGTCATAAACGGCAAGATGCGGCGTGGCGGTTATCTGAAAATAGCCCGGCGTCAGCTCAATCCTCGACGGTGCTGCCGGTGCGGCAATCCGGAACGATACCGACGCCGGATCGCCCTGCTGCCCCCACGCATTTACCGCCCGGACTGTCAGCCTGTAGTTCCCCAGCGCCAGTTGCGTGAAGCGGTATGTGGTTTCCGT_3’(SEQ ID NO:481)

  a.接下来,将下述组分在110μl的最终PCR反应体积中组合:55pmol的LAM_10245_F引物(5’-CTGGCGGCTATCCAGTACAG(SEQ ID NO:482));55pmol的LAM_10552_R引物(5’-ACGGAAACCACATACCGCTT(SEQ ID NO:483));dGTP、dATP、dTTP和5-叠氮-PEG4-dCTP(5-叠氮-PEG4-2'-脱氧胞苷-5'-三磷酸,Jena Biosciences)各200μM;2.75单位的OneTaq DNA聚合酶(New England Biolabs);和11ng的λDNA。

  b.用于PCR的热循环条件如下:

  i.94℃30sec

  ii.94℃20sec

  iii.55℃20sec

  iv.68℃20sec

  v.循环到步骤ii另外21次

  vi.68℃5min

  vii.保持在10℃

  2.接下来,向PCR添加20单位的外切核酸酶I(New England Biolabs)以消化未掺入的引物。

  3.将上述反应混合物在37℃温育15min,在80℃温育20min,并且最后在60℃温育10min。

  4.然后将所述反应浓缩并使用Amicon Ultra-4离心超滤装置(3,000NMWL)(Millipore)渗滤所述外切核酸酶处理过的308bp多价核心,以除去未掺入的5-叠氮-PEG4-dCTP、残留的消化产物和其他低分子量反应组分。

  5.将所述浓缩的308bp多价核心制备物添加到Montage SEQ 96清理板(Millipore)。

  6.在MultiScreen多头抽真空装置(Millipore)上过滤直至孔显得变空,然后每个孔添加100μl超纯水。

  7.在多头抽真空装置上再次过滤,直至孔显得变空。

  步骤2:

  接下来,如图6中所示和下文中详细描述的,将5’-DBCO标记的poly-T TAG1夹板引物与来自于上一步骤的5-叠氮-PEG4-dCTP修饰的308bp多价核心(即通用支架)使用点击化学(即SPAAC)进行反应:

  1.在上述Montage SEQ 96清理板的孔中,将所述浓缩的308bp多价核心重悬浮在40μl的5’-DBCO(二苯并环辛基)标记的poly-T TAG1夹板引物(5’-DBCO-TTTTTTTTTTTTCAAGCAGAAGACGGCATACGAGAT(SEQ ID NO:484))中,所述夹板引物相对于所述308bp多价核心中存在的5-叠氮-PEG4-dCTP的摩尔数1.5倍摩尔过量,然后在多头抽真空装置上再次过滤,直至所有孔显得变空(用于将所述试剂浓缩在超滤膜的表面上并提高点击化学反应速率)。

  2.将所述浓缩的试剂一起在室温温育2小时,以允许点击化学反应进行。

  3.将所述反应产物(每个多价核心分子共价连接到5’-DBCO标记的poly-T TAG1夹板引物的多个拷贝)溶解在100μl pH8.0的10mM Tris-HCl中(所述连接到多价核心的寡核苷酸在下文描述的所述多价核心上的PCR期间充当正向引物)。

  步骤3:

  所述多价核心上全长的带条形码的TAG1接头的PCR如图7中所示,并在下文中详细描述:

  1.将125fmol的模板寡核苷酸(n=480个具有不同条形码的模板)、5pmol的在上述步骤中制备的共价附连有5’-DBCO(二苯并环辛基)寡核苷酸的多价核心、5pmol的TAG1-revcom-5P-引物(5’-P-CTGTCTCTT ATACACATCTCCGAGCCCACGAGAC(SEQ ID NO:485))和2XQ5 HotStart DNA聚合酶主混合物(New England Biolabs)在10μl的总反应体积中组合,置于5个96孔PCR板上的96个分开的孔中(n=480个PCR反应)(PCR用于在每个孔中扩增所述多价核心上的全长(80bp)接头(5’-TTTTTTTTTTTTCAAGCAGAAGACGGCATACGAGATNNNNNNNNNNGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG(SEQ ID NO:486)))。

  下面的序列代表了使用上述方法,用于通过PCR在所述多价核心上生产全长的带条形码的TAG1接头的所有480个模板序列的名单。

  SEQ ID NO:1

  CAAGCAGAAGACGGCATACGAGATGTACCATGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:2

  CAAGCAGAAGACGGCATACGAGATGTTGCTTCCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:3

  CAAGCAGAAGACGGCATACGAGATGTCGGTTGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:4

  CAAGCAGAAGACGGCATACGAGATGTGCTGTTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:5

  CAAGCAGAAGACGGCATACGAGATGTCTTGGATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:6

  CAAGCAGAAGACGGCATACGAGATGTGCTTCGAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:7

  CAAGCAGAAGACGGCATACGAGATGTCTCTACTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:8

  CAAGCAGAAGACGGCATACGAGATGTGAACATCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:9

  CAAGCAGAAGACGGCATACGAGATGTTGACGCATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:10

  CAAGCAGAAGACGGCATACGAGATGTGAGCTTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:11

  CAAGCAGAAGACGGCATACGAGATGTATGCCTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:12

  CAAGCAGAAGACGGCATACGAGATGTTCTTGACGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:13

  CAAGCAGAAGACGGCATACGAGATCTAGAACGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:14

  CAAGCAGAAGACGGCATACGAGATCTGACATGGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:15

  CAAGCAGAAGACGGCATACGAGATCTTCACGTTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:16

  CAAGCAGAAGACGGCATACGAGATCTTTGGTGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:17

  CAAGCAGAAGACGGCATACGAGATCTTGTGAAGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:18

  CAAGCAGAAGACGGCATACGAGATCTTGGAGAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:19

  CAAGCAGAAGACGGCATACGAGATCTGTGAGCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:20

  CAAGCAGAAGACGGCATACGAGATCTTTGTGTGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:21

  CAAGCAGAAGACGGCATACGAGATCTCTTCGTTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:22

  CAAGCAGAAGACGGCATACGAGATCTCGTTGAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:23

  CAAGCAGAAGACGGCATACGAGATCTCCATACGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:24

  CAAGCAGAAGACGGCATACGAGATCTATGACCAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:25

  CAAGCAGAAGACGGCATACGAGATTGGAGTGGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:26

  CAAGCAGAAGACGGCATACGAGATTGCGCATGATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:27

  CAAGCAGAAGACGGCATACGAGATTGACCATCCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:28

  CAAGCAGAAGACGGCATACGAGATTGTAGTTGCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:29

  CAAGCAGAAGACGGCATACGAGATTGTATTCCGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:30

  CAAGCAGAAGACGGCATACGAGATTGTACCAGGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:31

  CAAGCAGAAGACGGCATACGAGATTGCTGCACTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:32

  CAAGCAGAAGACGGCATACGAGATTGTGGATCACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:33

  CAAGCAGAAGACGGCATACGAGATTGGCAATGGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:34

  CAAGCAGAAGACGGCATACGAGATTGTCCGTATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:35

  CAAGCAGAAGACGGCATACGAGATTGACTCAGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:36

  CAAGCAGAAGACGGCATACGAGATTGAAGTGTCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:37

  CAAGCAGAAGACGGCATACGAGATAGAACTGAGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:38

  CAAGCAGAAGACGGCATACGAGATAGCTGTGTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:39

  CAAGCAGAAGACGGCATACGAGATAGTCCTTAGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:40

  CAAGCAGAAGACGGCATACGAGATAGGATTGGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:41

  CAAGCAGAAGACGGCATACGAGATAGACGTTCAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:42

  CAAGCAGAAGACGGCATACGAGATAGGCGTTCTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:43

  CAAGCAGAAGACGGCATACGAGATAGATTGCGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:44

  CAAGCAGAAGACGGCATACGAGATAGGTCGGTAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:45

  CAAGCAGAAGACGGCATACGAGATAGAGAGGTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:46

  CAAGCAGAAGACGGCATACGAGATAGTTGAGGCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:47

  CAAGCAGAAGACGGCATACGAGATAGTCTGCTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:48

  CAAGCAGAAGACGGCATACGAGATAGTGGAGTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:49

  CAAGCAGAAGACGGCATACGAGATTCGCCTTGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:50

  CAAGCAGAAGACGGCATACGAGATTCTGCCTCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:51

  CAAGCAGAAGACGGCATACGAGATTCCTGACACAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:52

  CAAGCAGAAGACGGCATACGAGATTCAGATGAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:53

  CAAGCAGAAGACGGCATACGAGATTCAGGCATAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:54

  CAAGCAGAAGACGGCATACGAGATTCCTATCGCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:55

  CAAGCAGAAGACGGCATACGAGATTCATAGCGGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:56

  CAAGCAGAAGACGGCATACGAGATTCTAGCCGAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:57

  CAAGCAGAAGACGGCATACGAGATTCATACTCCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:58

  CAAGCAGAAGACGGCATACGAGATTCTTGCAGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:59

  CAAGCAGAAGACGGCATACGAGATTCGGTATAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:60

  CAAGCAGAAGACGGCATACGAGATTCTCACAGCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:61

  CAAGCAGAAGACGGCATACGAGATACATGGCGAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:62

  CAAGCAGAAGACGGCATACGAGATACACCTGGAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:63

  CAAGCAGAAGACGGCATACGAGATACTGACTGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:64

  CAAGCAGAAGACGGCATACGAGATACTACGGTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:65

  CAAGCAGAAGACGGCATACGAGATACCCTTGATCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:66

  CAAGCAGAAGACGGCATACGAGATACATGGTCCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:67

  CAAGCAGAAGACGGCATACGAGATACCCAAGCAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:68

  CAAGCAGAAGACGGCATACGAGATACCAGCGATTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:69

  CAAGCAGAAGACGGCATACGAGATACAACGACGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:70

  CAAGCAGAAGACGGCATACGAGATACGAGCAGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:71

  CAAGCAGAAGACGGCATACGAGATACGCCAGTATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:72

  CAAGCAGAAGACGGCATACGAGATACCTGAGATCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:73

  CAAGCAGAAGACGGCATACGAGATCACCATTCACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:74

  CAAGCAGAAGACGGCATACGAGATCATTCTCTCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:75

  CAAGCAGAAGACGGCATACGAGATCAGGACCTATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:76

  CAAGCAGAAGACGGCATACGAGATCAGGATCTTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:77

  CAAGCAGAAGACGGCATACGAGATCAACACACTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:78

  CAAGCAGAAGACGGCATACGAGATCAGATGTGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:79

  CAAGCAGAAGACGGCATACGAGATCACCTGTCATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:80

  CAAGCAGAAGACGGCATACGAGATCACTAGGTGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:81

  CAAGCAGAAGACGGCATACGAGATCAGAAGAGGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:82

  CAAGCAGAAGACGGCATACGAGATCAGTCTTGCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:83

  CAAGCAGAAGACGGCATACGAGATCATAGGATGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:84

  CAAGCAGAAGACGGCATACGAGATCAGTTCATGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:85

  CAAGCAGAAGACGGCATACGAGATGACTCCATGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:86

  CAAGCAGAAGACGGCATACGAGATGAAACCTCCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:87

  CAAGCAGAAGACGGCATACGAGATGAGATTACCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:88

  CAAGCAGAAGACGGCATACGAGATGAACCGCATAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:89

  CAAGCAGAAGACGGCATACGAGATGATGGCACTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:90

  CAAGCAGAAGACGGCATACGAGATGAGTCCACATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:91

  CAAGCAGAAGACGGCATACGAGATGAAACGTGGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:92

  CAAGCAGAAGACGGCATACGAGATGAACTAGGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:93

  CAAGCAGAAGACGGCATACGAGATGATACGCCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:94

  CAAGCAGAAGACGGCATACGAGATGACAATGTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:95

  CAAGCAGAAGACGGCATACGAGATGAACTCTCGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:96

  CAAGCAGAAGACGGCATACGAGATGACATCGTGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:97

  CAAGCAGAAGACGGCATACGAGATGTGTCCTTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:98

  CAAGCAGAAGACGGCATACGAGATGTTGTACCGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:99

  CAAGCAGAAGACGGCATACGAGATGTTGCACCAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:100

  CAAGCAGAAGACGGCATACGAGATGTGGAGATGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:101

  CAAGCAGAAGACGGCATACGAGATGTCTTGCTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:102

  CAAGCAGAAGACGGCATACGAGATGTCACTGACAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:103

  CAAGCAGAAGACGGCATACGAGATGTCAGGAGATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:104

  CAAGCAGAAGACGGCATACGAGATGTCGGCTAATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:105

  CAAGCAGAAGACGGCATACGAGATGTTCCGTGAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:106

  CAAGCAGAAGACGGCATACGAGATGTTTACGGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:107

  CAAGCAGAAGACGGCATACGAGATGTATGGTTGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:108

  CAAGCAGAAGACGGCATACGAGATGTGTACCTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:109

  CAAGCAGAAGACGGCATACGAGATCTGGAATTGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:110

  CAAGCAGAAGACGGCATACGAGATCTTGGCATGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:111

  CAAGCAGAAGACGGCATACGAGATCTTGGTACAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:112

  CAAGCAGAAGACGGCATACGAGATCTAGTCAGGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:113

  CAAGCAGAAGACGGCATACGAGATCTTTGGTCTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:114

  CAAGCAGAAGACGGCATACGAGATCTAGGCTTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:115

  CAAGCAGAAGACGGCATACGAGATCTATCGCCATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:116

  CAAGCAGAAGACGGCATACGAGATCTGCTATCCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:117

  CAAGCAGAAGACGGCATACGAGATCTATCCAGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:118

  CAAGCAGAAGACGGCATACGAGATCTGCTTCTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:119

  CAAGCAGAAGACGGCATACGAGATCTGTAGGAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:120

  CAAGCAGAAGACGGCATACGAGATCTCCAGTGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:121

  CAAGCAGAAGACGGCATACGAGATTGCGCTAGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:122

  CAAGCAGAAGACGGCATACGAGATTGGGTAGTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:123

  CAAGCAGAAGACGGCATACGAGATTGTCGCGATAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:124

  CAAGCAGAAGACGGCATACGAGATTGCTGATCGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:125

  CAAGCAGAAGACGGCATACGAGATTGGTTGCGATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:126

  CAAGCAGAAGACGGCATACGAGATTGTTCGCAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:127

  CAAGCAGAAGACGGCATACGAGATTGCGAGACTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:128

  CAAGCAGAAGACGGCATACGAGATTGGAGATACGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:129

  CAAGCAGAAGACGGCATACGAGATTGTTACCGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:130

  CAAGCAGAAGACGGCATACGAGATTGGATTCAGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:131

  CAAGCAGAAGACGGCATACGAGATTGTCGCTGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:132

  CAAGCAGAAGACGGCATACGAGATTGTGCCATTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:133

  CAAGCAGAAGACGGCATACGAGATAGGTCCTAAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:134

  CAAGCAGAAGACGGCATACGAGATAGGACGAATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:135

  CAAGCAGAAGACGGCATACGAGATAGAAGTCCGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:136

  CAAGCAGAAGACGGCATACGAGATAGGAAGGTTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:137

  CAAGCAGAAGACGGCATACGAGATAGGATTGCTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:138

  CAAGCAGAAGACGGCATACGAGATAGGAGATGTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:139

  CAAGCAGAAGACGGCATACGAGATAGACACGGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:140

  CAAGCAGAAGACGGCATACGAGATAGAGTCGCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:141

  CAAGCAGAAGACGGCATACGAGATAGCTAACTCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:142

  CAAGCAGAAGACGGCATACGAGATAGACGACAGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:143

  CAAGCAGAAGACGGCATACGAGATAGAGCAAGCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:144

  CAAGCAGAAGACGGCATACGAGATAGGAACGCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:145

  CAAGCAGAAGACGGCATACGAGATTCGTATTGGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:146

  CAAGCAGAAGACGGCATACGAGATTCCGCAATCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:147

  CAAGCAGAAGACGGCATACGAGATTCGTGCTTACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:148

  CAAGCAGAAGACGGCATACGAGATTCAACCTTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:149

  CAAGCAGAAGACGGCATACGAGATTCGGAAGCTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:150

  CAAGCAGAAGACGGCATACGAGATTCGTTACGCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:151

  CAAGCAGAAGACGGCATACGAGATTCCGACGTTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:152

  CAAGCAGAAGACGGCATACGAGATTCAGCGTGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:153

  CAAGCAGAAGACGGCATACGAGATTCACCTTCTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:154

  CAAGCAGAAGACGGCATACGAGATTCCATTGCCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:155

  CAAGCAGAAGACGGCATACGAGATTCATCTTCGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:156

  CAAGCAGAAGACGGCATACGAGATTCTGACTTCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:157

  CAAGCAGAAGACGGCATACGAGATACAACTGGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:158

  CAAGCAGAAGACGGCATACGAGATACTCAAGGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:159

  CAAGCAGAAGACGGCATACGAGATACATTCGAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:160

  CAAGCAGAAGACGGCATACGAGATACGGCTATTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:161

  CAAGCAGAAGACGGCATACGAGATACCCGTATCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:162

  CAAGCAGAAGACGGCATACGAGATACGGATACCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:163

  CAAGCAGAAGACGGCATACGAGATACCGATGCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:164

  CAAGCAGAAGACGGCATACGAGATACTCTAACGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:165

  CAAGCAGAAGACGGCATACGAGATACATGTAGCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:166

  CAAGCAGAAGACGGCATACGAGATACCAATCGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:167

  CAAGCAGAAGACGGCATACGAGATACGAGGACTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:168

  CAAGCAGAAGACGGCATACGAGATACGGTGATTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:169

  CAAGCAGAAGACGGCATACGAGATCATAACGAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:170

  CAAGCAGAAGACGGCATACGAGATCACACGTTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:171

  CAAGCAGAAGACGGCATACGAGATCATGTTCGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:172

  CAAGCAGAAGACGGCATACGAGATCATCTCTAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:173

  CAAGCAGAAGACGGCATACGAGATCAGTGCCATAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:174

  CAAGCAGAAGACGGCATACGAGATCATTAAGCGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:175

  CAAGCAGAAGACGGCATACGAGATCAGAAGTTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:176

  CAAGCAGAAGACGGCATACGAGATCATACACGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:177

  CAAGCAGAAGACGGCATACGAGATCACAGTGAAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:178

  CAAGCAGAAGACGGCATACGAGATCACTACAGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:179

  CAAGCAGAAGACGGCATACGAGATCAGTGGTGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:180

  CAAGCAGAAGACGGCATACGAGATCACTTCACCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:181

  CAAGCAGAAGACGGCATACGAGATGAAAGAGCCAGTCTCGTGGGCTCGGAGATG

  SEQ ID.NO:182

  CAAGCAGAAGACGGCATACGAGATGAAGGTCACTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:183

  CAAGCAGAAGACGGCATACGAGATGAAACCGTTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:184

  CAAGCAGAAGACGGCATACGAGATGAAGCGGAATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:185

  CAAGCAGAAGACGGCATACGAGATGAAAGCCACAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:186

  CAAGCAGAAGACGGCATACGAGATGACTTACAGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:187

  CAAGCAGAAGACGGCATACGAGATGAGCGATAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:188

  CAAGCAGAAGACGGCATACGAGATGAGAACACACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:189

  CAAGCAGAAGACGGCATACGAGATGACAACACCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:190

  CAAGCAGAAGACGGCATACGAGATGAACACCAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:191

  CAAGCAGAAGACGGCATACGAGATGAGCTGACTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:192

  CAAGCAGAAGACGGCATACGAGATGAGAGACGATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:193

  CAAGCAGAAGACGGCATACGAGATGTTGGTCCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:194

  CAAGCAGAAGACGGCATACGAGATGTCTTAGGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:195

  CAAGCAGAAGACGGCATACGAGATGTTCGCATTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:196

  CAAGCAGAAGACGGCATACGAGATGTCTAGCAAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:197

  CAAGCAGAAGACGGCATACGAGATGTGGTCTTAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:198

  CAAGCAGAAGACGGCATACGAGATGTACGGTCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:199

  CAAGCAGAAGACGGCATACGAGATGTACGACTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:200

  CAAGCAGAAGACGGCATACGAGATGTTGCGAACTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:201

  CAAGCAGAAGACGGCATACGAGATGTGGACAATCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:202

  CAAGCAGAAGACGGCATACGAGATGTTTCTCGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:203

  CAAGCAGAAGACGGCATACGAGATGTTAAGTGGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:204

  CAAGCAGAAGACGGCATACGAGATGTATCGGTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:205

  CAAGCAGAAGACGGCATACGAGATCTGCTGTAAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:206

  CAAGCAGAAGACGGCATACGAGATCTGTGAAGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:207

  CAAGCAGAAGACGGCATACGAGATCTAAGGCGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:208

  CAAGCAGAAGACGGCATACGAGATCTTCACTCTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:209

  CAAGCAGAAGACGGCATACGAGATCTGTCTAGGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:210

  CAAGCAGAAGACGGCATACGAGATCTCCTTGTAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:211

  CAAGCAGAAGACGGCATACGAGATCTCATTCGGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:212

  CAAGCAGAAGACGGCATACGAGATCTGATGCACTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:213

  CAAGCAGAAGACGGCATACGAGATCTTGTGCGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:214

  CAAGCAGAAGACGGCATACGAGATCTCCAATAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:215

  CAAGCAGAAGACGGCATACGAGATCTGTTCGGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:216

  CAAGCAGAAGACGGCATACGAGATCTTGGTAGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:217

  CAAGCAGAAGACGGCATACGAGATTGGTATGCTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:218

  CAAGCAGAAGACGGCATACGAGATTGCGCTTAACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:219

  CAAGCAGAAGACGGCATACGAGATTGCTCCTAGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:220

  CAAGCAGAAGACGGCATACGAGATTGCTTCTGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:221

  CAAGCAGAAGACGGCATACGAGATTGAGCAGATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:222

  CAAGCAGAAGACGGCATACGAGATTGCCGTAAGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:223

  CAAGCAGAAGACGGCATACGAGATTGTTGATCCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:224

  CAAGCAGAAGACGGCATACGAGATTGTGCAGGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:225

  CAAGCAGAAGACGGCATACGAGATTGCAGGTTAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:226

  CAAGCAGAAGACGGCATACGAGATTGTACGCTACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:227

  CAAGCAGAAGACGGCATACGAGATTGCCAGGATAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:228

  CAAGCAGAAGACGGCATACGAGATTGCGTGTGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:229

  CAAGCAGAAGACGGCATACGAGATAGGTTGTAGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:230

  CAAGCAGAAGACGGCATACGAGATAGCAGTCTTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:231

  CAAGCAGAAGACGGCATACGAGATAGAGCACTTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:232

  CAAGCAGAAGACGGCATACGAGATAGACTCGTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:233

  CAAGCAGAAGACGGCATACGAGATAGTAGGTAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:234

  CAAGCAGAAGACGGCATACGAGATAGGTCTGATCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:235

  CAAGCAGAAGACGGCATACGAGATAGACAGCTCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:236

  CAAGCAGAAGACGGCATACGAGATAGCCGATGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:237

  CAAGCAGAAGACGGCATACGAGATAGCTGTTGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:238

  CAAGCAGAAGACGGCATACGAGATAGTAGCGTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:239

  CAAGCAGAAGACGGCATACGAGATAGAACCGAAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:240

  CAAGCAGAAGACGGCATACGAGATAGCTTACCTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:241

  CAAGCAGAAGACGGCATACGAGATTCAGTTACGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:242

  CAAGCAGAAGACGGCATACGAGATTCCATCCTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:243

  CAAGCAGAAGACGGCATACGAGATTCGTAACGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:244

  CAAGCAGAAGACGGCATACGAGATTCGTCGAAGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:245

  CAAGCAGAAGACGGCATACGAGATTCCAGTTCTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:246

  CAAGCAGAAGACGGCATACGAGATTCGGTGTCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:247

  CAAGCAGAAGACGGCATACGAGATTCACATTGCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:248

  CAAGCAGAAGACGGCATACGAGATTCACGGAACAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:249

  CAAGCAGAAGACGGCATACGAGATTCCCTGATTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:250

  CAAGCAGAAGACGGCATACGAGATTCACGGATTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:251

  CAAGCAGAAGACGGCATACGAGATTCTTGACAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:252

  CAAGCAGAAGACGGCATACGAGATTCTGTGGTACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:253

  CAAGCAGAAGACGGCATACGAGATACACTCCATCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:254

  CAAGCAGAAGACGGCATACGAGATACTCGAAGGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:255

  CAAGCAGAAGACGGCATACGAGATACAGTCTGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:256

  CAAGCAGAAGACGGCATACGAGATACCTAGGCATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:257

  CAAGCAGAAGACGGCATACGAGATACAACAACCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:258

  CAAGCAGAAGACGGCATACGAGATACCGTTGCAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:259

  CAAGCAGAAGACGGCATACGAGATACGCTACGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:260

  CAAGCAGAAGACGGCATACGAGATACGACAAGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:261

  CAAGCAGAAGACGGCATACGAGATACTCGAGTGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:262

  CAAGCAGAAGACGGCATACGAGATACAGGTTCGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:263

  CAAGCAGAAGACGGCATACGAGATACCGTCAATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:264

  CAAGCAGAAGACGGCATACGAGATACCGAGTATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:265

  CAAGCAGAAGACGGCATACGAGATCATCCTACCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:266

  CAAGCAGAAGACGGCATACGAGATCAAGCCAAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:267

  CAAGCAGAAGACGGCATACGAGATCAGCGTCATTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:268

  CAAGCAGAAGACGGCATACGAGATCACAGAATCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:269

  CAAGCAGAAGACGGCATACGAGATCAATCGATCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:270

  CAAGCAGAAGACGGCATACGAGATCATGAGGTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:271

  CAAGCAGAAGACGGCATACGAGATCAGACGATCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:272

  CAAGCAGAAGACGGCATACGAGATCACAACGGATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:273

  CAAGCAGAAGACGGCATACGAGATCAAGTCGACAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:274

  CAAGCAGAAGACGGCATACGAGATCAGATCGAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:275

  CAAGCAGAAGACGGCATACGAGATCATCAGACGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:276

  CAAGCAGAAGACGGCATACGAGATCACACCACTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:277

  CAAGCAGAAGACGGCATACGAGATGACTCTGGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:278

  CAAGCAGAAGACGGCATACGAGATGATACCACAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:279

  CAAGCAGAAGACGGCATACGAGATGAGACTTAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:280

  CAAGCAGAAGACGGCATACGAGATGATCTGAGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:281

  CAAGCAGAAGACGGCATACGAGATGAGTTCTCGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:282

  CAAGCAGAAGACGGCATACGAGATGAGCTTAGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:283

  CAAGCAGAAGACGGCATACGAGATGAGTGGATAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:284

  CAAGCAGAAGACGGCATACGAGATGACATAACGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:285

  CAAGCAGAAGACGGCATACGAGATGAACCTAAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:286

  CAAGCAGAAGACGGCATACGAGATGATCGACATCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:287

  CAAGCAGAAGACGGCATACGAGATGAGCTCTGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:288

  CAAGCAGAAGACGGCATACGAGATGAACTGCTAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:289

  CAAGCAGAAGACGGCATACGAGATGTAGAGCCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:290

  CAAGCAGAAGACGGCATACGAGATGTTGCTTGGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:291

  CAAGCAGAAGACGGCATACGAGATGTATCACACGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:292

  CAAGCAGAAGACGGCATACGAGATGTGTTGTTCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:293

  CAAGCAGAAGACGGCATACGAGATGTTGCGTAGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:294

  CAAGCAGAAGACGGCATACGAGATGTCATGGAACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:295

  CAAGCAGAAGACGGCATACGAGATGTCTGTTAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:296

  CAAGCAGAAGACGGCATACGAGATGTGGTACTACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:297

  CAAGCAGAAGACGGCATACGAGATGTGCCACTTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:298

  CAAGCAGAAGACGGCATACGAGATGTTATCAGCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:299

  CAAGCAGAAGACGGCATACGAGATGTCTTCGACTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:300

  CAAGCAGAAGACGGCATACGAGATGTCGAAGAACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:301

  CAAGCAGAAGACGGCATACGAGATCTCACCTTACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:302

  CAAGCAGAAGACGGCATACGAGATCTACATAGGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:303

  CAAGCAGAAGACGGCATACGAGATCTTGTCTGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:304

  CAAGCAGAAGACGGCATACGAGATCTCAGTCCAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:305

  CAAGCAGAAGACGGCATACGAGATCTGTCTCCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:306

  CAAGCAGAAGACGGCATACGAGATCTCAACCTAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:307

  CAAGCAGAAGACGGCATACGAGATCTAACGTCTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:308

  CAAGCAGAAGACGGCATACGAGATCTCCTCAGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:309

  CAAGCAGAAGACGGCATACGAGATCTCCTACTGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:310

  CAAGCAGAAGACGGCATACGAGATCTGCATACAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:311

  CAAGCAGAAGACGGCATACGAGATCTGTTAAGGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:312

  CAAGCAGAAGACGGCATACGAGATCTTTGCGAAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:313

  CAAGCAGAAGACGGCATACGAGATTGTTGGCTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:314

  CAAGCAGAAGACGGCATACGAGATTGATGCACGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:315

  CAAGCAGAAGACGGCATACGAGATTGGGCAAGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:316

  CAAGCAGAAGACGGCATACGAGATTGGGACTGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:317

  CAAGCAGAAGACGGCATACGAGATTGTGTTGTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:318

  CAAGCAGAAGACGGCATACGAGATTGTCCAATCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:319

  CAAGCAGAAGACGGCATACGAGATTGCTGCGTATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:320

  CAAGCAGAAGACGGCATACGAGATTGGAAGGAAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:321

  CAAGCAGAAGACGGCATACGAGATTGCTGGAGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:322

  CAAGCAGAAGACGGCATACGAGATTGTCCTGCTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:323

  CAAGCAGAAGACGGCATACGAGATTGCGTTATGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:324

  CAAGCAGAAGACGGCATACGAGATTGCTACTTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:325

  CAAGCAGAAGACGGCATACGAGATAGAGTTGGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:326

  CAAGCAGAAGACGGCATACGAGATAGAGGTGTACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:327

  CAAGCAGAAGACGGCATACGAGATAGCGATAGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:328

  CAAGCAGAAGACGGCATACGAGATAGATAAGGCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:329

  CAAGCAGAAGACGGCATACGAGATAGGTAGTCAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:330

  CAAGCAGAAGACGGCATACGAGATAGCAAGCAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:331

  CAAGCAGAAGACGGCATACGAGATAGTGTCCAGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:332

  CAAGCAGAAGACGGCATACGAGATAGTCGTTCGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:333

  CAAGCAGAAGACGGCATACGAGATAGTCTTCTGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:334

  CAAGCAGAAGACGGCATACGAGATAGCTGAAGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:335

  CAAGCAGAAGACGGCATACGAGATAGCATGAGGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:336

  CAAGCAGAAGACGGCATACGAGATAGACTGTGTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:337

  CAAGCAGAAGACGGCATACGAGATTCGGCGTTATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:338

  CAAGCAGAAGACGGCATACGAGATTCTGTAGCCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:339

  CAAGCAGAAGACGGCATACGAGATTCCGACCATTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:340

  CAAGCAGAAGACGGCATACGAGATTCATGACGTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:341

  CAAGCAGAAGACGGCATACGAGATTCTACATCGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:342

  CAAGCAGAAGACGGCATACGAGATTCGTCACTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:343

  CAAGCAGAAGACGGCATACGAGATTCGATAGGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:344

  CAAGCAGAAGACGGCATACGAGATTCTTGTCGGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:345

  CAAGCAGAAGACGGCATACGAGATTCAGACCGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:346

  CAAGCAGAAGACGGCATACGAGATTCCGAACTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:347

  CAAGCAGAAGACGGCATACGAGATTCCACTAGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:348

  CAAGCAGAAGACGGCATACGAGATTCTCTCGTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:349

  CAAGCAGAAGACGGCATACGAGATACGCCTATCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:350

  CAAGCAGAAGACGGCATACGAGATACGATAGCGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:351

  CAAGCAGAAGACGGCATACGAGATACTCGAACCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:352

  CAAGCAGAAGACGGCATACGAGATACAGTGCAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:353

  CAAGCAGAAGACGGCATACGAGATACTGTGACTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:354

  CAAGCAGAAGACGGCATACGAGATACGGTTGATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:355

  CAAGCAGAAGACGGCATACGAGATACTAGACGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:356

  CAAGCAGAAGACGGCATACGAGATACAGAAGCGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:357

  CAAGCAGAAGACGGCATACGAGATACCGTAGGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:358

  CAAGCAGAAGACGGCATACGAGATACCAGAGTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:359

  CAAGCAGAAGACGGCATACGAGATACTGCTCATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:360

  CAAGCAGAAGACGGCATACGAGATACTCATGGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:361

  CAAGCAGAAGACGGCATACGAGATCACGTACGAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:362

  CAAGCAGAAGACGGCATACGAGATCACTTAGTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:363

  CAAGCAGAAGACGGCATACGAGATCACCAAGACTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:364

  CAAGCAGAAGACGGCATACGAGATCACGTGATCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:365

  CAAGCAGAAGACGGCATACGAGATCAGGAAGGATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:366

  CAAGCAGAAGACGGCATACGAGATCAACCTCTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:367

  CAAGCAGAAGACGGCATACGAGATCAAAGAAGGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:368

  CAAGCAGAAGACGGCATACGAGATCAGTTGACCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:369

  CAAGCAGAAGACGGCATACGAGATCACAAGGTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:370

  CAAGCAGAAGACGGCATACGAGATCAGTCATCGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:371

  CAAGCAGAAGACGGCATACGAGATCAACATCCTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:372

  CAAGCAGAAGACGGCATACGAGATCACCAAGTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:373

  CAAGCAGAAGACGGCATACGAGATGACTCATTGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:374

  CAAGCAGAAGACGGCATACGAGATGATGATCGGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:375

  CAAGCAGAAGACGGCATACGAGATGATGCGCTTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:376

  CAAGCAGAAGACGGCATACGAGATGAGTGTTCCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:377

  CAAGCAGAAGACGGCATACGAGATGACTTGTCGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:378

  CAAGCAGAAGACGGCATACGAGATGACTCGTCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:379

  CAAGCAGAAGACGGCATACGAGATGAGTGTGACAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:380

  CAAGCAGAAGACGGCATACGAGATGACTGGTTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:381

  CAAGCAGAAGACGGCATACGAGATGAGCACAACTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:382

  CAAGCAGAAGACGGCATACGAGATGACATGGCTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:383

  CAAGCAGAAGACGGCATACGAGATGACTCATCAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:384

  CAAGCAGAAGACGGCATACGAGATGATGATACGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:385

  CAAGCAGAAGACGGCATACGAGATGTGATCCATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:386

  CAAGCAGAAGACGGCATACGAGATGTCCGACTATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:387

  CAAGCAGAAGACGGCATACGAGATGTTTCAGGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:388

  CAAGCAGAAGACGGCATACGAGATGTATCTCGCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:389

  CAAGCAGAAGACGGCATACGAGATGTAGCTCCTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:390

  CAAGCAGAAGACGGCATACGAGATGTCGCTCTATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:391

  CAAGCAGAAGACGGCATACGAGATGTGGATTCGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:392

  CAAGCAGAAGACGGCATACGAGATGTATGCCAACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:393

  CAAGCAGAAGACGGCATACGAGATGTGACTATGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:394

  CAAGCAGAAGACGGCATACGAGATGTATATGCGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:395

  CAAGCAGAAGACGGCATACGAGATGTAGGAGGAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:396

  CAAGCAGAAGACGGCATACGAGATGTATGGAAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:397

  CAAGCAGAAGACGGCATACGAGATCTGGTTGTCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:398

  CAAGCAGAAGACGGCATACGAGATCTGATGAGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:399

  CAAGCAGAAGACGGCATACGAGATCTTCGTGGATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:400

  CAAGCAGAAGACGGCATACGAGATCTGGACTAGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:401

  CAAGCAGAAGACGGCATACGAGATCTAATGGACGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:402

  CAAGCAGAAGACGGCATACGAGATCTCTCAGAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:403

  CAAGCAGAAGACGGCATACGAGATCTGGATGTAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:404

  CAAGCAGAAGACGGCATACGAGATCTCAAGTGCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:405

  CAAGCAGAAGACGGCATACGAGATCTTTAGGTCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:406

  CAAGCAGAAGACGGCATACGAGATCTTCTAGCTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:407

  CAAGCAGAAGACGGCATACGAGATCTGGTCAGATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:408

  CAAGCAGAAGACGGCATACGAGATCTGTAGCATCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:409

  CAAGCAGAAGACGGCATACGAGATTGTCGGTTACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:410

  CAAGCAGAAGACGGCATACGAGATTGCGGATTGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:411

  CAAGCAGAAGACGGCATACGAGATTGAATACGCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:412

  CAAGCAGAAGACGGCATACGAGATTGACCAGCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:413

  CAAGCAGAAGACGGCATACGAGATTGCTCGATACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:414

  CAAGCAGAAGACGGCATACGAGATTGTCAACTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:415

  CAAGCAGAAGACGGCATACGAGATTGACCGTAGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:416

  CAAGCAGAAGACGGCATACGAGATTGCCGGAATTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:417

  CAAGCAGAAGACGGCATACGAGATTGCGTCTTGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:418

  CAAGCAGAAGACGGCATACGAGATTGGAATCCGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:419

  CAAGCAGAAGACGGCATACGAGATTGACGATGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:420

  CAAGCAGAAGACGGCATACGAGATTGCGTATTCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:421

  CAAGCAGAAGACGGCATACGAGATAGAAGTCGAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:422

  CAAGCAGAAGACGGCATACGAGATAGAGTGTTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:423

  CAAGCAGAAGACGGCATACGAGATAGCAGGTATCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:424

  CAAGCAGAAGACGGCATACGAGATAGTATCGGTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:425

  CAAGCAGAAGACGGCATACGAGATAGTCTCCGATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:426

  CAAGCAGAAGACGGCATACGAGATAGCACACATGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:427

  CAAGCAGAAGACGGCATACGAGATAGCCACTTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:428

  CAAGCAGAAGACGGCATACGAGATAGGAGTCTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:429

  CAAGCAGAAGACGGCATACGAGATAGCATACCACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:430

  CAAGCAGAAGACGGCATACGAGATAGAAGGACACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:431

  CAAGCAGAAGACGGCATACGAGATAGGAATCGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:432

  CAAGCAGAAGACGGCATACGAGATAGTCAGGCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:433

  CAAGCAGAAGACGGCATACGAGATTCTAGAGCTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:434

  CAAGCAGAAGACGGCATACGAGATTCGTGTCTGAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:435

  CAAGCAGAAGACGGCATACGAGATTCGCATGTCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:436

  CAAGCAGAAGACGGCATACGAGATTCAATGCCTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:437

  CAAGCAGAAGACGGCATACGAGATTCGATCGTACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:438

  CAAGCAGAAGACGGCATACGAGATTCACCAATGCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:439

  CAAGCAGAAGACGGCATACGAGATTCGCTGGATTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:440

  CAAGCAGAAGACGGCATACGAGATTCTGGCTATCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:441

  CAAGCAGAAGACGGCATACGAGATTCAACGGTCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:442

  CAAGCAGAAGACGGCATACGAGATTCGTACTCTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:443

  CAAGCAGAAGACGGCATACGAGATTCCGTGTACTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:444

  CAAGCAGAAGACGGCATACGAGATTCTGAAGACGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:445

  CAAGCAGAAGACGGCATACGAGATACCTTCCGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:446

  CAAGCAGAAGACGGCATACGAGATACCACAAGTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:447

  CAAGCAGAAGACGGCATACGAGATACCGGTCATAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:448

  CAAGCAGAAGACGGCATACGAGATACACGCCTAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:449

  CAAGCAGAAGACGGCATACGAGATACTGAGCTAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:450

  CAAGCAGAAGACGGCATACGAGATACTAATGCCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:451

  CAAGCAGAAGACGGCATACGAGATACGATACTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:452

  CAAGCAGAAGACGGCATACGAGATACAACAGGACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:453

  CAAGCAGAAGACGGCATACGAGATACATCCGGTAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:454

  CAAGCAGAAGACGGCATACGAGATACAAGCGCATGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:455

  CAAGCAGAAGACGGCATACGAGATACACTGAGGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:456

  CAAGCAGAAGACGGCATACGAGATACGTAGAGCAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:457

  CAAGCAGAAGACGGCATACGAGATCATTCCAAGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:458

  CAAGCAGAAGACGGCATACGAGATCACCTTCCTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:459

  CAAGCAGAAGACGGCATACGAGATCAGCAATTCGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:460

  CAAGCAGAAGACGGCATACGAGATCATCGTAGTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:461

  CAAGCAGAAGACGGCATACGAGATCATTCAGCCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:462

  CAAGCAGAAGACGGCATACGAGATCAAGGAACCTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:463

  CAAGCAGAAGACGGCATACGAGATCAAGTTCGTCGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:464

  CAAGCAGAAGACGGCATACGAGATCAGTCAGTTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:465

  CAAGCAGAAGACGGCATACGAGATCAAGGATCTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:466

  CAAGCAGAAGACGGCATACGAGATCAAAGCACTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:467

  CAAGCAGAAGACGGCATACGAGATCATCCGAGTTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:468

  CAAGCAGAAGACGGCATACGAGATCATGAACCTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:469

  CAAGCAGAAGACGGCATACGAGATGAGCCATAACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:470

  CAAGCAGAAGACGGCATACGAGATGATTGGACGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:471

  CAAGCAGAAGACGGCATACGAGATGATTCCTGTGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:472

  CAAGCAGAAGACGGCATACGAGATGAGCACGTAAGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:473

  CAAGCAGAAGACGGCATACGAGATGACATCTACGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:474

  CAAGCAGAAGACGGCATACGAGATGATACTGCGTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:475

  CAAGCAGAAGACGGCATACGAGATGATATGGCAGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:476

  CAAGCAGAAGACGGCATACGAGATGAACAGCAACGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:477

  CAAGCAGAAGACGGCATACGAGATGAGTTAGACGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:478

  CAAGCAGAAGACGGCATACGAGATGATTGCCACTGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:479

  CAAGCAGAAGACGGCATACGAGATGATTCGTTGGGTCTCGTGGGCTCGGAGATG

  SEQ ID NO:480

  CAAGCAGAAGACGGCATACGAGATGAAGCTTGAGGTCTCGTGGGCTCGGAGATG

  2.下面的热循环条件被用于在所述多价核心上扩增全长接头:

  1. 98℃30sec

  2. 98℃5sec

  2. 62℃10sec

  4. 72℃20sec

  5.循环到步骤2另外11次

  6. 72℃2min

  7.保持在10℃

  图8示出了通过所述PCR得到的共价附连到所述多价核心的80bp TAG1接头的示意图。所述拴系的TAG1接头也带有Illumina P7引物序列(5’-CAAGCAGAAGACGGCATACGAG(SEQID NO:487)),其在晚些时候允许在Illumina测序流动池上进行文库扩增和簇形成。

  3.在PCR后,随后将每个反应(n=480)在终浓度为0.25x外切核酸酶反应缓冲液(New England Biolabs)、5mM氯化镁和0.04单位/μl的外切核酸酶I(New EnglandBiolabs)中稀释到100μl,以消化所述未掺入的引物。

  4.然后将所述外切核酸酶I消化物在37℃温育15min,在80℃温育20min以热失活所述酶,最后在60℃温育10min。

  5.将一部分外切核酸酶I消化的PCR反应在琼脂糖凝胶上电泳,通过PicoGreen测定法(Thermo)定量,以确定在所述多价核心上扩增的dsDNA(即全长接头)的量。

  6.然后将90μl每种外切核酸酶I消化物添加到MultiScreen PCRμ96超滤板(Millipore)的分开的孔中。

  7.将上述反应在MultiScreen多头抽真空装置上过滤,直至孔显得变空,然后添加90μl pH 8.0的10mM Tris-HCl。

  8.再次过滤,直至孔变空。

  9.将每种纯化的消化物重悬浮在60μl pH 8.0的10mM Tris-HCl中。

  10.将来自于MultiScreen PCRμ96超滤板的每个孔的50μl转移到清洁的96孔PCR板。

  11.将每个反应稀释到55μl的终体积,其含有0.3x外切核酸酶I缓冲液和0.09单位/μl的λ外切核酸酶(New England Biolabs)的终浓度。

  12.将所述λ外切核酸酶消化物在37℃温育30min,以使所述多价核心上的接头成为单链,然后在75℃温育10min,以失活所述λ外切核酸酶。

  13.在终体积为60μl的80mM pH 8.0的Tris-HCl和10mM EDTA中,向多价核心上的ssDNA添加32.3fmol的TN5.MEDS.UNIV寡核苷酸(5’-P-CTGTCTCTTATACACATCT(SEQ ID NO:488))。

  14.将所述混合物在95℃变性2min,然后缓慢冷却至室温,以使TN5.MEDS.UNIV寡核苷酸退火到所述多价核心上的单链接头。

  所述多价核心上拴系突触复合体(TSC)的形成:

  1.在5个96孔PCR板(n=480个孔)中,将1.5pmol的Tn5转座酶与0.65pmol的拴系接头(在多价核心上)在总体积为95μl的1x转座酶结合缓冲液(130mMNaCl,12.5mM Tris-HCl,pH8.0,7.5%甘油,7.5%DMSO,0.05%Triton X-100,10.7mM CaCl2,12.9ng/μl乙酰化牛血清白蛋白)中组合,并在室温温育1小时以形成拴系到每个多价核心的突触复合体。

  2.将等体积的每种拴系突触复合体(n=480)合并在单个管中。

  使用拴系突触复合体(TSC)制备文库:

  1.在8孔PCR联排管(USA Scientific)的一个孔中,向体积为20μl的1X反应缓冲液中的1ng人类DNA添加1fmol的合并的拴系突触复合体(n=480)。

  2.在37℃温育9小时。

  3.添加125fmol的T2T(带有Illumina P5引物序列(5’-AATGATACGGCGACCACCGAG(SEQ ID NO:489)的未拴系的突触复合体)以允许在Illumina测序流动池上进行文库扩增和簇形成)。单链T2T的全长序列为(5’-AATGATACGGCGACCACCGAGATCTACACACACAGCTTCGTCGGCAGCGTCAGATGTGTATAAGAGACAG(SEQ ID NO:490)),并在添加Tn5转座酶以形成突触复合体之前被退火到TN5.MEDS.UNIV寡核苷酸(5’-P-CTGTCTCTTATACACATCT(SEQ ID NO:491))。

  4.在添加T2T后,在55℃温育15min,然后在25℃保持5min。

  5.添加11.6μl含有1%SDS和75mM EDTA(pH8)的终止溶液;然后将所述T2T反应在68℃热失活10min。

  6.用超纯水将所述终止的T2T反应稀释到50μl。

  7.添加40μl室温的MAGwise磁珠(seqWell),并通过移液充分混合。

  8.在室温温育5min,以将DNA片段结合到磁珠。

  9.通过将8孔PCR联排管在96S Super Magnet板(Alpaqua)上放置3min,将磁珠收集在容器的内壁上。

  10.在将所述8孔PCR联排管保留在所述磁板上的同时,吸取出上清液并舍弃。

  11.在将所述8孔PCR联排管保留在所述磁板上的同时,用120μl80%乙醇轻柔地清洗所述珠子沉淀物两次,并在每次清洗后通过吸取除去上清液。

  12.在将所述珠子沉淀物空气干燥5min后,将所述珠子充分重悬浮在25μl pH 8.0的10mM Tris-HCl中。

  13.添加25μl Kapa HiFi HotStart 2x ReadyMix(Kapa Biosystems),并通过吸取与重悬浮的珠子充分混合。

  14.在72℃温育10min以填充所述文库片段的末端,然后在95℃温育以变性所述文库片段。

  15.在将所述样品在95℃下变性的同时,向所述反应添加2μl 10μM P5引物(5’-AATGATACGGCGACCACCGAG(SEQ ID NO:492))和2μl 10μM P7引物(5’-CAAGCAGAAGACGGCATACGAG(SEQ ID NO:493))。

  16.使用下述热循环条件将文库扩增18个PCR循环:

  1. 95℃3min

  2. 98℃20sec

  3. 64℃45sec

  4. 72℃30sec

  5.循环到步骤2另外17次

  6. 72℃2min

  7.保持在4℃

  17.使用超纯水稀释到100μl,并转移到清洁的1.5ml LoBind管(Eppendorf)。

  18.添加77.5μl室温的MAGwise磁珠(seqWell),并通过吸取充分混合。

  19.在室温温育5min以将DNA结合到磁珠。

  20.通过将8孔PCR联排管在磁性管架上放置3min,将磁珠收集在管的内壁上。

  21.在仍然在磁性管架上的同时,吸取出上清液并舍弃。

  22.在磁性管架上的同时,将所述珠子沉淀物用400μl 80%乙醇轻柔地清洗两次,并在每次清洗后舍弃上清液。

  23.在空气干燥5min后,将管从磁性管架上取下,并将磁珠重悬浮在28μl pH 8.0的10mM Tris-HCl中。

  24.在室温洗脱5min。

  25.将所述管放回到所述磁性管架并等待3min,以沉淀所述磁珠。

  26.将所述纯化的文库(洗出液)转移到清洁的1.5ml LoBind管。

  27.重复步骤17-26。

  28.变性并稀释所述纯化的文库,以按照制造商的说明书装载到IlluminaNextSeq 500测序平台上。

  使用拴系突触复合体(TSC)制备文库并确定联系的转座事件之间的距离:

  将人类基因组DNA(1.5ng)与约300fmol的带有5,637种独特i7条形码的拴系突触复合体(TSC)在37℃温育30分钟。在热失活后,将所述反应使用MAGwise顺磁珠(seqWell)进行纯化。接下来,将纯化的TSC处理的DNA用30单位的截短的外切核酸酶VIII(New EnglandBiolabs)和20单位的外切核酸酶I(New England Biolabs)在37℃消化30分钟。在热失活后,将所述外切核酸酶消化物分到112个分开的标签化反应中,其添加112种独特的i5条形码。接下来,将所述112种标签化反应合并,并在热失活后纯化。因此,可能的条形码组合的总数为631,344(5,637x 112)。将所述合并的、纯化的标签化反应用P5和P7引物进行PCR扩增(18个循环),以产生NGS文库,然后在Illumina NextSeq 500序列仪上使用配对末端双索引化学进行测序。从测序仪获得测序数据,并使用bowtie2将其作图到hg38人类参比基因组,并将索引作图到P5和P7接头库。计算作图坐标并将其用于推断具有相同条形码的读出之间的距离,用于鉴定有连接/相位的读出。

  结果

  转座酶活性将来自于TSC的带条形码的读出半随机插入到分立的DNA区域中,其中有联系的读出在测序后被鉴定出来。源自于同一靶DNA分子的有联系的读出带有相同条形码,并通常在人类基因组参比DNA上小于50,000bp的距离处一起作图(图1)。无联系的读出带有不同条形码或相同条形码,但当无联系的读出带有相同条形码时,它们与具有相同条形码的有联系的读出相比通常相隔超过100-1000倍的作图距离(图2)。

  使用TSC处理过的人类DNA产生的文库的测序被进行,以评估具有一致的条形码的读出之间的距离(图16)。约20%的转座事件被认为是近端联系的,约80%的转座事件被认为是远端联系的。在数据集中被联系的观察到的转座事件的数目随距离的变化,示出在图18中。人类靶DNA上转座事件的数目随着距具有相同条形码的最近转座事件的作图距离的变化,与在对所述条形码进行随机排列后同一数据集的分析相比,示出在图19中。正如通过随机排列所评估的,在与背景分开约102至104bp处观察到的明显的峰(峰位于约107至108bp处)。

  序列表

  <110> 斯库维尔公司(seqWell, Inc.)

  <120> 用于对核酸进行测序的组合物和方法

  <130> 51178-003WO2

  <150> US 62/458,893

  <151> 2017-02-14

  <160> 518

  <170> PatentIn version 3.5

  <210> 1

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 1

  caagcagaag acggcatacg agatgtacca tgtggtctcg tgggctcgga gatg 54

  <210> 2

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 2

  caagcagaag acggcatacg agatgttgct tccagtctcg tgggctcgga gatg 54

  <210> 3

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 3

  caagcagaag acggcatacg agatgtcggt tgttgtctcg tgggctcgga gatg 54

  <210> 4

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 4

  caagcagaag acggcatacg agatgtgctg ttgtgtctcg tgggctcgga gatg 54

  <210> 5

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 5

  caagcagaag acggcatacg agatgtcttg gatggtctcg tgggctcgga gatg 54

  <210> 6

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 6

  caagcagaag acggcatacg agatgtgctt cgaagtctcg tgggctcgga gatg 54

  <210> 7

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 7

  caagcagaag acggcatacg agatgtctct actcgtctcg tgggctcgga gatg 54

  <210> 8

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 8

  caagcagaag acggcatacg agatgtgaac atcggtctcg tgggctcgga gatg 54

  <210> 9

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 9

  caagcagaag acggcatacg agatgttgac gcatgtctcg tgggctcgga gatg 54

  <210> 10

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 10

  caagcagaag acggcatacg agatgtgagc ttgtgtctcg tgggctcgga gatg 54

  <210> 11

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 11

  caagcagaag acggcatacg agatgtatgc ctgtgtctcg tgggctcgga gatg 54

  <210> 12

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 12

  caagcagaag acggcatacg agatgttctt gacggtctcg tgggctcgga gatg 54

  <210> 13

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 13

  caagcagaag acggcatacg agatctagaa cgaggtctcg tgggctcgga gatg 54

  <210> 14

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 14

  caagcagaag acggcatacg agatctgaca tggtgtctcg tgggctcgga gatg 54

  <210> 15

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 15

  caagcagaag acggcatacg agatcttcac gttcgtctcg tgggctcgga gatg 54

  <210> 16

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 16

  caagcagaag acggcatacg agatctttgg tgaggtctcg tgggctcgga gatg 54

  <210> 17

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 17

  caagcagaag acggcatacg agatcttgtg aagcgtctcg tgggctcgga gatg 54

  <210> 18

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 18

  caagcagaag acggcatacg agatcttgga gagtgtctcg tgggctcgga gatg 54

  <210> 19

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 19

  caagcagaag acggcatacg agatctgtga gcttgtctcg tgggctcgga gatg 54

  <210> 20

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 20

  caagcagaag acggcatacg agatctttgt gtgcgtctcg tgggctcgga gatg 54

  <210> 21

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 21

  caagcagaag acggcatacg agatctcttc gttcgtctcg tgggctcgga gatg 54

  <210> 22

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 22

  caagcagaag acggcatacg agatctcgtt gagtgtctcg tgggctcgga gatg 54

  <210> 23

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 23

  caagcagaag acggcatacg agatctccat acgtgtctcg tgggctcgga gatg 54

  <210> 24

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 24

  caagcagaag acggcatacg agatctatga ccaggtctcg tgggctcgga gatg 54

  <210> 25

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 25

  caagcagaag acggcatacg agattggagt ggttgtctcg tgggctcgga gatg 54

  <210> 26

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 26

  caagcagaag acggcatacg agattgcgca tgatgtctcg tgggctcgga gatg 54

  <210> 27

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 27

  caagcagaag acggcatacg agattgacca tccagtctcg tgggctcgga gatg 54

  <210> 28

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 28

  caagcagaag acggcatacg agattgtagt tgcggtctcg tgggctcgga gatg 54

  <210> 29

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 29

  caagcagaag acggcatacg agattgtatt ccgggtctcg tgggctcgga gatg 54

  <210> 30

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 30

  caagcagaag acggcatacg agattgtacc aggagtctcg tgggctcgga gatg 54

  <210> 31

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 31

  caagcagaag acggcatacg agattgctgc acttgtctcg tgggctcgga gatg 54

  <210> 32

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 32

  caagcagaag acggcatacg agattgtgga tcacgtctcg tgggctcgga gatg 54

  <210> 33

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 33

  caagcagaag acggcatacg agattggcaa tggagtctcg tgggctcgga gatg 54

  <210> 34

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 34

  caagcagaag acggcatacg agattgtccg tatggtctcg tgggctcgga gatg 54

  <210> 35

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 35

  caagcagaag acggcatacg agattgactc agacgtctcg tgggctcgga gatg 54

  <210> 36

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 36

  caagcagaag acggcatacg agattgaagt gtcggtctcg tgggctcgga gatg 54

  <210> 37

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 37

  caagcagaag acggcatacg agatagaact gagcgtctcg tgggctcgga gatg 54

  <210> 38

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 38

  caagcagaag acggcatacg agatagctgt gttggtctcg tgggctcgga gatg 54

  <210> 39

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 39

  caagcagaag acggcatacg agatagtcct tagcgtctcg tgggctcgga gatg 54

  <210> 40

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 40

  caagcagaag acggcatacg agataggatt ggaggtctcg tgggctcgga gatg 54

  <210> 41

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 41

  caagcagaag acggcatacg agatagacgt tcaggtctcg tgggctcgga gatg 54

  <210> 42

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 42

  caagcagaag acggcatacg agataggcgt tctagtctcg tgggctcgga gatg 54

  <210> 43

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 43

  caagcagaag acggcatacg agatagattg cgtggtctcg tgggctcgga gatg 54

  <210> 44

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 44

  caagcagaag acggcatacg agataggtcg gtaagtctcg tgggctcgga gatg 54

  <210> 45

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 45

  caagcagaag acggcatacg agatagagag gttggtctcg tgggctcgga gatg 54

  <210> 46

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 46

  caagcagaag acggcatacg agatagttga ggcagtctcg tgggctcgga gatg 54

  <210> 47

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 47

  caagcagaag acggcatacg agatagtctg ctctgtctcg tgggctcgga gatg 54

  <210> 48

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 48

  caagcagaag acggcatacg agatagtgga gttggtctcg tgggctcgga gatg 54

  <210> 49

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 49

  caagcagaag acggcatacg agattcgcct tgttgtctcg tgggctcgga gatg 54

  <210> 50

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 50

  caagcagaag acggcatacg agattctgcc tcttgtctcg tgggctcgga gatg 54

  <210> 51

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 51

  caagcagaag acggcatacg agattcctga cacagtctcg tgggctcgga gatg 54

  <210> 52

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 序列表

  <400> 52

  caagcagaag acggcatacg agattcagat gagggtctcg tgggctcgga gatg 54

  <210> 53

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 53

  caagcagaag acggcatacg agattcaggc ataggtctcg tgggctcgga gatg 54

  <210> 54

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 54

  caagcagaag acggcatacg agattcctat cgcagtctcg tgggctcgga gatg 54

  <210> 55

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 55

  caagcagaag acggcatacg agattcatag cggtgtctcg tgggctcgga gatg 54

  <210> 56

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 56

  caagcagaag acggcatacg agattctagc cgaagtctcg tgggctcgga gatg 54

  <210> 57

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 57

  caagcagaag acggcatacg agattcatac tccggtctcg tgggctcgga gatg 54

  <210> 58

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 58

  caagcagaag acggcatacg agattcttgc agacgtctcg tgggctcgga gatg 54

  <210> 59

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 59

  caagcagaag acggcatacg agattcggta tagggtctcg tgggctcgga gatg 54

  <210> 60

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 60

  caagcagaag acggcatacg agattctcac agcagtctcg tgggctcgga gatg 54

  <210> 61

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 61

  caagcagaag acggcatacg agatacatgg cgaagtctcg tgggctcgga gatg 54

  <210> 62

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 62

  caagcagaag acggcatacg agatacacct ggaagtctcg tgggctcgga gatg 54

  <210> 63

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 63

  caagcagaag acggcatacg agatactgac tgacgtctcg tgggctcgga gatg 54

  <210> 64

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 64

  caagcagaag acggcatacg agatactacg gttggtctcg tgggctcgga gatg 54

  <210> 65

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 65

  caagcagaag acggcatacg agataccctt gatcgtctcg tgggctcgga gatg 54

  <210> 66

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 66

  caagcagaag acggcatacg agatacatgg tccagtctcg tgggctcgga gatg 54

  <210> 67

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 67

  caagcagaag acggcatacg agatacccaa gcaagtctcg tgggctcgga gatg 54

  <210> 68

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 68

  caagcagaag acggcatacg agataccagc gattgtctcg tgggctcgga gatg 54

  <210> 69

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 69

  caagcagaag acggcatacg agatacaacg acgtgtctcg tgggctcgga gatg 54

  <210> 70

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 70

  caagcagaag acggcatacg agatacgagc agtagtctcg tgggctcgga gatg 54

  <210> 71

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 71

  caagcagaag acggcatacg agatacgcca gtatgtctcg tgggctcgga gatg 54

  <210> 72

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 72

  caagcagaag acggcatacg agatacctga gatcgtctcg tgggctcgga gatg 54

  <210> 73

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 73

  caagcagaag acggcatacg agatcaccat tcacgtctcg tgggctcgga gatg 54

  <210> 74

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 74

  caagcagaag acggcatacg agatcattct ctcggtctcg tgggctcgga gatg 54

  <210> 75

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 75

  caagcagaag acggcatacg agatcaggac ctatgtctcg tgggctcgga gatg 54

  <210> 76

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 76

  caagcagaag acggcatacg agatcaggat cttcgtctcg tgggctcgga gatg 54

  <210> 77

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 77

  caagcagaag acggcatacg agatcaacac actcgtctcg tgggctcgga gatg 54

  <210> 78

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 78

  caagcagaag acggcatacg agatcagatg tgtggtctcg tgggctcgga gatg 54

  <210> 79

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 79

  caagcagaag acggcatacg agatcacctg tcatgtctcg tgggctcgga gatg 54

  <210> 80

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 80

  caagcagaag acggcatacg agatcactag gtgagtctcg tgggctcgga gatg 54

  <210> 81

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 81

  caagcagaag acggcatacg agatcagaag aggtgtctcg tgggctcgga gatg 54

  <210> 82

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 82

  caagcagaag acggcatacg agatcagtct tgcagtctcg tgggctcgga gatg 54

  <210> 83

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 83

  caagcagaag acggcatacg agatcatagg atgcgtctcg tgggctcgga gatg 54

  <210> 84

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 84

  caagcagaag acggcatacg agatcagttc atgggtctcg tgggctcgga gatg 54

  <210> 85

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 85

  caagcagaag acggcatacg agatgactcc atgtgtctcg tgggctcgga gatg 54

  <210> 86

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 86

  caagcagaag acggcatacg agatgaaacc tcctgtctcg tgggctcgga gatg 54

  <210> 87

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 87

  caagcagaag acggcatacg agatgagatt accggtctcg tgggctcgga gatg 54

  <210> 88

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 88

  caagcagaag acggcatacg agatgaaccg catagtctcg tgggctcgga gatg 54

  <210> 89

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 89

  caagcagaag acggcatacg agatgatggc actagtctcg tgggctcgga gatg 54

  <210> 90

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 90

  caagcagaag acggcatacg agatgagtcc acatgtctcg tgggctcgga gatg 54

  <210> 91

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 91

  caagcagaag acggcatacg agatgaaacg tggagtctcg tgggctcgga gatg 54

  <210> 92

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 92

  caagcagaag acggcatacg agatgaacta ggaggtctcg tgggctcgga gatg 54

  <210> 93

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 93

  caagcagaag acggcatacg agatgatacg ccttgtctcg tgggctcgga gatg 54

  <210> 94

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 94

  caagcagaag acggcatacg agatgacaat gtgggtctcg tgggctcgga gatg 54

  <210> 95

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 95

  caagcagaag acggcatacg agatgaactc tcgagtctcg tgggctcgga gatg 54

  <210> 96

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 96

  caagcagaag acggcatacg agatgacatc gtgagtctcg tgggctcgga gatg 54

  <210> 97

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 97

  caagcagaag acggcatacg agatgtgtcc ttctgtctcg tgggctcgga gatg 54

  <210> 98

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 98

  caagcagaag acggcatacg agatgttgta ccgtgtctcg tgggctcgga gatg 54

  <210> 99

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 99

  caagcagaag acggcatacg agatgttgca ccaagtctcg tgggctcgga gatg 54

  <210> 100

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 100

  caagcagaag acggcatacg agatgtggag atgagtctcg tgggctcgga gatg 54

  <210> 101

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 101

  caagcagaag acggcatacg agatgtcttg ctgtgtctcg tgggctcgga gatg 54

  <210> 102

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 102

  caagcagaag acggcatacg agatgtcact gacagtctcg tgggctcgga gatg 54

  <210> 103

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 103

  caagcagaag acggcatacg agatgtcagg agatgtctcg tgggctcgga gatg 54

  <210> 104

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 104

  caagcagaag acggcatacg agatgtcggc taatgtctcg tgggctcgga gatg 54

  <210> 105

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 105

  caagcagaag acggcatacg agatgttccg tgaagtctcg tgggctcgga gatg 54

  <210> 106

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 106

  caagcagaag acggcatacg agatgtttac ggctgtctcg tgggctcgga gatg 54

  <210> 107

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 107

  caagcagaag acggcatacg agatgtatgg ttgcgtctcg tgggctcgga gatg 54

  <210> 108

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 108

  caagcagaag acggcatacg agatgtgtac cttggtctcg tgggctcgga gatg 54

  <210> 109

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 109

  caagcagaag acggcatacg agatctggaa ttgcgtctcg tgggctcgga gatg 54

  <210> 110

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 110

  caagcagaag acggcatacg agatcttggc atgtgtctcg tgggctcgga gatg 54

  <210> 111

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 111

  caagcagaag acggcatacg agatcttggt acaggtctcg tgggctcgga gatg 54

  <210> 112

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 112

  caagcagaag acggcatacg agatctagtc aggagtctcg tgggctcgga gatg 54

  <210> 113

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 113

  caagcagaag acggcatacg agatctttgg tctcgtctcg tgggctcgga gatg 54

  <210> 114

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 114

  caagcagaag acggcatacg agatctaggc ttctgtctcg tgggctcgga gatg 54

  <210> 115

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 115

  caagcagaag acggcatacg agatctatcg ccatgtctcg tgggctcgga gatg 54

  <210> 116

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 116

  caagcagaag acggcatacg agatctgcta tcctgtctcg tgggctcgga gatg 54

  <210> 117

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 117

  caagcagaag acggcatacg agatctatcc agaggtctcg tgggctcgga gatg 54

  <210> 118

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 118

  caagcagaag acggcatacg agatctgctt cttggtctcg tgggctcgga gatg 54

  <210> 119

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 119

  caagcagaag acggcatacg agatctgtag gagtgtctcg tgggctcgga gatg 54

  <210> 120

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 120

  caagcagaag acggcatacg agatctccag tgttgtctcg tgggctcgga gatg 54

  <210> 121

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 121

  caagcagaag acggcatacg agattgcgct agtagtctcg tgggctcgga gatg 54

  <210> 122

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 122

  caagcagaag acggcatacg agattgggta gtgtgtctcg tgggctcgga gatg 54

  <210> 123

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 123

  caagcagaag acggcatacg agattgtcgc gatagtctcg tgggctcgga gatg 54

  <210> 124

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 124

  caagcagaag acggcatacg agattgctga tcgtgtctcg tgggctcgga gatg 54

  <210> 125

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 125

  caagcagaag acggcatacg agattggttg cgatgtctcg tgggctcgga gatg 54

  <210> 126

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 126

  caagcagaag acggcatacg agattgttcg cagtgtctcg tgggctcgga gatg 54

  <210> 127

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 127

  caagcagaag acggcatacg agattgcgag actagtctcg tgggctcgga gatg 54

  <210> 128

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 128

  caagcagaag acggcatacg agattggaga tacggtctcg tgggctcgga gatg 54

  <210> 129

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 129

  caagcagaag acggcatacg agattgttac cgaggtctcg tgggctcgga gatg 54

  <210> 130

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 130

  caagcagaag acggcatacg agattggatt cagcgtctcg tgggctcgga gatg 54

  <210> 131

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 131

  caagcagaag acggcatacg agattgtcgc tgttgtctcg tgggctcgga gatg 54

  <210> 132

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 132

  caagcagaag acggcatacg agattgtgcc attcgtctcg tgggctcgga gatg 54

  <210> 133

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 133

  caagcagaag acggcatacg agataggtcc taaggtctcg tgggctcgga gatg 54

  <210> 134

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 134

  caagcagaag acggcatacg agataggacg aatggtctcg tgggctcgga gatg 54

  <210> 135

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 135

  caagcagaag acggcatacg agatagaagt ccgtgtctcg tgggctcgga gatg 54

  <210> 136

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 136

  caagcagaag acggcatacg agataggaag gttcgtctcg tgggctcgga gatg 54

  <210> 137

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 137

  caagcagaag acggcatacg agataggatt gctcgtctcg tgggctcgga gatg 54

  <210> 138

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 138

  caagcagaag acggcatacg agataggaga tgtcgtctcg tgggctcgga gatg 54

  <210> 139

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 139

  caagcagaag acggcatacg agatagacac ggttgtctcg tgggctcgga gatg 54

  <210> 140

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 140

  caagcagaag acggcatacg agatagagtc gcttgtctcg tgggctcgga gatg 54

  <210> 141

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 141

  caagcagaag acggcatacg agatagctaa ctcggtctcg tgggctcgga gatg 54

  <210> 142

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 142

  caagcagaag acggcatacg agatagacga cagagtctcg tgggctcgga gatg 54

  <210> 143

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 143

  caagcagaag acggcatacg agatagagca agcagtctcg tgggctcgga gatg 54

  <210> 144

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 144

  caagcagaag acggcatacg agataggaac gcttgtctcg tgggctcgga gatg 54

  <210> 145

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 145

  caagcagaag acggcatacg agattcgtat tggcgtctcg tgggctcgga gatg 54

  <210> 146

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 146

  caagcagaag acggcatacg agattccgca atctgtctcg tgggctcgga gatg 54

  <210> 147

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 147

  caagcagaag acggcatacg agattcgtgc ttacgtctcg tgggctcgga gatg 54

  <210> 148

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 148

  caagcagaag acggcatacg agattcaacc ttgggtctcg tgggctcgga gatg 54

  <210> 149

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 149

  caagcagaag acggcatacg agattcggaa gctagtctcg tgggctcgga gatg 54

  <210> 150

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 150

  caagcagaag acggcatacg agattcgtta cgcagtctcg tgggctcgga gatg 54

  <210> 151

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 151

  caagcagaag acggcatacg agattccgac gttagtctcg tgggctcgga gatg 54

  <210> 152

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 152

  caagcagaag acggcatacg agattcagcg tgttgtctcg tgggctcgga gatg 54

  <210> 153

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 153

  caagcagaag acggcatacg agattcacct tctcgtctcg tgggctcgga gatg 54

  <210> 154

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 154

  caagcagaag acggcatacg agattccatt gcctgtctcg tgggctcgga gatg 54

  <210> 155

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 155

  caagcagaag acggcatacg agattcatct tcgggtctcg tgggctcgga gatg 54

  <210> 156

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 156

  caagcagaag acggcatacg agattctgac ttcggtctcg tgggctcgga gatg 54

  <210> 157

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 157

  caagcagaag acggcatacg agatacaact ggtggtctcg tgggctcgga gatg 54

  <210> 158

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 158

  caagcagaag acggcatacg agatactcaa ggacgtctcg tgggctcgga gatg 54

  <210> 159

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 159

  caagcagaag acggcatacg agatacattc gagggtctcg tgggctcgga gatg 54

  <210> 160

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 160

  caagcagaag acggcatacg agatacggct attggtctcg tgggctcgga gatg 54

  <210> 161

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 161

  caagcagaag acggcatacg agatacccgt atctgtctcg tgggctcgga gatg 54

  <210> 162

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 162

  caagcagaag acggcatacg agatacggat accagtctcg tgggctcgga gatg 54

  <210> 163

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 163

  caagcagaag acggcatacg agataccgat gcttgtctcg tgggctcgga gatg 54

  <210> 164

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 164

  caagcagaag acggcatacg agatactcta acgcgtctcg tgggctcgga gatg 54

  <210> 165

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 165

  caagcagaag acggcatacg agatacatgt agcggtctcg tgggctcgga gatg 54

  <210> 166

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 166

  caagcagaag acggcatacg agataccaat cgacgtctcg tgggctcgga gatg 54

  <210> 167

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 167

  caagcagaag acggcatacg agatacgagg acttgtctcg tgggctcgga gatg 54

  <210> 168

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 168

  caagcagaag acggcatacg agatacggtg attcgtctcg tgggctcgga gatg 54

  <210> 169

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 169

  caagcagaag acggcatacg agatcataac gagggtctcg tgggctcgga gatg 54

  <210> 170

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 170

  caagcagaag acggcatacg agatcacacg ttgtgtctcg tgggctcgga gatg 54

  <210> 171

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 171

  caagcagaag acggcatacg agatcatgtt cgaggtctcg tgggctcgga gatg 54

  <210> 172

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 172

  caagcagaag acggcatacg agatcatctc tagggtctcg tgggctcgga gatg 54

  <210> 173

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 173

  caagcagaag acggcatacg agatcagtgc catagtctcg tgggctcgga gatg 54

  <210> 174

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 174

  caagcagaag acggcatacg agatcattaa gcgggtctcg tgggctcgga gatg 54

  <210> 175

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 175

  caagcagaag acggcatacg agatcagaag ttgggtctcg tgggctcgga gatg 54

  <210> 176

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 176

  caagcagaag acggcatacg agatcataca cgctgtctcg tgggctcgga gatg 54

  <210> 177

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 177

  caagcagaag acggcatacg agatcacagt gaaggtctcg tgggctcgga gatg 54

  <210> 178

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 178

  caagcagaag acggcatacg agatcactac agtggtctcg tgggctcgga gatg 54

  <210> 179

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 179

  caagcagaag acggcatacg agatcagtgg tgttgtctcg tgggctcgga gatg 54

  <210> 180

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 180

  caagcagaag acggcatacg agatcacttc accagtctcg tgggctcgga gatg 54

  <210> 181

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 181

  caagcagaag acggcatacg agatgaaaga gccagtctcg tgggctcgga gatg 54

  <210> 182

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 182

  caagcagaag acggcatacg agatgaaggt cactgtctcg tgggctcgga gatg 54

  <210> 183

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 183

  caagcagaag acggcatacg agatgaaacc gttcgtctcg tgggctcgga gatg 54

  <210> 184

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 184

  caagcagaag acggcatacg agatgaagcg gaatgtctcg tgggctcgga gatg 54

  <210> 185

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 185

  caagcagaag acggcatacg agatgaaagc cacagtctcg tgggctcgga gatg 54

  <210> 186

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 186

  caagcagaag acggcatacg agatgactta cagcgtctcg tgggctcgga gatg 54

  <210> 187

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 187

  caagcagaag acggcatacg agatgagcga tagtgtctcg tgggctcgga gatg 54

  <210> 188

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 188

  caagcagaag acggcatacg agatgagaac acacgtctcg tgggctcgga gatg 54

  <210> 189

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 189

  caagcagaag acggcatacg agatgacaac acctgtctcg tgggctcgga gatg 54

  <210> 190

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 190

  caagcagaag acggcatacg agatgaacac cagtgtctcg tgggctcgga gatg 54

  <210> 191

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 191

  caagcagaag acggcatacg agatgagctg actagtctcg tgggctcgga gatg 54

  <210> 192

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 192

  caagcagaag acggcatacg agatgagaga cgatgtctcg tgggctcgga gatg 54

  <210> 193

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 193

  caagcagaag acggcatacg agatgttggt ccttgtctcg tgggctcgga gatg 54

  <210> 194

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 194

  caagcagaag acggcatacg agatgtctta ggacgtctcg tgggctcgga gatg 54

  <210> 195

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 195

  caagcagaag acggcatacg agatgttcgc attggtctcg tgggctcgga gatg 54

  <210> 196

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 196

  caagcagaag acggcatacg agatgtctag caaggtctcg tgggctcgga gatg 54

  <210> 197

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 197

  caagcagaag acggcatacg agatgtggtc ttaggtctcg tgggctcgga gatg 54

  <210> 198

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 198

  caagcagaag acggcatacg agatgtacgg tcttgtctcg tgggctcgga gatg 54

  <210> 199

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 199

  caagcagaag acggcatacg agatgtacga cttggtctcg tgggctcgga gatg 54

  <210> 200

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 200

  caagcagaag acggcatacg agatgttgcg aactgtctcg tgggctcgga gatg 54

  <210> 201

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 201

  caagcagaag acggcatacg agatgtggac aatcgtctcg tgggctcgga gatg 54

  <210> 202

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 202

  caagcagaag acggcatacg agatgtttct cgacgtctcg tgggctcgga gatg 54

  <210> 203

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 203

  caagcagaag acggcatacg agatgttaag tggcgtctcg tgggctcgga gatg 54

  <210> 204

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 204

  caagcagaag acggcatacg agatgtatcg gtgtgtctcg tgggctcgga gatg 54

  <210> 205

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 205

  caagcagaag acggcatacg agatctgctg taaggtctcg tgggctcgga gatg 54

  <210> 206

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 206

  caagcagaag acggcatacg agatctgtga agtggtctcg tgggctcgga gatg 54

  <210> 207

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 207

  caagcagaag acggcatacg agatctaagg cgttgtctcg tgggctcgga gatg 54

  <210> 208

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 208

  caagcagaag acggcatacg agatcttcac tctggtctcg tgggctcgga gatg 54

  <210> 209

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 209

  caagcagaag acggcatacg agatctgtct aggtgtctcg tgggctcgga gatg 54

  <210> 210

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 210

  caagcagaag acggcatacg agatctcctt gtaggtctcg tgggctcgga gatg 54

  <210> 211

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 211

  caagcagaag acggcatacg agatctcatt cggtgtctcg tgggctcgga gatg 54

  <210> 212

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 212

  caagcagaag acggcatacg agatctgatg cactgtctcg tgggctcgga gatg 54

  <210> 213

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 213

  caagcagaag acggcatacg agatcttgtg cgttgtctcg tgggctcgga gatg 54

  <210> 214

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 214

  caagcagaag acggcatacg agatctccaa tagggtctcg tgggctcgga gatg 54

  <210> 215

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 215

  caagcagaag acggcatacg agatctgttc ggttgtctcg tgggctcgga gatg 54

  <210> 216

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 216

  caagcagaag acggcatacg agatcttggt agctgtctcg tgggctcgga gatg 54

  <210> 217

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 217

  caagcagaag acggcatacg agattggtat gctggtctcg tgggctcgga gatg 54

  <210> 218

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 218

  caagcagaag acggcatacg agattgcgct taacgtctcg tgggctcgga gatg 54

  <210> 219

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 219

  caagcagaag acggcatacg agattgctcc tagagtctcg tgggctcgga gatg 54

  <210> 220

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 220

  caagcagaag acggcatacg agattgcttc tgaggtctcg tgggctcgga gatg 54

  <210> 221

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 221

  caagcagaag acggcatacg agattgagca gatggtctcg tgggctcgga gatg 54

  <210> 222

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 222

  caagcagaag acggcatacg agattgccgt aagagtctcg tgggctcgga gatg 54

  <210> 223

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 223

  caagcagaag acggcatacg agattgttga tccggtctcg tgggctcgga gatg 54

  <210> 224

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 224

  caagcagaag acggcatacg agattgtgca ggtagtctcg tgggctcgga gatg 54

  <210> 225

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 225

  caagcagaag acggcatacg agattgcagg ttaggtctcg tgggctcgga gatg 54

  <210> 226

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 226

  caagcagaag acggcatacg agattgtacg ctacgtctcg tgggctcgga gatg 54

  <210> 227

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 227

  caagcagaag acggcatacg agattgccag gatagtctcg tgggctcgga gatg 54

  <210> 228

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 228

  caagcagaag acggcatacg agattgcgtg tgtagtctcg tgggctcgga gatg 54

  <210> 229

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 229

  caagcagaag acggcatacg agataggttg tagcgtctcg tgggctcgga gatg 54

  <210> 230

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 230

  caagcagaag acggcatacg agatagcagt cttcgtctcg tgggctcgga gatg 54

  <210> 231

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 231

  caagcagaag acggcatacg agatagagca cttcgtctcg tgggctcgga gatg 54

  <210> 232

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 232

  caagcagaag acggcatacg agatagactc gttggtctcg tgggctcgga gatg 54

  <210> 233

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 233

  caagcagaag acggcatacg agatagtagg tagggtctcg tgggctcgga gatg 54

  <210> 234

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 234

  caagcagaag acggcatacg agataggtct gatcgtctcg tgggctcgga gatg 54

  <210> 235

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 235

  caagcagaag acggcatacg agatagacag ctcagtctcg tgggctcgga gatg 54

  <210> 236

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 236

  caagcagaag acggcatacg agatagccga tgtagtctcg tgggctcgga gatg 54

  <210> 237

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 237

  caagcagaag acggcatacg agatagctgt tgacgtctcg tgggctcgga gatg 54

  <210> 238

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 238

  caagcagaag acggcatacg agatagtagc gtctgtctcg tgggctcgga gatg 54

  <210> 239

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 239

  caagcagaag acggcatacg agatagaacc gaaggtctcg tgggctcgga gatg 54

  <210> 240

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 240

  caagcagaag acggcatacg agatagctta cctggtctcg tgggctcgga gatg 54

  <210> 241

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 241

  caagcagaag acggcatacg agattcagtt acgggtctcg tgggctcgga gatg 54

  <210> 242

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 242

  caagcagaag acggcatacg agattccatc ctctgtctcg tgggctcgga gatg 54

  <210> 243

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 243

  caagcagaag acggcatacg agattcgtaa cgacgtctcg tgggctcgga gatg 54

  <210> 244

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 244

  caagcagaag acggcatacg agattcgtcg aagagtctcg tgggctcgga gatg 54

  <210> 245

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 245

  caagcagaag acggcatacg agattccagt tctggtctcg tgggctcgga gatg 54

  <210> 246

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 246

  caagcagaag acggcatacg agattcggtg tcttgtctcg tgggctcgga gatg 54

  <210> 247

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 247

  caagcagaag acggcatacg agattcacat tgcggtctcg tgggctcgga gatg 54

  <210> 248

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 248

  caagcagaag acggcatacg agattcacgg aacagtctcg tgggctcgga gatg 54

  <210> 249

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 249

  caagcagaag acggcatacg agattccctg attggtctcg tgggctcgga gatg 54

  <210> 250

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 250

  caagcagaag acggcatacg agattcacgg attcgtctcg tgggctcgga gatg 54

  <210> 251

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 251

  caagcagaag acggcatacg agattcttga cagggtctcg tgggctcgga gatg 54

  <210> 252

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 252

  caagcagaag acggcatacg agattctgtg gtacgtctcg tgggctcgga gatg 54

  <210> 253

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 253

  caagcagaag acggcatacg agatacactc catcgtctcg tgggctcgga gatg 54

  <210> 254

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 254

  caagcagaag acggcatacg agatactcga aggtgtctcg tgggctcgga gatg 54

  <210> 255

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 255

  caagcagaag acggcatacg agatacagtc tgtggtctcg tgggctcgga gatg 54

  <210> 256

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 256

  caagcagaag acggcatacg agatacctag gcatgtctcg tgggctcgga gatg 54

  <210> 257

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 257

  caagcagaag acggcatacg agatacaaca accggtctcg tgggctcgga gatg 54

  <210> 258

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 258

  caagcagaag acggcatacg agataccgtt gcaagtctcg tgggctcgga gatg 54

  <210> 259

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 259

  caagcagaag acggcatacg agatacgcta cgttgtctcg tgggctcgga gatg 54

  <210> 260

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 260

  caagcagaag acggcatacg agatacgaca agaggtctcg tgggctcgga gatg 54

  <210> 261

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 261

  caagcagaag acggcatacg agatactcga gtgagtctcg tgggctcgga gatg 54

  <210> 262

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 262

  caagcagaag acggcatacg agatacaggt tcgagtctcg tgggctcgga gatg 54

  <210> 263

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 263

  caagcagaag acggcatacg agataccgtc aatggtctcg tgggctcgga gatg 54

  <210> 264

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 264

  caagcagaag acggcatacg agataccgag tatggtctcg tgggctcgga gatg 54

  <210> 265

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 265

  caagcagaag acggcatacg agatcatcct acctgtctcg tgggctcgga gatg 54

  <210> 266

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 266

  caagcagaag acggcatacg agatcaagcc aagtgtctcg tgggctcgga gatg 54

  <210> 267

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 267

  caagcagaag acggcatacg agatcagcgt cattgtctcg tgggctcgga gatg 54

  <210> 268

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 268

  caagcagaag acggcatacg agatcacaga atcggtctcg tgggctcgga gatg 54

  <210> 269

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 269

  caagcagaag acggcatacg agatcaatcg atcggtctcg tgggctcgga gatg 54

  <210> 270

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 270

  caagcagaag acggcatacg agatcatgag gtgtgtctcg tgggctcgga gatg 54

  <210> 271

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 271

  caagcagaag acggcatacg agatcagacg atctgtctcg tgggctcgga gatg 54

  <210> 272

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 272

  caagcagaag acggcatacg agatcacaac ggatgtctcg tgggctcgga gatg 54

  <210> 273

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 273

  caagcagaag acggcatacg agatcaagtc gacagtctcg tgggctcgga gatg 54

  <210> 274

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 274

  caagcagaag acggcatacg agatcagatc gagtgtctcg tgggctcgga gatg 54

  <210> 275

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 275

  caagcagaag acggcatacg agatcatcag acgagtctcg tgggctcgga gatg 54

  <210> 276

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 276

  caagcagaag acggcatacg agatcacacc actagtctcg tgggctcgga gatg 54

  <210> 277

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 277

  caagcagaag acggcatacg agatgactct ggttgtctcg tgggctcgga gatg 54

  <210> 278

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 278

  caagcagaag acggcatacg agatgatacc acaggtctcg tgggctcgga gatg 54

  <210> 279

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 279

  caagcagaag acggcatacg agatgagact tagggtctcg tgggctcgga gatg 54

  <210> 280

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 280

  caagcagaag acggcatacg agatgatctg agaggtctcg tgggctcgga gatg 54

  <210> 281

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 281

  caagcagaag acggcatacg agatgagttc tcgtgtctcg tgggctcgga gatg 54

  <210> 282

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 282

  caagcagaag acggcatacg agatgagctt agctgtctcg tgggctcgga gatg 54

  <210> 283

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 283

  caagcagaag acggcatacg agatgagtgg ataggtctcg tgggctcgga gatg 54

  <210> 284

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 284

  caagcagaag acggcatacg agatgacata acgggtctcg tgggctcgga gatg 54

  <210> 285

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 285

  caagcagaag acggcatacg agatgaacct aagggtctcg tgggctcgga gatg 54

  <210> 286

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 286

  caagcagaag acggcatacg agatgatcga catcgtctcg tgggctcgga gatg 54

  <210> 287

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 287

  caagcagaag acggcatacg agatgagctc tgtagtctcg tgggctcgga gatg 54

  <210> 288

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 288

  caagcagaag acggcatacg agatgaactg ctaggtctcg tgggctcgga gatg 54

  <210> 289

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 289

  caagcagaag acggcatacg agatgtagag ccttgtctcg tgggctcgga gatg 54

  <210> 290

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 290

  caagcagaag acggcatacg agatgttgct tggtgtctcg tgggctcgga gatg 54

  <210> 291

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 291

  caagcagaag acggcatacg agatgtatca cacggtctcg tgggctcgga gatg 54

  <210> 292

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 292

  caagcagaag acggcatacg agatgtgttg ttcggtctcg tgggctcgga gatg 54

  <210> 293

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 293

  caagcagaag acggcatacg agatgttgcg tagagtctcg tgggctcgga gatg 54

  <210> 294

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 294

  caagcagaag acggcatacg agatgtcatg gaacgtctcg tgggctcgga gatg 54

  <210> 295

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 295

  caagcagaag acggcatacg agatgtctgt tagggtctcg tgggctcgga gatg 54

  <210> 296

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 296

  caagcagaag acggcatacg agatgtggta ctacgtctcg tgggctcgga gatg 54

  <210> 297

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 297

  caagcagaag acggcatacg agatgtgcca cttagtctcg tgggctcgga gatg 54

  <210> 298

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 298

  caagcagaag acggcatacg agatgttatc agcggtctcg tgggctcgga gatg 54

  <210> 299

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 299

  caagcagaag acggcatacg agatgtcttc gactgtctcg tgggctcgga gatg 54

  <210> 300

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 300

  caagcagaag acggcatacg agatgtcgaa gaacgtctcg tgggctcgga gatg 54

  <210> 301

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 301

  caagcagaag acggcatacg agatctcacc ttacgtctcg tgggctcgga gatg 54

  <210> 302

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 302

  caagcagaag acggcatacg agatctacat aggcgtctcg tgggctcgga gatg 54

  <210> 303

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 303

  caagcagaag acggcatacg agatcttgtc tgctgtctcg tgggctcgga gatg 54

  <210> 304

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 304

  caagcagaag acggcatacg agatctcagt ccaagtctcg tgggctcgga gatg 54

  <210> 305

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 305

  caagcagaag acggcatacg agatctgtct ccttgtctcg tgggctcgga gatg 54

  <210> 306

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 306

  caagcagaag acggcatacg agatctcaac ctaggtctcg tgggctcgga gatg 54

  <210> 307

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 307

  caagcagaag acggcatacg agatctaacg tctggtctcg tgggctcgga gatg 54

  <210> 308

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 308

  caagcagaag acggcatacg agatctcctc agttgtctcg tgggctcgga gatg 54

  <210> 309

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 309

  caagcagaag acggcatacg agatctccta ctgagtctcg tgggctcgga gatg 54

  <210> 310

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 310

  caagcagaag acggcatacg agatctgcat acaggtctcg tgggctcgga gatg 54

  <210> 311

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 311

  caagcagaag acggcatacg agatctgtta aggcgtctcg tgggctcgga gatg 54

  <210> 312

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 312

  caagcagaag acggcatacg agatctttgc gaaggtctcg tgggctcgga gatg 54

  <210> 313

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 313

  caagcagaag acggcatacg agattgttgg cttggtctcg tgggctcgga gatg 54

  <210> 314

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 314

  caagcagaag acggcatacg agattgatgc acgagtctcg tgggctcgga gatg 54

  <210> 315

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 315

  caagcagaag acggcatacg agattgggca agttgtctcg tgggctcgga gatg 54

  <210> 316

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 316

  caagcagaag acggcatacg agattgggac tgttgtctcg tgggctcgga gatg 54

  <210> 317

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 317

  caagcagaag acggcatacg agattgtgtt gtgggtctcg tgggctcgga gatg 54

  <210> 318

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 318

  caagcagaag acggcatacg agattgtcca atcggtctcg tgggctcgga gatg 54

  <210> 319

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 319

  caagcagaag acggcatacg agattgctgc gtatgtctcg tgggctcgga gatg 54

  <210> 320

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 320

  caagcagaag acggcatacg agattggaag gaaggtctcg tgggctcgga gatg 54

  <210> 321

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 321

  caagcagaag acggcatacg agattgctgg agtagtctcg tgggctcgga gatg 54

  <210> 322

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 322

  caagcagaag acggcatacg agattgtcct gctagtctcg tgggctcgga gatg 54

  <210> 323

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 323

  caagcagaag acggcatacg agattgcgtt atgcgtctcg tgggctcgga gatg 54

  <210> 324

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 324

  caagcagaag acggcatacg agattgctac ttgggtctcg tgggctcgga gatg 54

  <210> 325

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 325

  caagcagaag acggcatacg agatagagtt ggctgtctcg tgggctcgga gatg 54

  <210> 326

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 326

  caagcagaag acggcatacg agatagaggt gtacgtctcg tgggctcgga gatg 54

  <210> 327

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 327

  caagcagaag acggcatacg agatagcgat agaggtctcg tgggctcgga gatg 54

  <210> 328

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 328

  caagcagaag acggcatacg agatagataa ggcggtctcg tgggctcgga gatg 54

  <210> 329

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 329

  caagcagaag acggcatacg agataggtag tcaggtctcg tgggctcgga gatg 54

  <210> 330

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 330

  caagcagaag acggcatacg agatagcaag cagtgtctcg tgggctcgga gatg 54

  <210> 331

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 331

  caagcagaag acggcatacg agatagtgtc cagagtctcg tgggctcgga gatg 54

  <210> 332

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 332

  caagcagaag acggcatacg agatagtcgt tcgtgtctcg tgggctcgga gatg 54

  <210> 333

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 333

  caagcagaag acggcatacg agatagtctt ctgcgtctcg tgggctcgga gatg 54

  <210> 334

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 334

  caagcagaag acggcatacg agatagctga agctgtctcg tgggctcgga gatg 54

  <210> 335

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 335

  caagcagaag acggcatacg agatagcatg aggagtctcg tgggctcgga gatg 54

  <210> 336

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 336

  caagcagaag acggcatacg agatagactg tgtcgtctcg tgggctcgga gatg 54

  <210> 337

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 337

  caagcagaag acggcatacg agattcggcg ttatgtctcg tgggctcgga gatg 54

  <210> 338

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 338

  caagcagaag acggcatacg agattctgta gccagtctcg tgggctcgga gatg 54

  <210> 339

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 339

  caagcagaag acggcatacg agattccgac cattgtctcg tgggctcgga gatg 54

  <210> 340

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 340

  caagcagaag acggcatacg agattcatga cgtcgtctcg tgggctcgga gatg 54

  <210> 341

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 341

  caagcagaag acggcatacg agattctaca tcgggtctcg tgggctcgga gatg 54

  <210> 342

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 342

  caagcagaag acggcatacg agattcgtca ctgtgtctcg tgggctcgga gatg 54

  <210> 343

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 343

  caagcagaag acggcatacg agattcgata ggctgtctcg tgggctcgga gatg 54

  <210> 344

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 344

  caagcagaag acggcatacg agattcttgt cggtgtctcg tgggctcgga gatg 54

  <210> 345

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 345

  caagcagaag acggcatacg agattcagac cgtagtctcg tgggctcgga gatg 54

  <210> 346

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 346

  caagcagaag acggcatacg agattccgaa ctgtgtctcg tgggctcgga gatg 54

  <210> 347

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 347

  caagcagaag acggcatacg agattccact agctgtctcg tgggctcgga gatg 54

  <210> 348

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 348

  caagcagaag acggcatacg agattccact agctgtctcg tgggctcgga gatg 54

  <210> 349

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 349

  caagcagaag acggcatacg agatacgcct atcagtctcg tgggctcgga gatg 54

  <210> 350

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 350

  caagcagaag acggcatacg agatacgata gcgagtctcg tgggctcgga gatg 54

  <210> 351

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 351

  caagcagaag acggcatacg agatactcga accagtctcg tgggctcgga gatg 54

  <210> 352

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 352

  caagcagaag acggcatacg agatacagtg cagtgtctcg tgggctcgga gatg 54

  <210> 353

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 353

  caagcagaag acggcatacg agatactgtg actggtctcg tgggctcgga gatg 54

  <210> 354

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 354

  caagcagaag acggcatacg agatacggtt gatggtctcg tgggctcgga gatg 54

  <210> 355

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 355

  caagcagaag acggcatacg agatactaga cgtggtctcg tgggctcgga gatg 54

  <210> 356

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 356

  caagcagaag acggcatacg agatacagaa gcgtgtctcg tgggctcgga gatg 54

  <210> 357

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 357

  caagcagaag acggcatacg agataccgta ggttgtctcg tgggctcgga gatg 54

  <210> 358

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 358

  caagcagaag acggcatacg agataccaga gtgtgtctcg tgggctcgga gatg 54

  <210> 359

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 359

  caagcagaag acggcatacg agatactgct catggtctcg tgggctcgga gatg 54

  <210> 360

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 360

  caagcagaag acggcatacg agatactcat ggtggtctcg tgggctcgga gatg 54

  <210> 361

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 361

  caagcagaag acggcatacg agatcacgta cgaagtctcg tgggctcgga gatg 54

  <210> 362

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 362

  caagcagaag acggcatacg agatcactta gtgggtctcg tgggctcgga gatg 54

  <210> 363

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 363

  caagcagaag acggcatacg agatcaccaa gactgtctcg tgggctcgga gatg 54

  <210> 364

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 364

  caagcagaag acggcatacg agatcacgtg atcagtctcg tgggctcgga gatg 54

  <210> 365

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 365

  caagcagaag acggcatacg agatcaggaa ggatgtctcg tgggctcgga gatg 54

  <210> 366

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 366

  caagcagaag acggcatacg agatcaacct ctgtgtctcg tgggctcgga gatg 54

  <210> 367

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 367

  caagcagaag acggcatacg agatcaaaga aggcgtctcg tgggctcgga gatg 54

  <210> 368

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 368

  caagcagaag acggcatacg agatcagttg acctgtctcg tgggctcgga gatg 54

  <210> 369

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 369

  caagcagaag acggcatacg agatcacaag gtctgtctcg tgggctcgga gatg 54

  <210> 370

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 370

  caagcagaag acggcatacg agatcagtca tcgagtctcg tgggctcgga gatg 54

  <210> 371

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 371

  caagcagaag acggcatacg agatcaacat cctggtctcg tgggctcgga gatg 54

  <210> 372

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 372

  caagcagaag acggcatacg agatcaccaa gttggtctcg tgggctcgga gatg 54

  <210> 373

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 373

  caagcagaag acggcatacg agatgactca ttgcgtctcg tgggctcgga gatg 54

  <210> 374

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 374

  caagcagaag acggcatacg agatgatgat cggagtctcg tgggctcgga gatg 54

  <210> 375

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 375

  caagcagaag acggcatacg agatgatgcg cttagtctcg tgggctcgga gatg 54

  <210> 376

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 376

  caagcagaag acggcatacg agatgagtgt tcctgtctcg tgggctcgga gatg 54

  <210> 377

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 377

  caagcagaag acggcatacg agatgacttg tcgagtctcg tgggctcgga gatg 54

  <210> 378

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 378

  caagcagaag acggcatacg agatgactcg tcttgtctcg tgggctcgga gatg 54

  <210> 379

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 379

  caagcagaag acggcatacg agatgagtgt gacagtctcg tgggctcgga gatg 54

  <210> 380

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 380

  caagcagaag acggcatacg agatgactgg ttctgtctcg tgggctcgga gatg 54

  <210> 381

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 381

  caagcagaag acggcatacg agatgagcac aactgtctcg tgggctcgga gatg 54

  <210> 382

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 382

  caagcagaag acggcatacg agatgacatg gctagtctcg tgggctcgga gatg 54

  <210> 383

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 383

  caagcagaag acggcatacg agatgactca tcaggtctcg tgggctcgga gatg 54

  <210> 384

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 384

  caagcagaag acggcatacg agatgatgat acgcgtctcg tgggctcgga gatg 54

  <210> 385

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 385

  caagcagaag acggcatacg agatgtgatc catggtctcg tgggctcgga gatg 54

  <210> 386

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 386

  caagcagaag acggcatacg agatgtccga ctatgtctcg tgggctcgga gatg 54

  <210> 387

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 387

  caagcagaag acggcatacg agatgtttca ggaggtctcg tgggctcgga gatg 54

  <210> 388

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 388

  caagcagaag acggcatacg agatgtttca ggaggtctcg tgggctcgga gatg 54

  <210> 389

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 389

  caagcagaag acggcatacg agatgtagct cctagtctcg tgggctcgga gatg 54

  <210> 390

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 390

  caagcagaag acggcatacg agatgtcgct ctatgtctcg tgggctcgga gatg 54

  <210> 391

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 391

  caagcagaag acggcatacg agatgtggat tcgtgtctcg tgggctcgga gatg 54

  <210> 392

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 392

  caagcagaag acggcatacg agatgtatgc caacgtctcg tgggctcgga gatg 54

  <210> 393

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 393

  caagcagaag acggcatacg agatgtgact atgcgtctcg tgggctcgga gatg 54

  <210> 394

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 394

  caagcagaag acggcatacg agatgtatat gcgcgtctcg tgggctcgga gatg 54

  <210> 395

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 395

  caagcagaag acggcatacg agatgtagga ggaagtctcg tgggctcgga gatg 54

  <210> 396

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 396

  caagcagaag acggcatacg agatgtatgg aagggtctcg tgggctcgga gatg 54

  <210> 397

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 397

  caagcagaag acggcatacg agatctggtt gtcagtctcg tgggctcgga gatg 54

  <210> 398

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 398

  caagcagaag acggcatacg agatctgatg agacgtctcg tgggctcgga gatg 54

  <210> 399

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 399

  caagcagaag acggcatacg agatcttcgt ggatgtctcg tgggctcgga gatg 54

  <210> 400

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 400

  caagcagaag acggcatacg agatctggac tagagtctcg tgggctcgga gatg 54

  <210> 401

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 401

  caagcagaag acggcatacg agatctaatg gacggtctcg tgggctcgga gatg 54

  <210> 402

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 402

  caagcagaag acggcatacg agatctctca gagtgtctcg tgggctcgga gatg 54

  <210> 403

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 403

  caagcagaag acggcatacg agatctggat gtaggtctcg tgggctcgga gatg 54

  <210> 404

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 404

  caagcagaag acggcatacg agatctcaag tgcagtctcg tgggctcgga gatg 54

  <210> 405

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 405

  caagcagaag acggcatacg agatctttag gtcggtctcg tgggctcgga gatg 54

  <210> 406

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 406

  caagcagaag acggcatacg agatcttcta gctggtctcg tgggctcgga gatg 54

  <210> 407

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 407

  caagcagaag acggcatacg agatctggtc agatgtctcg tgggctcgga gatg 54

  <210> 408

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 408

  caagcagaag acggcatacg agatctgtag catcgtctcg tgggctcgga gatg 54

  <210> 409

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 409

  caagcagaag acggcatacg agattgtcgg ttacgtctcg tgggctcgga gatg 54

  <210> 410

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 410

  caagcagaag acggcatacg agattgcgga ttgagtctcg tgggctcgga gatg 54

  <210> 411

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 411

  caagcagaag acggcatacg agattgaata cgcggtctcg tgggctcgga gatg 54

  <210> 412

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 412

  caagcagaag acggcatacg agattgacca gcttgtctcg tgggctcgga gatg 54

  <210> 413

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 413

  caagcagaag acggcatacg agattgctcg atacgtctcg tgggctcgga gatg 54

  <210> 414

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 414

  caagcagaag acggcatacg agattgtcaa ctgggtctcg tgggctcgga gatg 54

  <210> 415

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 415

  caagcagaag acggcatacg agattgaccg tagtgtctcg tgggctcgga gatg 54

  <210> 416

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 416

  caagcagaag acggcatacg agattgccgg aattgtctcg tgggctcgga gatg 54

  <210> 417

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 417

  caagcagaag acggcatacg agattgcgtc ttgtgtctcg tgggctcgga gatg 54

  <210> 418

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 418

  caagcagaag acggcatacg agattggaat ccgagtctcg tgggctcgga gatg 54

  <210> 419

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 419

  caagcagaag acggcatacg agattgacga tgacgtctcg tgggctcgga gatg 54

  <210> 420

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 420

  caagcagaag acggcatacg agattgcgta ttcggtctcg tgggctcgga gatg 54

  <210> 421

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 421

  caagcagaag acggcatacg agatagaagt cgaggtctcg tgggctcgga gatg 54

  <210> 422

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 422

  caagcagaag acggcatacg agatagagtg ttgggtctcg tgggctcgga gatg 54

  <210> 423

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 423

  caagcagaag acggcatacg agatagcagg tatcgtctcg tgggctcgga gatg 54

  <210> 424

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 424

  caagcagaag acggcatacg agatagtatc ggtcgtctcg tgggctcgga gatg 54

  <210> 425

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 425

  caagcagaag acggcatacg agatagtctc cgatgtctcg tgggctcgga gatg 54

  <210> 426

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 426

  caagcagaag acggcatacg agatagcaca catggtctcg tgggctcgga gatg 54

  <210> 427

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 427

  caagcagaag acggcatacg agatagccac ttctgtctcg tgggctcgga gatg 54

  <210> 428

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 428

  caagcagaag acggcatacg agataggagt ctctgtctcg tgggctcgga gatg 54

  <210> 429

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 429

  caagcagaag acggcatacg agatagcata ccacgtctcg tgggctcgga gatg 54

  <210> 430

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 430

  caagcagaag acggcatacg agatagaagg acacgtctcg tgggctcgga gatg 54

  <210> 431

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 431

  caagcagaag acggcatacg agataggaat cgtggtctcg tgggctcgga gatg 54

  <210> 432

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 432

  caagcagaag acggcatacg agatagtcag gcttgtctcg tgggctcgga gatg 54

  <210> 433

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 433

  caagcagaag acggcatacg agattctaga gctcgtctcg tgggctcgga gatg 54

  <210> 434

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 434

  caagcagaag acggcatacg agattcgtgt ctgagtctcg tgggctcgga gatg 54

  <210> 435

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 435

  caagcagaag acggcatacg agattcgcat gtctgtctcg tgggctcgga gatg 54

  <210> 436

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 436

  caagcagaag acggcatacg agattcaatg cctcgtctcg tgggctcgga gatg 54

  <210> 437

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 437

  caagcagaag acggcatacg agattcgatc gtacgtctcg tgggctcgga gatg 54

  <210> 438

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 438

  caagcagaag acggcatacg agattcacca atgcgtctcg tgggctcgga gatg 54

  <210> 439

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 439

  caagcagaag acggcatacg agattcgctg gattgtctcg tgggctcgga gatg 54

  <210> 440

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 440

  caagcagaag acggcatacg agattctggc tatcgtctcg tgggctcgga gatg 54

  <210> 441

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 441

  caagcagaag acggcatacg agattcaacg gtcagtctcg tgggctcgga gatg 54

  <210> 442

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 442

  caagcagaag acggcatacg agattcgtac tctcgtctcg tgggctcgga gatg 54

  <210> 443

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 443

  caagcagaag acggcatacg agattccgtg tactgtctcg tgggctcgga gatg 54

  <210> 444

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 444

  caagcagaag acggcatacg agattctgaa gacggtctcg tgggctcgga gatg 54

  <210> 445

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 445

  caagcagaag acggcatacg agataccttc cgtagtctcg tgggctcgga gatg 54

  <210> 446

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 446

  caagcagaag acggcatacg agataccaca agtcgtctcg tgggctcgga gatg 54

  <210> 447

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 447

  caagcagaag acggcatacg agataccggt catagtctcg tgggctcgga gatg 54

  <210> 448

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 448

  caagcagaag acggcatacg agatacacgc ctaagtctcg tgggctcgga gatg 54

  <210> 449

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 449

  caagcagaag acggcatacg agatactgag ctaggtctcg tgggctcgga gatg 54

  <210> 450

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 450

  caagcagaag acggcatacg agatactaat gccggtctcg tgggctcgga gatg 54

  <210> 451

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 451

  caagcagaag acggcatacg agatacgata ctgggtctcg tgggctcgga gatg 54

  <210> 452

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 452

  caagcagaag acggcatacg agatacaaca ggacgtctcg tgggctcgga gatg 54

  <210> 453

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 453

  caagcagaag acggcatacg agatacatcc ggtagtctcg tgggctcgga gatg 54

  <210> 454

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 454

  caagcagaag acggcatacg agatacaagc gcatgtctcg tgggctcgga gatg 54

  <210> 455

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 455

  caagcagaag acggcatacg agatacactg aggtgtctcg tgggctcgga gatg 54

  <210> 456

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 456

  caagcagaag acggcatacg agatacgtag agcagtctcg tgggctcgga gatg 54

  <210> 457

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 457

  caagcagaag acggcatacg agatcattcc aagggtctcg tgggctcgga gatg 54

  <210> 458

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 458

  caagcagaag acggcatacg agatcacctt ccttgtctcg tgggctcgga gatg 54

  <210> 459

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 459

  caagcagaag acggcatacg agatcagcaa ttcggtctcg tgggctcgga gatg 54

  <210> 460

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 460

  caagcagaag acggcatacg agatcatcgt agtcgtctcg tgggctcgga gatg 54

  <210> 461

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 461

  caagcagaag acggcatacg agatcattca gcctgtctcg tgggctcgga gatg 54

  <210> 462

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 462

  caagcagaag acggcatacg agatcaagga acctgtctcg tgggctcgga gatg 54

  <210> 463

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 463

  caagcagaag acggcatacg agatcaagtt cgtcgtctcg tgggctcgga gatg 54

  <210> 464

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 464

  caagcagaag acggcatacg agatcagtca gttggtctcg tgggctcgga gatg 54

  <210> 465

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 465

  caagcagaag acggcatacg agatcaagga tctggtctcg tgggctcgga gatg 54

  <210> 466

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 466

  caagcagaag acggcatacg agatcaaagc actggtctcg tgggctcgga gatg 54

  <210> 467

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 467

  caagcagaag acggcatacg agatcatccg agttgtctcg tgggctcgga gatg 54

  <210> 468

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 468

  caagcagaag acggcatacg agatcatgaa cctggtctcg tgggctcgga gatg 54

  <210> 469

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 469

  caagcagaag acggcatacg agatgagcca taacgtctcg tgggctcgga gatg 54

  <210> 470

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 470

  caagcagaag acggcatacg agatgattgg acgtgtctcg tgggctcgga gatg 54

  <210> 471

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 471

  caagcagaag acggcatacg agatgattcc tgtggtctcg tgggctcgga gatg 54

  <210> 472

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 472

  caagcagaag acggcatacg agatgagcac gtaagtctcg tgggctcgga gatg 54

  <210> 473

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 473

  caagcagaag acggcatacg agatgacatc tacggtctcg tgggctcgga gatg 54

  <210> 474

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 474

  caagcagaag acggcatacg agatgatact gcgtgtctcg tgggctcgga gatg 54

  <210> 475

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 475

  caagcagaag acggcatacg agatgatatg gcaggtctcg tgggctcgga gatg 54

  <210> 476

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 476

  caagcagaag acggcatacg agatgaacag caacgtctcg tgggctcgga gatg 54

  <210> 477

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 477

  caagcagaag acggcatacg agatgagtta gacggtctcg tgggctcgga gatg 54

  <210> 478

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 478

  caagcagaag acggcatacg agatgattgc cactgtctcg tgggctcgga gatg 54

  <210> 479

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 479

  caagcagaag acggcatacg agatgattcg ttgggtctcg tgggctcgga gatg 54

  <210> 480

  <211> 54

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 480

  caagcagaag acggcatacg agatgaagct tgaggtctcg tgggctcgga gatg 54

  <210> 481

  <211> 308

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 481

  ctggcggcta tccagtacag cgccgtacca agataacgcg tgctggtttc aacctgtctg 60

  atatccgcaa tctgcttttc cgagaaccag aactcaaact gtaccgtcgg gtcataaacg 120

  gcaagatgcg gcgtggcggt tatctgaaaa tagcccggcg tcagctcaat cctcgacggt 180

  gctgccggtg cggcaatccg gaacgatacc gacgccggat cgccctgctg cccccacgca 240

  tttaccgccc ggactgtcag cctgtagttc cccagcgcca gttgcgtgaa gcggtatgtg 300

  gtttccgt 308

  <210> 482

  <211> 20

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 482

  ctggcggcta tccagtacag 20

  <210> 483

  <211> 20

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 483

  acggaaacca cataccgctt 20

  <210> 484

  <211> 36

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 484

  tttttttttt ttcaagcaga agacggcata cgagat 36

  <210> 485

  <211> 34

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 485

  ctgtctctta tacacatctc cgagcccacg agac 34

  <210> 486

  <211> 80

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <220>

  <221> misc_feature

  <222> (37)..(46)

  <223> n是a、c、g或t

  <400> 486

  tttttttttt ttcaagcaga agacggcata cgagatnnnn nnnnnngtct cgtgggctcg 60

  gagatgtgta taagagacag 80

  <210> 487

  <211> 22

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 487

  caagcagaag acggcatacg ag 22

  <210> 488

  <211> 19

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 488

  ctgtctctta tacacatct 19

  <210> 489

  <211> 21

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 489

  aatgatacgg cgaccaccga g 21

  <210> 490

  <211> 70

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 490

  aatgatacgg cgaccaccga gatctacaca cacagcttcg tcggcagcgt cagatgtgta 60

  taagagacag 70

  <210> 491

  <211> 19

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 491

  ctgtctctta tacacatct 19

  <210> 492

  <211> 21

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 492

  aatgatacgg cgaccaccga g 21

  <210> 493

  <211> 22

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 493

  caagcagaag acggcatacg ag 22

  <210> 494

  <211> 476

  <212> PRT

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 494

  Met Ile Thr Ser Ala Leu His Arg Ala Ala Asp Trp Ala Lys Ser Val

  1 5 1015

  Phe Ser Ser Ala Ala Leu Gly Asp Pro Arg Arg Thr Ala Arg Leu Val

  202530

  Asn Val Ala Ala Gln Leu Ala Lys Tyr Ser Gly Lys Ser Ile Thr Ile

  354045

  Ser Ser Glu Gly Ser Glu Ala Met Gln Glu Gly Ala Tyr Arg Phe Ile

  505560

  Arg Asn Pro Asn Val Ser Ala Glu Ala Ile Arg Lys Ala Gly Ala Met

  65707580

  Gln Thr Val Lys Leu Ala Gln Glu Phe Pro Glu Leu Leu Ala Ile Glu

  859095

  Asp Thr Thr Ser Leu Ser Tyr Arg His Gln Val Ala Glu Glu Leu Gly

  100 105 110

  Lys Leu Gly Ser Ile Gln Asp Lys Ser Arg Gly Trp Trp Val His Ser

  115 120 125

  Val Leu Leu Leu Glu Ala Thr Thr Phe Arg Thr Val Gly Leu Leu His

  130 135 140

  Gln Glu Trp Trp Met Arg Pro Asp Asp Pro Ala Asp Ala Asp Glu Lys

  145 150 155 160

  Glu Ser Gly Lys Trp Leu Ala Ala Ala Ala Thr Ser Arg Leu Arg Met

  165 170 175

  Gly Ser Met Met Ser Asn Val Ile Ala Val Cys Asp Arg Glu Ala Asp

  180 185 190

  Ile His Ala Tyr Leu Gln Asp Lys Leu Ala His Asn Glu Arg Phe Val

  195 200 205

  Val Arg Ser Lys His Pro Arg Lys Asp Val Glu Ser Gly Leu Tyr Leu

  210 215 220

  Tyr Asp His Leu Lys Asn Gln Pro Glu Leu Gly Gly Tyr Gln Ile Ser

  225 230 235 240

  Ile Pro Gln Lys Gly Val Val Asp Lys Arg Gly Lys Arg Lys Asn Arg

  245 250 255

  Pro Ala Arg Lys Ala Ser Leu Ser Leu Arg Ser Gly Arg Ile Thr Leu

  260 265 270

  Lys Gln Gly Asn Ile Thr Leu Asn Ala Val Leu Ala Glu Glu Ile Asn

  275 280 285

  Pro Pro Lys Gly Glu Thr Pro Leu Lys Trp Leu Leu Leu Thr Ser Glu

  290 295 300

  Pro Val Glu Ser Leu Ala Gln Ala Leu Arg Val Ile Asp Ile Tyr Thr

  305 310 315 320

  His Arg Trp Arg Ile Glu Glu Phe His Lys Ala Trp Lys Thr Gly Ala

  325 330 335

  Gly Ala Glu Arg Gln Arg Met Glu Glu Pro Asp Asn Leu Glu Arg Met

  340 345 350

  Val Ser Ile Leu Ser Phe Val Ala Val Arg Leu Leu Gln Leu Arg Glu

  355 360 365

  Ser Phe Thr Leu Pro Gln Ala Leu Arg Ala Gln Gly Leu Leu Lys Glu

  370 375 380

  Ala Glu His Val Glu Ser Gln Ser Ala Glu Thr Val Leu Thr Pro Asp

  385 390 395 400

  Glu Cys Gln Leu Leu Gly Tyr Leu Asp Lys Gly Lys Arg Lys Arg Lys

  405 410 415

  Glu Lys Ala Gly Ser Leu Gln Trp Ala Tyr Met Ala Ile Ala Arg Leu

  420 425 430

  Gly Gly Phe Met Asp Ser Lys Arg Thr Gly Ile Ala Ser Trp Gly Ala

  435 440 445

  Leu Trp Glu Gly Trp Glu Ala Leu Gln Ser Lys Leu Asp Gly Phe Leu

  450 455 460

  Ala Ala Lys Asp Leu Met Ala Gln Gly Ile Lys Ile

  465 470 475

  <210> 495

  <211> 19

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 495

  ctgactctta tacacaagt 19

  <210> 496

  <211> 19

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 496

  ctgtctcttg atcagatct 19

  <210> 497

  <211> 19

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 497

  ctgtctctta tacacatct 19

  <210> 498

  <211> 19

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 498

  ctgtctctta tacagatct 19

  <210> 499

  <211> 663

  <212> PRT

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 499

  Met Glu Leu Trp Val Ser Pro Lys Glu Cys Ala Asn Leu Pro Gly Leu

  1 5 1015

  Pro Lys Thr Ser Ala Gly Val Ile Tyr Val Ala Lys Lys Gln Gly Trp

  202530

  Gln Asn Arg Thr Arg Ala Gly Val Lys Gly Gly Lys Ala Ile Glu Tyr

  354045

  Asn Ala Asn Ser Leu Pro Val Glu Ala Lys Ala Ala Leu Leu Leu Arg

  505560

  Gln Gly Glu Ile Glu Thr Ser Leu Gly Tyr Phe Glu Ile Ala Arg Pro

  65707580

  Thr Leu Glu Ala His Asp Tyr Asp Arg Glu Ala Leu Trp Ser Lys Trp

  859095

  Asp Asn Ala Ser Asp Ser Gln Arg Arg Leu Ala Glu Lys Trp Leu Pro

  100 105 110

  Ala Val Gln Ala Ala Asp Glu Met Leu Asn Gln Gly Ile Ser Thr Lys

  115 120 125

  Thr Ala Phe Ala Thr Val Ala Gly His Tyr Gln Val Ser Ala Ser Thr

  130 135 140

  Leu Arg Asp Lys Tyr Tyr Gln Val Gln Lys Phe Ala Lys Pro Asp Trp

  145 150 155 160

  Ala Ala Ala Leu Val Asp Gly Arg Gly Ala Ser Arg Arg Asn Val His

  165 170 175

  Lys Ser Glu Phe Asp Glu Asp Ala Trp Gln Phe Leu Ile Ala Asp Tyr

  180 185 190

  Leu Arg Pro Glu Lys Pro Ala Phe Arg Lys Cys Tyr Glu Arg Leu Glu

  195 200 205

  Leu Ala Ala Arg Glu His Gly Trp Ser Ile Pro Ser Arg Ala Thr Ala

  210 215 220

  Phe Arg Arg Ile Gln Gln Leu Asp Glu Ala Met Val Val Ala Cys Arg

  225 230 235 240

  Glu Gly Glu His Ala Leu Met His Leu Ile Pro Ala Gln Gln Arg Thr

  245 250 255

  Val Glu His Leu Asp Ala Met Gln Trp Ile Asn Gly Asp Gly Tyr Leu

  260 265 270

  His Asn Val Phe Val Arg Trp Phe Asn Gly Asp Val Ile Arg Pro Lys

  275 280 285

  Thr Trp Phe Trp Gln Asp Val Lys Thr Arg Lys Ile Leu Gly Trp Arg

  290 295 300

  Cys Asp Val Ser Glu Asn Ile Asp Ser Ile Arg Leu Ser Phe Met Asp

  305 310 315 320

  Val Val Thr Arg Tyr Gly Ile Pro Glu Asp Phe His Ile Thr Ile Asp

  325 330 335

  Asn Thr Arg Gly Ala Ala Asn Lys Trp Leu Thr Gly Gly Ala Pro Asn

  340 345 350

  Arg Tyr Arg Phe Lys Val Lys Glu Asp Asp Pro Lys Gly Leu Phe Leu

  355 360 365

  Leu Met Gly Ala Lys Met His Trp Thr Ser Val Val Ala Gly Lys Gly

  370 375 380

  Trp Gly Gln Ala Lys Pro Val Glu Arg Ala Phe Gly Val Gly Gly Leu

  385 390 395 400

  Glu Glu Tyr Val Asp Lys His Pro Ala Leu Ala Gly Ala Tyr Thr Gly

  405 410 415

  Pro Asn Pro Gln Ala Lys Pro Asp Asn Tyr Gly Asp Arg Ala Val Asp

  420 425 430

  Ala Glu Leu Phe Leu Lys Thr Leu Ala Glu Gly Val Ala Met Phe Asn

  435 440 445

  Ala Arg Thr Gly Arg Glu Thr Glu Met Cys Gly Gly Lys Leu Ser Phe

  450 455 460

  Asp Asp Val Phe Glu Arg Glu Tyr Ala Arg Thr Ile Val Arg Lys Pro

  465 470 475 480

  Thr Glu Glu Gln Lys Arg Met Leu Leu Leu Pro Ala Glu Ala Val Asn

  485 490 495

  Val Ser Arg Lys Gly Glu Phe Thr Leu Lys Val Gly Gly Ser Leu Lys

  500 505 510

  Gly Ala Lys Asn Val Tyr Tyr Asn Met Ala Leu Met Asn Ala Gly Val

  515 520 525

  Lys Lys Val Val Val Arg Phe Asp Pro Gln Gln Leu His Ser Thr Val

  530 535 540

  Tyr Cys Tyr Thr Leu Asp Gly Arg Phe Ile Cys Glu Ala Glu Cys Leu

  545 550 555 560

  Ala Pro Val Ala Phe Asn Asp Ala Ala Ala Gly Arg Glu Tyr Arg Arg

  565 570 575

  Arg Gln Lys Gln Leu Lys Ser Ala Thr Lys Ala Ala Ile Lys Ala Gln

  580 585 590

  Lys Gln Met Asp Ala Leu Glu Val Ala Glu Leu Leu Pro Gln Ile Ala

  595 600 605

  Glu Pro Ala Ala Pro Glu Ser Arg Ile Val Gly Ile Phe Arg Pro Ser

  610 615 620

  Gly Asn Thr Glu Arg Val Lys Asn Gln Glu Arg Asp Asp Glu Tyr Glu

  625 630 635 640

  Thr Glu Arg Asp Glu Tyr Leu Asn His Ser Leu Asp Ile Leu Glu Gln

  645 650 655

  Asn Arg Arg Lys Lys Ala Ile

  660

  <210> 500

  <211> 26

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 500

  tgtattgatt cactgaagta cgaaaa 26

  <210> 501

  <211> 23

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 501

  ccttaatcaa tgaaacgcga aag 23

  <210> 502

  <211> 23

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 502

  ttgtttcatt gaaaatacga aaa 23

  <210> 503

  <211> 27

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 503

  tgaagcggcg cacgaaaaat gcgaaaa 27

  <210> 504

  <211> 23

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 504

  gcgtttcacg ataaatgcga aaa 23

  <210> 505

  <211> 23

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 505

  ccgtttcatt tgaagcgcga aaa 23

  <210> 506

  <211> 22

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <220>

  <221> misc_feature

  <222> (9)..(10)

  <223> n是a、c、g或t

  <400> 506

  ygtttcaynn raaryrcgaa ar 22

  <210> 507

  <211> 402

  <212> PRT

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 507

  Met Cys Glu Leu Asp Ile Leu His Asp Ser Leu Tyr Gln Phe Cys Pro

  1 5 1015

  Glu Leu His Leu Lys Arg Leu Asn Ser Leu Thr Leu Ala Cys His Ala

  202530

  Leu Leu Asp Cys Lys Thr Leu Thr Leu Thr Glu Leu Gly Arg Asn Leu

  354045

  Pro Thr Lys Ala Arg Thr Lys His Asn Ile Lys Arg Ile Asp Arg Leu

  505560

  Leu Gly Asn Arg His Leu His Lys Glu Arg Leu Ala Val Tyr Arg Trp

  65707580

  His Ala Ser Phe Ile Cys Ser Gly Asn Thr Met Pro Ile Val Leu Val

  859095

  Asp Trp Ser Asp Ile Arg Glu Gln Lys Arg Leu Met Val Leu Arg Ala

  100 105 110

  Ser Val Ala Leu His Gly Arg Ser Val Thr Leu Tyr Glu Lys Ala Phe

  115 120 125

  Pro Leu Ser Glu Gln Cys Ser Lys Lys Ala His Asp Gln Phe Leu Ala

  130 135 140

  Asp Leu Ala Ser Ile Leu Pro Ser Asn Thr Thr Pro Leu Ile Val Ser

  145 150 155 160

  Asp Ala Gly Phe Lys Val Pro Trp Tyr Lys Ser Val Glu Lys Leu Gly

  165 170 175

  Trp Tyr Trp Leu Ser Arg Val Arg Gly Lys Val Gln Tyr Ala Asp Leu

  180 185 190

  Gly Ala Glu Asn Trp Lys Pro Ile Ser Asn Leu His Asp Met Ser Ser

  195 200 205

  Ser His Ser Lys Thr Leu Gly Tyr Lys Arg Leu Thr Lys Ser Asn Pro

  210 215 220

  Ile Ser Cys Gln Ile Leu Leu Tyr Lys Ser Arg Ser Lys Gly Arg Lys

  225 230 235 240

  Asn Gln Arg Ser Thr Arg Thr His Cys His His Pro Ser Pro Lys Ile

  245 250 255

  Tyr Ser Ala Ser Ala Lys Glu Pro Trp Val Leu Ala Thr Asn Leu Pro

  260 265 270

  Val Glu Ile Arg Thr Pro Lys Gln Leu Val Asn Ile Tyr Ser Lys Arg

  275 280 285

  Met Gln Ile Glu Glu Thr Phe Arg Asp Leu Lys Ser Pro Ala Tyr Gly

  290 295 300

  Leu Gly Leu Arg His Ser Arg Thr Ser Ser Ser Glu Arg Phe Asp Ile

  305 310 315 320

  Met Leu Leu Ile Ala Leu Met Leu Gln Leu Thr Cys Trp Leu Ala Gly

  325 330 335

  Val His Ala Gln Lys Gln Gly Trp Asp Lys His Phe Gln Ala Asn Thr

  340 345 350

  Val Arg Asn Arg Asn Val Leu Ser Thr Val Arg Leu Gly Met Glu Val

  355 360 365

  Leu Arg His Ser Gly Tyr Thr Ile Thr Arg Glu Asp Leu Leu Val Ala

  370 375 380

  Ala Thr Leu Leu Ala Gln Asn Leu Phe Thr His Gly Tyr Ala Leu Gly

  385 390 395 400

  Lys Leu

  <210> 508

  <211> 23

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 508

  ctgakrratc ccctmatrat tty 23

  <210> 509

  <211> 273

  <212> PRT

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 509

  Met Ala Lys Ala Asn Ser Ser Phe Ser Glu Val Gln Ile Ala Arg Arg

  1 5 1015

  Ile Lys Glu Gly Arg Gly Gln Gly His Gly Lys Asp Tyr Ile Pro Trp

  202530

  Leu Thr Val Gln Glu Val Pro Ser Ser Gly Arg Ser His Arg Ile Tyr

  354045

  Ser His Lys Thr Gly Arg Val His His Leu Leu Ser Asp Leu Glu Leu

  505560

  Ala Val Phe Leu Ser Leu Glu Trp Glu Ser Ser Val Leu Asp Ile Arg

  65707580

  Glu Gln Phe Pro Leu Leu Pro Ser Asp Thr Arg Gln Ile Ala Ile Asp

  859095

  Ser Gly Ile Lys His Pro Val Ile Arg Gly Val Asp Gln Val Met Ser

  100 105 110

  Thr Asp Phe Leu Val Asp Cys Lys Asp Gly Pro Phe Glu Gln Phe Ala

  115 120 125

  Ile Gln Val Lys Pro Ala Ala Ala Leu Gln Asp Glu Arg Thr Leu Glu

  130 135 140

  Lys Leu Glu Leu Glu Arg Arg Tyr Trp Gln Gln Lys Gln Ile Pro Trp

  145 150 155 160

  Phe Ile Phe Thr Asp Lys Glu Ile Asn Pro Val Val Lys Glu Asn Ile

  165 170 175

  Glu Trp Leu Tyr Ser Val Lys Thr Glu Glu Val Ser Ala Glu Leu Leu

  180 185 190

  Ala Gln Leu Ser Pro Leu Ala His Ile Leu Gln Glu Lys Gly Asp Glu

  195 200 205

  Asn Ile Ile Asn Val Cys Lys Gln Val Asp Ile Ala Tyr Asp Leu Glu

  210 215 220

  Leu Gly Lys Thr Leu Ser Glu Ile Arg Ala Leu Thr Ala Asn Gly Phe

  225 230 235 240

  Ile Lys Phe Asn Ile Tyr Lys Ser Phe Arg Ala Asn Lys Cys Ala Asp

  245 250 255

  Leu Cys Ile Ser Gln Val Val Asn Met Glu Glu Leu Arg Tyr Val Ala

  260 265 270

  Asn

  <210> 510

  <211> 702

  <212> PRT

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 510

  Met Trp Gln Ile Asn Glu Val Val Leu Phe Asp Asn Asp Pro Tyr Arg

  1 5 1015

  Ile Leu Ala Ile Glu Asp Gly Gln Val Val Trp Met Gln Ile Ser Ala

  202530

  Asp Lys Gly Val Pro Gln Ala Arg Ala Glu Leu Leu Leu Met Gln Tyr

  354045

  Leu Asp Glu Gly Arg Leu Val Arg Thr Asp Asp Pro Tyr Val His Leu

  505560

  Asp Leu Glu Glu Pro Ser Val Asp Ser Val Ser Phe Gln Lys Arg Glu

  65707580

  Glu Asp Tyr Arg Lys Ile Leu Pro Ile Ile Asn Ser Lys Asp Arg Phe

  859095

  Asp Pro Lys Val Arg Ser Glu Leu Val Glu His Val Val Gln Glu His

  100 105 110

  Lys Val Thr Lys Ala Thr Val Tyr Lys Leu Leu Arg Arg Tyr Trp Gln

  115 120 125

  Arg Gly Gln Thr Pro Asn Ala Leu Ile Pro Asp Tyr Lys Asn Ser Gly

  130 135 140

  Ala Pro Gly Glu Arg Arg Ser Ala Thr Gly Thr Ala Lys Ile Gly Arg

  145 150 155 160

  Ala Arg Glu Tyr Gly Lys Gly Glu Gly Thr Lys Val Thr Pro Glu Ile

  165 170 175

  Glu Arg Leu Phe Arg Leu Thr Ile Glu Lys His Leu Leu Asn Gln Lys

  180 185 190

  Gly Thr Lys Thr Thr Val Ala Tyr Arg Arg Phe Val Asp Leu Phe Ala

  195 200 205

  Gln Tyr Phe Pro Arg Ile Pro Gln Glu Asp Tyr Pro Thr Leu Arg Gln

  210 215 220

  Phe Arg Tyr Phe Tyr Asp Arg Glu Tyr Pro Lys Ala Gln Arg Leu Lys

  225 230 235 240

  Ser Arg Val Lys Ala Gly Val Tyr Lys Lys Asp Val Arg Pro Leu Ser

  245 250 255

  Ser Thr Ala Thr Ser Gln Ala Leu Gly Pro Gly Ser Arg Tyr Glu Ile

  260 265 270

  Asp Ala Thr Ile Ala Asp Ile Tyr Leu Val Asp His His Asp Arg Gln

  275 280 285

  Lys Ile Ile Gly Arg Pro Thr Leu Tyr Ile Val Ile Asp Val Phe Ser

  290 295 300

  Arg Met Ile Thr Gly Phe Tyr Ile Gly Phe Glu Asn Pro Ser Tyr Val

  305 310 315 320

  Val Ala Met Gln Ala Phe Val Asn Ala Cys Ser Asp Lys Thr Ala Ile

  325 330 335

  Cys Ala Gln His Asp Ile Glu Ile Ser Ser Ser Asp Trp Pro Cys Val

  340 345 350

  Gly Leu Pro Asp Val Leu Leu Ala Asp Arg Gly Glu Leu Met Ser His

  355 360 365

  Gln Val Glu Ala Leu Val Ser Ser Phe Asn Val Arg Val Glu Ser Ala

  370 375 380

  Pro Pro Arg Arg Gly Asp Ala Lys Gly Ile Val Glu Ser Thr Phe Arg

  385 390 395 400

  Thr Leu Gln Ala Glu Phe Lys Ser Phe Ala Pro Gly Ile Val Glu Gly

  405 410 415

  Ser Arg Ile Lys Ser His Gly Glu Thr Asp Tyr Arg Leu Asp Ala Ser

  420 425 430

  Leu Ser Val Phe Glu Phe Thr Gln Ile Ile Leu Arg Thr Ile Leu Phe

  435 440 445

  Arg Asn Asn His Leu Val Met Asp Lys Tyr Asp Arg Asp Ala Asp Phe

  450 455 460

  Pro Thr Asp Leu Pro Ser Ile Pro Val Gln Leu Trp Gln Trp Gly Met

  465 470 475 480

  Gln His Arg Thr Gly Ser Leu Arg Ala Val Glu Gln Glu Gln Leu Arg

  485 490 495

  Val Ala Leu Leu Pro Arg Arg Lys Val Ser Ile Ser Ser Phe Gly Val

  500 505 510

  Asn Leu Trp Gly Leu Tyr Tyr Ser Gly Ser Glu Ile Leu Arg Glu Gly

  515 520 525

  Trp Leu Gln Arg Ser Thr Asp Ile Ala Arg Pro Gln His Leu Glu Ala

  530 535 540

  Ala Tyr Asp Pro Val Leu Val Asp Thr Ile Tyr Leu Phe Pro Gln Val

  545 550 555 560

  Gly Ser Arg Val Phe Trp Arg Cys Asn Leu Thr Glu Arg Ser Arg Gln

  565 570 575

  Phe Lys Gly Leu Ser Phe Trp Glu Val Trp Asp Ile Gln Ala Gln Glu

  580 585 590

  Lys His Asn Lys Ala Asn Ala Lys Gln Asp Glu Leu Thr Lys Arg Arg

  595 600 605

  Glu Leu Glu Ala Phe Ile Gln Gln Thr Ile Gln Lys Ala Asn Lys Leu

  610 615 620

  Thr Pro Ser Thr Thr Glu Pro Lys Ser Thr Arg Ile Lys Gln Ile Lys

  625 630 635 640

  Thr Asn Lys Lys Glu Ala Val Thr Ser Glu Arg Lys Lys Arg Ala Glu

  645 650 655

  His Leu Lys Pro Ser Ser Ser Gly Asp Glu Ala Lys Val Ile Pro Phe

  660 665 670

  Asn Ala Val Glu Ala Asp Asp Gln Glu Asp Tyr Ser Leu Pro Thr Tyr

  675 680 685

  Val Pro Glu Leu Phe Gln Asp Pro Pro Glu Lys Asp Glu Ser

  690 695 700

  <210> 511

  <211> 22

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 511

  tgayaataaa gttgattata ct 22

  <210> 512

  <211> 38

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 512

  ggggtctgac gctcagtgga acgaaaactc acgttaag 38

  <210> 513

  <211> 38

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 513

  cttaacgtga gttttcgttc cactgagcgt cagacccc 38

  <210> 514

  <211> 38

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 514

  ggggtttgag ggccaatgga acgaaaacgt acgttaag 38

  <210> 515

  <211> 38

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 515

  ataaacgtac gttttcgttc cattggccct caaacccc 38

  <210> 516

  <211> 255

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 516

  cgcttaactt aatacgagcc ccaaccacta ttaattcgaa cagcatgttt tttttgcagt 60

  gcgcaatgtt taacacacta tattatcaat actactaaag ataacacata ccaatgcatt 120

  tcgtctcaaa gagaatttta ttctcttcac gacgaaaaaa aaagttttgc tctatttcca 180

  acaacaacaa aaatatgagt aatttattca aacggtttgc ttaagagata agaaaaaagt 240

  gaccactatt aattc 255

  <210> 517

  <211> 255

  <212> DNA

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 517

  atagtaaatc acattacgcc gcgttcgaat taatagtggt cacttttttc ttatctctta 60

  agcaaaccgt ttgaataaat tactcatatt tttgttgttg ttggaaatag agcaaaactt 120

  tttttttcgt cgtgaagaga ataaaattct ctttgagacg aaatgcattg gtatgtgtta 180

  tctttagtag tattgataat atagtgtgtt aaacattgcg cactgcaaaa aaaacatgct 240

  gttcgaatta atagt 255

  <210> 518

  <211> 340

  <212> PRT

  <213> 人工序列

  <220>

  <223> 合成构建物

  <400> 518

  Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Lys Ile Val

  1 5 1015

  Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu

  202530

  Lys Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His

  354045

  His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Val Leu

  505560

  Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro

  65707580

  Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr

  859095

  Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu

  100 105 110

  Lys Gly Arg Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys

  115 120 125

  Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr

  130 135 140

  Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe

  145 150 155 160

  Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys

  165 170 175

  Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile

  180 185 190

  Met Leu Trp Cys Gly Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys

  195 200 205

  Ile Asp Gly Ile Met Arg Lys Glu Asn Tyr Val Asp Ile Leu Lys Gln

  210 215 220

  His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val

  225 230 235 240

  Phe Gln Met Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys

  245 250 255

  Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser

  260 265 270

  Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg

  275 280 285

  Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys

  290 295 300

  Gln Glu Glu Trp Ala Lys Ile His Pro Thr Tyr Cys Gly Lys Leu Val

  305 310 315 320

  Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn

  325 330 335

  Ala Thr Lys Tyr

  340

《用于对核酸进行测序的组合物和方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)