欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 用于核酸组装和高通量测序的方法独创技术91760字

用于核酸组装和高通量测序的方法

2021-03-18 19:08:41

用于核酸组装和高通量测序的方法

  相关申请tt

  本申请要求2012年6月25日提交的美国临时专利申请号61/664,118和2012tt年11月30日提交的美国临时专利申请号61/731,627的权益和优先权,上述各申请tt通过引用全文纳入本文。tt

  技术领域tt

  本文提供了涉及合成和组装有预定序列的高保真核酸和核酸库的方法和设tt备。更具体的,提供了用于多核苷酸合成、错误降低和/或高通量测序验证的方法tt和设备。tt

  发明背景tt

  使用重组DNA化学技术,从自然中复制和扩增DNA序列并随后分解成组成tt部分是常见的。作为组成部分,随后序列重组或重新组装成新的DNA序列。然而,tt对天然可得序列的依赖性严重限制了研究者探索的可能性。虽然现在可以从单个核tt苷直接合成短DNA序列,但通常直接构建多核苷酸的大片段或组件(即长于约400tt碱基对的多核苷酸序列)是不可行的。tt

  能通过微芯片上的大规模平行定制合成进行寡核苷酸合成(Zhou等,(2004)ttNucleic Acids Res.32:5409;Fodor等(1991)Science 251:767)。然而,当前微芯片tt的表面积非常小,并且因而仅能生成少量的寡核苷酸。在释放到溶液中时,寡核苷tt酸以每条序列皮摩尔或更低浓度存在,该浓度不足以有效驱动双分子活化反应。无tt法对目前用于组装少量变体核酸的方法以成本节约的方式进行放大以生成大量特tt定的变体。同样,仍然需要用于高保真基因组装等的改良的方法和装置。tt

  此外,通常通过化学反应合成微芯片上的寡核苷酸。错误的化学反应导致寡tt核苷酸中随机的碱基错误。化学核酸合成中关键限制因素之一是错误率。化学合成tt的寡核苷酸的错误率(例如每100个碱基中1个的缺失和约每400个碱基中1个的tt错配和插入)超过了通过酶的方式复制现有核酸(例如PCR)所得的错误率。因tt此,迫切需要一种新的技术来以成本节约的方式生产高产量的高保真多核苷酸。tt

  概述tt

  本发明的各方面涉及制备和/或组装高保真聚合物的方法、系统和组合物。本tt发明还提供了进行核酸组装反应和组装核酸的设备和方法。本发明的一个目的是提tt供合成定制多核苷酸的可行、经济的方法。本发明的另一个目的是提供生产合成的tt多核苷酸的方法,该方法的错误率低于通过本领域已知方法制备的合成的多核苷tt酸。tt

  根据一些实施方式,本发明提供了一种用于生产具有预定序列的目标核酸的tt方法。在一些实施方式中,该方法包括提供多个寡核苷酸的步骤,其中各寡核苷酸tt包含(i)与目标核酸的序列的不同部分相同的内部序列,(ii)内部序列5’端之侧的tt5’侧接序列和内部序列3’端之侧的3’侧接序列,各侧接序列包含引物对的引物识别tt位点和限制性酶识别位点。在一些实施方式中,该方法还包括使用引物对扩增至少tt一组寡核苷酸,从而生成多个经扩增的寡核苷酸。随后可使多个经扩增的寡核苷酸tt在单个池中接触限制性酶和连接酶,其中限制性酶能够识别限制性酶识别位点,从tt而生成目标核酸。tt

  在一些实施方式中,该方法包括对组装的目标核酸进行测序确认。在一些实tt施方式中,经扩增的双链寡核苷酸可包含一个序列错误或错配。在一些实施方式中,tt该方法包括对多个经扩增的寡核苷酸进行错误去除。在一些实施方式中,可使多个tt经扩增的寡核苷酸接触错配结合剂。所述错配结合剂可选择性地结合包含错配的双tt链寡核苷酸,导致结合和剪切作用。在一些实施方式中,可使多个经扩增的寡核苷tt酸接触错配识别剂,例如化学品,如赖氨酸、哌啶等。tt

  在一些实施方式中,在适于促进消化和连接的条件下将限制性酶和连接酶加tt入单个经扩增的寡核苷酸的池中,从而生成包含组装的目标核酸序列和侧接区的混tt合物。在一些实施方式中,各侧接区包含共有的引物识别位点。在一些实施方式中,tt所述限制性酶是IIS型限制性酶。使用IIS型限制性酶进行消化可产生多个粘性末tt端的双链结构寡核苷酸且所述多个粘性末端的双链结构寡核苷酸可以特定的线性tt排列形式进行连接。tt

  在一些实施方式中,该方法包括使用能够识别位于目标核酸的5’端和3’端的tt引物识别位点的引物对扩增目标核酸。在一些实施方式中,该方法包括对目标核酸tt进行测序以确认其序列准确性,例如通过高通量测序。在一些实施方式中,该方法tt包括从核酸序列池中分离至少一种具有预定序列的目标核酸。tt

  根据一些实施方式,本发明提供了一种进一步加工分离的核酸的方法。在一tt些实施方式中,该方法包括组装至少两种目标核酸。组装的步骤可以是通过分级组tt装。在一些实施方式中,可对至少两种目标核酸进行限制性酶消化和连接,从而形tt成长的目标核酸构建体,例如长度至少约10千碱基或100千碱基。tt

  根据一些实施方式,本发明提供了一种用于生产载体中具有预定序列的目标tt核酸的方法。在一些实施方式中,提供了多个寡核苷酸,各寡核苷酸包含(i)与目tt标核酸的序列的不同部分相同的内部序列,(ii)内部序列5’端之侧的5’侧接序列和tt内部序列3’端之侧的3’侧接序列,各侧接序列包含引物对的引物识别位点和限制tt性内切酶的限制性酶识别位点。在一些实施方式中,可使用引物对扩增至少一组寡tt核苷酸,从而生成多个经扩增的寡核苷酸。在一些实施方式中,可对多个经扩增的tt寡核苷酸进行错误去除和/或校正。在一些实施方式中,提供了具有限制性内切酶tt的限制性酶识别位点的环形载体。在一些实施方式中,可使多个经扩增的寡核苷酸tt和环形载体在单个池中接触限制性酶和连接酶,其中限制性酶能够识别限制性酶识tt别位点,从而在载体中组装目标核酸。在一些实施方式中,该方法还包括将载体转tt化至宿主细胞中并测序以验证目标核酸序列。tt

  根据一些实施方式,本发明提供了一种用于组装具有预定序列的目标核酸的tt组合物。在一些实施方式中,所述组合物包含多个寡核苷酸,其中各寡核苷酸包含tt(i)与目标核酸的序列的不同部分相同的内部序列,(ii)内部序列5’端之侧的5’侧tt接序列和内部序列3’端之侧的3’侧接序列,各侧接序列包含引物对的引物识别位tt点和限制性内切酶的限制性酶识别位点。在一些实施方式中,所述组合物还包含限tt制性内切酶和/或连接酶。在一些实施方式中,所述组合物还包含载体,所述载体tt包含限制性内切酶的一对酶识别位点。在一些实施方式中,所述限制性内切酶是ttIIS型限制性内切酶。tt

  在一些实施方式中,对多个寡核苷酸进行扩增和/或错误校正。tt

  在本发明的一些方面中,生成具有预定序列的目标核酸的方法包括提供第一tt混合物,其包含(i)限制性酶和(ii)第一寡核苷酸池,所述第一寡核苷酸池包括:tt包含与目标核酸5’端相同序列的第一寡核苷酸、包含与目标核酸3’端相同序列的tt第二寡核苷酸和包含与目标核酸序列另外部分相同序列的多寡核苷酸组,各寡核苷tt酸具有对应于下一寡核苷酸中序列区域的重叠序列区域,第一池中的寡核苷酸合起tttttt来包含目标核酸序列;并使混合物与连接酶接触,从而生成目标核酸。随后可对目tt标核酸进行测序验证。tt

  在一些实施方式中,本发明的方法包括提供一个构建寡核苷酸池并涉及不同tt阶段时寡核苷酸的扩增。术语“构建寡核苷酸”指可用于组装比构建寡核苷酸本身tt长的核酸分子的单链寡核苷酸。构建寡核苷酸可以是单链寡核苷酸或双链寡核苷tt酸。在一些实施方式中,构建寡核苷酸是合成的寡核苷酸并可以在基质上平行地合tt成。tt

  在一些实施方式中,该方法还包括在提供第一混合物前提供多个构建寡核苷tt酸的步骤,其中各构建寡核苷酸包含(i)与目标核酸的序列的不同部分相同的内部tt序列,(ii)内部序列5’端之侧的5’侧接序列和内部序列3’端之侧的3’侧接序列,tt各侧接序列包含引物对的引物识别位点和限制性酶识别位点。在一些实施方式中,tt各侧接区可包含共同的引物识别位点。在一些实施方式中,可扩增多个构建寡核苷tt酸。在一些实施方式中,寡核苷酸可包含序列错误或错配。在一些实施方式中,可tt对多个经扩增的寡核苷酸进行错误去除。例如,可使多个经扩增的寡核苷酸接触错tt配结合剂,所述错配结合剂选择性结合并剪切包含错配的双链寡核苷酸。tt

  在一些实施方式中,可在适于促进消化和连接的条件下将限制性酶和连接酶tt加入单个经扩增的寡核苷酸的池中,从而生成包含组装的目标核酸序列和侧接区的tt混合物。在一些实施方式中,所述限制性酶可以是IIS型限制性酶且使用IIS型限tt制性酶进行的消化可生成多个粘性末端双链寡核苷酸,其中所述多个粘性末端双链tt寡核苷酸以特殊的线性排列进行连接。tt

  在一些实施方式中,该方法还包括使用能够识别位于第一寡核苷酸5’端和第tt二寡核苷酸3’端的引物识别位点的引物对扩增目标核酸。tt

  在一些实施方式中,该方法还包括对目标核酸进行测序以确认其序列准确性,tt例如通过高通量测序。tt

  在一些实施方式中,该方法还包括从核酸序列池中分离至少一种具有预定序tt列的目标核酸。tt

  在一些实施方式中,该方法还包括加工目标核酸。tt

  在一些实施方式中,该方法还包括提供第二混合物,其包含(i)限制性酶和(ii)tt第二寡核苷酸池,所述第二寡核苷酸池包含:包含与目标核酸5’端相同序列的第tt一寡核苷酸、包含与目标核酸3’端相同的序列的第二寡核苷酸和包含与目标核酸tttttt序列另外部分相同序列的多寡核苷酸组,各寡核苷酸具有对应于下一寡核苷酸中序tt列区域的重叠序列区域,第二池中的寡核苷酸合起来包含第二目标核酸。在一些实tt施方式中,使第二混合物接触连接酶,从而生成第二目标核酸。在一些实施方式中,tt第一池中的第二寡核苷酸包含限制性内切酶的限制性内切酶识别位点且第二池中tt的第一寡核苷酸包含限制性内切酶的限制性内切酶识别位点。tt

  在一些实施方式中,该方法还包括组装至少两个目标核酸。在一些实施方式tt中,组装的步骤是通过分级组装。在一些实施方式中,对所述至少两个目标核酸进tt行限制性内切酶消化和连接,从而形成长的目标核酸构建体。在一些实施方式中,tt所述长的目标核酸构建体的长度为至少约10千碱基或至少约100千碱基。tt

  在一些方面,本发明涉及用于组装具有预定序列的目标核酸的组合物,所述tt组合物包含多个寡核苷酸,其包含:包含与目标核酸5’端相同序列的第一寡核苷tt酸、包含与目标核酸3’端相同的序列的第二寡核苷酸和包含与目标核酸序列另外tt部分相同序列的一个或多个寡核苷酸,各寡核苷酸具有对应于下一寡核苷酸中序列tt区域的重叠序列区域,多个寡核苷酸合起来包含目标核酸;多个共有序列包含引物tt对的引物识别位点和限制性内切酶识别位点。在一些实施方式中,所述组合物还包tt含限制性内切酶和/或连接酶。所述限制性内切酶可以是IIS型限制性内切酶。tt

  在一些实施方式中,可对多个寡核苷酸进行扩增和/或错误校正。在一些实施tt方式中,所述组合物还可包含线性化的载体,所述载体包含与第一寡核苷酸相容的tt5’端和与第二寡核苷酸相容的3’端。tt

  附图简要说明tt

  图1显示了根据本发明的一个实施方式的高保真核酸组装的示例性过程。tt

  图2显示了具有预定序列的多核苷酸的组装方法的非限制性示例。tt

  图3显示了将具有预定序列的多核苷酸组装至载体中的组装方法的非限制性tt示例。tt

  图4显示了具有预定序列的多核苷酸的分级组装方法的非限制性示例。tt

  图5显示了具有限制性内切酶识别位点(下划线)的质粒pG9-1的核苷酸序tt列。tt

  图6显示了测序验证的非限制性示例性方法。tt

  发明详述tt

  本发明的各方面对于优化核酸组装反应和减少不准确组装的核酸数目是有用tt的。本发明的方法和组合物可促进获得具有预定序列的目标序列的方法。因此,本tt发明的方法和组合物可增加获得正确组装的核酸的可能性,从而减少生产具有预定tt序列的核酸相关的成本和时间。tt

  本发明的各方面可用于提高一种或多种初始或中间组装反应的产量。在一些tt实施方式中,本发明的方法和组合物可通过避免需要分离多个组装步骤(例如酶消tt化、纯化和连接步骤)来提高总组装过程的效率。因此,本发明的一些方面允许可tt预测和/或可靠的组装策略并可显著减少基因合成所需的时间和步骤并提高中间产tt物或最终核酸产物的产量和/或准确性。tt

  在本发明的一些方面中,组装过程包括设计和实施核酸组装策略,该核酸组tt装策略能够调和已知或预测会干扰一个或多个组装步骤的序列特征。例如,可分析tt待合成的核酸序列中会干扰一个或多个组装步骤的序列特征,如重复的序列,具有tt显著高或低GC含量的序列和/或与二级结构相关的其他序列。本领域技术人员应tt理解,某些序列特征会干扰多重组装反应(例如基于聚合酶的延伸反应)和/或促tt进不需要的组装产物的形成,从而减少或阻止正确的核酸产物的组装。在一些实施tt方式中,如果在目标核酸序列中鉴定到多个干扰序列特征,有用的策略可涉及在组tt装期间分离干扰序列特征。例如,可在涉及多个中间片段或结构模块(其被设计以tt仅包含少量的干扰序列(例如0、1、2或3个))的过程中组装目标核酸。在一些tt实施方式中,各中间片段或结构模块可含有最多一种干扰序列特征。因此,可有效tt地组装各中间片段。在一些实施方式中,核酸片段或结构模块的设计可排除来自其tt5'和/或3'端的干扰序列特征。因此,可从设计用于组装反应的相邻起始核酸之间的tt互补重叠区域中排除干扰序列特征。这会防止或减少对序列特异性杂交反应的干tt扰,该序列特异性杂交反应对核酸的正确组装是重要的。在一些实施方式中,从中tt间体结构模块的3'和/或5'端排除干扰序列特征是足够的。例如,干扰序列特征可tt位于来自结构模块3'端和/或5'端的至少一个核苷酸处,优选位于来自结构模块3'tt端和/或5'端的2、3、4、5或更多个核苷酸(例如5-10、10-15、15-20或更多个核tt苷酸)处。tt

  本发明的各方面可与体外和/或体内核酸组装步骤联用。tt

  本文提供的方法和组合物的各方面对增加核酸合成和组装反应的精确性、产tt率、通量、和/或成本效益是有用的。本文使用的术语“核酸”、“多核苷酸”、tttttt“寡核苷酸”可互换使用,并且指核苷酸的天然产生或合成的聚合物形式。本发明tt所述寡核苷酸和核酸分子可以从天然产生的核苷酸形成,例如形成脱氧核糖核酸tt(DNA)或核糖核酸(RNA)分子。或者,该天然产生的寡核苷酸可以包含改变tt其性质的结构修饰,例如肽核酸(PNA)或锁核酸(LNA)。有天然产生碱基或tt人工碱基的寡核苷酸和核酸分子的固相合成为本领域熟知。应理解这些术语包含从tt核苷酸类似物中生成的RNA或DNA的等同物、类似物和应用于要描述的实施方tt式时的单链或双链多核苷酸。本发明中可用的核苷酸包含例如天然产生的核苷酸tt(例如核糖核苷酸或脱氧核糖核苷酸),或者核苷酸的天然或合成修饰、或者人工tt碱基。本文使用的术语单体指小分子组成员,其是并且能结合在一起以形成低聚物、tt聚合物或由两个或更多成员构成的化合物。聚合物中所述单体的特定顺序在本文中tt称为聚合物的“序列”。该单体组包含但不限于例如常见L-氨基酸组、D-氨基酸tt组、合成和/或天然氨基酸组、核苷酸组及戊糖和己糖组。本文所述的本发明的方tt面主要关于制备寡核苷酸,但是易于应用于制备其他聚合物例如肽或多肽、多糖、tt磷脂、杂聚物、聚酯、聚碳酸酯、聚脲、聚酰胺、聚乙烯亚胺、聚亚芳基硫醚、聚tt硅氧烷、聚酰亚胺、聚乙酸酯或任何其他聚合物。tt

  目标核酸

  本文使用的术语“预定序列”指在所述聚合物合成或组装前已知且已选择的tt聚合物的序列。具体地,本文所述本发明的各方面主要涉及核酸分子的制备,在核tt酸分子合成或组装前已知且已选择寡核苷酸或多核苷酸的序列。在本文所提供技术tt的一些实施方式中,固定的寡核苷酸或多核苷酸被用作材料来源。在多个实施方式tt中,本文所述方法使用多个寡核苷酸,各序列基于待合成的最终多核苷酸构建体的tt序列确定。在一个实施方式中,寡核苷酸是短核酸分子。例如,寡核苷酸的长度可tt以是10至约300个核苷酸、20至约400个核苷酸、30至约500个核苷酸、40至tt约600个核苷酸,或超过约600个核苷酸。然而,可以使用更短或更长的寡核苷酸。tt寡核苷酸可设计成具有不同长度。在一些实施方式中,多核苷酸构建体序列可以分tt成更短序列组,该序列能使用本文所述方法平行合成并组装成单个或多个所需多核tt苷酸构建体。tt

  在一些实施方式中,目标核酸可具有天然产生的基因和/或其他天然产生的核tt酸(例如天然产生的编码序列、调节序列、非编码序列、染色体结构序列(如端粒tt或中心粒序列)等,其任意片段或其两种或多种的任意组合)的序列或者非天然产tttttt生的序列。在一些实施方式中,可将目标核酸设计为具有在一个或多个位置上不同tt于天然序列的序列。在其他实施方式中,可将目标核酸设计为具有全新的序列。然tt而,应理解目标核酸可包括一种或多种天然产生的序列、非天然产生的序列或其组tt合。tt

  在一些实施方式中,本文提供了组装包含具有预定序列差异的核酸的文库的tt方法。本文提供的组装方案能用于生成代表很多不同感兴趣核酸序列的非常大的文tt库。例如,本文提供的方法可用于组装具有超过10种不同序列变体的文库。在一tt些实施方式中,核酸文库是序列变体文库。序列变体可以是单个天然产生蛋白编码tt序列的变体。然而,在一些实施方式中,序列变体可以是多个不同蛋白编码序列的tt变体。因此,本发明的一个方面涉及用于制备精确的高密度核酸文库的组装策略的tt设计。本文提供的技术的另一个方面涉及组装精确的高密度核酸文库。本文提供的tt技术的各方面还涉及精确的高密度核酸文库。高密度核酸文库可以包含超过100tt种不同序列变体(如约102至103、约103至104、约104至105、约105至106、约tt106至107、约107至108、约108至109、约109至1010、约1010至1011、约1011至tt1012、约1012至1013、约1013至1014、约1014至1015或更多不同序列),其中与随tt机序列相反,高百分比的不同序列是特异性序列(如,大于约50%、大于约60%、tt大于约70%、大于约75%、大于约80%、大于约85%、大于约90%、约91%、约tt92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多的序tt列是预定的感兴趣的序列)。tt

  在某些实施方式中,目标核酸可包括功能序列(例如蛋白结合序列、调节序tt列、编码功能蛋白的序列等,或其组合)。然而,在一些实施方式中,目标核酸可tt缺少特定功能序列(例如目标核酸可仅包括蛋白结合序列、调节序列或蛋白编码序tt列的非功能片段或变体,或任何其他非功能的天然产生的或合成的序列,或其任意tt非功能的组合)。某些目标核酸可包括功能和非功能序列。本文中更详细地描述了tt目标核酸及其用途的这些和其他方面。tt

  在一些实施方式中,可在单个多重组装反应(例如单核苷酸组装反应)中组tt装目标核酸。然而,也可由多个核酸片段组装目标核酸,其中可在独立的多重寡核tt苷酸组装反应中生成各核酸片段。应理解在一些实施方式中,可将通过多重寡核苷tt酸组装生成的一个或多个核酸片段与获自另一来源的一个或多个核酸分子(例如限tt制性片段、核酸扩增产物等)混合以形成目标核酸。在一些实施方式中,在第一反tttttt应中组装的目标核酸可以用作后续组装反应的输入核酸片段以生成较大的目标核tt酸。本文所用术语“多重组装”和“多重寡核苷酸组装反应”通常指涉及多个起始tt核酸(例如多个至少部分重叠的核酸)的组装反应,该起始核酸经组装以生成较大tt的目标核酸。tt

  组装方法

  图1显示了根据本发明的一个实施方式用于组装核酸的方法。首先,获得序tt列信息。序列信息可以是待组装的预定目标核酸的序列。在一些实施方式中,可以tt来自客户的指令的形式接受序列。在一些实施方式中,可以核酸序列(例如,DNAtt或RNA)的形式接受序列。在一些实施方式中,可以蛋白序列的形式接受序列。tt该序列可转化为DNA序列。例如,如果所得的序列是RNA序列,可以用T来代tt替U以得到相应的DNA序列。如果所得的序列是蛋白序列,可以使用合适的氨基tt酸密码子将该蛋白序列转化为DNA序列。tt

  在一些实施方式中,可对序列信息进行分析以确定组装策略(如待组装片段tt(在本文中也称作结构模块、寡核苷酸或中间片段)的数目和序列)以生成目标核tt酸的预定序列。在一些实施方式中,序列分析可包括扫描一种或多种干扰序列特征tt是否存在,该干扰序列特征已知或预计干扰寡核苷酸合成、扩增或组装。例如,干tt扰序列结构可以是在至少10个碱基(例如,10-20、20-50、50-100或超过100个tt碱基)的长度上具有低GC含量(例如,低于30%GC、低于20%GC、低于10%GCtt等)的序列,或者可以形成二级结构或茎环结构的序列。一旦通过该过滤,可将核tt酸序列分为较小碎片,如寡核苷酸结构模块。tt

  在一些实施方式中,在构建体定量和解析步骤之后,可设计用于组装的合成tt的寡核苷酸(例如序列、大小和数量)。可使用标准DNA合成化学(例如,亚磷tt酰胺方法)来生产合成的寡核苷酸。可使用本领域已知的任何合适技术或如本文详tt述在固体支持物(例如微阵列)上合成合成的寡核苷酸。可在扩增之前将寡核苷酸tt从微阵列上洗脱下来或在微阵列上扩增寡核苷酸。应理解可将不同的寡核苷酸设计tt为具有不同的长度。tt

  在一些实施方式中,可扩增各目标序列的结构模块寡核苷酸。例如,可对寡tt核苷酸进行设计以在其3’端和5’端上具有引物结合序列并可使用合适的引物对通tt过聚合酶链式反应(PCR)对寡核苷酸进行扩增。tt

  应理解合成的寡核苷酸可具有序列错误。因此,可如本文中更详细描述的那tt样选择或筛选寡核苷酸制备物以除去含有错误的分子。含有错误的寡核苷酸可以是tt在两条链上都具有错误的同源双链体(即在两条链上都有不正确的互补核苷酸、缺tt失或添加)。在一些实施方式中,可使用涉及使双链核酸变性并再退火的技术除去tt序列错误。在一些实施方式中,如果含有各单个错误的核酸以比在相同位置具有正tt确序列的核酸低的频率存在于核酸制备物中,则含有互补错误的单链核酸可能无法tt再退火并相互结合。相反,含有错误的单链可能与不含错误或含有一种或多种不同tt错误的互补链进行再退火。结果是,最终含有错误的链在再退火的反应产物中以异tt源双链分子的形式存在。无错误的核酸链可与含有错误的链或者其他无错误的链发tt生再退火。再退火的无错误的链在再退火样品中形成同源双链体。因此,通过从再tt退火的寡核苷酸制备物中去除异源双链分子,可减少含有错误的核酸的量或频率。tt可使用本领域已知的除去异源双链分子的任何适当方法,包括色谱、电泳、异源双tt链分子的选择性结合等。在一些实施方式中,可使用选择性(例如特异性)结合异tt源双链核酸分子的错配结合蛋白。在一些实施方式中,该错配结合蛋白可用于溶液tt中或者固定在支持物上的双链寡核苷酸或多核苷酸上。tt

  在一些实施方式中,使用MutS过滤方法(例如使用MutS、MutS同源物或其tt组合)除去含有错误的寡核苷酸。在大肠杆菌中,似乎以二聚体形式起作用的MutStt蛋白作为错配识别因子发挥作用。在真核细胞中,已鉴定到至少三种MutS同源tt(MSH)蛋白,即MSH2、MSH3和MSH6,且其形成异源二聚体。例如在酿酒酵tt母中,MSH2-MSH6复合物(也称作MutSα)识别碱基错配和单核苷酸插入/缺失tt环,而MSH2-MSH3复合物(也称作MutSβ)识别最多12-16个核苷酸的插入/缺tt失,但其起基本冗余的作用。错配结合蛋白可获自重组或天然来源。错配结合蛋白tt可以是热稳定的。在一些实施方式中,可以使用来自嗜热微生物的热稳定错配结合tt蛋白。热稳定DNA错配结合蛋白的示例包括但不限于:Tth MutS(来自嗜热栖热tt菌(Thermus thermophilus))、Taq MutS(来自水生栖热菌(Thermus aquaticus))、ttApy MutS(来自嗜火液菌(Aquifex pyrophilus))、Tma MutS(来自海栖热袍菌tt(Thermotoga maritima))、其同源物、任何其他合适的MutS或其中两种或多种的tt任意组合。tt

  已证明获自不同物种的MutS可对特定的错配或对不同的错配具有不同的亲tt和性。在一些实施方式中,可使用对不同错配具有不同亲和性的不同MutS的组合。tt

  在一些实施方式中,可使用使用一种或多种修复蛋白的酶复合物。修复蛋白tt的示例包括但不限于:用于错配识别的MutS、用于在目标链上导入缺口的MutHtt和用于介导MutH和MutS之间相互作用的MutL、其同源物或其任意组合。在一tt些实施方式中,错配结合蛋白复合物是MutHLS酶复合物。tt

  在一些实施方式中,滑动夹(sliding clamp)技术可用于富集无错误的双链寡tt核苷酸。在一些实施方式中,MutS或其同源物可与DNA夹蛋白(DNA clamp protein)tt相互作用。DNA夹蛋白的示例包括但不限于由dnaN基因编码的细菌滑动夹蛋白ttDnaN,其以同源二聚体的形式发挥作用。在一些实施方式中,MutS蛋白(或其同tt源物)与夹蛋白之间的相互作用可提高MutS在结合错配中的有效性。tt

  在一些实施方式中,可使用来自S1蛋白家族的酶(例如CELI,CELII或其同tt源物,如RESI,或其组合)去除含有错误的寡核苷酸。来自S1蛋白家族的酶可识tt别碱基错配、插入和缺失环。在一些实施方式中,通过仅有的一条或两条DNA链,tt这类酶可优先结合霍利迪连结体,之后剪切识别位点。在一些实施方式中,可以使tt用S1蛋白的热稳定等价物。tt

  在一些实施方式中,可使用结合错配碱基位点的小分子、化学或无机材料去tt除含有错误的寡核苷酸。在错配位点处,核苷酸碱基是超螺旋的且易于进行化学修tt饰反应。可在化学剪切方法中使用诸如高锰酸、羟胺、赖氨酸和/或五胺钌的材料tt来分别修饰错配的胸腺嘧啶和胞嘧啶。随后使用哌啶处理所得修饰的DNA以在脱tt碱基位点处引起剪切。在一些实施方式中,可使用二价盐监测剪切的特异性。tt

  在一些实施方式中,在下一步骤中,通过依次除去共有序列并随后连接成更tt长的多寡核苷酸构建体的方式混合经错误校正的寡核苷酸。tt

  在本发明的一些方面中,酶促消化共有序列去除步骤与连接步骤联用。本领tt域技术人员应理解,本发明的方法允许同时去除共有序列并连接成目标核酸构建体tt并无需酶促去除、基于珠的捕获和连接连续步骤。此外,本领域技术人员应理解,tt相对于标准基因组装方法,本发明的方法具有许多优势,例如:tt

  增加生产效率。使用标准的独立酶促去除共有序列,反应在设定的时间点tt后停止,其中未反应的底物或未消化的寡核苷酸仍然存在,作为进一步去除的tt对象。本领域技术人员应理解,由于连接反应产生了不是酶促去除底物的所需tt产物,所以去除和连接步骤的组合能够不可逆地驱动反应产生所需产物。tt

  成本节约:根据本发明的一些方面的方法是成本节约的,因为在去除共有tt序列和连接之间不再需要纯化步骤。由于删去了纯化步骤,本发明的各方面也tt不需要生物素标记的引物。相关的节约还有:收到非生物素化引物的订货时间tt比含生物素的引物短。tt

  时间效率:通过删去酶促共有序列去除和连接之间的纯化步骤,减少了基tt因合成所需的时间和步骤数目。tt

  容易地添加其他序列的机会,这与序列大小无关。由于用于除去不需要的tt序列的部分纯化步骤是基于大小,删去纯化步骤可除去对任何其他用于基因合tt成的待添加序列大小的限制。这可包括一步连接至载体,或添加共有的侧接序tt列。tt

  该方法允许在基因中使用限制性位点,其用于基因合成过程本身。在先前tt的方法中,不能使用这些限制性位点,因为切割位点会导致形成会在纯化步骤tt中被除去的小DNA碎片。使用这些限制性位点可允许进行递推(分级)基因tt合成以构建更长的核酸。tt

  本领域技术人员应理解,寡核苷酸组装后,组装产物(例如最终目标核酸和tt中间体核酸片段)可含有不需要的序列。错误可能由在寡核苷酸合成期间,或在寡tt核苷酸组装成较长的核酸期间引入的序列错误所致。在一些实施方式中,可将具有tt正确预定序列的核酸与其他核酸序列分离(在本文中也称作制备型体外克隆)。在tt一些实施方式中,可通过将正确序列与其他不正确序列选择性地分离来分离正确序tt列。例如,可将具有正确序列的核酸选择性地移动或转移至支持物的不同特征或另tt一块板。或者,可将具有不正确序列的核酸选择性地从包含感兴趣的核酸的特征中tt移除(参见例如PCT/US2007/011886,其通过引用全文纳入本文)。tt

  在一些实施方式中,在寡核苷酸加工和连接后,可通过克隆分离来分离组装tt构建体或组装的构建体的拷贝。可使用例如高通量测序来对组装构建体进行序列验tt证。在一些实施方式中,可使用对个体分子进行测序(如单一分子测序)或对目标tt核酸序列的扩增群的测序(如聚合酶克隆测序)来实施目标核酸序列的序列测定。tt可使用任何合适的测序方法,如通过杂交测序、通过连接测序或通过合成测序。tt

  本方面的一些方面涉及使用本文所述方法的基因合成平台。在一些实施方式tt中,基因合成平台可与下一代测序平台(例如通过杂交测序、通过合成测序或通过tt连接测序或任何其他合适的测序方法)联用。tt

  在一些实施方式中,组装方法可以包括数种平行和/或顺序反应步骤,其中多tt种不同核酸或寡核苷酸组被合成或固定、扩增并且合并以组装(如通过本文所述延tt伸或连接)生成更长核酸产物,从而用于进一步组装、克隆或其他应用(参见PCTtt申请PCT/US09/55267,其通过引用全文纳入本文)。tt

  寡核苷酸合成

  在一些实施方式中,本文提供的方法和设备使用固定在表面或基底上的寡核tt苷酸(如结合于支持物的寡核苷酸)。本文所用术语“支持物”和“基底”可互换tt使用,并且指聚合物(如核酸)在其上合成或固定的多孔或非多孔溶剂不溶性材料。tt本文使用的“多孔”指材料包含有基本一致直径(例如nm范围)的孔。多孔材料tt包括纸、合成过滤器等。在这种多孔材料中,反应可以在孔中进行。所述支持物能tt具有很多形状中的任何一种,例如销型、条、板、平盘、杆状、弯曲、圆柱形结构、tt颗粒(包含珠、纳米颗粒)等。所述支持物可具有不同宽度。所述支持物可以是亲tt水性的,或可以制成亲水性的,并且包含无机粉末(如二氧化硅、硫酸镁和氧化铝)、tt天然聚合材料(特别是纤维素材料和纤维素衍生材料,例如包含纤维的纸(如滤纸、tt色谱纸等))、合成或改性天然产生的聚合物(如硝酸纤维素、乙酸纤维素、聚(氯tt乙烯)、聚丙烯酰胺、交联的葡聚糖、琼脂糖、聚丙烯酸酯、聚乙烯、聚丙烯、聚tt(4-甲基丁烯)、聚苯乙烯、聚甲基丙烯酸酯、聚(对苯二甲酸乙二酯)、尼龙、聚(丁tt酸乙烯酯)、聚偏二氟乙烯(PVDF)膜、玻璃、可控孔度玻璃、磁性可控孔度玻璃、tt陶瓷、金属等),或者单独使用或与其他材料联用。在一些实施方式中,在阵列形tt式上合成寡核苷酸。例如,在常见支持物上原位合成单链寡核苷酸,其中各寡核苷tt酸在底物的单独或不连续特征(或点)上合成。在优选实施方式中,单链寡核苷酸tt结合在支持物或特征的表面上。本文所用术语“阵列”是指用于存储、路径选择、tt扩增和释放寡核苷酸或互补寡核苷酸用于进一步反应的离散特征的排列。在优选实tt施方式中,所述支持物或阵列是可寻址的:所述支持物包含在支持物上特定预定位tt置(即“地址”)上的两个或更多个离散的可寻址特征。因此,阵列上的各寡核苷tt酸分子位于支持物上已知并确定的位置。各寡核苷酸序列能从支持物上其位点处测tt定。tt

  在一些实施方式中,寡核苷酸在表面或阵列的离散特征上连接、点样、固定、tt表面结合、支持或合成。寡核苷酸可以共价连接到表面或在表面上沉积。阵列可以tt构建、定制购买或购自商业销售商(如安捷伦公司(Agilent)、昂飞公司tttttt(Affymetrix)、尼姆布拉齐(Nimblegen)公司)。各种构建方法为本领域熟知,如tt无掩膜阵列合成器、利用掩膜的光定向方法、流动通道方法、点样法等。在一些实tt施方式中,可以使用无掩膜阵列合成器(MAS)在固体支持物上合成构建和/或选tt择寡核苷酸。无掩膜阵列合成器描述于例如PCT申请号WO 99/42813和相应的美tt国专利号6,375,903中。其他示例为已知的无掩膜设备,其能制造定制的DNA微tt阵列,其中所述阵列中的各特征中有所需序列的单链DNA分子。其他合成构建和tt/或选择寡核苷酸的方法包含例如利用掩模的光导向的方法、流动通道方法、点样tt法、销型方法和利用多个支持物的方法。用于合成寡核苷酸的利用掩模的光导向的tt方法(例如,VLSIPSTM方法)描述于美国专利号5,143,854、5,510,270和5,527,681tt中。这些方法涉及活化固体支持物上的预定区域,并随后使支持物接触预选择的单tt体溶液。选定区域能用通过掩模的光源辐射来活化,方法大多按照集成电路制造中tt使用的光刻法技术。支持物的其他区域保持失活,因为照射被掩模封闭并且其仍保tt持化学保护。因此,光模式定义支持物上的哪个区域与给定的单体反应。通过重复tt活化不同预定区域组并使不同单体溶液接触支持物,在支持物上产生聚合物的不同tt阵列。能任选使用其他步骤,例如从支持物上洗涤未反应的单体溶液。其他可应用tt方法包括机械技术如描述于美国专利号5,384,261中的那些。可应用于在单个支持tt物上合成构建和/或选择寡核苷酸的其他方法描述于例如美国专利号5,384,261中。tt例如,可通过(1)在预定区域上确定的通道中流动,或者(2)在预定区域上“点tt样”的方式将试剂递送到支持物上。也可以使用其他方法以及点样和流动的组合。tt在各情况下,在将单体溶液递送到多个反应位点时,将支持物上的某些活化区域与tt其他区域机械分开。流动通道方法包括,例如微流体系统以控制在固体支持物上寡tt核苷酸的合成。例如,可以通过在固体支持物的表面上形成流动通道的方式在固体tt支持物的选定区域上合成不同的聚合物序列,其中合适的试剂流过该流动通道或者tt位于该流动通道中。用于在固体支持物上制备寡核苷酸的点样法涉及通过直接置于tt选定区域来以相对少量递送反应物。在一些步骤中,能用溶液喷洒或覆盖整个支持tt物表面,前提是这样做更有效。可以通过从一个区域到另一个区域移动的分配器逐tt滴加入精确测量的单体溶液等分样品。用于在固体支持物上合成寡核苷酸的销型方tt法描述于例如美国专利号5,288,514中。销型方法利用有多个销型或其他延伸的支tt持物。该销型各自同时插入到浅盘中的单个试剂容器中。96销型的阵列通常利用tt96容器的浅盘,例如96孔微量滴定皿。各个浅盘填充有在单个销型上特定化学反tttttt应中偶联的特定试剂。因此,所述浅盘会经常包含不同试剂。由于已对化学反应进tt行优化从而使各反应能在较相似的反应条件组下进行,因此可同时进行多个化学偶tt联的步骤。tt

  在另一个实施方式中,可在多个支持物上合成定多个寡核苷酸。一个示例是tt描述于例如美国专利号5,770,358、5,639,603和5,541,061的基于珠的合成方法。为tt了在珠上合成分子(如寡核苷酸),将大量的珠悬浮于容器中的合适运载体(如水)tt中。提供了带有可选间隔分子的珠,所述分子有其复合的活性位点,可选为保护基tt团。在合成的各步骤中,分开所述珠以使其偶联至多种容器中。新生寡核苷酸链脱tt保护后,不同单体溶液加入到各容器中,从而在给定容器内的所有珠上发生相同的tt核苷酸加成反应。随后用过量试剂洗涤珠,收集入单个容器中,混合并重新分布到tt另外的多个容器以准备下一轮合成。应注意到由于在开始利用的大量珠,在容器内tt同样会随机分布大量珠,在多轮随机加入碱基后,各自在其表面具有合成的独特寡tt核苷酸序列。可以用序列来对单个珠加标签,该序列对其上的双链寡核苷酸是唯一tt的,从而允许在使用过程中进行鉴定。tt

  预合成的寡核苷酸和/或多核苷酸序列可以连接到支持物上或使用下列方法原tt位合成:光导向方法、流动通道和点样法、喷墨法、销型方法和珠基方法,示于下tt列参考文献中:McGall等,(1996)Proc.Natl.Acad.Sci.U.S.A.93:13555;Synthetic ttDNA Arrays In Genetic Engineering(《在基因工程操作中合成DNA阵列》),卷tt20:111,普莱南出版社(Plenum Press)(1998);Duggan等,(1999)Nat.Genet.S21:10;ttMicroarrays:Making Them and Using Them In Microarray Bioinformatics(《微阵列:tt在微阵列生物信息学中制作和使用》),剑桥大学出版社(Cambridge UniversityttPress),2003;美国专利申请公开号2003/0068633和2002/0081582;美国专利号tt6,833,450、6,830,890、6,824,866、6,800,439、6,375,903和5,700,637;和PCT公开tt号WO 04/031399、WO 04/031351、WO 04/029586、WO 03/100012、WO 03/066212、ttWO 03/065038、WO 03/064699、WO 03/064027、WO 03/064026、WO 03/046223、ttWO 03/040410和WO 02/24597;上述公开内容通过引用全文纳入本文以用于所有tt目的。在一些实施方式中,预合成的寡核苷酸连接到支持物上或使用点样方法合成,tt其中通过从一个区域到另一个区域移动的分配器(如喷墨)逐滴加入单体溶液。在tt一些实施方式中,使用例如机械波驱动的分配器在支持物上点样寡核苷酸。tt

  扩增

  在一些实施方式中,可以使用合适的引物对来扩增寡核苷酸,引物对中一条tt引物对应于寡核苷酸的每个末端(例如,一条与寡核苷酸的3'末端互补而一条与寡tt核苷酸的5'末端相同)。在一些实施方式中,寡核苷酸可以被设计成含有由5'扩增tt序列(例如,5'通用序列或5'共有扩增序列)和3'扩增序列(例如,3'通用序列或tt5'共有扩增序列)侧接的中心或内部组装序列(对应于目标序列,设计为纳入终产tt物)。tt

  在一些实施方式中,合成寡核苷酸可以包含由5'和3'扩增序列侧接的中心组装tt序列。中心组装序列被设计纳入到组装的核酸中。侧接序列被设计用于扩增并且不tt旨在被纳入到组装的核酸中。可以使用侧接扩增序列作为引物序列来扩增多个有相tt同扩增序列但是不同中心组装序列的不同组装寡核苷酸。在一些实施方式中,在扩tt增后去除侧接序列来得到仅含有组装序列的寡核苷酸。tt

  可以使用对应于侧接扩增序列的扩增引物(例如,10-50个核苷酸长,15-45tt个核苷酸长,约25个核苷酸长等)来扩增寡核苷酸(例如,一条引物可与3'扩增tt序列互补而一条引物具有与5'扩增序列相同的序列)。在一些实施方式中,多个具tt有不同中心组装序列的不同的寡核苷酸(例如,约5、10、50、100或更多个)可tt以具有相同的5'扩增序列和/或相同的3'扩增序列。这些寡核苷酸都可以在相同的tt反应中使用相同的扩增引物来扩增。然后可以使用任意合适的技术从经扩增的寡核tt苷酸中去除扩增序列来产生仅含有组装序列的寡核苷酸。在一些实施方式中,通过tt本文中较详细描述的限制性酶去除扩增序列。tt

  在一些实施方式中,可以扩增寡核苷酸,同时其仍然与支持物连接。在一些tt实施方式中,可以在扩增之前从支持物上移去或切下寡核苷酸。tt

  在一些实施方式中,该方法包含在链延伸反应中使用第一组多个单链寡核苷tt酸作为模板合成多个寡核苷酸或多核苷酸。如前所述,可以首先在表面的离散特征tt组上合成寡核苷酸,或可将寡核苷酸置于支持物的多个特征上。在一些实施方式中,tt寡核苷酸与支持物共价连接。在一些实施方式中,第一组多个寡核苷酸固定在固体tt表面上。在一些实施方式中,固体表面的各特征包含具有不同预定序列的高密度寡tt核苷酸(如每个特征约106-108个分子)。支持物可以包含至少100、至少1,000、tt至少104、至少105、至少106、至少107、至少108个特征。在一些实施方式中,tt在扩增后,可在溶液中洗脱双链寡核苷酸和/或对其进行错误减少和/或对其进行组tt装以形成较长的核酸构建体。tt

  错误减少

  在一些实施方式中,在进行加工以生成粘性末端前,对各片段进行组装和保tt真度优化以去除含有错误的核酸(例如使用本文所述的一种或多种组装后保真度优tt化技术)。序列错误可能包含一个或多个核苷酸缺失、插入、取代(例如,颠换或tt转换)、倒位、重复或其两种或更多种的任意组合。在寡核苷酸合成期间可能产生tt寡核苷酸错误。不同的合成技术可能易于出现不同的错误分布和频率。在一些实施tt方式中,根据使用的合成方案,错误率可能在每个碱基1/10-1/200个错误之间变化。tt然而,在一些实施方式中,可以实现较低的错误率。另外,错误的类型可能取决于tt使用的合成技术。例如,与基于柱的合成技术相比,基于微阵列的寡核苷酸合成可tt能产生相对更多的缺失。tt

  本发明的一些方面涉及多核苷酸组装方法,其中对合成的寡核苷酸进行设计tt并用于将多核苷酸组装成为较长的多核苷酸构建体。在酶促扩增或链延伸反应期tt间,序列中的错误如实地得到复制。结果是,通过该方法合成的多核苷酸群体含有tt无错误序列和易错序列。在一些实施方式中,由于寡核苷酸合成期间导入的错误,tt合成的寡核苷酸可含有不正确序列,所以去除在组装或延伸期间整合了一种或多种tt含有错误的寡核苷酸的多核苷酸是有用的。在一些实施方式中,可对一种或多种组tt装的多核苷酸进行测序以测定其是否包含预测定的序列。这个方法能鉴定有正确序tt列的片段。在其他实施方式中,可以使用其他技术以除去包含错误的核酸片段。这tt类核酸片段可以是初始合成的寡核苷酸或者组装的核酸聚合物。应理解,含有错误tt的核酸可以是在两条链上都含有错误的同源双链体(即两条链上不正确的互补核苷tt酸、缺失或添加),因为组装方法可涉及一轮或多轮聚合酶延伸(例如在组装期间tt或组装后以扩增组装的产物)。聚合酶延伸期间,含有错误的输入核酸可用作模板tt从而生成包含互补错误的互补链。在某些实施方式中,双链核酸片段或双链体的制tt备物可能含有核酸混合物,该核酸混合物包含具有正确预定序列的核酸以及含有一tt种或多种组装期间整合的序列错误的核酸。术语“双链体”指至少部分双链的核酸tt分子。“稳定的双链体”指在给定的杂交条件组下与互补序列维持杂交状态的可能tt性相对较大的双链体。在一个示例性实施方式中,稳定的双链体指不含有碱基对错tt配、插入或缺失的双链体。“不稳定的双链体”指在给定的杂交条件组(如严谨熔tt融)下与互补序列维持杂交状态的可能性较小的双链体。在一个示例性实施方式中,tt不稳定的双链体指含有至少一个碱基对错配、插入或缺失的双链体。本文所用术语tttttt“严谨性”指温度、离子强度和是否存在其他化合物(如有机溶剂)等的条件,核tt酸杂交在该条件下进行。在杂交过程期间,杂交严谨性随着温度和/或溶液化学特tt性(如杂交溶液中盐和/或甲酰胺的量)而增加。在“高严谨性”条件下,核酸碱tt基配对只发生在具有高频率互补碱基序列的核酸片段之间。可对严谨性条件进行选tt择使其比限定的离子强度和pH下给定的多核苷酸双链体的热解链点(Tm)低约tt5℃。互补多核苷酸链的长度和GC含量决定了双链体的Tm,并因此决定了获得所tt需杂交特异性所必需的杂交条件。Tm是(在确定离子强度和pH的条件下)50%tt的多核苷酸序列与完全匹配的互补链杂交时的温度。在某些情况下,可能需要将杂tt交条件的严谨性提高至约等于特定双链体的Tm。合适的严谨性条件是本领域技术tt人员已知的或者可以由本领域技术人员通过实验来确定。参见例如Current ttProtocols in Molecular Biology(《新编分子生物学实验指南》),纽约州威立公司tt(John Wiley&Sons)(1989),6.3.1-12.3.6;Sambrook等,1989,Molecular Cloning,A ttLaboratory Manual(《分子克隆:实验室手册》),纽约州冷泉港出版社(Cold Spring ttHarbor Press);Agrawal编,Methods in Molecular Biology(《分子生物学方法》),tt第20卷;Tijssen(1993)Laboratory Techniques in biochemistry and molecular ttbiology-hybridization with nucleic acid probes(《生物化学和分子生物学实验技tt术——使用核酸探针进行杂交》),例如第1部分第2章“Overview of principles of tthybridization and the strategy of nucleic acid probe assays(杂交原理概述和核酸探针tt试验策略)”,纽约爱斯韦尔公司(Elsevier)。tt

  在一些实施方式中,可使用涉及使双链核酸变性并再退火的技术除去序列错tt误。在一些实施方式中,如果含有各单个错误的核酸以比在相同位置具有正确序列tt的核酸低的频率存在于核酸制备物中,则含有互补错误的单链核酸可能无法再退火tt并相互结合。相反,含有错误的单链可与无错误的互补链或者含有一个或多个不同tt错误或在不同位置含有错误的互补链发生再退火。结果是,最终含有错误的链在再tt退火的反应产物中以异源双链分子的形式存在。无错误的核酸链可与含有错误的链tt或者其他无错误的链发生再退火。再退火的无错误的链在再退火样品中形成同源双tt链体。因此,通过从再退火的核酸片段制备物中去除异源双链体分子,可减少含有tt错误的核酸的量或频率。tt

  因此通过被理解为改组的过程形成异源双链体,其中来自不同群体的核酸链tt可彼此杂交从而形成完全匹配和含有错配的双链体。用于去除异源双链体分子的合tttttt适的方法包括色谱、电泳、优先结合在两条链之间具有序列错配的双链DNA的异tt源双链体分子的选择性结合。术语“错配”或“碱基对错配”表示根据沃森和克里tt克碱基配对规则通常不会形成核酸的碱基对组合。例如,对于DNA中常见的碱基tt(即腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶),碱基对错配指DNA中常见的A-T和ttG-C配对以外的那些碱基组合。如本文中所述,错配可以表示为:例如C/C表示tt胞嘧啶残基与另一个胞嘧啶残基相对,这不同于其正确配对的配体鸟嘌呤。tt

  在一些实施方式中,可如本文中更详细描述的那样选择或筛选寡核苷酸制备tt物以除去含有错误的分子。在一些实施方式中,可使用本文所述的错配结合剂对寡tt核苷酸进行错误校正。tt

  在一个方面,本发明涉及在固体支持物上生产高保真多核苷酸的方法。合成tt的多核苷酸长度为至少约1、2、3、4、5、8、10、15、20、25、30、40、50、75、tt或100千碱基(kb),或1兆碱基(mb),或更长。在示例性实施方式中,合成的多tt核苷酸的组合物包含至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、tt15%、20%、25%、50%、60%、70%、80%、90%、95%或更多的无错误拷贝(如tt具有非衍生自预定序列的序列)。无错误拷贝的百分比是基于与旨在具有正确(如tt预定或预测的)序列的组合物中的多核苷酸拷贝总数相比,组合物中无错误拷贝的tt数目。tt

  本发明的一些方面涉及用于高保真多核苷酸组装的寡核苷酸设计。本发明的tt各方面可用于提高核酸组装过程的生产速率和/或减少用于生成正确组装的核酸的tt步骤数目或试剂量。在某些实施方式中,本发明的各方面可用于自动化核酸组装以tt减少各正确核酸组装所需的时间、步骤数目、试剂量和其他因素。因此,本发明的tt这些和其他方面可用于降低一个或多个核酸组装过程的成本和时间。tt

  单链突出端

  在本发明的一些方面中,组装的核酸片段被设计为具有重叠的互补序列。在tt一些实施方式中,核酸片段是具有3'和/或5'单链突出端的双链DNA片段。这些突tt出端可以是能够与不同核酸片段上的互补粘性末端发生退火的粘性末端。按照本发tt明的各方面,两个核酸片段上存在的互补序列(和特定互补粘性末端)促进了它们tt的共价组装。在一些实施方式中,能够组装具有不同重叠互补单链粘性末端的多个tt核酸片段并且通过在各片段上的粘性末端的相同性确定它们在组装的核酸产物中tt的顺序。例如,可对核酸片段进行设计使得第一核酸具有与载体的第一粘性末端互tttttt补的第一粘性末端以及与第二核酸的第一粘性末端互补的第二粘性末端。第二核酸tt的第二粘性末端可以与第三核酸的第一粘性末端互补。第三核酸的第二粘性末端可tt以与第四核酸的第一粘性末端互补。依此类推直至与倒数第二个核酸上的第二粘性tt末端互补的第一粘性末端的最后一个核酸。tt

  在某些实施方式中,将相邻核酸片段之间的重叠互补区域设计(或选择)为tt具有足够的差异来促进(例如,热力学上有利于)唯一排比的核酸片段(例如,选tt择或设计的片段排比)的组装。应理解可以使用不同长度的重叠区域。在一些实施tt方式中,当组装较大数量的核酸片段时,可以使用较长的粘性末端。较长的粘性末tt端可以为设计或选择充分区别的序列提供更多的灵活性,从而区分正确的粘性末端tt退火(例如,涉及经设计退火互相结合的粘性末端)与不正确的粘性末端退火(例tt如,在非互补粘性末端之间)。tt

  在一些实施方式中,可以设计或选择两对或更多对不同核酸片段之间的互补tt粘性末端使其具有相同或相似的序列来促进含有相对随机排列(和/或数量)的具tt有相似或相同粘性末端的片段的产物的组装。这可以用于产生具有某些内部序列区tt域的不同序列排列和/或不同拷贝数量的核酸产物的库。tt

  在一些实施方式中,最后的核酸的第二粘性末端与载体的第二粘性末端互补。tt按照本发明的各方面,可以使用该方法来产生含有以预定线性顺序(例如,第一、tt第二、第三、第四……最后)组装的核酸片段的载体。在一些实施方式中,可对两tt个末端核酸片段(例如组装的产物各端处的末端片段)中的每个片段进行设计以使tt其具有与载体上(例如线性化载体上)的粘性末端互补的粘性末端。这些粘性末端tt可与能够与线性化载体上相同互补末端序列发生退火的粘性末端相同。然而,在一tt些实施方式中,末端片段上的粘性末端是不同的且载体含有两个不同的粘性末端,tt其各自位于线性化载体的一端,各自与末端片段粘性末端之一互补。因此,该载体tt可以是具有两个粘性末端的线性化质粒,各粘性末端与组装的核酸片段的一端互tt补。tt

  本发明的一些方面包含具有单链突出端的双链核酸。可以使用任意合适的技tt术来产生突出端。在一些实施方式中,可以用合适的限制性酶来消化双链核酸片段tt(例如,在多重组装中组装的片段)来产生末端的单链突出端。在一些实施方式中,tt可以用相同的酶消化被设计为在组装的产物中互相邻接的片段来暴露互补突出端。tt在一些实施方式中,可以使用IIS型限制性酶产生突出端。IIS型限制性酶是在称tttttt为识别位点的位点上与双链核酸结合的酶,并在识别位点外侧进行单个双链切割。tt称为剪切位点的双链切割处通常位于距离识别位点0-20个碱基处。识别位点长度tt通常是约4-7bp。所有的IIS型限制性酶都表现出至少部分的不对称识别。不对称tt识别指核酸的每条链的5'3'识别序列是不同的。酶活性也显示极性,表明剪切位点tt仅位于识别位点一侧。因此,通常每个识别位点仅对应于一个双链切割。剪切通常tt在5'或3'末端产生1-5个核苷酸的单链突出端,但是一些酶产生钝末端。两种切割tt都用于本发明的内容中,虽然在一些情况下产生单链突出端。迄今为止,已经鉴定tt了大约80种IIS型酶。示例包括但不限于BstF5I、BtsC I、BsrD I、Bts I、Alw I、ttBcc I、BsmA I、Ear I、Mly I(钝末端)、Ple I、Bmr I、Bsa I、BsmB I、Fau I、ttMnl I、Sap I、Bbs I、BciV I、Hph I、Mbo II、BfuA I、BspCN I、BspM I、SfaN I、ttHga I、BseR I、Bbv I、Eci I、Fok I、BceA I、BsmF I、BtgZ I、BpuE I、Bsg I、ttMme I、BseG I、Bse3D I、BseM I、AcIW I、Alw26I、Bst6I、BstMA I、Eam1104 ttI、Ksp632I、Pps I、Sch I(钝末端)、Bfi I、Bso31I、BspTN I、Eco31I、Esp3I、ttSmu I、Bfu I、Bpi I、BpuA I、BstV2I、AsuHP I、Acc36I、Lwe I、Aar I、BseM II、ttTspDT I、TspGW I、BseX I、BstV1I、Eco57I、Eco57M I、Gsu I和Bcg I。这类tt酶和关于它们的识别位点和剪切位点的信息可从供应商如新英格兰生物实验室公tt司(New England Biolabs,Inc.,美国马萨诸塞州伊普斯威奇)处得到。tt

  在一些实施方式中,可以使用商品化或工程改造的限制性酶。在一些实施方tt式中,可对IIS型限制性酶进行设计和工程改造以产生更长的突出端。对限制性酶tt进行设计和工程改造以产生更长的单链突出端能够使得更多的寡核苷酸结合在一tt起以形成更长的核酸构建体。例如,可对产生4个核苷酸单链突出端的BsaI进行tt工程改造以产生5个或6个或更长的单链突出端。通过使用该工程改造的BsaI增tt加单链突出端长度,能够增加可结合的17个核酸或寡核苷酸的理论限值。tt

  在一些实施方式中,设计用于核酸组装的多个核酸片段中的每个都可以在各tt末端具有IIS型限制性位点。可以导向IIS型限制性位点使得剪切位点与识别序列tt内部相关。结果,酶消化暴露了内部序列(例如,内部序列中的突出端)并且从末tt端去除识别序列。因此,相同的IIS型位点可用于所有经制备用于组装的核酸片段tt的两个末端和/或可用于线性化合适的载体。然而,也可以使用不同的IIS型位点。tt经设计在组装的产物中邻接的两个片段各自可以包含相同的重叠末端序列和适当tt位置的侧接IIS型位点以在限制性酶消化后暴露重叠序列内的互补突出端。因此,tttttt可以用不同的互补突出端来产生多个核酸片段。可以对核酸片段的每个末端上的限tt制性位点进行定位,使得用合适的IIS型酶进行的消化去除了限制性位点并且暴露tt了与核酸片段上的单链区域互补的单链区域,该核酸片段被设计与组装的核酸产物tt相邻。在一些实施方式中,可对两个末端核酸片段中每一个的末端进行设计以使其tt具有与线性化载体核酸的单链突出端互补的单链突出端(例如在使用合适的限制性tt酶进行消化后)。因此,可将所得的核酸片段和载体直接转化至宿主细胞内。或者,tt可将核酸片段和载体进行孵育以在转化进宿主细胞前促进互补序列的杂交和退火。tt应理解,可使用本文所述任意技术或者产生与末端核酸片段之一的一端互补的单链tt突出端的任意其他适当技术来制备载体。tt

  使用IIS型或位点特异性限制性酶的DNA酶消化通常产生4至6个核苷酸的tt突出端。这些短粘性末端足以连接两个含有互补末端的核酸片段。然而,当多个核tt酸片段连接在一起时,优选较长的互补粘性末端以促进组装并确保特异性。例如,tt粘性末端可以足够长以具有足够不同的序列以防止或减少相似粘性末端之间的错tt配。然而,优选其长度不会长到稳定相似粘性序列之间的错配。在一些实施方式中,tt可以使用约9至约15个碱基的长度。然而,对于用于产生粘性突出端的区域,可tt以选择任意合适的长度。特异性的重要性可以取决于同时组装的不同片段的数量。tt另外,为避免使错配的区域稳定所需要的合适的长度可取决于用于退火不同粘性末tt端的条件。tt

  基于连接酶的组装

  基于连接酶的组装技术可以涉及一种或多种合适的连接酶,所述连接酶能催tt化邻近3'和5'核酸末端的共价连接(如核酸的5'磷酸和3'羟基在互补模板核酸上退tt火从而使得3'末端紧邻5'末端)。因此,连接酶可以催化第一核酸的5'磷酸和第二tt核酸的3'羟基之间的连接反应,前提是第一和第二核酸在模板核酸上彼此相邻发生tt退火,连接酶可以获自重组或天然来源。连接酶可以是热稳定的连接酶。在一些实tt施方式中,可以使用来自嗜热微生物的热稳定连接酶。热稳定DNA连接酶的示例tt包括但不限于:Tth DNA连接酶(来自嗜热栖热菌(Thermus thermophilus),可购tt自例如友基公司(Eurogentec)和基因工艺公司(GeneCraft))、Pfu DNA连接酶(来tt自激烈火球菌(Pyrococcus furiosus)的超嗜热连接酶)、Taq连接酶(来自水生栖tt热菌(Thermus aquaticus)),任何其他合适的热稳定连接酶,或其任意组合。在一tt些实施方式中,可以使用一种或多种较低温度的连接酶(如T4DNA连接酶)。较tttttt低温度的连接酶可以用于在较高温度下可能不稳定的更短的突出端(如约3、约4、tt约5或约6个碱基的突出端)。tt

  在一些实施方式中,可对连接酶进行设计和工程改造以使其具有更大程度的tt特异性以最小化形成的不需要的连接产物。在一些实施方式中,连接酶可与蛋白联tt用或者可与能够促进连接酶与核酸分子之间相互作用和/或增加连接特异性的蛋白tt融合。tt

  非酶技术能用于连接核酸。例如,一个或多个核酸的5'末端(如5'磷酸基团)tt和3'末端(如3'羟基)可以不用酶(如不使用连接酶)而共价连接在一起。在一些tt实施方式中,非酶技术可以提供超过酶连接的某些优势。例如,非酶技术可以对核tt酸底物中非天然核苷酸类似物具有高耐受性,可以用于连接短的核酸底物,可以用tt于连接RNA底物,和/或对某些自动(如高通量)应用而言更便宜和/或更合适。tt

  因此,化学连接可以用于形成第一核酸末端的5'末端和第二核酸末端的3'末端的共tt价连接,其中所述第一和第二核酸末端可以是单个核酸末端或单独的核酸末端。一tt方面,化学连接可以涉及具有修饰的末端(例如修饰的5'和/或3'末端)的至少一tt个核酸底物,该修饰的末端包括帮助或促进连接形成的一种或多种化学反应部分。tt在一些实施方式中,当使得一个或多个核酸末端紧密相邻时(例如由于互补核酸序tt列之间的退火使得末端结合在一起时),发生化学连接。因此,互补3'或5'突出端tt(如由双链核酸的限制性酶剪切生成的突出端)之间或者引起3'末端与5'末端紧密tt相邻的任意互补核酸组合之间(如当核酸与互补模板核酸发色退火时,3'和5'末端tt彼此相邻)的退火可以促进模板定向的化学连接。化学反应的示例可以包含但不限tt于缩合、还原、和/或光-化学连接反应。应理解在一些实施方式中,化学连接可用tt于生成天然产生的磷酸二酯核苷酸间连接、非天然产生的磷酰胺焦磷酸核苷酸间连tt接和/或其他非天然产生的核苷酸间连接。tt

  同时酶促去除共有寡核苷酸序列并将经加工的寡核苷酸连接成更长的构建体

  图2显示了根据本发明的一个实施方式用于组装核酸的方法。在一些实施方tt式中,该方法包括同时酶促去除共有寡核苷酸序列并将经加工的寡核苷酸序列连接tt成更长的构建体。在一些实施方式中,如本文所述通过PCR扩增寡核苷酸并对其tt进行错误校正。通过合适的限制性内切酶(40)对由共有启动(扩增)序列(20)和tt构建体特异性载荷(payload)或内部序列区域(30)组成的经扩增的寡核苷酸(10)tt进行加工。在一些实施方式中,第一和最后的寡核苷酸含有用于扩增目标构建体的tttttt独特的启动序列(25)。限制性内切酶催化所有寡核苷酸(50)共有的末端共有区域tt(本文中也称作扩增区域或引物识别区域)的剪切,留下具有末端单链DNA序列tt(60)的内部区域(本文中也称作游离载荷(free payload))。在一些实施方式中,tt该限制性内切酶是IIS型限制性内切酶。对这些单链序列进行设计以指导一个寡核tt苷酸与另一个的特异性相互作用,使得多个寡核苷酸线性排列成预定序列(70)。tt因此,末端单链DNA序列可将寡核苷酸的适当相互作用指导为正确的顺序,从而tt连接酶(80)催化单个寡核苷酸的连接,生成最后的目标核酸构建体(90)或中间tt核酸构建体。tt

  本领域技术人员应理解,如果初始的共有序列向后连接在一起(例如使用与tt(60)互补的末端序列的(50)),则限制性内切酶的存在可确保能够再次对其进行tt切割以生成游离末端(60)。然而,由于限制性内切酶的选择,适当连接的连接部tt(例如1’和2’之间)不会被识别为限制性位点且不会是解开的。天然状态下反应tt应朝所需产物(90)的方向进行。tt

  在一些实施方式中,对于一种识别用于去除共有序列的限制性位点的方法的tt变体现在也可以是待合成基因的一部分。该约束性去除允许基因合成方法的递推tt(分级)应用以构建较长的核酸序列(如图4所示)。先前的方法中,在以独立的tt步骤进行去除和连接时,由于在去除和连接步骤之间必须有部分基于大小选择的纯tt化步骤,该设计是不被允许的。在这类方法中,纯化过程中可能丢失所需目标序列tt的切割碎片,导致无法构建所需目标序列。在一些实施方式中,通过同时使用本发tt明的去除和连接步骤,可以一致地切割那些切割序列并进行重新连接,使得一些感tt兴趣的目标序列得以存在。在一些实施方式中,所需序列的量取决于对限制性酶和tt连接酶的相对活性的调节。tt

  如图4所示,可由寡核苷酸组(310)和(311)组装基因合成碎片(390)和tt(391)。可对寡核苷酸组进行设计使其具有匹配的限制性内切酶位点(340),从而能tt够使用相同的同时消化和连接步骤连接基因合成碎片(390)和(391)(随后进行扩tt增)。在一些实施方式中,可对第二轮进行设计使其具有使用第二限制性酶的限制tt性内切酶位点(340)。然而,由于在该方法中使用多种酶的复杂性,可能无法进行tt上述操作。此外,在不同时进行消化和连接的情况下,使用两种限制性酶会导致不tt允许目标序列具有两个限制性酶位点,这将进一步约束能够被合成的基因。tt

  仍然根据图4,可使用引物(325)扩增核酸片段(390),并可使用引物(326)tt扩增核酸片段(391)。随后将核酸片段混合在一起并以类似于先前合成步骤的方式tt进行加工以生成合并的核酸片段(392),其中限制性位点(340)以与先前轮次中的tt位点(350)类似的方式发挥作用。可使用来自(325)的5’引物和来自(326)的3’tt引物扩增合并的目标序列(392)。tt

  在一些实施方式中,可根据本文所公开的方法使用分级组装策略。本领域技tt术人员应理解,本方法可规模化至多种核酸片段,使得随后轮次中的核酸片段数目tt能够与第一轮中的核酸片段数目类似。分级组装方法可以是几何的,从而在较少轮tt次中构建非常大的目标序列。例如,可由池(310)或(311)之一构建1000碱基(1ttkbp)的目标序列。第二轮的类似于(390)或(391)的10个核酸片段会形成10kbptt碱基的目标核酸序列。使用10kbp核酸序列的第三轮会形成100kbp的目标核酸序tt列,其来源于初始的100源池。tt

  在一些实施方式中,可在单独的池中进行多个组装反应。随后可混合来自组tt装反应的组装构建体以形成更长的核酸序列。在一些实施方式中,可使用限制性内tt切酶进行分级组装以形成粘性末端,该粘性末端可以所需顺序结合在一起。可设计tt并合成构建寡核苷酸以使其含有识别和剪切位点,用于使一种或多种限制性内切酶tt在位点处促进特定顺序的连接。在一些实施方式中,可将一种或多种IIS型内切酶tt识别位点整合至构建寡核苷酸的末端以允许IIS型限制性内切酶进行剪切。可通过tt互补粘性末端的杂交确定连接的顺序。tt

  在一些实施方式中,第一寡核苷酸池包含经设计在其3’端具有额外的限制性tt酶识别位点的3’端寡核苷酸且第二寡核苷酸池包含经设计在其5’端具有额外的限tt制性酶识别位点的5’端寡核苷酸。在一些实施方式中,限制性酶是相同的。在各tt池中进行寡核苷酸组装后,可根据本文所述方法使用限制性内切酶和连接酶处理两tt种亚组装构建体。tt

  本领域技术人员应理解,可通过本发明的各方面显著(几何地)提高合成的tt可用组装空间。先前,为生成两倍序列数目(2n)的构建体,需要使寡核苷酸数目tt翻倍。例如,为生成构建体(390),需要使构建体(310)的数目翻倍,因此需要使tt相容的单链末端(360)的数目翻倍。使用如图4所示的方法,用于(310)和(311)tt的连接部仅需与连接部(340)相容,从而确保大小翻倍的核酸的组装过程中仅使tt用一个额外的连接部。因此,如果寡核苷酸(310)和(311)具有干扰或不相容的tttttt末端,仍可通过本文所述方法(消化(340)和连接)将其连接在一起以制备目标tt核酸(392),而仅将寡核苷酸池(310)和(311)混合在一起是无法实现连接的。tt

  图3显示了一种变体形式,其中同时进行寡核苷酸加工和组装成目标构建体tt并同时进入质粒。质粒pG9-1(SEQ ID NO.1)的详细信息如图5所示。该质粒含tt有允许限制性内切酶(在该示例中是BsaI)在两个位点处切割质粒的限制性内切tt酶识别位点(带下划线的文本,图5),得到限定的单链序列(图5–反向文本)。tt根据图3,质粒(100)(例如pG9-1)被导入包含寡核苷酸(110)混合物的池中,tt该寡核苷酸(110)已如本文所述进行扩增和错误校正。在一些实施方式中,这些tt寡核苷酸序列(110)可具有被特定的限制性内切酶(140)识别的共有序列(120)。tt在一些实施方式中,质粒(130)可具有被相同限制性内切酶(140)识别的序列。tt限制性内切酶(140)对这些序列的作用导致从寡核苷酸((310),(311))和质粒tt(150)中去除共有序列,暴露单链DNA序列(160)。在一些实施方式中,所述限制tt性酶可以是IIS型限制性酶。在一些实施方式中,对所述单链序列进行设计以指导tt一个寡核苷酸与另一个的特定相互作用,使得多个寡核苷酸排列成限定的序列并使tt该排列的寡核苷酸序列(170)进入质粒(100)。在一些实施方式中,连接酶(180)tt催化单个寡核苷酸的共价连接。终产物是含有来源于连接寡核苷酸(190)的特定tt构建体的质粒(例如pG9-1)。随后可将该质粒(190)转化进细菌并进行测序验证。tt

  本发明的各方面涉及根据本发明的方法对组装的构建体进行测序验证。构建tt体的测序验证如图6所示。在该方法中,可如图3所示产生多个构建体(200,C1tt至C4)并将其转化至细菌中。可使用适当的用于选择的抗生素抗性在固体生长平tt板上选择含有质粒DNA的细菌转化子。生长后,可挑取单克隆并置于池中,各构tt建体平板(220)取一个,生成构建体池,各池含有各构建体的一个拷贝。在一些tt实施方式中,池的数量可取决于待测序以鉴定具有完美序列的构建体的单个构建体tt的数量。如图6所示,生成了4个构建体的4个池,允许分析各构建体的4个成员。tt随后可从收集的材料(230)中制备质粒DNA。随后可对各质粒DNA分子池进行tt准备以进行测序。该准备可使用多种方法之一,该方法导致DNA断裂成小片段并tt使用测序(例如下一代高通量测序)所需的共有序列进行连接。这些共有序列中含tt有短的DNA碎片,所述DNA碎片对生成的4个池中的每个都是独特的。这些独tt特的DNA碎片可用于鉴定各测序的构建体是来源于哪个池。随后可通过回到初始tttttt的细菌生长平板并再次生长相应的含有具有所需构建体的质粒的克隆来恢复具有tt正确序列的构建体。tt

  载体和宿主细胞

  可使用任何合适的载体,本发明不限于此。例如,载体可以是质粒、细菌载tt体、病毒载体、噬菌体载体、昆虫载体、酵母载体、哺乳动物载体、BAC、YACtt或任何其他合适的载体。在一些实施方式中,载体可以是仅在一类生物体(例如细tt菌、酵母、昆虫、哺乳动物等)内或仅在一种生物体内复制的载体。一些载体可具tt有广泛的宿主范围。一些载体可具有在不同生物体中发挥功能的不同的功能序列tt(例如起点或复制、可选择标记等)。这些可用于在两种不同类型的生物体之间(例tt如细菌和哺乳动物之间、酵母和哺乳动物之间等)运输载体(以及任何克隆至载体tt中的核酸片段)。在一些实施方式中,可通过所选宿主细胞类型确定所用载体类型。tt

  应理解,载体可编码可检测标记(如可选择标记,例如抗生素抗性等),使tt得转化的细胞能够选择性地生长并可分离载体并可表征任何插入以确定其是否含tt有所需的组装的核酸。可使用任何合适的技术(例如大小分析、限制性片段分析、tt测序等)表征该插入。在一些实施方式中,可通过确定宿主细胞中是否表达预测由tt正确组装的核酸编码的功能来测定载体中是否存在正确组装的核酸。tt

  在一些实施方式中,可通过使用一种或多种其他可检测或可选择标记选择或tt富集包含含有核酸插入的载体的宿主细胞,所述标记仅当正确的(例如经设计的)tt末端核酸片段被克隆至载体中时发挥功能。tt

  因此,宿主细胞应具有适当的表型以选择一种或多种载体上编码的抗药标记tt(或者检测一种或多种载体上编码的可检测标记)。然而,任何合适的宿主细胞类tt型都可以使用(例如原核、真核、细菌、酵母、昆虫、哺乳动物等)。例如,宿主tt细胞可以是细菌细胞(例如大肠杆菌(Escherichia coli)、枯草芽孢杆菌(Bacillus ttsubtilis)、结核分枝杆菌属(Mycobacterium spp.)、结核分枝杆菌(M.tuberculosis)或tt其他合适的细菌细胞)、酵母细胞(例如酵母菌属(Saccharomyces spp.)、毕赤酵tt母菌属(Picchia spp.)、假丝酵母菌属(Candida spp.)或其他合适的酵母物种,如酿tt酒酵母(S.cerevisiae)、白色念珠菌(C.albicans)、粟酒裂殖酵母(S.pombe)等)、tt爪蟾细胞、小鼠细胞、猴细胞、人细胞、昆虫细胞(例如SF9细胞和果蝇细胞)、tt蠕虫细胞(例如隐杆线虫属(Caenorhabditis spp.))、植物细胞或其他合适的细胞tttttt(包括例如转基因或其他重组细胞系)。此外,可使用多种异源细胞系,如中国仓tt鼠卵巢细胞(CHO)。tt

  应用

  本发明的各方面可用于多种应用,涉及合成的核酸的生成和/或使用。如本文tt所述,本发明提供了以提高的效率组装合成的核酸的方法。可对所得组装的核酸进tt行体外扩增(如使用PCR、LCR或任何合适的扩增技术)、体内扩增(如通过克tt隆到合适的载体中)、分离和/或纯化。可将(单独或克隆到载体中的)组装的核tt酸转化入宿主细胞(如原核、真核、昆虫、哺乳动物或其他宿主细胞)。在一些实tt施方式中,该宿主细胞可以用于增殖该核酸。在某些实施方式中,该核酸可以整合tt到该宿主细胞的基因组中。在一些实施方式中,该核酸可以取代细胞基因组上的对tt应核酸区域(如通过同源重组)。因此,核酸可以用于生成重组生物体。在一些实tt施方式中,目标核酸可以是整个基因组或用于取代全部或部分宿主生物体基因组的tt基因组大片段。重组生物体也可用于多种研究、工业、农业和/或医学应用。tt

  本文所述的许多技术可以一起使用,在一个或多个点上应用一种或多种基于tt延伸和/或基于连接的组装技术的组合以生成长核酸分子。例如,可以使用协同组tt装来组装寡核苷酸双链体和低于100至超过10000个碱基对长度的核酸片段(例如,tt100聚体至500聚体、500聚体至1000聚体、1000聚体至5000聚体、5000聚体至tt10000聚体、25000聚体、50000聚体、75000聚体、100000聚体等)。在一个示tt例性实施方式中,本文所述方法可以在组装生物体(如病毒、细菌、酵母或其他原tt核或真核生物)的整个基因组(或其大片段,如约10%、20%、30%、40%、50%、tt60%、70%、80%、90%或更多)的过程中使用,可选在一个或多个所需位置处将tt特异性修饰整合到序列中。tt

  可将使用本发明的方法生成的核酸分子整合到载体中。该载体可以是克隆载tt体或表达载体。载体可包含一个复制起始和一个或多个可选择标记(例如抗生素抗tt性标记、营养缺陷标记等)。在一些实施方式中,该载体可以是病毒载体。病毒载tt体可包含能够感染目标细胞的核酸序列。类似地,在一些实施方式中,可操作地与tt合适的启动子系统连接的原核表达载体可用于转化目标细胞。在其他实施方式中,tt可操作地与合适的启动子系统连接的真核载体可以用于转染目标细胞或组织。tt

  本文所述的构建体的转录和/或翻译可以在体外(即使用不含细胞的系统)或tt体内(即在细胞中表达)进行。在一些实施方式中,可以制备细胞裂解物。在某些tt实施方式中,可以分离或纯化表达的RNA或多肽。tt

  本文提供的方法和设备的各方面可以包括自动进行本文所述的一个或多个操tt作。在一些实施方式中,扩增和/或组装反应中的一个或多个步骤可以使用一个或tt多个自动化样品处理装置(如一个或多个自动化液体或流体处理装置)来自动操作。tt自动化装置和方法可用于递送反应试剂,所述反应试剂包括下列一种或多种:起始tt核酸、缓冲液、酶(如一种或多种连接酶和/或聚合酶)、核苷酸、盐和任何其他tt合适试剂(如稳定剂)。自动化装置和方法也可用于控制反应条件。例如,自动化tt热循环仪可用于控制反应温度和可用的任何温度循环。在一些实施方式中,可对扫tt描激光器进行自动化以提供适于孵育多核苷酸的一个或多个反应温度或温度循环。tt类似地,组装的多核苷酸产物的后续分析可以自动进行。例如,可以使用测序装置tt和自动化测序方案自动进行测序。也可以使用一种或多种合适装置和相关方案自动tt进行其他步骤(如扩增、克隆等)。应理解,本文所述的一种或多种装置或装置组tt件可以在某一系统(如机器人系统)或微环境(如微流体反应室)中组合。使用自tt动化装置和方法(如样品和/或样品容器的机械化操作和/或转移,包含自动化移液tt装置、微系统等),可将组装反应混合物(如液体反应样品)从系统的一个组件转tt移至另一个组件。该系统及其任何组件可以通过控制系统来控制。tt

  因此,本文所提供装置的方法步骤和/或方面可以使用例如计算机系统(如计tt算机控制系统)自动进行。能实施本文所提供技术方面的计算机系统可以包括用于tt任何处理类型的计算机(如本文所述序列分析和/或自动化装置控制)。然而,应tt理解某些处理步骤可以通过作为组装系统的一部分的一种或多种自动化装置来提tt供。在一些实施方式中,计算机系统可包括两台或更多台计算机。例如,一台计算tt机可以通过网络与第二台计算机偶联。一台计算机可进行序列分析。第二台计算机tt可以控制系统中的一个或多个自动化合成和组装装置。在其他方面中,其他计算机tt可以包含在网络中以控制一个或多个分析或处理操作。各计算机可以包含内存和处tt理器。该计算机可采用任何形式,因为本文提供的技术方面并不限于在任何特定计tt算机平台上实施。类似地,该网络可采用任何形式,包含专用网络或公共网络(如tt互联网)。显示设备能与一个或多个装置和计算机连接。或者,或另外,显示设备tt可以位于远端位点,并且根据本文提供的技术连接以显示分析输出。该系统的不同tttttt组件之间的连接可以通过有线、光纤、无线传送,卫星传送,任何其他合适的传送,tt或者上述两种或多种的任意组合。tt

  本文所提供技术的各个不同方面、实施方式、或操作能以任意的多种方式独tt立自动进行和实施。例如,各个方面、实施方式或操作能使用硬件、软件或其组合tt独立实施。当以软件实施时,能在任何合适的处理器或处理器集合上执行软件代码,tt该处理器集合在单独计算机中提供或分布在多个计算机上。应理解,通常可将完成tt上述功能的任何组件或组件集合视作控制上文所讨论功能的一个或多个控制器。所tt述一个或多个控制器能以多种方式实施,例如使用微码或软件程序控制的专用硬件tt或通用目的硬件(如一个或多个处理器)以完成上述功能。tt

  在这方面,应理解,本文所提供技术的实施方式的一种实现中包含了用计算tt机程序(如多种指令)编码的至少一种计算机可读介质(如计算机内存、软盘、光tt盘、磁带等),其能够在处理器上运行时完成本文所提供技术的一种或多种上述功tt能。该计算机可读介质可运输,从而其上存储的程序能加载到任何计算机系统来源tt以运行本文所提供技术的一种或多种功能。此外,应理解,执行时完成上文所讨论tt功能的计算机程序不限于在主机上运行的应用程序。相反,术语计算机程序在本文tt以一般意义使用,指任何类型的计算机代码(如软件或微码),该代码能用于编程tt处理器以进行上文讨论的本文所提供技术方面。tt

  应理解,与处理器存储于计算机可读介质上的数个本文所提供技术的实施方tt式一致,计算机实施的处理在其执行过程中可以接受手工输入(如来自用户)。tt

  因此,本文所述组装装置或组件的整体系统水平控制可以通过系统控制器进tt行,该系统控制器可以向下列装置提供控制信号:相关的核酸合成器、液体处理装tt置、热循环仪、测序装置、相关的机械化组件,以及用于运行所需输入/输出或其tt他控制功能的其他合适系统。因此,该系统控制器与任何装置控制器一起形成控制tt核酸组装系统运行的控制器。该控制器可以包含通用目的数据处理系统和其他相关tt装置,该通用目的数据处理系统能是通用目的计算机或通用目的计算机的网络,所tt述其他相关设备包含通信装置、调制解调器、和/或其他回路或组件,以进行所需tt输入/输出或其他功能。该控制器也能至少部分作为单个特定目的集成电路(如ttASIC)或ASIC阵列实施,各自具有用于整体、系统水平控制的主要或中央处理tt器部分以及专用的分离部分以在中央处理器部分控制下进行多种不同特定计算、功tt能和其他处理。该控制器也能使用多种分离的专用程序集成或其他电子回路或装置tttttt实施,例如硬连线电子装置或逻辑回路如分开的元件电路或程序逻辑装置。该控制tt器也能包含任何其他组件或装置,如用户输入/输出装置(监控器、显示器、打印tt机、键盘、用户点击装置、触摸屏、或其他用户界面等)、数据存储装置、驱动马tt达、连接、阀控制器、机械化装置、真空和其他泵、压力传感器、检测器、电源供tt应器、脉冲源、通信装置或其他电子电路或组件等。该控制器也可以控制系统其他tt部分的运行,如自动化客户订单处理、质量控制、包装、运输、开票等,以进行本tt领域已知而本文没有详述的其他合适功能。tt

  本发明的多个方面可以单独使用、联用或以前述实施方式未特定讨论的各种tt排列来使用,并且因此并不限制其应用于前面描述或附图说明所示组件的细节和排tt列。例如,一个实施方式中描述的各方面可与其他实施方式中描述的各方面以任何tt方式组合。tt

  权利要求中修饰权利要求元件使用的顺序术语“第一”、“第二”、“第三”tt等本身并不暗指任何优先、级别高低或一个权利要求项高于另一个的顺序或实行方tt法作用的暂时顺序,而是仅仅用作标记把有某一名称的一个权利要求元件与有相同tt名称的另一元件(但是就顺序术语使用而言)区分开以区别权利要求元件。tt

  而且,本文所用的词语和术语是为了描述目的,而不是限制性的。本文使用tt“包含”、“包括”、或“具有”、“含有”、“涉及”及其变体表示涵盖其后列tt出的项目及其等价物,以及其他项目。tt

  等同形式tt

  本发明提供了用于高保真基因组装的新方法和装置等。尽管讨论了本发明的tt具体实施方式,但以上说明书仅为说明性而非限制性的。本领域的技术人员在阅读tt本说明书后将清楚了解本发明的许多变化。本发明的全部范围应该通过参考所附权tt利要求书连同其等同物的全部范围,以及说明书连同此类变化来确定。tt

  通过引用纳入tt

  参考2013年4月24日提交的美国申请13/986,368、2012年6月15日提交的tt美国申请13/524,164和PCT公开PCT/US2009/055267。本文提到的所有发表物、tt专利、专利申请和序列数据库条目在此通过引用全文纳入,就好像各个单独发表物tt或专利特定和单独地表明通过引用纳入。tt

《用于核酸组装和高通量测序的方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)