欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 用于核酸合成的柔性基底独创技术95165字

用于核酸合成的柔性基底

2021-03-08 14:20:55

用于核酸合成的柔性基底

  交叉引用

  本申请要求2015年9月22日提交的美国临时申请号62/222,020的权益,该临时申请通过引用以其全文并入本文。

  序列表

  本申请含有以ASCII格式电子提交的序列表,并且其通过引用以其全文并入于此。创建于2016年9月19日的所述ASCII副本被命名为44854_717_601_SL.txt且大小为1,341个字节。

  背景技术

  基于生物分子的信息存储系统(例如,基于DNA)随着时间的推移具有大的存储容量和稳定性。然而,存在对用于生成用于信息存储的生物分子的可扩展的、自动化的、高度准确且高效的系统的需求。

  发明内容

  本文提供了用于存储信息的方法,所述方法包括:将至少一个数字序列形式的信息项转换为至少一个核酸序列;提供具有表面的柔性结构;合成具有共同编码所述至少一个核酸序列的预定序列的多个寡核酸,其中所述多个寡核酸包含至少约100,000个寡核酸,并且其中所述多个寡核酸从所述柔性结构的表面延伸;以及存储所述多个寡核酸。本文进一步提供了这样的方法,其中合成包括:在预定位置的表面上沉积核苷;以及移动所述柔性结构的至少一部分穿过浴或来自喷杆的排放物。本文进一步提供了这样的方法,其中所述浴或来自喷杆的排放物将所述结构的表面暴露于氧化剂或解封闭剂。本文进一步提供了这样的方法,其中合成进一步包括对沉积在所述表面上的核苷进行加帽。本文进一步提供了这样的方法,其中所述核苷包括核苷亚磷酰胺。本文进一步提供了这样的方法,其中所述柔性结构包括卷到卷带或连续带。本文进一步提供了这样的方法,其中所述柔性结构包括热塑性材料。本文进一步提供了这样的方法,其中所述热塑性材料包括聚芳醚酮。本文进一步提供了这样的方法,其中所述聚芳醚酮为聚醚酮、聚醚酮酮、聚(醚醚酮酮)、聚醚醚酮或聚醚酮醚酮酮。本文进一步提供了这样的方法,其中所述柔性结构包括尼龙、硝化纤维素、聚丙烯、聚碳酸酯、聚乙烯、聚氨酯、聚苯乙烯、缩醛、丙烯酸、丙烯腈、丁二烯苯乙烯、聚对苯二甲酸乙二醇酯、聚甲基丙烯酸甲酯、聚氯乙烯、透明PVC箔、聚(甲基丙烯酸甲酯)、苯乙烯聚合物、含氟聚合物、聚醚砜或聚酰亚胺。本文进一步提供了这样的方法,其中所述多个寡核酸中的每一个寡核酸包含50至500个碱基的长度。本文进一步提供了这样的方法,其中所述多个寡核酸包含至少约100亿个寡核酸。本文进一步提供了这样的方法,其中在24小时内合成至少约1.75×1013个核碱基。本文进一步提供了这样的方法,其中在72小时内合成至少约262.5×109个寡核酸。本文进一步提供了这样的方法,其中所述信息项为文本信息、音频信息或视觉信息。本文进一步提供了这样的方法,其中所述核苷包括核苷亚磷酰胺。

  本文提供了用于存储信息的方法,所述方法包括:将至少一个数字序列形式的信息项转换为至少一个核酸序列;提供具有表面的结构;合成具有共同编码所述至少一个核酸序列的预定序列的多个寡核酸,其中所述多个寡核酸包含至少约100,000个寡核酸,其中所述多个寡核酸从所述结构的表面延伸,并且其中合成包括:清洁所述结构的表面;在预定位置的表面上沉积核苷;对沉积在所述表面上的核苷进行氧化、解封闭和任选的加帽;其中所述清洁、氧化、解封闭和加帽包括移动所述柔性结构的至少一部分穿过浴或来自喷杆的排放物;以及存储所述多个寡核酸。本文进一步提供了这样的方法,其中所述核苷包括核苷亚磷酰胺。

  本文提供了用于存储信息的方法,所述方法包括:将至少一个数字序列形式的信息项转换为至少一个核酸序列;合成具有共同编码所述至少一个核酸序列的预定序列的多个寡核酸,其中所述多个寡核酸包含至少约10,000个寡核酸,其中所述多个寡核酸共同编码与所述预定序列有不超过1/1000个碱基不同的序列,并且其中所述多个寡核酸中的每一个寡核酸包含50至500个碱基的长度;以及存储所述至少约10,000个寡核酸。本文进一步提供了这样的方法,其中所述多个寡核酸包含至少约100,000个寡核酸。本文进一步提供了这样的方法,其中所述多个寡核酸包含至少约1,000,000个寡核酸。本文进一步提供了这样的方法,其中所述多个寡核酸包含至少约100亿个寡核酸。本文进一步提供了这样的方法,其中大于90%的寡核酸编码与所述预定序列无差异的序列。本文进一步提供了这样的方法,其中所述信息项为文本信息、音频信息或视觉信息。本文进一步提供了这样的方法,其中所述结构是刚性的或柔性的,并且其中所述结构包括表面,并且其中所述多个寡核酸从所述表面延伸。本文进一步提供了这样的方法,其中所述核苷包括核苷亚磷酰胺。

  本文提供了用于存储信息的方法,所述方法包括:将至少一个数字序列形式的信息项转换为至少一个核酸序列;合成具有共同编码所述至少一个核酸序列的预定序列的多个寡核酸,其中所述多个寡核酸包含至少约10,000个寡核酸,其中所述多个寡核酸中的每一个寡核酸包含50至500个碱基的长度,并且其中所述多个寡核酸从柔性结构的表面延伸;以及存储所述多个寡核酸。本文进一步提供了这样的方法,其中所述柔性结构包括卷到卷带或连续带。本文进一步提供了这样的方法,其中每个寡核酸从所述柔性结构的表面上的特征延伸,其中所述特征的直径为约1um至约500um。本文进一步提供了这样的方法,其中所述特征的直径为约1um至约50um。本文进一步提供了这样的方法,其中所述特征的直径为约10um。本文进一步提供了这样的方法,其中所述柔性结构包括热塑性材料。本文进一步提供了这样的方法,其中所述热塑性材料包括聚芳醚酮。本文进一步提供了这样的方法,其中所述聚芳醚酮为聚醚酮、聚醚酮酮、聚(醚醚酮酮)、聚醚醚酮或聚醚酮醚酮酮。本文进一步提供了这样的方法,其中所述柔性结构包括尼龙、硝化纤维素、聚丙烯、聚碳酸酯、聚乙烯、聚氨酯、聚苯乙烯、缩醛、丙烯酸、丙烯腈、丁二烯苯乙烯、聚对苯二甲酸乙二醇酯、聚甲基丙烯酸甲酯、聚氯乙烯、透明PVC箔、聚(甲基丙烯酸甲酯)、苯乙烯聚合物、含氟聚合物、聚醚砜或聚酰亚胺。本文进一步提供了这样的方法,其中所述柔性结构具有小于约10mm的厚度。本文进一步提供了这样的方法,其中每个寡核酸的长度为约200个碱基。本文进一步提供了这样的方法,其中在24小时内合成至少约1.75×1013个核碱基。本文进一步提供了这样的方法,其中在72小时内合成至少约262.5×109个寡核酸。本文进一步提供了这样的方法,其中所述核苷包括核苷亚磷酰胺。

  本文提供了用于存储信息的方法,所述方法包括:将至少一个数字序列形式的至少一个信息项加密为至少一个核酸序列;合成具有共同编码所述至少一个核酸序列的预定序列的多个寡核酸,其中所述多个寡核酸包含至少约10,000个寡核酸,并且其中所述多个寡核酸中的每一个寡核酸包含50至500个碱基的长度;存储所述多个寡核酸;对所述多个寡核酸进行测序;将所述多个寡核酸从核酸序列解密为数字序列;以及组装所述数字序列以形成所述至少一个数字序列,其中所述至少一个数字序列以100%的准确度找回。本文进一步提供了这样的方法,其进一步包括释放所述多个寡核酸。本文进一步提供了这样的方法,其中所述核苷包括核苷亚磷酰胺。

  本文提供了用于信息存储的装置,所述装置包括:具有表面的柔性结构;以及在所述表面上的多个特征,其中每个特征具有约1至约500um的宽度,并且其中所述多个特征中的每一个特征涂覆有与所述表面结合并且包含可用于核苷偶联的羟基的部分。本文进一步提供了这样的装置,其中所述柔性结构位于弯曲位置。本文进一步提供了这样的装置,其中所述弯曲位置包含大于30度的曲线。本文进一步提供了这样的装置,其中所述弯曲位置包含大于180度的曲线。本文进一步提供了这样的装置,其中所述柔性结构包含至少约100万个特征。本文进一步提供了这样的装置,其中所述柔性结构具有小于约4.5m2的总表面积。本文进一步提供了这样的装置,其中所述柔性结构每m2包含超过20亿个特征。本文进一步提供了这样的装置,其中所述柔性结构包括热塑性材料。本文进一步提供了这样的装置,其中所述热塑性材料包括聚芳醚酮。本文进一步提供了这样的装置,其中所述聚芳醚酮为聚醚酮、聚醚酮酮、聚(醚醚酮酮)、聚醚醚酮或聚醚酮醚酮酮。本文进一步提供了这样的装置,其中所述柔性结构包括尼龙、硝化纤维素、聚丙烯、聚碳酸酯、聚乙烯、聚氨酯、聚苯乙烯、缩醛、丙烯酸、丙烯腈、丁二烯苯乙烯、聚对苯二甲酸乙二醇酯、聚甲基丙烯酸甲酯、聚氯乙烯、透明PVC箔、聚(甲基丙烯酸甲酯)、苯乙烯聚合物、含氟聚合物、聚醚砜或聚酰亚胺。本文进一步提供了这样的装置,其中所述柔性结构具有小于约10mm的厚度。本文进一步提供了这样的装置,其中每个特征的宽度为约1um至约50um。本文进一步提供了这样的装置,其中每个特征具有约10um的直径。本文进一步提供了这样的装置,其中第一特征的中心距离第二特征的中心以及所述第一特征和所述第二特征约21um。本文进一步提供了这样的装置,其中所述柔性结构包括卷到卷带或连续带。本文进一步提供了这样的装置,其中每个特征包含通道。

  本文提供了用于信息存储的寡核酸文库,所述文库包含多个寡核酸,其中所述多个寡核酸包含至少约10,000个寡核酸,其中所述多个寡核酸共同编码与预定序列的总和有不超过1/1000个碱基不同的序列,并且其中所述多个寡核酸中的每一个寡核酸包含:在被解密时编码数字信息的预定序列;以及50至500个碱基的长度。本文进一步提供了这样的文库,其中所述多个寡核酸包含至少约100,000个寡核酸。本文进一步提供了这样的文库,其中所述多个寡核酸包含至少约100亿个寡核酸。本文进一步提供了这样的文库,其中所述多个寡核酸中的每一个寡核酸通过系链附接至结构的表面。本文进一步提供了这样的文库,其中所述系链包含具有至少一个化学修饰的核苷酸的可切割区,以在切割试剂的存在下从寡核酸中分离。本文进一步提供了这样的文库,其中所述系链包含约10至约50个碱基。本文进一步提供了这样的文库,其中大于90%的寡核酸编码与所述预定序列无差异的序列。本文进一步提供了这样的文库,其中所述数字信息编码文本、音频或视觉信息。本文进一步提供了这样的文库,其中所述文库在少于3天内合成。本文进一步提供了这样的文库,其中所述文库在少于24小时内合成。

  援引并入

  本说明书中所提及的所有出版物、专利和专利申请均通过引用而并入本文,其程度犹如具体地和个别地指出每一单独的出版物、专利或专利申请均通过引用而并入。

  附图说明

  在所附权利要求书中具体阐述了本发明的新颖特征。通过参考对在其中利用到本发明原理的说明性实施方案加以阐述的以下详细描述和附图,将会对本发明的特征和优点获得更好的理解,在附图中:

  图1图示了用于基于核酸的数据存储的示例性工作流程。

  图2A图示了具有带(tape)、轧制单元和材料沉积单元的示例性连续工作流程。

  图2B图示了从图2A中的带的角度来看的示例性放大,显示了用于寡核酸延伸的离散座位。

  图3图示了具有支持寡核酸合成的特征的表面的一部分。

  图4图示了计算机系统的示例。

  图5是示出计算机系统的架构的框图。

  图6是说明网络的示图,该网络被配置用于并入多个计算机系统、多个蜂窝电话和个人数据助理,以及网络附加存储(NAS)。

  图7是使用共享虚拟地址存储空间的多处理器计算机系统的框图。

  具体实施方式

  由于生成和存储的信息量呈指数增长,因此需要更大容量的存储系统。传统存储介质容量有限并且需要随时间变化的专业技术,因此需要不断地向新介质传输数据,而且费用往往很高。与传统的二进制信息编码相反,诸如DNA分子的生物分子由于其随时间的稳定性和四比特信息编码的能力而提供了用于部分信息存储的合适主机。因此,与商用的信息存储装置相比,大量的数据以相对较小的物理空间量被编码在DNA中。

  定义

  除非另外定义,否则本文使用的所有技术和科学术语具有与这些发明所属领域的普通技术人员通常理解的含义相同的含义。

  贯穿本公开内容,各个实施方案以范围格式给出。应当理解,范围格式的描述只是为了方便和简明,而不应被解释为对任何实施方案范围的硬性限制。相应地,对范围的描述应被认为明确公开了所有可能的子范围以及该范围内精确到下限单位十分之一的单个数值,除非上下文另有明确规定。例如,诸如从1至6的范围描述应被认为已经明确公开了诸如从1至3、从1至4、从1至5、从2至4、从2至6、从3至6等子范围,以及该范围内的单个值,例如,1.1、2、2.3、5和5.9。无论范围的宽度如何,这都是适用的。这些中间范围的上限和下限可独立地包括在更小的范围内,并且也被涵盖于本发明之中,但受制于所声称范围中的任何被明确排除的限值。当所声称范围包括限值中之一或全部两者时,排除了这些包括的限值中之一或全部二者的范围也被包括在本发明中,除非上下文另有明确规定。

  本文使用的术语仅用于描述特定实施方案的目的,而不旨在限制任何实施方案。除非上下文另有明确规定,否则如本文所使用的单数形式“一个”、“一种”和“该”也预期包括复数形式。将进一步理解的是,术语“包括”和/或“包含”在本说明书中使用时指定所述特征、整体、步骤、操作、元件和/或组件的存在,但不排除存在或添加一个或多个特征、整体、步骤、操作、元件、组件和/或其群体。如本文所使用的,术语“和/或”包括一个或多个相关所列项目的任何或所有组合。

  除非特别说明或从上下文中明显看出,否则如本文所使用的,关于数字或数字范围的术语“约”应理解为所述数字及其数字+/-10%,或对于范围列出的值低于所列下限的10%且高于所列上限的10%。

  基于核酸的信息存储

  本文提供了用于基于核酸的信息(数据)存储的装置、组合物、系统和方法。图1中提供了示例性工作流程。在第一步骤中,接收编码信息项(即,由计算机处理的二进制代码形式的数字信息)的数字序列(101)。实施加密103方案将数字序列从二进制代码转换为核酸序列105。选择用于核酸延伸的表面材料、用于核酸延伸的座位的设计(又称为排列点)和用于核酸合成的试剂(107)。制备结构的表面用于核酸合成(108)。进行从头寡核酸合成(109)。存储合成的寡核酸(111)并且该合成的寡核酸全部或部分地可用于随后的释放(113)。一旦释放,寡核酸全部或部分地进行测序(115),经历解密(117)以将核酸序列转换回数字序列。然后组装数字序列(119)以获得原始信息项的对准(alignment)编码。

  信息存储

  本文提供了用于将由生物分子编码的信息存储在基底上的方法和系统。在一些情况下,该信息是数字数据。在一些情况下,该生物分子包括DNA。在一些情况下,该生物分子包括寡核酸。在一些情况下,提供了将寡核酸合成到基底上的方法。在一些情况下,合成的寡核酸以高密度定位在基底上以在小占用面积内编码大量复杂的数据。示例性基底是柔性的,从而允许在合成、存储和/或数据提取过程中操作基底。在一些情况下,柔性基底被配置用于滚动到卷轴上以用于长期存储。

  为了将数据存储在DNA序列中,将信息从二进制代码的1和0转换成DNA的A、T、G和C碱基的代码。在一些情况下,信息项首先以数字信息形式进行编码。信息项包括但不限于文本、音频和视觉信息。信息项的示例性来源包括但不限于书籍、期刊、电子数据库、病历、信件、表格、录音、动物记录、生物学特征、广播、电影、短视频、电子邮件、簿记电话记录、互联网活动日志、图纸、图画、版画、照片、像素化图形和软件代码。信息项的示例性生物学特征来源包括但不限于基因文库、基因组、基因表达数据和蛋白质活性数据。信息项的示例性格式包括但不限于.txt、.PDF、.doc、.docx、.ppt、.pptx、.xls、.xlsx、.rtf、.jpg、.gif、.psd、.bmp、.giff、.png和.mpeg。在一些情况下,将数字序列的二进制代码转换成基于生物分子(例如,基于DNA)的序列,同时保留该代码所代表的信息。以数字格式编码信息项的单个文件大小或编码信息项的多个文件的量包括但不限于最多1024个字节(等于1KB)、1024KB(等于1MB)、1024MB(等于1GB)、1024GB(等于1TB)、1024TB(等于1PB)、1艾字节(exabyte)、1泽字节(zettabyte)、1尧字节(yottabyte)、1xenottabyte或更多。该转换的代码(数字二进制代码转换为生物分子代码)在本文中被称为关于在本文公开的表面上沉积本文公开的生物分子的“预定”序列。

  将包含转换的DNA代码的预定序列合成为一个或多个负载于结构(又称为基底)上的寡核酸以用于数据存储。在一些情况下,使用以逐步方式释放核酸合成试剂的寡核酸合成装置在基底上合成寡核酸,使得多个寡核酸平行地从基底表面一次延伸一个残基。每个寡核酸位于基底的不同区域或特征上。在许多情况下,这些区域位于基底的可寻址位置。在一些情况下,基底上的两个或更多个寡核酸具有不同的序列。在一些情况下,基底上的两个或更多个寡核酸具有相同的序列。

  本文描述的用于合成过程中寡核酸延伸的结构可以是刚性或柔性材料。图2A和图2B中示出了使用寡核酸合成仪在基底上从头合成寡核酸的示例性处理工作流程。在图示中,寡核酸合成材料沉积单元201将试剂释放到包含表面的柔性结构205(基底)上,其中该表面包含用于核酸延伸的多个特征207(或“座位”)。在连续带设置中,柔性结构205缠绕在滚轴203上。

  在一些情况下,支持寡核酸编码信息的合成和存储的基底包含柔性材料。在一些情况下,该柔性材料为带的形式。在一些情况下,具有柔性材料的基底用于卷到卷带,其中基底的第一端附接(可逆地或不可逆地)至第一卷轴而基底的第二端附接(可逆地或不可逆地)至第二卷轴。以这种方式,基底的主体缠绕在第一卷轴、第二卷轴或两者上。系统的卷轴是可旋转的,使得在使用时基底在卷轴之间转移。在卷到卷带系统的基底上进行的寡核酸合成反应过程中,基底的部分以生产流水线方式通过合成反应的各个阶段。作为一个实例,在核酸合成反应过程中基底的一部分通过将核碱基附接至基底的阶段。在另一个实例中,基底的一部分通过核酸合成反应的洗涤阶段。在一些情况下,基底的一部分位于与基底的另一部分不同的核酸合成反应阶段。

  在一些情况下,本文描述的用于寡核酸合成的柔性材料包括连续带。在一些情况下,用于合成和/或存储寡核酸的基底包括柔性材料,其可以以连续输送带配置或“连续带系统”围绕转鼓旋转。在示例性连续带系统中,将寡核酸合成步骤划分为区段,并且将基底的区域连续输送通过每个区段。作为实例,寡核酸合成反应通过将柔性基底从沉积区段(其中沉积包含寡核酸结构单元的小滴并将其偶联至所输送的基底表面上)输送至连续循环中的一个或多个处理区段(例如,加帽、氧化、洗涤、干燥),从而在每个循环中将合成的寡核酸延伸单个碱基来进行。在一些情况下,与在不同步骤中发生的寡核酸合成反应相比,连续输送基底通过寡核酸合成反应以更高的效率进行,因为在基底的不同区域上同时进行多个化学反应。

  在另一个示例性连续带系统中,随着带以可旋转的方式前进,整个连续带暴露于反应的单个步骤。在该带的表面的每个部分在单次通过中暴露于反应步骤之后,发生反应的下一个步骤。作为实例,寡核酸合成反应通过将该带输送通过释放氧化剂的装置的一部分来进行。在整个带接受核苷单体沉积之后,然后将该带暴露于洗涤步骤,随后进行一轮氧化、洗涤、解封闭、洗涤、加帽、洗涤并随后重复,导致在每个循环中将合成的寡核酸延伸单个碱基。

  通过使用任何合适的测序技术,直接在基底上或在从基底中提取之后读取合成和存储的寡核酸的DNA代码。在一些情况下,在基底上或在基底的特征内读取DNA序列。在一些情况下,提取存储在基底上的寡核酸,任选地组装成更长的核酸,并随后进行测序。

  本文提供了被配置为在短时间内在基底上合成高密度寡核酸的系统和方法。在一些情况下,该基底是柔性基底。在一些情况下,在一天内合成至少约1010、1011、1012、1013、1014或1015个碱基。在一些情况下,在一天内合成至少约10×108、10×109、10×1010、10×1011或10×1012个寡核酸。在一些情况下,合成的每个寡核酸包含至少约20、50、100、200、300、400或500个核碱基。在一个实例中,在3天内合成至少10×109个200碱基的寡核酸。在一些情况下,这些碱基以100;200;300;400;500;1000;2000;5000;10000;15000;20000个碱基中少于约1个的总平均错误率合成。

  在本文所述的基底上合成并存储的寡核酸编码数据,该数据可通过读取合成的寡核酸序列并将该序列转换成由计算机可读的二进制代码(“解密”)来解释。在又一个方面,提供了检测系统,其包含能够直接在基底上和/或在从基底移除之后对存储的寡核酸进行测序的装置。在基底为柔性材料的卷到卷带的情况下,检测系统包含用于夹持和推进基底通过检测位置的装置和设置在检测位置附近用于在带的一部分处于检测位置时检测源自该部分的信号的检测器。在一些情况下,该信号指示寡核酸的存在。在一些情况下,该信号指示寡核酸的序列。在另一个方面,本文描述了用于检测和读取在基底上存储的生物分子的检测方法。在基底为卷到卷带上的柔性材料的情况下,该方法包括顺序地推进基底通过固定位置以用于顺序检测并读取结合的生物分子。在一些情况下,当带连续输送通过可操作地连接到计算机的检测器时,由计算机读取在连续带上的寡核酸内编码的信息。在一些情况下,检测系统包括计算机系统,该计算机系统包含寡核酸测序装置、用于存储和找回(retrieval)与寡核酸序列相关的数据的数据库、用于将寡核酸序列的DNA代码转换为二进制代码的软件、用于读取二进制代码的计算机或其任何组合。

  在本公开内容的又一个方面,提供了包括外壳和带的盒,其中该带为包含多个附接的生物分子的柔性基底。将该带放置于外壳中,使得该带可沿着从该带的第一端到第二端的路径推进。

  结构

  本文提供了包含多个特征的结构(也被称为基底),其中生物分子直接或间接地附接至结构的表面。在许多情况下,生物分子包含在基底的特征上合成的核酸序列。在一些情况下,特征之间间隔很近,使得小面积的结构编码高密度的数据。例如,两个特征的中心之间的距离为约1um至约200um、约1um至约100um、约1um至约50um、约1um至约25um、约10um至约50um、或约10um至约25。在一些情况下,两个特征之间的距离小于约100um、50um、40um、30um、20um或10um。每个特征的尺寸可以在约0.1um至约100um、约1um至约100um、约1um至约50um、或约0.1um至约100um的范围内。在一些情况下,每个特征的直径小于约100um、50um、20um、10um或5um。在一些情况下,每平方米的结构允许至少约107、108、109、1010、1011个特征,其中每个特征支持一个寡核酸。在一些情况下,寡核酸具有最长约100、200、300、400、500或更多个碱基的长度。在一些情况下,109个寡核酸负载在小于约6、5、4、3、2或1m2的结构表面上。

  为了说明本文所述结构的示例性尺寸,参考图3。对该图的参考仅用于示例目的,并且所描述的特征的数目、尺寸和配置不是限制性的。图3中所示结构的表面区域示出了直径为10um,中心距为21um的四个特征。图3的特征以行排列以形成正方形,然而,意图是特征可以以任何结构进行排列,例如,没有成行或者以圆形或交错形状。

  柔性结构

  本文提供了允许在生物分子附接、存储和/或读取过程中进行操作的柔性结构。术语“柔性”在本文中用于指能够弯曲、折叠或类似地操作而不破损的结构。在一些情况下,柔性结构围绕滚轴弯曲180度。在一些情况下,柔性结构围绕滚轴弯曲约30度至约330度。在一些情况下,柔性结构围绕滚轴弯曲最多约360度。在一些情况下,滚轴的半径小于约10cm、5cm、3cm、2cm或1cm。在一些情况下,在20℃下,将该结构在任一方向上反复弯曲和拉直至少100次而不会失效(例如,破裂)或变形。在一些情况下,结构包括刚性材料。在一些情况下,结构具有适合滚动的厚度。在一些情况下,该结构的厚度小于约500mm、100mm、50mm、10mm或1mm。在一些情况下,该结构的厚度小于约1mm、0.5mm、0.1mm、0.05、0.01或更薄。

  本文所述的示例性柔性材料包括但不限于尼龙(未改性尼龙、改性尼龙、透明尼龙),硝化纤维素,聚丙烯,聚碳酸酯,聚乙烯、聚氨酯,聚苯乙烯,缩醛,丙烯酸,丙烯腈,丁二烯苯乙烯(ABS),聚酯薄膜如聚对苯二甲酸乙二醇酯、聚甲基丙烯酸甲酯或其他丙烯酸,聚氯乙烯或其他乙烯基树脂,透明PVC箔、用于打印机的透明箔,聚(甲基丙烯酸甲酯)(PMMA),甲基丙烯酸酯共聚物,苯乙烯聚合物,高折射率聚合物,含氟聚合物,聚醚砜,含有脂环结构的聚酰亚胺,橡胶,织物,金属箔及其任何组合。各种增塑剂和改性剂可与聚合物材料一起使用以实现选定的柔性特性。

  在一些情况下,所述结构包括塑性材料。在一些情况下,该结构包括热塑性材料。热塑性材料的非限制性实例包括丙烯酸、丙烯腈丁二烯苯乙烯、尼龙、聚乳酸、聚苯并咪唑、聚碳酸酯、聚醚砜、聚醚醚酮、聚醚酰亚胺、聚乙烯、聚苯醚、聚苯硫醚、聚丙烯、聚苯乙烯、聚氯乙烯和聚四氟乙烯。在一些情况下,该结构包括聚芳醚酮(PEAK)家族中的热塑性材料。PEAK热塑性塑料的非限制性实例包括聚醚酮(PEK)、聚醚酮酮(PEKK)、聚(醚醚酮酮)(PEEKK)、聚醚醚酮(PEEK)和聚醚酮醚酮酮(PEKEKK)。在一些情况下,该结构包括与甲苯相容的热塑性材料。在一些情况下,通过添加增塑剂来增加塑性材料的柔性。增塑剂的实例为基于酯的增塑剂,如邻苯二甲酸酯。邻苯二甲酸酯增塑剂包括邻苯二甲酸二(2-乙基己基)酯(DEHP)、邻苯二甲酸二异壬酯(DINP)、邻苯二甲酸二正丁酯(DnBP,DBP)、邻苯二甲酸丁基苄酯(BBzP)、邻苯二甲酸二异癸酯(DIDP)、邻苯二甲酸二辛酯(DOP,DnOP)、邻苯二甲酸二异辛酯(DIOP)、邻苯二甲酸二乙酯(DEP)、邻苯二甲酸二异丁酯(DIBP)和邻苯二甲酸二正己酯。在一些情况下,通过共聚或通过在聚合之前向单体添加非反应性侧链来修饰热塑性聚合物也增加了柔性。

  在一些情况下,所述结构包括氟弹性体。具有约80%氟弹性体的材料被命名为FKM。氟弹性体包含全氟弹性体(FFKM)和四氟乙烯/丙烯橡胶(FEPM)。氟弹性体具有五种已知类型。1型FKM由偏二氟乙烯(VDF)和六氟丙烯(HFP)组成,并且它们的氟含量通常为大约66重量%。2型FKM由VDF、HFP和四氟乙烯(TFE)组成,并且通常具有约68%至69%的氟。3型FKM由VDF、TFE和全氟甲基乙烯基醚(PMVE)组成,并且通常具有约62%至68%的氟。4型FKM由丙烯、TFE和VDF组成,并且通常具有约67%的氟。5型FKM由VDF、HFP、TFE、PMVE和乙烯组成。

  在一些情况下,本文公开的结构包括计算机可读材料。计算机可读材料包括但不限于磁性介质、卷到卷带、匣式磁带、盒式磁带、软盘、纸质介质、胶片、缩微胶片、连续带(例如,带)以及适用于存储电子指令的任何介质。在一些情况下,该结构包括磁性卷到卷带或磁性带。在一些情况下,该结构包括柔性印刷电路板。

  在一些情况下,本文公开的基底材料对可见光和/或紫外光是透明的。在一些情况下,基底材料具有足够的导电性以在整个或一部分基底上形成均匀的电场。在一些情况下,基底是导热的或隔热的。在一些情况下,该材料是耐化学腐蚀和耐热的,以支持化学反应,诸如寡核酸合成反应。在一些情况下,基底是磁性的。在一些情况下,基底包含金属或金属合金。

  在一些情况下,表面包含刚性材料。刚性材料包括但不限于玻璃;熔融石英;硅如二氧化硅或氮化硅;金属如金或铂;塑料如聚四氟乙烯、聚丙烯、聚苯乙烯、聚碳酸酯及其任何组合。

  在一些情况下,本文公开的基底材料包括平面区域。在一些情况下,基底包含嵌入的孔隙(其为捕获释放的寡核酸的一系列单独的反应部分),以促进寡核酸在基底的孔隙内的直接测序。在一些情况下,本文公开的基底材料包含孔隙。在一些情况下,该孔隙涂覆有本文公开的功能化剂,其中该功能化剂将核苷碱基偶联至基底表面。在一些情况下,该孔隙包含微通道。在一些情况下,单个孔隙包含至少2个微通道。在一些情况下,单个孔隙含有约2至约200、约100至约150个微通道。在一些情况下,微孔隙涂覆有本文公开的功能化剂,其中该功能化剂将核苷碱基偶联至基底表面。在一些情况下,本文公开的基底材料包含孔。在一些情况下,该孔涂覆有本文公开的功能化剂,其中该功能化剂将核苷碱基偶联至基底表面。在一些情况下,以本文所述的方式将单体寡核苷酸沉积至基底表面上的孔隙、微通道或孔中。在一些情况下,通过本文公开的方法合成的寡核酸的读取发生在基底表面上的孔隙、微通道或孔中。

  在一些情况下,基底包括对准结构或印刷对准元件,诸如基准标记。在一些情况下,基底包括附接至基底的一部分以用于识别该部分的可检测标记物。在一些情况下,基底包括用于注释的一个或多个区域。在一些情况下,对基底进行标记。

  在一些情况下,本文公开的基底包括一个或多个标识符。在一些情况下,通过在基底上具有相对于条形码(从其确定每个生物分子或生物分子组的身份的相对位置)的固定位置,每个标识符与基底上的每个生物分子或基底上的一组生物分子相关联。在一个方面,标识符提供了识别生物分子信息的手段。在一些情况下,生物分子为寡核酸,并且信息是序列同一性。在一些情况下,将信息存储在数据库中。

  表面修饰

  在一些情况下,为了支持将生物分子固定在基底上用于从头合成核酸,所述结构的表面包含材料并且/或者涂覆有促进与生物分子的偶联反应以用于附接的材料。在各种情况下,为了制备用于生物分子固定的基底,利用表面修饰来通过加成工艺或减成工艺进行对基底表面的化学和/或物理改变,以改变基底表面或表面的选定位点或区域的一种或多种化学和/或物理性质。例如,表面修饰涉及:(1)改变表面的润湿性质;(2)对表面进行功能化,即,提供、修改或取代表面官能团;(3)对表面进行去功能化,即,移除表面官能团;(4)以其他方式例如通过刻蚀来改变表面的化学组成;(5)增大或减小表面粗糙度;(6)在表面上提供涂层,例如,展现出与表面的润湿性质不同的润湿性质的涂层;和/或(7)在表面上沉积微粒。在一些情况下,将基底选择性功能化以在结构上产生两个或更多个不同区域,其中至少一个区域具有与相同结构的另一个区域不同的表面或化学性质。这样的性质包括但不限于表面能、化学终止、化学部分的表面浓度等。

  在一些情况下,对基底的表面进行修饰以包含一个或多个主动功能化表面,其被配置为与基底表面和生物分子两者相结合,从而支持对表面的偶联反应。在一些情况下,表面还用不能有效结合生物分子的钝化材料进行功能化,从而防止在被动性功能化剂结合的位点处的生物分子附接。在一些情况下,表面包括仅针对生物分子支持而限定不同特征的活性层。在一些情况下,表面未进行涂覆。

  在一些情况下,基底表面与任何不同比率的功能化基团的混合物接触。在一些情况下,混合物包含至少2、3、4、5种或更多种不同类型的功能化剂。在一些情况下,混合物中的至少两种类型的表面功能化剂的比率为约1:1、1:2、1:5、1:10、2:10、3:10、4:10、5:10、6:10、7:10、8:10、9:10或用以达到两种基团的所需表面呈现的任何其他比率。在一些情况下,通过向基底表面提供合适比率的功能化剂来实现期望的表面张力、润湿性、水接触角和/或针对其他合适的溶剂的接触角。在一些情况下,混合物中的试剂选自合适的反应性和惰性部分,从而将反应性基团的表面密度稀释成用于下游反应的期望水平。在一些情况下,功能化剂的混合物包含一种或多种与生物分子结合的试剂和一种或多种不与生物分子结合的试剂。因此,试剂的调节允许控制在不同的功能化区域发生的生物分子结合的量。

  在一些情况下,用于基底功能化的方法包括将硅烷分子沉积到基底表面上。在一些情况下,硅烷分子沉积在基底的高能表面上。在一些情况下,高表面能区域包括钝化功能化剂。硅烷基团结合到表面,而分子的剩余部分提供与表面的距离和在附接生物分子的末端处的游离羟基。在一些情况下,硅烷为有机官能烷氧基硅烷分子。有机官能烷氧基硅烷分子的非限制性实例包括二甲基氯十八烷基硅烷、甲基二氯十八烷基硅烷、三氯十八烷基硅烷和三甲基十八烷基硅烷、三乙基十八烷基硅烷。在一些情况下,硅烷为氨基硅烷。氨基硅烷的实例包括但不限于11-乙酰氧基十一烷基三乙氧基硅烷、正癸基三乙氧基硅烷、(3-氨丙基)三甲氧基硅烷、(3-氨丙基)三乙氧基硅烷、缩水甘油基氧基丙基/三甲氧基硅烷和N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺。在一些情况下,硅烷包括11-乙酰氧基十一烷基三乙氧基硅烷、正癸基三乙氧基硅烷、(3-氨丙基)三甲氧基硅烷、(3-氨丙基)三乙氧基硅烷、缩水甘油基氧基丙基/三甲氧基硅烷、N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺或其任何组合。在一些情况下,活性功能化剂包括11-乙酰氧基十一烷基三乙氧基硅烷。在一些情况下,活性功能化剂包括正癸基三乙氧基硅烷。在一些情况下,活性功能化剂包括缩水甘油基氧基丙基三乙氧基硅烷(GOPS)。在一些情况下,硅烷为氟硅烷。在一些情况下,硅烷为烃硅烷。在一些情况下,硅烷为3-碘-丙基三甲氧基硅烷。在一些情况下,硅烷为辛基氯硅烷。

  在一些情况下,通过与有机官能烷氧基硅烷分子自组装在表面上进行硅烷化。有机官能烷氧基硅烷根据其有机官能来分类。硅氧烷功能化试剂的非限制性示例包括:羟烷基硅氧烷(甲硅烷基化表面,用乙硼烷功能化,并通过过氧化氢来氧化该醇)、二醇(二羟基烷基)硅氧烷(甲硅烷基化表面,并水解成二醇)、氨基烷基硅氧烷(胺不需要中间功能化步骤)、环氧丙氧基硅烷(3-环氧丙氧基丙基-二甲基-乙氧基硅烷、环氧丙氧基-三甲氧基硅烷)、巯基硅烷(3-巯基丙基-三甲氧基硅烷,3-4环氧环己基-乙基三甲氧基硅烷或3-巯基丙基-甲基-二甲氧基硅烷)、联环庚烯基-三氯硅烷、丁基-醛基-三甲氧基硅烷或二聚仲氨基烷基硅氧烷。示例性的羟烷基硅氧烷包括变成3-羟基丙基的烯丙基三氯氯硅烷或变成8-羟基辛基的7-辛-1-烯基三氯氯硅烷。二醇(二羟基烷基)硅氧烷包括缩水甘油基三甲氧基硅烷衍生的(2,3-二羟基丙氧基)丙基(GOPS)。氨基烷基硅氧烷包括变成3-氨丙基的3-氨丙基三甲氧基硅烷(3-氨丙基-三乙氧基硅烷、3-氨丙基-二乙氧基-甲基硅烷、3-氨丙基-二甲基-乙氧基硅烷或3-氨丙基-三甲氧基硅烷)。在一些情况下,二聚仲氨烷基硅氧烷为变成双(甲硅烷基氧基丙基)胺的双(3-三甲氧基甲硅烷基丙基)胺。

  在一些情况下,活性功能化区域包含一种或多种不同种类的硅烷,例如,1、2、3、4、5、6、7、8、9、10种或更多种硅烷。在一些情况下,该一种或多种硅烷中的一种以相比于另一种硅烷更高的量存在于功能化组合物中。例如,具有两种硅烷的混合硅烷溶液包含99:1、98:2、97:3、96:4、95:5、94:6、93:7、92:8、91:9、90:10、89:11、88:12、87:13、86:14、85:15、84:16、83:17、82:18、81:19、80:20、75:25、70:30、65:35、60:40、55:45的一种硅烷与另一种硅烷比。在一些情况下,活性功能化剂包含11-乙酰氧基十一烷基三乙氧基硅烷和正癸基三乙氧基硅烷。在一些情况下,活性功能化剂包含比率为约20:80至约1:99、或约10:90至约2:98、或约5:95的11-乙酰氧基十一烷基三乙氧基硅烷和正癸基三乙氧基硅烷。

  基底上的合成

  本文所述的基底可包含允许寡核酸附接和合成到表面的多个特征。在一些情况下,包含寡核酸合成试剂的小滴从具有压电陶瓷材料和电极的沉积装置逐步地从寡核酸合成材料沉积单元释放到基底,以将电信号转换成用于释放该小滴的机械信号。使小滴一次释放到基底表面上的特定位置上一个核碱基,以生成具有编码数据的预定序列的多个合成的寡核酸。在一些情况下,将合成的寡核酸存储在基底上。在一些情况下,从表面切割寡核酸。切割包括采用例如氨或甲胺的气体进行的气体切割。

  本文提供了可包含表面的结构,该表面支持在共同支持物上的可寻址位置处合成具有不同预定序列的多种寡核酸。在一些情况下,装置提供支持合成超过2,000、5,000、10,000、20,000、50,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000、10,000,000个或更多个不同的寡核酸。在一些情况下,该装置提供支持合成超过2,000、5,000、10,000、20,000、30,000、50,000、75,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000、10,000,000个或更多个编码不同序列的寡核酸。在一些情况下,该装置提供支持合成超过1百万、10亿、100亿个或更多个寡核酸。在一些情况下,至少一部分寡核酸具有相同的序列或被配置为用相同的序列合成。

  本文提供了用于制造和生长长度约5、10、20、30、40、50、60、70、80、90、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900或2000个碱基的寡核酸的方法和装置。在一些情况下,所形成的寡核酸的长度为约5、10、20、30、40、50、60、70、80、90、100、125、150、175、200或225个碱基。寡核酸的长度可以为至少5、10、20、30、40、50、60、70、80、90或100个碱基。寡核酸可以是长度为10至225个碱基、长度为12至100个碱基、长度为20至150个碱基、长度为20至130个碱基、长度为25至1000个碱基、长度为75至500个碱基、长度为30至100个碱基或长度为50至500个碱基。

  在一些情况下,寡核酸在基底的不同座位上合成,其中每个座位支持合成寡核酸群体。在一些情况下,每个座位支持合成具有与在另一座位上生长的寡核酸群体不同序列的寡核酸群体。在一些情况下,装置的座位位于多个簇内。在一些情况下,装置包含至少10、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、20000、30000、40000、50000个或更多个簇。在一些情况下,装置包含超过2,000、5,000、10,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,100,000、1,200,000、1,300,000、1,400,000、1,500,000、1,600,000、1,700,000、1,800,000、1,900,000、2,000,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、1,200,000、1,400,000、1,600,000、1,800,000、2,000,000、2,500,000、3,000,000、3,500,000、4,000,000、4,500,000、5,000,000或10,000,000个或更多个不同的座位。在一些情况下,装置包含约10,000个不同的座位。单簇内的座位的量在不同情况下是不同的。在一些情况下,每个簇包含1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、120、130、150、200、300、400、500个或更多个座位。在一些情况下,每个簇包含约50-500个座位。在一些情况下,每个簇包含约100-200个座位。在一些情况下,每个簇包含约100-150个座位。在一些情况下,每个簇包含约109、121、130或137个座位。在一些情况下,每个簇包含约19、20、61、64个或更多个座位。

  装置上合成的不同寡核酸的数目可取决于基底中可用的不同座位的数目。在一些情况下,装置的簇内的座位(或特征)密度为至少或约1个座位/mm2、10个座位/mm2、25个座位/mm2、50个座位/mm2、65个座位/mm2、75个座位/mm2、100个座位/mm2、130个座位/mm2、150个座位/mm2、175个座位/mm2、200个座位/mm2、300个座位/mm2、400个座位/mm2、500个座位/mm2、1,000个座位/mm2或更大。在一些情况下,装置包含约10个座位/mm2至约500个座位/mm2、约25个座位/mm2至约400个座位/mm2、约50个座位/mm2至约500个座位/mm2、约100个座位/mm2至约500个座位/mm2、约150个座位/mm2至约500个座位/mm2、约10个座位/mm2至约250个座位/mm2、约50个座位/mm2至约250个座位/mm2、约10个座位/mm2至约200个座位/mm2或约50个座位/mm2至约200个座位/mm2。在一些情况下,簇内两个相邻座位中心的距离为约10um至约500um、约10um至约200um或约10um至约100um。在一些情况下,距相邻座位的两个中心的距离为大于约10um、20um、30um、40um、50um、60um、70um、80um、90um或100um。在一些情况下,距两个相邻座位的中心的距离为小于约200um、150um、100um、80um、70um、60um、50um、40um、30um、20um或10um。在一些情况下,每个座位具有约0.5um、1um、2um、3um、4um、5um、6um、7um、8um、9um、10um、20um、30um、40um、50um、60um、70um、80um、90um或100um的宽度。在一些情况下,每个座位具有约0.5um至100um、约0.5um至50um、约10um至75um、约0.5um至50um或约1um至约500um的宽度。

  在一些情况下,本文公开的合成的寡核酸包含12至25个碱基的系链。在一些情况下,该系链包含10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个碱基。

  本公开内容的用于基底上寡核酸合成的合适方法为亚磷酰胺方法,其包括在亚磷酰胺结构单元与结合到基底的核苷之间形成亚磷酸三酯键的偶联步骤中将亚磷酰胺结构单元(即核苷亚磷酰胺)受控添加至生长的寡核酸链中。在一些情况下,将核苷亚磷酰胺提供给活化的基底。在一些情况下,将核苷亚磷酰胺提供给具有活化剂的基底。在一些情况下,核苷亚磷酰胺以相对于基底结合核苷1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、90、100倍或更多倍过量来提供给基底。在一些情况下,添加核苷亚磷酰胺在无水环境中(例如,在无水乙腈中)进行。在偶联步骤中添加并连接核苷亚磷酰胺后,任选地洗涤该基底。在一些情况下,偶联步骤重复一次或多次额外的时间,任选地在向基底添加核苷亚磷酰胺之间进行洗涤步骤。在一些情况下,本文使用的寡核酸合成方法包括1、2、3或更多个连续的偶联步骤。在许多情况下,在偶联之前,与基底结合的核苷通过去除保护基团来脱保护,其中保护基团起防止聚合的作用。常见的保护基团为4,4’-二甲氧基三苯甲基(DMT)。

  偶联后,亚磷酰胺寡核酸合成方法任选地包含加帽步骤。在加帽步骤中,用加帽试剂处理生长的寡核酸。加帽步骤通常用来在进一步链延伸偶联后封闭未反应的基底结合的5’-OH基团,从而防止形成具有内部碱基缺失的寡核酸。此外,用1H-四唑的活化的亚磷酰胺可能在很小的程度上与鸟苷的O6位置反应。不受理论的束缚,在用I2/水氧化后,该副产物(可能是经由O6-N7迁移)经历脱嘌呤。无嘌呤位点可最后在寡核苷酸的最终脱保护的过程中被切割,从而降低全长产物的产率。O6修饰可通过在用I2/水氧化之前用加帽试剂处理而去除。在一些情况下,与没有加帽的合成相比,在寡核酸合成过程中包含加帽步骤会降低错误率。作为实例,加帽步骤包括用乙酸酐和1-甲基咪唑的混合物处理基底结合的寡核酸。在加帽步骤之后,任选地洗涤基底。

  在一些情况下,在添加核苷亚磷酰胺之后,并任选地在加帽和一个或多个洗涤步骤之后,基底结合的生长核酸得以氧化。氧化步骤包括将亚磷酸三酯氧化成四配位磷酸三酯(一种天然存在的磷酸二酯核苷间键的受保护的前体)。在一些情况下,生长的寡核酸的氧化通过任选地在弱碱如吡啶、二甲基吡啶、三甲吡啶的存在下用碘和水处理来实现。氧化有时在无水条件下采用叔丁基过氧化氢或(1S)-(+)-(10-樟脑磺酰基)-氧杂吖丙啶(CSO)进行。在一些方法中,在氧化之后进行加帽步骤。第二个加帽步骤允许基底干燥,因为可能持续存在的来自氧化的残余水可以抑制随后的偶联。氧化后,任选地洗涤基底和生长的寡核酸。在一些情况下,氧化步骤用硫化步骤来替代,以获得寡核苷酸硫代磷酸酯,其中任何加帽步骤可在硫化之后进行。许多试剂能够进行有效地硫转移,包括但不限于3-(二甲基氨基亚甲基)氨基)-3H-1,2,4-二噻唑-3-硫酮、DDTT、3H-1,2-苯并二硫醇-3-酮1,1-二氧化物(也被称为Beaucage试剂)以及N,N,N'N'-四乙基秋兰姆二硫化物(TETD)。

  为了使核苷掺入的后续循环通过偶联而发生,必须移除基底结合的生长寡核酸的受保护的5’末端,使得伯羟基能够与下一个核苷亚磷酰胺反应。在一些情况下,保护基团为DMT并且用在二氯甲烷中的三氯乙酸进行解封闭。进行延长时间的脱三苯甲基化或者使用比推荐的酸溶液更强的酸溶液进行脱三苯甲基化可导致固体支持物结合的寡核苷酸的脱嘌呤增加,并因此降低了所需的全长产物的产率。本文所述的方法和组合物提供了受控的解封闭条件,从而限制不期望的脱嘌呤反应。在一些情况下,基底结合的寡核酸在解封闭后洗涤。在一些情况下,解封闭后的有效洗涤有助于合成的寡核酸具有低错误率。

  用于在本文所述的基底上合成寡核酸的方法通常涉及以下步骤的迭代序列:将受保护的单体应用于基底特征的表面上以与该表面、连接体或与先前脱保护的单体连接;使所施加的单体脱保护,使得其能够与随后施加的受保护的单体反应;以及应用另一种受保护的单体进行连接。一个或多个中间步骤包括氧化和/或硫化。在一些情况下,一个或多个洗涤步骤在一个或全部步骤之前或之后。

  在一些情况下,用光不稳定的保护基团合成寡核酸,其中表面上生成的羟基被光不稳定的保护基团封闭。当该表面例如通过光刻掩模暴露于~UV光时,可在表面上产生游离的羟基基团的图案。这些羟基基团可依照亚磷酰胺化学法与光保护的核苷亚磷酰胺反应。可采用第二光刻掩模,且表面可暴露于UV光以产生羟基基团的第二图案,随后与5'-光保护的核苷亚磷酰胺偶联。同样,可产生图案并可使寡聚物链延伸。不受理论的束缚,可光切割的基团的不稳定性取决于波长和所采用的溶剂的极性,并且光切割的速率可受暴露的持续时间和光的强度影响。该方法可利用许多因素,例如,掩模对准的准确性、光保护基团去除的效率和亚磷酰胺偶联步骤的产率。此外,不期望的光向邻近位点的泄露可被最小化。每个斑点合成寡聚物的密度可通过调整合成表面上的先导核苷的负载来监控。

  在一些情况下,对为寡核酸合成提供支持的基底表面进行化学修饰以允许合成的寡核酸链从表面上切下。在一些情况下,寡核酸链在寡核酸脱保护的同时被切割。在一些情况下,寡核酸链在寡核酸脱保护之后被切割。在示例性方案中,三烷氧基甲硅烷基胺如(CH3CH2O)3Si-(CH2)2-NH2与基底的表面SiOH基团反应,随后与琥珀酸酐和胺反应以产生支持核酸链增长的酰胺键和游离OH。

  使用本文所述的方法和基底合成的寡核酸任选地从合成它们的表面释放。在一些情况下,寡核酸在合成之后从表面上切下。在一些情况下,寡核酸在存储之后从表面上切下。切割包括采用氨或甲胺的气体切割。在一些情况下,在合成步骤期间施加氨气同时对受保护的磷酸基团脱保护,即去除吸电子氰基。在一些情况下,一旦从表面释放,寡核酸就被组装成更大的核酸,对其进行测序并解码以提取存储的信息。在一些情况下,其中存储在基底上的寡核酸将被去除,每个序列片段包含提供如何将其和与其一起存储的其他序列组装在一起的指令的索引。

  在一些情况下,合成的寡核酸被设计为共同跨越编码信息的预定序列的大区域。在一些情况下,通过连接反应连接合成的寡核酸来生成较大的寡核酸。连接反应的一个实例是聚合酶链组装(PCA)。在一些情况下,至少一部分寡核酸被设计为包含作为通用引物结合的基底的附加区域。对于PCA反应,预先合成的寡核酸包括彼此的重叠(例如,具有重叠序列的4、20、40个或更多个碱基)。在聚合酶循环过程中,寡核酸与互补片段退火,并随后通过聚合酶进行补平。每个循环因此根据寡核酸彼此找到而随机增加各个片段的长度。片段之间的互补性允许形成完整的大跨度双链DNA。在一些情况下,在PCA反应完成之后,使用错配修复检测酶来进行错误校正步骤以去除序列中的错配。一旦生成较大的靶序列片段,就可以对该片段进行扩增。例如,在一些情况下,包含5’和3’末端衔接子序列的靶序列在聚合酶链式反应(PCR)中进行扩增,所述PCR包括与衔接子序列杂交的修饰的引物。在一些情况下,修饰的引物包含一个或多个尿嘧啶碱基。使用修饰的引物允许通过集中于靶向修饰的碱基和/或通过从片段切割修饰的碱基对的酶留下的空隙的酶促反应去除引物。剩下的是缺少衔接子序列残余物的双链扩增产物。以这种方式,多种扩增产物可以与同一组引物平行生成,以生成不同的双链DNA片段。

  在一些情况下,对合成的寡核酸和/或组装的产物进行错误校正。用于错误校正的示例性策略涉及通过重叠延伸PCR进行定点诱变以校正错误,其任选地与两轮或更多轮克隆和测序相结合。在某些情况下,选择性地从正确合成的核酸群体中去除具有错配、凸起和小环、化学改变的碱基和/或其他异源双链体的双链核酸。在一些情况下,使用识别并结合或紧挨着双链核酸内的错配或未配对的碱基的蛋白质/酶进行错误校正,以产生单链或双链断裂或启动链转移转座事件。用于错误校正的蛋白质/酶的非限制性实例包括内切核酸酶(T7内切核酸酶I、大肠杆菌内切核酸酶V、T4内切核酸酶VII、绿豆核酸酶、细胞大肠杆菌内切核酸酶IV、UVDE)、限制酶、糖基化酶、核糖核酸酶、错配修复酶、解离酶、解旋酶、连接酶、错配特异性抗体及其变体。特异性错误校正酶的实例包括T4内切核酸酶7、T7内切核酸酶1、S1、绿豆内切核酸酶、MutY、MutS、MutH、MutL、切割酶(cleavase)、CELI和HINF1。在一些情况下,DNA错配结合蛋白MutS(水生栖热菌Thermus aquaticus)用于从合成产物群体中去除失败产物。在一些情况下,使用Correctase酶进行错误校正。在一些情况下,使用SURVEYOR内切核酸酶(Transgenomic),即扫描异源双链体DNA中的已知和未知的突变以及多态性的错配特异性DNA内切核酸酶来进行错误校正。

  错误率

  在一些情况下,这些错误率是针对合成的寡核酸的至少50%、60%、70%、80%、90%、95%、98%、99%、99.5%或更多。在一些情况下,这些至少90%、95%、98%、99%、99.5%或更多的合成的寡核酸与它们编码的预定序列没有差异。在一些情况下,使用本文所述的方法和系统在基底上合成的寡核酸的错误率小于约1/200。在一些情况下,使用本文所述的方法和系统在基底上合成的寡核酸的错误率小于约1/1,000。在一些情况下,使用本文所述的方法和系统在基底上合成的寡核酸的错误率小于约1/2,000。在一些情况下,使用本文所述的方法和系统在基底上合成的寡核酸的错误率小于约1/3,000。在一些情况下,使用本文所述的方法和系统在基底上合成的寡核酸的错误率小于约1/5,000。单个类型的错误率包括在基底上合成的寡核酸的错配、缺失、插入和/或置换。术语“错误率”是指将合成的寡核酸的总量与预定的寡核酸序列的总和进行比较。

  使用所提供的系统和方法在文库内合成的寡核酸的平均错误率可以小于1/1000、小于1/1250、小于1/1500、小于1/2000、小于1/3000或更低。在一些情况下,使用所提供的系统和方法在文库内合成的寡核酸的平均错误率小于1/500、1/600、1/700、1/800、1/900、1/1000、1/1100、1/1200、1/1250、1/1300、1/1400、1/1500、1/1600、1/1700、1/1800、1/1900、1/2000、1/3000或更低。在一些情况下,使用所提供的系统和方法在文库内合成的寡核酸的平均错误率小于1/1000。

  在一些情况下,相比于预定序列,使用所提供的系统和方法在文库内合成的寡核酸的总错误率小于1/500、1/600、1/700、1/800、1/900、1/1000、1/1100、1/1200、1/1250、1/1300、1/1400、1/1500、1/1600、1/1700、1/1800、1/1900、1/2000、1/3000或更低。在一些情况下,使用所提供的系统和方法在文库内合成的寡核酸的总错误率小于1/500、1/600、1/700、1/800、1/900或1/1000。在一些情况下,使用所提供的系统和方法在文库内合成的寡核酸的总错误率小于1/1000。

  在一些情况下,可以使用可用于使用所提供的系统和方法在文库内合成的寡核酸的错误校正酶。在一些情况下,相比于预定序列,采用错误校正的寡核酸的总错误率可小于1/500、1/600、1/700、1/800、1/900、1/1000、1/1100、1/1200、1/1300、1/1400、1/1500、1/1600、1/1700、1/1800、1/1900、1/2000、1/3000或更低。在一些情况下,使用所提供的系统和方法在文库内合成的采用错误校正的寡核酸的总错误率可小于1/500、1/600、1/700、1/800、1/900或1/1000。在一些情况下,使用所提供的系统和方法在文库内合成的采用错误校正的寡核酸的总错误率可小于1/1000。

  可以以在整个文库中或超过80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%或更多的文库中低于1/300、1/400、1/500、1/600、1/700、1/800、1/900、1/1000、1/1250、1/1500、1/2000、1/2500、1/3000、1/4000、1/5000、1/6000、1/7000、1/8000、1/9000、1/10000、1/12000、1/15000、1/20000、1/25000、1/30000、1/40000、1/50000、1/60000、1/70000、1/80000、1/90000、1/100000、1/125000、1/150000、1/200000、1/300000、1/400000、1/500000、1/600000、1/700000、1/800000、1/900000、1/1000000或更低的碱基插入、缺失、置换或总错误率来合成本文公开的文库。本公开内容的方法和组合物还涉及具有低错误率的大合成寡核苷酸文库,该错误率与该文库的至少一个子集中至少30%、40%、50%、60%、70%、75%、80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%或更多的寡核苷酸相关,涉及与预定/预选序列相比的无错误序列。在一些情况下,文库内的独立体积中至少30%、40%、50%、60%、70%、75%、80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%或更多的寡核苷酸具有相同的序列。在一些情况下,与超过95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或更高的相似性或同一性有关的任意寡核苷酸中的至少30%、40%、50%、60%、70%、75%、80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%或更多具有相同序列。在一些情况下,优化与寡核苷酸上的特定座位有关的错误率。因此,一个或多个作为大文库的部分的寡核苷酸的给定座位或多个选定座位可各自具有低于1/300、1/400、1/500、1/600、1/700、1/800、1/900、1/1000、1/1250、1/1500、1/2000、1/2500、1/3000、1/4000、1/5000、1/6000、1/7000、1/8000、1/9000、1/10000、1/12000、1/15000、1/20000、1/25000、1/30000、1/40000、1/50000、1/60000、1/70000、1/80000、1/90000、1/100000、1/125000、1/150000、1/200000、1/300000、1/400000、1/500000、1/600000、1/700000、1/800000、1/900000、1/1000000或更低的错误率。在各种情况下,这类错误优化的座位可包括至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、4000、5000、6000、7000、8000、9000、10000、30000、50000、75000、100000、500000、1000000、2000000、3000000个或更多个座位。错误优化的座位可分布到至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、4000、5000、6000、7000、8000、9000、10000、30000、75000、100000、500000、1000000、2000000、3000000个或更多个寡核苷酸。

  可在使用或不使用错误校正的情形下获得错误率。错误率可在整个文库,或在文库的超过80%、85%、90%、93%、95%、96%、97%、98%、99%、99.5%、99.8%、99.9%、99.95%、99.98%、99.99%或更多中获得。

  装置

  本文提供了用于在基底上沉积和存储生物分子的系统和装置。在一些情况下,生物分子是将编码信息存储在其序列中的寡核酸。在一些情况下,系统包括支持生物分子附接的基底和/或用于将生物分子施加至基底表面的装置。在一个实例中,用于生物分子施加的装置为寡核酸合成仪。在一些情况下,系统包括用于采用流体处理基底的装置(例如,流动池)。在一些情况下,系统包括用于在施加装置与处理装置之间移动基底的装置。对于其中基底为卷到卷带的情况,系统可包括两个或更多个卷轴,其允许在不同时间将基底的不同部分接入施加装置和任选的处理装置。

  在一些情况下,包含热塑性材料的柔性基底涂覆有核苷偶联试剂。将涂层图案化为特征,使得每个特征具有约10um的直径,且两个相邻特征之间的中心距为约21um。在这种情况下,在寡核酸合成沉积步骤期间,特征的尺寸足以容纳0.2pl的固着滴(sessile drop)体积。在一些情况下,特征密度为约22亿个特征/m2(1个特征/441×10-12m2)。在一些情况下,4.5m2的基底包含约100亿个特征,每个特征的直径为10um。

  在一些情况下,沉积装置包含约2,048个喷嘴,每个喷嘴以每个小滴1个核碱基每秒沉积约100,000个小滴。对于每个沉积装置,每天在基底上沉积至少约1.75×1013个核碱基。在一些情况下,合成100至500个核碱基寡核酸。在一些情况下,合成200个核碱基寡核酸。任选地,在3天内,以每天约1.75×1013个碱基的速度,合成至少约262.5×109个寡核酸。

  在一个方面,提供了与本文所述的能够处理一个或多个基底的寡核酸合成方法一起使用的自动化系统,该系统包括:用于在基底上喷射包含试剂的微滴的材料沉积装置;用于扫描邻近材料沉积装置的基底以选择性地使微滴沉积在指定位点处的扫描传输装置;用于处理基底的流动池,通过将基底暴露于一种或多种选择的流体使微滴沉积在该基底上;以及用于使基底相对于材料沉积装置正确对准以进行沉积的对准单元。在一些情况下,系统任选地包括用于在材料沉积装置与流动池之间移动基底以用于在流动池中处理的处理传输装置,其中所述处理传输装置和所述扫描传输装置是不同的元件。在其他情况下,系统不包括处理传输装置。

  在一些情况下,用于在合成反应过程中将一种或多种试剂施加至基底的装置是包含多个材料沉积装置的寡核酸合成仪。在一些情况下,每个材料沉积装置被配置为沉积用于亚磷酰胺合成的核苷酸单体。在一些情况下,寡核酸合成仪将试剂沉积到基底的不同特征。用于寡核酸合成的试剂包括用于寡核酸延伸的试剂和洗涤缓冲液。作为非限制性实例,寡核酸合成仪沉积偶联试剂、加帽试剂、氧化剂、解封闭剂、乙腈、诸如氮气的气体及其任何组合。另外,寡核酸合成仪任选地沉积用于制备基底和/或维持基底完整性的试剂。在一些情况下,寡核酸合成仪沉积体积小于约1000、500、100、50或20pl的直径小于约200um、100um或50um的液滴。在一些情况下,寡核酸合成仪每秒沉积约1至10000、1至5000、100至5000、或1000至5000个小滴。在一些情况下,寡核酸合成仪使用有机溶剂。

  在一些情况下,在寡核酸合成过程中,将基底置于流动池内和/或密封在流动池内。在一些情况下,流动池提供液体的连续或不连续流动,诸如包含在基底内对于反应所必需的试剂(例如氧化剂和/或溶剂)的那些液体。在一些情况下,流动池提供气体(诸如氮气)的连续或不连续流动,以通常通过增强挥发性基底的蒸发来干燥基底。多种辅助装置可用于改善干燥并减少基底表面上的残留水分。这类辅助干燥装置的实例包括但不限于真空源、减压泵和真空罐。在一些情况下,寡核酸合成系统包含一个或多个流动池(诸如2、3、4、5、6、7、8、9、10或20个)和一个或多个基底(诸如2、3、4、5、6、7、8、9、10或20个)。在一些情况下,流动池被配置为在合成反应的一个或多个步骤期间保持试剂并向基底提供试剂。在一些情况下,流动池包括在基底的顶部上滑动的盖子并且可被夹紧到位以在基底的边缘周围形成压力密封。足够的密封包括但不限于允许约1、2、3、4、5、6、7、8、9或10个大气压的密封。在一些情况下,打开流动池的盖子以允许进入施加装置如寡核酸合成仪。在一些情况下,寡核酸合成方法的一个或多个步骤在流动池内的基底上进行,而不需要进行基底的运输。

  在一些情况下,用于采用流体处理基底的装置包括喷杆。在示例性的寡核酸合成工艺中,用施加装置将核苷酸单体施加至基底表面上,并且随后喷杆使用该喷杆的喷嘴用一种或多种处理试剂喷射基底表面。在一些情况下,将喷嘴按顺序排列以与寡核酸合成过程中的不同处理步骤相关联。用于不同工艺步骤的化学物质很容易在喷杆中改变,以容易地适应合成方法或合成方法的步骤之间的变化。在一些情况下,当基底移动经过喷杆时,喷杆在基底表面上连续地喷射给定的化学物质。在一些情况下,喷杆沉积在大面积的基底上,非常像草坪洒水器中使用的喷杆。在一些情况下,喷杆喷嘴被定位成向基底的给定区域提供均匀的处理材料涂层。

  在一些情况下,寡核酸合成系统包含用于合成的寡核酸的下游处理的一个或多个元件。作为实例,该系统包括温度控制元件,诸如热循环装置。在一些情况下,温度控制元件与多个解析反应器一起使用以进行核酸组装诸如PCA和/或核酸扩增如PCR。

  寡核酸合成仪包括在X-Y方向移动以与基底的位置对准的材料沉积装置。寡核酸合成仪也可在Z方向移动以与基底密封,从而形成解析反应器。解析反应器被配置为允许将流体(包括寡核酸和/或试剂)从基底转移至加帽元件,和/或反之亦然。流体可穿过基底和加帽元件中的任一者或两者,并且包括但不限于偶联试剂、加帽试剂、氧化剂、解封闭剂、乙腈和氮气。

  寡核酸合成仪包括一个或多个沉积装置,其以高解析度将用于核酸合成的试剂沉积到基底的不同特征或区域上。能够进行高解析度小滴沉积的装置的实例包括喷墨打印机和激光打印机的打印头。在本文所述的系统和方法中有用的装置实现约100个点/英尺(DPI)至约50,000DPI;约100DPI至约20,000DPI;约100DPI至约10,000DPI;约100DPI至约5,000DPI;约1,000DPI至约20,000DPI;或约1,000DPI至约10,000DPI的解析度。在一些情况下,该装置具有至少约1,000;2,000;3,000;4,000;5,000;10,000;或20,000DPI的解析度。通过该装置进行的高解析度沉积与各个喷嘴的数目和密度(对应于基底的特征)相关。

  分配的小滴的尺寸与装置的解析度相关。在一些情况下,装置以约0.01pl至约20pl、约0.01pl至约10pl、约0.01pl至约1pl、约0.01pl至约0.5pl、约0.01pl至约0.01pl、或约0.05pl至约1pl的尺寸沉积试剂的小滴。在一些情况下,小滴的尺寸小于约1pl、0.5pl、0.2pl、0.1pl或0.05pl。由装置分配的小滴的尺寸与沉积喷嘴的直径相关,其中每个喷嘴能够将试剂沉积到基底的特征上。在一些情况下,寡核酸合成仪的沉积装置包含约100至约10,000个喷嘴;约100至约5,000个喷嘴;约100至约3,000个喷嘴;约500至约10,000个喷嘴;或约100至约5,000个喷嘴。在一些情况下,沉积装置包含大于1,000;2,000;3,000;4,000;5,000或10,000个喷嘴。在一些情况下,每个材料沉积装置包含多个喷嘴,其中每个喷嘴任选地被配置为对应于基底上的特征。在一些情况下,每个喷嘴沉积不同于另一个喷嘴的试剂组分。在一些情况下,每个喷嘴沉积覆盖基底的一个或多个特征的小滴。在一些情况下,一个或多个喷嘴是成角度的。在一些情况下,多个沉积装置并排堆叠以实现吞吐量的成倍增加。在一些情况下,增益为2x、4x、8x或更多。沉积装置的实例为Samba打印头(Fujifilm)。Samba打印头可以与Samba Web管理工具(SWAT)一起使用。

  在一些寡核酸合成方法中,核酸试剂以非连续或按需滴落方法沉积在基底表面上。这类方法的实例包括机电转移方法、电热转移方法和静电吸引方法。在机电转移方法中,由电脉冲变形的压电元件导致小滴得以喷射。在电热转移方法中,在装置的腔室中生成气泡,并且气泡的膨胀力导致小滴得以喷射。在静电吸引方法中,利用静电吸引力将小滴喷射到基底上。在一些情况下,滴落频率为约5KHz至约500KHz;约5KHz至约100KHz;约10KHz至约500KHz;约10KHz至约100KHz;或约50KHz至约500KHz。在一些情况下,频率小于约500KHz、200KHz、100KHz或50KHz。

  在一些情况下,通过使用相同的沉积装置并使相同的沉积装置旋转一定的角度或者剑角(saber angle)来增加沉积位点的数目。通过旋转沉积装置,每个喷嘴以一定量的延迟时间对应于剑角进行喷射。这种不同步的喷射造成喷嘴之间的串扰。因此,当小滴以不同于0度的某一剑角喷射时,来自喷嘴的小滴体积可以是不同的。

  在一些情况下,寡核酸合成系统的配置允许连续的寡核酸合成工艺,该工艺利用基底的柔性来以卷到卷式工艺行进。该合成工艺以连续生产线方式进行操作,其中使用一个或多个卷轴来旋转基底的位置使基底行进通过寡核酸合成的各个阶段。在一些情况下,寡核酸合成反应包括滚动基底:通过在用于亚磷酰胺沉积的沉积装置下方的溶剂浴、通过氧化剂浴、通过乙腈洗涤浴,以及通过解封闭浴。任选地,带也穿过加帽浴。卷到卷式工艺允许包含合成的寡核酸的基底的最终产物容易地聚集在卷取卷轴上,在卷取卷轴处可将最终产物运输用于进一步处理或存储。

  在一些情况下,当连续柔性带沿着输送带系统输送时,寡核酸合成以连续工艺进行。类似于卷到卷式工艺,连续带上的寡核酸合成以生产线方式操作,其中基底在输送过程中行进通过寡核酸合成的各个阶段。然而,在输送带工艺中,连续带重新回到寡核酸合成步骤,而不需要滚动和展开带,如在卷到卷工艺中的。在一些情况下,将寡核酸合成步骤划分为区段,并且连续带在循环中一次或多次输送通过每个区段。在一些情况下,寡核酸合成反应包括(1)在循环中,将基底输送通过在用于亚磷酰胺沉积的沉积装置下方的溶剂浴、通过氧化剂浴、通过乙腈洗涤浴以及通过封闭浴;并随后(2)根据需要重复该循环以获得预定长度的合成的寡核酸。在一些情况下,在寡核酸合成之后,将柔性基底从输送带系统移除,并且任选地卷绕在卷轴上用于存储。

  计算机系统

  在多个方面,本文所述的任何系统均可操作地连接至计算机,并且任选地本地或远程地通过计算机进行自动化。在一些情况下,本文所述的方法和系统可进一步包括计算机系统上的软件程序及其使用。相应地,对于分配/抽真空/再填充功能的同步如编排和同步材料沉积装置运动、分配动作和真空致动的计算机化控制处于本发明的范围内。在一些情况下,计算机系统被编程为在用户指定的碱基序列与材料沉积装置的位置之间接合,以将正确的试剂递送至基底的指定区域。

  图4中示出的计算机系统400可被理解为能够从介质411和/或网络端口405读取指令的逻辑设备,其可任选地连接至具有固定介质412的服务器409。诸如图4示出的系统可包括CPU 401、磁盘驱动器403、任选的输入设备如键盘415和/或鼠标416以及任选的监视器407。可通过示出的通信媒介实现与本地或远程位置处的服务器的数据通信。通信媒介可包括传输和/或接收数据的任何手段。例如,通信媒介可以是网络连接、无线连接或因特网连接。这样的连接可提供经由万维网的通信。可以预期有关本公开内容的数据可经过这样的网络或连接而传输,以便由图4所示的用户方422接收和/或审阅。

  图5是示出可与本发明的示例实施方案结合使用的计算机系统500的第一示例架构的框图。如图5所示,该示例计算机系统可包括用于处理指令的处理器502。处理器的非限制性实例包括:Intel XeonTM处理器、AMD OpteronTM处理器、Samsung 32-bit RISC ARM 1176JZ(F)-S v1.0TM处理器、ARM Cortex-A8 Samsung S5PC100TM处理器、ARM Cortex-A8 Apple A4TM处理器、Marvell PXA 930TM处理器或功能上等效的处理器。多个执行线程可用于并行处理。在一些实施方案中,也可以使用多个处理器或具有多核的处理器,无论是在单一计算机系统中,在群集中,还是通过包含多个计算机、蜂窝电话和/或个人数据助理设备的网络跨系统分布。

  如图5所示,高速缓冲存储器504可连接至或并入处理器502,以提供由处理器502新近或频繁使用的指令或数据的高速存储器。处理器502通过处理器总线508连接至北桥506。北桥506通过存储器总线512连接至随机存取存储器(RAM)510,并管理处理器502对RAM 510的访问。北桥506还通过芯片集总线516连接至南桥514。南桥514又连接至外围总线518。外围总线可以是例如PCI、PCI-X、PCI Express或其他外围总线。北桥和南桥通常被称为处理器芯片集,并管理在处理器、RAM与外围总线518上的外围组件之间的数据传送。在一些供选择的架构中,北桥的功能性可以并入处理器,而不是使用单独的北桥芯片。

  在一些实施方案中,系统500可包括附接至外围总线518的加速器卡522。加速器可包括现场可编程门阵列(FPGA)或用于加速某个处理的其他硬件。例如,加速器可用于适应性数据重建或用来评估在扩展集处理中使用的代数表达式。

  软件和数据存储在外部存储器524中并可加载至RAM 510和/或高速缓冲存储器504中,以供处理器使用。系统500包括用于管理系统资源的操作系统;操作系统的非限制性实例包括:Linux、WindowsTM、MACOSTM、BlackBerry OSTM、iOSTM和其他功能上等效的操作系统,以及在操作系统顶部运行的、用于根据本发明的示例实施方案管理数据存储和优化的应用软件。

  在该实例中,系统500还包括与外围总线连接的网络接口卡(NIC)520和521,以提供与外部存储如网络附加存储(NAS)和可用于分布式并行处理的其他计算机系统的网络接口。

  图6是显示了具有多个计算机系统602a和602b、多个蜂窝电话和个人数据助理602c以及网络附加存储(NAS)604a和604b的网络600的示图。在示例实施方案中,系统602a、602b和602c可管理数据存储并优化对存储在网络附加存储(NAS)604a和604b中的数据的数据访问。数学模型可用于该数据并使用跨计算机系统602a和602b和蜂窝电话以及个人数据助理系统62102c的分布式并行处理进行评估。计算机系统602a和602b和蜂窝电话以及个人数据助理系统602c也可提供对存储在网络附加存储(NAS)604a和604b中的数据的适应性数据重建的并行处理。图6仅示出了一个实例,而多种多样的其他计算机架构和系统可与本发明的多个实施方案一起使用。例如,刀片式服务器可用来提供并行处理。处理器刀片可通过背板连接,以提供并行处理。存储还可通过单独的网络接口连接至背板或作为网络附加存储(NAS)。

  在一些示例实施方案中,处理器可维持单独的存储空间并通过网络接口、背板或其他连接器传输数据以便由其他处理器并行处理。在其他实施方案中,部分或全部的处理器可使用共享的虚拟地址存储空间。

  图7是根据示例实施方案使用共享虚拟地址存储空间的多处理器计算机系统700的框图。该系统包括可访问共享的存储器子系统704的多个处理器702a-f。该系统中并入存储器子系统704中的多个可编程硬件存储算法处理器(MAP)706a-f。MAP 706a-f中的每一个可包括存储器708a-f和一个或多个现场可编程门阵列(FPGA)710a-f。MAP提供了可配置的功能单元,并且可向FPGA 710a-f提供特定算法或算法的部分,以便与各自的处理器密切协调处理。例如,在示例实施方案中,MAP可用来评估与数据模型相关的代数表达式以及用来进行适应性数据重建。在该实例中,每一个MAP可被用于这些目的的所有处理器全局访问。在一种配置中,每一个MAP可使用直接存储器访问(DMA)以访问相关联的存储器708a-f,使其独立于且异步于各自的微处理器702a-f而执行任务。在这一配置中,MAP可将结果直接提供给另一MAP以用于流水处理和并行执行算法。

  以上计算机架构和系统仅为实例,并且多种多样的其他计算机、蜂窝电话和个人数据助理架构和系统可与示例实施方案结合使用,其包括使用普通处理器、协处理器、FPGA和其他可编程逻辑设备、芯片上系统(SOC)、专用集成电路(ASIC)和其他处理和逻辑元件的任何组合的系统。在一些实施方案中,全部或部分计算机系统可用软件或硬件来实现。任何种类的数据存储介质可与示例实施方案结合使用,其包括随机存取存储器、硬盘驱动器、闪速存储器、磁带驱动器、磁盘阵列、网络附加存储(NAS)和其他的本地或分布式数据存储设备和系统。

  在示例实施方案中,计算机系统可使用在任何上述或其他计算机架构和系统上执行的软件模块来实现。在其他实施方案中,系统的功能可部分或完全地在固件、可编程逻辑设备如图7所示的现场可编程门阵列(FPGA)、芯片上系统(SOC)、专用集成电路(ASIC)或其他处理和逻辑元件中实现。例如,集处理器(Set Processor)和优化器可通过使用硬件加速器卡用硬件加速方式实现。

  对于本领域技术人员而言,阐述以下实施例以更清楚地说明本文所公开的实施方案的原理和实践,并且这些实施例不应被解释为限制任何要求保护的实施方案的范围。除非另有说明,否则所有份数和百分比均以重量计。

  实施例

  实施例1:装置表面的功能化

  将装置进行功能化以支持寡核酸文库的附着和合成。首先使用包含90%H2SO4和10%H2O2的水虎鱼溶液(piranha solution)将装置表面润湿清洗20分钟。将该装置在具有去离子水的几个烧杯中冲洗,在去离子水鹅颈管水龙头下保持5min,并用N2干燥。随后将该装置在NH4OH(1:100;3mL:300mL)中浸泡5min,使用手枪喷嘴(handgun)以去离子水冲洗,在具有去离子水的连续三个烧杯中各浸泡1min,随后再使用手枪喷嘴以去离子水冲洗。然后通过将装置表面暴露于O2来等离子体清洗该装置。使用SAMCO PC-300仪器在下游模式下以250瓦的O2等离子体蚀刻1min。

  用包含N-(3-三乙氧基甲硅烷基丙基)-4-羟基丁酰胺的溶液使用具有以下参数的YES-1224P气相沉积烘箱系统使清洁的装置表面主动功能化:0.5至1托,60min,70℃,135℃汽化器。使用Brewer Science 200X旋转涂布仪对装置表面进行抗蚀剂涂覆。将SPRTM 3612光致抗蚀剂以2500rpm旋涂在装置上,时长40sec。该装置在Brewer热板上以90℃预烘30min。使用Karl Suss MA6掩模对准机对装置进行光刻。将该装置暴露2.2sec并在MSF 26A中显影1min。剩余的显影剂用手枪喷嘴冲洗,并将装置在水中浸泡5min。该装置在烘箱中以100℃烘烤30min,随后使用Nikon L200目视检查光刻缺陷。采用除渣工艺利用SAMCO PC-300仪器以250瓦的O2等离子体蚀刻1min来去除残余抗蚀剂。

  用全氟辛基三氯硅烷与10μL轻矿物油混合的100μL溶液使装置表面功能钝化。将该装置放置于腔室中,泵送10min,随后将阀门关闭至泵并静置10min。该腔室通风排气。该装置通过在70℃下在500mL NMP中以最大功率超声波处理(在Crest系统上9次)进行两次5min浸泡来剥离抗蚀剂。然后将装置在室温下在500mL异丙醇中浸泡5min,并以最大功率进行超声波处理。将该装置浸入300mL的200标准乙醇中并用N2吹干。激活该功能化表面以用作寡核酸合成的支持物。

  实施例2:在寡核苷酸合成装置上合成50-聚体序列

  将二维寡核苷酸合成装置组装至流动池中,其与流动池(Applied Biosystems(ABI394 DNA合成仪")连接。该二维寡核苷酸合成装置用N-(3-三乙氧基甲硅烷基丙基-4-羟基丁酰胺(Gelest)均匀地功能化,其用来使用本文所述的寡核苷酸合成方法合成50bp的示例性寡核苷酸("50-聚体寡核苷酸”)。

  该50-聚体的序列如SEQ ID NO.:1所述。5'AGACAATCAACCATTTGGGGTGGACAGCCTTGACCTCTAGACTTCGGCAT##TTTTTTTTTT3'(SEQ ID NO.:1),其中#表示胸苷-琥珀酰己酰胺CED亚磷酰胺(来自ChemGenes的CLP-2244),它是能够在脱保护过程中使寡核酸从表面上释放的可切割的连接体。

  根据表1中的方案和ABI合成仪,使用标准DNA合成化学法(偶联、加帽、氧化和解封闭)完成合成。

  表1:

  亚磷酰胺/活化剂组合以类似于本体试剂通过流动池的递送的方式进行递送。当在整个时间中环境保持被试剂“润湿”时,不进行干燥步骤。

  从ABI 394合成仪中去除限流器,以使得能够更快速流动。在没有限流器的情况下,酰胺类(amidites)(在ACN中0.1M)、活化剂(在ACN中的0.25M苯甲酰基硫基四唑(“BTT”;来自GlenResearch的30-3070-xx))和Ox(在20%吡啶、10%水和70%THF中的0.02M I2)的流速大致为~100uL/sec,乙腈(“ACN”)和加帽试剂(帽A和帽B的1:1混合物,其中帽A是在THF/吡啶中的乙酸酐,帽B是在THF中的16%1-甲基咪唑(1-methylimidizole))的流速大致为~200uL/sec,解封闭剂(在甲苯中的3%二氯乙酸)的流速大致为~300uL/sec(与之相比,在有限流器的情况下所有试剂均为~50uL/sec)。观测完全排出氧化剂的时间,相应地调节化学品流动时间的时间选择,并在不同的化学品之间引入额外的ACN洗涤。寡核苷酸合成之后,芯片在75psi下在气态氨中脱保护过夜。将五滴水施加到表面上以回收寡核酸。随后在BioAnalyzer小RNA芯片上分析所回收的寡核酸(数据未示出)。

  实施例3:在寡核苷酸合成装置上合成100-聚体序列

  使用在实施例2中描述的用于合成50-聚体序列的相同过程,在两个不同的硅芯片上合成100-聚体寡核苷酸(“100-聚体寡核苷酸”;5'CGGGATCCTTATCGTCATCGTCGTACAGATCCCGACCCATTTGCTGTCCACCAGTCATGCTAGCCATACCATGATGATGATGATGATGAGAACCCCGCAT##TTTTTTTTTT3',其中#表示胸苷-琥珀酰己酰胺CED亚磷酰胺(来自ChemGenes的CLP-2244);SEQ ID NO.:2),第一个用N-(3-三乙氧基甲硅烷基丙基-4-羟基丁酰胺均匀地功能化,而第二个用11-乙酰氧基十一烷基三乙氧基硅烷和正癸基三乙氧基硅烷的5/95混合物功能化,并在BioAnalyzer仪器上分析从表面提取的寡核酸(数据未示出)。

  在50uL PCR混合物(25uL NEB Q5主混合物,2.5uL 10uM正向引物,2.5uL 10uM反向引物,从表面提取的1uL寡核酸,和加至50uL的水)中使用正向(5'ATGCGGGGTTCTCATCATC3';SEQ ID NO.:3)和反向(5'CGGGATCCTTATCGTCATCG3';SEQ ID NO.:4)引物,使用下列热循环程序,进一步PCR扩增来自两个芯片的全部十个样品:

  98C,30sec

  98C,10sec;63C,10sec;72C,10sec;重复12个循环

  72C,2min

  PCR产物还在BioAnalyzer上运行(数据未示出),在100-聚体位置处显示尖锐峰。然后,对PCR扩增的样品进行克隆,并进行Sanger测序。表2总结了从来自芯片1的斑点1-5采集的样品和从来自芯片2的斑点6-10采集的样品的Sanger测序结果。

  表2:

  

  因此,合成的寡核苷酸的高质量和均匀性在具有不同表面化学的两个芯片上重复。总体上,89%,相当于被测序的262个100-聚体中的233个,是没有错误的完美序列。

  最后,表3总结了从来自斑点1-10的寡核苷酸样品中获得的序列的错误特征。

  表3:

  实施例4:高度准确的基于DNA的信息存储和找回

  以二进制数据的形式选择数字信息,该二进制数据总计约0.2GB,包含超过100种语言的“世界人权宣言(Universal Declaration of Human Rights)”的内容、Project Guttenberg的前100本书和种子数据库。将数字信息加密成基于核酸的序列并划分为字符串。以类似于实施例2中所述的方式,在刚性硅表面上合成超过1千万个不同的寡核酸,每个对应于一个字符串。每个不同的寡核酸的长度等于或小于200个碱基。收集合成的寡核酸并对该寡核酸进行测序,并解码回数字代码,对于源数字信息具有100%的准确度。

  实施例5:具有高密度特征的柔性基底

  用核苷偶联试剂涂覆包含热塑性材料的柔性结构。将涂层剂图案化以获得高密度的特征。图2B中示出了柔性表面的一部分。每个特征具有10um的直径,且两个相邻特征之间的中心距为21um。在寡核酸合成沉积步骤期间,特征尺寸足以容纳0.2pl的固着滴体积。小特征尺寸允许在基底表面上合成高密度的寡核酸。特征密度为22亿个特征/m2(1个特征/441×10-12m2)。4.5m2的基底被制造成具有100亿个特征,每个特征具有10um的直径。将柔性结构任选地放置在连续环路系统中(图2A),用于寡核酸合成。

  实施例6:在柔性基底上的寡核酸合成

  制备在热塑性柔性材料上包含多个特征的柔性基底。该基底用作使用包含沉积装置的寡核酸合成装置合成寡核酸的支持体。该柔性基底为柔性介质的形式,非常像磁性卷到卷带。

  从头合成以连续生产线方式进行,其中基底行进通过溶剂浴,并随后行进至一堆打印头下方,在此处将亚磷酰胺印刷到基底上。使表面上沉积有固着滴的柔性基底滚入氧化剂浴,然后带从氧化浴中涌出来并浸入乙腈洗涤浴中,然后浸入解封闭浴中。任选地,带穿过加帽浴。在替代的工作流程中,柔性基底从氧化浴中涌出来并在洗涤步骤中用乙腈进行喷射。

  或者,使用喷杆代替液体浴。在该工艺中,仍然采用喷墨装置将核苷酸沉积在表面上,但充溢步骤现在在具有喷嘴的腔室中完成。例如,沉积装置具有2,048个喷嘴,每个喷嘴以每个小滴1个核碱基每秒沉积100,000个小滴。存在顺序排列的喷嘴以模拟标准亚磷酰胺化学法中的充溢步骤的顺序。这种技术可容易地改变喷杆中装载的化学物质,以适应不同的工艺步骤。以与如实施例2中所述的方式相同的方式将寡核酸脱保护或切割。

  对于每个沉积装置,每天(24小时)在基底上沉积超过1.75×1013个核碱基。合成多个200个核碱基的寡核酸。在3天(72小时)内,以每天1.75×1013个碱基的速度,合成262.5×109个寡核酸。

  虽然本文已经示出和描述了本发明的特定实施方案,但是这些实施方案仅通过举例的方式提供对于本领域技术人员来说是显而易见的。在不脱离本发明的情况下本领域技术人员将会想到许多变化、改变和替换。应当理解,本文所述发明的实施方案的各种替代方案可用于实施本发明。其意图在于下列权利要求限定本发明的范围并且由此覆盖这些权利要求的范围内的方法和结构及其等同物。

  序列表

  <110> 特韦斯特生物科学公司

  <120> 用于核酸合成的柔性基底

  <130> 44854-717.601

  <140>

  <141>

  <150> 62/222,020

  <151> 2015-09-22

  <160> 4

  <170> PatentIn version 3.5

  <210> 1

  <211> 62

  <212> DNA

  <213> 人工序列

  <220>

  <223> 人工序列的描述:合成

  寡核苷酸

  <400> 1

  agacaatcaa ccatttgggg tggacagcct tgacctctag acttcggcat tttttttttt 60

  tt 62

  <210> 2

  <211> 112

  <212> DNA

  <213> 人工序列

  <220>

  <223> 人工序列的描述:合成

  多核苷酸

  <400> 2

  cgggatcctt atcgtcatcg tcgtacagat cccgacccat ttgctgtcca ccagtcatgc 60

  tagccatacc atgatgatga tgatgatgag aaccccgcat tttttttttt tt 112

  <210> 3

  <211> 19

  <212> DNA

  <213> 人工序列

  <220>

  <223> 人工序列的描述:合成

  引物

  <400> 3

  atgcggggtt ctcatcatc 19

  <210> 4

  <211> 20

  <212> DNA

  <213> 人工序列

  <220>

  <223> 人工序列的描述:合成

  引物

  <400> 4

  cgggatcctt atcgtcatcg 20

《用于核酸合成的柔性基底.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)