欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 用纳米孔的聚合物分析中的混合光学信号独创技术97832字

用纳米孔的聚合物分析中的混合光学信号

2021-02-02 19:05:05

用纳米孔的聚合物分析中的混合光学信号

  相关申请的交叉引用

  本申请要求于2016年4月14日提交的美国临时专利申请第62/322,343号的优先权的权益,该临时专利申请的内容通过引用以其整体并入本文。

  背景

  纳米孔测序(nanopore sequencing)已经被提出作为克服当前DNA测序技术中的许多挑战的方法,包括降低每次测序成本、简化样品制备、减少运行时间、增加序列读取长度、提供实时样品分析及类似方法。然而,用纳米孔的聚合物分析,例如DNA分析,具有其自身的一系列技术困难,例如可靠的纳米结构制造、DNA易位速率(translocation rate)的控制、明确的核苷酸识别、来自纳米标度传感器(nanoscale sensor)的大的阵列的信号的检测和处理等等,例如Branton等人,Nature Biotechnology,26(10):1146-1153(2008)。

  核苷酸的光学检测已经被提出作为纳米孔测序领域中一些技术困难的潜在解决方案,例如,从纳米孔的大阵列收集独立信号的困难。然而,在基于荧光的信号的情况下,克服单个分子的光学检测中的背景噪声仍然是显著的挑战,这已经导致显微镜系统的频繁使用,例如全内反射荧光(total internal reflection fluorescence)(TIRF)系统,该系统通过限制激发的空间区来最小化背景激发。然而,即使在用于限制激发体积的当前可用的技术的情况下,在任何时刻收集的信号可以包括来自相同分辨率受限区(resolution limited area)和激发体积中的多个光学标记物的贡献,这使基本调用(base calling)极大地复杂化。

  鉴于上文,如果尽管检测到包括来自多种空间上不可区分的标记物的光的光学信号,将允许明确的基本呼叫的方法和装置是可用的,那么对于纳米孔测序技术及其具体应用将是有利的,例如基于光学的纳米孔测序(optically-based nanopore sequencing)。

  发明概述

  本发明涉及用于使用光学标记物和纳米孔进行聚合物分析,特别是多核苷酸分析的方法和装置。

  在某些实施方案中,本发明涉及分析聚合物的方法,所述方法包括以下步骤:(a)将聚合物易位穿过纳米孔,其中聚合物的不同种类的单体被标记有产生可区分的光学信号的不同光学标记物,并且其中纳米孔限制单体将单个文件(file)移动穿过包括多种单体的激发区;(b)当聚合物穿过激发区时,检测来自单体的光学信号的时间排序组(time-ordered set);(c)将来自不同种类的单体的光学信号分开,以形成光学信号的单体特异性时间排序组;以及(d)由来自聚合物的光学信号的单体特异性时间排序组确定单体的序列。

  在其他实施方案中,本发明涉及分析多核苷酸的方法,所述方法包括以下步骤:(a)将多核苷酸易位穿过纳米孔,多核苷酸的核苷酸被标记有荧光标记物,并且纳米孔具有钻孔(bore),所述钻孔在空间上限制荧光标记物以防止在其易位期间荧光信号的发射;(b)激发荧光标记物;(c)当多核苷酸易位穿过钻孔时,检测来自荧光标记物的荧光信号的时间序列;以及(d)从荧光信号的时间序列确定被附接至多核苷酸的核苷酸的荧光标记物的序列。

  本发明有利地克服了基于光学的纳米孔分析中的包括多于一种光学标记物的贡献的光学测量的问题。本发明的这些优点和其他优点在许多实施方式和应用中被例示,其中的某些在下文和整个说明书中被总结。

  附图简述

  图1图示出了使用FRET和落射照明系统(epi-illumination system)的实施方案中的本发明的元件。

  图2A图示出了使用FRET和TIRF系统的实施方案中的本发明的元件。

  图2B图示出了实施方案中的本发明的元件,在所述实施方案中,当两种标记的单体穿过激发区时,它们同时发射光学信号。

  图3图示出了共聚焦落射照明系统的基本部件。

  图4A-图4B图示出了不具有FRET的用于激发的TIRF系统的元件。

  图5是流程图,其图示出了用于基于包括来自多种光学标记物的光的光学信号的测量来调用(calling)核苷酸序列的步骤。

  图6A-图6C图示出了分别在反式室(trans chamber)、顺式室(cis chamber)以及顺式室和反式室两者中采用猝灭剂(quenching agent)的本发明的实施方案。

  图7图示出了使用蛋白质纳米孔(protein nanopore)和在纳米孔阵列上具有金属层的落射照明以减小背景或具有FRET的TIR的本发明的实施方案。

  发明详述

  虽然本发明适于多种修改和替代形式,但其细节已经在附图中通过实例的方式被示出并将详细地被描述。然而,应当理解,本发明不将本发明限于所描述的具体实施方案。相反,本发明将覆盖落在本发明的精神和范围内的所有修改、替代物和等效物。例如,为了说明的目的,示出了本发明的特定的纳米孔类型和数目、特定的标记物、FRET对、检测方案、制造方法。然而,应当理解,本公开内容并不意图在这方面是限制性的,因为其他类型的纳米孔、纳米孔的阵列和其他制造技术可以被用于实施本文讨论的系统的多个方面。用于本发明的方面的指南可以在对于本领域普通技术人员熟知的许多可用的参考文献和专著中找到,包括例如Cao,Nanostructures&Nanomaterials(Imperial College Press,2004);Levinson,Principles of Lithography,第二版(SPIE Press,2005);Doering和Nishi,编辑,Handbook of Semiconductor Manufacturing Technology,第二版(CRC Press,2007);Sawyer等人,Electrochemistry for Chemists,第2版(Wiley Interscience,1995);Bard和Faulkner,Electrochemical Methods:Fundamentals and Applications,第2版(Wiley,2000);Lakowicz,Principles of Fluorescence Spectroscopy,第3版(Springer,2006);Hermanson,Bioconjugate Techniques,第二版(Academic Press,2008);及类似参考文献和专著,所述参考文献和专著的相关部分据此通过引用并入。

  在一个方面中,本发明涉及用于使用纳米孔和光学检测分析聚合物的方法和装置。在某些实施方案中,不同种类的单体具有产生可区分的光学信号的不同标记物,所述可区分的光学信号允许识别单体。这样的标记的聚合物可以被易位穿过纳米孔,所述纳米孔限制单体将单个文件移动穿过分辨率受限区中的光学检测区或者交叉分辨率受限区中的光学检测区。从这样的分辨率受限区测量一系列光学信号,其中每个光学测量包括来自不同的邻近单体的多个分量信号(其在聚合物中的顺序不能由单个测量来确定,因为例如分量信号从衍射受限区内产生)。部分地,本发明基于以下认识和理解:在某些配置中,聚合物的基于光学的纳米孔分析(i)产生光学测量的时间序列,所述时间序列包括来自多于一种标记单体的序列的重叠贡献(overlapping contribution),从而使得难以(如果不是不可能的话)从单个测量确定单体的排序,以及(ii)通过选择用于产生可区分信号的单体的光学标记物,光学测量可以被分成来自不同种类的单体上的不同标记物的贡献,这允许重叠测量被转化成序列信息。

  在一个方面中,本发明的方法可以通过以下步骤来实施:(a)将聚合物易位穿过纳米孔,其中聚合物的不同种类的单体被标记有产生可区分的光学信号的不同光学标记物,并且其中纳米孔限制单体将单个文件移动穿过包括多种单体的激发区或信号产生区;(b)当聚合物穿过激发区或信号产生区时,检测来自单体的光学信号的时间序列;(c)将来自不同种类的单体的光学信号分开;以及(d)由来自激发区或信号产生区的分开的光学信号的时间序列确定单体的序列。

  如本文使用的,术语“激发区”、“信号产生区”、“检测区”或类似术语意指邻近产生或收集光学信号的纳米孔的空间区域或体积。在某些实施方案中,标记的单体可以在“转变间隔(transition interval)”期间经过(transit)这样的区域。这样的区域或体积可以由对本领域技术人员已知的若干因素来确定,包括但不限于其中激发能被递送至光学标记物(例如FRET、TIRF或类似物)的方式、光学标记物的性质(例如是否存在自猝灭(self-quenching)和/或相互猝灭)、采用的纳米孔配置(例如蛋白质纳米孔或非蛋白质纳米孔、光阻挡层(light-blocking layer)的存在或不存在)、猝灭剂的存在或不存在等。在某些实施方案中,激发区或信号产生区可以通过测量由测试多核苷酸或校准多核苷酸产生的光学信号凭经验地确定,所述测试多核苷酸或校准多核苷酸具有已知的核苷酸序列、已知的标记物和/或已知的猝灭剂浓度。在某些实施方案中,邻近纳米孔的激发区或信号产生区各自具有体积和几何形状,使得占据这样的体积的核苷酸的数目在从1至4的范围内,或在从1至3的范围内,或在另外其他的实施方案中,在从1至2的范围内。在某些实施方案中,这样的区域包括邻近纳米孔的反式开口(trans opening)的单个连续的体积。

  在某些实施方案中,本发明涉及使用纳米孔、荧光猝灭和荧光发信号(fluorescent signaling)来顺序地识别荧光标记的多核苷酸分析物的核苷酸。这样的多核苷酸分析物的分析可以在单个多核苷酸上或在多个多核苷酸上同时平行地进行,例如通过使用纳米孔的阵列。在某些实施方案中,核苷酸被标记有荧光标记物,当被附接至多核苷酸时,所述荧光标记物能够具有至少三种状态:(i)大体上猝灭状态,其中附接的荧光标记物的荧光通过紧密邻近单体上的荧光标记物来猝灭,或者通过与猝灭剂的相互作用来猝灭;例如,当标记的多核苷酸在用于研究和操纵多核苷酸的常规水溶液或缓冲液中处于游离(free)时,被附接至根据本发明的多核苷酸的荧光标记物被大体上猝灭,(ii)空间受限状态,当标记的多核苷酸被易位穿过纳米孔时,使得附接的荧光标记物的自由溶液运动或排列被破坏或受限制,使得存在很少或不存在由荧光标记物产生的可检测的荧光信号。(iii)转变(transition)状态,其中当荧光标记物的核苷酸离开纳米孔时(在“转变间隔”或“间隔”期间),被附接至多核苷酸的荧光标记物从空间受限状态转变到猝灭状态。本发明的某些实施方案(部分地)是以下发现的应用:在转变间隔期间,荧光标记物(在以其他方式大体上完全标记的和自猝灭的或猝灭的多核苷酸上)能够产生可检测的荧光信号;以及有助于测量信号的离开标记物(exiting label)的数目可以(至少部分地)通过控制标记的多核苷酸的易位速度来控制。如果易位速度(例如,每毫秒离开纳米孔的核苷酸)高于转变速率(从有信号能力(signal-capable)到猝灭,即猝灭速率),那么测量的荧光信号或信号样品可以包括来自多于一种标记物的贡献。此情况使得信号分析更困难,并且可能更不精确。根据某些实施方案,此问题可以通过调节易位速度来改善,例如通过降低易位速度,使得一次大体上仅一种荧光标记物对测量的荧光信号贡献荧光。

  不受任何基于此发现的理论所限制的意图,据信在转变间隔期间产生的荧光信号是由于从纳米孔中出现的荧光标记物的一个或更多个自由可旋转的偶极的存在,这致使荧光标记物能够产生荧光信号,例如在直接激发之后或经由经由FRET的激发。在某些实施方案中,多核苷酸是单链多核苷酸,例如DNA或RNA,但特别是单链DNA。在某些实施方案中,本发明包括用于确定多核苷酸的核苷酸序列的方法,该方法通过在多核苷酸易位穿过纳米孔时记录当荧光标记物一次一种地离开纳米孔时,由荧光标记物产生的信号。在某些实施方案中,可以选择易位速度以最小化有助于测量的荧光信号的荧光标记物的数目。这样的选择可以通过实时调节在操作期间可控的参数(例如跨过纳米孔的电压、温度或类似参数)或通过预先确定的仪器设置(例如反应缓冲液粘度、离子浓度或类似设置)来进行。在离开后,在转变间隔期间,每种附接的荧光标记物从纳米孔中的受限状态转变成自由溶液中的多核苷酸上的猝灭状态。在转变间隔期间,标记物能够产生可以被测量的荧光信号。换句话说,在某些实施方案中,本发明的方法的步骤包括当每种荧光标记物从纳米孔中的受限状态转变成自由溶液中的聚合物上的猝灭状态时,激发每种荧光标记物。如上文提及的,在此转变间隔或时间段期间,荧光标记物能够发射指示其被附接至的核苷酸的可检测的荧光信号。

  在某些实施方案中,如上文使用的“大体上猝灭的”意指荧光标记物产生由在相同条件下产生的信号减少至少百分之三十的荧光信号,而不具有相邻的相互猝灭的标记物。在某些实施方案中,如上文使用的“大体上猝灭的”意指荧光标记物产生由在相同条件下产生的信号减少至少百分之五十的荧光信号,而不具有相邻的相互猝灭的标记物。

  在某些实施方案中,光学信号可以是FRET信号,或者它们可以是来自被附接至单体的直接激发的荧光标记物的荧光发射。图1图示出了一个实施方案的部件,在所述实施方案中,蛋白质纳米孔(100)被布置在脂质双层(102)中,所述脂质双层(102)(进而)被布置成跨过固态膜(106)的孔(104),所述固态膜(106)包括不透明层(108)(例如金属层)、氮化硅层(110)和硅支撑层(112)。不透明层(108)防止或减少激发光束(114)(excitation beam)透射穿过固态膜(106),在所述固态膜(106)中所述激发光束(114)可以激发不希望的背景荧光。当具有不同标记的单体(被图示为黑色(122)和白色(124))的聚合物(120)穿过纳米孔(100)时,在每个测量间隔,多种单体(例如141、142和143)存在于相同分辨率限制区内的激发区(126)和(128)中。在图示的实施方案中,用落射照明系统进行光学测量,并且假定纳米孔(100)已经被选择,使得从单体内部至纳米孔(100)的光学信号被抑制,并且不有助于测量的光学信号。激发区(128)是邻近FRET供体(130)的FRET区;也就是,激发区(128)限定与FRET供体(130)的距离,在该距离内,FRET可以在FRET供体(130)和被附接至单体的光学标记物之间发生,所述光学标记物还可以被称为受体标记物或FRET受体标记物。激发区(126)是激发光束(114)的分量进入孔(104)中的非传播突起(non-propagating protrusion),每当孔(104)的尺寸被选择成足够地低于激发光束(114)的波长时,所述非传播突起发生。如图示的,在此实施方案中,多种单体(141、142和143)将有助于在单体(141、142和143)处于激发区(126)和(128)期间的瞬间或间隔测量的光学信号。

  图2图示出了实施方案,其中在系统中的全内反射荧光(TIRF)激发下进行光学测量,例如在Soni等人,Review of Scientific Instruments,81:014301(2010);和在美国专利公布2012/0135410中描述的,这些参考文献通过引用并入本文。在此实施方案中,具有附接的FRET供体(202)的蛋白质纳米孔(200)被插入到脂质双层(204)中,所述脂质双层(204)被布置在具有孔(208)的固态膜(206)上。通过选择具有不同折射率的固态膜(206)的顺式(205)侧和反式(207)侧上的电解质,使全内部反射(TIR)成为可能。结果,TIR边界(210)在固态膜(206)被布置处于的平面处或附近产生,使得渐逝场(evanescent field)在固态膜(206)的顺式(205)侧产生。渐逝场可以在光学标记物进入纳米孔(200)之前激发光学标记物。FRET供体(202)被在TIR边界(210)处反射的光直接激发,使得FRET可以在FRET供体(202)和FRET区(220)内的单体(219)上的标记物之间发生。如在图1的实施方案中,可以选择纳米孔(200),使得当标记的单体在纳米孔(200)的钻孔(bore)中时,通过标记物的荧光发射被抑制。多种单体例如225、226和227有助于以该图中的指示的配置记录的光学测量。

  在某些实施方案中,可以单独使用类似于图4A中示出的设备通过渐逝场来激发单体上的标记物。在此设备中,在纳米孔或纳米孔阵列的反式侧上的非常窄的第二室允许渐逝场从下面的载玻片的表面延伸,以在纳米孔的入口和出口处建立激发区,使得与纳米孔相关的每个光学测量包括来自多种标记的单体的贡献。孔的阵列(400)(其可以包括被插入到脂质双层中的蛋白质纳米孔)可以在氮化硅层(402)中形成,所述氮化硅层(402)可以具有在从20nm-100nm的范围内的厚度。氮化硅层(402)可以在硅支撑层(403)上形成。第二室(406)可以由氮化硅层(402)、确定第二室(406)的高度的二氧化硅层(404)和载玻片(410)的表面(408)形成。二氧化硅层(404)可以具有在从50nm-100nm的范围内的厚度。从表面(408)延伸跨过氮化硅层(402)的期望的渐逝场可以通过以相对于载玻片(410)的合适的角度引导光束(412)使得TIR发生来建立。为了驱动标记的多核苷酸分析物穿过阵列(400),顺式(-)条件可以在第一室(416)中建立,并且反式(+)条件可以在第二室(406)中建立,其中电极可操作地连接至第一室和第二室(406和421)。图4B是阵列(400)中的孔的特定实施方案的特写,其示意性地示出了被插入在脂质双层(422)中的蛋白质纳米孔(420),所述脂质双层(422)被布置在氮化硅层(402)的表面上。具有标记的单体(例如,427)的聚合物(425)被示出易位穿过纳米孔(420),所述纳米孔(420)已经被选择成具有钻孔(421),所述钻孔(421)具有造成钻孔(421)内部的标记物的荧光发射的抑制的尺寸。在此实施方案中,在特定的时间点t或间隔,来自包括孔(400)的分辨率受限区的测量的光学信号可以包括来自激发区中的单体例如单体n1-n4和n13-n15上的多种标记物的贡献。

  图2B提供了收集荧光信号的另外的图示,所述荧光信号包括由两种标记的单体产生的荧光。图2B示出了易位穿过纳米孔(2002)的标记的多核苷酸(2000),其中标记的多核苷酸(2000)包括两种标记物“a”和“b”(例如,其可以对应于标记有“a”的dC以及标记有“b”的dA、dG和dT,或类似物)。不含纳米孔(2002)的核苷酸的标记物通过与其他标记物(2011)的相互作用或通过猝灭剂的作用(未示出)来猝灭。纳米孔(2002)内的核苷酸的标记物被限制和/或定向(2014),使得它们在其经过纳米孔的全部或部分期间不产生可检测的信号。随着标记的多核苷酸(2000)的核苷酸从纳米孔(2002)的出口(2015)出现,它们变得能够被激发光束(2010)激发,并且在被猝灭前产生可检测的信号持续一定间隔。如果易位速度V1高,那么在猝灭前核苷酸行进的距离(2008)可以超过多核苷酸(2000)的核苷酸间的距离,使得多于一种标记物对由检测器(2018)收集的荧光信号,即测量的荧光信号贡献荧光。由于相邻标记物之间的距离低于激发光(2010)的衍射限值,所以没有获得关于标记物的排序的信息(在激发区或信号产生区中(如果由猝灭定义的)(2099)),尽管存在使用专用算法推断这样的信息的方法,例如Timp等人,Biophys.J.,102:L37-L39(2012);Carson等人,Nanotechnology,26:074004(2015)。在使用具有有区别的发射波段的荧光标记物的光学检测的情况下,测量的荧光信号可以被分成两个或更多个通道,例如使用带通滤波器(bandpass filter),以便评估来自多种标记物的荧光的相对贡献。然而,随着贡献荧光的荧光标记物的数目增加,例如3个、4个或更多个,确定核苷酸的正确排序的难度增加。用于两个通道的信号强度,例如对应于两种荧光标记物的发射最大值在图2B中图示(2031和2032),其中两种荧光标记物有助于测量的信号。由实线例如2033表示的强度值来自标记物“a”,而由虚线例如2036表示的强度值来自标记物“b”。图2B的两个通道中的实线和虚线的存在反映荧光标记物的重叠的发射波段,当一起收集时,这使分析复杂化,因为测量的强度的量来自两种标记物。

  序列确定

  根据本发明,当标记的聚合物易位穿过纳米孔及其相关的激发区时,记录光学测量的时间排序组。在每个光学测量包括来自邻近单体的标记物的贡献的意义上,在邻近时间点的光学测量是重叠的。因此,例如,如果三种单体在各自时间点产生信号(例如,聚合物...-A-(B-C-D)-...的B、C和D从左至右移动穿过激发区),并且如果一种单体离开激发区而另一种单体在连续测量之间进入激发区(由括号指示的)(例如,A进入而D离开:-(A-B-C)-D...),那么两次连续的光学测量将包括来自相同单体的贡献(在此实例中,两次测量均包括来自B和C的贡献。上文实例基于聚合物易位穿过纳米孔的非常简化的模型;然而,连续重叠的光学测量的概念适用于更复杂的聚合物易位的描述。

  由于在纳米孔处从多种不同的标记的单体的发射源自相同的分辨率受限区,所以关于单体的相对位置信息(特别是序列信息)不能由单个光学测量来确定。然而,由于产生单体特异性信号的标记物的重叠和使用,在某些实施方案中,当其被分成单体特异性信号的多个时间排序组时,序列信息可以由光学信号测量的时间排序组来确定。类似于在杂交测序(sequencing-by-hybridization)(SBH)中使用的以从杂交数据重建目标多核苷酸序列(target polynucleotide sequence)的算法此处可以被用于重建目标多核苷酸,例如美国专利5,002,867;Timp等人,Biophys.J.,102:L37-L39(2012);或类似参考文献,这些参考文献通过引用并入。(i)时序重叠信号和信号以及(ii)它们分成单体特异性分量的限制显著地简化光学检测的情况下的确定步骤。

  图5图示出了用于基于纳米孔易位的简单模型由重叠的光学信号的时间排序组确定单体序列信息的步骤的一个实施方案。简单的模型假定在每个时间步骤的光学测量(除了在聚合物从纳米孔的入口和出口处)各自包括来自相同数目的单体的信号贡献(在图5中被称为“n元组(n-tuple)”以指示测量将包括来自n种单体的贡献)。应理解,更复杂的模型可以允许每次测量中不同数目的贡献单体、允许易位速速度的局部变化、单体的线性移动的偏离及其他类似现象。也就是,在某些实施方案中,在不同时间的光学测量可以具有来自不同数目的核苷酸的贡献。在某些实施方案中,不同数目的核苷酸沿着目标多核苷酸的片段排序。由图5图示的确定步骤假定标记的聚合物已经穿过纳米孔,并已经进行了光学测量的时间排序组,包括将光学信号分成单体特异性信号(500)。聚合物的入口和出口被不同地处理,因为在进入和离开时,在激发区中存在必定不同数目的单体。在此实施方案中,假定在这些条件下的初始光学测量和最终光学测量允许初始单体和最终单体由它们的单体特异性信号来直接确定。在其他实施方案中,用于分析的标记的聚合物的制备可以包括在这样的标记的聚合物的一端或两端处插入多种预先确定的标记的核苷酸,用于产生光学信号的已知序列以有助于序列确定步骤的目的。这样的预先确定的标记的核苷酸将类似于IonTorrent或454测序中的关键序列,例如美国专利7,575,865,该专利通过引用并入。

  回到图5,在确定步骤开始时,时间指数(time index)i被设置成0;在当前时间i的候选序列的指数j被设置成1(502);并且检查单体特异性时间排序光学信号的组的初始n元组(504)。这样的检查包括首先由在时间i的测量确定与该测量一致的单体的所有可能的n元组,然后由那些n元组确定哪些合适地重叠候选序列Si。对于与测量一致的组(506),通过各自合适地重叠的n元组形成新的候选序列Si+1(并且延伸序列Si)。新延伸的候选序列Si+1被存储,并且给出在时间i+1、Ji+1的候选序列的数目的指数被更新(508)。重复此步骤,直到已经检查每一个候选序列Si(510),并且在每个时间i进行类似的检查,直到已经检查时间排序组中的每个光学测量。

  纳米孔和纳米孔阵列

  与本发明一起使用的纳米孔可以是固态纳米孔、蛋白质纳米孔或混合纳米孔(hybrid nanopore),所述混合纳米孔包括蛋白质纳米孔或有机纳米管例如碳纳米管或石墨烯纳米管,所述纳米孔被配置在固态膜或类似框架中。纳米孔的重要特征包括限制聚合物分析物,例如多核苷酸,使得它们的单体依次穿过信号产生区(或激发区或类似区域),也就是,使得单体,例如核苷酸,以单个文件穿过检测区(或激发区或类似区域)。在某些实施方案中,纳米孔的另外特征包括使单链核酸通过,而不使双链核酸,或等效大体积分子通过。在其他实施方案中,纳米孔,特别是蛋白质纳米孔,可以被选择,使得它们的钻孔被定尺寸,使得单体的标记物在空间上受限制,使得FRET信号,或甚至荧光信号被抑制。

  在某些实施方案中,与本发明的方法和装置结合使用的纳米孔被设置成阵列的形式,例如纳米孔的簇的阵列,其可以被规则地布置在平的表面上。在某些实施方案中,簇各自在单独的分辨率受限区中,使得来自不同簇的纳米孔的光学信号通过所采用的光学检测系统可区分,但来自相同簇内的纳米孔的光学信号不一定通过所采用的光学检测系统被分配至这样的簇内的特定的纳米孔。

  固态纳米孔可以以多种材料来制造,所述材料包括但不限于氮化硅(Si3N4)、二氧化硅(Si02)及类似材料。用于分析应用例如DNA测序的纳米孔的制造和操作在以下示例性参考文献中公开,所述参考文献通过引用并入:Ling,美国专利7,678,562;Hu等人,美国专利7,397,232;Golovchenko等人,美国专利6,464,842;Chu等人,美国专利5,798,042;Sauer等人,美国专利7,001,792;Su等人,美国专利7,744,816;Church等人,美国专利5,795,782;Bayley等人,美国专利6,426,231;Akeson等人,美国专利7,189,503;Bayley等人,美国专利6,916,665;Akeson等人,美国专利6,267,872;Meller等人,美国专利公布2009/0029477;Howorka等人,国际专利公布WO2009/007743;Brown等人,国际专利公布WO2011/067559;Meller等人,国际专利公布WO2009/020682;Polonsky等人,国际专利公布WO2008/092760;Van der Zaag等人,国际专利公布WO2010/007537;Yan等人,Nano Letters,5(6):1129-1134(2005);Iqbal等人,Nature Nanotechnology,2:243-248(2007);Wanunu等人,Nano Letters,7(6):1580-1585(2007);Dekker,Nature Nanotechnology,2:209-215(2007);Storm等人,Nature Materials,2:537-540(2003);Wu等人,Electrophoresis,29(13):2754-2759(2008);Nakane等人,Electrophoresis,23:2592-2601(2002);Zhe等人,J.Micromech.Microeng.,17:304-313(2007);Henriquez等人,The Analyst,129:478-482(2004);Jagtiani等人,J.Micromech.Microeng.,16:1530-1539(2006);Nakane等人,J.Phys.Condens.Matter,15R1365-R1393(2003);DeBlois等人,Rev.Sci.Instruments,41(7):909-916(1970);Clarke等人,Nature Nanotechnology,4(4):265-270(2009);Bayley等人,美国专利公布2003/0215881;及类似参考文献。

  在某些实施方案中,本发明包括具有一个或更多个光阻挡层,也就是一个或更多个不透明层的纳米孔阵列。典型地,纳米孔阵列以薄的材料片材来制造,例如硅、氮化硅、氧化硅、氧化铝或类似物,这些材料容易地透射光,特别是在使用的厚度,例如小于50nm-100nm。对于分析物的电学检测,这不是问题。然而,在易位纳米孔的标记的分子的基于光学的检测中,透射穿过阵列的光总是激发意图的反应位点之外的材料,从而产生光学噪音,例如来自非特异性背景荧光、来自尚未进入纳米孔的分子的标记物的荧光或类似物。在一个方面中,本发明通过以下来解决此问题:提供具有一个或更多个光阻挡层的纳米孔阵列,从而降低在与阵列的纳米孔相关的意图的反应位点处产生的光学信号的背景噪音,所述一个或更多个光阻挡层反射和/或吸收来自激发光束的光。在某些实施方案中,这允许意图的反应位点中的光学标记物通过直接照明被激发。在某些实施方案中,不透明层可以是金属层。这样的金属层可以包含Sn、Al、V、Ti、Ni、Mo、Ta、W、Au、Ag或Cu。在某些实施方案中,这样的金属层可以包含Al、Au、Ag或Cu。在另外其他的实施方案中,这样的金属层可以包含铝或金,或可以仅包含铝。不透明层的厚度可以广泛地变化,并且取决于包含该层的材料的物理性质和化学性质。在某些实施方案中,不透明层的厚度可以是至少5nm,或至少10nm,或至少40nm。在其他实施方案中,不透明层的厚度可以在从5nm-100nm的范围内;在其他实施方案中,不透明层的厚度可以在从10nm-80nm的范围内。不透明层不需要阻挡(即反射或吸收)来自激发光束的100%的光。在某些实施方案中,不透明层可以阻挡来自激发光束的入射光的至少10%;在其他实施方案中,不透明层可以阻挡来自激发光束的入射光的至少50%。

  不透明层或涂层可以通过本领域已知的多种技术被制造在固态膜上。可以使用材料沉积技术,包括化学气相沉积、电沉积、外延、热氧化、物理气相沉积(包括蒸发和溅射)、浇铸及类似技术。在某些实施方案中,可以使用原子层沉积,例如美国专利6,464,842;Wei等人,Small,6(13):1406-1414(2010),它们通过引用并入。

  在某些实施方案中,可以穿过固体基底通常是平面基底例如膜形成1nm-100nm的通道或孔,穿过所述固体基底,分析物例如单链DNA被诱导易位。在其他实施方案中,穿过基底形成2nm-50nm的通道或孔;并且在另外其他的实施方案中,如果穿过基底形成,那么形成2nm-30nm、或2nm-20nm、或3nm-30nm、或3nm-20nm、或3nm-10nm的通道或孔。产生纳米孔的固态方法提供强健性(robustness)和耐用性,以及调节纳米孔的大小和形状的能力,在薄片标度(wafer scale)制造高密度纳米孔的阵列的能力,与基于脂质的系统相比优越的机械特性、化学特性和热特性,以及与电子或光学读出技术集成的可能性。另一方面,生物纳米孔提供特别是在1纳米-10纳米范围内的可再现的窄的钻孔或腔,以及用于定制纳米孔的物理性质和/或化学性质的技术和用于通过常规的蛋白质工程方法直接地或间接地附接基团或元素例如荧光标记物的技术,所述荧光标记物可以是FRET供体或FRET受体。蛋白质纳米孔典型地依赖于用于机械支撑的精细的脂质双层,而具有精确尺寸的固态纳米孔的制造仍然是有挑战性的。在某些实施方案中,固态纳米孔可以与生物纳米孔组合以形成克服这些缺点中的某些的所谓的“混合”纳米孔,从而提供具有固态纳米孔的稳定性的生物孔蛋白(biological pore protein)的精度。对于光学读出技术,混合纳米孔提供纳米孔的精确位置,这大大地简化数据采集。

  在某些实施方案中,簇还可以通过将蛋白质纳米孔布置在由包含孔的阵列的固相膜支撑的脂质双层中来形成。例如,这样的阵列可以包括在固相支撑物中制造(例如钻孔、蚀刻或类似方法)的孔。这样的孔的几何形状可以取决于所采用的制造技术而变化。在某些实施方案中,每个这样的孔与单独的分辨率受限区相关或由单独的分辨率受限区涵盖;然而,在其他实施方案中,多个孔可以在相同的分辨率受限区内。孔的横截面积可以广泛地变化,并且可以与或可以不与不同簇之间相同,尽管这样的面积通常与常规的制造方法的结果大体上相同。在某些实施方案中,孔具有在从10nm至200nm的范围内的最小线性尺寸(例如在圆形孔的情况下的直径),或具有在从约100nm2至3x104nm2的范围内的面积。跨过孔可以布置脂质双层。每个孔的蛋白质纳米孔的分布可以例如通过在插入步骤期间控制蛋白质纳米孔的浓度而变化。在这样的实施方案中,纳米孔的簇可以包括随机数目的纳米孔。在其中蛋白质纳米孔随机地插入到孔中的某些实施方案中,包括一个或更多个孔的簇平均具有大于零的蛋白质纳米孔的数目;在其他实施方案中,这样的簇具有大于0.25的蛋白质纳米孔的数目;在其他实施方案中,这样的簇具有大于0.5的蛋白质纳米孔的数目;在其他实施方案中,这样的簇具有大于0.75的蛋白质纳米孔的数目;在其他实施方案中,这样的簇具有大于1.0的蛋白质纳米孔的数目。

  在某些实施方案中,本发明的方法和装置包括固相膜,例如SiN膜,所述固相膜具有穿过其中的孔的阵列,所述孔提供第一室和第二室(有时还被称为“顺式室”和“反式室”)之间的连通,并且支撑在面向第二室或反式室的表面上的脂质双层。在某些实施方案中,这样的固相膜中的孔的直径可以在10nm至200nm的范围内,或在20nm至100nm的范围内。在某些实施方案中,这样的固相膜还包括蛋白质纳米孔,所述蛋白质纳米孔被插入到区域中的脂质双层中,在所述区域中,这样的双层跨越面向反式室的表面上的孔。在某些实施方案中,使用本文描述的技术,从固相膜的顺式侧插入这样的蛋白质纳米孔。在某些实施方案中,这样的蛋白质纳米孔具有与α-溶血素相同或类似的结构,因为它包括沿着轴的筒或钻孔,并且在一端具有“帽”结构,而在另一端具有“茎”结构(使用来自Song等人,Science,274:1859-1866(1996)的术语)。在使用这样的蛋白质纳米孔的某些实施方案中,插入到脂质双层中导致蛋白质纳米孔被定向,使得其帽结构被暴露于顺式室,而其茎结构被暴露于反式室。

  在某些实施方案中,本发明可以采用呈簇的混合纳米孔(hybrid nanopore),特别是对于多核苷酸的基于光学的纳米孔测序。这样的纳米孔包括固态穿孔(orifice)或孔,例如蛋白质纳米孔,蛋白质生物传感器被稳定地插入在其中。带电荷的聚合物可以通过常规的蛋白质工程技术被附接至蛋白质纳米孔(例如α溶血素),其后施加的电场可以被用于将蛋白质纳米孔指导到固态膜中的孔。在某些实施方案中,固态基底中的孔被选择为略微小于蛋白质,从而防止其易位穿过孔。而是,蛋白质将被嵌入到固态穿孔中。

  在某些实施方案中,供体荧光团被附接至蛋白质纳米孔。然后,通过将电场施加跨过固态纳米空穴(solid state nanohole)或孔,将此复合物(complex)插入到固态孔或纳米空穴中(例如直径3nm-10nm),直到蛋白质纳米孔被输送到固态纳米空穴中以形成混合纳米孔。混合纳米孔的形成可以通过以下来验证:(a)基于固态纳米空穴的部分阻塞,插入的蛋白质纳米孔造成电流的下降,以及(b)供体荧光团的光学检测。

  固态纳米孔或合成的纳米孔可以以多种方式来制备,如上文引用的参考文献中例示的。在某些实施方案中,氦离子显微镜可以被用于在多种材料中钻孔合成的纳米孔,例如,如由Yang等人,Nanotechnolgy,22:285310(2011)公开的,该参考文献通过引用并入本文。支撑薄膜材料例如氮化硅的一个或更多个区域的芯片被引入至氦离子显微镜(HIM)室,所述薄膜材料已经被加工成自支撑膜(free-standing membrane)。当显微镜被设置用于低放大率时,HIM电机控制器被用于将自支撑膜带到离子束的路径中。包括焦点和像散(stigmation)的光束参数在邻近自支撑膜的区域处而不是在固体基底上被调节。在参数已经被合适地固定后,芯片位置被移动,使得自支撑膜区域位于离子束扫描区域的中心,并且光束被遮蔽。HIM视场被设置成足以包括全部预期的纳米孔图案并足以在将来的光学读出(即取决于光学放大率、相机分辨率等)中有用的尺寸(以μm计)。然后,在以导致足以除去膜自发荧光的全部或部分的总离子剂量的像素停留时间穿过整个视场时,离子束被光栅化。然后,视场被设置成合适的值(小于上文使用的值),以进行单个纳米孔或纳米孔的阵列的光刻定义的碾磨(lithographically-defined milling)。该图案的像素停留时间被设置成导致一个或更多个预先确定的直径的纳米孔,所述直径在样品处理之前通过使用校准样品来确定。对于单个芯片上的每个期望的区域和/或对于被引入到HIM室中的每个芯片,重复此整个过程。

  在某些实施方案中,纳米孔可以具有用于在基于光学的纳米孔测序方法中使用的附接的一种或更多种标记物。标记物可以是Forster Resonance Energy Transfer(FRET)对的成员。这样的标记物可以包括有机荧光团、化学发光标记物、量子点、金属纳米颗粒和/或荧光蛋白。目标核酸可以具有每个核苷酸一个有区别的标记物。被附接至核苷酸的标记物可以选自由有机荧光团组成的组。孔蛋白中的标记物附接位点可以通过常规的蛋白质工程方法产生,例如,可以构建将允许标记物的特异性结合的突变蛋白。作为实例,半胱氨酸残基可以在蛋白质的期望的位置处被插入,所述蛋白质插入可以被用于附接标记物的硫醇(SH)基团。半胱氨酸可以替代天然存在的氨基酸,或可以作为添加氨基酸并入。然后,马来酰亚胺活化的标记物被共价地附接至蛋白质纳米孔的硫醇残基。在优选的实施方案中,标记物附接至蛋白质纳米孔或标记物附接在核酸上是可逆的。通过实施可裂解的交联剂,易断裂的化学键(例如S-S键或pH不稳定键)被引入,并且当对应的条件被满足时,标记物可以被除去。

  在某些实施方案中,其中激发光束递送和光学信号收集通过单个物镜发生的落射照明系统可以被用于聚合物分析物上的标记物或纳米孔上的供体的直接照明。用于与本发明一起使用的共聚焦落射照明系统的基本部件在图3中图示。激发光束(302)穿过二色体(dichroic)(304)并到达物镜(306)上,所述物镜(306)将激发光束(302)聚焦(310)到分层膜(300)上,在所述分层膜(300)中标记物被直接激发以发射光学信号,例如荧光信号,其经由FRET相互作用被间接激发以发射光学信号。这样的光学信号被物镜(306)收集,并被引导至二色体(304),所述二色体(304)被选择使得其通过激发光束(302)的光,但反射光学信号(311)的光。反射的光学信号(311)穿过透镜(314),所述透镜(314)通过针孔(316)将反射的光学信号(311)聚焦并聚焦到检测器(318)上。

  在某些实施方案中,用于实施用于分析聚合物(例如单链多核苷酸)的上文方法的装置典型地包括电极的组,所述电极的组用于确定跨过分层膜和纳米孔的电场。通过将单链核酸放置在第一室中的电解质中,单链核酸被暴露于纳米孔,所述第一室通过在该室中放置负电极被配置为分层膜的“顺式”侧。在施加电场后,带负电的单链核酸被纳米孔捕获,并被易位至分层膜的另一侧上的第二室,所述第二室通过在该室中放置正电极被配置为膜的“反式”侧。易位的速度部分地取决于第一室和第二室中的电解质的离子强度以及跨过纳米孔的施加电压。在基于光学的检测中,易位速度可以通过初步校准测量来选择,例如,使用对于不同电压,以不同的每纳米孔的预计的速率产生信号的预先确定的标记的单链核酸的标准物。因此,对于DNA测序应用,易位速度可以基于来自这样的校准测量的信号速率来选择。因此,从这样的测量,可以选择允许或最大化可靠的核苷酸识别的电压,例如在纳米孔的阵列上。在某些实施方案中,可以使用来自待被分析的模板的样品的核酸进行这样的校准(替代预先确定的标准序列,或除了预先确定的标准序列之外)。在某些实施方案中,这样的校准可以在测序运行期间实时进行,并且基于这样的测量,施加的电压可以被实时修改,例如,以最大化核苷酸特异性信号的采集。

  控制易位速度

  多核苷酸穿过纳米孔的易位速度的作用和对其控制的需要已经在纳米孔技术领域中被理解,其中电流的变化被用于确定易位分析物。许多种方法已经被用于控制易位速度,所述方法包括可以在没有显著的困难的情况下实时调节的方法(例如跨过纳米孔的电压电势、温度及类似物)和可以仅在操作期间困难地调节的方法(反应缓冲液粘度、蛋白质纳米孔的钻孔中的带电荷的侧链的存在或不存在、反应缓冲液的离子组成和浓度、附接或杂交至多核苷酸分析物的速度迟滞基团、分子马达(molecular motor)及类似物)两者,例如Bates等人,Biophysical J.,84:2366-2372(2003);Carson等人,Nanotechnology,26(7):074004(2015);Yeh等人,Electrophoresis,33(23):58-65(2012);Meller,J.Phys.Cond.Matter,15:R581-R607(2003);Luan等人,Nanoscale,4(4):1068-1077(2012);Keyser,J.R.Soc.Interface,8:1369-1378(2011);及类似参考文献,这些参考文献通过引用并入本文。在某些实施方案中,当本发明的方法被实施时,包括用于主动地控制易位速度的一个或多个步骤,例如电压电势、温度或类似物;在其他实施方案中,包括确定当本发明的方法被实施时未被主动地控制或改变的易位速度的一个或多个步骤,例如反应缓冲液粘度、离子浓度及类似物。关于后者,在某些实施方案中,通过提供具有在从1%至60%的范围内的甘油或等效试剂的浓度的反应缓冲液来选择易位速度。

  关于前述实施方案(在实时易位速度调节的情况下),一种或多于一种标记物是否对测量的信号贡献荧光的测量可以基于荧光强度在荧光被收集在其上的多个通道中的分布。典型地,多个通道包括对应于所使用的荧光标记物的发射波段的2个、3个或4个通道。在从邻近纳米孔出口的区域发射的荧光的测量样品中,如果仅单种标记物有助于测量的信号,那么不同通道(例如4个通道)中的信号强度的相对分布可以被理想地表示为(1,0,0,0);(0,1,0,0);(0,0,1,0)或(0,0,0,1)。另一方面,如果多于一种标记物有助于测量的荧光信号,那么相对分布将包括多于一个通道中的非零值,其中更糟的情况是四种不同的标记物贡献相同,这将在上文描述中呈现为(.25,.25,.25,.25)。将在对应于相对强度分布(1,0,0,0);(0,1,0,0);(0,0,1,0)或(0,0,0,1)的最大值;和对应于(.25,.25,.25,.25)的相对强度分布的最小值之间单调地变化的测量值可以被用于实时控制易位速度。例如,基于接近其最小值的这样的测量的值,初始易位位速度可以降低。这样的降低可以例如通过将跨过纳米孔的电势电压降低预先确定的量来实施,这之后可以重新计算测量值。这样的步骤可以重复,直到过程被优化。

  如上文提及的,易位速度部分地取决于跨过纳米孔的电压差(或电场强度)和第一室的反应混合物或缓冲液中的条件,在所述第一室中多核苷酸被暴露于纳米孔(例如,被布置在构成第一室的一个壁的固相膜)。纳米孔对多核苷酸的捕获率(polynucleotide capture rate)取决于这样的多核苷酸的浓度。在某些实施方案中,用于纳米孔测序的常规的反应混合物条件可以与本发明一起使用(用于通过改变跨过纳米孔的电压电势来控制易位速度),例如1M KC1(或等效盐,例如NaCl、LiCl或类似物)和pH缓冲体系(例如,其确保待使用的蛋白质,例如蛋白质纳米孔、核酸酶或类似物不变性)。在某些实施方案中,pH缓冲体系可以被用于将pH大体上保持恒定在6.8至8.8的范围内的值。在某些实施方案中,跨过纳米孔的电压差可以在从70mV至200mV的范围内。在其他实施方案中,跨过纳米孔的电压差可以在从80mV至150mV的范围内。可以使用常规的测量技术来选择合适的用于操作的电压。使用可商购的仪器可以容易地测量跨过纳米孔的电流(或电压)。可以选择电压差,使得易位速度在期望的范围内。在某些实施方案中,易位速度的范围包括那些小于每秒1000个核苷酸的速度。在其他实施方案中,易位速度的范围是从每秒10个至800个核苷酸;在其他实施方案中,易位速度的范围是从每秒10个至600个核苷酸;在其他实施方案中,易位速度的范围是从每秒200个至800个核苷酸;在其他实施方案中,易位速度的范围是从每秒200个至500个核苷酸。同样地,可以选择影响易位速度的其他因素,例如温度、粘度、离子浓度、蛋白质纳米孔的钻孔中的带电荷的侧链及类似因素,以获得上文陈述的范围内的易位速度。

  在某些实施方案中,用于实施用于单链核酸的上文方法的装置典型地包括提供用于建立跨过纳米孔(其可以包括阵列)的电场的电极的组。通过将单链核酸放置在第一室中的电解质(即反应缓冲液)中,单链核酸被暴露于纳米孔,所述第一室通过在该室中放置负电极被配置为分层膜的“顺式”侧。在施加电场后,带负电的单链核酸被纳米孔捕获,并被易位至分层膜的另一侧上的第二室,所述第二室通过在该室中放置正电极被配置为膜的“反式”侧。如上文提及的,易位的速度部分地取决于第一室和第二室中的电解质的离子强度以及跨过纳米孔的施加电压。在基于光学的检测中,易位速度可以通过初步校准测量来选择,例如,使用对于不同电压,以不同的每纳米孔的预计的速率产生信号的预先确定的标记的单链核酸的标准物。因此,对于DNA测序应用,初始易位速度可以基于来自这样的校准测量的信号速率以及基于上文讨论的相对信号强度分布的测量值来选择。因此,从这样的测量,可以选择允许或最大化可靠的核苷酸识别的电压,例如在纳米孔的阵列上。在某些实施方案中,可以使用来自待被分析的模板的样品的核酸进行这样的校准(替代预先确定的标准序列,或除了预先确定的标准序列之外)。在某些实施方案中,这样的校准可以在测序运行期间实时进行,并且基于这样的测量,施加的电压可以被实时修改,例如,以最大化核苷酸特异性信号的采集。

  采用相互猝灭标记物和自猝灭标记物的实施方案

  如上文提及的,在某些实施方案中,除了猝灭剂之外,还可以使用自猝灭荧光标记物和相互猝灭荧光标记物,以便减少来自离开纳米孔的核苷酸上的标记物的那些之外的荧光发射,即限制信号产生区的空间范围(spatial extent)。这样的荧光标记物的用途在美国专利公布2016/0122812中公开,该专利通过引用并入。在某些实施方案中,单体被标记有荧光标记物,所述荧光标记物当被附接至目标多核苷酸时能够具有至少三种状态:(i)大体上猝灭状态,其中附接的荧光标记物的荧光通过紧密邻近的单体上的荧光标记物来猝灭;例如,当标记的多核苷酸在用于研究和操纵多核苷酸的常规水溶液或缓冲液中处于游离时,被附接至根据本发明的多核苷酸的荧光标记物被大体上猝灭。(ii)空间受限状态,其中标记的多核苷酸被易位穿过纳米孔时,使得附接的荧光标记物的自由溶液运动或排列被破坏或受限,使得存在很少或不存在由荧光标记物产生的可检测的荧光信号。(iii)转变状态,其中当荧光标记物离开纳米孔时(在“转变间隔”期间),被附接至多核苷酸的荧光标记物从空间受限状态转变成猝灭状态,同时多核苷酸易位穿过纳米孔。

  部分地,此实例是以下发现的应用:在转变间隔期间,荧光标记物(在另外大体上充分标记的且自猝灭的多核苷酸上)能够产生可检测的荧光信号。不受任何基于此发现的理论所限制的意图,据信在转变间隔期间产生的荧光信号是由于从纳米孔出现的荧光标记物中的自由可旋转的偶极的存在,这致使荧光标记物暂时能够产生荧光信号,例如在直接激发之后或经由FRET。在空间受限状态以及猝灭状态两者中,偶极在其旋转自由度方面受限制,从而减少或限制发射的光子的数目。在某些实施方案中,多核苷酸是通常为单链多核苷酸的多核苷酸,例如DNA或RNA,但特别是单链DAN。在某些实施方案中,本发明包括用于确定多核苷酸的核苷酸序列的方法,该方法通过在多核苷酸易位穿过纳米孔时记录当附接的荧光标记物一次一种地离开纳米孔时,由附接的荧光标记物产生的信号。在离开后,在转变间隔期间,每种附接的荧光标记物从纳米孔中的受限状态转变成自由溶液中的多核苷酸上的猝灭状态。换句话说,在某些实施方案中,本发明的方法的步骤包括当每种荧光标记物从纳米孔中的受限状态转变成自由溶液中的多核苷酸上的猝灭状态时,激发每种荧光标记物。如上文提及的,在此转变间隔或时间段期间,荧光标记物能够发射指示其被附接至的核苷酸的可检测的荧光信号。

  在某些实施方案中,本发明包括以下发现的应用:可以选择荧光标记物和纳米孔,使得在多核苷酸易位穿过纳米孔期间,被附接至单体的纳米孔荧光标记物被迫进入受限状态,在该受限状态下,所述纳米孔荧光标记物不能(或大体上不能)产生可检测的荧光信号。在某些实施方案中,选择具有带有在从1nm至4nm的范围内的直径的钻孔或腔的纳米孔;在其他实施方案中,选择具有带有在从2nm至3nm的范围内的直径的钻孔或腔的纳米孔。在某些实施方案中,这样的钻孔直径由蛋白质纳米孔来提供。在某些实施方案中,这样的纳米孔被用于迫使荧光标记物进入根据本发明的受限状态,使得荧光标记物无论何时离开纳米孔时,它从大体上不能产生荧光信号转变成通过其可以被诱导以发射的荧光信号可检测且可识别的。因此,当被附接至多核苷酸的单体的序列的每个的荧光标记物在紧密邻近纳米孔出口的区域(“转变区”或“转变体积”或“检测区”)中突然产生荧光信号时,它们可以依次被检测。在某些实施方案中,有机荧光染料被用作具有上文直径的纳米孔的荧光标记物。在某些实施方案中,至少一种这样的有机荧光染料选自由以下组成的组:呫吨染料、罗丹明染料和花青染料。用于确定多核苷酸的单体序列的某些实施方案可以用以下步骤进行:(a)将多核苷酸易位穿过纳米孔,其中多核苷酸的单体被标记有荧光标记物,其中纳米孔将其钻孔内的荧光标记物限制成受限状态,使得大体上没有可检测的荧光信号在其中产生;(b)在离开纳米孔后,激发每种单体的荧光标记物;(c)测量由离开的荧光标记物产生的检测区中的荧光信号,以识别荧光标记物被附接至的单体;(d)猝灭来自检测区外的激发的荧光标记物的荧光信号,以及(d)从荧光信号的序列确定多核苷酸的单体序列。在另外的实施方案中,荧光标记物是FRET对的受体,并且FRET对的一个或更多个供体在出口的FRET距离内被附接至纳米孔。

  在某些实施方案中,如上文使用的“大体上猝灭的”意指荧光标记物产生由在相同条件下产生的信号减少至少百分之三十的荧光信号,而不具有邻近相互猝灭的标记物。在某些实施方案中,如上文使用的“大体上猝灭的”意指荧光标记物产生由在相同条件下产生的信号减少至少百分之五十的荧光信号,而不具有邻近相互猝灭的标记物。

  在某些实施方案中,目标多核苷酸的核苷酸序列通过进行四种单独的反应来确定,其中目标多核苷酸的拷贝具有用单个荧光标记物标记的其四种不同类型的核苷酸(A、C、G和T)中的每种。在这样的实施方案的变型中,目标多核苷酸的核苷酸序列通过进行四种单独的反应来确定,其中目标多核苷酸的拷贝具有用一个荧光标记物标记的其四种不同类型的核苷酸(A、C、G和T)中的每种,而同时,相同目标多核苷酸上的其他核苷酸被标记有第二荧光标记物。例如,如果第一荧光标记物在第一反应中被附接至目标多核苷酸的A',那么第二荧光标记物在第一反应中被附接至目标多核苷酸的C'、G'和T'(即,被附接至“非-A”核苷酸)。同样地,在该实例的继续中,在第二反应中,第一标记物被附接至目标多核苷酸的C',而第二荧光标记物被附接至目标多核苷酸的A'、G'和T'(即,被附接至“非-C”核苷酸)。并且对于核苷酸G和T,也是如此。

  相同的标记方案可以根据用于核苷酸类型的子组(subset)的常规术语来表达;因此,在上文实例中,在第一反应中,第一荧光标记物被附接至A',而第二荧光标记物被附接至B';在第二反应中,第一荧光标记物被附接至C',而第二荧光标记物被附接至D';在第三反应中,第一荧光标记物被附接至G',而第二荧光标记物被附接至H';以及在第四反应中,第一荧光标记物被附接至T',而第二荧光标记物被附接至V'。

  在某些实施方案中,聚合物例如多核苷酸或肽可以被标记有被附接至单种类型的单体的单种荧光标记物,例如,多核苷酸的每一个T(或大体上每一个T)被标记有荧光标记物,例如花青染料。在这样的实施方案中,来自多核苷酸的荧光信号的集合(collection)或序列可以形成用于特定多核苷酸的特征或指纹(fingerprint)。在某些这样的实施方案中,这样的指纹可以提供或可以不提供待被确定的单体的序列的足够的信息。

  在某些实施方案中,本发明的特征是将多核苷酸分析物的大体上所有单体标记有荧光染料或标记物,所述荧光染料或标记物是相互猝灭组的成员。提到标记多核苷酸分析物的术语“大体上所有”的使用是对化学标记技术和酶促标记技术典型地小于100%有效的承认。在某些实施方案中,“大体上所有”意指具有附接的荧光标记物的所有单体的至少80%。在其他实施方案中,“大体上所有”意指具有附接的荧光标记物的所有单体的至少90%。在其他实施方案中,“大体上所有”意指具有附接的荧光标记物的所有单体的至少95%。荧光染料的相互猝灭组具有以下性质:(i)每个成员猝灭每一个成员的荧光(例如,通过FRET或通过静态机制或接触机制),以及(ii)当被激发并当处于非猝灭状态时,每个成员产生有区别的荧光信号。也就是,如果相互猝灭组由两种染料D1和D2组成,那么(i)D1是自猝灭的(例如通过与另一个D1分子接触猝灭),并且它被D2猝灭(例如通过接触猝灭),以及(ii)D2是自猝灭的(例如通过与另一个D2分子接触猝灭),并且它被D1猝灭(例如通过接触猝灭)。用于选择用于相互猝灭组的荧光染料或标记物的指南可以在以下参考文献中找到,这些参考文献通过引用并入本文:Johansson,Methods in Molecular Biology,335:17-29(2006);Marras等人,Nucleic Acids Research,30:el22(2002);及类似参考文献。在某些实施方案中,相互猝灭组的成员包括组分或部分能够堆叠相互作用的有机荧光染料,例如芳香族环结构。荧光染料或标记物的示例性的相互猝灭组可以选自罗丹明染料、荧光素染料和花青染料。在一个实施方案中,相互猝灭组可以包括罗丹明染料TAMRA和荧光素染料FAM。在另一个实施方案中,荧光染料的相互猝灭组可以通过选择来自由以下组成的组中的两种或更多种染料来形成:Oregon Green 488、荧光素-EX、异硫氰酸荧光素、罗丹明红-X、Lissamine罗丹明B、钙黄绿素、荧光素、罗丹明、一种或更多种BODIPY染料、Texas Red、Oregon Green 514、以及一种或更多种Alexa Fluor。代表性的BODIPY染料包括BODIPY FL、BODIPY R6G、BODIPY TMR、BODIPY 581/591、BODIPY TR、BODIPY 630/650以及BODIPY 650/665。代表性的Alexa Fluor包括Alexa Fluor 350、Alexa Fluor 405、Alexa Fluor 430、Alexa Fluor 488、Alexa Fluor 500、Alexa Fluor 514、Alexa Fluor 532、Alexa Fluor 546、Alexa Fluor 555、Alexa Fluor 568、Alexa Fluor 594、Alexa Fluor 610、Alexa Fluor 633、Alexa Fluor 635、Alexa Fluor 647、Alexa Fluor 660、Alexa Fluor 680、Alexa Fluor 700、Alexa Fluor 750以及Alexa Fluor 790。

  如上文,在某些实施方案中,目标多核苷酸的单体序列通过进行单独的反应(对于每种类型的单体一种)来确定,其中目标多核苷酸的拷贝具有被标记有相互猝灭荧光标记物或自猝灭荧光标记物的每种不同类型的单体。在其他实施方案中,目标多核苷酸的单体序列通过进行单独的反应(对于每种类型的单体一种)来确定,其中目标多核苷酸的拷贝具有被标记有不同的相互猝灭荧光标记物的每种不同类型的单体,所述不同的相互猝灭荧光标记物选自相同的相互猝灭组。在其中相互猝灭组仅包含两种染料的实施方案中,那么选择的单体(即,单体X)被标记有第一相互猝灭的染料,并且每一种其他种类的单体(即,非单体X)被标记有来自相同组的第二相互猝灭的染料。因此,该实施方案的步骤产生两种不同荧光信号的序列,一种指示单体X,而另一种指示非单体X。

  在某些实施方案中,当被附接至多核苷酸上的(相同种类的)邻近单体例如多核苷酸的邻近核苷酸时,可以使用自猝灭的单种荧光标记物(例如被附接至包含多种类型单体的多核苷酸中的单种类型的单体)。示例性的自猝灭荧光标记物包括但不限于Oregon Green 488、荧光素-EX、FITC、罗丹明红-X、Lissamine罗丹明B、钙黄绿素、荧光素、罗丹明、BODIPYS以及Texas Red,例如它们在Molecular Probes Handbook,第11版(2010)中公开。

  采用猝灭剂的实施方案

  图6A-图6C图示出了本发明的不同实施方案,这些不同实施方案对应于其中猝灭剂被施加在纳米孔装置中:仅反式室(图6A)、仅顺式室(图6B)或顺式室和反式室两者(图6C)。在图6A中,图示出了标记的多核苷酸(600),将固相膜(608)的纳米孔(606)从顺式室(602)易位至反式室(604)。浸没在反式室(604)中的是由“Q”指定的非荧光猝灭剂(605)。本发明的猝灭剂在用于标记的多核苷酸(600)的易位条件下是可溶的,并且在相同条件下,猝灭剂结合至单链多核苷酸例如(600),而没有实质的序列特异性。如下文更充分地解释的,许多种非荧光猝灭剂可用于本发明,其包括许多熟知的有机染料的衍生物例如不对称花青染料,以及这样的化合物和寡核苷酸和/或其类似物的缀合物。在此实施方案中,猝灭剂的类型和浓度以及易位速度的选择定义检测区(610)。在某些实施方案中,“检测区”意指从其中收集荧光信号以形成原始数据的区域或体积(其可以是连续的或非连续的),从所述原始数据确定关于标记的多核苷酸的信息,例如序列信息。检测区(610)之外的反式室(604)中的荧光标记物被结合至反式室(604)中的标记的多核苷酸(600)的部分的猝灭剂(605)大体上猝灭。在某些实施方案中,猝灭剂包括基于有机染料,被缀合至一个或更多个猝灭部分的寡核苷酸或类似物,如下文更充分地描述的。当例如固相膜(608)是不透明层或包括不透明层使得顺式室(602)中的荧光标记物大体上不被激发时,可以采用图6A的实施方案。

  图6B示出了与图6A中那些的大体上相同的元件,除了猝灭火剂(605)被布置在顺式室(602)中。在其中不期望的渐逝波或类似非辐射光能延伸至顺式室(602)并激发产生收集的荧光信号的荧光标记物的情况下,此配置可以是合意的。结合至顺式室(602)中的标记的多核苷酸(600)的猝灭剂(605)减少或消除这样的荧光信号。在某些实施方案中,选择猝灭剂(605)和纳米孔(606)的横截面,使得猝灭剂(605)被排除在易位穿过纳米孔(606)之外。在某些实施方案中,这可以通过使用蛋白质纳米孔α-溶血素和猝灭剂来实现,所述猝灭剂包括寡核苷酸或其类似物和一种或更多种猝灭化合物的缀合物,如下文更充分地描述的。

  图6C图示出了其中猝灭剂(605)存在于顺式室(602)和反式室(604)两者中的实施方案,该图提供对于图6A和图6B两者的实施方案描述的优点。

  图7图示出了包括以下元件的实施方案:蛋白质纳米孔(700),所述蛋白质纳米孔(700)被布置在脂质双层(702)中;固相膜(706)中的具有不透明层(708)的荧光标记物的落射照明,以防止或减少背景荧光;以及猝灭剂(710),所述猝灭剂(710)被布置在反式室(726)中。如上文,具有荧光地标记的核苷酸的多核苷酸(720)(标记物由“f”来指示,如同(722))从顺式室(724)被易位穿过纳米孔(700)至反式室(726)。寡核苷酸猝灭剂(710)在允许寡核苷酸猝灭剂(728)杂交至从纳米孔(700)出现的多核苷酸(720)的部分的条件(例如浓度、温度、盐浓度或类似条件)下,被布置在反式室(726)中。可以选择纳米孔(700),使得来自荧光标记物的信号在经过纳米孔期间被抑制,如在Huber等人,美国专利公布US 2016/0076091中描述的,该专利公布通过引用并入本文。因此,当标记的核苷酸从区域(728)中的纳米孔(700)出现时,它们变得不被抑制并且能够产生信号。在直接照明的大部分形式而不是全部形式(例如非-FRET)的情况下,当这样的出现的标记物进一步行进到反式室(726)中时,它们将继续发射荧光,从而大大地有助于收集的信号。在结合至出现的多核苷酸的反式室(726)中的猝灭剂的情况下,这样的发射可以显著地减少,并且可以定义检测区(728),从所述检测区(728),收集的信号可以被分析,以给出关于多核苷酸(720)的核苷酸序列信息。在某些实施方案中,当标记的多核苷酸移动穿过检测区(728)时,在检测时间段期间,来自单种荧光标记物的荧光信号从检测区(728)检测。在其他实施方案中,在预先确定的时间段期间,多种荧光信号从检测区(728)中的多种荧光标记物收集。在某些实施方案中,这样的检测时间段小于1毫秒,或小于0.1毫秒,或小于0.01毫秒。在某些实施方案中,这样的检测时间段是至少0.01毫秒,或至少0.1毫秒,或至少0.5毫秒。

  本发明的猝灭剂包括在纳米孔测序条件下为以下的任何化合物(或化合物的组):(i)大体上无荧光,(ii)结合至单链核酸,特别是单链DNA,以及(iii)非辐射地吸收来自其他分子的激发能并将其非辐射地释放。在某些实施方案中,猝灭剂还非共价地结合至单链DNA。许多种猝灭化合物可用于在本发明中使用,包括但不限于常用合成染料例如花青燃料和呫吨染料的非荧光衍生物,如下文更充分地描述的。选择猝灭化合物的指南可以在美国专利6,323,337;6,750,024及类似参考文献中找到,这些参考文献通过引用并入本文。

  在某些实施方案中,猝灭剂可以是单链DNA结合染料,其已经被已知猝灭荧光的重原子(例如溴或碘)共价地改性,或者被已知猝灭荧光的其他基团例如硝基基团或偶氮基团共价地改性。已知结合单链DNA的染料的实例是Sybr Green(Zipper等人,(2004),Nucleic Acids Research.32(12))。将硝基基团、溴基团、碘基团和/或偶氮基团并入到cynanine Sybr Green结构中提供单链DNA结合基团部分,所述单链DNA结合基团部分将猝灭可以存在于DNA上的荧光标记物。

  在某些实施方案中,猝灭剂包含结合部分和一个或更多个猝灭部分。结合部分可以包括结合至单链核酸而不具有实质序列特异性的任何化合物。结合部分可以包括具有改性的键和/或单体的肽或寡核苷酸或类似物。寡核苷酸及其类似物可以经由双链体形成(duplex formation)或经由非碱基配对适配体结合提供结合至多核苷酸。在某些实施方案中,结合部分包括具有在从6个至60个核苷酸的范围内的长度的寡核苷酸或其类似物。这样的寡核苷酸或类似物可以被缀合至一个猝灭部分或多个猝灭部分。在某些实施方案中,被缀合至每个寡核苷酸或类似物的多个猝灭部分是2个或3个。被缀合至结合部分的猝灭部分可以相同或不同。在某些实施方案中,无论结合部分是寡核苷酸或类似物,两个猝灭部分被缀合至其上,一个在寡核苷酸的5’端,并且一个在寡核苷酸的3’端。可以使用常规的键和合成化学来合成具有从2个至3个猝灭部分的寡核苷酸或类似物,例如,如本文陈述的参考文献中公开的。

  寡核苷酸或类似物可以作为单种物质来提供,或它们可以作为具有不同序列,并因此具有不同结合特异性的多种寡核苷酸或类似物的混合物来提供。在某些实施方案中,寡核苷酸或类似物是随机序列聚合物;也就是,它们是作为给定长度的每一个可能序列的混合物来提供。例如,这样的寡核苷酸或类似物可以由下式表示:对于6聚体为“NNNNNN”,对于8聚体为“NNNNNNNN”,其中N可以是A、C、G或T,或其类似物。

  提到寡核苷酸的“类似物”意指包含一种或更多种核苷酸类似物的寡核苷酸。如定义部分中描述的,“核苷酸类似物”是可以具有改性的键部分、糖部分或碱基部分的核苷酸。可以与本发明一起使用的示例性的寡核苷酸类似物包括但不限于肽核酸(PNA)、锁核酸(locked nucleic acid)(LNA)(2’-O-甲基RNA)、硫代磷酸酯寡核苷酸(phosphorothioate oligonucleotide)、桥接核酸(BNA)或类似物。

  在某些实施方案中,寡核苷酸结合部分包含通用碱基;也就是,它们包含可以替代四种天然核苷酸中的任何而不将碱基对相互作用去稳定的一种或更多种核苷酸类似物。具有通用碱基性质的核苷酸类似物在Loakes,Nucleic Acids Research,29(12):2437-2447(2001)中被描述,该参考文献通过引用并入本文。在某些实施方案中,寡核苷酸结合部分包括2’-脱氧肌苷、7-脱氮-2’-脱氧肌苷、2-氮杂-2’-脱氧肌苷、3-硝基吡咯核苷酸、5-硝基吲哚核苷酸或类似物。

  在某些实施方案中,猝灭剂可以包括两种或更多种化合物的组合,所述化合物一起作用以猝灭单链标记的多核苷酸的不期望的荧光信号。例如,猝灭剂可以包含寡核苷酸(例如聚脱氧肌苷(polydeoxyinosine))和单独地双链嵌入剂,所述寡核苷酸可以与标记的多核苷酸形成双链体,所述双链嵌入剂是猝灭剂。因此,每当聚脱氧肌苷结合至标记的多核苷酸时,猝灭嵌入剂结合至产生的双链体并猝灭来自该多核苷酸的荧光信号。

  为了本发明的目的,可以可检测地猝灭标记的多核苷酸的荧光标记物的荧光信号的任何合成染料是可接受的猝灭部分。具体地,如本发明中使用的,猝灭部分具有吸收波段,所述吸收波段呈现出与标记的多核苷酸的荧光标记物的发射波段至少某些光谱重叠。在比猝灭部分(受体)的最大吸收波长更低或甚至更高的波长发射最大值处发生的荧光标记物(供体)的发射的情况下,此重叠可以发生,条件是存在足够的光谱重叠。通过将供体的发射转移至受体的较高电场,还可以发生能量转移。本领域普通技术人员通过检查相对于待被使用的荧光标记物的发射光谱的该染料的激发波段来确定给定猝灭部分的效用。

  典型地,本发明中的荧光猝灭通过本发明的荧光标记物和猝灭部分之间的荧光共振能量转移(Fluorescence Resonance Energy Transfer)(FRET或通过电荷转移复合物的形成)发生。供体化合物和受体化合物的光谱和电子性质对观察到的能量转移的程度具有强的影响,标记的多核苷酸上的荧光标记物和淬灭部分之间的分开距离也是如此。随着分开距离增加,荧光猝灭的程度降低。

  猝灭部分可以任选地是荧光的,条件是染料的最大发射波长与荧光标记物当结合至标记的多核苷酸时的最大发射波长良好地分开。然而,优选地,当被共价地缀合至寡核苷酸或类似物时,猝灭部分仅是昏暗荧光的,或大体上是非荧光的。如本文使用的,大体上非荧光的指示用于本文方法的任何的如所描述的测定溶液中的猝灭部分的荧光效率小于或等于5%,优选地小于或等于1%。在其他实施方案中,共价结合的猝灭部分呈现出小于约0.1,更优选地小于约0.01的量子收率。在某些实施方案中,在不存在共价结合的猝灭部分下,相对于与相同荧光标记物缔合的相同寡核苷酸,与本发明的猝灭寡核苷酸缔合的荧光标记物的荧光被猝灭大于50%。在另一个实施方案中,相对于未标记的寡核苷酸,荧光标记物被猝灭大于90%。在又一实施方案中,相对于未标记的寡核苷酸,核酸染色被猝灭大于95%。

  在某些实施方案中,猝灭部分可以是芘、蒽、萘、吖啶、二苯乙烯、吲哚或苯并吲哚、噁唑或苯并噁唑、噻唑或苯并噻唑、4-氨基-7-硝基苯并-2-氧杂-1,3-二唑(NBD)、花青、羰花青(carbocyanine)、喹诺酮基(carbostyryl)、卟啉、水杨酸酯、邻氨基苯甲酸酯、薁、苝、吡啶、喹啉、香豆素(包括羟基香豆素和氨基香豆素,以及其氟化衍生物和磺化衍生物(如在Gee等人(1998)的美国专利第5,830,912号和Wang等人(1997)的美国专利第5,696,157号中描述的,其通过引用被并入)、聚氮杂引达省(polyazaindacene)(例如Haugland等人(1988)的美国专利第4,774,339号;Kang等人(1993)的美国专利第5,187,288号;Haugland等人(1993)的美国专利第5,248,782号;Kang等人(1993)的美国专利第5,274,113号;Kang等人(1995年)的美国专利第5,433,896号;Wu等人(1999)的美国专利第6,005,113号,全部通过引用并入)、呫吨、噁嗪或苯并噁嗪、卡巴嗪(carbazine)(Corey(1989)的美国专利第4,810,636号,通过引用并入)、或苯并酮(phenelanone)或苯并酮(benzphelanone)(Babb等人(1989)的美国专利第4,812,409号,通过引用并入)。

  在其他实施方案中,大体上为非荧光染料的猝灭部分特别地包括偶氮染料(例如DABCYL染料或DABSYL染料及其结构类似物)、三芳基甲烷染料例如孔雀石绿或酚红、4',5z-二醚取代的荧光素(美国专利第4,318,846号(1982))、或不对称的花青染料猝灭剂(PCT国际申请WO 99 37,717(1999))。

  在其中猝灭部分是呫吨的实施方案中,合成染料任选地是荧光素、对甲氨基酚(Haugland等人(1993)的美国专利第5,227,487号,通过引用并入)或罗丹明。如本文使用的,荧光素包括苯并荧光素(benzofluorescein)或二苯并荧光素、半萘并荧光素(seminaphthofluorescein)或萘并荧光素。类似地,如本文使用的,对甲氨基酚包括半萘酚罗丹荧(seminaphthorhodafluor)(Haugland等人(1990)的美国专利第4,945,171号,通过引用并入)。呫吨包括呫吨染料的氟化衍生物(国际公布第WO 97/39064号,Molecular Probes,Inc.(1997),通过引用并入)和呫吨染料的磺化衍生物(国际公布第WO 99/15517号,Molecular Probes,Inc.(1999),通过引用并入)。如本文使用的,噁嗪包括试卤灵(resorufm)、氨基噁嗪酮、二氨基噁嗪及其苯取代的类似物。

  在另外的实施方案中,猝灭部分是3-氨基呫吨和/或6-氨基呫吨的大体上非荧光衍生物,所述3-氨基呫吨和/或6-氨基呫吨在一个或更多个氨基氮原子处被芳香族环体系或杂芳香族环体系取代,例如如在美国专利6,399,392中描述的,该专利通过引用并入本文。这些猝灭染料典型地具有大于530nm的吸收最大值,具有很少或不具有可观察到的荧光,并且有效地猝灭宽光谱的发光发射,例如通过化学发光团、磷光体或荧光团发射。在一个实施方案中,猝灭染料是被取代的罗丹明。在另一个实施方案中,猝灭化合物是被取代的对甲氨基酚。

  在另外的其他实施方案中,猝灭部分可以包括在以下专利中描述的一种或更多种被称为Black Hole QuenchersTM化合物(BHQ)的非荧光猝灭剂,这些专利通过引用并入文本:7,019,129;7,109,312;7,582,432;8,410,025;8,440,399;8,633,307;8,946,404;9,018,369;或9,139,610。另外的猝灭部分在以下专利中公开,这些专利通过引用并入本文:美国专利6,699,975;6,790,945;和8,114,979。

  用于纳米孔和聚合物的标记物

  在某些实施方案中,纳米孔可以标记有一个或更多个量子点。特别地,在某些实施方案中,一个或更多个量子点可以被附接至纳米孔,或被附接至邻近纳米孔的入口或出口的固相支持物(并且在纳米孔的入口或出口的FRET距离内),并且在与分析物上的受体FRET反应中用作供体。量子点的这样的用途是熟知的,并且在科学文献和专利文献中被广泛描述,例如在美国专利6,252,303;6,855,551;7,235,361及类似文献中,这些文献通过引用并入文本。

  可以用作孔标记物(pore label)的量子点的一个实例是可以在水溶液中合成的CdTe量子点。CdTe量子点可以用亲核基团例如伯胺、硫醇或诸如羧酸的官能团官能化。CdTe量子点可以包括巯基丙酸封端配体(mercaptopropionic acid capping ligand),所述巯基丙酸封端配体具有可以被用于将量子点共价地连接至蛋白质孔的外部的伯胺的羧酸官能团。可以使用生物缀合领域普通技术人员已知的标准交联试剂(均双官能的(homo-bifunctional)以及杂双官能的(hetero-bifunctional))来完成交联反应。可以注意确保改性不损害或大体上不损害核酸易位穿过纳米孔。这可以通过改变被用于将供体标记物附接至纳米孔的所采用的交联剂分子的长度来实现。

  例如,天然α溶血素蛋白的赖氨酸残基131的伯胺(Song,L.等人,Science 274,(1996):1859-1866)可以被用于经由1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐/N-羟基磺基琥珀酰亚胺(EDC/NHS)偶联化学共价地结合羧基改性的CdTe量子点。可选择地,氨基酸129(苏氨酸)可以被交换成半胱氨酸。由于在天然α溶血素蛋白中不存在其他半胱氨酸残基,所以新插入的半胱氨酸的巯基侧基可以被用于共价地附接其他化学部分。

  生物聚合物例如核酸分子或聚合物可以标记有一种或更多种受体标记物。对于核酸分子,核酸分子的四种核苷酸或构建单元中的每个可以标记有受体标记物,从而产生每种天然存在的核苷酸的标记的(例如荧光的)对应物。受体标记物可以呈能量接受分子的形式,所述能量接受分子可以被附接至转化的核酸的一部分链上或全部链上的一种或更多种核苷酸。

  多种方法可以被用于标记核酸分子或聚合物的单体或核苷酸。在使用原始样品作为模板合成新核酸期间,标记的核苷酸可以被并入到核酸中(“通过合成标记”)。例如,核酸的标记可以经由PCR、全基因组扩增、滚环扩增、引物延伸或类似技术或经由本领域普通技术人员已知的上文方法的多种组合和扩展来实现。

  标记物可以包含反应基团,例如亲核体(胺、硫醇等)。不存在于天然核酸中的这样的亲核体可以被用于经由胺或硫醇反应化学例如NHS酯、马来酰亚胺、环氧环、异氰酸酯等附接荧光标记物。这样的亲核反应荧光染料(即NHS染料)容易地可商购自不同来源。用小亲核体标记核酸的优点在于,当使用“通过合成标记(labeling by synthesis)”方法时,这样的标记的核苷酸的高的并入效率。由于聚合过程期间标记物的空间位阻,体积大的荧光标记的核酸构建单元可以通过聚合酶被差地并入到新合成的DNA中。

  每当使用两种或更多种相互猝灭染料时,可以使用正交附接化学(orthogonal attachment chemistry),将这样的染料附接至DNA。例如,NHS酯可以被用于与伯胺非常特定地反应,或者马来酰亚胺将与硫醇基团反应。伯胺(NH2)或硫醇(SH)改性的核苷酸是可商购的。这些相对小的改性被容易地并入在聚合酶介导的DNA合成中,并且可以被用于使用NHS或马来酰亚胺改性的染料的随后的标记反应。用于选择和使用这样的正交连接基化学的指南可以在Hermanson(上文引用的)中找到。

  用于典型的附接定位(attachment position)的另外的正交附接化学包括用于铜催化反应和非催化反应的Huisgen型环加成;烯烃加腈氧化物环加成,例如如在Gutsmiedl等人,Org.Lett.,11:2405-2408(2009)中公开的;Diels-Alder环加成,例如在Seelig等人,Tetrahedron Lett.,38:7729-7732(1997)中公开的;羰基连接,例如如在Casi等人,J.Am.Chem.Soc.,134:5887-5892(2012);Shao等人J.Am.Chem.Soc.,117:3893-3899(1995);Rideout,Science,233:561-563(1986)中公开的;Michael加成,例如在Brinkley,Bioconjugate Chemistry,3:2-13(1992)中公开的;天然化学连接(native chemical ligation),例如在Schuler等人,Bioconjugate Chemistry,13:1039-1043(2002);Dawson等人,Science,266:776-779(1994)中公开的;或经由活化酯的酰胺形成,例如在Hermanson(上文引用的)中公开的。

  定义

  “渐逝场”意指非传播电磁场;也就是,它是其中Poynting矢量的平均值是零的电磁场。

  “FRET”或“或荧光共振能量转移”意指从激发的供体荧光团至基态的受体荧光团的非辐射偶极-偶极能量转移机制。FRET相互作用中的能量转移的速率取决于供体的发射光谱与受体的吸收光谱的光谱重叠的程度、供体的量子收率、供体和受主转变偶极的相对定向以及供体分子和受主分子之间的距离,Lakowitz,Principles of Fluorescence Spectroscopy,第三版(Springer,2006)。特别感兴趣的FRET相互作用是那些导致能量的一部分被转移至受体,进而由受体作为光子发射,其中频率低于激发其供体的光的频率(即“FRET信号”)。“FRET距离”意指FRET供体和FRET受体之间的距离,在该距离内,FRET相互作用可以发生,并且可检测的FRET信号由FRET受体产生。

  “试剂盒”指的是用于递送用于进行本发明的方法的材料或试剂的任何递送系统。在反应测定的上下文中,这样的递送系统包括允许将反应试剂(例如在适当的容器中的荧光标记物,例如相互猝灭的荧光标记物、荧光标记物连接剂、酶等)和/或支持材料(例如,缓冲液、用于进行测定的书面说明等)从一个位置储存、运输或递送到另一个位置的系统。例如,试剂盒包括一个或更多个包含相关反应试剂和/或支持材料的外壳(例如盒)。这样的内容物可以被一起或单独地递送至预期的接收者。例如,第一容器可以包含用于在测定中使用的酶,而第二容器或更多个容器包含相互猝灭的荧光标记物。

  “纳米孔”意指被定位在基底中的任何开口,所述开口允许分析物以预先确定的或可辨别的顺序穿过基底,或在聚合物分析物的情况下,允许其单体单元以预先确定的或可辨别的顺序穿过基底。在后者情况下,预先确定的或可辨别的顺序可以是聚合物中的单体单元的主要顺序。纳米孔的实例包括蛋白质的或基于蛋白质的纳米孔、合成纳米孔或固态纳米孔、以及包含具有嵌入其中的蛋白质纳米孔的固态纳米孔的混合纳米孔。纳米孔可以具有1nm-10nm或1nm-5nm或1nm-3nm的内径。蛋白质纳米孔的实例包括但不限于α-溶血素、电压依赖性线粒体孔蛋白(voltage-dependent mitochondrial porin)(VDAC)、OmpF、OmpC、MspA和LamB(麦芽糖孔蛋白(maltoporin)),例如在Rhee,M.等人,Trends in Biotechnology,25(4)(2007):174-181;Bayley等人(上文引用的);Gundlach等人,美国专利公布2012/0055792;及类似文献中公开的,这些文献通过引用并入本文。可以使用允许单种核酸分子的易位的任何蛋白质孔。纳米孔蛋白可以在孔的外部的特定位点处,或在构成孔形成蛋白(pore forming protein)的一个或更多个单体单元外部的特定位点处被标记。孔蛋白选自蛋白质的组,例如但不限于α-溶血素、MspA、电压依赖性线粒体孔蛋白(VDAC)、Anthrax孔蛋白、OmpF、OmpC以及LamB(麦芽糖孔蛋白)。孔蛋白集成到固态空穴(hole)中通过将带电荷的聚合物附接至孔蛋白来实现。在施加电场后,带电荷的复合物被电泳地拉到固态空穴中。合成纳米孔或固态纳米孔可以以多种固体基底形式产生,其实例包括但不限于有机硅(例如Si3N4、SiO2)、金属、金属氧化物(例如Al2O3)、塑料、玻璃、半导体材料及其组合。合成纳米孔可以比被定位在脂质双层膜中的生物蛋白孔更稳定。还可以通过使用嵌入在合适的基底例如但不限于聚合的环氧树脂中的碳纳米管来产生合成纳米孔。碳纳米管可以具有均匀且明确定义的化学性质和结构性质。可以获得在从一纳米至数百纳米的范围的多种大小的碳纳米管。已知碳纳米管的表面电荷是约零,并且因此,核酸穿过纳米孔的电泳传输变得简单且可预测(Ito T.等人,Chem.Commun.12(2003):1482-83)。合成纳米孔的基底表面可以被化学改性,以允许蛋白质孔的共价附接,或致使适合于光学纳米孔测序的表面性质。这样的表面改性可以是共价的或非共价的。大多数共价改性包括有机硅烷沉积,对于所述有机硅烷沉积,描述最常见的方案:1)从含水醇中沉积。这是用于制备甲硅烷基化表面最可行的方法。用乙酸将95%乙醇-5%水溶液调节至pH 4.5-5.5。在搅拌下,添加硅烷,以产生2%最终浓度。在水解和硅烷醇基团形成后,添加基底持续2min-5min。之后,通过短暂地浸渍在乙醇中冲洗掉过量的材料。硅烷层的固化在110摄氏度持续5min-10min。2)气相沉积。通过化学气相沉积方法,硅烷可以在干燥的非质子条件下被施加至基底。这些方法有利于单层沉积。在封闭室设计中,基底被加热至足够的温度,以实现5mm蒸汽压。可选择地,真空可以被施加,直到观察到硅烷蒸发。3)旋涂沉积。在有利于最大官能化和多层沉积的水解条件下或有利于单层沉积的干燥条件下,可以进行旋涂施加。在某些实施方案中,单个纳米孔与本发明的方法一起使用。在其他实施方案中,使用多个纳米孔。在后者实施方案的某些中,多个纳米孔被用作纳米孔的阵列,通常被布置在平面基底,例如固相膜中。纳米孔阵列的纳米孔可以被规则地间隔开,例如,以直线图案间隔开,或者可以被随机地间隔开。在优选的实施方案中,纳米孔在平面固相基底中以直线图案被规则地间隔开。

  “纳米结构”(与“纳米标度结构”和“纳米标度特征”互换地使用)意指具有在几纳米至几百纳米例如从1纳米至1000纳米的范围内的至少一个尺寸的结构。在某些应用中,这样的范围是从2纳米至500纳米;在其他应用中,这样的范围是从3纳米至500纳米。纳米结构的形状和几何形状可以广泛地变化,并且包括但不限于纳米孔(nanopore)、纳米孔(nanowell)、纳米颗粒以及特别适合于进行反应序列的任何其他方便的形状。在某些实施方案中,纳米结构可以是在操作上与固相膜相关的蛋白质纳米孔。某些纳米结构,例如纳米孔(nanopore)和纳米孔(nanowell),可以在较大的常用基底例如固相膜或其他固体中形成,以形成纳米孔(nanopore)或纳米孔(nanowell)的阵列。特别感兴趣的纳米结构是能够支持或包括化学反应、物理反应(例如FRET)、酶促反应和/或结合反应或这样的反应的序列的纳米结构。在某些实施方案中,纳米结构,例如纳米孔(nanowell)封闭小于1纳升(10x-9升)、小于1皮升或小于1毫微微升(femtoliter)的体积。在其他实施方案中,单独的纳米孔(nanowell)的每个提供小于1000仄升(zeptoliter)、100仄升、80仄升、或小于50仄升、或小于1仄升、或甚至小于100yactoliter的体积。在某些实施方案中,纳米孔(nanowell)包括零模式波导。

  关于肽的“肽”、“肽片段”、“多肽”、“寡肽”或“片段”在本文中同义地使用,并且指的是由通过肽键连接的氨基酸残基的单个非支链组成的化合物。肽或多肽中的氨基酸可以被多种部分衍生化,包括但不限于聚乙二醇、染料、生物素、半抗原或类似部分。蛋白质或多肽或肽中的氨基酸残基的数目可以广泛地变化;然而,在某些实施方案中,本文提到的蛋白质或多肽或肽可以具有从2个至70个氨基酸残基;并且在其他实施方案中,它们可以具有从2个至50个氨基酸残基。在其他实施方案中,本文提到的蛋白质或多肽或肽可以具有从几十个氨基酸残基例如20个,至高达一千个或更多个氨基酸残基例如1200个。在还其他实施方案中,蛋白质、多肽、肽或其片段可以具有从10个至1000个氨基酸残基;或者它们可以具有从20个至500个氨基酸残基;或者它们可以具有从20个至200个氨基酸残基。

  “聚合物”意指被连接成直链的多种单体。通常,聚合物包含多于一种类型的单体,例如如包含A'、C'、G'和T'的多核苷酸,或包含多于一种类型的氨基酸的多肽。单体可以包括而不限于核苷及其衍生物或类似物以及氨基酸及其衍生物和类似物。在某些实施方案中,聚合物是多核苷酸,由此核苷单体通过磷酸二酯键或其类似物连接。

  “多核苷酸”或“寡核苷酸”可互换地使用,并且各自意指核苷酸单体的直链聚合物。构成多核苷酸和寡核苷酸的单体能够通过单体与单体相互作用(monomer-to-monomer interaction)的规律模式被特异性地结合至天然多核苷酸,例如Watson-Crick型碱基配对、碱基堆积、Hoogsteen或反向Hoogsteen型碱基配对或类似物。这样的单体及其核苷间的键可以是天然存在的,或者可以是其类似物,例如天然存在的类似物或非天然存在的类似物。非天然存在的类似物可以包括PNA、硫代磷酸酯核苷间的键、包含允许标记物的附接的连接基团的碱基例如荧光团、或半抗原及类似物。每当寡核苷酸或多核苷酸的使用需要酶加工时,例如通过聚合酶的延伸、通过连接酶的连接或类似加工,普通技术人员将理解,在这些情况下,寡核苷酸或多核苷酸在任何或某些位置处将不包含核苷间的键、糖部分或碱基的某些类似物。

  当多核苷酸通常被称为“寡核苷酸”时,它们的大小典型地在从几个单体单元,例如5个-40个,至几千个单体单元的范围内。每当多核苷酸或寡核苷酸由字母序列(大写或小写)例如“ATGCCTG”表示时,将理解,核苷酸从左至右以5'→3'顺序,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,并且“T”表示胸苷,“I”表示脱氧肌苷,“U”表示尿苷,除非另外指示或从上下文明显的。除非另外提到的,否则术语和原子编号惯例将遵循Strachan和Read,Human Molecular Genetics 2(Wiley-Liss,New York,1999)中公开的那些。通常,多核苷酸包括由磷酸二酯键连接的四种天然核苷(例如对于DNA,脱氧腺苷、脱氧胞苷、脱氧鸟苷、脱氧胸苷或对于RNA,它们的核糖对应物);然而,它们还可以包括非天然核苷酸类似物,例如包括改性的碱基、糖或核苷间的键。对于本领域技术人员清楚的是,在对于活性,酶具有特定的寡核苷酸或多核苷酸底物要求,例如单链DNA、RNA/DNA双链体或类似物的情况下,那么对于寡核苷酸底物或多核苷酸底物的合适组合物的选择良好地在本领域普通技术人员的知识内,特别是在来自专著的指导下,例如Sambrook等人,Molecular Cloning,第二版(ColdSpring Harbor Laboratory,New York,1989)及类似文献。同样地,寡核苷酸和多核苷酸可以指的是单链形式或双链形式(即寡核苷酸或多核苷酸及其各自互补体(complement)的双链体)。将对于本领域普通技术人员清楚的是,哪一种形式或两种形式是否意图来自该术语使用的上下文。

  “引物”意指天然的或合成的寡核苷酸,其在与多核苷酸模板形成双链体时能够充当核酸合成的初始点,并且从其3’端沿着模板延伸,从而形成延伸的双链体。引物的延伸通常在核酸聚合酶例如DNA聚合酶或RNA聚合酶下进行。延伸过程中添加的核苷酸的序列由模板多核苷酸的序列确定。通常,引物由DNA聚合酶延伸。引物通常具有在从14个至40个核苷酸的范围内,或在从18个至36个核苷酸的范围内的长度。引物被用于多种核酸扩增反应,例如使用单种引物的线性扩增反应,或使用两种或更多种引物的聚合酶链反应。用于选择用于特定应用的引物的长度和序列的指南对于本领域普通技术人员是熟知的,如通过以下参考文献证明的,该参考文献通过引用并入:Dieffenbach,编辑,PCR Primer:A Laboratory Manual第2版(Cold Spring Harbor Press,New York,2003)。

  “分辨率受限区”是纳米孔(nanopore)阵列或纳米孔(nanowell)阵列的表面区域,在该区域内,单独的特征或光发射源不能通过光学信号检测系统来区别。不意图受理论限制,这样的分辨率受限区由光学系统的分辨率限值(resolution limit)(有时还被称为“衍射限值”或“衍射屏障”)确定。这样的限值由发射源的波长和光学部件确定,并且可以由d=λ/NA来定义,其中d是可以分辨的最小特征,λ是光的波长,并且NA是被用于使光聚焦的物镜的数值孔径。因此,每当两种或更多种纳米孔在分辨率受限区内并且两种或更多种光学信号在各自纳米孔处产生时,光学检测系统不能区分或确定哪些光学信号来自哪个纳米孔。根据本发明,纳米孔阵列的表面可以被分配或再分成对应于分辨率受限区的非重叠区或大体上非重叠区。对应于分辨率受限区的这样的再分的大小可以取决于采用的特定的光学检测系统。在某些实施方案中,每当光发射源在可见光谱内时,分辨率受限区在从300nm2至3.0μm2的范围内;在其他实施方案中,分辨率受限区在从1200nm2至0.7μm2的范围内;在其他实施方案中,分辨率受限区在从3×104nm2至0.7μm2的范围内,其中前述的区域范围指的是纳米孔(nanopore)阵列或纳米孔(nanowell)阵列的表面。在某些实施方案中,可见光谱意指在从约380nm至约700nm的范围内的波长。

  关于多核苷酸的“序列确定”、“测序”或“确定核苷酸序列”或类似术语包括多核苷酸的部分序列信息以及全部序列信息的确定。也就是,该术语包括四种天然核苷酸A、C、G和T的完整组的子组的序列,比如例如,目标多核苷酸的仅A'和C'的序列。也就是,该术语包括目标多核苷酸内的四种类型的核苷酸中的一种、两种、三种或全部的同一性、排序和位置的确定。在某些实施方案中,该术语包括目标多核苷酸内的四种类型的核苷酸中的两种、三种或全部的同一性、排序和位置的确定。在某些实施方案中,序列确定可以通过识别目标多核苷酸“catcgc……”内的单种类型的核苷酸例如胞嘧啶的排序和位置来完成,使得其序列被表示为代表“c-(非c)(非c)c-(非c)-c……”的二进制编码,例如“100101……”,及类似物。在某些实施方案中,该术语还可以包括用作用于目标多核苷酸的指纹的目标多核苷酸的子序列;也就是,唯一地识别多核苷酸的组内的目标多核苷酸或目标多核苷酸的类别的子序列,例如所有通过细胞表达的不同RNA序列。

  本公开内容不意图限于陈述的特定形式的范围,而是意图覆盖本文描述的变型的替代物、修改和等效物。另外,鉴于本公开内容,本公开内容的范围完全涵盖可以对本领域技术人员变得明显的其他变型。本发明的范围仅由所附的权利要求限制。

《用纳米孔的聚合物分析中的混合光学信号.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)