欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 用于肝靶向和治疗的CRISPR-CAS系统、载体和组合物的递送与用途独创技术767243字

用于肝靶向和治疗的CRISPR-CAS系统、载体和组合物的递送与用途

2021-02-01 08:45:12

用于肝靶向和治疗的CRISPR-CAS系统、载体和组合物的递送与用途

  相关应用和引用参考

  要求来自2013年6月17日提交的美国临时专利申请61/836,123、2013年7月17日提交的61/847,537、2013年8月5日提交的61/862,355、2013年8月28日提交的61/871,301、2013年12月12日提交的61/915,325、2014年4月15日提交的61/979,733、以及2013年12月12日提交的PCT/US 2013/074667的用于美国的目的的优先权,本申请也是部分继续申请;并且如可以在美国法律下允许的,美国等效物或到此的国家阶段可以进一步要求和要求对于PCT/US 2013/074667的优先权以及PCT/US 2013/074667所要求优先权的来源的申请的优先权。

  前述申请、以及在其中或在它们的审查程序期间引用的所有文献或(“申请引用文献”)以及在这些申请引用文献中引用或参考的所有文献、以及在本文中引用或参考的所有文献(“本文引用的文献”)、在本文中引用的文献中引用或参考的所有文献,连同针对在本文中提及或通过引用结合在本文中的任何文献中的任何产品的任何制造商的说明书、说明、产品规格、和产品表,特此通过引用并入本文,并且可以在本发明的实践中采用。更具体地说,所有参考的文献均通过引用并入本文,其程度如同每个单独的文献被确切地并单独地指明通过引用而并入本文。

  发明领域

  本发明总体上涉及用于控制涉及序列靶向的基因表达的系统、方法、和组合物的递送、工程化、优化和治疗应用,该序列靶向例如涉及规律间隔成簇短回文重复序列(CRISPR)及其组分的基因组干扰或基因编辑。具体地说,本发明涉及与以下项相关的方面:递送至肝脏以用于肝脏病症的基因疗法,理解肝脏或肝脏组织基因功能以及创建肝脏模型。肝脏或肝脏组织包括通常被称为肝细胞的实质细胞。肝脏或肝脏组织还可以是作为非实质细胞的肝脏细胞,尤其是当此类细胞构成肝脏细胞的总数的40%时,即使仅构成其体积的6.5%;并且,此类非实质细胞肝脏细胞或组织的实例包括肝窦内皮细胞、枯否(Kupffer)细胞以及肝星状细胞。肝脏的细胞表达一种或多种肝脏基因产物。有利地,相对于肝细胞或肝脏或包含肝细胞的肝脏组织实践本发明。

  关于联邦资助研究的声明

  本发明是在美国国立卫生研究院颁发的NIH先锋奖(Pioneer Award)(1DP1MH100706)的政府支持下完成的。美国政府享有本发明的某些权利。

  发明背景

  在基因组测序技术和分析方法中的最新进展显著加速了对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和映射的能力。精确的基因组靶向技术对于通过允许个体遗传元件的选择性干扰而使得因果性遗传变异的统性逆向工程成为可能、以及推进合成生物学、生物技术应用、和医学应用是需要的。虽然基因组编辑技术,如设计师锌指、转录激活子样效应因子(TALE)、或归巢大范围核酸酶(homing meganuclease)对于产生靶向的基因组干扰是可得的,但是仍然需要负担得起的、易于建立的、可扩展的、并且便于靶向真核基因组内的多个位置的新的基因组工程技术。

  发明概述

  该CRISPR-Cas系统不要求产生针对靶特异性序列的定制蛋白,相反,通过识别特异性DNA靶的短RNA分子可以对单个Cas酶进行程序设计。将该CRISPR-Cas系统添加到基因组测序技术和分析方法的组库中可以显著使该方法论简化并且提高对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和映射的能力。为了有效而无有害作用地利用CRISPR-Cas系统用于基因组编辑,了解这些基因组工程工具的工程化、优化和细胞类型/组织/器官特异性递送等方面是至关重要的,这些方面是所要求的本发明方面。

  对于具有一系列广泛应用的核酸序列靶向的替代性且稳健的系统和技术存在着迫切需要。本发明的多个方面着手解决这种需要并且提供了相关优点。示例性CRISPR复合物包括与指导序列复合的CRISPR酶,该指导序列与靶多核苷酸内的靶序列杂交或可与其杂交。该指导序列与tracr配对序列连接,该tracr配对序列进而与tracr序列杂交。

  在一方面,本发明提供了使用CRISPR-Cas系统的一个或多个元件的方法。本发明的CRISPR复合物提供了用于修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有多种多样的实用性,包括修饰(例如,缺失、插入、转位、失活、激活)各种组织和器官中的多种细胞类型中的靶多核苷酸。正因为如此,本发明的CRISPR复合物在例如基因或基因组编辑、基因治疗、药物发现、药物筛选、疾病诊断、以及预后中具有广阔的应用谱。设想了在体内、体外和离体用途。

  本发明的方面涉及在具备具有优化活性的指导RNA的CRISPR-Cas9系统中的、具有改进的肝靶向特异性的、在长度上小于野生型Cas9酶的Cas9酶和编码它的核酸分子,和嵌合的Cas9酶,以及改进Cas9酶的靶向特异性或设计CRISPR-Cas9系统的方法,所述方法包括设计或制备具有优化活性的指导RNA和/或选择或制备具有比野生型Cas9更小的尺寸或长度的Cas9酶,由此将编码它的核酸包装到递送载体是更高级的(因为在该递送载体中对它的编码少于野生型Cas9)中,和/或产生嵌合Cas9酶。

  还提供了本发明的序列、载体、酶或系统在医学中的用途。还提供了它们在基因或基因组编辑中的用途。这有关肝脏组织或细胞,不论是在体内还是离体,

  在本发明的另外方面,Cas9酶可以包含一个或多个突变,并且可以用作具有或不具有与功能结构域融合的通用DNA结合蛋白。这些突变可以是人工引入的突变或获得性和丢失性功能突变。这些突变可以包括但不限于分别在RuvC和HNH催化结构域中的催化结构域(D10和H840)之一中的突变。已经表征了另外的突变,并且可以将其用于本发明的一种或多种组合物中。在本发明的一个方面,突变的Cas9酶可以融合至蛋白质结构域,例如像转录激活结构域。在本发明的一个方面,该转录激活结构域可以是VP64。在本发明的其他方面,该转录阻遏物结构域可以是KRAB或SID4X。本发明的其他方面涉及融合到结构域上的突变的Cas9酶,这些结构域包括但不限于,转录激活剂、阻遏物、重组酶、转座酶、组蛋白重塑剂(histone remodeler)、脱甲基酶、DNA甲基转移酶、隐花色素、光可诱导/可控制结构域或化学可诱导/可控制结构域。

  在一个另外的实施例中,本发明提供了产生突变体tracrRNA和允许增强这些RNA在细胞中的性能的同向重复序列或突变体嵌合指导序列的方法。本发明的方面还提供了所述序列的选择。

  本发明的方面还提供了简化CRISPR复合物的组分的克隆和递送的方法。在本发明的优选实施例中,适合的启动子,如U6启动子,与DNA寡核苷酸一起扩增并且添加到指导RNA上。然后将生成的PCR产物转染到细胞中以驱动指导RNA的表达。本发明的方面还涉及体外转录的或从合成公司订购并且直接转染的指导RNA。

  在一个方面,本发明提供了通过使用更具活性的聚合酶来提高活性的方法。在一个优选的实施例中,这些指导RNA在T7启动子控制下的表达是由该细胞中的T7聚合酶的表达驱动的。在一个有利的实施例中,该细胞是真核细胞。在一个优选的实施例中,该真核细胞是人类细胞。在一个更优选的实施例中,该人类细胞是患者特异性细胞。

  在一个方面,本发明提供了用于降低Cas酶的毒性的方法。在某些方面,该Cas酶是如本文描述的任何Cas9,例如任何天然存在的细菌Cas9以及任何嵌合体、突变体、同源物或直向同源物。在一个优选的实施例中,该Cas9以mRNA的形式递送到该细胞中。这允许该酶的瞬时表达,由此降低毒性。在另一个优选实施例中,本发明还提供了在诱导型启动子的控制下表达Cas9的方法、以及在其中使用的构建体。

  在另一方面,本发明提供了用于改进CRISPR-Cas系统的体内应用的方法。在该优选实施例中,该Cas酶是本文描述的野生型Cas9或任何修改版本,包括任何天然存在的细菌Cas9以及任何嵌合体、突变体、同源物或直向同源物。本发明的一个有利方面提供了易于被包装到病毒载体以便递送的Cas9同源物的选择。Cas9直向同源物典型地共享3-4个RuvC结构域和一个HNH结构域的通用结构。最5'的RuvC结构域切割非互补链,而HNH结构域切割互补链。所有符号都是就指导序列而言的。

  在5'RuvC结构域中的催化残基是通过该感兴趣的Cas9与其他Cas9直向同源物(来自化脓链球菌II型CRISPR位点、嗜热链球菌CRISPR位点1、嗜热链球菌CRISPR位点3、以及凶手弗朗西斯菌(Franciscilla novicida)II型CRISPR位点)的同源性比较而鉴定的,并且保守性Asp残基(D10)被突变为丙氨酸以将Cas9转化成互补链切口酶。类似地,在HNH结构域中的保守性His和Asn残基被突变为丙氨酸以将Cas9转化为非互补链切口酶。在一些实施例中,这两组突变都可以进行,将Cas9转化为非切割酶。

  在一些实施例中,该CRISPR酶是I型或III型CRISPR酶,优选II型CRISPR酶。这种II型CRISPR酶可以是任何Cas酶。优选的Cas酶可以被鉴定为Cas9,因为这可以是指与来自II型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别。最优选地,该Cas9酶来自或衍生自spCas9或saCas9。关于衍生,申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义,但是如本文所述它在某些方面已经被突变(修饰)。

  应当理解的是,术语Cas和CRISPR酶在本文中通常可互换地使用,除非另外说明。如上提及的,在本文中使用的许多残基编号是指来自化脓链球菌中的II型CRISPR座位的Cas9酶。然而,应当理解的是,本发明包括更多的来自其他微生物物种的Cas9s,如SpCas9、SaCas9、St1Cas9等等。在本文中提供了另外的实例。熟练的技术人员将能够通过比较相关氨基酸序列而确定在除了SpCas9之外的Cas9酶中的适当的相应残基。因此,在特异性氨基酸置换是指使用SpCas9编号的情况下,那么,除非上下文清楚说明,这并不预期是指其他Cas9酶,本披露预期涵盖在其他Cas9酶中的相应修饰。SaCas9是特别优选的。

  本文中提供了在这种情形下针对人类进行优化(即,针对在人类中表达进行优化)的密码子优化序列的实例,例如参见SaCas9人类密码子优化序列。虽然这是优选的,但是应当理解的是,其他实例也是可能的,并且针对除人类之外的宿主物种的密码子优化或针对具体器官(如脑)的密码子优化是已知的。

  在另外的实施例中,本发明提供了通过产生嵌合Cas9蛋白而增强Cas9的功能的方法。嵌合Cas9蛋白嵌合Cas9可以是含有来自一种以上的天然存在的Cas9的片段的新Cas9。这些方法可包括使一种Cas9同源物的N末端片段与另一种Cas9同源物的C末端片段融合。这些方法还允许选择这些嵌合Cas9蛋白所展示的新特性。

  应当理解的是,在本发明的方法中,在该生物是一种动物或植物的情况下,该修饰可以离体地或在体外例如在细胞培养物中进行,在一些情况下不在体内进行。在其他实施例中,可以在体内进行。

  在一个方面,本发明提供了一种通过操纵在感兴趣基因组座位中的靶序列来修饰生物或非人类生物的方法,该方法包括:

  递送非天然存在的或工程化的组合物,该组合物包含:

  A)-I.CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列,其中该多核苷酸序列包含:

  (a)指导序列,该指导序列能够杂交到真核细胞中的靶序列上,

  (b)tracr配对序列,和

  (c)tracr序列,以及

  II.对包含至少一个或多个核定位序列的CRISPR酶进行编码的多核苷酸序列,

  其中(a)、(b)和(c)以5’到3’方向排列,

  其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且

  其中该CRISPR复合物包含与(1)杂交或可杂交到该靶序列上的该指导序列、和(2)杂交或可杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,并且编码CRISPR酶的多核苷酸序列是DNA或RNA,

  或者

  (B)I.多核苷酸,其包含:

  (a)指导序列,该指导序列能够杂交到真核细胞中的靶序列上,和

  (b)至少一种或多种tracr配对序列,

  II.编码CRISPR酶的多核苷酸序列,以及

  III.包含tracr序列的多核苷酸序列,

  其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且

  其中该CRISPR复合物包含与(1)杂交或可杂交到该靶序列上的该指导序列、和(2)杂交或可杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,并且编码CRISPR酶的多核苷酸序列是DNA或RNA。

  在一些实施例中,以上第二替代方案是优选的。然而,在本披露的大部分但是并非所有方面中,第一替代方案是特别优选的。

  应当理解的是,本申请是针对肝脏,无论是器官本身或其内的组织,或是仅仅一种或多种肝脏细胞,例如肝细胞。原代肝细胞是优选的。肝脏细胞可以包含在脊椎动物(患者(在需要CRISPR-定向基因疗法的动物的意义上)或模式生物)内,或者可以是在细胞培养物、类器官或其他离体组织(例如像其中肝细胞接种和生长在支架上的“芯片上的肝”)中。收获的来自非-移植器官的肝细胞也是有用的靶标。随着应用于生物学的3-D印刷技术的开发,印刷的组织在掌握之内,并且完全可行的是以建立类器官的方式印刷的或印刷在芯片的肝脏细胞或组织也可以被靶向。

  因此,提供了包含肝脏细胞如肝细胞的模式生物,本发明的CRISPR-Cas系统已经递送至这些肝脏细胞。类似地,还提供了两种或更多种肝脏细胞例如肝细胞的离体集合,本发明的CRISPR-Cas系统已经递送至这些肝脏细胞。此类集合可以包括占据支架的肝脏器官、肝脏类器官、肝脏细胞(例如像‘在芯片上的肝’)。还提供了创建此类模型或集合的方法。

  具体地说,此类肝脏细胞可以表达或可以包括能够表达Cas酶的多核苷酸。如在此所讨论的,这具有以下优势:提供用于通过基因干扰(包括敲低)来探询基因功能的即用模型。这在研究肝脏病症(如淀粉样变性和在本文中列出的其他那些)以及肝脏是体内唯一的影响元件的更广泛的病症(如肥胖症)中是特别有用的。

  还在此提供了探询肝脏基因功能的方法。这些典型地包括将CRISPR-Cas系统递送至在体内或离体的肝脏细胞。然而,如果细胞已经包含Cas,无论表达为蛋白还是由细胞内已经包含的多核苷酸编码,则仅CRISPR多核苷酸需要被递送。该方法可以包括从肝脏提取、并且任选地重新插入回到肝脏中。通过递送,意味着将多核苷酸实际上物理递送至细胞核,并且转染。因此,递送还应该被解读为包括转染,除非另外清楚地指出。

  还提供了一种在一种或多种肝脏细胞中诱导基因干扰的方法,该方法包括将第一细胞群体用根据本发明的CRISPR-Cas系统转导,由此改变该第一细胞群体的基因组,以获得第二细胞群体。该方法可以在离体或体外进行,例如在细胞培养物中或在离体或体外模型(例如类器官或‘芯片上的肝’)中。可替代地,该方法可以是在体内,在该情况下它还可以包括从该受试者分离第一细胞群体,并且将第二细胞群体移植(回)入受试者中。基因干扰可以是针对一种或多种、或者两种或更多种、或者三种或更多种、或者四种或更多种基因。该基因干扰可以是基因功能(即编码基因产物的活性)的降低。这可以是例如通过改变第一细胞群体的基因组来诱导,以获得第二细胞群体,其中该第二细胞群体具有缺陷基因型,例如不存在于该第一细胞群体中的单基因病症。这可能需要相应的修复模板,如在此所讨论的,以提供缺陷序列,或者它可以通过DSB的诱导。具体而言,该基因干扰是基因敲低。

  可替代地,该基因干扰可以是基因功能(即编码基因产物的活性)的增加。这可以是例如通过改变第一细胞群体的基因组来诱导,以获得第二细胞群体,其中该第一细胞群体具有缺陷基因型,例如不存在于(即在其中被校正)该第二细胞群体中的单基因病症。这可能需要相应的修复模板,如在此所讨论的,以提供校正的序列。

  如果使用多元,则设想一种或多种基因的减少和一种或多种基因的增加。这可以通过提供一种或多种指导物(在多元体中)来实现,并且相应的修复模板可以用于减少功能,而一种或多种指导物以及它们的相应的模板可以用于增加功能。

  还提供了探询在一种或多种肝脏细胞中一种或多种基因的功能的方法,该方法包括确定在第一肝脏细胞群体中一种或多种基因的表达变化,诱导在所述第一群体中的基因干扰以提供具有改变的基因组(或基因型)的所述第二群体,并且确定在第二肝脏细胞群体中一种或多种基因的表达变化,由此探询该一种或多种基因的功能。

  还提供了一种模型和一种创建所述模型的方法。该模型可以是包括肝脏的动物(体内模型),或它可以是离体或体外模型,例如肝脏类器官或‘芯片上的肝’或肝脏细胞的集合(如在支架上),如在此所述的。任一模型的这些肝脏细胞将优选用Cas9转染。因此,确切地提供了一种包括一种或多种含CRISPR酶(优选Cas9,如Sa或SpCas9)的肝脏细胞的模型。模型细胞可以已经用在此提供的第二调节元件转染或转导,该第二调节元件是可操作地连接至编码CRISPR酶的酶编码序列的第二调节元件,该CRISPR酶包括至少一个或多个核定位序列(NLS)。该模型可以是如上所述的体内模型,或它可以是离体或体外模型。这样的模型允许快速探询一种或多种基因的功能,因为仅CRISPR-Cas系统多核苷酸序列(包括靶向所述一种或多种基因的一种或多种指导序列)需要被递送以扰乱所述基因的功能。换言之,在所述模型中探询基因功能的方法可以包括仅递送CRISPR-Cas系统多核苷酸序列(包括该一种或多种指导序列),Cas(CRISPR酶)已经被提供于该模型的一种或多种细胞中。还提供了创建此类模型的方法,这些方法包括用第二调节元件转导或转染第一肝脏细胞群体中的一种或多种肝脏细胞,该第二调节元件可操作地连接至编码CRISPR酶的酶编码序列,该CRISPR酶包括如在此所述的至少一个或多个核定位序列(NLS),由此提供一种或多种包含或表达该CRISPR酶的第二肝脏细胞群。

  还提供了创建基因扰动模型特别是基因敲低模型的方法。这些方法可以典型地包括在第一细胞群体中诱导一种或多种基因的基因干扰,如在此所述,由此提供具有改变的基因组(或基因型)的第二细胞群体。然后第二细胞群体可以被接种在例如支架中或芯片上,由此提供离体或体外模型。可替代地,第二群体可以包含于体内动物中。

  还设想了基因疗法的方法。例如,一种或多种缺陷基因型(例如单点突变)的校正可以通过在肝脏细胞中使用在此讨论的本发明的CRISPR-Cas系统(包括模型)来实现。与肝脏相关的单基因病症是特别优选的并且在此进行例证,参见实例38,其中该CRISPR-Cas9系统靶标是ApoB(一种脂类代谢基因),有效于在体内诱导表型改变。还提供了用于在基因疗法中使用的组合物。

  尽管设想了各种Cas酶,但Cas9是特别优选的,并且我们已经示出对于SaCa9在肝脏中的特别功效。如果该Cas酶是SaCas酶,来自Sa的Tracr序列也是优选的。在这种情况下适合的PAM是NNGRR。对于化脓链球菌Cas9或衍生酶,适合的PAM是5'-NRG。

  尽管可以使用一种指导物,但与两种、三种、四种或更多种指导物的所谓多元化在探询基因功能和模型创建(以提供多个基因敲低)中是特别有用的,而且在其中多个缺陷基因型有待校正(在单一基因中的多个错误,或者更可能地在跨若干基因分布的多个错误)的基因疗法中也是特别有用的。可替代地,与两种指导物多元化可用于双切口酶途径以减少脱靶效应或可用于简单地在一种基因内选择多个靶标以确保Cas募集。三重和四重指导物是优选的。在此对基因的引用可以与基因组座位互换。

  此处描述的内含子途径在此方面也是有用的,其中指导物定位于Cas内含子之内。

  优选的递送手段包括由如下文坎纳斯特(Kanasty)描述的方法,例如LNP,尤其是其中仅指导物有待递送或它要被单独递送。然而,包括慢病毒和AAV的病毒载体通常对于肝脏是优选的,因为迄今它们已经是成功的。在这些中,AAV是优选的,并且尤其是血清型8,其中AAV2/8显示是有效的。

  一些优选的靶标,在它们存在于肝脏中或它们是肝脏的病症的程度上,是代谢性障碍,例如以下中的任一个:淀粉样蛋白神经病变(TTR、PALB);淀粉样变性(APOA1、APP、AAA、CVAP、AD1、GSN、FGA、LYZ、TTR、PALB);肝硬化(KRT18、KRT8、CIRH1A、NAIC、TEX292、KIAA1988);囊性纤维化(CFTR、ABCC7、CF、MRP7);糖原贮积病(SLC2A2、GLUT2、G6PC、G6PT、G6PT1、GAA、LAMP2、LAMPB、AGL、GDE、GBE1、GYS2、PYGL、PFKM);肝腺瘤,142330(TCF1、HNF1A、MODY3),肝衰竭,早期发病以及神经障碍(SCOD1、SCO1),肝脂酶缺乏(LIPC)、肝母细胞癌、癌症(cancer)和癌(carcinomas)(CTNNB1、PDGFRL、PDGRL、PRLTS、AXIN1、AXIN、CTNNB1、TP53、P53、LFS1、IGF2R、MPRI、MET、CASP8、MCH5;髓质囊肾病(UMOD、HNFJ、FJHN、MCKD2、ADMCKD2);苯丙酮尿症(PAH、PKU1、QDPR、DHPR、PTS);多囊肾和肝病(FCYT、PKHD1、ARPKD、PKD1、PKD2、PKD4、PKDTS、PRKCSH、G19P1、PCLD、SEC63)。其他优选的靶标包括以下中的任何一个或多个,包括以下中的一个或多个:PCSK9;Hmgcr;SERPINA1;ApoB;和/或LDL。

  应当理解的是,改变肝脏中的表达的方法不涉及种系改变,这可以基于道德而被排除。事实上,尽管设想了干细胞的转染,并且在一些实施例中是当然优选的,但原代肝细胞是特别优选的,特别是当它们可以示出或被刺激以示出一些再生时。

  II型CRISPRS是特别优选的,尤其是用于在真核生物中使用,如在本发明的情况下,其中肝脏仅发现于真核生物,特别是脊椎动物中(在任何情况下)。

  使用CRISPR-Cas系统以引起表型改变是特别的优点,尤其是在体内。我们已经在本申请中显示这点。

  当设想治疗应用,或用于在肝脏中的其他基因组工程化时,则需要校正的情况下将理解的是在基因组DNA靶标的切口产生或切割后,然后经由HDR途径的校正是优选的。对于基因敲低,NHEJ是有利的,然而,经由HDR途径的校正优选用于疗法。在这样的情况下,优选的是递送修复模板。这最优选地是ssDNA,尽管RNA经由逆转录病毒载体提供相应的DNA模板也是可能的。技术人员可以容易地根据在此处的贡献于本领域知识的传授将本发明付诸于实践;并且关于这一点要提及的是技术人员根据在此处的贡献于本领域知识的传授可以容易地理解和实施关于同源臂长度的考虑。提及的专利申请和公开案包括本文发明人张(Zhang)的,包括在此引用的那些。该修复模板是优选与CRISPR-Cas系统的一个或多个元件共递送的。

  还提供了一种改变至少一种肝脏基因产物的表达的方法,该方法包括向真核肝脏细胞(该细胞包含并且表达具有靶序列且编码基因产物的DNA分子)例如肝细胞中引入工程化、非天然发生的规律间隔成簇短回文重复(CRISPR)-CRISPR关联的(Cas)(CRISPR-Cas)系统,该系统包括一种或多种包含以下项的载体:

  a)第一调节元件,其在真核细胞中是可操作的,可操作地连接到对与靶序列杂交的CRISPR-Cas系统指导RNA进行编码的至少一种核苷酸序列上,以及

  b)第二调节元件,其在真核细胞中是可操作的,可操作地连接到对Type-II Cas9蛋白进行编码的核苷酸序列上,

  其中组分(a)和(b)是位于系统的相同或不同载体上,借此该指导RNA靶向于靶序列,并且Cas9蛋白切割该DNA分子,借此至少一种肝脏基因产物的表达被改变;并且,其中该Cas9蛋白和该指导RNA并不天然地一起存在。

  下文对靶标的提及将理解为以另外方式表达于肝脏中的肝靶标或基因,除非另外清楚指出。

  编码CRISPR酶的多核苷酸序列、指导序列、tracr配对序列或tracr序列的任一者或全部可以是RNA。包括编码CRISPR酶的序列、指导序列、tracr配对序列或tracr序列的多核苷酸可以是RNA并且可以经由脂质体、纳米粒子、外泌体、微囊泡、或基因枪进行递送。

  应当理解的是,在提及作为RNA并且被认为‘包含’这样tracr配对序列的特征的多核苷酸的情况下,该RNA序列包括该特征。在该多核苷酸是DNA并且被认为包含这样tracr配对序列的特征的情况下,该DNA序列被或者可以被转录成包括该讨论中的特征的RNA。在该特征是蛋白质的情况下,如CRISPR酶,所提及的该DNA或RNA序列被或者可以被翻译(以及在DNA首先被转录的情况下)。

  因此,在某些实施例中,本发明提供了一种通过操纵在感兴趣基因组座位中的靶序列来修饰一种生物(例如包括人类的哺乳动物或非人类哺乳动物或生物)的肝脏的方法,该方法包括递送一种包含病毒或质粒载体系统的非天然存在的或工程化的组合物,该载体系统包含可操作地编码用于其表达的组合物的一种或多种病毒或质粒载体,其中该组合物包括:(A)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含:I.第一调节元件,该第一调节元件可操作地连接到一个CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列上,其中该多核苷酸序列包含(a)一个能够杂交到真核细胞中的靶序列上的指导序列,(b)tracr配对序列,和(c)tracr序列,以及II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,该CRISPR酶包含至少一个或多个核定位序列(或者任选地至少一个或多个核定位序列,因为在一些实施例中可能不涉及NLS),其中(a)、(b)和(c)以5’到3’方向排列,其中组分I和II位于该系统的相同或不同载体上,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列指导CRISPR复合物与该靶序列的序列特异性结合,并且其中该CRISPR复合物包含与(1)杂交或可杂交到该靶序列上的指导序列、和(2)杂交或可杂交到该tracr序列上的tracr配对序列复合的CRISPR酶,或者(B)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统含有一种或多种载体,该一种或多种载体包含I.第一调节元件,该第一调节元件可操作地连接到(a)能够杂交到真核细胞中的靶序列上的指导序列、和(b)至少一种或多种tracr配对序列,II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,以及III.第三调节元件,该第三调节元件可操作地连接到tracr序列上,其中组分I、II和III位于该系统的相同或不同载体上,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列指导CRISPR复合物与该靶序列的序列特异性结合,并且其中该CRISPR复合物包含与(1)杂交或可杂交到该靶序列上的指导序列、和(2)杂交或可杂交到该tracr序列上的tracr配对序列复合的CRISPR酶。在一些实施例中,组分I、II和III位于相同载体上。在其他实施例中,组分I和II位于相同载体上,而组分III位于另一种载体上。在其他实施例中,组分I和III位于相同载体上,而组分II位于另一种载体上。在其他实施例中,组分II和III位于相同载体上,而组分I位于另一种载体上。在其他实施例中,组分I、II和III各自位于不同的载体上。本发明还提供了如本文所述的病毒或质粒载体系统。

  优选地,该载体可以是病毒载体,如慢病毒或杆状病毒或优选地腺病毒/腺病毒相关病毒载体,但是其他递送手段也是已知的(如酵母系统、微囊泡、基因枪/将载体附接到金纳米粒子上的手段)并且被提供。在一些实施例中,可以经由脂质体、纳米粒子、外泌体、微囊泡、或基因枪递送一种或多种病毒载体或质粒载体。

  通过操纵靶序列,申请人还打算靶序列的表观遗传操纵。这可以是靶序列的染色质状态的操纵,如借助于修饰靶序列的甲基化状态(即,甲基化或甲基化模式或CpG岛的添加或去除)、组蛋白修饰,从而增加或降低靶序列的可及性,或者借助于3D折叠。

  应当理解的是,在提及一种通过操纵在感兴趣基因组座位中的靶序列来修饰一种生物或哺乳动物(包括人类或非人类哺乳动物或生物)的方法的情况下,这可适用于作为整体的生物(或哺乳动物)或者仅仅是来自这种生物的单个细胞或细胞群(如果该生物是多细胞的话)。在人类的情况下,例如,申请人特别地设想到单个细胞或细胞群,并且这些细胞可以优选地进行离体修饰,进而重新引入。在这种情况下,活组织检查或其他组织或生物流体样品可以必要的。在这方面,干细胞也是特别优选的。但是,当然还设想了体内实施例。

  在某些实施例中,本发明提供了一种治疗或抑制对其有需要的受试者(例如哺乳动物或人类)或非人类受试者(例如,哺乳动物)中感兴趣基因组座位中的靶序列缺陷所引起的病症的方法,该方法包括通过操纵该靶序列而修饰该受试者或非人类受试者,并且其中该病症对于借助于包括提供治疗的靶序列操纵的治疗或抑制是敏感的,该治疗包括:递送包含AAV或慢病毒载体系统的非天然存在的或工程化的组合物,该载体系统含有一种或多种AAV或慢病毒载体,所述载体可操作地编码用于其表达的组合物,其中在表达时该靶序列由该非天然存在的或工程化的组合物操纵,其中该非天然存在的或工程化的组合物包括:(A)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含:I.第一调节元件,该第一调节元件可操作地连接到一个CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列上,其中该多核苷酸序列包含(a)一个能够杂交到真核细胞中的靶序列上的指导序列,(b)tracr配对序列,和(c)tracr序列,以及II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,该CRISPR酶包含至少一个或多个核定位序列(或者任选地至少一个或多个核定位序列,因为在一些实施例中可能不涉及NLS),其中(a)、(b)和(c)以5’到3’方向排列,其中组分I和II位于该系统的相同或不同载体上,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列指导CRISPR复合物与该靶序列的序列特异性结合,并且其中该CRISPR复合物包含与(1)杂交或可杂交到该靶序列上的指导序列、和(2)杂交或可杂交到该tracr序列上的tracr配对序列复合的CRISPR酶,或者(B)非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统含有一种或多种载体,该一种或多种载体包含I.第一调节元件,该第一调节元件可操作地连接到(a)能够杂交到真核细胞中的靶序列上的指导序列、和(b)至少一种或多种tracr配对序列,II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,以及III.第三调节元件,该第三调节元件可操作地连接到tracr序列上,其中组分I、II和III位于该系统的相同或不同载体上,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列指导CRISPR复合物与该靶序列的序列特异性结合,并且其中该CRISPR复合物包含与(1)杂交或可杂交到该靶序列上的指导序列、和(2)杂交或可杂交到该tracr序列上的tracr配对序列复合的CRISPR酶。在一些实施例中,组分I、II和III位于相同载体上。在其他实施例中,组分I和II位于相同载体上,而组分III位于另一种载体上。在其他实施例中,组分I和III位于相同载体上,而组分II位于另一种载体上。在其他实施例中,组分II和III位于相同载体上,而组分I位于另一种载体上。在其他实施例中,组分I、II和III各自位于不同的载体上。本发明还提供了如本文所述的病毒(例如,AAV或慢病毒)载体系统,并且可以是如本文所述的载体系统的一部分。

  本发明的一些方法可以包括诱导表达。该生物或受试者是真核细胞(包括哺乳动物,包括人类)或非人类真核生物或非人类动物或非人类哺乳动物,其条件是它具有肝脏或肝功能。在一些实施例中,该生物或受试者是非人类动物,并且可以是节肢动物例如昆虫,或者可以是线虫。在本发明的一些方法中,该生物或受试者是哺乳动物或非人类哺乳动物。非人类哺乳动物可以是例如啮齿动物(优选小鼠或大鼠)、有蹄动物、或灵长动物。在本发明的一些方法中,该病毒载体是AAV或慢病毒,并且可以是如本文所述的载体系统的一部分。在本发明的一些方法中,该CRISPR酶是Cas9。在本发明的一些方法中,该指导序列的表达是在T7启动子控制下并且是由T7聚合酶的表达驱动的。

  在一些实施例中本发明包含一种递送CRISPR酶的方法,该方法包括向细胞递送编码该CRISPR酶的mRNA。在本发明的这些方法的一些中,该CRISPR酶是Cas9。

  本发明还提供了制备本发明的载体系统尤其是如本文所述的病毒载体系统的方法。在一些实施例中,本发明包括一种制备本发明的AAV的方法,该方法包括将含有或其基本组成为编码AAV的一种或多种核酸分子的一种或多种质粒转染到感染AAV的细胞中,并且提供对于AAV的复制和包装必须的AAV rep和/或cap。在一些实施例中,对于AAV的复制和包装必须的AAV rep和/或cap是通过用一种或多种辅助质粒或一种或多种辅助病毒转染这些细胞而提供的。在一些实施例中,该辅助病毒是痘病毒、腺病毒、疱疹病毒或杆状病毒。在一些实施例中,该痘病毒是牛痘病毒。在一些实施例中,这些细胞是哺乳动物细胞。并且在一些实施例中,这些细胞是昆虫细胞,并且该辅助病毒是杆状病毒。在其他实施例中,该病毒是慢病毒。

  本发明进一步包括本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA),其用于在医学或治疗中使用。在一些实施例中,本发明包括根据本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA),其用于在根据本发明的方法中使用。在一些实施例中,本发明提供了本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA)在离体基因或基因组编辑中的用途。在某些实施例中,本发明包括本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA)在用于离体基因或基因组编辑中或在根据本发明的方法中使用的药剂的制造中的用途。在一些实施例中,本发明包括本发明的组合物或其CRISPR酶(包括或可替代地是编码CRISPR酶的mRNA),其中该靶序列在其3’端的侧翼为PAM(原型间隔子邻近基序)序列,该PAM序列包含5’-基序,尤其是在Cas9是(或衍生自)化脓链球菌或金黄色葡萄球菌Cas9的情况下。例如,适合的PAM是分别针对SpCas9或SaCas9酶(或衍生的酶)的5'-NRG或5'-NNGRR(其中N是任何核苷酸),如下文提及的。

  应当理解的是,SpCas9或SaCas9是来自或衍生自化脓链球菌或金黄色葡萄球菌Cas9的那些。它当然可以是从野生型突变的或以其他方式改变的,以适应预期用途,如在此所描述。双切口酶D10A突变体或变体是优选的,尤其是结合被定向为在相同染色体的不同链上相对位点的两个重叠指导物。

  本发明的方面包括提高CRISPR酶例如Cas9介导的基因靶向的特异性,以及降低经由CRISPR酶例如Cas9的脱靶修饰的可能性。在一些实施例中,本发明包括通过借助于操纵在细胞中的感兴趣基因组座位中的DNA双链体的相对链上的第一和第二靶序列而将脱靶修饰降低到最低限度来修饰生物或非人类生物的方法,该方法包括递送非天然存在的或工程化的组合物,该组合物包含:

  I.一种第一CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列,其中该第一多核苷酸序列包含:

  (a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,

  (b)第一tracr配对序列,和

  (c)第一tracr序列,

  II.一种第二CRISPR-Cas系统chiRNA多核苷酸序列,其中该第二多核苷酸序列包含:

  (a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,

  (b)第二tracr配对序列,和

  (c)第二tracr序列,以及

  III.对包含至少一个或多个核定位序列并且包含一个或多个突变的CRISPR酶进行编码的多核苷酸序列,其中(a)、(b)和(c)以5’到3’方向排列,其中在转录时,该第一和第二tracr配对序列分别杂交到该第一和第二tracr序列上,并且该第一和第二指导序列分别指导第一和第二CRISPR复合物与该第一和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)杂交或可杂交到该第一靶序列上的第一指导序列、和(2)杂交或可杂交到该第一tracr序列上的第一tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)杂交或可杂交到该第二靶序列上的第二指导序列、和(2)杂交或可杂交到该第二tracr序列上的第二tracr配对序列复合的CRISPR酶,其中编码CRISPR酶的多核苷酸序列是DNA或RNA,并且其中该第一指导序列指导邻近该第一靶序列的DNA双链体的一条链的切割,并且该第二指导序列指导邻近该第二靶序列的另一条链的切割,从而诱导双链的断裂,由此通过将脱靶修饰降低到最低限度而修饰该生物或非人类生物。

  在本发明的一些方法中,编码CRISPR酶的多核苷酸序列、该第一和第二指导序列、该第一和第二tracr配对序列或该第一和第二tracr序列中的任一者或全部是RNA。在本发明的另外的实施例中,包括编码CRISPR酶的序列、该第一和第二指导序列、该第一和第二tracr配对序列或该第一和第二tracr序列的多核苷酸是RNA,并且是经由脂质体、纳米粒子、外泌体、微囊泡、或基因枪递送的。在本发明的某些实施例中,该第一和第二tracr配对序列共享100%的一致性和/或该第一和第二tracr序列共享100%的一致性。在一些实施例中,这些多核苷酸可以被包含在含有一种或多种载体的载体系统中。在本发明的优选实施例中,该CRISPR酶是一种Cas9酶,例如SpCas9。在本发明的一个方面,该CRISPR酶包含在催化结构域中的一个或多个突变,其中该一个或多个突变选自下组,该组由以下各项组成:D10A、E762A、H840A、N854A、N863A和D986A。在一个高度优选的实施例中,该CRISPR酶具有D10A突变。在优选的实施例中,该第一CRISPR酶具有一个或多个突变,使得该酶是一种互补链切口酶,并且该第二CRISPR酶具有一个或多个突变,使得该酶是一种非互补链切口酶。可替代地,该第一酶可以是一种非互补链切口酶,而该第二酶可以是一种互补链切口酶。

  在本发明的优选方法中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’突出端。在本发明的实施例中,该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中,该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对。最优选地,重叠是在5和-1碱基对之间。

  在一些实施例中,本发明包括通过借助于操纵在细胞中的感兴趣基因组座位中的DNA双链体的相对链上的第一和第二靶序列而将脱靶修饰降低到最低限度来修饰生物或非人类生物的方法,该方法包括递送非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含

  I.第一调节元件,该第一调节元件可操作地连接至

  (a)第一指导序列,该第一指导序列能够杂交到该第一靶序列上,和

  (b)至少一种或多种tracr配对序列,

  II.第二调节元件,该第二调节元件可操作地连接至

  (a)第二指导序列,该第二指导序列能够杂交到该第二靶序列上,和

  (b)至少一种或多种tracr配对序列,

  III.第三调节元件,该第三调节元件可操作地连接至编码CRISPR酶的酶编码序列,以及

  IV.第四调节元件,该第四调节元件可操作地连接至tracr序列,

  其中组分I、II、III和IV位于该系统的相同或不同载体上,在转录时,该tracr配对序列杂交到该tracr序列上,并且该第一和第二指导序列分别指导第一和第二CRISPR复合物与该第一和第二靶序列的序列特异性结合,其中该第一CRISPR复合物包含与(1)杂交或可杂交到该第一靶序列上的第一指导序列、和(2)杂交或可杂交到该tracr序列上的tracr配对序列复合的CRISPR酶,其中该第二CRISPR复合物包含与(1)杂交或可杂交到该第二靶序列上的第二指导序列、和(2)杂交或可杂交到该tracr序列上的tracr配对序列复合的CRISPR酶,其中编码CRISPR酶的多核苷酸序列是DNA或RNA,并且其中该第一指导序列指导邻近该第一靶序列的DNA双链体的一条链的切割,并且该第二指导序列指导邻近该第二靶序列的另一条链的切割,从而诱导双链的断裂,由此通过将脱靶修饰降低到最低限度而修饰该生物或非人类生物。

  本发明还提供了如本文所述的载体系统。该系统可以包含一种、二种、三种或四种不同的载体。组分I、II、III和IV因此可以被定位在一种、两种、三种或四种不同的载体上,并且在此设想了针对这些组分的可能位置的所有组合,例如:组分I、II、III和IV可以位于相同载体上;组分I、II、III和IV可以各自位于不同的载体上;组分I、II、III和IV可以位于总计两种或三种不同载体上,其中设想了位置的所有组合,等。

  在本发明的一些方法中,编码CRISPR酶的多核苷酸序列、该第一和第二指导序列、该第一和第二tracr配对序列或该第一和第二tracr序列中的任一者或全部是RNA。在本发明另外的实施例中,该第一和第二tracr配对序列共享100%的一致性和/或该第一和第二tracr序列共享100%的一致性。在本发明的优选实施例中,该CRISPR酶是一种Cas9酶,例如SpCas9。在本发明的一个方面,该CRISPR酶包含在催化结构域中的一个或多个突变,其中该一个或多个突变选自下组,该组由以下各项组成:D10A、E762A、H840A、N854A、N863A和D986A。在一个高度优选的实施例中,该CRISPR酶具有D10A突变。在优选的实施例中,该第一CRISPR酶具有一个或多个突变,使得该酶是一种互补链切口酶,并且该第二CRISPR酶具有一个或多个突变,使得该酶是一种非互补链切口酶。可替代地,该第一酶可以是一种非互补链切口酶,而该第二酶可以是一种互补链切口酶。在本发明的一个另外的实施例中,这些病毒载体的一种或多种可以经由脂质体、纳米粒子、外泌体、微囊泡、或基因枪进行递送。

  在本发明的优选方法中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’突出端。在本发明的实施例中,该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中,该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对。

  在一些实施例中,本发明包括一种通过借助于向含有和表达编码感兴趣的基因产物的双链DNA分子的细胞中引入一种工程化的、非天然存在的CRISPR-Cas系统将脱靶修饰降低至最低限度而修饰感兴趣的基因组座位的方法,该CRISPR-Cas系统包含具有一个或多个突变的Cas蛋白和两个分别靶向该DNA分子的第一链和第二链的指导RNA,由此这些指导RNA靶向编码该基因产物的DNA分子,并且该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口,由此改变该基因产物的表达;并且,其中该Cas蛋白和这两个指导RNA并不天然地一起存在。

  在本发明的优选方法中,该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口导致一个5’突出端。在本发明的实施例中,该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中,该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对。

  本发明的实施例还包括包含融合到tracr配对序列和tracr序列上的指导序列的指导RNA。在本发明的一个方面,该Cas蛋白经密码子优化以便在真核细胞,优选哺乳动物细胞或人类细胞中表达。在本发明另外的实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白,例如一种Cas9蛋白。在一个高度优选的实施例中,该Cas蛋白是一种Cas9蛋白,例如SpCas9。在本发明的方面中,该Cas蛋白具有一个或多个选自下组的突变,该组由以下各项组成:D10A、E762A、H840A、N854A、N863A和D986A。在一个高度优选的实施例中,该Cas蛋白具有D10A突变。

  本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中,该基因产物是一种蛋白质。

  本发明还包括一种工程化的、非天然存在的CRISPR-Cas系统,该系统包含具有一个或多个突变的Cas蛋白和两个分别靶向在细胞中编码基因产物的双链DNA分子的第一链和第二链的指导RNA,由此这些指导RNA靶向编码该基因产物的DNA分子,并且该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口,由此改变该基因产物的表达;并且,其中该Cas蛋白和这两个指导RNA并不天然地一起存在。

  在本发明的方面中,这些指导RNA可包含融合到tracr配对序列和tracr序列上的指导序列。在本发明的一个实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白。在本发明的一个方面,该Cas蛋白经密码子优化以便在真核细胞,优选哺乳动物细胞或人类细胞中表达。在本发明另外的实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白,例如一种Cas 9蛋白。在一个高度优选的实施例中,该Cas蛋白是一种Cas9蛋白,例如SpCas9。在本发明的方面中,该Cas蛋白具有一个或多个选自下组的突变,该组由以下各项组成:D10A、E762A、H840A、N854A、N863A和D986A。在一个高度优选的实施例中,该Cas蛋白具有D10A突变。

  本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中,该基因产物是一种蛋白质。

  本发明还包括包含一种或多种载体的工程化的、非天然存在的载体系统,所述载体包含:

  a)第一调节元件,该第一调节元件可操作地连接到两个CRISPR-Cas系统指导RNA的每一者上,这两个指导RNA分别靶向编码基因产物的双链DNA分子的第一链和第二链,

  b)第二调节元件,该第二调节元件可操作地连接至Cas蛋白,

  其中组分(a)和(b)位于该系统的相同或不同载体上,由此这些指导RNA靶向编码该基因产物的DNA分子,并且该Cas蛋白使编码该基因产物的DNA分子的第一链和第二链的每一者产生切口,由此改变该基因产物的表达;并且,其中该Cas蛋白和这两个指导RNA并不天然地一起存在。

  在本发明的方面中,这些指导RNA可包含融合到tracr配对序列和tracr序列上的指导序列。在本发明的一个实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白。在本发明的一个方面,该Cas蛋白经密码子优化以便在真核细胞,优选哺乳动物细胞或人类细胞中表达。在本发明另外的实施例中,该Cas蛋白是一种II型CRISPR-Cas蛋白,例如一种Cas9蛋白。在一个高度优选的实施例中,该Cas蛋白是一种Cas9蛋白,例如SpCas9。在本发明的方面中,该Cas蛋白具有一个或多个选自下组的突变,该组由以下各项组成:D10A、E762A、H840A、N854A、N863A和D986A。在一个高度优选的实施例中,该Cas蛋白具有D10A突变。

  本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中,该基因产物是一种蛋白质。在本发明的优选实施例中,该系统的这些载体是病毒载体。一个另外的实施例中,该系统的这些载体经由脂质体、纳米粒子、外泌体、微囊泡、或基因枪进行递送。

  在一个方面,本发明提供了一种修饰在肝脏细胞中的靶多核苷酸的方法。在一些实施例中,该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该CRISPR复合物包括与杂交或可杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。在一些实施例中,所述切割包括通过所述CRISPR酶切割在该靶序列位置的一条或两条链。在一些实施例中,所述切割导致靶基因的转录降低。在一些实施例中,该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸,其中所述修复导致一种突变,包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中,所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施例中,该方法进一步包括将一种或多种载体递送到所述真核细胞,其中该一种或多种载体驱动下列一者或多者的表达:该CRISPR酶、连接到该tracr配对序列上的指导序列、以及该tracr序列。在一些实施例中,所述载体被递送到受试者内的真核细胞中。在一些实施例中,所述修饰发生在细胞培养物中的所述真核细胞中。在一些实施例中,该方法进一步包括在所述修饰之前从受试者中分离所述真核细胞。在一些实施例中,该方法进一步包括使所述真核细胞和/或从中衍生的细胞返回到所述受试者中。

  在一个方面,本发明提供了修饰多核苷酸在肝脏细胞中的表达的方法。在一些实施例中,该方法包括允许CRISPR复合物结合到该多核苷酸上,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中该CRISPR复合物包括与杂交或可杂交到在所述多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。在一些实施例中,该方法进一步包括将一种或多种载体递送到所述真核细胞,其中该一种或多种载体驱动下列一者或多者的表达:该CRISPR酶、连接到该tracr配对序列上的指导序列、以及该tracr序列。

  在一个方面,本发明提供了一种产生包含突变的疾病基因的模式肝脏细胞的方法。在一些实施例中,疾病基因是与患有或产生一种疾病的风险的增加相关联的任何基因。在一些实施例中,该方法包括(a)向真核细胞中引入一种或多种载体,其中该一种或多种载体驱动下列一者或多者的表达:CRISPR酶、连接到tracr配对序列上的指导序列、以及tracr序列;和(b)允许CRISPR复合物结合到靶多核苷酸上以实施在所述疾病基因内的该靶多核苷酸的切割,其中该CRISPR复合物包含与(1)杂交或可杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)杂交或可杂交到该tracr上的该tracr配对序列复合的CRISPR酶,由此产生包含突变的疾病基因的模式真核细胞。在一些实施例中,所述切割包括通过所述CRISPR酶切割在该靶序列位置的一条或两条链。在一些实施例中,所述切割导致靶基因的转录降低。在一些实施例中,该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸,其中所述修复导致一种突变,包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中,所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。

  在一个方面,本发明提供了一种通过在一种或多种细胞中引入一个或多个突变来选择一种或多种肝脏细胞的方法,该方法包括:将一种或多种载体引入该一种或多种细胞中,其中该一种或多种载体驱动以下一项或多项的表达:CRISPR酶、连接到tracr配对序列上的指导序列、tracr序列、以及编辑模板;其中该编辑模板包含消除CRISPR酶切的一个或多个突变;允许该编辑模板与靶多核苷酸在有待筛选的一种或多种细胞中进行同源重组;允许CRISPR复合物结合到靶多核苷酸上以实施在所述基因内的该靶多核苷酸的切割,其中该CRISPR复合物包含与(1)杂交或可杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)杂交或可杂交到该tracr上的该tracr配对序列复合的CRISPR酶,其中该CRISPR复合物与该靶多核苷酸的结合诱导细胞死亡,由此允许选择其中已经引入一个或多个突变的一种或多种原核细胞。在一个优选的实施例中,该CRISPR酶是Cas9。本发明的方面允许选择特异细胞,而不需要选择标记或可能包括反选择系统的两步法。

  在一个方面,本发明提供了修饰在肝脏细胞中的靶多核苷酸的方法。在一些实施例中,该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该CRISPR复合物包括与杂交或可杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。

  在其他实施例中,本发明提供了一种修饰多核苷酸在肝脏细胞中的表达的方法。该方法包括通过使用结合到多核苷酸上的CRISPR复合物增加或降低靶多核苷酸的表达。

  在希望的情况下,为了实施在细胞中的表达的修饰,将包含tracr序列、连接到该tracr配对序列上的指导序列、编码CRISPR酶的序列的一种或多种载体递送到细胞。在一些方法中,该一种或多种载体包括:可操作地连接到编码所述CRISPR酶的酶编码序列上的调节元件,该CRISPR酶包含核定位序列;以及可操作地连接至tracr配对序列的调节元件和用于在该tracr配对序列的上游插入指导序列的一个或多个插入位点。当表达时,该指导序列指导CRISPR复合物与细胞中的一个靶序列的序列特异性结合。典型地,该CRISPR复合物包含与(1)杂交或可杂交到该靶序列上的该指导序列、和(2)杂交或可杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶。

  在一些方法中,可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如,当CRISPR复合物结合到细胞中的靶序列上时,该靶多核苷酸失活,这样使得该序列不被转录,该编码蛋白不被产生,或者该序列不会像野生型序列一样起作用。例如,可以使蛋白质或微小RNA编码序列失活,这样使得该蛋白质不被产生。

  在某些实施例中,该CRISPR酶包含一个或多个选自下组的突变,该组由以下各项组成:D10A、E762A、H840A、N854A、N863A或D986A和/或该一个或多个突变在该CRISPR酶的RuvC1或HNH结构域中或者为如本文另外论述的突变。在一些实施例中,该CRISPR酶具有一个或多个在催化结构域中的突变,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列指导CRISPR复合物与该靶序列的序列特异性结合,并且其中该酶进一步包含一个功能结构域。在一些实施例中,该功能结构域是一个转录激活结构域,优选VP64。在一些实施例中,该功能结构域一个转录阻遏结构域,优选KRAB。在一些实施例中,该转录阻遏结构域是SID、或SID的多联体(例如SID4X)。在一些实施例中,该功能结构域是一个表观遗传修饰结构域,从而提供了一种表观遗传修饰酶。在一些实施例中,该功能结构域是一种激活结构域,其可以是P65激活结构域。

  在一些实施例中,该CRISPR酶是I型或III型CRISPR酶,但是优选II型CRISPR酶。这种II型CRISPR酶可以是任何Cas酶。一种Cas酶可以被鉴定为Cas9,因为这可以是指与来自II型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别。最优选地,该Cas9酶来自或衍生自spCas9或saCas9。关于衍生,申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义,但是如本文所述它在某些方面已经被突变(修饰)。

  应当理解的是,术语Cas和CRISPR酶在本文中通常可互换地使用,除非另外说明。如上提及的,在本文中使用的许多残基编号是指来自化脓链球菌中的II型CRISPR座位的Cas9酶。然而,应当理解的是,本发明包括更多的来自其他微生物物种的Cas9s,如SpCas9、SaCa9、St1Cas9等等。

  本文中提供了在这种情形下针对人类进行优化(即,针对在人类中表达进行优化)的密码子优化序列的实例,参见SaCas9人类密码子优化序列。在这被优化的同时,应当理解其他实例是可能的并且针对宿主物种的密码子优化是已知的。

  优选地,递送是以载体形式进行的,该载体可以是病毒载体,如慢病毒或杆状病毒或优选地腺病毒/腺病毒相关病毒载体,但是其他递送手段也是已知的(如酵母系统、微囊泡、基因枪/将载体附接到金纳米粒子上的手段)并且被提供。一种载体可能不仅是指病毒或酵母系统(例如,在感兴趣的核酸可被可操作地连接到一个启动子上并且在其控制下(就表达而言,从而最终提供加工的RNA)的情况下),而且指导核酸递送到宿主细胞中。虽然在本文的方法中该载体可以是病毒载体并且AAV在这里是有利的,但是可以采用如本文论述的其他病毒载体,如慢病毒。例如,杆状病毒可以用于昆虫细胞中的表达。这些昆虫细胞进而可用于产生大量的其他载体,如适合于本发明递送的AAV或慢病毒载体。还设想了一种递送本发明CRISPR酶的方法,该方法包括向细胞递送编码该CRISPR酶的mRNA。应当理解的是,在某些实施例中,该CRISPR酶被截短,和/或由少于一千个氨基酸或少于四千个氨基酸组成,和/或是一种核酸酶或切口酶,和/或是经密码子优化的,和/或包含一个或多个突变,和/或包含嵌合CRISPR酶,和/或如本文论述的其他选项。AAV和慢病毒载体是优选的。

  在某些实施例中,该靶序列在其3’端的侧翼或下游为适合于CRISPR酶(典型地Cas,并且尤其是Cas9)的PAM。

  例如,适合的PAM是分别针对SpCas9或SaCas9酶(或衍生的酶)的5'-NRG或5'-NNGRR。

  应当理解的是,SpCas9或SaCas9是来自或衍生自化脓链球菌或金黄色葡萄球菌Cas9的那些。

  本申请中的一些点在下文总结:

  AAV2/8

  优选的用于CRISPR-Cas系统的递送是通过病毒载体。该载体可以是慢病毒载体或AAV载体,如在此以一定长度讨论的。我们已经特别显示的是AAV是病毒载体的优选实例。在其中,我们继续显示,AAV8并且在具体的AAV2/8(AAV8包装有AAV2包装信号ITR)中,可用于递送至肝脏,尤其是在体内。

  在体内看到的表型改变

  如其他地方所讨论,我们已经能够显示可以体内地检测到表型改变。这是显著的前进进步,因为常常在RNAi水平的缺陷是看不到任何持续效果。对于本发明,表型改变可以首次在肝脏中看到。将此实现的一种优选安排是在实例36中使用它。它的重要元件优选是单独或组合,即:

  ·SaCas9;

  ·使用嵌合指导RNA,包括指导物、tracr序列和tracr配对者;

  ·对于tracr序列,Sa tracr是优选的以募集SaCas9;

  ·AAV8或更优选AAV2/8;

  ·出于实验目的,Rosa26是一种有用的阴性对照;

  ·尽管在AAV载体中使用CMV启动子是有帮助的,但使用肝脏特异性启动子例如TBG是特别有效的;

  ·该一个或多个靶标可以是宽范围的,因为已显示一旦指导物成功地递送并且Css9酶得以适合地表达,CRISPR则具有跨靶标的广泛适用性。然而,在肝脏中优选的靶标(针对这些靶标,可以设计指导物)仍包括以下项中的一种或多种:PCSK9;Hmgcr;SERPINA1;ApoB;和/或LDL。

  因此,在一些实施例中,特别优选的是该Cas酶是SaCas9。优选地,该CRISPRS-Cas多核苷酸序列是嵌合的并且优选包括Sa tracr,其中Cas9是SaCas9。可以使用病毒载体,其优选是AAV2/8。此外,肝脏-特异性启动子是理想的,并且优选实例是TBG。所有的这些可以被组合使用,以提供包括Sa tracr的嵌合CRISPRS-Cas多核苷酸序列,其中Cas9是SaCas9,并且该载体是AAV2/8,其中至少Cas9是在肝脏特异性例如TBG的控制之下。以上靶标的任一个可以用于此系统,特别是ApoB,这是由于其在肥胖症中的重要性。

  殷(Yin)和安德森(Anderson)的后来的自然生物技术论文(Nature Biotech Paper)(NBT 2884,在此引用)提供了对于我们已经显示出的体内表型改变的进一步支持。

  然后我们提供在实例37中的另外的数据通过证实经由Cas9对体细胞肝组织高效的体内编辑而增加了进一步支持。此外,经由AAV2/8的递送以及SaCas9的使用再次显示这个体内特别途径的有用性。优选的ApoB被再次靶向。

  稍后实例38和39显示出优异的关于功效的体内数据,包括体内表型改变:特别是ApoB(一种脂类代谢基因),同时实例40示出了该技术在有丝分裂后细胞上的适用性,其肝脏是一个重要的实例。实例41显示多种表位标签对于检测目的是优选的。

  尽管病毒载体是优选的,但在一些实施例中,使用细胞穿透肽是一种可行的替代方案,并且如此也是优选的。

  因此,本发明的目的在于,在本发明中不涵盖任何先前已知的产品、制造该产品的过程、或使用该产品的方法,使得申请人保留和特此公开放弃任何先前已知的产品、过程、或方法的权利。进一步指出的是,在本发明的范围之内,本发明并不旨在涵盖任何产品、过程、或该产品的制造或使用该产品的方法,其不符合USPTO(35U.S.C.§112,第一段)或EPO(EPC的第83条)的书面说明和可实施性要求,使得申请人保留和特此公开放弃任何先前描述的产品、制造该产品的过程、或使用该产品的方法的权利。

  应注意,在本披露并且特别是在权利要求书和/或段落中,术语如“包括(comprise)”、“包括的(comprised)”、“包括了(comprising)”等等可具有在美国专利法中属于它的含义;例如,它们可以表示“包含(includes)”、“包含的(included)”、“包含了(including)”等等;并且这些术语如“基本上由……组成(consisting essentially of)”和“基本上由……组成(consists essentially of)”具有在美国专利法中归于它们的含义,例如,它们允许未被明确叙述的要素,但是排除在现有技术中发现或者影响本发明的基本或新颖特征的要素。

  这些和其他实施例披露于以下详细说明中,或者据其显而易见并且由其涵盖。

  附图简要说明

  本发明的新颖特征在所附权利要求书中具体提出。通过参考对说明性实施例进行叙述的以下详细说明,将获得对本发明的特征和优点的更好理解,在这些实施例中利用了本发明的原理,并且在这些附图中:

  图1显示了该CRISPR系统的示意模型。来自化脓链球菌(黄色)的Cas9核酸酶经由合成的指导RNA(sgRNA)而靶向基因组DNA,该指导RNA由20-nt指导序列(蓝色)和支架(红色)组成。与DNA靶(蓝色)的指导序列碱基对,直接地在必要的5’-NGG原型间隔子邻近基序(PAM;红紫色)的上游,并且Cas9在该PAM(红色三角形)的上游约3bp介导了双链断裂(DSB)。

  图2A-F显示了示例性CRISPR系统、可能的作用机制、在真核细胞中的表达的示例性适应性改变、以及评估核定位和CRISPR活性的试验的结果。

  图3A-D显示了针对示例性靶标的SpCas9特异性的评估结果。

  图4A-G显示了示例性载体系统以及它在指导真核细胞中的同源重组中的使用结果。

  图5提供了原型间隔子序列的表,并且总结了基于示例性化脓链球菌和嗜热链球菌CRISPR系统设计的原型间隔子靶标的修饰效率结果,这些CRISPR系统具有针对人类和小鼠基因组中的座位的相应PAM。用Cas9以及前-crRNA/tracrRNA或嵌合RNA转染细胞,在转染72小时之后进行分析。基于来自指示细胞系的检验员(Surveyor)分析结果,计算了插入缺失(indel)百分比(对于所有原型间隔子靶标N=3,误差为S.E.M.,N.D.表示使用Surveyor测定未检测到,并且N.T.表示在本研究中未检测)。

  图6A-C显示了对于Cas9介导的基因靶向而言的不同tracrRNA转录物的比较。

  图7显示了对于双链断裂诱导的微插入和微缺失的检测的surveyor核酸酶测定的示意图。

  图8A-B显示了用于CRISPR系统元件在真核细胞中的表达的示例性双顺反子表达载体。

  图9A-C显示了在人类基因组中在邻近的化脓链球菌SF370座位1PAM(NGG)(图9A)和嗜热链球菌LMD9座位2PAM(NNAGAAW)(图9B)之间的距离、以及对于每个PAM就染色体(Chr)而言的距离(图9C)的直方图。

  图10A-D显示了示例性CRISPR系统、针对在真核细胞中的表达的示例性适应性改变、以及评估CRISPR活性的试验的结果。

  图11A-C显示了用于靶向哺乳动物细胞中的基因组座位的CRISPR系统的示例性操纵。

  图12A-B显示了在哺乳动物中的crRNA加工的Northern印迹分析的结果。

  图13A-B显示了在人PVALB和小鼠Th座位中的原型间隔子的示例性选择。

  图14显示了在人EMX1座位中的嗜热链球菌CRISPR系统的示例性原型间隔子和相应PAM序列靶标。

  图15提供了用于Surveyor、RFLP、基因组测序、以及Northern印迹分析的引物和探针序列的表。

  图16A-C显示了具有嵌合RNA的CRISPR系统的示例性操纵以及在真核细胞中的系统活性的SURVEYOR分析的结果。

  图17A-B显示了在真核细胞中的CRISPR系统活性的SURVEYOR分析的结果的图示。

  图18显示了使用UCSC基因组浏览器进行的在人类基因组中的一些化脓链球菌Cas9靶位点的示例性可视化。

  图19A-D显示了揭示五个Cas9家族的系统发生分析的环状描绘,这五个家族包括三组大的Cas9(约1400个氨基酸)和两组小的Cas9(约1100个氨基酸)。

  图20A-F显示了揭示五个Cas9家族的系统发生分析的线性描绘,这五个家族包括三组大的Cas9(约1400个氨基酸)和两组小的Cas9(约1100个氨基酸)。

  图21A-D显示了经由同源重组的基因组编辑。(a)SpCas9切口酶的示意图,具有在RuvC I催化结构域中的D10A突变。(b)示意图,表示使用有义或反义单链寡核苷酸作为修复模板在人EMX1座位处的同源重组(HR)。以上红色箭头表示sgRNA切割位点;用于基因分型的PCR引物(表J和K)表示为右图中的箭头。(c)由HR修饰的区域的序列。d,对于野生型(wt)和切口酶(D10A)SpCas9介导的在EMX1靶标1座位处的indel而言的SURVEYOR分析(n=3)。箭头指示预期片段大小的位置。

  图22A-B显示了用于SpCas9的单个载体设计。

  图23显示了代表Cas9直向同源物的长度分布的曲线图。

  图24A-M显示了在突变点位于SpCas9基因内的情况下的序列。

  图25A显示了条件型Cas9、Rosa26靶向载体图谱。

  图25B显示了组成型Cas9、Rosa26靶向载体图谱。

  图26显示了在组成型和条件型Cas9构建体中的重要元件的示意图。

  图27显示了递送和体内小鼠脑Cas9表达数据。

  图28显示了Cas9和嵌合RNA到细胞中的RNA递送(A)GFP报告基因作为DNA或mRNA到Neuro-2A细胞中的递送。(B)针对作为RNA的Icam2基因的Cas9和嵌合RNA的递送导致测试的两个间隔子之一的切割。(C)针对作为RNA的F7基因的Cas9和嵌合RNA的递送导致测试的两个间隔子之一的切割。

  图29显示了DNA双链断裂(DSB)修复如何促进基因编辑。在易错非同源末端连接(NHEJ)途径中,DSB的末端由内源DNA修复机构加工并重新连接在一起,可导致在连接位点的随机插入/缺失(indel)突变。发生在基因编码区内的indel突变可产生移码和提前终止密码子,导致基因敲除。可替代地,处于质粒或单链寡脱氧核苷酸(ssODN)形式的修复模板可以被提供为利用同源定向修复(HDR)途径,该途径允许高保真和精确编辑。

  图30A-C显示了在HEK和HUES9细胞中的HDR的预期结果。(a)具有同源臂的靶向质粒或ssODN(有义或反义)可以用来编辑在靶基因组座位处由Cas9(红色三角形)切割的序列。为了分析HDR的效率,我们在靶座位中引入了HindIII位点(红条),用在同源区外部退火的引物进行PCR扩增。用HindIII消化该PCR产物揭示了HDR事件的存在。(b)相对于感兴趣基因组的有义方向或反义方向(s或a)定向的ssODN可以与Cas9组合使用,以实现有效的在该靶座位处的HDR介导的编辑。在该修饰(红条)的任一侧面上,推荐40bp、并且优选90bp的最小同源区。(c)使用野生型Cas9和Cas9切口酶(D10A)两者,显示了在EMX1座位中的HDR上的ssODN的作用的实例。每个ssODN含有90bp的同源臂,这些同源臂侧接两个限制性位点的12-bp插入片物。

  图31A-C显示了囊性纤维化δF508突变的修复策略。

  图32A-B(a)显示了在FXN内含子1中的GAA重复扩展的示意图并且(b)显示了所采用的使用该CRISPR/Cas系统切除该GAA扩展区的策略的示意图。

  图33显示了Tet1-3和Dnmt1、3a和3b座位的有效的SpCas9介导的靶向的筛选。通过使用不同的gRNA,在来自转染的N2A细胞的DNA上的Surveyor测定证明了有效的DNA切割。

  图34显示了使用AAV1/2递送系统中的2载体系统进行的多元基因组靶向策略。Tet1-3和Dnmt1、3a和3b gRNA在U6启动子的控制之下。GFP-KASH在人突触蛋白启动子的控制之下。限制性侧面显示了经由亚克隆的简单gRNA置换策略。显示了侧翼为两个核定位信号(NLS)的、HA标记的SpCas9。两种载体都以1:1比率通过AAV1/2病毒递送到脑中。

  图35显示了使用Surveyor测定进行的多元DNMT靶向载体#1的功能性的验证。用DNMT靶向载体#1(+)和SpCas9编码载体共转染N2A细胞,以便检测SpCas9介导的DNMT基因家族座位的切割。阴性对照是仅有gRNA(-)。收获细胞用于DNA纯化,并且在转染后48小时进行下游加工。

  图36显示了使用Surveyor测定进行的多元DNMT靶向载体#2的功能性的验证。用DNMT靶向载体#1(+)和SpCas9编码载体共转染N2A细胞,以便检测SpCas9介导的DNMT基因家族座位的切割。阴性对照是仅有gRNA(-)。收获细胞用于DNA纯化,并且在转染后48小时进行下游加工。

  图37显示了用于体内HA-SpCas9表达的短启动子和短polyA版本的示意性概述。从L-ITR到R-ITR的编码区的大小显示在右边。

  图38显示了用于体内HA-SaCas9表达的短启动子和短polyA版本的示意性概述。从L-ITR到R-ITR的编码区的大小显示在右边。

  图39显示了SpCas9和SaCas9在N2A细胞中的表达。在不同的短启动子的控制之下并且具有短polyA(spA)序列的、HA标记的SpCas9和SaCas9版本的代表性Western印迹。微管蛋白是加载对照。mCherry(mCh)是一种转染对照。收获细胞并进一步加工,以便在转染后48小时进行Western印迹。

  图40显示了有效的SaCas9介导的Tet3基因座位的靶向的筛选。通过使用具有NNGGGT PUM序列的不同的gRNA,在来自转染的N2A细胞的DNA上的Surveyor测定证明了有效的DNA切割。GFP转染的细胞和仅仅表达SaCas9的细胞是对照。

  图41显示了HA-SaCas9在小鼠脑中的表达。用在人突触蛋白启动子控制之下驱动HA-SaCas9表达的病毒注射到动物的齿状脑回中。在手术后2周将动物处死。使用兔单克隆抗体C29F4(细胞信号传导)检测HA标签。用DAPI染料将细胞核染成蓝色。

  图42显示了SpCas9和SaCas9在转导后7天的培养物中的皮层初级神经元中的表达。在不同的启动子的控制之下并且具有bgh或短polyA(spA)序列的、HA标记的SpCas9和SaCas9版本的代表性Western印迹。微管蛋白是加载对照。

  图43显示了在用携带具有不同启动子的SpCas9和多元gRNA构建体(显示在DNMT的最后一个小图上的实例)的AAV1粒子转导之后7天的初级皮层神经元的LIVE/DEAD染色。将AAV转导之后的神经元与未转导的对照神经元进行比较。红色细胞核指示渗透化处理的死细胞(小图的第二条线)。活细胞标记为绿色(小图的第三条线)。

  图44显示了用携带具有不同启动子的SaCas9的AAV1粒子转导之后7天的初级皮层神经元的LIVE/DEAD染色。红色细胞核指示渗透化处理的死细胞(小图的第二条线)。活细胞标记为绿色(小图的第三条线)。

  图45显示了在用携带用于TET和DNMT基因座位的SpCas9和gRNA多元体的AAV1病毒转导之后的神经元的形态学比较。未转导的神经元作为对照示出。

  图46显示了在初级皮层神经元中使用Surveyor测定进行的多元DNMT靶向载体#1的功能性的验证。用DNMT靶向载体#1和具有不同启动子的SpCas9病毒共转导细胞,以便检测SpCas9介导的DNMT基因家族座位的切割。

  图47显示了在脑中SpCas9切割的体内效率。用携带多元靶向DNMT家族基因座位的gRNA的AAV1/2病毒连同在2个不同的启动子(小鼠Mecp2和大鼠Map1b)控制之下的SpCas9病毒注射小鼠。在注射两周之后提取脑组织,并且基于由来自gRNA多元构建体的突触蛋白启动子驱动的GFP表达,使用FACS制备和分选细胞核。在gDNA提取之后,进行Surveyor测定。+指示GFP阳性细胞核,-为对照,来自相同动物的GFP阴性细胞核。在凝胶上的数字指示评估的SpCas9效率。

  图48显示了GFP-KASH标记的、来自海马体神经元的细胞核的纯化。用GFP与KASH蛋白跨膜结构域的融合体标记细胞核膜的外层核膜(ONM)。在立体定向手术和AAV1/2注射之后一周GFP在脑中强表达。进行密度梯度离心步骤纯化来自完整脑的细胞核。显示了纯化的细胞核。通过DyeCycleTMRuby染色的染色质染色显示为红色,GFP标记的细胞核为绿色。GFP+和GFP-细胞核的代表性FACS分布图(红紫色:DyeCycleTMRuby染色,绿色:GFP)。

  图49显示了在小鼠脑中SpCas9切割的效率。用携带多元靶向TET家族基因座位的gRNA的AAV1/2病毒连同在2个不同的启动子(小鼠Mecp2和大鼠Map1b)控制之下的SpCas9病毒注射小鼠。在注射三周之后提取脑组织,基于由来自gRNA多元构建体的突触蛋白启动子驱动的GFP表达,使用FACS制备和分选细胞核。在gDNA提取之后,进行Surveyor测定。+指示GFP阳性细胞核,-为对照,来自相同动物的GFP阴性细胞核。在凝胶上的数字指示评估的SpCas9效率。

  图50显示了在培养物中的皮层神经元中的GFP-KASH表达。用携带靶向TET基因座位的gRNA多元构建体的AAV1病毒转导神经元。由于KASH结构域定位,最强信号位于细胞核周围。

  图51显示了(上)在指导RNA对之间的间隔的清单(如由两个PAM序列的排列模式指示)。当与SpCas9(D10A)切口酶一起使用时,仅有满足模式1、2、3、4的指导RNA对展现出indel。(下)凝胶图像显示,SpCas9(D10A)与满足模式1、2、3、4的指导RNA对的组合导致靶位点中的indel的形成。

  图52显示了用来产生U6-指导RNA表达盒的U6反向引物序列的清单。每个引物需要与U6正向引物“gcactgagggcctatttcccatgattc”配对,以便产生含有U6和所希望的指导RNA的扩增子。

  图53显示了来自人Emx1座位的基因组序列图谱,显示了在图33中列出的24个模式的位置。

  图54显示了(右侧)指示当由不同指导RNA对靶向的Cas9切口酶切割之后存在可变5’突出端时在靶位点处的indel形成的凝胶图像。(左侧)为指示在右侧凝胶上的泳道数目和不同参数的表,这些参数包括鉴定所使用的指导RNA对和在由Cas9切口酶切割之后存在的5’突出端的长度。

  图55显示了来自人Emx1座位的基因组序列图谱,其显示了导致图54(右侧)的凝胶模式并且在实例35中进一步描述的不同的指导RNA对的位置。

  图56显示了代表性Surveyor凝胶,其显示由SaCas9进行的基因组切割。

  图57显示了PAM序列(所有靶标)的基因组切割效率。

  图58显示了PAM序列(切割的靶标)的基因组切割效率。

  图59显示了PAM序列(所有靶标,放弃低效率和孤立靶标)的基因组切割效率。

  图60显示了PAM序列(切割的靶标,放弃低效率和孤立靶标)的基因组切割效率。

  图61显示了操作切割的间隔子&PAM的序列图标(新的内源基因组测试显示T不被需要)。

  图62显示了来自注射了AAV-CMV-EGFP和AAV-CMV-SaCas9-U6-sgRNA(Pcsk9)的动物的肝脏组织切片免疫组织化学染色图像(注射后2周,验证SaCas9蛋白质表达)。

  图63显示了经由尾静脉注射AAV2/8病毒递送的SaCas9对肝脏组织的切割(1周时间点)。

  图64显示了经由尾静脉注射AAV2/8(AAV2/8-SaCas9-U6-sgRNA(Pcsk9))病毒递送的SaCas9对肝脏组织的切割的时间历程测定。

  图65显示了递送靶向人类SERPINA1基因座位的SaCas9和U6-sgRNA盒之后在人类293FT细胞中筛选功能性CRISPR/Cas靶标,随后对靶向人类SERPINA1基因的表达sgRNA的dsDNA的总共24种不同间隔子设计中的12种进行surveyor测定和凝胶分析,DNA梯在左边。

  图66显示了12个样品的凝胶分析,将表达sgRNA的dsDNA的6种间隔子设计中的每者与SaCas9质粒共转染进小鼠肝细胞细胞系中,彼此相邻放置两个复制物。DNA梯在左边。

  图67显示了来自注射有EGFP的TBG版本与CMV版本的小鼠的急性解剖的肝脏组织(注射后6天,GFP通道图像,10X)。

  图68A-B显示了(A)AAV载体的设计,该载体用于包装SaCas9和指导RNA表达系统连同遍存哺乳动物CMV启动子,以便递送进广泛的组织中。(B)AAV载体的设计,该载体用于包装SaCas9和指导RNA表达系统连同肝脏特异性TBG启动子,以便在体内靶向肝细胞。ITR,AAV反向末端重复。hSaCas9,人类密码子优化的SaCas9。NLS,核定位信号。HA,人类流感血球凝集素衍生标签。bGHpA,牛生长激素多聚腺苷酸化信号。U6,人类U6启动子。sgRNA,单一指导RNA。

  图69A-B显示了(A)surveyor测定结果,显示了来自注射有表达靶向小鼠Pcsk9基因的SaCas9的AAV2/8或表达EGFP报告基因的对照AAV2/8病毒的小鼠的肝脏组织的基因组修饰率。所有样品均是在尾静脉注射之后1周取得。(B)总结了从注射有表达靶向小鼠Pcsk9基因的SaCas9的AAV2/8的小鼠收集的所有三个时间点的切割效率的统计。

  图70A-D显示了小Cas9直向同源物的生物化学筛选。(a)Cas9直向同源物的系统发生树,其中指出了亚家族和大小(氨基酸)。保守核酸酶结构域在彩色框中高亮,黑色残基代表保守序列。(b)展示了用于鉴定原型间隔子邻近基序(PAM)的基于体外切割的方法的示意图。(c)根据经切割片段的测序,八种Cas9直向同源物的共有PAM。(d)使用靶向带有假定PAM的不同座位(以红色示出)的直向同源物和sgRNA的生物化学切割反应。红色三角形指示经切割的片段。

  图71A-F显示了金黄色葡萄球菌Cas9的体外表征。(a)显示金黄色葡萄球菌sgRNA的结构的示意图。Indel取决于(b)指导序列的长度或(c)重复:抗重复双链体而变化。(d)HEK 293FT细胞中的SaCas9的共有PAM。显示了所有假定PAM 4-碱基组合(上,n≥3)和整体序列标识(n=116,下)的汇集indel值。e是针对基因组靶位点的SpCas9和SaCas9切割效率比较,并且f是针对基因组广度的脱靶座位的SpCas9和SaCas9切割效率比较(误差条指示威尔逊(Wilson)区间)。具有显著indel的脱靶(OT)序列在图表上方高亮。除非另外注明,n=3,误差条S.E.M;N.D.检测不到。

  图72A-E显示了将金黄色葡萄球菌Cas AAV递送进活体动物中。(a)展示了AAV单一载体统系统(上)和实验时间轴(下)的示意图。(b)小鼠Pcsk9座位,显示了SaCas9靶位置。指导序列以蓝色高亮,其中PAM以红紫色高亮。(c)注射AAV2/8粒子后靶标1和6处的肝脏组织indel形成的时间历程(每次注射多达2个动物;误差条表示肝脏组织块)。(d)注射后1周和3周在靶标6处的Indel形成。每个泳道表示一块肝脏组织。红色三角形指示经切割的片段。(e)代表性色谱图和由SaCas9在体内产生的indel。

  图73显示了来自II型CRISPR-Cas系统的两个亚家族的六种直向同源物的CRISPR-Cas座位的示意图。间隔子或“指导”序列以蓝色显示,后面是同向重复(灰色)。预测的tracrRNA以红色显示,并且基于约束生成(Constraint Generation)RNA折叠模型折叠。

  图74显示了堆叠条形图,指示针对每种Cas9直向同源物在PAM的上游2、3、4或5-bp处切割的靶标的分数;所有Cas9最常见地在PAM的上游3-bp处切割(红色三角形)。

  图75A-B显示了:(a)SURVEYOR测定,显示了在HEK 293FT细胞中来自Cas9直向同源物和sgRNA的共转染的人类内源座位处的indel形成。(b)SaCas9以高效率切割多种靶标。各个靶标的PAM序列在每个泳道的上方显示,其中每个Cas9的共有序列以红色高亮。红色三角形指示经切割的片段。

  图76A-B显示了:(a)人类基因组(GRCh38)中的邻近金黄色葡萄球菌金黄色亚种II型CRISPR PAM(NNGRR)之间的距离的直方图。(b)对于每个PAM就染色体而言的距离。

  图77A-B显示了SaCas9靶标和PAM在小鼠Pcsk9基因座位内的位置。b,在靶位点处由小鼠肝脏肝癌(Hepa1-6)细胞系的转染产生的Indel。红色箭头指示切割位点。

  图78A显示指导物(靶标)1诱导ApoB中最高百分比的indel。

  图78B显示了在注射后4周针对indel形成效率的Surveyor核酸酶凝胶测定的结果。

  图79B显示在AAV-Cas9-sgRNA递送之后用以检测体内肝脂质积累表型的油红染色。在每个方形中的比例尺代表20微米。

  图80显示跨一定范围的靶标并且在两个不同基因(AAVS1和EMX1)内,由灰色条表示的21个核苷酸nt/碱基对(bp)至少相比于20或22个碱基对(分别由黑色和白色条代表)是最佳间隔子长度。

  图81显示指导序列是否可被插入到Cas9内含子序列中

  图82显示该全长H1启动子(灰色条)仍弱于U6启动子(黑色条),因为U6显示出对于每个测试的靶标而言增加的indel百分比形成。

  图83显示,短H1启动子弱于全长H1

  图84显示在构建体中两个指导序列的5’端之间的距离,这是相关于D10A SaCAs9双切口酶的切割效率测量得到的。

  图85(实例40)显示了在小鼠脑中CRISPR-Cas9系统递送和Mecp2座位的靶向。(a)AAV-SpCas9和AAV-SpGuide(Mecp2)表达载体。sgRNA载体包含GFP-KASH融合蛋白的编码序列,以用于鉴定转导的神经元。(b)在小鼠海马体的背侧齿状脑回(DG)中HA-Cas9和GFP-KASH的表达。比例尺,100μm。(c)由双载体Cas9-CRISPR系统高效靶向的细胞的定量。(d)示出Cas9靶位置的小鼠Mecp2座位的图形表示;sgRNA以蓝色指示。PAM序列以紫色标记。通过对Mecp2座位的测序而检测的代表性突变模式显示如下:绿色-野生型序列;红色虚线-缺失的碱基;红色碱基:插入或突变;红色箭头指示CRISPR-Cas9切割位点。(e)SURVEYORTM测定凝胶显示在DG区中AAV递送后2周Mecp2座位的修饰。(f)在靶向的脑区中MeCP2蛋白质表达的Western印迹分析以及在背侧DG中MeCP2蛋白水平的定量(t-检验,**p<0.001,n=4,来自3个动物,误差条:s.e.m.)。(g)在CRISPR-Cas9靶向于Mecp2座位后2周背侧DG区的图像。比例尺,150μm。(h)在靶向的脑区中在所有检测的细胞内(DAPI染色)MeCP2阳性细胞群体相比于对照并行位点的定量(t-检验,****p<0.0001,n=290和249个细胞,分别来自2个动物;误差条:s.e.m)。(ITR-反向末端重复;HA-血凝素标签;NLS-核定位信号;spA-合成的多聚腺苷酸化信号;U6-PolIII启动子;sgRNA-单一指导RNA;hSyn-人类突触蛋白1启动子;GFP-绿色荧光蛋白;KASH-Klarsicht,ANC1,Syne同源核跨膜结构域;bGH pA-牛生长激素多聚腺苷酸化信号;WPRE-土拨鼠肝炎病毒转录后调节元件)。

  图86(实例40)显示在Cas9-介导的MeCP2敲低神经元中基因表达的分析。(a)来自小鼠脑的CRISPR-Cas9靶向的细胞的细胞核纯化的策略。(b)差异性表达基因的分层聚簇(t-检验,p<0.01,n=分类的核的19个群体,来自8个动物),通过RNAseq检测。针对每一行将基因的相对log2(TPM+1)表达水平归一化,并且以红-蓝色标度展现。每列表示从分离的齿状脑回细胞群体经FACS分选的被靶向的100个神经元核的群体,来自对照或来自Mecp2sgRNA转导的动物,如指示的。

  图87(实例40)显示在CRISPR-介导的MeCP2敲低后神经元的细胞响应特性方面的细胞自主缺陷。(a)卡通显示来自小鼠视觉皮质的体内实验配置和视觉刺激参数。示出GFP+神经元。比例尺,20μm。(b)卡通显示记录在层2/3兴奋性神经元中的配置,这些神经元接受对侧和同侧眼睛特异性输入两者。基因组修饰的GFP+细胞是绿色而未修饰的细胞是灰色。归一化的尖峰形状显示规则的形成尖峰的兴奋性神经元。(c,d)平均OSI(c)和诱发FR(d)是从分别表达Mecp2和对照sgRNA的GFP+细胞测量(t-检验,*p<0.05;图中的数目指示记录的细胞的数目;n=2-3个动物;误差条:s.e.m)。

  图88(实例40)显示了在小鼠脑中同步的多元基因编辑。(a)被设计用于多元基因组靶向的CRISPR-Cas9系统的示意图。(b)靶向的DNMT小鼠座位的图形表示。指导RNA以蓝色指示。PAM序列被标记为紫色。(c)SURVEYORTM测定凝胶显示在DG区中AAV递送后4周在FACS分选的GFP-KASH阳性细胞中DNMT座位的修饰。(d)在单一细胞中DNMT座位修饰的基于深度测序的分析,显示在多个座位中修饰的共同发生。(e)在体内递送靶向DNMT家族基因的CRISPR-Cas9系统之后,Dnmt3a和Dnmt1蛋白的Western印迹分析(顶部)。在体内CRISPR-Cas9后靶向之后,在DG中Dnmt3a和Dnmt1蛋白水平的Western印迹定量(底部;t-检验,**p<0.001,*p<0.05,Dnmt3a:n=7;Dnmt1:n=5,来自5个动物;误差条:s.e.m)。(f)在海马体的DG区中使用SpCas9靶向DNMT基因后8周的情境性学习缺陷,在训练和改变的情境中测试(t-检验,***p<0.0001,n=18个动物,2个独立的实验;误差条:s.e.m)。

  图89(实例40)显示了供AAV包装的HA-标记的SpCas9的克隆和表达(HA-SpCas9)。(a)最小化SpCas9表达盒大小的不同克隆策略的示意性概述,使用了短大鼠Map1b启动子(pMap1b)、小鼠Mecp2启动子(pMecp2)的截短形式以及短polyA基序(spA)。(b)使用不同SpCas9表达盒表达HA-SpCas9的初级皮层神经元培养物的Western印迹分析。(c)Mecp2启动子驱动HA-SpCas9(红色)在神经元中的表达(Map1b,NeuN;箭头)但不是在星形神经胶质(GFAP,箭头)中。示出HA-SpCas9和GFP-KASH的共表达(底部)。细胞核用DAPI标记(蓝色)。比例尺,20μm。(d)GFP-标记的示意性概述。展示了与核跨膜KASH结构域融合的增强的绿色荧光蛋白(GFP)以及GFP-KASH整合到外核膜。(e)协同感染效率计算,示出表达HA-SpCas9和GFP-KASH两者的细胞群体(n=973个神经元,来自3个培养物;误差条:s.e.m)。(f)在病毒递送后7天,将细胞用试剂盒染色。DAPI+和死(DEAD+)细胞的定量(对照n=518个DAPI+核;SpCas9/GFP-KASH n=1003个DAPI+核,来自2个培养物;误差条:s.e.m)。(ITR-反向末端重复;HA-血凝素标签;NLS-核定位信号;spA-合成的多聚腺苷酸化信号;U6-PolIII启动子;sgRNA-单一指导RNA;hSyn-人类突触蛋白1启动子;GFP-绿色荧光蛋白;KASH-Klarsicht,ANC1,Syne同源核跨膜结构域;bGH pA-牛生长激素多聚腺苷酸化信号;WPRE-土拨鼠肝炎病毒转录后调节元件)。

  图90(实例40)显示了在Neuro-2a细胞中Mecp2的靶向。(a)Mecp2靶向序列和相应的原型间隔子邻近基序(PAM)。(b)6个用SpCas9共转染进Neuro-2a细胞中的Mecp2sgRNA的评价。使用SURVEYORTM测定的转染后48h对座位修饰效率进行分析。

  图91(实例40)显示了CRISPR-SpCas9靶向初级皮层神经元中的Mecp2。(a)在AAV-CRISPR转导(绿色,GFP-KASH)后7天,在培养的神经元中MeCP2的免疫荧光染色(红色)。细胞核用DAPI标记(蓝色)。比例尺,20μm。(b)使用SURVEYORTM测定凝胶,使用SpCas9或dSpCas9连同Mecp2sgRNA或对照(靶向细菌lacZ基因)sgRNA时Mecp2座位靶向的评价。(c)在神经元的靶向群体中MeCP2阳性核的定量(GFP+)。(d)在CRISPR-SpCas9靶向Mecp2座位之后MeCP2蛋白水平的Western印迹以及MeCP2蛋白水平的定量(t-检验,**p<0.001,n=5,来自3个培养物,误差条:s.e.m)。

  图92(实例40)显示了在体外在SpCas9-介导的MeCP2敲低之后,神经元树突树的形态学变化。(a)在CRISPR-SpCas9靶向Mecp2座位之后,在神经元中树突树的降低的复杂度。比例尺,20μm。(b)在被SpCas9和Mecp2sgRNA靶向的神经元中树突棘形态学中的变化。比例尺,10μm。细胞的形态学是采用mCherry构建体共转染可视化。基于Mecp2染色的结果来选择用于形态学分析的细胞。(c)用树突末端的数目评定的树突树形态,以及(d)肖尔(Sholl)分析(t-检验,***p<0.0001,n=40,来自2个培养物)。(e)树突棘密度定量(t-检验,***p<0.0001,n=40,来自2个培养物,误差条:s.e.m)。

  图93(实例40)显示了来自对照动物和SpCas9-介导的Mecp2敲低的神经元核的RNAseq。盒形图,呈现跨RNA-seq文库的检测基因的数目(19个文库,各自100个核取自对照sgRNA或Mecp2sgRNA转导的核;n=4个动物/组)/表达水平分位数。所有基因通过它们的平均log2(TPM+1)表达水平被划分为10个分位数,然后在每个样品针对每个分位数检测到的基因的数目(log2(TPM+1)>2)计数。示出的三个靶序列是分别针对Dnmt3a、Dnmt1和Dnmt3b的SEQ ID NO:___、SEQ ID NO:___和SEQ ID NO:___。

  图94(实例40)显示了在体外DNMT家族成员的多元基因组靶向。(a)Dnmt3a、Dnmt1和Dnmt3b靶向序列和相应的原型间隔子邻近基序(PAM)。(b)在用靶向于Dnmt3a、Dnmt1和Dnmt3b座位的SpCas9和DNMT 3xsgRNA载体转染之后48小时,Neuro-2a细胞的SURVEYORTM核酸酶测定分析。示出所有三个靶基因的高效基因组编辑。

  图95(实例40)显示了靶向的Dnmt3a、Dnmt1和Dnmt3b座位的下一代测序。在体内递送SpCas9和DNMT 3xsgRNA进入小鼠齿状脑回之后,突变的Dnmt3a(a)、Dnmt1(b)和Dnmt3b(c)座位的测序结果的实例。绿色:野生型序列,红色虚线:缺失的碱基,红色碱基:插入或突变。红箭头指示CRISPR-SpCas9切割位点。在此图中所使用的完整序列提供为分别针对Dnmt3a、Dnmt1和Dnmt3b座位的SEQ ID NO:、SEQ ID NO:、和SEQ ID NO:。它们是:

  SEQ ID NO:(Dnmt3a):

  CCT CCG TGT CAG CGA CCC ATG CCA A

  SEQ ID NO:(Dnmt1):

  CCA GCG TCG AAC AGC TCC AGC CCG

  SEQ ID NO:(Dnmt3b)

  AGA GGG TGC CAG CGG GTA TAT GAG G

  图96显示了SaCas9蛋白序列经密码子优化(“reopt”),并且它们的泛素化信号被去除(“reopt(Ub)”)以用于增强的表达。针对FLAG-和HA-标记的SaCas9的蛋白印迹显示优化的SaCas9(reopt,#2-4)相对于最初的构建体(#0、5、和6)而言约2-倍增加的表达,以及与SpCas9相似的水平(SpCas9330,顶部条左图;SpCas9414,顶部条右图)。添加3xHA标记(右图#6)以超过1xHA标签(右图#5)约2倍改进了检测信号。

  图97显示了使用通过U6启动子原样转录的sgRNA的indel效率(灰色、左侧条,针对nt的每个数目),或将“G”(蓝色、右侧条,针对nt的每个数目,且具有更厚的边界)附加至针对SaCas9的sgRNA的5’-最末端位置的indel效率。总sgRNA间隔子长度(包括G)指示在x轴上。图表用来自5个sgRNA的聚合数据表示。

  图98显示了sgRNA间隔子长度的优化(x轴)。图表示出在HEK(左)和Hepa(右)中具有不同长度的sgRNA间隔子的indel形成。

  本文的这些图仅仅是出于说明性的目的,并且不一定是按比例绘制的。

  本发明的详细说明

  关于对CRISPR-Cas系统的一般信息:参考分别提交于2013年1月30日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日和2013年5月28日的美国临时专利申请61/758,468;61/802,174;61/806,375;61/814,263;61/819,803和61/828,130。还参考提交于2013年6月17日的美国临时专利申请61/836,123。还参考分别提交于2012年12月12日和2013年1月2日的美国临时专利申请61/736,527和61/748,427。还参考提交于2013年3月15日的美国临时专利申请61/791,409。还参考提交于2013年3月15日的美国临时专利申请61/799,800。还参考各自提交于2013年6月17日的美国临时专利申请61/835,931、61/835,936、61/836,127、61/836,101、61/836,080和61/835,973。进一步参考提交于2013年8月5日的美国临时专利申请61/862,468和61/862,355;提交于2013年8月28日的61/871,301;提交于2013年9月25日的61/960,777和提交于2013年10月28日的61/961,980。进一步参考提交于2013年12月12日的美国临时专利申请61/915,325。这些申请的每一个、以及在其中或在它们的审查程序期间引用的所有文件(“申请引用文件”)以及在这些申请引用文献中引用或参考的所有文件,连同其中提到的或在其中任何文件中提到并通过引用结合在其中的针对任何产品的任何说明书、说明、产品规格、和产品表,特此通过引用结合在此,并且可以在本发明的实践中采用。所有文件(例如,这些申请和申请引用文件)在如同每个单独文件被确切地且单独地指明为通过引用结合的相同程度上通过引用结合在此。

  另外关于CRISPR-Cas系统的一般信息,提及的是:

  使用CRISPR/Cas系统进行的多元基因组工程化(Multiplex genome engineering using CRISPR/Cas systems).丛(Cong),L.、兰(Ran),F.A.、科克斯(Cox)D.、林(Lin),S.、巴雷德(Barretto),R.、哈比卜(Habib),N.、徐(Hsu),P.D.、武(Wu),X.、江(Jiang),W.、马拉菲尼(Marraffini),L.A.,&张(Zhang),F.《科学》(Science)2月15日;339(6121):819-23(2013);

  使用CRISPR-Cas系统对细菌基因组进行RNA-指导的编辑(RNA-guided editing of bacterial genomes using CRISPR-Cas systems).江(Jiang)W.、比卡德(Bikard)D.、科克斯(Cox)D.、张(Zhang)F、马拉菲尼(Marraffini)LA.《自然生物技术》(Nat Biotechnol Mar);31(3):233-9(2013);

  通过CRISPR/Cas-介导的基因组工程化在多基因中携带突变的小鼠的一步产生(One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering).王(Wang)H.、杨(Yang)H.、奇瓦里拉(Shivalila)CS.、多拉蒂(Dawlaty)MM.、程(Cheng)AW.、张(Zhang)F.、耶尼施(Jaenisch)R.《细胞》(Cell)五月9日;153(4):910-8(2013);

  哺乳动物内源转录和外遗传状态的光控制(Optical control of mammalian endogenous transcription and epigenetic states).科纳曼(Konermann)S、布里格姆(Brigham)MD、特里维诺(Trevino)AE、徐(Hsu)PD、海登里希(Heidenreich)M、丛(Cong)L、普莱特(Platt)RJ、斯科特(Scott)DA、丘奇(Church)GM、张(Zhang)F.《自然》(Nature).2013年8月22日;500(7463):472-6.doi:10.1038/Nature12466.电子版2013年8月23日;

  通过RNA指导的CRISPR Cas9进行的双切以用于增强的基因组编辑特异性(Double Nicking by RNA-Guided CRISPR Cas9for Enhanced Genome Editing Specificity).兰(Ran),FA.、徐(Hsu),PD.、林(Lin),CY.、古滕伯格(Gootenberg),JS.、科纳曼(Konermann),S.、特里维诺(Trevino),AE.、斯科特(Scott),DA.、井上(Inoue),A.、马托巴(Matoba),S.、张(Zhang),Y.,&张(Zhang),F.《细胞》(Cell)8月28日.pii:S0092-8674(13)01015-5.(2013);

  RNA指导的Cas9核酸酶的DNA靶向特异性(DNA targeting specificity of RNA-guided Cas9nucleases).徐(Hsu),P.、斯科特(Scott),D.、温斯坦(Weinstein),J.、兰(Ran),FA.、科纳曼(Konermann),S.、阿格瓦拉(Agarwala),V.、李(Li),Y.、法恩(Fine),E.、吴(Wu),X.、沙勒姆(Shalem),O.、克拉迪克(Cradick),TJ.、马拉菲尼(Marraffini),LA.、包(Bao),G.,&张(Zhang),F.《自然生物技术》(Nat Biotechnol)doi:10.1038/nbt.2647(2013);

  使用CRISPR-Cas9系统进行的基因组工程化(Genome engineering using the CRISPR-Cas9system).兰(Ran),FA.、徐(Hsu),PD.、赖特(Wright),J.、阿格瓦拉(Agarwala),V.、斯科特(Scott),DA.、张(Zhang),F.《自然工具》(Nature Protocols)十一月;8(11):2281-308.(2013);

  在人类细胞中基因组规模CRISPR-Cas9敲除筛选(Genome-Scale CRISPR-Cas9Knockout Screening in Human Cells).沙勒姆(Shalem),O.、桑耶纳(Sanjana),NE.、哈尔特宁(Hartenian),E.、史(Shi),X.、斯科特(Scott),DA.、迈克尔森(Mikkelson),T.、赫克尔(Heckl),D.、埃伯特(Ebert),BL.、罗特(Root),DE.、登奇(Doench),JG.、张(Zhang),F.《科学》(Science)12月12.(2013).[电子版先于印刷版];

  在与指导RNA和靶DNA复合物中的cas9的晶体结构(Crystal structure of cas9in complex with guide RNA and target DNA).尼氏玛素(Nishimasu),H.、兰(Ran),FA.、徐(Hsu),PD.、科纳曼(Konermann),S.、舍哈塔(Shehata),SI.、多米耶(Dohmae),N.、石谷(Ishitani),R.、张(Zhang),F.、努尔基(Nureki),O.《细胞》(Cell)2月27.(2014).156(5):935-49;

  在哺乳动物细胞中CRISPR内切核酸酶Cas9的基因组宽结合(Genome-wide binding of the CRISPR endonuclease Cas9in mammalian cells).吴(Wu)X.、斯科特(Scott)DA.、凯里兹(Kriz)AJ.、邱(Chiu)AC.、徐(Hsu)PD.、达东(Dadon)DB.、程(Cheng)AW.、特里维诺(Trevino)AE.、科纳曼(Konermann)S.、陈(Chen)S.、耶尼施(Jaenisch)R.、张(Zhang)F.、夏普(Sharp)PA.《自然生物技术》(Nat Biotechnol.)(2014)4月20日.doi:10.1038/nbt.2889,以及

  用于基因组工程化的CRISPR-Cas9的开发与应用(Development and Applications of CRISPR-Cas9for Genome Engineering),徐(Hsu)等人,《细胞》(Cell)157,1262-1278(2014年6月5日)(徐2014),

  将这些文献的每一个通过引用结合在此,并且简要讨论如下:

  ■丛(Cong)等人基于嗜热链球菌Cas9以及还有化脓链球菌Cas9两者改造了II型CRISPR/Cas系统以用于在真核细胞中使用,并且证实了Cas9分子可以通过短RNA指导以诱导在人类和小鼠细胞中DNA的精确切割。他们的研究进一步显示Cas9在转化成一种切口酶时可以用来以最低诱变活性促进在真核细胞中的同源定向修复。另外,他们的研究证实多个指导序列可以被编码进单一CRISPR阵列中以使得能够在哺乳动物基因组内的内源性基因组座位位点处同时编辑若干,证实了RNA指导的核酸酶技术的容易可编程性和广泛可应用性。这种使用RNA以编程细胞内序列特异性DNA切割的能力定义了新一类的基因组编辑工具。这些研究进一步显示,其他CRISPR座位可能是可移植入哺乳动物细胞中的,并且还可以介导哺乳动物基因组切割。重要地,可以设想的是CRISPR/Cas系统的若干方面可以进一步改进以增加其效率和多功能性。

  ■江(Jiang)等人使用规律间隔成簇短回文重复(CRISPR)-关联的Cas9内切核酸酶,与双-RNA复合,以在肺炎链球菌和大肠杆菌的基因组中引入精确的突变。该途径依赖于在靶基因组位点处的双-RNA:Cas9-引导的切割,以杀死未突变的细胞,并且回避对选择性标记或反选择系统的需要。该研究报道通过改变短CRISPR RNA(crRNA)的序列以使单一-和多个多核苷酸变化被携带在编辑模板上而重编程双-RNA:Cas9特异性。该研究显示,同时使用两种crRNA使得多元诱变成为可能。另外,当该途径与重组工程组合使用时,在肺炎链球菌中使用描述的途径回收的接近100%的细胞包含希望的突变,并且在大肠杆菌中回收的65%包含突变。

  ■科纳曼(Konermann)等人解决了在本领域中对通用和稳固技术的需要,其使得能够基于CRISPR Cas9酶以及还有转录激活因子样效应子对DNA-结合结构域进行光调节和化学调节。

  ■如在本说明书中讨论的,来自微生物CRISPR-Cas系统的Cas9核酸酶通过20nt指导序列而靶向特异性基因组座位,其可以耐受与该DNA靶标的某些错配并由此促进不希望的脱靶诱变。为了解决此问题,兰(Ran)等人描述了将Cas9切口酶突变体与配对的指导RNA相组合以引入靶向的双链断裂的途径。因为基因组中的单独切口以高保真性被修复,所以同时经由适当补偿指导RNA而形成切口对于双链断裂是必需的,并且所述切口形成延伸了特异性识别的碱基的数目以用于靶标切割。作者证实了使用配对的切口形成可以降低在细胞系中的脱靶活性50至1,500倍,并且从而促进在小鼠受精卵中的基因敲除而不牺牲中靶切割效率。这个通用策略使得多种多样的要求高特异性的基因组编辑应用成为可能。

  ■徐(Hsu)等人表征了在人类细胞中SpCas9靶向特异性以告知靶位点的选择并避免脱靶效应。该研究评价了在293T和293FT细胞中的>100个预测的基因组脱靶座位处>700个指导RNA变体和SpCas9-诱导的indel突变水平。这些作者示出SpCas9以序列依赖性方式耐受指导RNA与靶DNA之间在不同位置处的错配,对错配的数目、位置和分布敏感。这些作者进一步示出SpCas9-介导的切割不受DNA甲基化的影响,并且SpCas9和sgRNA的剂量可被滴定为使得脱靶修饰最小化。另外,为了促进哺乳动物基因组工程应用,这些作者报道提供基于网络的软件工具以指导靶序列的选择和验证连同脱靶分析。

  ■兰(Ran)等人描述了用于在哺乳动物细胞中Cas9-介导的经由非同源末端连接(NHEJ)或同源定向修复(HDR)基因组编辑、连同产生修饰的细胞系(以用于下游功能研究)的一组工具。为了最小化脱靶切割,这些作者进一步描述了一种双-切口策略,使用的是Cas9切口酶突变体与配对的指导RNA。由这些作者提供的方案经实验得出用于选择靶位点、评价切割效率和分析脱靶活性的指南。这些研究显示,以靶设计开始,基因修饰可以在少至1-2周内实现,并且修饰的克隆细胞系可以在2-3周内得以衍生。

  ■沙勒姆(Shalem)等人描述了新的在基因组广度范围上探询基因功能的方式。他们的研究显示,递送基因组范围的CRISPR-Cas9敲除(GeCKO)文库利用64,751个独特的指导序列靶向18,080个基因,这些指导序列使得在人类细胞中阴性和阳性选择筛选两者成为可能。首先,这些作者显示,使用该GeCKO文库来鉴定癌症和多能干细胞中对于细胞活力至关重要的基因。接着,在黑色素瘤模型中,这些作者针对基因进行筛选,这些基因的损失涉及对维罗非尼(一种抑制突变体蛋白激酶BRAF的治疗剂)的抗性。他们的研究显示,最高级候选物包括先前验证的基因NF1和MED12连同新颖的命中物NF2、CUL3、TADA2B、和TADA1。这些作者观察到在靶向相同基因的独立指导RNA之间的高水平的一致性以及高比率的命中确认,并且因此证实了采用Cas9进行基因组范围筛选的前景。

  ■尼氏玛素(Nishimasu)等人以2.5A°分辨率报道了与sgRNA复合的化脓链球菌Cas9以及其靶DNA的晶体结构。该结构揭示了一种由靶识别和核酸酶叶片组成的两叶片构造,其将sgRNA:DNA异源双链体容纳在它们的界面处的带正电的凹槽中。然而识别叶片对于结合sgRNA和DNA是至关重要的,核酸酶叶片包含HNH和RuvC核酸酶结构域,这些结构域适合地被定位为分别用于靶DNA的互补和非互补链的切割。核酸酶叶片还包含负责与原型间隔子邻近基序(PAM)相互作用的羧基-末端结构域。这种高分辨率结构和伴随的功能分析已经揭示了RNA-指导的由Cas9进行的DNA靶向的分子机制,由此为合理设计新的通用基因组编辑技术做好准备。

  ■吴(Wu)等人标定了在小鼠胚胎干细胞(mESC)中,来自化脓链球菌的无催化活性Cas9(dCas9)(加载有单一指导RNA(sgRNA))的基因组广度的结合位点。这些作者显示,测试的四种sgRNA中的每一种将dCas9靶向至数十和数千个之间的基因组位点,这些基因组位点频繁地通过sgRNA中的5-核苷酸种子区和NGG原型间隔子邻近基序(PAM)表征。染色质不可接近性降低了dCas9与具有匹配种子序列的其他位点的结合;因此70%的脱靶位点是与基因相关联的。这些作者显示,在用催化活性的Cas9转染的mESC中295dCas9结合位点的靶向测序鉴定出超过背景水平的仅一个突变位点。这些作者提出了一种针对Cas9结合和切割的两态模型,其中种子匹配触发了结合但是需要与靶DNA的广泛配对用于切割。

  ■徐(Hsu)2014是一篇综述文章,它大体讨论了CRISPR-Cas9的从酸奶到基因组编辑的历史,包括细胞的基因筛选,其在2014年6月5日之前提交的本说明书的谱系中的申请的信息、数据和发现中。徐2014的总体传授不涉及本说明书的特定模型、动物。

  本发明涉及用于控制涉及序列靶向的基因表达的系统、方法、和组合物的工程化和优化,该序列靶向例如涉及CRISPR-Cas系统及其组分的基因组干扰或基因编辑。在有利的实施例中,该Cas酶是Cas9。

  CRISPRS-Cas多核苷酸序列通常在此称为指导物,或甚至称为指导RNA(sgRNA),但是将了解的是此术语不是如先前司空见惯的。此外,在本文中提及CRISPR-Cas9系统,但是应当理解的是,本发明可以广泛地关于任何CRISPR-Cas系统实践。有利地,该Cas具有诱导DSB、切口或双切口的核酸酶功能。Cas9是优选的并且SaCas9是特别优选的。

  实例38显示基因型和关键地表型的变化两者均发现于CRISPR-Cas系统。不仅如此,而且CRISPR-Cas9系统在诱导体内表型改变时也是有效的。

  特别而言,靶标是ApoB,即一种脂类代谢基因。令人鼓舞的是,ApoB可以称为是在肝脏递送中的“金标准”,并且广泛用于小鼠肥胖症模型中。

  递送是经由静脉内注射。使用AAV载体,连同用于Cas9的肝脏-特异性启动子(TBG)。

  如在此所见,相比于安德森/殷(Anderson/Yin’s)(NBT 2884)使用的流体动力学递送作为递送方法,通过从病毒载体表达进行的递送是个改进,因为流体动力学递送需要注射若干毫升流体,对于鼠体是有压力的并且可以是致命的。流体动力学递送最适合于递送质粒(裸)DNA,而我们已经显示,将指导序列和Cas9序列包装在病毒递送载体之内在大大增加效率方面是优选的。实际上,仅需要引入相对小的体积,并且这可以通过静脉内(i.v.)进行,这可能是在治疗学上更加可接受的。

  特别令人鼓舞的不仅是在肝脏“金标准”基因(如ApoB)中见到的基因型改变,而还记录了表型改变。以前用PCSK9的工作已经不仅显示出基因型改变,还有表型改变,因此用ApoB见到的表型改变验证了CRISPR递送至肝脏的合理性以及其在肝脏中实现表型改变的能力。这与治疗学上更加可接受的递送手段(i.v.,相比于流体动力学递送)相组合。这样,病毒递送CRISPR-Cas9系统(指导物和Cas9)是优选的,尤其是通过静脉内。

  潜在靶标包括:PCSK9、HMGCR、APOB、LDLR、ANGPTL3、F8、F9/FIX、AAT、FAH、HPD、TAT、ATP7B、UGT1A1、OTC、ARH。

  因此,提供了在体内诱导表型改变的方法,该方法包括将CRISPR-Cas9系统给予至靶细胞,例如肝脏。在此描述了合适的递送途径,但在一些实施例中i.v.注射是优选的。病毒载体是优选的,特别是AAV,特别是AAV血清型2/8。

  还提供了CRISPR-Cas9系统,该系统包括一种或多种靶向脂类代谢基因(例如ApoB)的指导物。还设想了治疗肥胖症的方法,该方法包括给予所述CRISPR-Cas9系统。包括一种或多种肝脏基因(尤其是一种或多种例如包括ApoB的脂类代谢基因)敲低的小鼠模型是优选的。

  用于Cas9的肝脏特异性启动子将是清楚的,但可以包括上面列出的那些。优选的实例是TBG。

  如在实例39中所示,该指导物可以是18-23个核苷酸长。它可以是18-22、或19-22、或18-21、20-22个,但优选是22个,并且最优选21个核苷酸长。

  还提供了成功地将指导序列包装到SaCas9内含子中的原理论证。因此,其中将一种或多种指导序列包装到(定位或插入)Cas9内含子中的CRISPR-Cas9系统是优选的。

  在一些情况下可以使用H1启动子并且该启动子可以是优选的。

  扩延了由兰(Ran)(细胞,154,2013年8月21日)进行的工作,对在使用了D10A双切口酶的双指导途径中的重叠程度进行了研究。最佳的结果显示在-5和+1bp(5’到5’)之间。因此,更优选使用双指导途径以最小化脱靶效应。这些优选地发生重叠,或接近于重叠,在它们的5’端,在基因组靶标处的DNA的不同链上。优选地,该重叠是在-5到+1bp的范围内。在这些情况下,应当理解的是,该Cas9是双切口酶,例如优选的D10A变体。

  实例40尤其提供了:第一次证实了在有丝分裂后神经元中体内成功的AAV-介导的Cas9递送连同高效的基因组修饰;开发使得能够容易从表达Cas9和sgRNA的细胞分离神经元核的核标记技术;证实了针对神经元转录组的RNAseq分析的应用;如何可以将电生理学研究和其他技术与Cas9-介导的基因组干扰整合以确定表型变化;如何可以将电生理学研究和其他技术与Cas9-介导的基因组干扰整合以确定表型变化;如何可以将电生理学研究和其他技术与Cas9-介导的基因组干扰整合以确定表型变化;并且证实了多元靶向以及使用Cas9-介导的基因组编辑研究关于啮齿动物行为的基因功能的能力。

  本发明提供了:对基因功能的理解和测试,包括模型的创建和测试;包括关于基因疗法并且因此基因疗法、基因疗法方法及其用于基因疗法的用途根据本披露在技术人员的范围之内。

  以下进一步讨论的另外一方面是关于用于核标记的方法。

  将理解的是,在此提及的CRISPR-Cas9系统是用于指代与指导物或用于靶向一种或多种基因组序列的指导物相组合的在此提供的Cas9酶的简略语。(并且本发明也可以被广泛地关于CRISPR-Cas系统考虑。)对一种或多种指导物的提及包括sgRNA、连同在此描述的嵌合多核苷酸序列,该嵌合多核苷酸序列包括能够杂交至受试者基因组中的靶序列的指导序列、tracr配对序列和tracr序列。

  这些数据基本上显示由基因敲低导致的表型改变,该基因敲低是通过在这种情况下使用两种单独的根据本发明的CRISPR-Cas9系统(指导RNA与Cas9酶相组合)以成功地扰动基因功能。选择的组织是脑组织,而结果提供了对于广泛的有丝分裂后组织的原理论证。这是重要的区别,因为以前的工作已经聚焦于分裂细胞(即有丝分裂前)。

  换言之,鉴于SpCas9已经广泛用于工程化分裂细胞,我们证实了SpCas9还可以用来工程化有丝分裂后神经元的基因组。这是经由NHEJ介导的indel产生以产生敲低而以高效率进行的,但是还设想了涉及经由HDR机制(在提供修复模板时)校正的治疗用途。这两者均取决于Cas9和一种或多种RNA指导物的成功递送和功能表达,其在此所示。

  CRISPR-Cas9系统诱导的基因型改变然后导致表型改变的事实对于以上两个方面(基因功能和基因治疗)来说是重要。

  第一CRISPR-Cas9系统采用针对(靶向)Mecp2的指导序列。成功地采用双载体CRISPR-Cas9系统,其中一种载体包含指导物并且一种载体包含Cas9,显示对于此类双载体系统的进一步的原理论证。将双载体CRISPR-Cas9系统成功地经由立体定向注射递送至脑中两个独立的位置,确切地为海马体齿状脑回和视觉皮质。在两种情况下,见到了相同基因Mecp2的基因干扰,指示双载体系统被成功地递送,并且如期望的通过Cas9酶(在该情况下为SpCas9)中的转录和功能活性以及经指导序列将Cas9成功募集到基因组靶序列上而进行作用。

  AAV-介导的体内递送SpCas9和sgRNA提供了用于实现在完整神经回路内的精确基因组干扰的快速且有力的技术。这样,使用的载体是AAV载体,为它们尤其在有丝分裂后细胞和组织并且特别是在脑中在一般使用和双载体CRISPR-Cas9系统中的使用添加了另外的证据。

  当然应理解的是,启动子的选择在实现从CRISPR-Cas9系统(特别是Cas9或一种或多种指导物和Cas9两者)的表达中是重要的。用于细胞和细胞生命周期阶段特异性的适合实例可以从文献中确定。尽管如此,我们提供了一些非限制性实例:TBG,肝脏-特异性启动子,并且在此用于驱动SaCas9的表达;H1启动子;截短的H1启动子;U6启动子。而且,因为指导物不一定需要特异性启动子,一种或多种指导物可以类似地包装到一个/该Cas9内含子中。

  使用的第二CRISPR-Cas9系统包括多元途径。SpCas9系统的一个关键优点是它能够促进多元基因组编辑。该第二系统通过包含适合的指导物而成功地靶向来自相同家族的三种或更多种基因(在此情况下为Dmnt1、3a和3b),并且导致多基因的稳定敲除。这具有用于探查活体动物组织中不仅单独的基因、还有整个基因家族的功能的广泛意义。在以前这还未变为可能或这仅可以通过长年经典遗传学来实现的情况下,这对于组织(例如脑)是特别重要的。申请人已经显示单一或多个基因干扰(甚至完全敲低)可以发生在正常动物的有丝分裂后细胞中。然而,这可以同样应用于模式生物(例如一种已经携带基因突变或干扰或者包括某类改变的表达的模式生物)或转基因生物,给现有的产生模式生物和使用模式生物理解基因功能的方法提供了快速的替代方案。可以采用另外的指导物(和/或完整的CRISPR-Cas9系统),以在相同的生物内制造后面多轮的基因干扰和/或恢复(恢复基因功能,例如通过提供例如修复模板(如适用于HDR的ssDNA)而校正受到干扰的基因)。

  事实上,一般而言,SpCas9-介导的靶向单个或多个基因可以重演使用经典的更耗时的遗传小鼠模型观察到的形态学、电生理学、和行为表型。

  替代敲低整个基因家族或相关基因,此处的数据还提供了同时敲低或三种或更多种无关基因同样可行的原理论证。这适用于所有组织,但特别强烈地关于有丝分裂后组织,尤其是脑而提出。

  该工作的另一个有用的方面是,它显示可以采取组合、或整合的途径研究基因功能、采用CRISPR以产生基因型改变并且然后使用经典工具如电生理学(特别是与脑和CNS组织相关的)、生物化学、测序、电生理学、和/或行为读出来确立什么(如果有的话)表型改变是由于由CRISPR-Cas9系统诱导的基因型改变引起的。例如,在脑中,这允许我们研究体内单独基因以及基因群在神经过程中的功能以及它们在脑障碍中的作用。

  在此工作中对基因的成功干扰同样适用于基因功能的校正或者恢复,即在基因疗法中使用CRISPR-Cas9系统。这特别是与靶向有丝分裂后细胞、尤其是脑有关。

  总体上,使用该CRISPR-Cas9系统显示超过现有技术的改进,这些现有技术比如是Zn指,其花费长时间设计和生产并且不能多元化的;以及shRNA,其具有太多脱靶效应而CRISPR脱靶效应可以通过使用双切口酶途径最小化。

  靶向的组织

  新的工作支持通过将CRISPR-Cas9系统递送到适当位置(即,到感兴趣器官或组织内的细胞处)使用CRISPR-Cas9系统而靶向有丝分裂后细胞中的基因。优选的组织是在以下器官内:

  肾;

  消化系统,包括胃、胰腺、十二指肠、回肠和/或结肠;

  心脏;

  肺;

  脑,特别是神经元,和/或总体CNS;

  眼睛,包括视网膜组织;

  耳朵,包括内耳;

  皮肤;

  肌肉;

  骨;和/或

  肝(总体上),尽管这在一些实施例被排除,因为它还是单独施用的受试对象。

  应当理解的是,许多上述器官可以包括有丝分裂前细胞,但本发明的这方面是针对那些器官内的有丝分裂后细胞或组织。

  具体地说,我们优选该器官是肾或脑。在脑内,数据具体地显示了递送到该海马体齿状脑回和视觉皮质(是优选组织),尽管在一些实施例中还优选包括任何一种或多种以下项的其他组织:初级运动皮质、初级听皮层、初级驱体感觉皮层、小脑,主嗅球、前额皮质、梨状内核、扁桃体、黑质、纹状体、苍白球、丘脑、下丘脑、臂旁核、上橄榄复合体、耳蜗核、乳头体核。在一些实施例中,肝脏组织也是优选的。

  来自脑的细胞,并且特别是神经元,是尤其优选的。

  用以驱动CRISPR-Cas9系统(尤其是Cas9)表达的启动子的选择是重要的,如上所提及。当选择启动子时要考虑细胞周期的阶段(早期/晚期)和细胞类型,因为针对一种或多种细胞类型和细胞周期阶段而言启动子将是特异性的。在一些实施例中合适的启动子可包括以下项中的一个或多个:在一些实施例中合适的启动子可包括以下项中的一个或多个:

  在靶向脑特别是海马体齿状脑回中使用的双载体CRISPR-Cas9系统将SpCas9和sgRNA包装在两个单独的病毒载体上。因此Cas9,特别是SpCAs9,优选地是通过腺病毒载体,尤其是AAV(即,作为AAV-SpCas9)递送。指导物优选是作为sgRNA表达盒通过腺病毒载体,尤其是AAV(即,作为AAV-SpGuide)递送。一般用于此组织(海马体齿状脑回)和用于脑的优选途径是立体定向注射。

  基因功能的理解和测试以及为此的模型的创建和使用

  病症包括亨廷顿病,但本质上包括在有丝分裂后细胞中发现的任何病症,并且尤其是可以从体内研究获益或者缺乏有用模型的那些。

  如以上所述,CRISPR-Cas9系统可以用来探询有丝分裂后细胞中一种或多种基因的功能。这可以通过将CRISPR-Cas9系统递送至有丝分裂后细胞并且在其中进行表达来实现,其中该CRISPR-Cas9系统的一种或多种指导物被设计为将Cas9招募至一种或多种感兴趣的基因组靶标。同样地,在Cas9已经以蛋白质(转录的)形式包含在该有丝分裂后细胞中的情况下,则指导物到该有丝分裂后细胞的递送将足够。在Cas9已经以多核苷酸(未转录的)包含在该有丝分裂后细胞中的情况下,则指导物到该有丝分裂后细胞的递送连同诱导Cas9多核苷酸的转录将是必需的。可以在此有利的是,使该Cas9处于诱导型或阻遏型启动子例如tet(四环素)开关系统的控制下。

  一个特别有希望的方面是将CRISPR技术与表型测定整合,以确定基因干扰尤其是敲低导致的表型改变(如果有的话)。例如,实例40显示什么可以用靶向的基因组干扰偶联定量读出来实现,以提供关于特定基因组元件的生物功能的理解。具体而言,在脑中Cas9-介导的体内基因组编辑还可以与电生理学记录来偶联,以研究基因组干扰对特定细胞类型或回路组分的影响。在更广泛的意义上,使用CRISPR-Cas9系统(以提供Cas9-介导的基因组干扰)可以与生化、测序、电生理学、和行为分析相组合以研究靶向的基因组元件的功能。

  因此,在一个方面,提供了:一种探询一种或多种基因在有丝分裂后细胞中的功能的方法,该方法包括:

  诱导一种如下描述的缺陷基因型或基因敲低;并且

  确定在病症中该一种或多种基因的表达的变化,从而探询该一种或多种基因的功能。

  任选地,该方法还可以包括:

  将第二细胞群体移植到受试者中,由此诱导与该缺陷基因型或基因敲低相关联的病症。这可以先于该确定步骤。

  以下广泛适用于本发明的多个适当的方面。细胞可以是在受试者例如人类、动物或模式生物中,从而基因功能得以在体内探询。然而,还设想的是该细胞可以是离体,例如在细胞培养物中或在模型器官或类器官中。在一些实施例中,该方法可以包括将第一细胞群体从受试者分离,任选地将它们进行培养并用一种或多种CRISPR-Cas9系统进行转导。可遵循其他任选的培养。然后可以将转导的细胞移植回该受试者中。

  该细胞可以来自在此所述的任何组织或器官。脑是一个优选实例,提供用于探询一种或多种基因的功能的所述方法,其中该有丝分裂后细胞是脑细胞,例如神经元。特别是在体内,这允许对关于动物行为的基因功能的探询。该动物优选为哺乳动物,例如啮齿动物。考虑到由异质细胞类型的错综复杂网络组成的神经系统的复杂性,能够高效地编辑体内神经元的基因组使得能够引导对嵌入在天然背景中的相关细胞类型中的基因功能的测试。这得到我们的数据的支持,其中敲除小鼠当在训练情境条件下测试时显示受损的记忆巩固。我们的结果证实在齿状脑回神经元中CRIPSR-Cas9-介导的DNMT家族成员的敲除足以探测行为任务中的基因的功能。

  这显示出Cas9在体内促进哺乳动物脑中靶向的基因敲除中的多功能性,以用于研究基因功能并且特别是用于剖析神经元回路。在活体动物的脑中引入多基因的稳定敲除将具有潜在深远的应用,例如在生理和神经病理病症中多基因机制的因果探询。

  此工作的特性在于我们选择小鼠Mecp2启动子(235bp,pMecp2)7和最小多聚腺苷酸化信号(48bp,spA),所基于的是它们在培养的初级小鼠皮层神经元中实现SpCas9表达的足够水平的能力。Mecp2基因在雷特综合征(Rett syndrome)中起主要作用,该病为一种类型的自闭症谱系障碍。为了靶向Mecp2,我们首先设计了几种靶向小鼠Mecp2基因的外显子3的sgRNA,并且使用Neuro-2a细胞评价了它们的功效。使用SURVEYOR核酸酶测定鉴别最高效的sgRNA。该递送是经由高滴度AAV-SpCas9和AAV-SpGuide的混合物(1:1比率)的立体定向注射。我们还成功地测试在脑中多元基因组编辑的可能性。我们设计了由三种串联的sgRNA连同用于核标记的GFP-KASH组成的多元sgRNA表达载体。

  因此,还提供了诱导病症的方法,这些病症涉及在有丝分裂后细胞中一种或多种基因敲减。此类病症的实例很多,但举例时可以包括雷特综合征。合适的启动子将是清楚的,并且Mecp2启动子对于雷特综合征是理想的。一种选择用以驱动CRISPR-Cas9系统(特别是Cas9)表达的启动子的方式是针对感兴趣基因来选择该启动子。

  因此,在一个方面,提供了:一种诱导病症的方法,该病症涉及在有丝分裂后细胞中一种或多种缺陷基因(或基因型)或基因敲低,该方法包括:

  将第一细胞群体用非天然存在的或工程化的包含载体系统的组合物进行转导,该载体系统包括一种或多种载体,所述载体包括

  第一调节元件,该第一调节元件可操作地连接到CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列上,其中该多核苷酸序列包含

  一种或多种,优选三种或更多种能够杂交到该受试者基因组中的三种或更多种靶序列上的指导序列,

  tracr配对序列,和

  tracr序列,以及

  第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,该CRISPR酶包括至少一个或多个核定位序列(NLS),其中(a)、(b)和(c)是以5’到3’方向排列,

  其中组分I和II位于该系统的相同或不同载体上,其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,

  其中该CRISPR复合物包含与(1)杂交或可杂交到该靶序列上的该指导序列、和(2)杂交或可杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶,

  其中该CRISPR酶改变第一细胞群体的基因组,以获得携带该一种或多种缺陷基因或敲低基因的第二细胞群体。

  任选地,该方法还可以包括:

  从该受试者分离第一细胞群体。

  任选地,该方法还可以包括:

  将该第二细胞群体移植到该受试者中由此诱导增殖性病症。

  这本质上涉及诱导非功能(包括部分非功能的)基因型进入靶细胞,以由此提供一种用于研究(包括功能基因型的未来恢复)的模型。

  在细胞测定中,还可以使用CRISPR-Cas9系统以通过使得在有丝分裂后神经元中能够进行靶向敲除而协助基因功能的研究。

  用于将核苷酸递送至神经元细胞的方法是熟知的,并且由卡拉(Karra)和达姆(Dahm)综述于《神经科学杂志》(Journalof Neuroscience)(2010年5月5日,30(18):6171-6177;doi:10.1523/JNEUROSCI.0183-10.2010)中。实例包括电转染方法(例如电穿孔、核转染、以及单细胞电穿孔);化学转染方法(例如Ca2+磷酸盐共/沉淀以及脂质转染);病毒递送(如腺病毒、腺相关病毒(AAV)、慢病毒以及单纯疱疹病毒);以及物理转染方法(例如显微注射和基因枪(DNA包被的金粒子)。所有的这些可用于递送CRISPR-Cas9系统,但优选脂质转染或病毒方法,尤其是AAV或慢病毒。

  模型

  模型设有单个或多个基因敲低。一个实例将是用于雷特综合征的啮齿动物模型,Mecp2敲低。其他包括Dmnt家族敲低,特别是Dmnt1、3a和3b敲低。这样,提供了研究神经病症的模型。所有需要来完成的是鉴定该感兴趣的靶基因,设计适合的一种或多种指导物,并且将这些包括在适合的CRISPR-Cas9系统中并将其递送到一种或多种有丝分裂后细胞,无论是在体内还是离体(根据需要)。例如,这些模型可以具有改变的树突树形态,和/或提供了树突棘密度。

  如以上所提及,还提供了模型组织,例如类器官或“芯片上的肝”或其在例如芯片或支持于支架上的非肝等同物,例如耳、肾和脑组织。动物模型和模型组织是优选的。这些可以已经用Cas9转化,使得它们包括处于核苷酸或蛋白质形式的Cas9,如以上所提及的。这些具有以下优点,Cas9不需要伴随一种或多种指导物被递送,并且这进而可以允许更大程度的(指导物)多元化被容纳于递送载体内。再次,在此使用诱导型或阻遏型系统如tet-开或tet-关可以是有利的。

  在本文中描述了可使用该CRISPR-Cas9系统获得的模型,并且这些模型根据本披露和本领域中的知识在技术人员的范围之内。由于CRISPR-Cas9系统的多功能性,可能的模型的范围,无论是人类、啮齿动物、哺乳动物或另外的都是有很大不同的,并且这可通过对一种或多种适当指导物的简单选择来建立。还提供了创建此类模型的方法。

  基因疗法

  实施例40中的数据集中于基因干扰,主要是敲低。基因敲低可能仅是CRISPR-Cas9系统在基因疗法中的可能应用的总群体中的小(如果重要)部分。如已经在殷(Yin)和安德森(Anderson)论文(《自然生物技术》(Nature Biotech)2884在线公开,2014年3月30日)中显示的,可以在校正I型遗传性酪氨酸血症(HTI)中的缺陷型突变之后恢复功能表型,该I型遗传性酪氨酸血症是一种在其他情况下会致命的病症,其由延胡索酰乙酰乙酸盐水解酶(FAH)的突变(在外显子8的最后的核苷酸中G变为A)引起,该突变造成在剪接过程中外显子8的跳跃并且导致形成截短的不稳定的FAH蛋白,引起有毒代谢物的积累。将A突变校正回野生型G基因型导致恢复的表型。

  这样,在本工作中采取的途径可以合理地应用于基因疗法。具体地,该双载体途径、核标记途径、脑递送的特点(使用的注射形式、启动子盒/或病毒载体)、连同多元化(使用针对相同基因内或不同基因内的多个靶标的多个指导物)可以如同应用于例证的基因敲低而同等地应用于校正性基因疗法(即,其中缺陷基因型被校正)。在校正性基因疗法和基因敲低之间的主要区别在于,为了校正缺陷基因型,如点突变(例如,囊性纤维化,参见参考文献施万克(Schwank)等人,《细胞-干细胞》(Cell Stem Cell)13,653-658,2013年12月5日),有利的是提供修复模板来刺激HDR机制并且还理想地提供适合的Cas9切口酶。

  因此,本发明的载体优选靶向有丝分裂后细胞。在一种或多种指导物靶向缺陷基因型时,还优选地提供对应于被校正序列(提供功能表型的基因型)的修复模板,例如ssDNA。修复模板被描述在此。Cas9可以被提供在与该一种或多种指导物的载体相同或不同的载体中。这些载体优选是病毒载体,更优选腺病毒载体,并且最优选AAV载体。递送到细胞是优选地通过静脉内注射或通过立体定向注射,视情况而定。对启动子的选择也可以是重要的,并且优选实例提供在本文中。

  提供了治疗由有丝分裂后细胞中的缺陷基因型引起或与之相关联的遗传性疾病或病症的方法,该方法包括将CRISPR-Cas9系统递送到适当的细胞。缺陷基因型可以是非野生型基因型。具体而言,单点突变和/或单基因障碍尤其适于使用CRISPR-Cas9系统治疗。当多基因需要编辑或校正时,则可以使用多元途径来同时靶向它们全部。可替代地,可以设想两轮或更多轮的不同CRISPR-Cas9系统。优选地,野生型基因型得以校正。它并不一定必须是最常见的基因型,前提是在表型方面功能得以恢复或改进。

  恢复的表型的实例是听力恢复,恢复VGLUT3功能,并且由此恢复小鼠内耳听力(奥马尔艾其尔(Omar Akil)、丽贝卡(Rebecca)P.西尔(Seal)、凯文伯克(Kevin Burke)、王传松(Chuansong Wang)、奥拉什阿勒米(Aurash Alemi)、马修杜林(Matthew During)、罗伯特(Robert)H.爱德华兹(Edwards)、劳伦斯(Lawrence)R.卢斯蒂格(Lustig).使用病毒介导的基因疗法恢复VGLUT3敲除小鼠中的听力(Restoration of Hearing in the VGLUT3Knockout Mouse Using Virally Mediated Gene Therapy).《神经元》(Neuron),2012;75(2):283DOI:10.1016/j.neuron.2012.05.019)。这是使用AAV-介导的VGLUT3本身的递送,但完全合理的是也可使用CRISPR-Cas9系统,优选地也使用AAV载体,来靶向内耳细胞并且校正非功能VGLUT3基因型,具有相似的表型结果,即恢复听力。这样,优选使用AAV载体将CRISPR-Cas9系统递送到内耳是优选的,由此治疗听力损失。实际上,恢复感觉器官例如眼睛(包括视网膜)、鼻子和耳朵(特别是内耳)中的基因功能是优选的。

  相对最新的包括对有丝分裂后组织(眼睛,耳朵等等)中的障碍的讨论的综述是考夫曼(Kaufmann)等人(《EMBO分子医学》(EMBO Mol Med)(2013(,5,p1642-1661)。这确认了AAV在校正有丝分裂后组织中的单基因障碍中的有用性。它陈述了,“结合其他特征例如低炎症活性,它们已经示出具有优异的安全性并且因此对于体内基因疗法是非常引人注目的工具。实际上,阿利泼金是用于直接肌内注射的重组AAV……”具有引用的该论文综述了在作为靶组织的视网膜、中枢神经系统、肝脏、骨骼和心肌中的基因疗法。并且,在引用下,指示“初始研究探究了原型AAV血清型2载体,AAV载体的集合最近已经扩张到包括另外的血清型和甚至工程化的衣壳”。考夫曼和考夫曼中引用的文献均通过引用特此结合于此。

  转录组的RNAseq分析

  SpCas9-介导的基因组干扰和群体水平RNAseq分析的组合提供了一种表征转录调节并提示对于考虑的细胞中特定功能或疾病过程基因可以是重要的基因的方式。具体而言,细胞是来自脑,特别是神经元。快速作用技术如CRISPR-Cas9系统在研究转录组中是有利的,它在本质上是瞬时的。这样,提供了根据本发明的CRISPR-Cas9系统在分析转录组(RNAseq)中的用途。

  核标记方法

  为了促进表达SpCas9的神经元的免疫荧光鉴定,我们用HA-表位标签(来源于人类流感血球凝集素,为一种广泛用于表达载体中的通用表位标签)标记SpCas9。

  对于AAV-SpGuide载体,我们包装U6-sgRNA表达盒连同与KASH核跨膜结构域稠合的由人类突触蛋白I启动子驱动的绿色荧光蛋白(GFP)。该GFP-KASH融合蛋白将GFP引导到外部核膜,并且使得能够进行基于荧光的鉴定和经AAV-SpGuide转导的完整神经元核的纯化。

  因此,本发明的这些载体优选地以相似的方式适配。因此,提供了这些载体,其中该Cas9用表位标签如HA-表位标签标记。该Cas9可以是在此描述的任何Cas9,例如Sp或SaCas9,并且可以是任何变体(例如D10A双切口酶等),其条件是它被或可以被适当标记。

  本发明的这些载体还可被适配成使得指导RNA被包装在表达盒内,该表达盒包含:

  报告蛋白;以及

  任选地,用于该指导RNA的适合的启动子,如U6;

  其中该报告蛋白是与核跨膜结构域稠合,该核跨膜结构域可操作地连接至针对其的适合启动子。

  该报告蛋白质优选是荧光蛋白,例如绿色、红色或黄色荧光蛋白(GFP、RFP、YFP)等等中的一种。

  核跨膜结构域的实例包括KASH-样结构域、Sun2结构域、LEM结构域。在一些优选实施例中,该核跨膜结构域是KASH核跨膜。优选地,用于该跨膜结构域的启动子是人类突触蛋白I启动子;还参见在此引用的文件。

  该标记途径可以用在单一或双载体系统中,但优选在双载体系统内,因为在单一载体系统中空间被限制并且还降低了对于单独标签的需要。

  此外,这种标记技术的每个方面都可以独立于彼此而使用,使得Cas9的表位标记可以单独使用,或报告蛋白/荧光蛋白盒途径可以单独使用,或更优选两者可以一起使用。

  多重或重复表位标签对于该Cas9是优选的。具体而言,三重表位标签示于实例41中以改进检测。该标签优选是一种重复,更优选是一种三重复。HA是优选的Cas9表位标签。因此三重HA表位标签在一些实施例中是优选的。

  坎纳斯特(Kanasty)和安德森(Anderson)(《自然材料》(Nature Materials),12卷,2013年11月)是一篇有用的综述,最初提交在2013年3月11日并将RNAi的递送在线公开于2013年10月23日。由于RNAi和CRISPR指导序列之间的相似性,关于RNAi的该领域和其他领域的传授对于在我们的CRISPR-Cas9系统中递送指导物的机制提供了信息。描述的一些技术还是也适用于Cas9的递送的。在一些情况下,可以有用的是独立于Cas9递送我们的CRISPR-Cas9系统的指导物。这可以作为双载体递送系统的部分,其中这些载体从最广泛观点来说被认为是简单的任何递送手段,而不是特异性病毒载体。设想该Cas9可以经由病毒载体递送,并且特异性针对基因组靶标的指导物被分开递送。如在此所讨论的,该指导物可以经由与Cas9相同的载体类型递送,例如双载体系统,其中该Cas9是在AAV载体中递送的而该一种或多种指导物是在分开的AAV载体中递送的。这可以基本上同时进行(即共递送),但它也可以是以分开的时间点进行,分开甚至数周或数月。例如,如果已经递送第一轮的CRISPR-Cas9系统,但是然后随后需要提供另外的指导物,则可以再使用有望在靶细胞中仍然具有功能的原始Cas9。如果该Cas9是在诱导型启动子的控制下,则新的CAs9在靶细胞中的转录的诱导是优选的。同样地,如果使用提供用于本文的CAs9-表达模型,则仅仅一种或多种指导物的递送是必需的。因此,当一种或多种指导物的递送需要独立于Cas9,则可以将其以与RNAi非常相同的方式递送。这样,坎纳斯特的综述有助于指出适合的、特别集中在肝脏上的已知途径的数目,尽管这些递送手段通常对于广泛细胞来说是适当的。实例包括:

  ·“脂质体递送系统,连同缀合至亲脂性分子的siRNA,与血清脂蛋白相互作用,并随后得以进入吸收那些脂蛋白的肝细胞;”

  ·PEG化;

  ·缀合物例如:

  a.动态多聚缀合物(DPC,10nm纳米粒子),已经显示递送RNAi以成功地抑制ApoB(由此与我们的关于经由CRISPR-Cas9系统靶向ApoB的工作相交叉);以及

  b.三分支GalNAc缀合物

  c.是“均高度有效的”,尤其是GalNAc;

  ·其他纳米粒子包括:

  d.环糊精聚合物纳米粒子(CDP),其包括另外的配制品组分,例如金刚烷-PEG(AD-PEG)和金刚烷-PEG-转铁蛋白(AD-PEG-Tf);

  e.脂质纳米粒子(LNP),包括阳离子或可电离的脂质、屏蔽脂质、胆固醇和内源或外源靶向配体。内源靶向配体的实例是视黄醇结合蛋白(RBP),其可用于靶向表达RBP受体的肝和胰腺星形细胞。外源靶向配体的实例是GalNac,其还经由肝细胞上的脱唾液酸糖蛋白受体靶向肝脏。组合的途径见于Anlylams ALN-VSP中;

  ·“在肝脏内皮中的开窗术允许直径为100-200nm的分子扩散出血流并且进入肝细胞和其他肝脏细胞”;

  ·配体如GalNAc适用于递送至表达甘露糖受体的非实质肝脏细胞,并且递送至肝细胞,其中适合的siRNA到GalNAc配体的缀合已经显示成功地抑制PCSK9;以及

  寡核苷酸纳米粒子(ONP),由被设计为杂交到预定义的3D结构上的互补DNA片段构成。使用适合的3’突出端序列,6个siRNA链可以附接到每个粒子,甚至在特定位置处。流体动力学直径是约29nm。

  这些方法在用于递送用于CRISPR-Cas9系统的至少指导物的一些实施例中是优选的。尤其优选的是动态多聚缀合物或使用内源靶向配体(例如视黄醇结合蛋白)或外源靶向配体(例如GalNac)。

  本发明方法的一个优点在于,该CRISPR系统避免了脱靶结合及其所产生的副作用。这是通过使用被安排为具有针对靶DNA的高度序列特异性的系统而实现的。

  Cas9

  Cas9优化可以用来增强功能或者用来开发新的功能,人们可以产生嵌合Cas9蛋白。申请人已经产生的例子提供在实例6中。可以通过组合来自不同的Cas9同源物的片段而制成嵌合Cas9蛋白。例如,两种示例性嵌合Cas9蛋白来自本文描述的Cas9。例如,申请人使St1Cas9的N-末端(来自这种蛋白质的片段是粗体的)与SpCas9的C-末端融合。制造嵌合Cas9的益处包括下列任一项或全部:毒性降低;在真核细胞中改进表达;特异性增强;蛋白质分子量降低,例如,通过组合来自不同Cas9同源物的最小结构域使蛋白质更小;和/或改变PAM序列要求。

  该Cas9可以用作通用的DNA结合蛋白。例如,如实例7中所示,通过使负责切割该DNA靶的两条链的两个催化结构域(D10和H840)突变,申请人使用Cas9作为通用的DNA结合蛋白。为了上调在靶座位处的基因转录,申请人使转录激活结构结构域(VP64)融合到Cas9上。其他的转录激活结构域是已知的。如实例17中所示,转录激活是可能的。还如实例17中所示,使用结合到靶基因序列上的Cas9阻遏物(DNA结合域),基因阻遏(在β-连环蛋白基因的这种情况下)是可能的,由此阻遏其活性。

  Cas9以及一种或多种指导RNA可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型进行递送,尤其是,使用来自以下文献的配方和剂量:例如,美国专利号8,454,972(针对腺病毒的配方、剂量)、8,404,658(针对AAV的配方、剂量)和5,846,946(针对DNA质粒的配方、剂量)以及来自临床试验和关于涉及慢病毒、AAV、和腺病毒的临床试验的出版物。例如,对于AAV,给药途径、配方和剂量可以如美国专利号8,454,972并且如涉及AAV的临床试验。对于腺病毒,给药途径、配方和剂量可以如美国专利号8,404,658并且如涉及腺病毒的临床试验。对于质粒递送,给药途径、配方和剂量可以如美国专利号5,846,946并且如涉及质粒的临床试验。剂量可以基于或推断为平均70kg的个体,并且可以针对患者、受试者、不同重量和物种的哺乳动物进行调整。给药频率在医学或兽医学从业者(例如,医师、兽医师)的范围之内,其取决于常规因素,包括患者或受试者的年龄、性别、一般健康状况、其他状况以及着手解决的特殊状况或症状。

  可以将病毒载体注射到感兴趣的组织中。对于细胞类型特异性基因组修饰,Cas9的表达可以由细胞类型特异性启动子驱动。例如,肝脏特异性表达可以使用白蛋白启动子,而神经元特异性表达可以使用突触蛋白I启动子。

  转基因动物和植物

  还提供了转基因动物(模型),并且以下同样适用于离体模型组织和组织的集合,如类器官、芯片上的肝等等。优选实例包括含有Cas9(就编码Cas9的多核苷酸或该蛋白质自身而言)的动物。小鼠、大鼠和兔是优选的。为了用如本文示例的这些构建体产生转基因小鼠,人们可以将纯的线性DNA注射到来自假孕雌性(例如,CB56雌性)的合子的前核中。然后对首建者小鼠(founder)进行鉴定、基因分型、并且与CB57回交。然后,例如通过桑格(Sanger)测序将这些构建体克隆和任选地进行证实。在例如一个或多个基因在模型中被敲除的情况下,设想了敲除。然而,还设想了敲入(单独或以组合方式)。产生了一种示例性敲入Cas9小鼠,并且这是示例性的,但是Cas9敲入是优选的。为了产生Cas9敲入小鼠,人们可以将相同的组成型或条件型构建体靶向到Rosa26座位上,如本文所述(图25A-B和26)。可以修饰针对靶向Rosa座位的、转让给桑加莫生物科学公司(Sangamo BioSciences,Inc.)的美国专利公开号20120017290和20110265198的方法,以便利用本发明的CRISPR Cas系统。在另一个实施例中,也可以修饰针对靶向Rosa座位的、转让给Cellectis公司的美国专利公开号20130236946的方法,以便利用本发明的CRISPR Cas系统。

  条件型Cas9小鼠的实用性:申请人已经在293细胞中显示,可以通过与Cre共表达而激活Cas9条件型表达构建体。申请人还显示,当表达Cre时,正确靶向的R1mESC可以具有活性Cas9。因为在Cas9之后为P2A肽切割序列并且然后为EGFP,申请人通过观察EGFP而鉴定成功表达。申请人已经表明在mESCs中的Cas9激活。这个相同的观念在于,什么使条件型Cas9小鼠如此有用。申请人可以将其条件型Cas9小鼠与普遍表达Cre的小鼠(ACTB-Cre系)杂交并且可以得到在每个细胞中表达Cas9的小鼠。应当仅仅采用嵌合的RNA的递送,以便诱导在胚胎小鼠或成年小鼠中的基因组编辑。有趣的是,如果条件型Cas9小鼠与在组织特异的启动子下表达Cre的小鼠杂交,在也表达Cre的组织中将会仅有Cas9。通过将嵌合的RNA递送到相同的组织中,此途径可以用来仅仅在精确的组织中编辑基因组。

  如以上所提及,还提供了转基因动物。在这方面,转基因动物,尤其是哺乳动物如家畜(奶牛、绵羊、山羊和猪),而且还有禽类和食用昆虫,是优选的。

  腺相关病毒(AAV)

  就体内递送而言,AAV相比于其他病毒载体是有利的,这是由于几个原因:

  低毒性(这可以是由于纯化方法不需要细胞粒子的超速离心所致,而超速离心可能激活免疫反应)

  引起插入诱变的低概率,原因在于它未整合到宿主基因组中。

  AAV具有4.5或4.75Kb的包装限制。这意味着Cas9以及启动子和转录终止子必须都配合在同一个病毒载体中。大于4.5或4.75Kb的构建体将导致病毒产生的显著降低。SpCas9是相当大的,其基因自身超过4.1Kb,使其难于包装到AAV中。因此本发明的实施例包括利用更短的Cas9同源物。例如:

  因此这些物种总体上是优选的Cas9物种。申请人已经示出了递送和体内小鼠脑Cas9表达数据。

  介导体内基因组修饰的、将Cas9编码核酸分子例如DNA包装到病毒载体中的两种方式是优选的:

  为了实现NHEJ介导的基因敲除:

  单病毒载体:

  含有两个或更多个表达盒的载体:

  启动子-Cas9编码核酸分子-终止子

  启动子-gRNA1-终止子

  启动子-gRNA2-终止子

  启动子-gRNA(N)-终止子(一直到载体的大小限制)

  双病毒载体:

  含有一个用于驱动Cas9表达的表达盒的载体1

  启动子-Cas9编码核酸分子-终止子

  含有一个或多个用于驱动一个或多个指导RNA表达的表达盒的载体2

  启动子-gRNA1-终止子

  启动子-gRNA(N)-终止子(一直到载体的大小限制)

  为了介导同源定向修复。除了上述单和双病毒载体途径之外,另外的载体可以用来递送同源定向修复模板。

  用来驱动Cas9编码核酸分子表达的启动子包括:

  AAV ITR可以用作一种启动子:这对于消除另外的启动子元件(可在载体中占用空间)的需要是有利的。空出来的另外的空间可以用来驱动另外的元件的表达(gRNA,等等)。同样,ITR活性是较弱的,因此可以用来降低由于Cas9的过表达所致的毒性。

  对于遍存表达,可以使用启动子CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链,等等。

  对于脑表达,可以使用启动子:用于所有神经元的突触蛋白I、用于兴奋性神经元的CaMKIIα、用于GABA能神经元的GAD67或GAD65或VGAT,等等。

  对于肝脏表达,可以使用白蛋白启动子。

  对于肺表达,可以使用SP-B。

  对于内皮细胞,可以使用ICAM。

  对于造血细胞,可以使用IFNβ或CD45。

  对于成骨细胞,可以使用OG-2。

  用来驱动指导RNA的启动子可以包括:

  Pol III启动子,如U6或H1

  使用Pol II启动子和内含子盒来表达gRNA

  关于AAV,AAV可以是AAV1、AAV2、AAV5或任何其组合。可以选择相对于有待被靶向的细胞的AAV的AAV;例如,可以选择用于靶向脑或神经元细胞的AAV血清型1、2、5或杂合衣壳AAV1、AAV2、AAV5或其任何组合;并且可以选择用于靶向心脏组织的AAV4。AAV8可用于递送到肝脏。以上启动子和载体是单独优选的。

  RNA递送也是一种有用的体内递送方法。图27显示了递送和体内小鼠脑Cas9表达数据。有可能使用脂质体或纳米粒子将Cas9和gRNA(并且,例如,HR修复模板)递送到细胞中。因此,CRISPR酶如Cas9的递送和/或本发明的RNA的递送可以处于RNA的形式并且经由微囊泡、脂质体或纳米粒子来进行。例如,Cas9mRNA和gRNA可以被包装到脂质体粒子中用于体内递送。脂质体转染试剂例如来自生命技术公司(Life Technologies)的lipofectamine以及市售的其他试剂可以有效地将RNA分子递送到肝脏中。

  提高NHEJ或HR效率也有助于递送。优选的是,NHEJ效率通过共表达末端加工酶(co-expressing end-processing enzyme)如Trex2而增强(杜米特拉切(Dumitrache)等人《遗传学》(Genetics)2011年8月;188(4):787-797)。优选的是,HR效率通过瞬时抑制NHEJ机构如Ku70和Ku86而增加。HR效率也可以通过共表达原核或真核同源重组酶如RecBCD、RecA而增加。

  本文描述了各种递送手段,并且进一步在这个部分中进行论述。

  病毒递送:该CRISPR酶,例如Cas9,和/或任何本发明的RNA,例如指导RNA,可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他病毒载体类型、或其组合进行递送。Cas9以及一种或多种指导RNA可以包装到一种或多种病毒载体中。在一些实施例中,病毒载体可以,例如,通过肌肉注射递送到感兴趣组织中,而有时经由静脉内、经皮、鼻内、经口、粘膜、或其他递送方法进行病毒递送。这样的递送可以经由单剂量或多剂量来进行。本领域技术人员理解的是,本文有待递送的实际剂量可以在很大程度上取决于多种因素而变化,如载体选择、靶细胞、生物、或组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、给药途径、给药方式、所寻求的转化/修饰的类型,等等。

  这样的剂量可以进一步含有,例如,载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油,等等)、稀释剂、药学上可接受的载体(例如,磷酸盐缓冲盐水)、药学上可接受的赋形剂、和/或本领域已知的其他化合物。这样一种剂量配方可由本领域技术人员容易地确定。该剂型可以进一步含有一种或多种药学上可接受的盐,例如像,无机酸盐如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐、等等;以及有机酸盐,如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等等。另外,也可以存在辅助物质,如润湿剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球体、聚合物、悬浮剂等等。另外,也可以存在一种或多种其他常规药用成分,如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结剂、填充剂、螯合剂、包衣剂、化学稳定剂等等,尤其是该剂型是可复原形式时。适合的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨酯80、苯乙醇、三氯叔丁醇、山梨酸钾、抗坏血酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯酚、明胶、白蛋白和它们的组合。药学上可接受的赋形剂的彻底论述可获自《雷明顿药物科学》(REMINGTON'S PHARMACEUTICAL SCIENCES)(马克出版公司,纽约,1991),通过引用将其并入本文。

  在本文的一个实施例中,递送是经由腺病毒进行的,其可以是含有至少1x105个腺病毒载体粒子(也称为粒子单位,pu)的单次加强剂量。在本文的一个实施例中,该剂量优选地是该腺病毒载体的至少约1x106个粒子(例如,约1x106-1x1012个粒子),更优选至少约1x107个粒子,更优选至少约1x108个粒子(例如,约1x108-1x1011个粒子或约1x108-1x1012个粒子),并且最优选至少约1x100个粒子(例如,约1x109-1x1010个粒子或约1x109-1x1012个粒子),或者甚至至少约1x1010个粒子(例如,约1x1010-1x1012个粒子)。可替代地,该剂量包含不多于约1x1014个粒子,优选不多于约1x1013个粒子,甚至更优选不多于约1x1012个粒子,甚至更优选不多于约1x1011个粒子,并且最优选不多于约1x1010个粒子(例如,不多于约1x109个粒子)。因此,该剂量可以含有单剂量的腺病毒载体,其具有例如,约1x106粒子单位(pu),约2x106pu、约4x106pu、约1x107pu、约2x107pu、约4x107pu、约1x108pu、约2x108pu、约4x108pu、约1x109pu、约2x109pu、约4x109pu、约1x1010pu、约2x1010pu、约4x1010pu、约1x1011pu、约2x1011pu、约4x1011pu、约1x1012pu、约2x1012pu、或约4x1012pu的腺病毒载体。参见,例如,在2013年6月4日授权的授予纳贝尔(Nabel)等人的美国专利号8,454,972B2中的腺病毒载体(通过引用并入本文)以及在其第29栏第36-58行的剂型。在本文的一个实施例中,该腺病毒是经由多剂量递送的。

  在本文的一个实施例中,该递送是经由AAV进行的。用于针对人类的AAV的体内递送的治疗有效剂量被认为处于含有从约1x1010到约1x1010个功能AAV/ml溶液的从约20到约50ml的盐水溶液的范围内。该剂量可以调整以便使治疗益处相对于任何副作用的平衡。在本文的一个实施例中,AAV剂量大致处于从约1x105到1x1050个基因组AAV、从约1x108到1x1020个基因组AAV、从约1x1010到约1x1016个基因组、或约1x1011到约1x1016个基因组AAV的浓度范围内。人类剂量可以是约1x1013个基因组AAV。这样的浓度能以从约0.001ml到约100ml、约0.05到约50ml、或约10到约25ml的载体溶液进行递送。通过建立剂量反应曲线的常规试验,本领域普通技术人员可以容易地确立其他有效剂量。参见,例如,2013年3月26日授权的授予哈加(Hajjar)等人的美国专利号8,404,658 B2,在第27栏第45-60行。

  在本文的一个实施例中,该递送是经由质粒进行的。在这样的质粒组合物中,该剂量应当是足以引出反应的质粒的量。例如,在质粒组合物中的质粒DNA的适当量可以是从约0.1到约2mg,或从约1μg到约10μg。

  本文的剂量是基于平均70kg的个体。给药频率在医学或兽医学从业者(例如医师、兽医师)或本领域熟练的科学家的范围之内。在实验中使用的小鼠是约20g。根据给予至20g小鼠的量,人们可以外推至70kg个体。

  慢病毒

  慢病毒是复杂的反转录病毒,其具有在有丝分裂细胞和有丝分裂后细胞两者中感染并表达其基因的能力。最为人熟知的慢病毒是人类免疫缺陷病毒(HIV),其利其他病毒的包膜糖蛋白来靶向广泛范围的细胞类型。

  慢病毒可以制备如下。在克隆pCasES10(含有慢病毒转移质粒骨架)之后,将处于低传代数(p=5)的HEK293FT接种在T-75烧瓶中,直到在转染之前的一天在具有10%胎牛血清而没有抗生素的DMEM中50%汇合。在20小时之后,培养基更换为OptiMEM(无血清)培养基,并且在4小时后进行转染。细胞用10μg的慢病毒转移质粒(pCasES10)和下列包装质粒转染:5μg的pMD2.G(VSV-g假型)、和7.5μg的psPAX2(gag/pol/rev/tat)。在具有阳离子脂质递送剂(50μL的Lipofectamine 2000和100μl的Plus试剂)的4mL OptiMEM中进行转染。在6小时之后,培养基更换为具有10%胎牛血清的无抗生素的DMEM。

  慢病毒可以如下纯化。在48小时后收获病毒上清液。首先清除上清液的碎片并通过0.45μm的低蛋白结合(PVDF)滤膜进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀重新悬浮在50μl的DMEM中在4℃过夜。然后将它们等分,并且立即在-80℃冷冻。

  在另一个实施例中,还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体,尤其是对于眼基因治疗而言(参见,例如,巴鲁谷安(Balagaan),《基因医学杂志》(J Gene Med)2006;8:275-285,2005年11月21日在《威利在线期刊》(Wiley InterScience)在线公开;可在网址:interscience.wiley.com.DOI:10.1002/jgm.845获得)。在另一个实施例中,还考虑了一种经由视网膜下注射用于治疗湿型的年龄相关性黄斑变性的、表达血管生成抑制蛋白(内皮抑素和血管抑素)的基于马传染性贫血病毒的慢病毒基因治疗载体(参见,例如,宾利(Binley)等人,《人类基因治疗》(HUMAN GENE THERAPY)23:980-991(2012年9月)),其可以经修饰用于本发明的CRISPR-Cas系统。

  在另一个实施例中,自灭活慢病毒载体可以用于和/或适合于本发明的CRISPR-Cas系统,该自灭活慢病毒载体具有靶向由HIV tat/rev共享的共有外显子的siRNA、核仁定位TAR诱饵、和抗CCR5特异性锤头状核酶(参见,例如,迪吉斯托(DiGiusto)等人(2010)《科学转化医学》(Sci Transl Med)2:36ra43)。可以收集最少2.5×106个CD34+细胞/每千克患者体重,并且以2×106个细胞/ml的密度在X-VIVO 15培养基中(龙沙公司(Lonza))预刺激16到20个小时,该培养基含有2微摩尔/L-谷氨酰胺、干细胞因子(100ng/ml)、Flt-3配体(Flt-3L)(100ng/ml)、和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染复数5在75-cm2的包被有纤连蛋白(25mg/cm2)(重组人纤维蛋白片段(RetroNectin),宝生物工程株式会社(Takara Bio Inc.))的组织培养瓶中转导预刺激的细胞16到24小时。

  慢病毒载体还披露于帕金森病的治疗中,参见,例如,美国专利公开号20120295960以及美国专利号7303910和7351585。慢病毒载体还已经披露于眼病的治疗中,参见,例如,美国专利公开号20060281180、20090007284、US 20110117189;US 20090017543;US 20070054961、US 20100317109。慢病毒载体还已经披露于递送到脑中,参见,例如,美国专利公开号US 20110293571;US 20110293571、US 20040013648、US 20070025970、US 20090111106和美国专利号US 7259015。

  RNA递送

  RNA递送:该CRISPR酶,例如Cas9,和/或任何本发明的RNA,例如指导RNA,也可以按RNA的形式递送。可以使用体外转录产生Cas9mRNA。例如,可以使用含有下列元件的PCR盒来合成Cas9mRNA:来自β珠蛋白-polyA尾(一串120个或更多的腺嘌呤)的T7_启动子-科扎克(kozak)序列(GCCACC)-Cas9-3’UTR。该盒可以用于经由T7聚合酶的转录。也可以使用体外转录从含有T7_启动子-GG-指导RNA序列的盒来转录指导RNA。

  为了增强表达并且降低毒性,可以使用假-U或5-甲基-C修饰该CRISPR酶和/或指导RNA。

  mRNA递送方法用于当前的肝脏递送是特别有希望的。具体地说,AAV8对于递送到肝脏是特别优选的。

  粒子递送系统和/或配制品:

  已知一些类型的粒子递送系统和/或配制品在不同种类的生物医学应用中是有用的。总体上,粒子被定义为小物体,该物体在其运输和特性方面以整体单元表现。将粒子根据直径进一步分类。粗粒子覆盖2,500与10,000纳米之间的范围。细粒子的尺寸在100与2,500纳米之间。超细粒子、或纳米粒子的大小通常是在1和100纳米之间。100-nm极限的基础是以下事实:使粒子区分于大块材料的新颖特性典型地是在100nm之下的临界长度规模下显现的。

  如在此所使用的,粒子递送系统/配制品被定义为任何包括根据本发明的粒子的生物学递送系统/配制品。根据本发明的粒子是任何具有小于100微米(μm)的最大尺寸(例如直径)的实体。在一些实施例中,本发明的粒子具有小于10μm的最大尺寸。在一些实施例中,本发明的粒子具有小于2000纳米(nm)的最大尺寸。在一些实施例中,本发明的粒子具有小于1000纳米(nm)的最大尺寸。在一些实施例中,本发明的粒子具有小于900nm、800nm、700nm、600nm、500nm、400nm、300nm、200nm、或100nm的最大尺寸。典型地,本发明的粒子具有500nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有250nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有200nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有150nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有100nm或更小的最大尺寸(例如,直径)。在本发明的一些实施例中使用更小的粒子(例如,具有50nm或更小的最大尺寸)。在一些实施例中,本发明的粒子具有范围在25nm与200nm之间的最大尺寸。

  粒子表征(包括,例如表征形态、尺寸、等)是使用各种不同的技术进行的。通用技术是电子显微术(TEM、SEM)、原子力显微镜(AFM)、动态光散射(DLS)、X-射线光电子光谱法(XPS)、粉末X射线衍射(XRD)、傅里叶变换红外光谱法(FTIR)、基质辅助激光解吸/电离飞行时间质谱法(MALDI-TOF)、紫外-可见光谱法、双偏振干涉法以及核磁共振(NMR)。表征(尺寸测量)可以针对天然粒子(即预加载)或在加载负荷物(在此负荷物指代例如CRISPR-Cas系统的一种或多种组分,例如CRISPR酶或mRNA或指导RNA、或其任何组合,并且可以包括另外的组分、载体和/或赋形剂)进行,以提供具有最适大小的离子以用于任何本发明的体外、离体和/或体内施用的递送。在某些优选实施例中,粒子尺寸(例如,直径)表征是基于使用动态激光散射(DLS)的测量。可提及的是美国专利号8,709,843;美国专利号6,007,845;美国专利号5,855,913;美国专利号5,985,309;美国专利号5,543,158;以及詹姆斯(James)E.达尔曼(Dahlman)和卡门巴尔内斯(Carmen Barnes)等人在《自然纳米技术》(Nature Nanotechnology)(2014)的公开物,在线公开于2014年5月11日,doi:10.1038/nnano.2014.84,以上文献涉及粒子、制造和使用它们的方法及其测量。

  在本发明的范围内的粒子递送系统可以按任何形式提供,包括但不限于固体、半固体、乳液、或胶体粒子。这样可以将在此描述的任何递送系统,包括但不限于例如基于脂质的系统、脂质体、胶束、微泡、外泌体、或基因枪,提供为在本发明的范围内的粒子递送系统。

  纳米粒子

  就本发明而言,优选的是使用纳米粒子或脂质包膜递送CRISPR复合物的一种或多种组分例如CRISPR酶或mRNA或指导RNA。可以使用纳米粒子或脂质包膜同时递送CRISPR酶mRNA和指导RNA。其他递送系统或载体可以结合本发明的纳米粒子方面使用。

  通常,“纳米粒子”是指任何具有小于1000nm的直径的粒子。在某些优选实施例中,本发明的纳米粒子具有500nm或更小的最大尺寸(例如,直径)。在其他优选实施例中,本发明的纳米粒子具有范围在25nm与200nm之间的最大尺寸。在其他优选实施例中,本发明的纳米粒子具有100nm或更小的最大尺寸。在其他优选实施例中,本发明的纳米粒子具有范围在35nm与60nm之间的最大尺寸。

  包含于本发明中的纳米粒子可以提供为不同形式,例如提供为固体纳米粒子(例如,金属如银、金、铁、钛,非金属,基于脂质的固体,聚合物)、纳米粒子悬浮液、或其组合。可以制备金属纳米粒子、介电纳米粒子和半导体纳米粒子连同混合结构(例如,核-壳纳米粒子)。由半导体材料制成的纳米粒子也可以经量子点标记,如果它们足够小(典型地低于10nm)使得电子能级的量子化发生的话。此类纳米级粒子作为药物载体或成像剂用于生物医学应用中,并且可以被适配为用于本发明中的相似目的。

  半-固体和软纳米粒子已经制造出,并且是在本发明的范围内。具有半-固体性质的原型纳米粒子是脂质体。各种类型的脂质体纳米粒子目前在临床上用作用于抗癌药物和疫苗的递送系统。一半亲水并且另一半疏水的纳米粒子称为杰那斯(Janus)粒子,并且对于稳定乳液是特别有效的。它们可以在水/油界面处自组装,并且充当固体表面活性剂。美国专利号8,709,843(通过引用结合在此)提供了用于将包含治疗剂的粒子靶向递送至组织、细胞和细胞内隔室的药物递送系统。本发明提供了包含聚合物的靶向粒子,该聚合物缀合至表面活性剂、亲水聚合物或脂类。

  通过引用结合在此的美国专利号6,007,845提供了以下粒子,这些粒子具有多嵌段共聚物的核,该多嵌段共聚物是通过将多官能化合物与一种或多种疏水聚合物和一种或多种亲水聚合物共价连接而形成的,并且这些粒子包含生物活性材料。

  通过引用结合在此的美国专利号5,855,913提供了一种具有空气动力学上轻的粒子的微粒组合物,这些空气动力学上轻的粒子具有小于0.4g/cm3的振实密度,其平均直径在5μm与30μm之间,将一种表面活性剂结合在其表面以用于将药物递送至肺部系统。

  通过引用结合在此的美国专利号5,985,309提供了以下粒子,这些粒子结合表面活性剂和/或带正电或负电的治疗剂或诊断剂和相反电荷带电分子的亲水或疏水复合物,以用于递送至肺部系统。

  通过引用结合在此的美国专利号5,543,158提供了生物可降解的可注射纳米粒子,这些可注射纳米粒子具有生物可降解的固体核,该固体核在表面上包含生物活性材料和聚(亚烷基二醇)部分。

  通过引用结合在此的WO 2012135025(也公开为US 20120251560)描述了缀合的聚乙烯亚胺(PEI)聚合物和缀合的氮杂-大环化合物(统称为“缀合的微脂体(lipomer)”或“微脂体”)。在某些实施例中,可设想此类缀合的微脂体可以在CRISPR-Cas系统的背景下使用,以实现体外、离体和体内基因组干扰以修饰基因表达,包括调节蛋白表达。

  在一个实施例中,该纳米粒子可以是环氧化物-修饰的脂质-聚合物,有利地为7C1(参见,例如詹姆斯(James)E.达尔曼(Dahlman)和卡门巴尔内斯(Carmen Barnes)等人在《自然纳米技术》(Nature Nanotechnology)(2014)的公开物,在线公开于2014年5月11日,doi:10.1038/nnano.2014.84)。C71是通过使C15环氧化物终止的脂质与PEI600以14:1摩尔比进行反应来合成,并且与C14PEG2000配制以产生在PBS溶液中稳定持续至少40天的纳米粒子(直径在35与60nm之间)。

  可以利用环氧化物-修饰的脂质-聚合物将本发明的CRISPR-Cas系统递送至肺部细胞、心血管细胞或肾细胞,然而本领域的技术人员可以调适该系统以递送到其他靶器官。设想了从约0.05至约0.6mg/kg的剂量范围。还设想了经数天或数周的剂量,其中总剂量为约2mg/kg。

  例如,苏X(Su X)、弗里克J(Fricke J)、卡瓦纳DG(Kavanagh DG)、欧文DJ(Irvine DJ)(“使用脂质包封的pH响应性聚合物纳米粒子的体外和体内mRNA递送”(“In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles”)《分子药理学》(Mol Pharm.)2011年6月6日;8(3):774-87.doi:10.1021/mp100390w.2011年4月1日电子版描述了生物可降解的核-壳结构纳米粒子,其具有由磷脂双层壳包封的聚(β-氨基酯)(PBAE)核。这些被开发为用于体内mRNA递送。该pH响应性PBAE被选择为促进内体破裂,而该脂质表面层被选择为将聚阳离子核的毒性降低到最低限度。因此,这些对于递送本发明的RNA是优选的。

  在一个实施例中,考虑了基于自组装生物粘附聚合物的纳米粒子,其可应用于肽的经口递送、肽的静脉内递送以及肽的鼻递送,均递送到脑。其他实施例,还考虑了例如疏水性药物的经口吸收和眼部递送。分子包膜技术涉及被保护并递送到疾病部位的工程化聚合物包膜(参见,例如,马萨(Mazza)M.等人《ACS纳米》(ACSNano),2013.7(2):1016-1026;秀(Siew)A.等人《分子药理学》(Mol Pharm),2012.9(1):14-28;拉拉特萨(Lalatsa)A.等人《控释杂志》(J Contr Rel),2012.161(2):523-36;拉拉特萨(Lalatsa)A.等人,《分子药理学》(Mol Pharm),2012.9(6):1665-80;拉拉特萨(Lalatsa)A.等人《分子药理学》(Mol Pharm),2012.9(6):1764-74;加勒特(Garrett)N.L.等人《生物光电杂志》(J Biophotonics),2012.5(5-6):458-68;加勒特(Garrett)N.L.等人《拉曼光谱杂志》(J Raman Spect),2012.43(5):681-688;阿哈默德(Ahmad)S.等人《皇家学会界面杂志》(J Royal Soc Interface)2010.7:S423-33;乌切克布(Uchegbu)I.F.《药物递送专家评论》(Expert Opin Drug Deliv),2006.3(5):629-40;曲(Qu)X.等人《生物大分子》(Biomacromolecules),2006.7(12):3452-9和乌切克布(Uchegbu)I.F.等人《国际药学杂志》(Int J Pharm),2001.224:185-199)。考虑了约5mg/kg的剂量,呈单剂量或多剂量形式,这取决于靶组织。

  在一个实施例中,可以使用由丹·安德森实验室(Dan Anderson’s lab)在MIT开发的可将RNA递送到癌细胞以便使肿瘤生长停止的纳米粒子/并且或使其适用于本发明的CRISPR Cas系统。具体地说,安德森实验室开发了用于新生物材料和纳米制剂的合成、纯化、表征、和配制的全自动化组合系统。参见,例如,阿拉比(Alabi)等人,《美国国家科学院院刊》(Proc Natl Acad Sci U S A.)2013年8月6日;110(32):12881-6;张(Zhang)等人,《先进材料》(Adv Mater.)2013年9月6日;25(33):4641-5;江(Jiang)等人,《纳米通讯》(Nano Lett.)2013年3月13日;13(3):1059-64;卡拉吉安尼斯(Karagiannis)等人,《ACS纳米》(ACS Nano.)2012年10月23日;6(10):8484-7;怀特海德(Whitehead)等人,《ACS纳米》(ACS Nano.)2012年8月28日;6(8):6922-9和李(Lee)等人,《自然纳米技术》(Nat Nanotechnol.)2012年6月3日;7(6):389-93。

  美国专利申请20110293703涉及类脂质化合物,这些化合物在多核苷酸的给药中也是特别有用的,其可适用于递送本发明的CRISPR Cas系统。在一个方面,氨基醇类脂质化合物与有待递送到细胞或受试者的药剂结合而形成微粒子、纳米粒子、脂质体、或胶束。有待通过粒子、脂质体、或胶束递送的药剂可以处于气体、液体、或固体的形式,并且该药剂可以是一种多核苷酸、蛋白质、肽、或小分子。这些氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质、等等形成粒子。然后这些粒子可以任选地与药用赋形剂结合而形成药物组合物。

  美国专利公开号0110293703也提供了制备氨基醇类脂质化合物的方法。使胺的一种或多种等效物与环氧化物封端化合物的一种或多种等效物在适当条件下反应而形成本发明的氨基醇类脂质化合物。在某些实施例中,胺的所有氨基基团与环氧化物封端化合物充分反应而形成叔胺。在其他实施例中,胺的所有氨基基团未与环氧化物封端化合物完全反应形成叔胺,由此生成在氨基醇类脂质化合物中的伯胺或仲胺。这些伯胺或仲胺照原样留下或者可以与另一种亲电体如一种不同的环氧化物封端化合物反应。正如本领域技术人员将理解的,胺与未过量的环氧化物封端化合物反应将产生多种不同的具有不同数目的尾部的氨基醇类脂质化合物。某些胺类可以用两个环氧化物衍生的化合物尾部将其完全功能化,而其他分子用环氧化物衍生的化合物尾部将不会被完全功能化。例如,二胺或多胺可包括离开该分子的不同氨基部分的一个、二个、三个、或四个环氧化物衍生的化合物尾部,从而产生伯胺、仲胺、和叔胺。在某些实施例中,并不是所有氨基基团都被完全功能化。在某些实施例中,使用相同类型的环氧化物封端化合物中的两种。在其他实施例中,使用两种或更多种不同的环氧化物封端化合物。氨基醇类脂质化合物的合成是用或不用溶剂进行的,并且该合成可以在范围从30℃-100℃,优选在大致50℃-90℃的较高温度下进行。任选地,可以将制备的氨基醇类脂质化合物纯化。例如,可以纯化氨基醇类脂质化合物的混合物而产生具有特定数目的、环氧化物衍生的化合物尾部的氨基醇类脂质化合物。或者,该混合物可以被纯化而产生特定的立体异构体或区域异构体。也可以使用烷基卤化物(例如,碘甲烷)或其他烷化剂将这些氨基醇类脂质化合物烷化,和/或它们可以被酰化。

  美国专利公开号0110293703还提供了通过发明方法制备的氨基醇类脂质化合物的文库。使用涉及液体处理器、机器人、微量滴定板、计算机、等等的高通量技术,可以制备和/或筛选这些氨基醇类脂质化合物。在某些实施例中,筛选了这些氨基醇类脂质化合物的将多核苷酸或其他药剂(例如,蛋白质、肽、小分子)转染到细胞中的能力。

  美国专利公开号20130302401涉及已经使用组合聚合制备的一类聚(β-氨基醇)(PBAAs)。这些发明的PBAA可以在生物技术和生物医学应用中用作涂层(如用于医疗装置或植入物的薄膜或多层薄膜的涂层)、添加剂、材料、赋形剂、生物防污剂(non-biofouling agent)、微图像化剂(micropatterning agent)、以及细胞封装剂(cellular encapsulation agent)。当用作表面涂层时,这些PBAA在体外和体内均引出不同水平的炎症,这取决于它们的化学结构。这类材料的巨大化学多样性允许我们鉴定出体外抑制巨噬细胞激活的聚合物涂层。此外,在羧化聚苯乙烯微粒的皮下移植之后,这些涂层减少了炎症细胞的募集,并且减轻了纤维化。这些聚合物可以用来形成用于细胞封装的聚电解质复合物胶囊。本发明还可具有许多其他的生物应用,如抗微生物涂层、DNA或siRNA递送、以及干细胞组织工程。美国专利公开号20130302401的传授内容可以适用于本发明的CRISPR Cas系统。

  在另一个实施例中,考虑了脂质纳米粒子(LNP)。具体地说,封装在脂质纳米粒子中的抗转甲状腺素蛋白小干扰RNA(参见,例如,科尔贺(Coelho)等人,《新英格兰医学杂志》(N Engl J Med)2013;369:819-29)可以适用于本发明的CRISPR Cas系统。考虑到静脉内给予约0.01到约1mg/kg体重的剂量。考虑了降低输注相关反应的风险的用药,如考虑到地塞米松、对乙酰氨基酚(acetampinophen)、苯海拉明或西替利嗪、以及雷尼替丁。考虑了约0.3mg/千克的多剂量,每4周一次,五个剂量。

  LNP已经显示在将siRNA递送到肝脏中是高度有效的(参见,例如,塔韦内罗(Tabernero)等人,《癌症发现》(Cancer Discovery),2013年4月,第3卷,第4期,第363-470页),并且因此被考虑用于递送CRISPR Cas到肝脏。可以考虑6mg/kg的LNP(或CRISPR-Cas的RNA)的约四个剂量的用量,每两周一次。塔韦内罗(Tabernero)等人证明,在以0.7mg/kg给予LNP的前2个周期之后,观察到肿瘤消退,并且在6个周期结束之后,患者已经实现了部分应答,具有淋巴结转移完全消退以及肝脏肿瘤的显著萎缩。在此患者中给予40个剂量之后获得完全应答,在接受经过26个月的剂量之后其保持缓解和完全治疗。具有RCC和在用VEGF途径抑制剂进行的在先治疗之后进展的包括肾脏、肺、以及淋巴结在内的肝外部位疾病的两位患者在所有部位的疾病都保持稳定大约8到12个月,并且一位具有PNET和肝转移的患者继续在18个月(36个剂量)的延伸研究中保持疾病稳定。

  然而,必须将LNP的电荷考虑在内。当阳离子脂质与带负电的脂质结合时,诱导促进细胞内递送的非双层结构。由于带电荷的LNP在静脉注射之后迅速从循环中清除,开发了具有低于7的pKa值的可电离阳离子脂质(参见,例如,罗辛(Rosin)等人,《分子治疗》(Molecular Therapy),第19卷,第12期,第1286-2200页,2011年12月)。带负电荷的聚合物如siRNA寡核苷酸可以低pH值(例如,pH 4)加载到LNP中,在此pH时可电离脂质展示出正电荷。然而,在生理学pH值时,LNP展现出与更长的循环时间相容的低表面电荷。已经关注了四种可电离阳离子脂质,即1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基-酮基-N,N-二甲基-3-氨基丙烷(DLinKDMA)、以及1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。已经表明,含有这些脂质的LNP siRNA系统在体内肝细胞中展现出显著不同的基因沉默特性,具有根据采用因子VII基因沉默模型的DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP系列而变化的潜能(参见,例如,罗辛(Rosin)等人,《分子治疗》(Molecular Therapy),第19卷,第12期,第1286-2200页,2011年12月)。可以考虑1μg/ml水平的剂量,尤其是对于含有DLinKC2-DMA的配制品而言。

  LNP的制备和CRISPR Cas封装可以使用/和或改编自罗辛(Rosin)等人的《分子治疗》(Molecular Therapy),第19卷,第12期,第1286-2200页,2011年12月)。阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮基-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-o-[2″-(甲氧基聚乙二醇2000)琥珀酰]-1,2-二肉豆蔻酰基-sn-二醇(PEG-S-DMG)、以及R-3-[(ω-甲氧基-聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻酰氧基丙基-3-胺(PEG-C-DOMG)可以由Tekmira制药公司(Tekmira Pharmaceuticals)(温哥华,加拿大)提供或者合成。胆固醇可以购自西格玛公司(圣路易斯,密苏里州)。特异性CRISPR Cas RNA可以封装在含有DLinDAP、DLinDMA、DLinK-DMA、和DLinKC2-DMA的LNP中(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG的摩尔比为40:10:40:10)。在需要时,可以结合0.2%SP-DiOC18(英杰公司,伯灵顿,加拿大)来评估细胞摄取、细胞内递送、和生物分布。通过将由阳离子脂质:DSPC:胆固醇:PEG-c-DOMG(40:10:40:10摩尔比)组成的混合物溶解在乙醇中直到最终脂质浓度为10mmol/l来进行封装。可以将脂质的这种乙醇溶液逐滴加入到pH 4.0的50mmol/l柠檬酸盐中而形成多层囊泡,从而产生30%(vol/vol)乙醇的最终浓度。在使用挤出机(北方脂质公司(Northern Lipids),温哥华,加拿大)通过两个重叠的80nm Nuclepore聚碳酸酯滤膜挤出多层囊泡之后,可以形成大的单层囊泡。可以通过如下步骤实现封装:将溶解在含有30%乙醇(vol/vol)的pH 4.0的50mmol/l柠檬酸盐中的2mg/ml的RNA逐滴加入到挤出的形成的大单层囊泡中,并且在31℃孵育30分钟,伴随持续混合直到最终的RNA/脂质重量比为0.06/1(wt/wt)。通过使用Spectra/Por 2再生纤维素透析膜在pH为7.4的磷酸盐缓冲盐水(PBS)中透析16小时进行乙醇的去除以及配制缓冲液的中和。使用NICOMP 370型粒径分析仪、囊泡/强度模式、以及高斯拟合,通过动态光散射,可以测定纳米粒子粒径分布(Nicomp粒径分析仪公司,圣巴巴拉市,加利福尼亚州)。对于所有三个LNP系统的粒径可以是约70nm的直径。可以通过使用VivaPureD MiniH柱(赛多利斯斯泰迪生物技术公司(Sartorius Stedim Biotech))从分析前后收集的样品中去除游离siRNA来确定siRNA封装效率。从洗脱的纳米粒子提取封装的RNA并且将其在260nm定量。通过使用来自美国瓦克化学公司(Wako Chemicals USA)(里士满(Richmond),弗吉尼亚州)的胆固醇E酶法测定法测量囊泡中的胆固醇含量,确定了siRNA与脂质的比率。PEG化的脂质体(或LNP)也可用于递送。

  大LNP的制备可以使用/和或改编自罗辛(Rosin)等人的《分子治疗》(Molecular Therapy),第19卷,第12期,第1286-2200页,2011年12月。可以在含有50:10:38.5的摩尔比的DLinKC2-DMA、DSPC、和胆固醇的乙醇中制备脂质预混物溶液(20.4mg/ml总脂质浓度)。可以按照0.75:1的摩尔比(乙酸钠:DLinKC2-DMA)将乙酸钠添加到脂质预混物中。随后可以通过将该混合物与1.85倍体积的柠檬酸盐缓冲液(10mmol/l,pH 3.0)在剧烈搅拌下合并而使脂质水合,从而导致在含有35%的在水性缓冲液中的自发脂质体形成。可以在37℃孵育该脂质体溶液以允许粒径的时间依赖性增加。可以通过动态光散射(纳米粒径电位分析仪(Zetasizer Nano ZS),马尔文仪器公司(Malvern Instruments),乌斯特郡(Worcestershire),英国)在孵育的不同时间去除等分试样以研究脂质体大小的变化。一旦实现所希望的粒径,可以将水性PEG脂质溶液(储备溶液=在35%(vol/vol)乙醇中的10mg/ml PEG-DMG)添加到该脂质体混合物中,以便产生3.5%总脂质的最终PEG摩尔浓度。在添加PEG-脂质之后,这些脂质体应该其大小,有效抑制进一步生长。然后以大约1:10(wt:wt)的siRNA与总脂质比率将RNA添加到空脂质体,然后在37℃孵育30分钟以形成加载的LNP。随后将该混合物在PBS中透析过夜,并且用0.45-μm的注射器过滤器。

  球形核酸(SNATM)构建体和其他纳米粒子(尤其是金纳米粒子)也被考虑为将CRISPR/Cas系统递送到预期靶标的手段。重要数据表明,基于核酸功能化的金纳米粒子的AuraSense治疗性球形核酸(SNATM)构建体优于替代平台,其基于多个关键成功因素,如:

  高体内稳定性。由于它们的密集加载,大多数负荷(DNA或siRNA)保持接合到细胞内部的构建体上,从而赋予核酸稳定性和对酶促降解的抗性。

  可递送性。对于所研究的所有细胞类型(例如,神经元、肿瘤细胞系,等等),这些构建体证明了在不需要载体或转染剂时99%的转染效率。

  治疗靶向性。这些构建体的独特靶结合亲和力和特异性允许对于匹配的靶序列的精密特异性(即,限制性脱靶效应)。

  优良效能。这些构建体显著胜过一流的常规转染试剂(Lipofectamine 2000和细胞转染剂(Cytofectin))。

  低毒性。这些构建体可以进入多种培养的细胞、原代细胞、和组织中,没有明显的毒性。

  没有显著的免疫反应。这些构建体在全局基因表达上引起最小的变化,正如通过全基因组微阵列研究和细胞因子特异性蛋白质分析所测量。

  化学可修整性。任何数目的单个或组合药剂(例如,蛋白质、肽、小分子)可以用来修整这些构建体的表面。

  对于基于核酸治疗剂的这个平台可以适用于许多疾病状态,包括炎症和感染性疾病、癌症、皮肤病症和心血管疾病。

  可引用的文献包括:卡特勒(Cutler)人,《美国化学会志》(J.Am.Chem.Soc.)2011133:9254-9257,郝(Hao)等人,Small.20117:3158-3162,张(Zhang)等人,《ACS纳米》(ACS Nano.)20115:6962-6970,卡特勒(Cutler)等人,《美国化学会志》(J.Am.Chem.Soc.)2012134:1376-1391,杨(Young)等人,《纳米通讯》(Nano Lett.)201212:3867-71,郑(Zheng)等人,《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA.)2012109:11975-80,米尔金(Mirkin),《纳米医学》(Nanomedicine)20127:635-638张(Zhang)等人,《美国化学会志》(J.Am.Chem.Soc.)2012134:16488-1691,因特劳布(Weintraub),《自然》(Nature)2013495:S14-S16,崔(Choi)等人,《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA.)2013110(19):7625-7630,詹森(Jensen)等人,《科学转化医学》(Sci Transl Med)5,209ra152(2013)以及米尔金(Mirkin)等人,Small,doi.org/10.1002/smll.201302143。

  具有siRNA的自组装纳米粒子可以用被聚乙二醇化的聚乙烯亚胺(PEI)构建,其中Arg-Gly-Asp(RGD)肽配体附接在聚乙二醇(PEG)的远端,例如,作为靶向表达整合素的肿瘤新血管系统的手段和用来递送抑制血管内皮生长因子受体2(VEGF R2)表达以及由此抑制肿瘤血管形成的siRNA的手段(参见,例如,施弗勒斯(Schiffelers)等人,《核酸研究》(Nucleic Acids Research),2004,第32卷,第19期)。通过将等体积的阳离子聚合物水溶液和核酸水溶液混合从而产生在2到6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量,从而制备纳米束。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成,其具有约100nm的平均粒径分布,此后称为纳米束。设想了CRISPR Cas的约100到200mg的剂量,用于施弗勒斯(Schiffelers)等人的自组装纳米粒子中的递送。

  巴特利特(Bartlett)等人的纳米束(PNAS,2007年9月25日,第104卷,第39期)也可以应用于本发明。通过将等体积的阳离子聚合物水溶液和核酸水溶液混合从而产生在2到6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量,从而制备巴特利特(Bartlett)等人的纳米束。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成,其具有约100nm的平均粒径分布,此后称为纳米束。巴特利特(Bartlett)等人的DOTA-siRNA合成如下:1,4,7,10-四氮杂环十二烷-1,4,7,10-四乙酸单(N-羟基琥珀酰亚胺酯)(DOTA-NHSester)订购自Macrocyclics公司(达拉斯(Dallas),德克萨斯州)。将碳酸盐缓冲液(pH 9)中的具有100倍摩尔过量的DOTA-NHS-酯的胺修饰的RNA有义链加入到微量离心管中。通过在室温搅拌4小时使这些内容物反应。将该DOTA-RNA有义缀合物用乙醇沉淀,重新悬浮在水中,并且退火到未修饰的反义链上而产生DOTA-siRNA。所有液体用Chelex-100(伯乐公司(Bio-Rad),赫库斯(Hercules),加利福尼亚州)预处理,以便去除微量金属污染物。通过使用含有环糊精的聚阳离子可以形成Tf靶向和非靶向的siRNA纳米粒子。典型地,纳米粒子以3(+/-)的进料比和0.5g/升的siRNA浓度在水中形成。用Tf(金刚烷-PEG-Tf)修饰在靶向纳米粒子表面上的百分之一的金刚烷-PEG分子。将纳米粒子悬浮在用于注射的5%(wt/vol)的葡萄糖载体溶液中。

  戴维斯(Davis)等人(《自然》,第464卷,2010年4月15日)使用靶向的纳米粒子递送系统进行了siRNA临床试验(临床试验登记号NCT00689065)。在21天周期的第1、3、8和10天通过30分钟的静脉输注对患有标准护理治疗难治的实体癌的患者给予靶向纳米粒子剂量。这些纳米粒子包含合成递送系统,该系统含有:(1)线性的、基于环糊精的聚合物(CDP),(2)展示在纳米粒子的外部上的用于接合癌细胞表面上的TF受体(TFR)的人转铁蛋白蛋白(TF)靶向配体,(3)亲水聚合物(用来促进在生物流体中的纳米粒子稳定性的聚乙二醇(PEG)),以及(4)被设计为降低RRM2(在临床中使用的序列,先前表示为siR2B+5)表达的siRNA。TFR已经久为所知在恶性细胞中被下调,并且RRM2是一种确立的抗癌靶标。已经显示这些纳米粒子(临床版本表示为CALAA-01)在非人类灵长动物中的多剂量研究中良好耐受。虽然已经通过脂质体递送向患有慢性粒细胞白血病的单一患者给予了siRNA,但是戴维斯等人的临床试验是初期人类试验,该试验用一个靶向的递送系统全身性地递送siRNA并且治疗患有实体癌的患者。为了确定该靶向的递送系统是否能够将功能性siRNA有效递送到人类肿瘤,戴维斯等人研究了来自三个不同的剂量组群的三位患者的活组织检查;患者A、B和C均患有转移性黑素瘤并且分别接受了18、24和30mg m-2siRNA的CALAA-01剂量。还可以针对本发明的CRISPR Cas系统考虑相似的剂量。用含有一种线性的基于环糊精的聚合物(CDP)、一种展示在纳米粒子的外部上的用于接合癌细胞表面上的TF受体(TFR)的人转铁蛋白(TF)靶向配体和/或一种亲水聚合物(例如,用来促进在生物流体中的纳米粒子稳定性的聚乙二醇(PEG))的纳米粒子,可以实现本发明的递送。

  外泌体

  外泌体是可以向小鼠脑中递送短干扰(si)RNA的转运RNA和蛋白质的内源纳米囊泡。为了降低免疫原性,阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人(2011,《自然生物技术》29:341)使用了用于外泌体产生的自我衍生的树突细胞。通过将树突细胞工程化为表达Lamp2b(一种外泌体膜蛋白,融合到神经元特异性RVG肽上)而实现了靶向。通过电穿孔使纯化的外泌体加载外源siRNA。静脉注射的RVG靶向的外泌体特异性地将GAPDH siRNA递送到脑中的神经元、小胶质细胞、少突神经胶质细胞,导致特异性的基因敲除。预暴露于RVG外泌体未减弱敲低,并且在其他组织中未观察到非特异性摄取。通过BACE1的强的mRNA(60%)和蛋白质(62%)敲低证明了外泌体介导的siRNA递送的治疗潜能,BACE1是一种阿尔茨海默病中的治疗靶标。

  为了获得免疫惰性的外泌体池,阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人收获了来自具有同源主要组织相容性复合体(MHC)单体型的近交C57BL/6小鼠的骨髓。由于未成熟树突细胞产生大量的缺乏T细胞激活剂如MHC-II和CD86的外泌体,阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人选择具有粒细胞/巨噬细胞集落刺激因子(GM-CSF)的树突细胞持续7天。次日,使用良好建立的超速离心方案从培养上清从纯化外泌体。这些产生的外泌体在物理上是同质的,具有直径为80nm的粒径分布峰,正如通过纳米粒子跟踪分析(NTA)和电子显微镜检查所测定。阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人获得了6-12μg的外泌体(基于蛋白质浓度测量的)/每106个细胞。

  其次,阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人研究了使用适用于纳米级应用的穿孔方案给修饰的外泌体加载外源负荷的可能性。由于电穿孔对于纳米级的膜粒子尚未良好表征,使用非特异性Cy5标记的siRNA用于电穿孔方案的经验优化。在外泌体超速离心和溶解之后测定了封装的siRNA的量。在400V和125μF的电穿孔导致siRNA的最好保留并且用于所有的后续实验。

  阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)向正常C57BL/6小鼠给予被包封在150μg的RVG外泌体中的150μg的每种BACE1siRNA并且将敲低效率与四个对照进行比较:未处理的小鼠、仅仅用RVG外泌体注射的小鼠,用与一种体内阳离子脂质体试剂络合的BACE1siRNA注射的小鼠、以及用与RVG-9R络合的BACE1siRNA注射的小鼠,该RVG肽与静电结合到siRNA上的9个D-精氨酸缀合。在给药之后3天,分析皮层组织样品,并且在siRNA-RVG-9R处理的和siRNARVG外泌体处理的小鼠中均观察到显著的蛋白质敲低(45%,P<0.05,相对于62%,P<0.01),这是由于显著的BACE1mRNA水平降低(分别为66%[+或-]15%,P<0.001以及61%[+或-]13%,P<0.01)。而且,申请人证明了在RVG-外泌体处理的动物中在总[β]-淀粉样蛋白1-42水平上的显著降低(55%,P<0.05),其中β淀粉样蛋白为一种在阿尔茨海默病理学中的淀粉样斑块的主要成分。所观察到的降低大于在心室内注射BACE1抑制剂之后的正常小鼠中证明的β淀粉样蛋白1-40降低。阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)在BACE1切割产物上进行了5'-cDNA末端快速扩增(RACE),其提供了经由siRNA的RNAi介导的敲低的证据。

  最后,阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人通过评定IL-6、IP-10、TNFα和IFN-α血清浓度研究了siRNA-RVG外泌体是否诱导了体内免疫反应。在siRNA-RVG外泌体处理之后,类似于与有力地刺激IL-6分泌的siRNA-RVG-9R相反的siRNA转染试剂处理,登记了在所有细胞因子上的非显著性变化,证实了该外泌体处理的免疫惰性属性。假定外泌体仅仅封装20%的siRNA,用RVG-外泌体递送比RVG-9R递送显得更有效,因为用少五倍的siRNA实现了相当的mRNA敲低和更好的蛋白质敲低,而没有相应水平的免疫刺激。这个实验证明了RVG-外泌体技术的治疗潜力,其潜在地适合于与神经退行性疾病相关的基因的长期沉默。阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人的外泌体递送系统可以用于将本发明的CRISPR-Cas系统递送至治疗靶标,尤其是神经退行性疾病。对于本发明可以考虑封装在约100到1000mg的RVG外泌体中的约100到1000mg的CRISPR Cas的剂量。

  艾尔·安达卢西(El-Andaloussi)等人(《自然-实验手册》(Nature Protocols)7,2112-2126(2012))披露了可以如何利用来源于培养的细胞的外泌体用于体外和体内递送siRNA。这个方案首先描述了通过转染一种包含与肽配体融合的外泌体蛋白的表达载体的靶向外泌体的产生。其次,艾尔·安达卢西(El-Andaloussi)等人解释了如何纯化和表征来自转染的细胞上清液的外泌体。接着,艾尔·安达卢西(El-Andaloussi)等人详述了将siRNA加载到外泌体中的关键步骤。最后,艾尔·安达卢西(El-Andaloussi)等人概述了如何使用外泌体有效体外递送siRNA以及体内递送到小鼠脑中。还提供了预期结果的实例,其中外泌体介导的siRNA递送通过功能分析和成像而评估。整个方案进行约3周。根据本发明的递送或给药可以使用从自我衍生的树突细胞产生的外泌体来进行。

  在另一个实施例中,考虑了瓦尔格伦(Wahlgren)等人的血浆外泌体(《核酸研究》(Nucleic Acids Research),2012年,第40卷,第17期,e130)。外泌体是由包括树突细胞(DC)、B细胞、T细胞、肥大细胞、上皮细胞和肿瘤细胞在内的许多细胞类型产生的纳米囊泡(30-90nm大小)。这些囊泡通过晚期核内体的向内出芽而形成,并且然后在与质膜融合后释放到细胞外环境中。由于外泌体天然地在细胞之间运送RNA,这种特性在基因治疗中可能有用。

  来自血浆的外泌体通过如下制备:在900g离心血沉棕黄层持续20分钟以便分离血浆,之后收获细胞上清液,在300g离心10分钟以便去除细胞,并且在16 500g离心30分钟,之后通过0.22mm过滤器进行过滤。通过在120 000g离心70分钟使外泌体沉淀。根据在RNAi人/小鼠启动试剂盒(Quiagen,希尔顿(Hilden),德国)中的制造商的说明进行siRNA到外泌体中的化学转染。siRNA以终浓度2mmol/ml添加到100ml PBS中。在加入HiPerFect转染试剂之后,将该混合物在室温下孵育10分钟。为了去除过量的胶束,使用醛/硫酸盐乳胶珠再分离外泌体。可以类似于siRNA进行CRISPR Cas到外泌体中的化学转染。外泌体可以与从健康供体的外周血中分离的单核细胞和淋巴细胞共培养。因此,可以考虑的是,可以将含有CRISPR Cas的外泌体引入人单核细胞和淋巴细胞中并且以自体方式再引入。因此,可以使用血浆外泌体进行根据本发明的递送或给药。

  脂质体

  可以用脂质体进行根据本发明的递送或给药。脂质体是球形囊泡结构,其组成为围绕内部水性区室的单层或多层脂质双层以及相对不可渗透的外部亲脂性磷脂双层。脂质体作为药物递送载体受到了相当的重视,因为它们是生物相容、无毒的,可以递送亲水和亲脂性药物分子,包护它们的负荷物免于被血浆酶降解,并且运送它们的负荷跨过生物膜和血脑屏障(BBB)(对于评述,参见,例如,斯普奇(Spuch)和纳瓦罗(Navarro)《药物递送杂志》(Journal of Drug Delivery),2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。

  可以从几种不同类型的脂质制造脂质体;然而,磷脂最常用来产生作为药物载体的脂质体。虽然当脂质膜与一种水性溶液混合时脂质体形成是自发的,但也可通过使用一个均质机、超声发生器、或挤出设备以振摇的形式施加力使其加速(对于评述,参见,例如,斯普奇(Spuch)和纳瓦罗(Navarro)《药物递送杂志》(Journal of Drug Delivery),2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。

  可以将几种其他的添加剂添加到脂质体,以便修饰其结构和特性。例如,可以将胆固醇或鞘磷脂添加到脂质体混合物中,以便帮助稳定脂质体结构并且防止脂质体内部负荷物的泄漏。此外,从氢化卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇、和磷酸二鲸蜡脂制备脂质体,并且脂质体的平均囊泡大小被调整到约50至100nm。(对于评述,参见,例如,斯普奇(Spuch)和纳瓦罗(Navarro)《药物递送杂志》(Journal of Drug Delivery),2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。

  常规的脂质体配制品主要由天然磷脂和脂质如1,2-二硬脂酰-sn-甘油基-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷酯构成。由于这种配制品仅仅由磷脂组成,脂质体配制品已经遇到了许多挑战,其中之一是在血浆中的不稳定性。已经作出战胜这些挑战的若干尝试,特别是在脂质膜的处理方面。这些尝试之一集中于胆固醇的处理。将胆固醇添加到常规配制品中减缓了封装的生物活性化合物到血浆中的迅速释放,或者添加1,2-二油酰基-sn-甘油基-3-磷酸乙醇胺(DOPE)增加稳定性(对于评述,参见,例如,斯普奇(Spuch)和纳瓦罗(Navarro)《药物递送杂志》(Journal of Drug Delivery),2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。

  在一个特别有利的实施例中,特洛伊木马(Trojan Horse)脂质体(也称为分子木马)是令人希望的并且方案可见于http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long。这些粒子允许转基因在血管内注射之后递送到整个脑。不受到限制,表面结合有特异性抗体的中性脂质粒子允许经由胞吞作用跨过血脑屏障。申请人假定利用特洛伊木马脂质体将核酸酶的CRISPR家族经由血管内注射递送到脑,这将允许全脑转基因动物,而不需要胚胎操作。对于在脂质体中的体内给药,可以考虑约1-5g的核酸分子,例如DNA、RNA。

  在另一个实施例中,该CRISPR Cas系统可以在脂质体中给药,如一种稳定的核酸-脂质粒子(SNALP)(参见,例如,莫里西(Morrissey)等人,《自然生物技术》(Nature Biotechnology),第23卷,第8期,2005年8月)。考虑了约1、3或5mg/kg/天的靶向SNALP中的特异性CRISPR Cas的每日静脉注射。日治疗可以经过约三天,然后每周治疗持续约五周。在另一个实施例中,还考虑了通过以约1或2.5mg/kg的剂量静脉注射给药的封装有特异性CRISPR Cas的SNALP(参见,例如,齐默尔曼(Zimmerman)等人,《自然通讯》(Nature Letters),第441卷,2006年5月4日)。该SNALP配制品可含有以2:40:10:48的摩尔百分比的脂质3-N-[(w甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基-丙胺(PEG-C-DMA)、1,2-二亚油基氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二硬脂酰-sn-甘油基-3-磷酸胆碱(DSPC)和胆固醇,(参见,例如,齐默尔曼(Zimmerman)等人,《自然通讯》(Nature Letters),第441卷,2006年5月4日)。

  在另一个实施例中,已经证明稳定的核酸-脂质粒子(SNALP)将分子有效递送到高度血管化的HepG2-衍生的肝脏肿瘤,但是不递送到血管化不良的HCT-116衍生的肝脏肿瘤(参见,例如,李(Li),《基因治疗》(Gene Therapy)(2012)19,775-780)。可以通过如下制备这些SNALP脂质体:使用25:1的脂质/siRNA比率和48/40/10/2的胆固醇/D-Lin-DMA/DSPC/PEG-C-DMA的摩尔比,用二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和siRNA配制D-Lin-DMA和PEG-C-DMA。生成的SNALP脂质体在大小上为约80-100nm。

  在又另一个实施例中,SNALP可以包含合成胆固醇(西格玛-奥德里奇公司(Sigma-Aldrich),圣路易斯,密苏里州,美国)、二棕榈酰磷脂酰胆碱(Avanti Polar Lipids公司,阿拉巴斯特(Alabaster),阿拉巴马州,美国)、3-N-[(w-甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基丙基胺、和阳离子的1,2-二亚油基氧基-3-N,N二甲基氨基丙烷(参见,例如,盖斯伯特(Geisbert)等人,《柳叶刀》(Lancet)2010;375:1896-905)。例如可以考虑静脉推注给予约2mg/kg总CRISPR Cas/剂的剂量。

  在又另一个实施例中,SNALP可以包含合成胆固醇(西格玛-奥德里奇公司(Sigma-Aldrich))、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(DSPC;Avanti Polar Lipids公司)、PEG-cDMA、和1,2-二亚油基氧基-3-(N;N-二甲基)氨基丙烷(DLinDMA)(参见,例如,贾奇(Judge),《临床研究杂志》(J.Clin.Invest.)119:661-673(2009))。用于体内研究的配制品可包含约9:1的最终脂质/RNA质量比。

  已经由阿尔尼拉姆制药公司(Alnylam Pharmaceuticals)的巴洛斯(Barros)和格罗布(Gollob)评论了RNAi纳米药物的安全性(参见,例如,《先进药物递送评论》(Advanced Drug Delivery Reviews)64(2012)1730-1737)。稳定的核酸脂质粒子(SNALP)由四种不同的脂质构成-一种在低pH时为阳离子的可电离脂质(DLinDMA)、一种中性辅助脂质、胆固醇、和一种可扩散的聚乙二醇(PEG)-脂质。该粒子直径大约为80nm并且在生理pH时是电中性的。在配制过程中,该可电离脂质用于在粒子形成过程中使脂质与阴离子siRNA缩合。当在渐增的酸性内体条件下带正电荷时,该可电离的脂质还介导了SNALP与内体膜的融合,从而使得能够将siRNA释放到细胞质中。该PEG-脂质在配制过程中使该粒子稳定并且减少聚集,随后提供中性的亲水性外部,以改进药代动力学特性。

  到目前为止,已经使用SNALPsiRNA配制品开始两个临床项目。Tekmira制药公司最近完成了SNALP-ApoB在具有增高的LDL胆固醇的成年志愿者中的I期单剂量研究。ApoB主要在肝脏和空肠中表达,并且对于VLDL和LDL的组装和分泌是必需的。ApoB也被我们的CrISPR-Cas系统成功靶向,参见实例38-39。十七位受试者接受了SNALP-ApoB的单剂量(跨7个剂量水平的剂量递增)。没有肝脏毒性(预期为基于临床前研究的潜在剂量限制性毒性)的证据。处于最高剂量的(两位中的)一位受试者经历了与免疫系统刺激一致的流感样症状,于是做出结束该试验的决定。

  阿尔尼拉姆制药公司(Alnylam Pharmaceuticals)已经类似地推出了ALN-TTR01,其采用上述SNALP技术并且靶向突变体和野生型TTR的肝细胞产生,从而治疗TTR淀粉样变性(ATTR)。已经描述了三个ATTR综合征:家族性淀粉样多发性神经病变(FAP)和家族性淀粉样心肌病(FAC)-两者均由TTR中的常染色体显性突变引起;以及由野生型TTR引起的老年全身性淀粉样变性(SSA)。最近在具有ATTR的患者中完成了ALN-TTR01的安慰剂对照单剂量递增I期试验。向31位患者(23位用研究药物,8位用安慰剂)在0.01到1.0mg/kg(基于siRNA)的剂量范围内以15分钟静脉内输注给予ALN-TTR01。治疗耐受良好,其中在肝功能试验中没有显著增加。在≥0.4mg/kg时在23位患者的3位中注意到输注相关反应;对所有患者均做出减慢输注速率的反应并且所有患者继续参与研究。在处于1mg/kg的最高剂量(如根据临床前和NHP研究预期的)的两位患者中注意到血清细胞因子IL-6、IP-10和IL-1ra的最小与瞬时升高。在1mg/kg时观察到ALN-TTR01的预期药理效应,即,血清TTR的降低。

  在又另一个实施例中,可以通过将阳离子脂质、DSPC、胆固醇以及PEG-脂质以40:10:40:10的摩尔比分别溶解在乙醇中来制作SNALP(参见,森普尔(Semple)等人,《自然生物技术》(Nature Niotechnology),第28卷,第2期,2010年2月,第172-177页)。将该脂质混合物添加到水性缓冲液中(50mM柠檬酸盐,pH 4),混合至最终的乙醇和脂质浓度分别为30%(vol/vol)和6.1mg/ml,允许在22℃平衡2分钟,然后挤出。使用Lipex挤出仪(北方脂质公司(Northern Lipids)),在22℃将水合脂质通过两层80nm孔径大小的过滤器(Nuclepore)直到获得70-90nm直径的囊泡时为止,正如通过动态光散射分析测定的。这大致需要1-3次通过。将该siRNA(溶解在50mM柠檬酸盐中,pH为4的含有30%乙醇的水溶液)以约5ml/min的速率在混合下添加到预平衡的(35℃)囊泡中。在达到0.06(wt/wt)的最终靶siRNA/脂质比率之后,将该混合物在35℃另外孵育30分钟,以允许囊泡重组和该siRNA的封装。然后去除乙醇并且通过透析或切向流渗滤用PBS(155mM NaCl、3mM Na2HPO4、1mM KH2PO4,pH 7.5)替换外部缓冲液。使用控制的逐步稀释法工艺将siRNA封装在SNALP中。KC2-SNALP的脂质组分为以57.1:7.1:34.3:1.4的摩尔比使用的DLin-KC2-DMA(阳离子脂质)、二棕榈酰磷脂酰胆碱(DPPC;Avanti Polar Lipids公司)、合成胆固醇(西格玛公司)和PEG-C-DMA。在形成加载的粒子后,将SNALP在PBS中透析并且在使用之前通过0.2μm的滤膜消毒过滤。平均粒径为75-85nm,并且将90%-95%的siRNA封装在脂质粒子内。用于体内测试的在配制品中的最终siRNA/脂质比率是大约0.15(wt/wt)。在使用之前即刻将含有因子VII siRNA的LNP-siRNA系统在无菌PBS中稀释到适当浓度,并且通过侧尾静脉以10ml/kg的总体积静脉内给药。这种方法可以类推到本发明的CRISPR Cas系统。

  其他脂质

  其他阳离子脂质,如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)可以类似于SiRNA地用来封装CRISPR Cas(参见,例如,加雅拉曼(Jayaraman),《德国应用化学》(Angew.Chem.Int.Ed.)2012,51,8529-8533)。可以考虑具有下列脂质组成的预成型囊泡:分别处于摩尔比40/10/40/10的氨基脂质、二硬脂酰卵磷脂(DSPC)、胆固醇和(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基碳酸酯(PEG-脂质),以及大约0.05(w/w)的FVII siRNA/总脂质比率。为了确保在70-90nm范围内的窄粒径分布以及0.11_0.04(n=56)的低多分散性指数,可以在添加CRISPR Cas RNA之前将粒子通过80nm的膜挤出达三次。可以使用含有高度有效的氨基脂质16的粒子,其中四种脂质组分16、DSPC、胆固醇和PEG-脂质的摩尔比(50/10/38.5/1.5)可以被进一步优化,以增强体内活性。

  迈克尔S D科尔曼(Michael S D Kormann)等人(“在小鼠中递送化学修饰的mRNA之后治疗蛋白的表达”("Expression of therapeutic proteins after delivery of chemically modified mRNA in mice):《自然生物技术》(Nature Biotechnology),第29卷,第154-157页,(2011)2011年1月9日在线公开)描述了脂质包膜用于递送RNA的用途。脂质包膜的用途在本发明中也是优选的。

  在另一个实施例中,脂质可以与本发明的CRISPR Cas系统配制在一起而形成脂质纳米粒子(LNP)。脂质包括但不限于,DLin-KC2-DMA4、C12-200和辅助脂质二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG,可以使用自发囊泡形成程序将其与CRISPR Cas而不是siRNA一起配制(参见,例如,Novobrantseva,《分子治疗-核酸》(Molecular Therapy-Nucleic Acids)(2012)1,e4;doi:10.1038/mtna.2011.3)。组分摩尔比可以是约50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇/PEG-DMG)。在DLin-KC2-DMA和C12-200脂质纳米粒子(LNP)的情况下,最终脂质:siRNA重量比可以分别是约12:1和9:1。配制品可以具有约80nm的平均粒径,具有>90%的包覆效率。可以考虑3mg/kg的剂量。

  Tekmira公司在美国和国外具有一组针对LNP和LNP配制品的不同方面的大约95个同族专利(参见,例如,美国专利号7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;7,745,651;7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658以及欧洲专利号1766035;1519714;1781593和1664316),所有这些专利均可用于和/或适用于本发明。

  该CRISPR Cas系统可以封装在PLGA微球中进行递送,例如进一步描述于美国公开申请20130252281和20130245107以及20130244279(转让给Moderna Therapeutics公司)中,其涉及包含修饰的核酸分子的组合物的配制品方面,所述核酸分子可以编码一种蛋白质、一种蛋白质前体、或该蛋白质或蛋白质前体的部分或完全加工形式。该配制品具有50:10:38.5:1.5-3.0(阳离子脂质:融合脂质:胆固醇:PEG脂质)的摩尔比。该PEG脂质可以选自,但不限于PEG-c-DOMG、PEG-DMG。该融合脂质可以是DSPC。还参见,施鲁姆(Schrum)等人,“工程化核酸的递送和配制”(Delivery and Formulation of Engineered Nucleic Acids),美国公开申请20120251618。

  Nanomerics公司的技术着手解决针对广泛治疗学的生物利用度挑战,包括基于低分子量疏水药物、肽以及核酸(质粒、siRNA、miRNA)的治疗学。该技术已经证明了明显优势的特异性的给药途径包括口服途径、跨血脑屏障的运送、向实体瘤以及眼部的递送。参见,例如,马萨(Mazza)等人,2013,《ACS纳米》(ACS Nano.)2013年2月26日;7(2):1016-26;乌切克布(Uchegbu)和秀(Siew),2013,《制药科学杂志》(J Pharm Sci.)102(2):305-10和拉拉特萨(Lalatsa)等人,2012,《控释杂志》(J Control Release),2012年7月20日;161(2):523-36。

  美国专利公开号20050019923描述了用于向哺乳动物身体递送生物活性分子例如多核苷酸分子、肽和多肽和/或药剂的阳离子树状聚合物。这些树状聚合物适合于将生物活性分子的递送靶向到例如肝、脾、肺、肾或心脏。树状聚合物是从简单的支化单体单元以逐步方式制备的3维大分子,其性质和功能性可以容易地进行控制和改变。经由向多功能核(发散式合成法)或朝向多功能核(收敛式合成法)重复加成结构单元(building blocks)而合成树状聚合物,并且结构单元的3维壳的各次加成导致更高级别的树状聚合物的形成。聚丙烯亚胺树状聚合物从二氨基丁烷核开始,通过对伯胺的丙烯腈的双迈克尔加成反应向其上添加两倍数目的氨基基团,继之为腈的氢化。这导致氨基基团的加倍。聚丙烯亚胺树状聚合物含有100%的可质子化氮以及高达64个末端氨基基团(5级,DAB 64)。可质子化基团常常为能够在中性pH时接受质子的胺基。树状聚合物作为基因递送剂的用途在很大程度上集中于聚酰胺-胺和含磷化合物的用途,其中胺/酰胺的混合物或N--P(O2)S分别作为缀合单元,没有报道关于更低级别的聚丙烯亚胺树状聚合物用于基因递送的用途的工作。还研究了作为pH敏感的控制释放系统的聚丙烯亚胺树状聚合物,其用于药物递送以及当被外周氨基酸基团化学修饰时用于它们的客体分子的封装。还研究了聚丙烯亚胺树状聚合物的细胞毒性和与DNA的相互作用以及DAB 64的转染效力。

  美国专利公开号20050019923是基于与早期报道相反的观察:阳离子树状聚合物例如聚丙烯亚胺树状聚合物展示出适当的特性,如,特异性靶向和低毒性,其用于在生物活性分子如基因材料的靶向递送中使用。另外,阳离子树状聚合物的衍生物也展示出适当的用于生物活性分子的靶向递送的特性。还参见,《生物活性聚合物》(Bioactive Polymers)、美国公开申请20080267903,其披露了不同的聚合物,包括阳离子聚胺聚合物和树枝状聚合物,其显示具有抗增殖活性,并且因此可用于治疗其特征为不希望的细胞增殖的失调,如新生物和肿瘤、炎性失调(包括自身免疫性失调)、银屑病和动脉粥样硬化。这些聚合物可以作为活性剂单独使用、或者作为其他治疗剂(如药物分子或用于基因治疗的核酸)的递送载体。在这样的情况下,这些聚合物自身固有的抗肿瘤活性可以补足有待递送的药剂的活性。

  超电荷蛋白

  超电荷蛋白是一类具有非常高的正或负的理论净电荷的工程化的或天然存在的蛋白质。超负电荷蛋白和超正电荷蛋白两者都展示出显著的抵抗热诱导或化学诱导的聚集的能力。超正电荷蛋白还能够渗透哺乳动物细胞。使负荷物与这些蛋白质结合,如质粒DNA、siRNA、或其他蛋白质,可使得这些大分子到体外和体内的哺乳动物细胞中的功能递送成为可能。刘大卫实验室(David Liu’s lab)在2007年报道了超电荷蛋白的建立和表征(劳伦斯(Lawrence)等人,2007,《美国化学会志》(Journal of the American Chemical Society)129,10110-10112)。

  siRNA和质粒DNA到哺乳动物细胞中的非病毒递送对于研究和治疗应用都是有价值的(阿肯克(Akinc)等人,2010,《自然生物技术》(Nat.Biotech.)26,561-569)。纯化的+36GFP蛋白(或其他超正电荷蛋白)与siRNA在适当的无血清培养基中混合并且允许在添加到细胞中之前复合。在这个阶段的血清的包含将会抑制超电荷蛋白-siRNA复合物的形成和降低治疗效果。已经发现以下方案对于多种细胞系是有效的(麦克诺顿(McNaughton)等人,2009,《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)106,6111-6116)。然而,应当进行改变蛋白质和siRNA剂量的先导实验来优化用于特异性细胞系的程序。

  (1)在治疗前一天,以1x105个细胞/孔铺板于48孔板中。

  (2)在治疗当天,在无血清的培养基中稀释纯化的+36GFP蛋白直到终浓度200nM。添加siRNA到50nM的终浓度。涡旋混合并且在室温孵育10分钟。

  (3)在孵育过程中,抽吸培养基离开细胞并且再次用PBS洗涤。

  (4)在孵育+36GFP和siRNA之后,向细胞加入蛋白质-siRNA复合物。

  (5)将细胞与复合物在37℃孵育4小时。

  (6)在孵育之后,抽出培养基并且用20U/mL的肝素PBS洗涤三次。用含血清培养基另外孵育细胞48小时或更长,这取决于用于敲低的试验。

  (7)通过免疫印迹、qPCR、表型分析、或其他适当的方法分析细胞。

  已经发现+36GFP在一系列细胞中是一种有效的质粒递送试剂。由于质粒DNA是一种比siRNA大的负荷物,有效复合质粒需要成比例地更大的+36GFP蛋白。为了有效质粒递送,申请人已经开发了一种带有C末端HA2肽标签的+36GFP变体,这种肽是一种已知的从流感病毒血凝素蛋白衍生的内体破坏肽。下列方案在多种细胞中是有效的,但是如上所述,建议针对特异性细胞系和递送应用优化质粒DNA的超电荷蛋白的剂量。

  (1)在治疗前一天,以1x105/孔铺板于48孔板中。

  (2)在治疗当天,在无血清的培养基中稀释纯化的蛋白直到终浓度2mM。加入1mg的质粒DNA。涡旋混合并且在室温孵育10分钟。

  (3)在孵育过程中,抽吸培养基离开细胞并且再次用PBS洗涤。

  (4)在孵育和质粒DNA之后,向细胞轻轻加入蛋白质-DNA复合物。

  (5)将细胞与复合物在37℃孵育4小时。

  (6)在孵育之后,抽出培养基并且用PBS洗涤。在含血清培养基中孵育细胞,并且另外孵育24-48小时。

  (7)在适当时分析质粒递送(例如,通过质粒驱动的基因表达)。

  还参见,例如,麦克诺顿(McNaughton)等人,《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)106,6111-6116(2009);克罗尼肯(Cronican)等人,《ACS化学生物学》(ACS Chemical Biology)5,747-752(2010);克罗尼肯(Cronican)等人,《化学与生物学》(Chemistry&Biology)18,833-838(2011);汤普森(Thompson)等人,《酶学方法》(Methods in Enzymology)503,293-319(2012);汤普森(Thompson)D.B.,等人,《化学与生物学》(Chemistry&Biology)19(7),831-843(2012)。超电荷蛋白的这些方法可以使用和/或适用于本发明的CRISPR Cas系统的递送。

  细胞穿透肽

  在又另一个实施例中,考虑了细胞穿透肽(CPP)用于递送CRISPR Cas系统。CPP是短肽,其促进细胞吸收不同分子负荷物(从纳米级粒子到小化学分子和DNA的大片段)。如在此使用的术语“负荷物”包括但不限于下组,该组由以下各项组成:治疗剂、诊断探针、肽、核酸、反义寡核苷酸、质粒、蛋白质、纳米粒子、脂质体、发色团、小分子和放射性物质。在本发明的多个方面,该负荷物还可包括CRISPR Cas系统的任何组分或整个功能性CRISPR Cas系统。本发明的多个方面进一步提供了用于将希望的负荷物递送到受试者体内的方法,这些方法包括:(a)制备一种复合物,其包含本发明的细胞穿透肽以及希望的负荷物,并且(b)经口服、关节内、腹膜内、鞘内、动脉内(intrarterially)、鼻内、实质内、皮下、肌内、静脉内、真皮、直肠内地、或局部给予该复合物至一位受试者。负荷物是通过化学键经由共价键或通过非共价相互作用与这些肽相关联。

  CPP的功能是将该负荷物递送进入细胞,这是一种通常通过内吞作用发生的过程,其中该负荷物被递送到活体哺乳动物细胞的内体。细胞穿透肽具有不同的大小、氨基酸序列、和电荷,但所有CPP具有一种不同的特征,该特征是转位质膜并协助将各种分子量的负荷物递送到细胞质或细胞器的能力。CPP转位可以分为三个主要的进入机制:直接渗透于膜中、内吞作用-介导的进入、和通过形成暂时性结构转位。CPP已经发现在治疗不同疾病中在药物(包括癌症和病毒抑制剂)中作为药物递送剂的许多应用、连同在用于细胞标记的造影剂中的许多应用。后者的实例包括充当用于GFP、MRI造影剂、或量子点的载体。CPP具有很大的作为用于研究和医学的体外和体内递送载体的潜力。CPP典型地具有一种氨基酸组合物,该氨基酸组合物包含高相对丰度的带负电荷的氨基酸,例如赖氨酸或精氨酸,或具有包含交替模式的极性/带电荷的氨基酸和非极性疏水性氨基酸的序列。这两种类型的结构分别称为聚阳离子或两亲性的。第三类CPP是仅含有非极性残基的疏水性肽,具有低净电荷或具有对于细胞摄入关键的疏水氨基酸基团。发现的初始CPP之一是来自人类免疫缺陷病毒1(HIV-1)的反式-激活转录激活因子(Tat),发现其高效地从周围介质被许多培养中的细胞类型摄取。从此以后,已知CPP的数目已经显著扩大,并且已经产生具有更有效蛋白转导特性的小分子合成类似物。CPP包括但不限于穿透素、Tat(48-60)、转运素(Transportan)、以及(R-AhX-R4)(Ahx=氨基己酰基)。

  如在美国专利8,372,951中所述的,提供了一种来源于嗜酸性粒细胞阳离子蛋白质(ECP)的CPP,它展示出高度细胞穿透效率和低毒性。还提供了将CPP与其内负荷物递送进脊椎动物受试者中的多个方面。CPP的其他方面及其递送描述于美国专利8,575,305;8,614,194和8,044,019中。

  可以采用CPP递送CRISPR-Cas系统,也被提供于原稿“通过细胞穿透肽介导的对Cas9蛋白和指导RNA的递送进行的基因破坏(Gene disruption by cell-penetrating peptide-mediated delivery of Cas9protein and guide RNA)”,苏雷什罗摩克里希纳(Suresh Ramakrishna),阿布-博恩塞拉夸库达迪(Abu-Bonsrah Kwaku Dad),贾格迪什博卢尔(Jagadish Beloor)等人,《基因组研究》(Genome Res.)2014年4月2日[电子出版先于印刷],通过引用以其全文结合,其中证实了用CPP-缀合的重组Cas9蛋白和CPP-复合的指导RNA进行治疗导致在人类细胞系中的内源基因破坏。在该论文中,Cas9蛋白经由硫醚键缀合至CPP,而指导RNA与CPP复合,形成形成缩合的、带负电荷的纳米粒子。已经显示,用修饰的Cas9和指导RNA同时和顺序地治疗人类细胞,包括胚胎干细胞、真皮成纤维细胞、HEK293T细胞、海拉(HeLa)细胞、和胚胎癌细胞,导致有效的基因破坏,伴随相对于质粒转染而言降低的脱靶突变。

  可植入装置

  在另一个实施例中,还考虑了用于CRISPR Cas系统的递送的可植入装置。例如,美国专利公开20110195123披露了一种可植入医用装置,其局部地并且在延长的时期内洗脱药物,包括几种类型的这种装置、实施的治疗方式和植入方法。该装置包含聚合物基材,例如,用作装置主体的基质、以及药物,并且在一些情况下包含另外的支架材料,如金属或另外的聚合物,以及增强可见度和成像的材料。药物的选择是基于局部地并且在延长的时期内释放药物的优点,其中药物直接释放到患病区域的细胞外基质(ECM),所述患病区域如肿瘤、炎症、退化,或用于针对症状的目的,或者释放到受损的平滑肌细胞,或者用于预防。一种药物是基RNA干扰(RNAi)的基因沉默药物,包括但不限于siRNA、shRNA、或反义RNA/DNA、核酶和核苷类似物。因此,这个系统可以用于和/或适用于本发明的CRISPR Cas系统。在一些实施例中,植入方式为用于包括近距离放射疗法和针吸活组织检查在内的其他治疗的、当今开发和使用的现有植入程序。在这样的情况下,在本发明中描述的新植入物的尺寸类似于初始植入物。典型地在相同的治疗程序中植物很少的装置。

  正如在美国专利公开20110195123中所述,提供了一种药物递送可植入或可插入系统,包括适用于空腔例如腹腔和/或其中药物递送系统未被锚定或附接的任何其他类型的给药,其包含生物稳定的和/或可降解的和/或生物可吸收的聚合物基材,其可以例如任选地是一种基质。应当指出的是术语“插入”也包括植入。该药物递送系统优选地被实施为如美国专利公开20110195123中描述的“装填器(Loder)”。

  聚合物或多种聚合物是生物相容的,其结合一种药剂和/或多种药剂,使得药剂以控制的速率释放,其中该聚合物基材如基质的总体积,例如在一些实施例中是任选地并且优选地不大于容许达到该药剂的治疗水平的最大体积。作为一个非限制性实例,这样的体积优选在0.1m3至1000mm3的范围内,正如该药剂负荷的体积所要求的。该装填器任选地是更大的,例如当结合有一个其大小由功能性决定的装置时,例如而不限于,膝关节、宫内节育环或子宫颈环等等。

  在一些实施例中,该药物递送系统(用于递送该组合物)被设计为优选地采用可降解聚合物,其中主要释放机制是本体溶蚀(Bulk erosion);或者在一些实施例中,使用了不可降解的、或缓慢降解的聚合物,其中主要释放机制是扩散而不是本体溶蚀,使得外部部分用作一种膜,而其内部部分用作一种储药池,该储药池在一个延长的时期内(例如从约一周到约几个月)实际上不受环境的影响。还可以任选地使用具有不同释放机制的不同聚合物的组合。在总药物释放期的重要时段期间,在表面处的浓度梯度优选地被维持有效地恒定,并且因此扩散速率是有效地恒定的(称为“零模式”扩散)。关于术语“恒定”,它意指优选地维持在治疗效果的低阈值以上的扩散速率,但是可以仍然任选地具有初期突释的特征和/或波动,例如增加和降低到一定程度。该扩散速率优选地被如此维持一个延长的时期,并且它被考虑为相对于一定的水平是恒定的,以便优化治疗有效期,例如该有效沉默期。

  该药物递送系统任选地并且优选地被设计为保护基于核苷酸的治疗剂免于降解,而不论化学性质或由于受试者体内的酶和其他因素的攻击。

  如描述于美国专利公开20110195123中的该药物递送系统任选地与传感和/或激活器具相关联,这些器具通过激活和/或加速/减速的无创和/或微创方法在该装置的植入之时和/或之后被操作,例如任选地包括但不限于热力加热和冷却、激光束和超声波,包括聚焦超声和/或RF(射频)方法或装置。

  根据美国专利公开20110195123的以下实施例,用于局部递送的部位可以任选地包括其特征为高度异常的细胞增殖、受到抑制的细胞凋亡的靶部位,包括肿瘤、活动性和/或慢性炎症和感染,包括自身免疫性疾病状态、退化组织(包括肌肉和神经组织)、慢性疼痛、退行性部位,以及用于增强组织再生的骨折位置以及其他伤口位置,以及损伤的心肌、平滑肌和横纹肌。用于局部递送的部位还任选地可包括能够进行预防活动(包括怀孕)、预防感染和衰老的部位。

  用于植入该组合物的部位、或靶部位,优选地其特征为用于靶向局部递送的足够小的半径、面积和/或体积。例如,该靶部位任选地具有在从约0.1mm到约5cm范围内的直径。

  该靶部位的位置优选地针对最大治疗效力而选择。例如,该药物递送系统的组合物(任选地与如上所述的用于植入的装置一起)任选地并且优选地被植入在肿瘤环境或与之相关的血供之内或者附近。

  例如该组合物(任选地与该装置一起)任选地植入在胰脏、前列腺、乳房、肝脏之内或附近,通过乳头,在血管系统之内,等等。

  靶位置任选地选自下组,该组由以下各项组成(仅仅作为非限制性实例,因为任选地在身体内的任何部位可以适合于植入一个装填器):1.在退行性部位的脑,像在帕金森病或阿尔茨海默病中的基底神经节、白质和灰质;2.如在肌萎缩性脊髓侧索硬化症(ALS)的情况下的脊柱;3.预防HPV感染的子宫颈;4.活动性或慢性炎性关节;5.在银屑病情况下的真皮;6.用于止痛作用的交感神经部位和感觉神经部位;7.骨内植入;8.急性和慢性感染部位;9.阴道内;10.耳内--听觉系统、内耳的迷路、前庭系统;11.气管内;12.心内;冠状动脉、心外膜;13.膀胱;14.胆道系统;15.实质组织,包括且不限于肾脏、肝脏、脾脏;16.淋巴结;17.唾液腺;18.牙龈;19.关节内(进入关节);20.眼内;21.脑组织;22.脑室;23.空腔,包括腹腔(例如但不限于,卵巢癌);24.食管内以及25.直肠内。

  任选地,该系统(例如含有该组合物的装置)的插入与向在该靶部位和该部位附近的ECM注射材料有关,从而影响该靶部位和这个部位附近的ECM中的局部pH和/或温度和/或影响该药物的扩散和/或药物动力学的其他生物因素。

  任选地,根据一些实施例,所述药剂的释放可以与传感和/或激活器具相关联,这些器具通过激活和/或加速/减速的无创和/或微创方法和/或别的方法在插入之前和/或之时和/或之后被操作,所述方法包括激光束、放射、热力加热和冷却、和超声波,包括聚焦超声和/或RF(射频)方法或装置、以及化学激活剂。

  根据美国专利公开20110195123的其他实施例,该药物优选地包括基因沉默性生物RNAi药物,例如,对于局限性癌症情况,在乳房、胰脏、脑、肾脏、膀胱、肺、以及前列腺中,如下文所述。而且,除了siRNA之外的许多药物可适用于封装在装填器中,并且可以与本发明相关联,只要这样的药物可以被封装在装填器基材(例如像一种基质)中即可。这样的药物包括当今通过除了本发明之外的方法递送的经批准的药物,包括用于真菌感染的两性霉素B;例如用于骨髓炎中的抗生素;止痛剂,如麻醉药;例如在阿尔茨海默病或帕金森病中的抗退行性剂,在背痛的情况其在植入脊柱附近的一个装填器中。这样的系统可以用于和/或适用于递送本发明的CRISPR Cas系统。

  例如,对于特殊应用,如预防平滑肌细胞(在支架置放程序中受损并且因此而倾向增殖)的生长和再生长,该药物可以任选地是使平滑肌细胞沉默(包括H19沉默)的siRNA,或者为选自下组的药物,该组由以下各项组成:紫杉醇、雷帕霉素和雷帕霉素类似物。在这样的情况下,该装填器优选地是一种药物洗脱支架(DES),其以恒定速率延长释放,或者是一个与该支架关联的单独植入的专用装置。这都可以用于和/或适用于本发明的CRISPR Cas系统。

  作为特殊应用的另一个实例,神经肌肉退行性疾病由于异常基因表达而发生。沉默RNA的局部递送可以具有干扰这样的异常基因表达的治疗特性。包括小分子药物和大分子在内的抗凋亡、抗炎和抗退行性药物的局部递送也可以任选地是治疗性的。在这样的情况下,该装填器用于以恒定速率和/或通过单独植入的专用装置延长释放。这都可以用于和/或适用于本发明的CRISPR Cas系统。

  作为特殊应用的又另一个实例,用基因修饰剂治疗精神和认知障碍。用沉默RNA的基因敲低是一个治疗选项。向中枢神经系统部位局部递送基于核苷酸的药剂的装填器是对于精神和认知障碍的治疗选项,这些精神和认知障碍包括但不限于,精神病、双极性疾病、神经性障碍和行为疾病(behavioral maladies)。这些装填器也可以在特定脑部位进行植入时局部递送包括小分子药物和大分子的药物。这都可以用于和/或适用于本发明的CRISPR Cas系统。

  作为特殊应用的另一个实例,在局部部位的先天性和/或适应性免疫介质的沉默使得能够预防器官移植排斥。用植入到移植器官和/或植入部位的装填器局部递送沉默RNA和免疫调节试剂致使经由排斥性免疫细胞(如针对移植器官而被激活的CD8)的局部免疫抑制。这都可以用于和/或适用于本发明的CRISPR Cas系统。

  作为特殊应用的另一个实例,包括VEGF和血管生成素及其他在内的血管生长因子对于新血管形成是必需的。这些因子、肽、肽模拟物的局部递送或抑制它们的抑制物是一种重要的治疗模式;使阻遏物沉默以及用装填器局部递送刺激血管发生的这些因子、肽、大分子和小分子药物对于周围血管疾病、全身性血管疾病和心血管疾病是治疗性的。

  插入的方法,如植入,可以任选地已用于其他类型的组织植入和/或用于组织取样,任选地在这样的方法中没有修改,或者可替代地任选地仅仅具有非重点修改。这样的方法任选地包括但不限于,近距离放射治疗方法、活组织检查、用和/或不用超声的内窥镜检查如ERCP、进入脑组织的立体定向法、腹腔镜检查,包括用腹腔镜进入关节、腹腔器官、膀胱壁和体腔的植入。

  CRISPR酶mRNA和指导RNA

  也可以单独递送CRISPR酶mRNA和指导RNA。可以在该指导RNA在给出时间以待CRISPR酶表达之前递送CRISPR酶mRNA。可以在给予指导RNA之前1-12小时(优选约2-6小时)给予CRISPR酶mRNA。

  可替代地,可以一起给予CRISPR酶mRNA和指导RNA。有利地,可以在初始给予CRISPR酶mRNA+指导RNA之后1-12小时(优选约2-6小时)给予指导RNA的第二加强剂量。

  为了实现基因组修饰的最有效水平,另外给予CRISPR酶mRNA和/或指导RNA可以是有用的。

  为了将毒性和脱靶效应降低到最低限度,重要的是控制所递送的CRISPR酶mRNA和指导RNA的浓度。CRISPR酶mRNA和指导RNA的最佳浓度可以通过在细胞或动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组座位处的修饰的范围而确定。例如,对于靶向人类基因组的EMX1基因中的5’-GAGTCCGAGCAGAAGAAGAA-3’的指导序列,可以使用深度测序来评定在下列两个脱靶位点处的修饰水平,1:5’-GAGTCCTAGCAGGAGAAGAA-3’和2:5’-GAGTCTAAGCAGAAGAAGAA-3’。对于体内递送,应当选择产生最高的中靶修饰水平同时将脱靶修饰水平降低到最低限度的浓度。

  可替代地,为了将毒性水平和脱靶效应降低到最低限度,可以用一对靶向感兴趣部位的指导RNA来递送CRISPR酶切口酶mRNA(例如,具有D10A修饰的化脓链球菌Cas9)。这两个指导RNA需要如下间隔开。分别处于红色(单下划线)和蓝色(双下划线)的指导序列(这些实例是基于化脓链球菌Cas9需要的PAM)。

  该系统的进一步询问向申请人提供了5’突出端的证据(参见,例如,拉恩(Ran)等人,《细胞》(Cell)2013年9月12日;154(6):1380-9和2013年8月28日提交的美国临时专利申请序列号61/871,301)。申请人进一步鉴定了涉及当与两种指导RNA结合时通过Cas9切口酶突变体的有效切割的参数,并且这些参数包括但不限于该5’突出端的长度。在本发明的实施例中,该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中,该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对或1-34个碱基对。在本发明的其他优选方法中,该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生钝切口或3’突出端。在本发明的实施例中,该3’突出端具有至多150、100或25个碱基对,或至少15、10或1个碱基对。在优选的实施例中,该3’突出端具有1-100个碱基对。

  本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中,该基因产物是一种蛋白质。

  只有产生在这些指导序列(大于-8bp的偏移)之间具有小于8bp重叠的5’突出端的sgRNA对才能介导可检测的indel信息。重要的是,当与野生型Cas9配对时,在这些分析中使用的每个指导对于有效诱导indel是重要的,表明这些指导对的相对位置在预测双切割活性中是最重要的参数。

  由于Cas9n和Cas9H840A切割DNA的相对链,对于一个给定的sgRNA对而言,用Cas9H840A取代Cas9n会导致该突出端类型的倒转。例如,将产生具有Cas9n的5’突出端的一对sgRNA原则上会相反地产生相应的3’突出端。因此,导致具有Cas9n的3’突出端产生的sgRNA对可以与Cas9H840A一起使用,以产生一个5’突出端。出人意料地,申请人利用被设计为产生5’和3’突出端两者(偏移范围从-278到+58bp)的一组sgRNA对测试了Cas9H840A,但是不能观察indel信息。可能需要进一步的工作来鉴定用于sgRNA配对的必要的设计规则,以允许经由Cas9H840A进行双切割。

  肝脏,前蛋白转化酶枯草杆菌蛋白酶Kexin9(PCSK9)

  该数据显示表型转化。

  前蛋白转化酶枯草杆菌蛋白酶Kexin9(PCSK9)是枯草杆菌蛋白酶丝氨酸蛋白酶家族的一个成员。PCSK9主要由肝脏表达并且对于肝细胞LDL受体表达的下调是关键的。血浆中的LDL-C水平在获得PCSK9功能突变的人体中高度上升,这些人被归类为患有严重的高胆固醇血症。因此,PCSK9是针对CRISPR的有吸引力的靶标。可以将PCS9K靶向的CRISPR配制在脂质粒子中并且例如以约15、45、90、150、250和400μg/kg静脉内给予(参见,例如,可在网址:www.alnylam.com/capella/wp-content/uploads/2013/08/ALN-PCS02-001-Protocol-Lancet.pdf获得)。

  贝利(Bailey)等人的《分子医学杂志》(J Mol Med(Berl).1999年1月;77(1):244-9)披露了借助于离体体细胞基因治疗的胰岛素递送,其涉及从糖尿病患者移除非B细胞体细胞(例如成纤维细胞),并且将其进行体外遗传改变以产生和分泌胰岛素。这些细胞可在培养物中生长,并且将其作为胰岛素替代来源输回到供体。可以在植入之前评估以这种方式修饰的细胞,并且将储备原液冷冻保存。通过使用患者自身的细胞,该程序将避免免疫抑制的需要,并且克服了组织供应的问题,同时避免了细胞破坏的重现。离体体细胞基因治疗要求经得起多重转染并且服从受控增殖的、可取得的且稳健的细胞类型。与使用非B细胞体细胞相关联的特殊问题包括胰岛素原到胰岛素的加工、以及葡萄糖刺激的胰岛素原合成和调节性胰岛素释放的敏感性的赋予。使用成纤维细胞、垂体细胞、肾(COS)细胞和卵巢(CHO)细胞的初步研究表明,可能遇到这些挑战,并且离体体细胞基因治疗提供了针对胰岛素替代治疗的可行途径。贝利(Bailey)等人的系统可以使用和/或适用于递送到肝脏的本发明的CRISPR Cas系统。

  萨托(Sato)等人的方法(《自然生物技术》(Nature Biotechnology),第26卷,2008年4月第4期,第431-442页)可以适用于递送到肝脏的本发明的CRISPR Cas系统。萨托(Sato)等人发现,在具有另外的致死性二甲基亚硝胺诱导的肝硬化小鼠中,用荷siRNA的偶联维生素A的脂质体治疗以剂量依赖性方式和持续时间依赖性方式几乎完全解决了肝纤维化并且延长了存活期。含有摩尔比为4:3:3的作为阳离子脂质的O,O’-双十四酰-N-(a-三甲基铵基乙酰基)二乙醇胺氯化物(DC-6-14)、胆固醇和二油酰基磷脂酰乙醇胺的阳离子脂质体(Lipotrust)(其显示对于在含血清条件下的体外和体内基因递送具有高转染效率)购自(北海道系统科学株式会社(Hokkaido System Science))。使用冷冻干燥的空脂质体方法制造这些脂质体,并且通过在使用之前在涡旋之下将双蒸馏水(DDW)添加到该冻干的脂质混合物中配制为1mM的浓度(DC-16-4)。为了制备VA偶联的脂质体,通过在1.5ml的管中在25℃下将溶解在DMSO中的200nmol的维生素A(视黄醇,西格玛公司)与脂质体悬浮液(作为DC-16-4100nmol)混合。为了制备携带siRNAgp46的VA偶联的脂质体(VA-lip-siRNAgp46),在25℃搅拌下将siRNAgp46溶液(580pmol/ml,在DDW中)添加到该视黄醇偶联的脂质体溶液中。siRNA与DC-16-4的比率为1:11.5(mol/mol)并且siRNA与脂质体的比率(wt/wt)为1:1。使用微分区系统(VIVASPIN 2浓缩器30,000MWCO PES,VIVASCIENCE公司),将任何未被脂质体吸收的游离维生素A或siRNA从脂质体制剂中分离。将该脂质体悬浮液添加到过滤器并且在1,500g在25℃离心5分钟,进行3次。收集各个级分,并且将截留在过滤器中的物质用PBS复原,以实现所希望的用于体外或体内使用的剂量。每隔一天向大鼠给予0.75mg/kg siRNA,注射三次。通过将如萨托(Sato)等人所述的在脂质体中的约0.5到1mg/kg的CRISPR Cas RNA递送给人类,萨托(Sato)等人的系统可用于和/或适用于递送到肝脏的本发明的CRISPR Cas系统。

  针对用于递送siRNA到体外和体内肝细胞两者的载体,已被罗泽马(Rozema)等人命名为siRNA动态多聚缀合物(siRNA Dynamic PolyConjugates)的罗泽马(Rozema)等人的方法(PNAS,2007年8月7日,第104卷,第32期)也可应用于本发明。动态多聚缀合物技术的关键特征包括膜活性聚合物、可逆地掩蔽这种聚合物的活性直到它到达内体的酸性环境时为止的能力、以及使这种修饰的聚合物和它的siRNA负荷物在简单的低压静脉注射之后特异性靶向体内肝细胞的能力。通过使5’胺修饰的siRNA与1个重量当量(wt eq)的N-琥珀酰亚胺基-S-乙酰硫代乙酸酯(SATA)试剂(皮尔斯(Pierce)公司)和0.36wt eq的在水中的NaHCO3在4℃反应16h合成SATA修饰的siRNA。然后通过加入9倍体积的乙醇并且在80℃孵育2h使修饰的siRNA沉淀。将该沉淀重新悬浮在1X siRNA缓冲液中(Dharmacon公司)并且通过在260-nm波长处测量吸光度进行定量。通过添加1.5wt%SMPT(皮尔斯(Pierce)公司)修饰PBAVE(30mg/ml,在5mM TAPS中,pH 9)。在1小时的孵育之后,将0.8mg的SMPT-PBAVE添加到400μl的含有5mM TAPS的等渗葡萄糖溶液中(pH 9)。向此溶液中添加50μg的SATA修饰的siRNA。对于其中[PBAVE]是恒定的剂量反应实验,添加不同量的siRNA。然后将该混合物孵育16小时。然后向此溶液中加入5.6mg的Hepes游离碱,接着加入3.7mg的CDM-NAG与1.9mg的CDM-PEG的混合物。然后在注射之前将该溶液在室温下孵育至少1小时。从经由使用草酰氯产生的酰基氯合成CDM-PEG和CDM-NAG。向该酰基氯加入1.1摩尔当量的聚乙二醇单甲醚(平均分子量450)以产生CDM-PEG或(氨基乙氧基)乙氧基-2-(乙酰氨基)-2-脱氧-β-D-吡喃葡萄糖苷,从而产生CDM-NAG。通过使用反相HPLC以0.1%TFA水/乙腈梯度纯化终产物。向小鼠递送约25到50μg的siRNA。例如,通过设想用于递送到人类的约50到约200mg剂量的CRISPR Cas,罗泽马(Rozema)等人的系统可应用于递送到肝脏的本发明的CRISPR Cas系统。

  靶向缺失、治疗应用

  基因的靶向缺失是优选的。例子示例于实例18中。因此优选的是涉及胆固醇生物合成、脂肪酸生物合成、以及其他代谢障碍的基因,编码涉及淀粉样蛋白以及其他疾病的错误折叠蛋白的基因,导致细胞转化的癌基因,潜伏病毒基因,以及导致负显性疾病(dominant-negative disorder)、其他失调的基因。在这里作为示例,申请人提出使用病毒或纳米粒子递送系统向对其有需要的受试者或患者的肝脏、脑、眼、上皮、造血、或另一种组织进行CRISPR-Cas系统的基因递送,该受试者或患者具有代谢障碍、淀粉样变性、蛋白聚积相关疾病、由于基因突变和基因异位所致的细胞转化、基因突变的负显性作用、潜伏病毒感染、以及其他相关症状。

  CRISPR-Cas系统的治疗应用包括青光眼、淀粉样变性、和亨廷顿病。这些示例于实例20中,并且在其中描述的特征是单独地或以组合方式优选的。

  可以通过本发明治疗的多聚谷氨酰胺扩增疾病(polyglutamine expansion disease)的另一个实例包括脊髓小脑共济失调1型(SCA1)。在小脑内注射后,表达短发夹RNA的重组腺相关病毒(AAV)载体深刻改进了动作协调、恢复了小脑形态并且溶解了在SCA1小鼠的浦肯野细胞中的特征性脊髓小脑失调症蛋白1包涵体(参见,例如,夏(Xia)等人,《自然医学》(Nature Medicine),第10卷,第8期,2004年8月)。具体地说,AAV1和AAV5载体是优选的,并且约1x1012个载体基因组/ml的AAV滴度是令人希望的。

  作为一个实例,可以治疗或预防由HIV-1引起的慢性感染。为了实现这个目标,可以产生靶向绝大多数HIV-1基因组的CRISPR-Cas指导RNA,同时考虑HIV-1株变体,以使覆盖面和效力最大。通过宿主免疫系统的常规腺病毒或慢病毒介导的感染,可以实现CRISPR-Cas系统的递送。取决于途径,宿主免疫细胞可以是a)分离的、用CRISPR-Cas转导的、选择的、并且重新引入该宿主中的或b)通过全身递送CRISPR-Cas系统体内转导的。第一种途径允许产生抗性免疫群体,而第二种更可能靶向宿主体内的潜伏病毒储库。这在实例部分中更详细地论述。

  在另一个实例中,转让给桑加莫生物科学公司(Sangamo BioSciences,Inc.)的美国专利公开号20130171732涉及抗HIV转基因到该基因组中的插入,其方法可应用于本发明的CRISPR Cas系统。在另一个实施例中,该CXCR4基因可以被靶向并且转让给桑加莫生物科学公司(Sangamo BioSciences,Inc.)的美国专利公开号20100291048的TALE系统可以被修饰为本发明的CRISPR Cas系统。转让给桑加莫生物科学公司(Sangamo BioSciences,Inc.)美国专利公开号20130137104和20130122591以转让给Cellectis公司的美国专利公开号20100146651的方法通常可应用于转基因表达,因为它涉及修饰用于增加基因修饰的频率的次黄嘌呤鸟嘌呤磷酸核糖转移酶(HPRT)座位。

  还可以设想的是,本发明产生一个基因敲除细胞文库。每个细胞可以有单基因被敲除。这被示例于实例23中。

  人们可以制作ES细胞的文库,其中每个细胞有单基因被敲除,并且ES细胞的整个文库将有每个单基因被敲除。此文库对于筛选细胞过程以及疾病的基因功能是有用的。为了制作这个细胞文库,人们可以将由诱导型启动子(例如,多西环素诱导型启动子)驱动的Cas9整合到ES细胞中。另外,人们可以将靶向特异性基因的单个指导RNA整合到ES细胞中。为了制作ES细胞文库,人们可以简单地将ES细胞与编码靶向人类基因组中的每个基因的指导RNA的基因的文库混合。人们可以首先将单个BxB1attB位点引入到人ES细胞的AAVS1座位中。然后可以使用BxB1整合酶来促进单独的指导RNA基因整合到AAVS1座位中的BxB1attB位点中。为了促进整合,每个指导RNA基因可以被包含在携带单个attP位点的质粒上。这样,BxB1将使基因组中的attB位点与含有指导RNA的质粒上的attP位点重组。为了生成该细胞文库,人们可以采用具有整合的单个指导RNA的细胞的文库,并且诱导Cas9表达。在诱导之后,Cas9介导由该指导RNA指定的位点处的双链断裂。

  蛋白质治疗剂的长期给药可以引出针对该特殊蛋白质的不可接受的免疫反应。蛋白质药物的免疫原性可以归因于少数免疫显性辅助性T淋巴细胞(HTL)表位。降低包含在这些蛋白质内的这些HTL表位的MHC结合亲和力可以产生具有更低免疫原性的药物(腾格里S(Tangri S)等人“具有降低免疫原性的合理工程化的治疗蛋白”(“Rationally engineered therapeutic proteins with reduced immunogenicity”《免疫学杂志》(J Immunol.)2005年3月15日;174(6):3187-96)。在本发明中,可以具体地遵循首先由腾格里(Tangri)等人针对促红细胞生成素提出并且随后开发的方法来降低该CRISPR酶的免疫原性。因此,定向演化或合理设计可以用来降低在宿主物种(人类或其他物种)中的CRISPR酶(例如Cas9)的免疫原性。

  在实例28中,申请人使用了3种感兴趣的指导RNA,并且这些指导RNA能够将仅仅发生在一个小的细胞亚群中的有效体内DNA切割可视化。实质上,申请人在此显示的是靶向的体内切割。具体地说,这提供了也可以在高级生物(如哺乳动物)中实现特异性靶向的概念证明。还强调的多元方面在于,可以同时使用多重指导序列(即,分开的靶标)(从共同递送的意义上说)。换言之,申请人使用了多重途径,其中几种不同的序列被同时而独立地靶向。

  适合的用于产生AAV(本发明的一种优选的载体)的方案的实例提供在实例34中。

  三核苷酸重复障碍是优选的有待治疗的病症。这些也示例于本文中。

  例如,美国专利公开号20110016540描述了使用锌指核酸酶基因修饰与三核苷酸重复扩增障碍相关的细胞、动物以及蛋白质。三核苷酸重复扩增障碍是复杂的、进行性的疾病,其涉及发育神经生物学并且常常影响认知以及感觉运动功能。

  三核苷酸重复扩增蛋白是一套多样化的蛋白质,这些蛋白质与发生三核苷酸重复扩增障碍的易感性、三核苷酸重复扩增障碍的存在、三核苷酸重复扩增障碍的严重性或其任何组合相关联。三核苷酸重复扩增障碍被分为由重复类型决定的两个类别。最常见的重复是三联体CAG,当出现在一个基因的编码区中时,其编码氨基酸谷氨酰胺(Q)。因此,这些障碍被称为多聚谷氨酰胺(polyQ)障碍并且包括下列疾病:亨廷顿病(HD);脊延髓肌萎缩症(SBMA);脊髓小脑性共济失调(SCA型1、2、3、6、7、和17);以及齿状核红核苍白球丘脑下部核萎缩(DRPLA)。其余的三核苷酸重复扩增障碍不涉及CAG三联体,或者该CAG三联体不在该基因的编码区中,并且因此被称为非多聚谷氨酰胺障碍。非多聚谷氨酰胺障碍包括脆性X综合征(FRAXA);脆性XE精神发育迟滞(FRAXE);弗里德赖希共济失调(FRDA);肌强直性营养不良(DM);和脊髓小脑性共济失调(SCA型8、和12)。

  与三核苷酸重复扩增障碍相关联的蛋白质典型地是基于三核苷酸重复扩增障碍相关性蛋白质与三核苷酸重复扩增障碍的实验性关联而选择的。例如,相对于没有三核苷酸重复扩增障碍的群体,在具有三核苷酸重复扩增障碍的群体中,与三核苷酸重复扩增障碍相关的蛋白质的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地,可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定与三核苷酸重复扩增障碍相关的蛋白质,包括但不限于DNA微阵列分析、基因表达系列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

  与三核苷酸重复扩增障碍相关联的蛋白质的非限制性实例包括AR(雄激素受体)、FMR1(脆性x精神发育迟滞1)、HTT(亨廷丁)、DMPK(肌强直性营养不良蛋白激酶)、FXN(线粒体型共济失调蛋白)、ATXN2(脊髓小脑共济失调蛋白2)、ATN1(萎缩蛋白1)、FEN1(片段结构特异内切核酸酶1)、TNRC6A(含有6A的三核苷酸重复)、PABPN1(多聚(A)结合蛋白,核1)、JPH3(亲联蛋白3)、MED15(介体复合物亚基15)、ATXN1(脊髓小脑共济失调蛋白1)、ATXN3(脊髓小脑共济失调蛋白3)、TBP(TATA盒结合蛋白)、CACNA1A(钙通道,电压依赖性,P/Q型、α1A亚基)、ATXN80S(ATXN8相反链(非蛋白质编码))、PPP2R2B(蛋白磷酸酶2,调节亚基B,β)、ATXN7(脊髓小脑共济失调蛋白7)、TNRC6B(含有6B的三核苷酸重复)、TNRC6C(含有6C的三核苷酸重复)、CELF3(CUGBP、Elav样家族成员3)、MAB21L1(mab-21-样1(秀丽隐杆线虫))、MSH2(MutS同源物2,结肠癌,无息肉病型1(大肠杆菌))、TMEM185A(跨膜蛋白185A)、SIX5(SIX同源框5)、CNPY3(冠层3同源物(斑马鱼))、FRAXE(脆性部位,叶酸型,罕见型,fra(X)(q28)E)、GNB2(鸟嘌呤核苷酸结合蛋白(G蛋白)、β多肽2)、RPL14(核糖体蛋白L14)、ATXN8(脊髓小脑共济失调蛋白8)、INSR(胰岛素受体)、TTR(转甲状腺素蛋白)、EP400(E1A结合蛋白p400)、GIGYF2(GRB10相互作用GYF蛋白2)、OGG1(8-氧鸟嘌呤DNA糖基化酶)、STC1(斯钙素1)、CNDP1(肌肽二肽酶1(金属肽酶M20家族))、C10orf2(染色体10开放阅读框2)、MAML3智者基因样3(果蝇)、DKC1(先天性角化不全症1,角化不良蛋白)、PAXIP1(PAX相互作用(具有转录激活域)蛋白1)、CASK(钙/钙调蛋白依赖性丝氨酸蛋白激酶(MAGUK家族)、MAPT(微管相关蛋白tau)、SP1(Sp1转录因子)、POLG(聚合酶(DNA指导的),γ)、AFF2(AF4/FMR2家族,成员2)、THBS1(凝血酶敏感蛋白1)、TP53(肿瘤蛋白p53)、ESR1(雌激素受体1)、CGGBP1(CGG三联体重复结合蛋白1)、ABT1(基本转录激活因子1)、KLK3(激肽释放酶相关肽酶3)、PRNP(朊病毒蛋白)、JUN(jun癌基因)、KCNN3(钾中间/小电导钙激活通道,亚家族N,成员3)、BAX(BCL2相关X蛋白)、FRAXA(脆性部位,叶酸型,罕见型,fra(X)(q27.3)A(巨睾丸,精神发育迟滞))、KBTBD10(Kelch重复和BTB(POZ)域包含蛋白10)、MBNL1(盲肌样(果蝇))、RAD51(RAD51同源物(RecA同源物,大肠杆菌)(酿酒酵母))、NCOA3(核受体共激活因子3)、ERDA1(扩展重复结构域,CAG/CTG 1)、TSC1(结节性硬化1)、COMP(软骨寡聚基质蛋白)、GCLC(谷氨酰半胱氨酸连接酶,催化亚基)、RRAD(Ras相关关联糖尿病)、MSH3(mutS同源物3(大肠杆菌))、DRD2(多巴胺受体D2)、CD44(CD44分子(印度血型))、CTCF(CCCTC结合因子(锌指蛋白))、CCND1(细胞周期蛋白D1)、CLSPN(扣蛋白同源物(非洲爪蟾))、MEF2A(肌细胞增强因子2A)、PTPRU(蛋白酪氨酸磷酸酶,受体型,U)、GAPDH(3-磷酸甘油醛脱氢酶)、TRIM22(三基序蛋白22)、WT1(维尔姆斯瘤1)、AHR(芳香烃受体)、GPX1(谷胱甘肽过氧化物酶1)、TPMT(硫嘌呤甲基转移酶)、NDP(诺里病(假神经胶质瘤))、ARX(无芒相关同源框)、MUS81(MUS81内切核酸酶同源物(酿酒酵母))、TYR(酪氨酸酶(眼皮肤白化病IA))、EGR1(早期生长反应蛋白1)、UNG(尿嘧啶DNA糖基化酶)、NUMBL(麻木同源物(果蝇)样)、FABP2(脂肪酸结合蛋白2,肠)、EN2(锯齿状同源框2)、CRYGC(晶状体蛋白,γC)、SRP14(信号识别粒子14kDa(同源Alu RNA结合蛋白))、CRYGB(晶状体蛋白,γB)、PDCD1(程序性细胞死亡1)、HOXA1(同源框A1)、ATXN2L(脊髓小脑共济失调蛋白2样)、PMS2(PMS2减数分裂后分离增加2样蛋白(酿酒酵母))、GLA(半乳糖苷酶,α)、CBL(Cas-Br-M(鼠)热带逆转录病毒转化序列)、FTH1(铁蛋白,重多肽1)、IL12RB2(白细胞介素12受体,β2)、OTX2(正小齿同源框2)、HOXA5(同源框A5)、POLG2(聚合酶(DNA指导的),γ2,辅助亚基)、DLX2(末端减少同源框2)、SIRPA(信号调节蛋白α)、OTX1(正小齿同源框1)、AHRR(芳香烃受体阻遏物)、MANF(中脑星形胶质细胞衍生神经营养因子)、TMEM158(跨膜蛋白158(基因/假基因))、以及ENSG00000078687。

  与三核苷酸重复扩增障碍相关联的优选蛋白质包括HTT(亨廷丁)、AR(雄激素受体)、FXN(线粒体型共济失调蛋白)、Atxn3(脊髓小脑共济失调蛋白)、Atxn1(脊髓小脑共济失调蛋白)、Atxn2(脊髓小脑共济失调蛋白)、Atxn7(脊髓小脑共济失调蛋白)、Atxn10(脊髓小脑共济失调蛋白)、DMPK(肌强直性营养不良蛋白激酶)、Atn1(萎缩蛋白1)、CBP(creb结合蛋白)、VLDLR(极低密度脂蛋白受体)、及其任何组合。

  根据另一个方面,提供了一种用于治疗具有在CFTR基因中的突变的受试者的基因治疗方法,并且该方法包括任选地经由一种生物相容性药用载体向受试者的细胞给予治疗有效量的CRISPR-Cas基因治疗粒子。优选地,该靶DNA包含突变δF508。通常,优选的是该突变被修复为野生型。在这种情况下,该突变是三个核苷酸的缺失,这些核苷酸包括在位置508处的针对苯丙氨酸(F)的密码子。因此,在这种情况下的修复要求将缺失密码子重新引入该突变体中。

  为了实施这个基因修复策略,优选的是将一个腺病毒/AAV载体系统引入该宿主细胞、多个细胞或患者中。优选地,该系统包含Cas9(或Cas9切口酶)和指导RNA连同腺病毒/AAV载体系统,其包含含有F508残基的同源性修复模板。这可以经由较早论述的递送方法之一引入受试者。该CRISPR-Cas系统可以由该CFTRδ508嵌合指导RNA指导。它靶向有待切割或切割的CFTR基因组座位的特定位点。在切割之后,将修复模板经由同源重组插入切割位点中,从而校正导致囊性纤维化或引起囊性纤维化相关症状的缺失。这种利用适当的指导RNA引导递送并提供CRISPR系统的系统性引入的策略可以用来靶向基因突变,以编辑或另外地操纵如那些在表B中的引起代谢障碍、肝脏、肾和蛋白质病和障碍的基因。

  基因组编辑

  本发明的CRISPR/Cas9系统可以用来校正基因突变,先前使用TALEN和ZFN尝试了这些突变,但是成功有限。例如,WO 2013163628A2,《突变基因的基因校正》(Genetic Correction of Mutated Genes),杜克大学的公开申请,描述了例如校正一种框移突变的努力,该框移突变引起提前终止密码子和可经由核酸酶介导的非同源末端连接进行校正的截短基因产物,该基因产物如引起迪谢内肌营养不良(“DMD”)的那些,迪谢内肌营养不良是一种隐性遗传的、致命的、X连锁疾病,其导致由于肌营养不良蛋白基因突变所致的肌肉变性。引起DMD的大多数肌营养不良蛋白突变是破坏该阅读框并且引起肌营养不良蛋白基因的提前翻译终止的外显子缺失。肌营养不良蛋白是一种细胞质蛋白,其提供负责调节肌细胞完整性和功能的细胞膜肌营养不良蛋白聚糖复合物的结构稳定性。如在此可互换地使用的肌营养不良蛋白基因或“DMD基因”是在座位Xp21处的2.2兆碱基。初级转录测量了约2,400kb,其中成熟mRNA为约14kb。79个外显子编码超过3500个氨基酸的蛋白质。在DMD患者中,外显子51常常接近破坏框的缺失并且已经在临床试验中被靶向基于寡核苷酸的外显子跳跃。对于外显子51跳跃化合物依替利森(eteplirsen)的临床试验最近报道了跨48周的显著功能益处,相比于基线具有47%的肌营养不良蛋白阳性纤维。外显子51的突变理想地适合于经由基于NHEJ的基因组编辑的持久校正。

  涉及从人类肌营养不良蛋白基因(DMD)切割靶序列的大范围核酸酶变体的转让给Cellectis公司的美国专利公开号20130145487的方法也可以针对本发明的CRISPR Cas系统进行修改。

  血液

  本发明还考虑了向血液递送该CRISPR-Cas系统。

  瓦尔格伦(Wahlgren)等人的血浆外泌体(《核酸研究》(Nucleic Acids Research),2012年,第40卷,第17期,e130)被较早描述并且利用为向血液递送该CRISPR Cas系统。

  还考虑本发明的CRISPR Cas系统用来治疗血红蛋白病,如地中海贫血和镰状细胞病。参见,例如,可以被本发明的CRISPR Cas系统靶向的潜在靶标的国际专利公开号WO 2013/126794。

  转让给Cellectis公司的美国专利公开号20110225664、20110091441、20100229252、20090271881和20090222937,涉及CREI变体,其中两个I-CreI单体的至少一个具有至少两个取代,一个在分别位于从I-CreI的位置26到40以及44到77的LAGLIDADG核心域的两个功能性亚结构域的每一个中,能够从人白细胞介素2受体γ链(IL2RG)基因切割DNA靶序列的所述变体也称为普通细胞因子受体γ链基因或γC基因。在美国专利公开号20110225664、20110091441、20100229252、20090271881和20090222937中鉴定的靶序列可以用于本发明的CRISPR Cas系统。

  由于在淋巴细胞T成熟方面的缺陷所致的严重联合免疫缺陷(SCID)总是与淋巴细胞B的功能缺陷相关联(卡瓦扎纳-卡尔沃(Cavazzana-Calvo)等人,《医学年鉴》(Annu.Rev.Med.),2005,56,585-602;费舍尔(Fischer)等人,《免疫学评论》(Immunol.Rev.),2005,203,98-109)。总发病率估计为每75000个出生人数有1个。患有未经治疗的SCID的患者遭受多重机会性微生物感染,并且通常不能活过一年。SCID可以通过同种异体造血干细胞(来自家族供体)转移进行治疗。对于供体而言的组织相容性可在很大程度上变化。在腺苷脱氨酶(ADA)缺陷的情况下,SCID之一形成,患者可以通过注射酶重组腺苷脱氨酶进行治疗。

  由于已经显示ADA基因在SCID患者中突变(吉布勒特(Giblett)等人,《柳叶刀》(Lancet),1972,2,1067-1069),已经鉴定了几种其他的涉及SCID的基因(卡瓦扎纳-卡尔沃(Cavazzana-Calvo)等人,《医学年鉴》(Annu.Rev.Med.),2005,56,585-602;费舍尔(Fischer)等人,《免疫学评论》(Immunol.Rev.),2005,203,98-109)。对于SCID有四种主要原因:(i)最常见的SCID形式,SCID-X1(X连锁的SCID或X-SCID),是由IL2RG基因的突变引起的,导致成熟T淋巴细胞和NK细胞的缺乏。IL2RG编码γC蛋白(野口(Noguchi)等人,《细胞》(Cell),1993,73,147-157),其为至少五种白细胞介素受体复合物的一种共有组分。这些受体通过JAK3激酶激活几种靶标(马基(Macchi)等人,《自然》(Nature),1995,377,65-68),其失活导致与γC失活相同的综合征;(ii)ADA基因的突变导致嘌呤代谢缺陷,这对于淋巴细胞前体是致命的,进而导致B、T和NK细胞的准缺乏;(iii)V(D)J重组在免疫球蛋白和T淋巴细胞受体(TCR)的成熟中是一个重要步骤。在涉及这个过程的三种基因重组活化基因1和2(RAG1和RAG2)以及阿蒂米斯(Artemis)中的突变导致成熟T和B淋巴细胞的缺乏;以及(iv)还报道了在涉及T细胞特异性信号传导的其他基因如CD45中的突变,虽然它们代表少数情形(卡瓦扎纳-卡尔沃(Cavazzana-Calvo)等人,《医学年鉴》(Annu.Rev.Med.),2005,56,585-602;费舍尔(Fischer)等人,《免疫学评论》(Immunol.Rev.),2005,203,98-109)。

  出于两个主要原因,自从它们的遗传基础已经鉴定以来,不同的SCID形式已经成为基因治疗方法的范例(费舍尔(Fischer)等人,《免疫学评论》(Immunol.Rev.),2005,203,98-109)。首先,是由于在所有血液疾病中可以设想离体治疗。造血干细胞(HSC)可以从骨髓恢复,并且在较少的细胞分裂中保持了它们的多能性。因此,可以将它们进行体外处理,然后重新注射到患者中,它们入驻骨髓中。其次,由于淋巴细胞的成熟在SCID患者中受损,经校正的细胞具有选择性优势。因此,少量的校正细胞可恢复功能性免疫系统。这种假设借助于下列各项确认数次(i)与SCID患者中的突变的逆转相关联的免疫功能的部分恢复(赫希霍恩(Hirschhorn)等人,《自然-遗传学》(Nat.Genet.),1996,13,290-295;斯蒂芬(Stephan)等人,《新英格兰医学杂志》(N.Engl.J.Med.),1996,335,1563-1567;布索(Bousso)等人,《美国国家科学院院刊》(Proc.Natl.,Acad.Sci.USA),2000,97,274-278;和田(Wada)等人,《美国国家科学院院刊》,2001,98,8697-8702;西小森(Nishikomori)等人,《血液》(Blood),2004,103,4565-4572),(ii)在造血细胞中的体外SCID-X1缺陷的校正(坎多蒂(Candotti)等人,《血液》,1996,87,3097-3102;卡瓦扎纳-卡尔沃(Cavazzana-Calvo)等人,《血液》,1996,《血液》,88,3901-3909;泰勒(Taylor)等人,《血液》,1996,87,3103-3107;哈辛-贝(Hacein-Bey)等人,《血液》,1998,92,4090-4097),(iii)SCID-X1的校正(苏戴斯(Soudais)等人,《血液》,2000,95,3071-3077;蔡(Tsai)等人,《血液》,2002,100,72-79),JAK-3(邦廷(Bunting)等人,《自然医学》(Nat.Med.),1998,4,58-64;邦廷等人,《人类基因治疗》(Hum.Gene Ther.),2000,11,2353-2364)和RAG2(耶茨(Yates)等人,《血液》,2002,100,3942-3949)在动物模型中的体内缺陷以及(iv)基因治疗临床试验的结果(卡瓦扎纳-卡尔沃等人,《科学》,2000,288,669-672;艾尔迪(Aiuti)等人,《自然医学》(Nat.Med.),2002;8,423-425;加斯帕(Gaspar)等人,《柳叶刀》(Lancet),2004,364,2181-2187)。

  转让给儿童医疗中心有限公司(Children’s Medical Center Corporation)和哈弗大学(President and Fellows of Harvard College)的美国专利公开号20110182867涉及经由BCL11A表达或活性抑制剂(如RNAi和抗体)在造血祖细胞中调节胎儿血红蛋白(HbF)表达的方法和用途。在美国专利公开号20110182867中披露的靶标,如BCL11A,可以被本发明的CRISPR Cas系统靶向,以便调节胎儿血红蛋白表达。对于另外的BCL11A靶标,还参见鲍尔(Bauer)等人(《科学》(Science)2013年10月11日:第342卷,第6155期,第253-257页)和许(Xu)等人(《科学》2011年11月18日:第334卷,第6058期,第993-996页)。

  可以通过分析(例如,定性或定量)一种或多种组织特异型基因的存在来鉴定适合的细胞。例如,可以通过检测一种或多种组织特异型基因的蛋白质产物来检测基因表达。蛋白质检测技术包括使用针对适当抗原的抗体将蛋白质染色(例如,使用细胞提取物或全细胞)。在这种情况下,该适当抗原是该组织特异型基因表达的蛋白质产物。虽然在原则上可以标记第一抗体(即,结合该抗原的抗体),更普遍的是(并且改进可视化)使用针对该第一抗体的第二抗体(例如,一种抗IgG)。这种第二抗体与荧光染料、或适当的用于比色反应的酶、或金珠(用于电子显微镜检查)、或者与生物素-亲和素系统结合,使得该一级抗体进而该抗原的位置可以被识别。

  在一些实施例中,本发明的RNA分子在脂质体或阳离子脂质体配制品等等中进行递送并且可以通过本领域技术人员熟知的方法进行制备。这样的方法描述于,例如,美国专利号5,593,972、5,589,466、和5,580,859中,将其通过引用并入本文。

  已经开发了专门针对增强和改进递送siRNA到哺乳动物细胞中的递送系统,(参见,例如,沈(Shen)等人《欧洲生化学会联合会快报》(FEBS Let.)2003,539:111-114;夏(Xia)等人,《自然生物技术》(Nat.Biotech.)2002,20:1006-1010;赖希(Reich)等人,《分子视界》(Mol.Vision.)2003,9:210-216;索伦森(Sorensen)等人,《分子生物学杂志》(J.Mol.Biol.)2003,327:761-766;路易斯(Lewis)等人,《自然遗传学》(Nat.Gen.)2002,32:107-108以及西梅奥尼(Simeoni)等人,NAR 2003,31,11:2717-2724)并且可以将其应用于本发明。最近,siRNA已经成功用于抑制灵长动物中的基因表达(参见例如托伦蒂诺(Tolentino)等人,《视网膜》(Retina)24(4):660,它也可应用于本发明。

  肾脏

  本发明还考虑了向肾脏递送该CRISPR-Cas系统。诱导治疗性核酸的细胞摄取的递送策略包括物理力或载体系统,如基于病毒、脂质或复合体的递送、或纳米载体。根据具有较低可能的临床相关性的最初应用,当以全身性流体动力高压注射将核酸寻址(addressed)于肾细胞时,许多种基因治疗性病毒和非病毒载体已经被应用于体内靶向不同的动物肾脏疾病模型中的转录后事件(Csaba Révész和Péter Hamar(2011)。“靶向肾脏中的RNA的递送方法”(Delivery Methods to Target RNAs in the Kidney),《基因疗法应用》(Gene Therapy Applications),康春生教授(Prof.Chunsheng Kang)(编辑),ISBN:978-953-307-541-9,印天科技(InTech),可在网址:intecho 1pen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-in-the-kidney获得)。针对肾脏的递送方法总结如下:

  类似方法可以用于递送至肝脏。

  尽管与肺相关,但是CFTR是现在被CRISPR成功地靶向的严重单基因病症的极佳实例。对于CFTRδ508嵌合的指导RNA的实例,参见实例22,其使用腺相关病毒(AAV)粒子证明了CRISPR-Cas系统在对其有需要的受试者或患者的气道中的基因转移或基因递送,所述受试者或患者患有囊性纤维化或囊性纤维化(CF)相关症状。具体地说,他们示例了囊性纤维化δF508突变的修复策略。这种策略类型可应用于所有生物。特别提到CF,适合的患者可以包括:人类、非人类灵长动物、犬、猫、牛、马和其他家养动物。在这种情况下,申请人利用包含Cas9酶的CRISPR-Cas系统来靶向δF508或其他CFTR诱导的突变。

  在这种情况下,这些经治疗的受试者的每一侧肺接受支气管内递送的药学上有效量的雾化AAV载体系统,同时自然地呼吸。像这样,通常对于AAV递送而言,雾化递送是优选的。腺病毒或AAV粒子可以用于递送。每一者都可操作地连接至一个或多个调节序列上的适合的基因构建体可以被克隆到递送载体中。在这种情况下,提供下列构建体作为实例:用于Cas9的Cbh或EF1a启动子、用于嵌合指导RNA的U6或H1启动子:一种优选的安排是使用靶向嵌合指导的CFTRδ508、用于δF508突变的修复模板以及密码子优化的Cas9酶(优选的Cas9是具有核酸酶或切口酶活性的那些),所述酶具有任选地一个或多个核定位信号或序列(NLS),例如,两个(2)NLS。还设想了没有NLS的构建体。

  为了鉴定该Cas9靶位点,申请人分析了人CFTR基因组座位并且鉴定了该Cas9靶位点。优选地,一般而言并且在这种CF的情况下,该PAM可以含有NGG或NNAGAAW基序。

  因此,在CF的情况下,本方法包括操纵在感兴趣基因组座位中的靶序列,该方法包括

  递送包含病毒载体系统的非天然存在的或工程化的组合物,该病毒载体系统包含一种或多种病毒载体,该一种或多种病毒载体可操作地编码用于其表达的组合物,其中该非天然存在的或工程化的组合物包括:

  非天然存在的或工程化的组合物,该组合物包含载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含

  I.第一调节元件,该第一调节元件可操作地连接到CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列上,其中该第一多核苷酸序列包含

  (a)指导序列,该指导序列能够杂交到适合的哺乳动物细胞中的CF靶序列上,

  (b)tracr配对序列,和

  (c)tracr序列,以及

  II.第二调节元件,该第二调节元件可操作地连接到编码CRISPR酶的酶编码序列上,该CRISPR酶包含至少一个或多个核定位序列,

  其中(a)、(b)和(c)以5’到3’方向排列,

  其中组分I和II位于该系统的相同或不同载体上,

  其中在转录时,该tracr配对序列杂交到该tracr序列上,并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合,并且

  其中该CRISPR复合物包含与(1)杂交或可杂交到该靶序列上的该指导序列、和(2)杂交或可杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶。就CF而言,优选的靶DNA序列包含该CFTRδ508突变。上文描述了优选的PAM。优选的CRISPR酶是任何Cas(在本文中描述,但是特别地描述于实例22中)。

  对于CF的替代物包括任何基因缺陷并且这些实例是众所周知的。本发明的另一个优选方法或用途是用于校正EMP2A和EMP2B基因的缺陷,这些基因已经被鉴定为与拉福拉病(Lafora disease)相关。

  在一些实施例中,“指导序列”可以与“指导RNA”不同。指导序列可以是指在该指导RNA内的大约20bp的序列,其指定该靶位点。

  在一些实施例中,该Cas9是(或衍生自)SpCas9。在这样的实施例中,优选的突变是在SpCas9的任何或所有的10、762、840、854、863和/或986位置或在其他Cas9的相应位置(其可以例如通过标准序列比较工具进行确定)。具体地说,在SpCas9中的任何或所有下列突变是优选的:D10A、E762A、H840A、N854A、N863A和/或D986A;并且还设想了这些置换氨基酸的任何一种的保守性取代。在其他Cas9中的相应位置处的相同取代(或这些突变的保守性取代)也是优选的。特别优选的是在SpCas9中的D10和H840。然而,在其他Cas9中,相应于SpCas9D10和H840的残基也是优选的。这些是有利的,因为它们提供了切口酶活性。这样的突变可以应用于本发明的所有方面,不仅是治疗CF。

  施万克(Schwank)等人(《细胞-干细胞》(Cell Stem Cell),13:653-58,2013)使用了CRISPR/Cas9来校正在人类干细胞中的与囊性纤维化相关联的缺陷。该研究组的目标是离子通道囊性纤维化跨膜传导受体(CFTR)的基因。在CFTR中的缺失引起该蛋白质在囊性纤维化患者中的错误折叠。使用从患有囊性纤维化的两个儿童的细胞样品中发育而来的培养的肠干细胞,施万克(Schwank)等人能够利用CRISPR连同含有有待插入的修补序列的供体质粒来校正该缺陷。然后这些研究者使这些细胞生长成肠“类器官”或微型肠,并且显示它们正常地起作用。在这种情况下,约一半的克隆类器官经历正确的基因校正。

  肝炎病毒

  本发明还可应用于治疗B型肝炎病毒(HBV)。然而,通过例如优化剂量和序列,该CRISPR Cas系统必须适应于避免RNAi的缺点,如过度启动(overstaring)内源小RNA途径的风险(参见,例如,格林姆(Grimm)等人,《自然》第441卷,2006年5月26日)。例如,考虑例如约每人1-10x1014个粒子的低剂量。

  在另一个实施例中,针对HBV的该CRISPR Cas系统可以在脂质体中给药,如一种稳定的核酸-脂质粒子(SNALP)(参见,例如,莫里西(Morrissey)等人,《自然生物技术》(Nature Biotechnology),第23卷,第8期,2005年8月)。考虑了约1、3或5mg/kg/天的靶向SNALP中的HBV RNA的CRISPR Cas的每日静脉注射。每天治疗可以经过约三天,然后每周治疗持续约五周。

  在另一个实施例中,陈(Chen)等人的系统(《基因治疗》(2007)14,11-19)可以使用和/或适用于本发明的CRISPR Cas系统。陈(Chen)等人使用双链腺相关病毒8-假型载体(dsAAV2/8)来递送shRNA。在HBV转基因小鼠的肝脏中,携带HBV特异性shRNA的dsAAV2/8载体(1x1012个载体基因组/小鼠)的单次给药有效抑制了HBV蛋白、mRNA和复制型DNA的稳定水平,从而导致在循环中的HBV负荷的高达2-3个log10减少。在载体给药之后,显著的HBV抑制持续了至少120天。shRNA的治疗作用是靶序列依赖性的并且不涉及干扰素的激活。对于本发明,可以将针对HBV的CRISPR Cas系统克隆到AAV载体如dsAAV2/8载体中,并且给予至人,例如,以1x1015个载体基因组到约1x1016个载体基因组/人的剂量。

  在另一个实施例中,伍德尔(Wooddell)等人的方法(《分子治疗》第21卷,第5期,973-985,2013年5月)可以用于和/或适用于本发明的CRISPR Cas系统。伍德尔(Wooddell)等人表明,肝细胞靶向的、N-乙酰半乳糖胺结合的蜂毒肽样肽(NAG-MLP)与靶向凝血因子VII(F7)的嗜肝胆固醇结合的siRNA(chol-siRNA)的简单共注射导致在小鼠和非人类灵长动物中的有效F7敲低,而在细胞因子的临床化学或诱导上没有变化。使用HBV感染的瞬时转基因小鼠模型,伍德尔(Wooddell)等人表明,NAG-MLP与有效的靶向保守HBV序列的chol-siRNA的简单共注射导致病毒RNA、蛋白质、和病毒DNA的多对数(multilog)阻遏。对于本发明可以设想例如,约6mg/kg的NAG-MLP和6mg/k的HBV特异性CRISPR Cas的静脉内共注射。在替代方案中,约3mg/kg的NAG-MLP和3mg/kg的HBV特异性CRISPR Cas可以在第一天递送,随后在两周之后给予约2-3mg/kg的NAG-MLP和2-3mg/kg的HBV特异性CRISPR Cas。

  本发明还可应用于治疗C型肝炎病毒(HCV)。Roelvinki等人的这些方法(《分子治疗》第20卷,第9期,1737-1749,2012年9月)可以应用于该CRISPR Cas系统。例如,AAV载体如AAV8可以是考虑的载体,并且可以考虑例如约1.25×1011至1.25×1013个载体基因组/千克体重(vg/kg)的剂量。

  在又另一个实施例中,CRISPR-Cas9-介导的基因组编辑可以用于校正疾病突变和/或表型。CRISPR-Cas9-介导的基因组编辑可以用于校正肝脏和/或肝细胞中的疾病突变和/或表型,其在以下原稿中进行了阐述,题为“用Cas9在成年小鼠中进行基因组编辑校正了疾病突变和表型(Genome editing with Cas9in adult mice corrects a disease mutation and phenotype)”,郝因(Hao Yin)等人,《自然生物技术》(Nature Biotechnology),在线公开于2014年3月30日;2014年3月31日在线校正,可在网址nature.com/doifinder/10.1038/nbt.2884获得,将其通过引用以其全文结合在此。该论文涉及在人类疾病遗传性酪氨酸血症的小鼠模型中CRISPR-Cas9-介导的对肝细胞中Fah突变的校正。显示通过流体动力学注射来递送CRISPR-Cas9系统的组分导致在约1/250的肝细胞中野生型Fah蛋白的初始表达。进一步显示Fah-阳性肝细胞的扩张挽救体重减轻表型。

  将易于清楚的是,可以按照相似的方式治疗具有其他疾病的宿主。本文提供了由突变引起的遗传疾病的一些实例,但是更多的疾病是已知的。以上策略可以应用于这些疾病。

  核酸、氨基酸和蛋白质

  本发明使用核酸来结合靶TDNA序列。这是有利的,因为产生核酸比产生蛋白质容易且价廉得多,并且特异性可以根据其中寻求同源性的拉伸长度而变化。例如多指的复杂3-D复杂定位是不需要的。

  术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换地使用。它们是指具有任何长度的核苷酸的聚合形式,是脱氧核糖核苷酸或核糖核苷酸、或其类似物。多核苷酸可具有任何三维结构,并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、根据连接分析定义的多个座位(一个座位)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、micro-RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针、和引物。该术语还涵盖具有合成骨架的核酸-样结构,参见,例如WO 97/03211;WO 96/39154。多核苷酸可以包含一个或多个经修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在,可以在聚合物组装之前或之后进行核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后,如通过与标记的组分缀合来进一步修饰。

  如本文所用的术语“野生型”是本领域技术人员所理解的术语,并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。

  如本文所用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。

  术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语,当指核酸分子或多肽时,表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。

  “互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克碱基配对或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个即为50%、60%、70%、80%、90%、和100%互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补程度,或者是指在严格条件下杂交的两个核酸。

  如本文使用的对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。严格条件的非限制性实例描述于蒂森(Tijssen)(1993)的《生物化学和分子生物学中的实验室技术-核酸探针杂交》(Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes),第I部分,第二章,“杂交原理概述和核酸探针分析策略”(“Overview of principles of hybridization and the strategy of nucleic acid probe assay”),爱思唯尔(Elsevier),纽约。在提及一个多核苷酸序列时,那么也设想了互补的或部分互补的序列。能够在高严格条件下杂交到参考序列上的这些序列是优选的。通常,为了使杂交率最大化,选择了相对低严格性的杂交条件:低于热熔点(Tm)约20℃到25℃。Tm是50%的特异性靶序列在具有规定的离子强度和pH的溶液中杂交到完全互补的探针上的温度。通常,为了要求杂交或可杂交序列的至少约85%的核苷酸互补性,高严格洗涤条件被选择为低于Tm约5℃到15℃。为了要求杂交或可杂交序列的至少约70%的核苷酸互补性,中等严格洗涤条件被选择为低于Tm约15℃到30℃。高容许(极低严格性)洗涤条件可以低至在Tm之下50℃,从而允许在杂交或可杂交序列之间的高水平错配。本领域技术人员将认识到,在杂交和洗涤阶段中的其他物理和化学参数也可以改变,从而影响来自在靶序列与探针序列之间的特定同源性水平的可检测杂交信号的结果。优选的高严格条件包括在50%甲酰胺、5×SSC、和1%SDS中在42℃孵育,或者在5×SSC和1%SDS中在65℃孵育,在0.2×SSC和0.1%SDS中在65℃洗涤。

  “杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应,该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、Hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成更广泛的过程(如PCR的开始、或经由一种酶的多核苷酸的切割)中的步骤。能够与给定序列杂交的序列被称为该给定序列的“互补物”。

  如本文使用的,术语“基因组座位(locus)”或“座位(locus)”(复数是座位(loci))是在染色体上的基因或DNA序列的特定位置。“基因”是指编码多肽或RNA链的DNA或RNA的段(stretch),其在生物中发挥功能作用并且因此是活生物体遗传的分子单元。出于本发明的目的,可以考虑包括调节基因产物的产生的区域的基因,而不论这样的调节序列是否接近编码和/或转录的序列。因此,基因包括而不必限于,启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、隔离子、边界元件、复制起点、核基质附着位点和座位控制区。

  如本文使用的“基因组座位的表达”或“基因表达”是藉此在功能性基因产物的合成中使用来自基因的信息的过程。基因表达的产物常常是蛋白质,但是在非蛋白质编码基因如rRNA基因或tRNA基因中,产物是功能性RNA。基因表达的过程由所有已知的生物利用-产生功能性产物以便存活的真核生物(包括多细胞生物)、原核生物(细菌和古细菌)以及病毒。如本文使用的基因或核酸的“表达”不仅涵盖细胞基因表达,而且涵盖在克隆系统中或在任何其他背景下的一个或多个核酸的转录和翻译。如本文使用的“表达”是指藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA,表达可以包括真核细胞中mRNA的剪接。

  术语“多肽”、“肽”和“蛋白质”在本文可互换地使用,是指具有任何长度的氨基酸的聚合物。该聚合物可以是可以是直链或支链的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。这些术语还涵盖已经被修饰的氨基酸聚合物;这些修饰例如二硫键形成、糖基化、脂化(lipidation)、乙酰化、磷酸化、或任何其他操纵,如与标记组分的缀合。如本文使用的术语“氨基酸”包括天然的和/或非天然的或者合成的氨基酸,包括甘氨酸以及D和L旋光异构体、以及氨基酸类似物和肽模拟物。

  如本文使用的,术语“结构域”或“蛋白质结构域”是指可以独立于该蛋白质链的其余部分而存在并且起作用的蛋白质序列的一部分。

  正如在本发明的多个方面中所描述,序列一致性与序列同源性有关。可以通过肉眼、更通常地借助于可得的序列比较程序来进行同源性比较。这些可商购的计算机程序可以计算在两个或更多个序列之间的同源性的百分比(%)并且还可以计算由两个或更多个氨基酸或核酸序列共享的序列一致性。在一些优选的实施例中,本文描述的dTALE的封端区具有与本文提供的封端区氨基酸序列至少95%一致性或共享一致性的序列。

  可以通过本领域已知的许多计算机程序(例如BLAST或FASTA等等)来生成序列同源性。用于进行这样的比对的适合的计算机程序是GCG 威斯康星Bestfit软件包(美国威斯康星大学;德弗罗(Devereux)等人,1984,《核酸研究》(Nucleic Acids Research)12:387)。可以进行序列比较的其他软件的实例包括但不限于,BLAST软件包(参见奥苏贝尔(Ausubel)等人,1999,出处同上-第18章)、FASTA(阿尔丘尔(Atschul)等人,1990,《分子生物学杂志》(J.Mol.Biol.),403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见奥苏贝尔(Ausubel)等人,1999,出处同上,7-58页到7-60页)。然而,优选使用GCG Bestfit程序。

  可以计算在连续序列上的序列同源性百分比(%),即,将一个序列与另一个序列比对,并且将一个序列中的每个氨基酸或核苷酸与另一个序列中的相应氨基酸或核苷酸直接进行比较,一次比较一个残基。这被称为“无空位”比对。典型地,这样的无空位比对仅仅在较少数目的残基上进行。

  虽然这是一种非常简单和一致的方法,但是它未能考虑的是,例如,在其他方面完全相同的序列对中,一个插入或缺失可以引起随后的氨基酸残基被排除在比对之外,因此当进行全局比对时可能导致在同源性%上的大幅降低。因此,大多数序列比较方法被设计为产生考虑到可能的插入和缺失的优化比对,而没有过度地使总体同源性或一致性评分不利。这是通过在序列比对中插入“空位”来实现的,以便试图将局部同源性或一致性最大化。

  然而,这些更复杂的方法向出现在该比对中的每个空位分配“空位罚分”,从而对于相同数目的一致的氨基酸而言,具有尽可能少的空位的序列比对-反映了在这两个比较的序列之间的更高关联性-可以比具有许多空位者实现更高的得分。“亲合空位成本”(“Affinity gap costs”)典型地用于对空位的存在要求相对高的成本并对空位中的每个后续残基施加较小的罚分。这是最常用的空位评分系统。高空位罚分当然将产生具有更少空位的最佳比对。大多数比对程序允许修改空位罚分。然而,当使用这种序列比较软件时优选使用默认值。例如当使用GCG威斯康星Bestfit软件包时,氨基酸序列的默认空位罚分为对于每个空位的-12,以及对于每个延伸的-4。

  因此计算最大同源性%首先要求产生最佳比对,考虑空位罚分。用于进行这样的比对的适合的计算机程序是GCG威斯康星Bestfit软件包(德弗罗(Devereux)等人,1984,《核酸研究》(Nucleic Acids Research)12p387)。可以进行序列比较的其他软件的实例包括但不限于,BLAST软件包(参见奥苏贝尔(Ausubel)等人,1999《精编分子生物学实验指南》(Short Protocols in Molecular Biology),第4次编辑-第18章)、FASTA(阿尔丘尔(Altschul)等人,1990《分子生物学杂志》(J.Mol.Biol)403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见奥苏贝尔(Ausubel)等人,1999,《精编分子生物学实验指南》(Short Protocols in Molecular Biology),7-58页到7-60页)。然而,对于一些应用,优选使用GCG Bestfit程序。一种新的工具,称为BLAST 2序列,也可用于比较蛋白质和核苷酸序列(参见《欧洲微生物学会联合会微生物学快报》(FEMS Microbiol Lett.)1999174(2):247-50;《欧洲微生物学会联合会微生物学快报》1999177(1):187-8以及在国立卫生研究院的网址的国家生物技术信息中心的网址)。

  虽然最终同源性%可以按照一致性进行测量,但是比对过程自身典型地不是基于全或无配对比较(all-or-nothing pair comparison)。相反,通常使用尺度相似性评分矩阵(scaled similarity score matrix),基于化学相似性或进化距离对各个成对比较评分。通常使用的这种矩阵的实例为BLOSUM62矩阵-BLAST系列程序的默认矩阵。GCG威斯康星程序通常使用公开的默认值或自定义符号比较表(更多细节详见用户手册)。对于一些应用,优选使用GCG软件包的公共默认值,或在其他软件情况下的默认矩阵,如BLOSUM62。

  可替代地,可以基于类似于CLUSTAL(希金斯DG(Higgins DG)和夏普PM(Sharp PM)(1988),《基因》(Gene)73(1),237-244)的一种算法,使用在DNASISTM(日立软件公司(Hitachi Software))中的多重比对特征来计算同源性百分比。一旦软件已经产生最佳比对,就有可能计算同源性%,优选序列一致性%。软件典型地这样进行,作为序列比较的一部分,并且产生数字结果。

  这些序列也可以具有氨基酸残基的缺失、插入或取代,其产生沉默变化并生成功能上等同的物质。可以基于氨基酸特性(如残基的极性、电荷、可溶性、疏水性、亲水性、和/或两亲性)的相似性做出有意氨基酸取代,并且因此它在将氨基酸集合成官能团中是有用的。可以仅仅基于氨基酸的侧链特性将它们集合在一起。然而,包括突变数据同样是更有用的。出于结构原因,如此衍生的氨基酸的集合很有可能是保守性的。这些集合可以被描述为文氏图形式(Venn diagram)(利文斯敦C.D.(Livingstone C.D.)和巴顿G.J.(Barton G.J.)(1993)“蛋白质序列比对:用于残基保守些的分级分析的策略”(“Protein sequence alignments:a strategy for the hierarchical analysis of residue conservation”)《生物科学计算应用》(Comput.Appl.Biosci.)9:745-756)(泰勒(Taylor)W.R.(1986)“氨基酸保守性的分类”(“The classification of amino acid conservation”)《理论生物学杂志》(J.Theor.Biol.)119;205-218)。例如可以根据下表做出保守性取代,该表描述了普遍接受的氨基酸的文氏图分组。

  本发明的实施例包括可包含同源取代(本文使用取代和置换两者来表示现有氨基酸残基或核苷酸与替代残基和核苷酸之间的互换)的序列(多核苷酸或多肽两者),该同源取代,即,在氨基酸的情况下发生同类取代(like-for-like substitution),如碱性对碱性、酸性对酸性、极性对极性。也可以发生非同源取代,即,从一类残基到另一类残基,或者可替代地涉及包含非天然氨基酸如鸟氨酸(在下文称为Z)、二氨基丁酸鸟氨酸(在下文称为B)、正亮氨酸鸟氨酸(在下文称为O)、吡啶基丙氨酸、噻吩基丙氨酸、萘基丙氨酸和苯基甘氨酸。

  变体氨基酸序列可以包括适合的可插入在该序列的任何两个氨基酸残基之间的间隔基团,包括除了氨基酸间隔物(如甘氨酸或β-丙氨酸)之外的烷基基团,如甲基、乙基或丙基基团。一个另外的变化形式,其涉及处于类肽形式的一个或多个氨基酸残基的存在,也是本领域技术人员熟知的。为避免疑义,“该类肽形式”用来指代变体氨基酸残基,其中该α-碳取代基在该残基的氮原子上,而不是在该α-碳上。用于制备处于该类肽形式的肽的方法是本领域已知的,例如西蒙RJ(Simon RJ)等人,PNAS(1992)89(20),9367-9371和豪威尔DC(Horwell DC),《生物技术趋势》(Trends Biotechnol.)(1995)13(4),132-134。

  除非另有说明,本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术,这些在本领域的技能之内。参见萨姆布鲁克(Sambrook)、弗里奇(Fritsch)和马尼亚蒂斯(Maniatis),《分子克隆:实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL),第2次编辑(1989);《当代分子生物学实验手册》(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奥苏贝尔(F.M.Ausubel)等人编辑,(1987));《酶学方法》(METHODS IN ENZYMOLOGY)系列(学术出版公司):《PCR 2:实用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麦克弗森(M.J.MacPherson)、B.D.黑姆斯(B.D.Hames)和G.R.泰勒(G.R.Taylor)编辑(1995))、哈洛(Harlow)和拉内(Lane)编辑(1988)《抗体:实验室手册》(ANTIBODIES,A LABORATORY MANUAL),以及《动物细胞培养》(ANIMAL CELL CULTURE)(R.I.弗雷谢尼(R.I.Freshney)编辑(1987))。

  载体

  在一个方面,本发明提供了在CRISPR-Cas系统的工程化和优化中使用的载体。

  如本文使用的,“载体”是一种允许或促进一个实体从一个环境转移到另一个环境中的工具。它是一种复制子,如质粒、噬菌体、或粘粒,另一个DNA片段可以插入其中,从而引起该插入的片段的复制。通常,当与适当的控制元件关联时,一种载体能够复制。一般而言,术语“载体”是指一种核酸分子,其能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括DNA、RNA、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的DNA片段的环状双链DNA环。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒(AAV))的载体中。病毒载体还包含由用于转染到一种宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此被称为“表达载体”。在重组DNA技术中使用的普通表达栽体通常是质粒形式。

  重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸,这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调节元件,所述调节元件可操作地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一种或多种调节元件(例如,处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。关于重组和克隆方法,提及2004年9月2日以US 2004-0171156 A1公开的美国专利申请10/815,730,该专利的内容通过引用以其全文并入本文。

  本发明的多个方面涉及用于嵌合的RNA与Cas9的载体。用于嵌合的RNA与Cas9的双顺反子表达载体是优选的。一般而言并且特别地,在这个实施例中,Cas9优选由CBh启动子驱动。嵌合RNA可以优选地由U6启动子驱动。理想地,将这两者结合。嵌合的指导RNA典型地由20bp指导序列(N)组成并且这可以接合到tracr序列上(从下链的第一个“U”到该转录物的结尾)。该tracr序列可以在如指示的不同位置被截短。指导序列和tracr序列被该tracr配对序列隔开,该tracr配对序列可以是GUUUUAGAGCUA。这之后可以是如所示的环序列GAAA。这两者都是优选的实例。申请人已经通过SURVEYOR测定证明了在人EMX1和PVALB座位处的Cas9介导的indel。ChiRNA由其“+n”标志指示,并且crRNA是指指导序列和tracr序列被表达为分开的转录物的杂交体RNA。贯穿本申请,嵌合RNA也可以被称为单指导、或合成指导RNA(sgRNA)。该环优选地是GAAA,但是并并限于这个序列或者实际上在长度上仅仅为4bp。实际上,用于在发夹结构中使用的优选环形成序列在长度上为四个核苷酸,并且最优选地具有序列GAAA。然而,可以使用更长或更短的环序列,正如可替代的序列。这些序列优选地包括三联体(例如,AAA)、和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。

  术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚U序列)。这样的调节序列例如描述于戈德尔(Goeddel),《基因表达技术:酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,学术出版社(Academic Press),圣地亚哥(San Diego),加利福尼亚州(1990)中。调节元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。调节元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中,一个载体包含一个或多个pol III启动子(例如1、2、3、4、5、或更多个pol III启动子)、一个或多个pol II启动子(例如1、2、3、4、5、或更多个pol II启动子)、一个或多个pol I启动子(例如1、2、3、4、5、或更多个pol I启动子)、或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见,例如,波沙特(Boshart)等人,《细胞》(Cell)41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、和EF1α启动子。还被术语“调节元件”涵盖的是增强子元件,如WPRE;CMV增强子;在HTLV-I的LTR中的R-U5’片段《分子细胞生物学》(Mol.Cell.Biol.,第8(1)卷,第466-472页,1988);SV40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA.),第78(3)卷,第1527-31页,1981)。本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的核酸编码的融合蛋白或肽(例如,成簇的规律间隔的短回文重复(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白,等等)。关于调节序列,提及美国专利申请10/491,026,该专利的内容通过引用以其全文并入本文。关于启动子,提及PCT公开WO 2011/028929和美国申请12/511,940,这些专利的内容通过引用以其全文并入本文。

  载体可以被设计为用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质、或酶)。例如,CRISPR转录物可表达于例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中。适合的宿主细胞进一步讨论于Goeddel(戈德尔),《基因表达技术:酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,学术出版社(Academic Press),圣地亚哥(San Diego),加利福尼亚州(Calif.)(1990年)中。可替代地,重组表达载体可在体外例如使用T7启动子调节序列和T7聚合酶来转录和翻译。

  载体可以被引入原核生物或原核细胞中并且在其中增殖。在一些实施例中,原核生物用来扩增有待引入真核细胞中的载体的多个拷贝,或者作为有待引入真核细胞中的载体的产生中的中间载体(例如,扩增质粒作为病毒载体包装系统的一部分)。在一些实施例中,原核生物用来扩增一个载体的多个拷贝并且表达一种或多种核酸,如提供用于递送到宿主细胞或宿主生物中的一种或多种蛋白质的来源。蛋白质在原核生物中的表达最经常在大肠杆菌中用含有指导融合或非融合蛋白的表达的组成型或诱导型启动子的载体来进行。融合载体将多个氨基酸添加到在其中编码的蛋白质上,如该重组蛋白的氨基端上。这样的融合载体可以用于一个或多个目的,如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解性;以及(iii)通过在亲和纯化中充当配体来辅助重组蛋白的纯化。通常,在融合表达载体中,将蛋白切割位点引入至融合部分与重组蛋白的接合处以使得能够在纯化融合蛋白之后将重组蛋白与融合部分分离。这类酶以及它们的同源识别序列包括因子Xa、凝血酶以及肠激酶。示例性融合表达载体包括pGEX(发玛西亚生物技术有限公司(Pharmacia Biotech Inc);史密斯和约翰逊,1988,《基因》(Gene)67:31-40)、pMAL(纽英伦生物技术公司(New England Biolabs),贝弗利(Beverly),马萨诸塞州(Mass.))以及pRIT5(发玛西亚公司,皮斯卡塔韦(Piscataway),新泽西州(N.J.)),它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A融合至靶重组蛋白。

  适合的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann(阿姆兰)等人,(1988年)《基因》(Gene)69:301-315)以及pET 11d(Studier(斯图迪尔)等人,《基因表达技术:酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185,学术出版社(Academic Press),圣地亚哥(San Diego),加利福尼亚州(Calif.)(1990年)60-89。

  在一些实施例中,载体是酵母表达载体。用于在酵母酿酒中表达的载体的实例包括pYepSec1(巴尔戴利(Baldari)等人,1987.《欧洲分子生物学学会杂志》(EMBO J)6:229-234)、pMFa(库尔坚(Kurjan)和赫斯库伍特兹(Herskowitz),1982,《细胞》(Cell)30:933-943)、pJRY88(舒尔茨(Schultz)等人,1987,《基因》(Gene)54:113-123)、pYES2(Invitrogen Corporation(英杰公司),San Diego(圣地亚哥),Calif(加利福尼亚州))、以及picZ(Invitrogen Corp(英杰公司),San Diego(圣地亚哥),Calif(加利福尼亚州))。

  在一些实施例中,使用杆状病毒载体,载体驱动昆虫细胞中的蛋白质表达。可用于在培养的昆虫细胞(例如,SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(史密斯(Smith)等人,1983,《分子细胞生物学》(Mol.Cell.Biol.)3:2156-2165)和pVL系列(拉克瑙(Lucklow)和萨莫斯(Summers),1989,《病毒学》(Virology)170:31-39)。

  在一些实施例中,使用哺乳动物表达载体,载体能够驱动一种或多种序列在哺乳动物细胞中表达。哺乳动物表达载体的实例包括pCDM8(锡德(Seed),1987,《自然》(Nature)329:840)和pMT2PC(考夫曼(Kaufman)等人,1987,《欧洲分子生物学学会杂志》(EMBO J.)6:187-195)。当用于哺乳动物细胞中时,表达载体的控制功能典型地由一种或多种调节元件提供。例如,常用的启动子来源于多瘤、腺病毒2、巨细胞病毒、猿猴病毒40、以及本文所述和本领域已知的其他病毒。对于用于原核细胞和真核细胞两者的其他适合的表达系统参见例如萨姆布鲁克(Sambrook)等人的《分子克隆实验指南》(Molecular Cloning:A Laboratory Manual.)(第2版)的第16和第17章,冷泉港实验室(Cold Spring Harbor Laboratory),冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),冷泉港(Cold Spring Harbor),纽约,1989。

  在一些实施例中,重组哺乳动物表达载体能够指导核酸优先在特定细胞类型中表达(例如,使用组织特异型调节元件来表达核酸)。组织特异型调节元件是本领域中已知的。适合的组织特异型启动子的非限制性实例包括白蛋白启动子(肝脏特异性的;平克特(Pinkert)等人,1987.《基因发育》(Genes Dev.)1:268-277),淋巴特异性启动子(卡里曼(Calame)和伊顿(Eaton),1988.《免疫学进展》(Adv.Immunol)43:235-275),特别是T细胞受体的启动子(维纳图(Winoto)和巴尔迪莫(Baltimore),1989.《欧洲分子生物学学会杂志》(EMBO J.)8:729-733)和免疫球蛋白(巴纳吉(Baneiji)等人,1983.《细胞》(Cell)33:729-740;奎恩(Queen)和巴尔迪莫(Baltimore),1983.《细胞》(Cell)33:741-748),神经元特异性启动子(例如,神经丝启动子;伯恩(Byrne)和鲁德尔(Ruddle),1989.《美国科学院院刊》(Proc.Natl.Acad.Sci USA)86:5473-5477),胰腺特异性启动子(艾德兰德(Edlund)等人,1985.《科学》(Science)230:912-916),以及乳腺特异性启动子(例如,乳清启动子;美国专利号4,873,316和欧洲申请公开号264,166)。还涵盖发育型调节启动子,例如,鼠科动物同源框蛋白(hox)启动子凯赛尔((Kessel)和格鲁斯(Gruss),1990.《科学》(Science)249:374-379)和α-甲胎蛋白启动子(卡姆皮斯(Campes)和蒂尔曼(Tilghman),1989.《基因发育》(Genes Dev.)3:537-546)。关于这些原核和真核载体,提及美国专利6,750,059,该专利的内容通过引用以其全文并入本文。本发明的其他实施例可涉及病毒载体的使用,关于它提及美国专利申请13/092,085,该专利的内容通过引用以其全文并入本文。组织特异型调节元件是本领域中已知的,并且在这个方面提及美国专利7,776,321,该专利的内容通过引用以其全文并入本文。

  调节元件

  在一些实施例中,调节元件可操作地连接至CRISPR系统的一个或多个元件,从而驱动该CRISPR系统的该一个或多个元件的表达。一般而言,CRISPR(规律间隔成簇短回文重复),也称为SPIDR(SPacer间隔开的同向重复),构成通常对于特定细菌物种而言特异性的DNA基因座的家族。该CRISPR座位包含在大肠杆菌中被识别的间隔开的短序列重复(SSR)的一个不同类(石野(Ishino)等人,《细菌学杂志》(J.Bacteriol.),169:5429-5433[1987];和中田(Nakata)等人,《细菌学杂志》(J.Bacteriol.),171:3553-3556[1989])、以及相关基因。类似的间隔开的SSR已经鉴定于地中海富盐菌(Haloferax mediterranei)、化脓链球菌、鱼腥藻属、和结核分枝杆菌中(参见,格鲁恩(Groenen)等人,《分子微生物学》(Mol.Microbiol.),10:1057-1065[1993];霍(Hoe)等人,《新发感染性疾病》(Emerg.Infect.Dis.),5:254-263[1999];马斯波尔(Masepohl)等人,《生物化学与生物物理学学报》(Biochim.Biophys.Acta)1307:26-30[1996];以及莫吉卡(Mojica)等人,《分子微生物学》,17:85-93[1995])。这些CRISPR座位典型地不同于其他SSR的重复结构,这些重复已被称为规律间隔的短重复(SRSR)(詹森(Janssen)等人,《OMICS:整合生物学杂志》(OMICS J.Integ.Biol.),6:23-33[2002];以及莫吉卡(Mojica)等人,《分子微生物学》(Mol.Microbiol.),36:244-246[2000])。一般而言,这些重复是以簇存在的短元件,其被具有基本上恒定长度的独特间插序列规律地间隔开(莫吉卡(Mojica)等人,[2000],同上)。虽然重复序列在菌株之间是高度保守的,许多间隔开的重复和这些间隔区的序列一般在菌株与菌株之间不同(冯·埃姆登(van Embden)等人,《细菌学杂志》(J.Bacteriol.),182:2393-2401[2000])。已经在40种以上的原核生物中鉴定出CRISPR座位(参见,例如,詹森(Janssen)等人,《分子微生物学》(Mol.Microbiol.),43:1565-1575[2002];以及莫吉卡(Mojica)等人,[2005]),包括但不限于:气火菌属(Aeropyrum)、热棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古球菌属(Archaeoglobus)、盐盒菌属(Halocarcula)、甲烷杆菌属(Methanobacterium)、甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷火菌属(Methanopyrus)、焦球菌属(Pyrococcus)、嗜酸菌属(Picrophilus)、热原体属(Thermoplasma)、棒状杆菌属(Corynebacterium)、分枝杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产水菌属(Aquifex)、紫单胞菌属(Porphyromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、芽孢杆菌属(Bacillus)、利斯特菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、好热厌氧杆菌属(Thermoanaerobacter)、支原体属(Mycoplasma)、梭杆菌属(Fusobacterium)、固氮弓菌属(Azarcus)、色杆菌属(Chromobacterium)、奈瑟菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、地杆菌属(Geobacter)、粘球菌属(Myxococcus)、弯曲杆菌属(Campylobacter)、类杆菌属(Wolinella)、不动杆菌属(Acinetobacter)、欧文菌属(Erwinia)、埃希菌属(Escherichia)、军团杆菌属(Legionella)、甲基球菌属(Methylococcus)、巴斯德菌属(Pasteurella)、发光细菌属(Photobacterium)、沙门菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森菌属(Yersinia)、密螺旋体属(Treponema)、和栖热袍菌属(Thermotoga)。

  一般而言,“CRISPR系统”总共是指转录物和涉及CRISPR相关(“Cas”)基因的表达或指导其活性的其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(涵盖“同向重复”和在内源CRISPR系统背景下的tracrRNA加工的部分同向重复)、指导序列(在内源CRISPR系统背景下也称为“间隔子(spacer)”)、或来自CRISPR座位的其他序列和转录物。在本发明的实施例中,术语指导序列和指导RNA可互换地使用。在一些实施例中,CRISPR系统的一个或多个元件来源于I型、II型、或III型CRISPR系统。在一些实施例中,CRISPR系统的一个或多个元件来源于包含内源CRISPR系统的特殊生物,如化脓链球菌。一般而言,CRISPR系统的特征为促进在靶序列的位点处的CRISPR复合物(在内源CRISPR系统的背景下也称为原型间隔子)的形成的元件。在CRISPR复合物形成的背景下,“靶序列”是指指导序列被设计为对其具有互补性的序列,其中在靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含任何多核苷酸,如DNA或RNA多核苷酸。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。

  在一些实施例中,可以通过计算机搜索重复基序来鉴定同向重复,其满足下列标准的任一项或全部:

  1.发现一个在II型CRISPR座位侧翼的基因组序列的2Kb窗口;

  2.跨从20到50bp;以及

  3.以20到50bp间隔开。

  在一些实施例中,可以使用这些标准中的2条,例如1和2、2和3、或1和3。在一些实施例中,可以使用所有这3条标准。

  在一些实施例中,随后可以通过满足下列标准的任一项或全部的序列来预测候选tracrRNA:

  1.与同向重复同源的序列(在Geneious中搜索的具有高达18-bp错配的基序);

  2.在转录方向上的预测的不依赖Rho的转录终止子的存在;以及

  3.在tracrRNA与同向重复之间的稳定发夹二级结构。

  在一些实施例中,可以使用这些标准中的2条,例如1和2、2和3、或1和3。在一些实施例中,可以使用所有这3条标准。

  在一些实施例中,嵌合的合成指导RNA(sgRNA)设计可以在同向重复与tracrRNA之间掺入至少12bp的双链体结构。

  在本发明的优选实施例中,该CRISPR系统是一个II型CRISPR系统,并且该Cas酶是Cas9,其催化DNA切割。通过来源于化脓链球菌或Cas9或任何密切相关的Cas9的酶促作用,产生了在靶位点序列处的双链断裂,所述靶位点序列杂交到该指导序列的20个核苷酸上并且具有在该靶序列的20个核苷酸之后的原型间隔子相邻基序(PAM)序列(实例包括NGG/NRG或可以如本文所述进行确定的PAM)。经由Cas9的对于位点特异性DNA识别和切割的CRISPR活性是由该指导序列、部分杂交到该指导序列上的tracr序列以及该PAM序列定义的。该CRISPR系统的更多方面描述于卡吉诺夫(Karginov)和汉农(Hannon)的“CRISPR系统:在细菌和古细菌中的小RNA指导的防御”(The CRISPR system:small RNA-guided defence in bacteria and archaea),《分子细胞学杂志》(Mole Cell)2010,1月15日;37(1):7。

  II型CRISPR座位来自化脓链球菌SF370,该座位含有四个基因Cas9、Cas1、Cas2和Csn1的聚簇以及两个非编码RNA元件tracrRNA和由非重复序列的短段(间隔子,每个约30bp)间隔开的重复序列(同向重复)的特征性阵列。在此系统中,以四个连续步骤产生靶向的DNA双链断裂(DSB)(图2A)。第一步,从CRISPR座位转录两个非编码RNA前-crRNA阵列和tracrRNA。第二步,将tracrRNA杂交到前-crRNA的同向重复上,然后将其加工成含有单独的间隔子序列的成熟crRNA。第三步,该成熟crRNA:tracrRNA复合物经由在crRNA的间隔子区与原型间隔子DNA之间形成异源双链体而指导Cas9到由原型间隔子和对应的PAM组成的DNA靶标。最后,Cas9介导PAM上游的靶DNA的切割,以在原型间隔子内产生一个DSB(图2A)。图2B证明了该密码子优化的Cas9的核定位。为了促进转录精确起始,选择基于RNA聚合酶III的U6启动子,以驱动tracrRNA的表达(图2C)。类似地,研发基于U6启动子的构建体,以表达由单个间隔子组成的前-crRNA阵列,该单个间隔子侧翼为两个同向重复(DR,还被术语“tracr配对序列”所涵盖;图2C)。将起始间隔子设计成靶向人EMX1座位(图2C)中的33-碱基对(bp)靶位点(满足Cas9的NGG识别基序的30-bp原型间隔子加3-bp CRISPR基序(PAM)序列),该座位是大脑皮层的发育中的一个关键基因。

  典型地,在内源CRISPR系统的背景下,CRISPR复合物(包含杂交或可杂交到靶序列上并且与一种或多种Cas蛋白复合的指导序列)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条链或两条链的切割。不希望受到理论的束缚,该tracr序列(其可以包含或其组成为野生型tracr序列的全部或部分(例如野生型tracr序列的约或多于约20、26、32、45、48、54、63、67、85个、或更多个核苷酸))也可以形成CRISPR复合物的一部分,如通过沿着该tracr序列的至少一部分杂交到与该指导序列可操作地连接的tracr配对序列的全部或部分上。在一些实施例中,将驱动CRISPR系统的一个或多个元件的表达的一种或多种载体引入到宿主细胞中,使得该CRISPR系统的这些元件的表达在一个或多个靶位点指导CRISPR复合物的形成。例如,Cas酶、连接到tracr配对序列上的指导序列、以及tracr序列可以各自可操作地连接到在分开的载体上的分开的调节元件上。可替代地,从相同或不同调节元件表达的二个或更多个元件可以结合在单个载体中,其中提供该CRISPR系统的任何组分的一种或多种另外的载体不包括在该第一载体中。结合在单个载体中的CRISPR系统元件可以按照任何适合的取向排列,如一个元件相对于第二元件位于5’(“上游”)或3’(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的同一条链或相对链上,并且取向为相同或相对的方向。在一些实施例中,单个启动子驱动编码CRISPR酶的转录物以及该指导序列、tracr配对序列(任选地可操作地连接到该指导序列上)、和嵌入在一个或多个内含子序列之内(例如,各自在不同的内含子中,两个或更多个在至少一个内含子中,或者全部都在单个内含子中)的tracr序列中的一者或多者的表达。在一些实施例中,该CRISPR酶、指导序列、tracr配对序列、和tracr序列可操作地连接到相同的启动子上并且从其表达。

  在一些实施例中,载体包含一个或多个插入位点,如限制性核酸内切酶识别序列(也称为“克隆位点”)。在一些实施例中,一个或多个插入位点(例如,约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个插入位点)位于一种或多种载体的一个或多个序列元件的上游和/或下游。在一些实施例中,载体包含在tracr配对序列的上游、并且任选地在可操作地连接到该tracr配对序列上的调节元件的下游的插入位点,使得在将指导序列插入到该插入位点中之后并且在表达时该指导序列引导CRISPR复合物与真核细胞中的靶序列的序列特异性结合。在一些实施例中,载体包含一个或多个插入位点,每个插入位点位于两个tracr配对序列之间,从而允许在每个位点插入指导序列。在这样一种安排中,两种或更多种指导序列可以包含单指导序列的两个或更多个拷贝、两种或更多种不同的指导序列、或这些的组合。当使用多个不同的指导序列时,可以使用单个表达构建体使CRISPR活性靶向到细胞内的多个不同的相应靶序列。例如,单个载体可以包含约或多于约1、2、3、4、5、6、7、8、9、10、15、20种、或更多种指导序列。在一些实施例中,可以提供约或多于约1、2、3、4、5、6、7、8、9、10个、或更多种这样的含有靶序列的载体,并且任选地将其递送到细胞中。

  在一些实施例中,一个载体包含可操作地连接到编码CRISPR酶(如Cas蛋白)的酶编码序列上的调节元件。Cas蛋白的非限制性实例包括:Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8,Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物、或其修饰形式。在一些实施例中,未修饰的CRISPR酶如Cas9具有DNA切割活性。在一些实施例中,该CRISPR酶指导在靶序列位置处(例如在该靶序列之内和/或在该靶序列的互补物之内)的一条链或两条链的切割。在一些实施例中,该CRISPR酶指导距离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个、或更多个碱基对之内的一条链或两条链的切割。在一些实施例中,一个载体编码相对于相应的野生型酶被突变的CRISPR酶,使得该突变的CRISPR酶缺乏切割含有一个靶序列的靶多核苷酸的一条链和两条链的能力。例如,在来自化脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸到丙氨酸取代(D10A)将Cas9从切割两条链的核酸酶转化成切口酶(切割单条链)。致使Cas9为切口酶的其他突变实例包括而不限于H840A、N854A、和N863A。作为一个另外的实例,Cas9的两个或更多个催化结构域(RuvC I、RuvC II、和RuvC III或该HNH结构域)可以被突变为产生实质上缺乏所有DNA切割活性的突变的Cas9。在一些实施例中,D10A突变与H840A、N854A、或N863A突变的一者或多者相组合,以便产生实质上缺乏所有DNA切割活性的Cas9酶。在一些实施例中,当该突变的CRISPR酶的DNA切割活性比它的非突变形式低约25%、10%、5%、1%、0.1%、0.01%、或更少时,则该酶被考虑为实质上缺乏所有DNA切割活性。在该酶不是SpCas9的情况下,可以在相应于SpCas9的位置10、762、840、854、863和/或986的任何或所有残基处进行突变(其可以例如通过标准序列比较工具进行确定)。具体地说,在SpCas9中的任何或所有下列突变是优选的:D10A、E762A、H840A、N854A、N863A和/或D986A;并且还设想了这些置换氨基酸的任何一种的保守性取代。在其他Cas9中的相应位置处的相同取代(或这些突变的保守性取代)也是优选的。特别优选的是在SpCas9中的D10和H840。然而,在其他Cas9中,相应于SpCas9D10和H840的残基也是优选的。

  另外,将SpCas9的RuvC I催化结构域中的天冬氨酸至丙氨酸取代(D10A)工程化,以将核酸酶转化为切口酶(SpCas9n)(参见例如萨普拉诺萨克斯(Sapranauskas)等人,2011,《核酸研究》(Nucleic Acis Research),39:9275;加索纳斯(Gasiunas)等人,2012,《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA),109:E2579),这样使得带切口的基因组DNA经历高保真同源定向修复(HDR)。Surveyor测定确认到,SpCas9n在EMX1原型间隔子靶标处不产生indel。靶向EMX1的嵌合crRNA(同样具有tracrRNA组分)与SpCas9的共表达在靶位点中产生indel,而与SpCas9n的共表达则不然(n=3)。此外,327个扩增子的测序未检测到由SpCas9n诱导的任何indel。选择相同的座位,以通过用靶向EMX1、hSpCas9或hSpCas9n的嵌合的RNA以及用于在原型间隔子附近引入一对限制酶切位点(HindIII和NheI)的HR模板共转染HEK 293FT细胞而测试CRISPR介导的HR。

  本文描述了优选的直向同源物。一种Cas酶可以被鉴定为Cas9,因为这可以是指与来自II型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别。最优选地,该Cas9酶来自或衍生自spCas9或saCas9。关于衍生,申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义,但是如本文所述它在某些方面已经被突变(修饰)。

  应当理解的是,术语Cas和CRISPR酶在本文中通常可互换地使用,除非另外说明。如上提及的,在本文中使用的许多残基编号是指来自化脓链球菌中的II型CRISPR座位的Cas9酶。然而,应当理解的是,本发明包括更多的来自其他微生物物种的Cas9s,如SpCas9、SaCa9、St1Cas9等等。

  密码子优化

  本文中提供了在这种情形下针对人类进行优化(即,针对在人类中表达进行优化)的密码子优化序列的实例,参见SaCas9人类密码子优化序列。在这被优化的同时,应当理解其他实例是可能的并且针对宿主物种的密码子优化是已知的。

  在一些实施例中,编码CRISPR酶的酶编码序列经密码子优化,以便在特定的细胞如真核细胞中表达。这些真核细胞可以是特定生物的那些或来源于特定生物,如哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗、或非人类哺乳动物或灵长动物。在一些实施例中,对于人类或动物而言很可能使得他们(它们)受苦而没有任何实质性医学益处的用于修饰人类的种系遗传同一性的方法和/或用于修饰动物的遗传同一性的方法、以及还有作为这样的方法的结果的动物,可以被排除在外。

  一般而言,密码子优化是指通过用在宿主细胞的基因中更频繁地或者最频繁地使用的密码子代替天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50个、或更多个密码子同时维持该天然氨基酸序列而修饰一个核酸序列以便增强在感兴趣宿主细胞中的表达的方法。不同的物种对于具有特定氨基酸的某些密码子展示出特定的偏好。密码子偏好性(在生物之间的密码子使用的差异)经常与信使RNA(mRNA)的翻译效率相关,而该翻译效率则被认为依赖于(除其他之外)被翻译的密码子的性质和特定的转运RNA(tRNA)分子的可用性。细胞内选定的tRNA的优势一般反映了最频繁用于肽合成的密码子。因此,可以将基因定制为基于密码子优化在给定生物中的最佳基因表达。密码子利用率表可以容易地获得,例如在www.kazusa.orjp/codon/(2002年7月9日访问)上可获得的“密码子使用数据库”(“Codon Usage Database”)中,并且这些表可以通过不同的方式调整适用。参见,中村Y.(Nakamura Y.)等人,“从国际DNA序列数据库中制表的密码子使用:2000年的状态”(“Codon usage tabulated from the international DNA sequence databases:status for the year 2000.”)《核酸研究》(Nucl.Acids Res.)28:292(2000年)。用于密码子优化特定的序列以便在特定的宿主细胞中表达的计算机算法也是可得的,如基因制造(Gene Forge)(Aptagen公司;雅各布斯(Jacobus),PA),也是可得的。在一些实施例中,在编码CRISPR酶的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个、或更多个、或所有密码子)相应于对于特定氨基酸最频繁使用的密码子。

  核定位序列(NLS)

  在一些实施例中,一种载体编码包含一个或多个核定位序列(NLS)如约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个NLS的CRISPR酶。在一些实施例中,该CRISPR酶包含在或接近于氨基端的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个NLS,在或接近于羧基端约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个NLS,或这些的组合(例如在氨基端的一个或多个NLS以及在羧基端的一个或多个NLS)。当存在多于一个NLS时,每一个可以被选择为不依赖于其他NLS,使得在多于一个拷贝中可以存在单个NLS和/或与在一个或多个拷贝中存在一个或多个其他NLS相组合。在本发明的一个优选实施例中,该CRISPR酶包含至多6个NLS。在一些实施例中,当NLS的最近的氨基酸是在从N端或C端沿着该多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个、或更多个氨基酸之内时,NLS可以被视为接近该N端或C端。NLS的非限制性实例包括来源于以下项的NLS序列:SV40病毒大T抗原的NLS,其具有氨基酸序列PKKKRKV;来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK的核质蛋白二分NLS);c-myc NLS,其具有氨基酸序列PAAKRVKLD或RQRRNELKRSP;hRNPA1M9NLS,其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY;来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;肌瘤T蛋白的序列VSRKRPRP和PPKKARED;人p53的序列POPKKKPL;小鼠c-abl IV的序列SALIKKKKKMAP;流感病毒NS1的序列DRLRR和PKQKKRK;肝炎病毒δ抗原的序列RKLKKKIKKL;小鼠Mx1蛋白的序列REKKKFLKRR;人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK;以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK。

  一般而言,该一个或多个NLS具有足够的强度,以便在真核细胞的核中驱动该CRISPR复合物以可检测到的量积聚。一般而言,核定位活性的强度可以驱动在该CRISPR酶中的NLS的数目、所使用的一个或多个特定的NLS、或这些因素的组合。可以通过任何适合的技术进行细胞核中积聚的检测。例如,一种检测标记可以融合到CRISPR酶上,使得细胞内的位置可以被可视化,如与检测细胞核的位置的手段(例如,对于细胞核特异的染料,如DAPI)相结合。还可以将细胞核从细胞中分离出来,然后可以通过任何适合的用于检测蛋白质的方法分析其内容物,如免疫组织化学、Western印迹或酶活性测定。如通过测定CRISPR复合物形成的作用(例如,测定在靶序列处的DNA切割或突变、或测定由于CRISPR复合物形成和/或CRISPR酶活性的影响而改变的基因表达活性),与没有暴露于CRISPR酶或复合物、或暴露于缺乏该一个或多个NLS的CRISPR酶的对照相比较,还可以间接地确定细胞核中的积聚。

  指导序列

  特别优选的指导物是在20-22个nt的范围内,如在本文讨论的;参见实例41。

  一般而言,指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且指导CRISPR复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中,当使用适合的比对算法进行最佳比对是,在指导序列与其相应的靶序列之间的互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼(Smith-Waterman)算法、尼德曼-翁施(Needleman-Wunsch)算法、基于伯罗斯-惠勒变换(Burrows-Wheeler Transform)的算法(例如伯罗斯-惠勒比对工具(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技术公司;在www.novocraft.com可获得)、ELAND(亿明达公司(Illumina),圣地亚哥,加利福尼亚州)、SOAP(在soap.genomics.org.cn可获得)、以及Maq(在maq.sourceforge.net可获得)。在一些实施例中,指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸。在一些实施例中,指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸。可以通过任何适合的测定法来评估指导序列引导CRISPR复合物与靶序列的序列特异性结合的能力。例如,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的指导序列在内,可以例如通过用编码该CRISPR序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过如本文所述的Surveyor测定来评估在该靶序列之内的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的CRISPR复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处的结合或切割率,可以在一个试管中评估靶多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。

  指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在细胞的基因组内的序列。示例性靶序列包括在靶基因组中为独特的那些。例如,对于化脓链球菌Cas9,在基因组中的独特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXGG的Cas9靶位点,其中NNNNNNNNNNNNXGG(N是A、G、T、或C;并且X可以是任何物)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXGG的化脓链球菌Cas9靶位点,其中NNNNNNNNNNNXGG(N是A、G、T、或C;并且X可以是任何物)在该基因组中单次出现。对于嗜热链球菌CRISPR1Cas9,在基因组中的独特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXXAGAAW的Cas9靶位点,其中NNNNNNNNNNNNXXAGAAW(N是A、G、T、或C;X可以是任何物;并且W是A或T)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXXAGAAW的嗜热链球菌CRISPR1Cas9靶位点,其中NNNNNNNNNNNXXAGAAW(N是A、G、T、或C;X可以是任何物;并且W是A或T)在该基因组中单次出现。对于化脓链球菌Cas9,在基因组中的独特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXGGXG的Cas9靶位点,其中NNNNNNNNNNNNXGGXG(N是A、G、T、或C;并且X可以是任何物)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXGGXG的化脓链球菌Cas9靶位点,其中NNNNNNNNNNNXGGXG(N是A、G、T、或C;并且X可以是任何物)在该基因组中单次出现。在这些序列的每一个中,“M”可以是A、G、T、或C,并且在序列鉴定中不必考虑为是独特的。

  在一些实施例中,指导序列被选择为降低在该指导序列内的二级结构程度。在一些实施例中,在最佳地折叠时,该指导序列的约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%、或更少的核苷酸参与自我互补碱基配对。可以通过任何适合的多核苷酸折叠算法来确定最佳折叠。一些算法是基于计算最小吉布斯(Gibbs)自由能。一种这样的算法的实例是mFold,正如祖克(Zuker)和施蒂格勒(Stiegler)《核酸研究》(Nucleic Acids Res.)9(1981),133-148)所描述。折叠算法的另一个实例是使用由维也纳大学(University of Vienna)的理论化学研究所(Institute for Theoretical Chemistry)研发的在线网络服务器RNAfold(参见例如A.R.格鲁伯(A.R.Gruber)等人,2008,《细胞》(Cell)106(1):23-24;以及PA卡尔(PA Carr)和GM丘奇(GM Church),2009,《自然生物技术》(Nature Biotechnology)27(12):1151-62)。

  tracr配对序列

  一般而言,tracr配对序列包括与tracr序列具有足够互补性以促进下列一项或多项的任何序列:(1)在含有相应tracr序列的细胞中的侧翼为tracr配对序列的指导序列的切除;以及(2)在靶序列处的CRISPR复合物的形成,其中该CRISPR复合物包含杂交或可杂交到tracr序列上的tracr配对序列。通常,互补程度是就tracr配对序列与tracr序列沿着这两个序列的较短者的长度的最佳比对而言。可以通过任何适合的比对算法来确定最佳比对,并且可以可以进一步对二级结构做出解释,如在该tracr序列或tracr配对序列之内的自我互补性。在一些实施例中,在进行最佳比对时,在该tracr序列与tracr配对序列之间沿着这两者的较短者的长度的互补程度是约或多于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、或更高。在一些实施例中,该tracr序列在长度上为约或多于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个、或更多个核苷酸。在一些实施例中,该tracr序列和tracr配对序列被包含在单个转录物中,使得在这两者之间的杂交产生具有二级结构(如发夹)的转录物。在本发明的一个实施例中,该转录物或转录的多核苷酸序列具有至少两个或更多个发夹。在优选的实施例中,该转录物具有两个、三个、四个或五个发夹。在本发明的一个另外的实施例中,该转录物具有至多五个发夹。在一个发夹结构中,在该环的最终“N”和上游的序列5’的部分相应于该tracr配对序列,并且该环的序列3’的部分相应于该tracr序列。另外的包含指导序列、tracr配对序列、和tracr序列的单一多核苷酸的非限制性实例如下(列出为5’到3’),其中“N”代表指导序列的碱基,小写字体的第一区代表tracr配对序列,且小写字体的第二区代表tracr序列,并且该最后的多聚T序列代表转录终止子:(1)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataa ggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT;(2)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccg aaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT;(3)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccg aaatcaacaccctgtcattttatggcagggtgtTTTTTT;(4)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaactt gaaaaagtggcaccgagtcggtgcTTTTTT;(5)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaac ttgaaaaagtgTTTTTTT;以及(6)NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTT TTTTTT。在一些实施例中,序列(1)到(3)与来自嗜热链球菌CRISPR1的Cas9结合使用。在一些实施例中,序列(4)到(6)与来自化脓链球菌CRISPR1的Cas9结合使用。在一些实施例中,该tracr序列是一个与包含该tracr配对序列的转录物分开的转录物。

  重组模板

  在一些实施例中,还提供了重组模板。重组模板可以是如本文所述的另一个载体的组分,其被包含在一个分开的载体中,或者被提供为一个分开的多核苷酸。在一些实施例中,重组模板被设计为用作在同源重组中的模板,如在被作为CRISPR复合物的一部分的CRISPR酶切开或切割的靶序列之内或在其附近。模板多核苷酸可以具有任何适合的长度,如约或多于约10、15、20、25、50、75、100、150、200、500、1000个、或更多个核苷酸长度。在一些实施例中,该模板多核苷酸与包含该靶序列的多核苷酸的一部分互补。当进行最佳比对时,模板多核苷酸可能与靶序列的一个或多个核苷酸(例如约或多于约1、5、10、15、20个、或更多个核苷酸)重叠。在一些实施例中,当一个模板序列与包含靶序列的多核苷酸进行最佳比对时,该模板多核苷酸的最近的核苷酸在距离该靶序列的约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000个、或更多个核苷酸之内。在此提供了另外的关于HDR途径的讨论;例如,对于‘CRISPR复合物’。

  融合蛋白

  在一些实施例中,该CRISPR酶是包含一个或多个异源蛋白结构域(例如除了该CRISPR酶之外的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个结构域)的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何其他蛋白质,以及任选地在任何两个结构域之间的连接序列。可以融合到CRISPR酶上的蛋白质结构域的实例包括但不限于,表位标签、报告基因序列、以及具有下列活性的一者或多者的蛋白质结构域:甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签、和硫氧还蛋白(Trx)标签。报告基因的实例包括,但不限于,谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、萤光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青荧光蛋白(CFP)、黄色荧光蛋白(YFP)、以包括蓝色荧光蛋白(BFP)的自发荧光蛋白。CRISPR酶可以融合到编码一种蛋白质或蛋白质片段的基因序列上,所述蛋白质或蛋白质片段结合DNA分子或结合其他细胞分子,其包括,但不限于,麦芽糖结合蛋白(MBP)、S-tag、Lex A DNA结合结构域(DBD)融合物、GAL4DNA结合结构域融合物、以及单纯疱疹病毒(HSV)BP16蛋白融合物。可以形成包含CRISPR酶的融合蛋白的一部分的另外的结构域描述于US 20110059502中,通过引用将其并入本文。在一些实施例中,使用标记的CRISPR酶来鉴定靶序列的位置。

  可诱导系统

  在一些实施例中,CRISPR酶可以形成可诱导系统的组分。该系统的诱导性质将允许该系统利用一种能量形式对基因编辑或基因表达进行时空控制。该能量形式可以包括但不限于,电磁辐射、声能、化学能和热能。可诱导系统的实例包括四环素诱导型启动子(Tet-开(Tet-On)或Tet-关(Tet-Off))、小分子双杂交体转录激活系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素)。在一个实施例中,该CRISPR酶可以是以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(LITE)的一部分。光的组分可以包括CRISPR酶、光响应细胞色素异二聚体(例如,来自拟南芥)、以及转录激活/抑制结构域。诱导型DNA结合蛋白和关于使用它们的方法的其他实例提供在US 61/736465和US 61/721,283中,特此通过引用以其全文并入。

  递送

  在一些方面,本发明提供了以下方法,这些方法包括向宿主细胞递送一种或多种多核苷酸,如或如在此描述的一种或多种载体、其一种或多种转录物和/或一种或多种自其转录的蛋白。在一些方面,本发明进一步提供了通过这样的方法产生的细胞以及包括这样的细胞或由这样的细胞产生的动物。在一些实施例中,将与(并且任选地与其复合)指导序列组合的CRISPR酶递送至细胞。可以使用常规的病毒和非病毒基的基因转移方法将核酸引入哺乳动物细胞或靶组织中。可以使用这样的方法向培养物中或宿主生物中的细胞给予编码CRISPR系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如在此描述的载体的转录物)、裸核酸以及与递送赋形剂(如脂质体)复合的核酸。病毒载体递送系统包括DNA和RNA病毒,在被递送至细胞后它们具有游离型或整合型基因组。关于基因疗法程序的综述,参见安德森(Anderson),《科学》(Science)256:808-813(1992);纳贝尔(Nabel)&费尔格纳(Felgner),TIBTECH 11:211-217(1993);三谷(Mitani)&卡斯基(Caskey),TIBTECH 11:162-166(1993);狄龙(Dillon),TIBTECH 11:167-175(1993);米勒(Miller),《自然》(Nature)357:455-460(1992);范·布朗特(Van Brunt),《生物技术》(Biotechnology)6(10):1149-1154(1988);维涅(Vigne),《恢复神经学和神经科学》(Restorative Neurology and Neuroscience)8:35-36(1995);克雷默(Kremer)&佩里科德特(Perricaudet),《英国医学公报》(British Medical Bulletin)51(1):31-44(1995);哈嗒嗒(Haddada)等人,在《微生物学和免疫学当前主题》(Current Topics in Microbiology and Immunology)中多尔夫勒(Doerfler)和博姆(编辑)(1995);以及余(Yu)等人,《基因疗法》(Gene Therapy)1:13-26(1994)。

  核酸的非病毒递送方法包括脂转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸共轭物、裸DNA、人工病毒体以及DNA的试剂增强的摄取。脂转染描述于例如美国专利号5,049,386、4,946,787和4,897,355中并且脂转染试剂是市售的(例如,TransfectamTM和LipofectinTM)。适于多核苷酸的有效的受体识别脂转染的阳离子和中性脂质包括Felgner(费尔格纳),WO 91/17424;WO 91/16024的那些。递送可以针对细胞(例如体外或离体给予)或靶组织(例如体内给予)。

  脂质:核酸复合物(包括靶向的脂质体,如免疫脂质复合物)的制备是本领域的技术人员熟知的(参见例如,克丽丝特尔(Crystal),《科学》(Science)270:404-410(1995);布莱泽(Blaese)等人,《癌症基因疗法》(Cancer Gene Ther.)2:291-297(1995);贝尔(Behr)等人,《生物共轭化学》(Bioconjugate Chem.)5:382-389(1994);雷米(Remy)等人,《生物共轭化学》5:647-654(1994);高(Gao)等人,《基因疗法》(Gene Therapy)2:710-722(1995);艾哈迈德(Ahmad)等人,《癌症研究》(Cancer Res.)52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及4,946,787)。

  使用RNA或DNA病毒基的系统递送核酸利用将病毒靶向体内的特定细胞并将病毒有效负荷(payload)运至细胞核中的高度进化的过程。可以将病毒载体直接给予至患者(体内)或可以使用它们在体外处理细胞,并且任选地,可以将修饰的细胞给予至患者(离体)。常规的病毒基的系统可以包括用于基因转移的逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体以及单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法整合进宿主基因组中是可能的,这通常导致插入转基因的长期表达。另外,已经在不同细胞类型和靶组织中观察到高转导效率。

  可以通过掺入外源包膜蛋白,扩展靶细胞的潜在靶群而改变逆转录病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并典型地产生较高病毒效价的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将依赖于靶组织。逆转录病毒载体由顺式作用长末端重复组成,这些长末端重复具有包装多达6-10kb的外源序列的能力。最低量的顺式作用LTR对于载体的复制和包装而言是足够的,然后使用这些载体将治疗基因整合进靶细胞中,以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人类免疫缺陷病毒(HIV)及其组合的那些(参见例如,布赫谢尔(Buchscher)等人,《病毒学杂志》(J.Virol.)66:2731-2739(1992);约翰(Johann)等人,《病毒学杂志》66:1635-1640(1992);佐姆内尔费尔特(Sommnerfelt)等人,《病毒学》(Virol.)176:58-59(1990);威尔逊(Wilson)等人,《病毒学杂志》63:2374-2378(1989);米勒(Miller)等人,《病毒学杂志》65:2220-2224(1991);PCT/US 94/05700)。

  在另一个实施例中,考虑了科卡尔(Cocal)水泡性病毒包膜假型逆转录病毒载体颗粒(参见例如,转让给弗雷德·哈钦森癌症研究中心(Fred Hutchinson Cancer Research Center)的美国专利公开号20120164118)。科卡尔病毒属于水泡性病毒属,并且是一种哺乳动物水泡性口炎病原体。科卡尔病毒最初分离自特立尼达拉岛(Trinidad)的螨(琼克斯(Jonkers)等人,《美国兽医研究杂志》(Am.J.Vet.Res.)25:236-242(1964)),并且已经在特立尼达拉岛、巴西和阿根廷从昆虫、牛和马体内鉴定出感染。已经从天然地感染的节肢动物体内分离出感染哺乳动物的水泡性病毒中的许多,表明它们是媒介传播的。水疱性病毒抗体在居住于这些病毒是地方性的且是实验室获得的农村地区的人中间是常见的;人类感染通常导致流感样症状。科卡尔病毒包膜糖蛋白在氨基酸水平上与印第安纳VSV-G(VSV-G Indiana)具有71.5%一致性,并且水疱性病毒的包膜基因的系统发育比较显示科卡尔病毒在血清学上与印第安纳VSV-G株不同,但是在水疱性病毒中间与其最密切相关。琼克斯(Jonkers)等人,《美国兽医研究杂志》(Am.J.Vet.Res.)25:236-242(1964)和特拉瓦索德罗萨(Travassos da Rosa)等人,《美国热带药学与卫生学杂志》(Am.J.Tropical Med.&Hygiene)33:999-1006(1984)。科卡尔水疱性病毒包膜假型逆转录病毒载体颗粒可以包括例如慢病毒、α逆转录病毒、β逆转录病毒、γ逆转录病毒、δ逆转录病毒以及ε逆转录病毒载体颗粒,这些颗粒可以包括逆转录病毒Gag、Pol和/或一种或多种辅助蛋白以及科卡尔水疱性病毒包膜蛋白。在这些实施例的某些方面内,Gag、Pol和辅助蛋白是慢病毒的和/或γ逆转录病毒的。

  在瞬时表达是优选的应用中,可以使用腺病毒基系统。腺病毒基载体在许多细胞类型中能够具有非常高的转导效并且无需细胞分裂。用这样的载体,已经获得了较高的效价和表达水平。可以在相对简单的系统中大量地产生此载体。

  还可以使用腺相关病毒(“AAV”)载体转导具有靶核酸的细胞,例如,在体外产生核酸和肽,以及用于体内和离体基因疗法程序(参见例如,韦斯特(West)等人,《病毒学》(Virology)160:38-47(1987);美国专利号4,797,368;WO 93/24641;科丁(Kotin),《人类基因疗法》(Human Gene Therapy)5:793-801(1994);缪斯科斯卡(Muzyczka),《临床研究杂志》(J.Clin.Invest.)94:1351(1994))。重组AAV载体的构建描述于多个出版物中,包括美国专利号5,173,414;特拉特斯金(Tratschin)等人,《分子与细胞生物学》(Mol.Cell.Biol.)5:3251-3260(1985);特拉特斯金等人,《分子与细胞生物学》4:2072-2081(1984);埃尔莫奈特(Hermonat)&缪斯科斯卡(Muzyczka),《美国国家科学院院刊》(PNAS)81:6466-6470(1984);以及萨穆尔斯基(Samulski)等人,《病毒学杂志》(J.Virol.)63:03822-3828(1989)。

  典型地使用包装细胞形成能够感染宿主细胞的病毒粒子。这样的细胞包括包装腺病毒的293细胞和包含逆转录病毒的ψ2细胞或PA317细胞。在基因疗法中使用的病毒载体通常由将核酸载体包装进病毒粒子的细胞系产生。这些载体典型地包含包装并且随后整合进宿主所需的最低量序列,其他病毒序列由用于有待表达的一个或多个多核苷酸的表达盒替换。失去的病毒功能典型地由包装细胞系反式地提供。例如,在基因疗法中使用的AAV载体典型地仅具有来自AAV基因组的ITR序列,这些序列为包装并整合进宿主基因组所需。将病毒DNA包装进以下细胞系中,该细胞系包含编码辅助质粒的其他AAV基因,即rep和cap,但缺少ITR序列。该细胞系还可以被作为辅助者的腺病毒感染。该辅助病毒促进AAV载体的复制和从辅助质粒表达AAV基因。由于缺少ITR序列,未以显著的量包装该辅助质粒。可以通过例如与AAV相比腺病毒更加敏感的热处理减少腺病毒的污染。

  因此,AAV被认为是用作转导载体的理想候选物。这样的AAV转导载体可以包括足够的顺式作用功能,以在反式地提供的腺病毒或疱疹病毒或痘病毒(例如,牛痘病毒)辅助功能的存在下进行复制。可以使用重组AAV(rAAV)将外源基因携带进多种谱系的细胞中。在这些载体中,将AAV cap和/或rep基因从病毒基因组中缺失并且用选择的DNA区段置换。当前的AAV载体可以容纳多达插入DNA的4300个碱基。

  存在多种产生rAAV的方式,并且本发明提供了rAAV以及用于制备rAAV的方法。例如,一种或多种质粒包含或基本包含希望的构建体,将其转染进AAV感染的细胞中。此外,将第二或另外的辅助质粒共转染进这些细胞中,以提供重组病毒构建体的复制和包装必需的AAV rep和/或cap基因。在这些条件下,AAV的rep和/或cap蛋白反式地作用,以刺激rAAV构建体的复制和包装。转染后两至三天,收获rAAV。传统地,从细胞中收获rAAV连同腺病毒。然后,通过热处理使污染的腺病毒失活。在本发明中,有利地不从细胞自身收获rAAV,而是从细胞上清液收获rAAV。因此,在初始方面,本发明提供了制备rAAV,并且除前述内容之外,可以通过以下方法制备rAAV,该方法包括或基本由以下组成:用包含外源DNA(包括供表达的DNA)和辅助病毒(例如,腺病毒、疱疹病毒、痘病毒如牛痘病毒)的rAAV感染易感细胞,其中该rAAV缺少功能性cap和/或rep(以及提供该rAAV缺少的cap和/或rev功能的辅助病毒(例如,腺病毒、疱疹病毒、痘病毒如牛痘病毒));或用包含外源DNA(包括供表达的DNA)的rAAV感染易感细胞,其中该重组体缺少功能性cap和/或rep,并且用提供该rAAV缺少的cap和/或rep功能的质粒转染所述细胞;或用包含外源DNA(包括供表达的DNA)的rAAV感染易感细胞,其中该重组体缺少功能性cap和/或rep,其中所述细胞提供该重组体缺少的cap和/或rep功能;或用缺少功能性cap和/或rep的AAV和用于将外源DNA插入该重组体中这样使得由该重组体表达该外源DNA并且用于提供rep和/或cap功能的质粒转染易感细胞,由此转染产生包含该外源DNA(包括供表达的DNA)的缺少功能性cap和/或rep的rAAV。

  该rAAV可以来自如在此描述的AAV,并且有利地可以是rAAV1、rAAV2、AAV5或具有杂合衣壳的rAAV,该具有杂合衣壳的rAAV可以包括AAV1、AAV2、AAV5或其任何组合。可以相对于有待被rAAV靶向的细胞而选择rAAV的AAV;例如,可以选择用于靶向脑或神经元细胞的AAV血清型1、2、5或杂合衣壳AAV1、AAV2、AAV5或其任何组合;并且可以选择用于靶向心脏组织的AAV4。

  除293细胞之外,可以在本发明的实践中使用的其他细胞以及这些细胞的某些体外AAV血清型的相对感染性(参见格林,D.(Grimm,D.)等人,《病毒学杂志》(J.Virol.)82:5887-5911(2008))如下:

  

  本发明提供了包含或基本上由编码CRISPR(规律间隔成簇短回文重复)系统的外源核酸分子组成的rAAV,例如,多个盒,该多个盒包括或包含第一盒,该第一盒包括或基本上由启动子、编码CRISPR相关(Cas)蛋白(假定的核酸酶或解旋酶蛋白)(例如,Cas9)的核酸分子和终止子组成,以及两个或更多个,有利地直到载体的包装尺寸极限,例如总共(包括第一盒)五个盒,这些盒包括或基本上由启动子、编码指导RNA(gRNA)的核酸分子和终止子组成(例如,每个盒示意性地由启动子-gRNA1-终止子、启动子-gRNA2-终止子...启动子-gRNA(N)-终止子表示(其中N是可以插入的处于载体的包装尺寸极限的上限的数目)),或两个或更多个单独的rAAV,每个rAAV包含一个或多于一个CRISPR系统盒,例如,第一rAAV包含第一盒,该第一盒包括或基本上由启动子、编码Cas(例如,Cas9)的核酸分子和终止子组成,并且第二rAAV包含多个,四个,盒,这些盒包括或基本上由启动子、编码指导RNA(gRNA)的核酸分子和终止子组成(例如,每个盒示意性地由启动子-gRNA1-终止子、启动子-gRNA2-终止子...启动子-gRNA(N)-终止子表示(其中N是可以插入的处于载体的包装尺寸极限的上限的数目))。由于rAAV是一种DNA病毒,因此涉及AAV或rAAV的在此讨论中的核酸分子有利地是DNA。在一些实施例中,启动子有利地是人类突触蛋白I启动子(hSyn)。

  用于将核酸递送至细胞的另外的方法是本领域的技术人员已知的。参见例如通过引用结合在此的US 20030087817。还参见坎纳斯特(Kanasty)参考文献,也通过引用结合在此并且在此讨论。

  在一些实施例中,用一种或多种在此描述的载体瞬时地或非瞬时地转染宿主细胞。在一些实施例中,当细胞天然地出现在受试者体内时将其转染。在一些实施例中,被转染的细胞取自受试者。在一些实施例中,该细胞来源于取自受试者的细胞,如细胞系。用于组织培养的多种多样的细胞系在本领域是已知的。细胞系的实例包括但不限于,C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、海拉B、海拉T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎成纤维细胞、3T3Swiss、3T3-L1、132-d5人类胎儿成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、维洛(Vero)细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因变种。细胞系可获得自本领域的技术人员已知的多种来源(参见例如,美国典型培养物保藏中心(American Type Culture Collection)(ATCC)(马纳萨斯(Manassus),弗吉尼亚州))。在一些实施例中,使用用一种或多种在此描述的载体转染的细胞建立新的细胞系,该新的细胞系包括一种或多种载体来源的序列。在一些实施例中,使用用如在此描述的CRISPR系统的组分转染(如通过用一种或多种载体进行瞬时转染或用RNA进行转染)且通过CRISPR复合物的活性修饰的细胞建立新的细胞系,该新的细胞系包括以下细胞,这些细胞包含吸水但是缺少任何其他外源序列。在一些实施例中,在评估一种或多种测试化合物中使用用一种或多种在此描述的载体瞬时或非瞬时转染的细胞或来源于这样的细胞的细胞系。

  在一些实施例中,使用一种或多种在此描述的载体产生非人转基因动物或转基因植物。在一些实施例中,该转基因动物是一种哺乳动物,如小鼠、大鼠或兔。用于产生转基因动物和植物的方法在本领域是已知的,并且通常以如在此描述的细胞转染方法开始。

  在另一个实施例中,可以考虑用具有针阵列的流体递送装置(参见例如,转让给弗雷德·哈钦森癌症研究中心的美国专利公开号20110230839)将CRISPR Cas递送至实体组织。用于将流体递送至实体组织的美国专利公开号20110230839的装置可以包括多个排列为阵列的针;多个储库,每个储库都与该多个针中的对应的针处于流体联通;以及多个致动器,这些致动器可操作地耦合至该多个储库中的对应的储库并被配置为控制该储库内的流体压力。在某些实施例中,该多个致动器中的每个都可以包括多个柱塞中的一个,该多个柱塞中的每个的第一端都被接收进该多个储库中的对应的储库中,并且在某些另外的实施例中,该多个柱塞中的柱塞在其对应的第二端被可操作地耦合在一起,以便可以同时被按下。某些仍另外的实施例可以包括一个柱塞驱动器,该柱塞驱动器被配置为以选择性地可变速率按下所有该多个柱塞。在其他实施例中,该多个致动器中的每个都可以包括多个流体传输线中的一个,这些流体传输线具有第一和第二端,该多个流体传输线中的每个的第一端被耦合至该多个储库中的对应的储库。在其他实施例中,该装置可以包括一个流体压力源,并且该多个致动器中的每个在该流体压力源与该多个储库中的对应的储库之间都包括一个液压耦合器。在另外的实施例中,该流体压力源可以包括压缩机、真空蓄能器、蠕动泵、主缸、微流体泵以及阀中的至少一个。在另一个实施例中,该多个针中的每个都可以包括多个沿其长度分布的端口。

  修饰靶标

  在一个方面,本发明提供了修饰真核细胞中的靶多核苷酸的方法,这些方法可以在体内、离体或在体外。在一些实施例中,该方法包括对来自人或非人动物的细胞或细胞群进行取样或活组织检查,并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物中。对于重新引入的细胞,特别优选的是这些细胞是干细胞,但是原代肝细胞也是优选的。

  在一些实施例中,该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该CRISPR复合物包括与杂交或可杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。

  在一个方面,本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中,该方法包括允许CRISPR复合物结合到该多核苷酸上,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中该CRISPR复合物包括与杂交或可杂交到在所述多核苷酸内的靶序列上的指导序列复合的CRISPR酶,其中所述指导序列连接到tracr配对序列上,该tracr配对序列进而杂交到tracr序列上。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。事实上,这些取样、培养和重新引入选择跨本发明的多个方面而适用。

  确实,在本发明的任何方面,该CRISPR复合物可以包括与杂交或可杂交到靶序列上的指导序列复合的CRISPR酶,其中所述指导序列可以连接到tracr配对序列上,该tracr配对序列进而可以杂交到tracr序列上。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。

  试剂盒

  在一个方面,本发明提供了以下试剂盒,这些试剂盒包含披露于以上方法和组合物中的元件中的任何一个或多个。元件可以单独地或组合地提供,并且可以被提供于任何适合的容器中,如小瓶、瓶子或管。在一些实施例中,该试剂盒包括一种或多种语言,例如多于一种语言的说明书。

  在一些实施例中,试剂盒包括一种或多种用于在利用在此描述的元件中的一种或多种的方法中使用的试剂。试剂可以被提供于任何适合的容器中。例如,试剂盒可以提供一种或多种反应或存储缓冲液。可以按在具体测定中可用的形式或按在使用之前需要添加一种或多种其他组分的形式(例如按浓缩或冻干形式)提供试剂。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施例中,该缓冲液是碱性的。在一些实施例中,该缓冲液具有从约7至约10的pH。在一些实施例中,该试剂盒包括一个或多个寡核苷酸,该一个或多个寡核苷酸对应于用于插入进载体中的指导序列,以便可操作地连接该指导序列和调节元件。在一些实施例中,该试剂盒包括同源重组模板多核苷酸。在一些实施例中,该试剂盒包括在此描述的载体中的一个或多个和/或在此描述的多核苷酸中的一个或多个。该试剂盒可以有利地允许提供本发明的系统的所有元件。

  CRISPR复合物

  在一个方面,本发明提供了用于使用CRISPR系统的一个或多个元件的方法。本发明的CRISPR复合物提供了用于修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有多种多样的实用性,包括修饰(例如,缺失、插入、转位、失活、激活)多种细胞类型中的靶多核苷酸。正因为如此,本发明的CRISPR复合物在例如基因疗法、药物筛选、疾病诊断以及预后中具有广阔的应用谱。示例性CRISPR复合物包括与指导序列复合的CRISPR酶,该指导序列与靶多核苷酸内的靶序列杂交或可与其杂交。该指导序列与tracr配对序列连接,该tracr配对序列进而与tracr序列杂交。

  在一个实施例中,本发明提供了一种切割靶多核苷酸的方法。该方法包括使用CRISPR复合物修饰靶多核苷酸,该CRISPR复合物结合到该靶多核苷酸上并且实施所述靶多核苷酸的切割。典型地,当被引入进细胞中时,本发明的CRISPR复合物在基因组序列中产生一个断裂(例如,单链或双链断裂)。例如,可以使用该方法切割细胞中的疾病基因。

  由该CRISPR复合物产生的断裂可以通过修复过程进行修复,如易出错的非同源末端连接(NHEJ)途径或高保真同源定向修复(HDR)(图29)。在这些修复过程期间,可以将外源多核苷酸模板引入进基因组序列中。在一些方法中,该HDR过程被用于修饰基因组序列。例如,将外源多核苷酸模板引入进细胞中,该外源多核苷酸模板包括有待整合的、侧翼为上游序列和下游序列的序列。上游和下游序列与染色体中的整合位点的任一侧都具有序列相似性。

  在希望的情况下,供体多核苷酸可以是DNA,例如DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、一段线性DNA、PCR片段、裸核酸或与递送赋形剂(如脂质体或泊洛沙姆)复合的核酸。

  该外源多核苷酸模板包括有待整合的序列(例如,突变的基因)。供整合的序列可以是对细胞而言内源或外源的序列。有待整合的序列的实例包括编码蛋白质的多核苷酸或非编码RNA(例如,微小RNA)。因此,供整合的序列可以可操作地连接到一个或多个适当的控制序列上。可替代地,有待整合的序列可以提供一种调节功能。

  选择外源多核苷酸模板中的上游和下游序列,以促进感兴趣的染色体序列与供体多核苷酸之间的重组。该上游序列是一个与供整合的靶向位点的上游的基因组序列具有序列相似性的核酸序列。类似地,该下游序列是一个与供整合的靶向位点的染色体序列下游具有序列相似性的核酸序列。外源多核苷酸模板中的上游和下游序列与靶向的基因组序列可以具有75%、80%、85%、90%、95%或100%序列一致性。优选地,外源多核苷酸模板中的上游和下游序列与靶向的基因组序列具有约95%、96%、97%、98%、99%或100%序列一致性。在一些方法中,外源多核苷酸模板中的上游和下游序列与靶向的基因组序列具有约99%或100%序列一致性。

  上游或下游序列可以包括从约20bp至约2500bp,例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有约200bp至约2000bp、约600bp至约1000bp或更具体地约700bp至约1000bp。

  在一些方法中,该外源多核苷酸模板可以进一步包括一种标记。这样的一种标记使得容易地筛选靶向的整合。适合的标记的实例包括限制性位点、荧光蛋白或选择性标记。可以使用重组技术构建本发明的外源多核苷酸模板(参见例如,萨姆布鲁克(Sambrook)等人,2001和奥苏贝尔(Ausubel)等人,1996)。

  在一种用于通过整合外源多核苷酸模板而修饰靶多核苷酸的示例性方法中,通过CRISPR复合物将双链断裂引入进基因组序列中,经由同源重组通过外源多核苷酸模板而修复该断裂,这样使得将该模板整合进基因组中。双链断裂的存在促进模板的整合。

  在其他实施例中,本发明提供了一种修饰多核苷酸在真核细胞中的表达的方法。该方法包括通过使用结合到多核苷酸上的CRISPR复合物增加或降低靶多核苷酸的表达。

  在一些方法中,可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如,当CRISPR复合物结合到细胞中的靶序列上时,该靶多核苷酸失活,这样使得该序列不被转录,该编码蛋白不被产生,或者该序列不会像野生型序列一样起作用。例如,可以使蛋白质或微小RNA编码序列失活,这样使得该蛋白质不被产生。

  在一些方法中,可以使控制序列失活,这样使得它不再作为控制序列起作用。如在此使用,“控制序列”是指影响核酸序列的转录、翻译或可及性的任何核酸序列。控制序列的实例包括启动子、转录终止子和增强子,它们是控制序列。

  失活的靶序列可以包括缺失突变(即,缺失一个或多个核苷酸)、插入突变(即,插入一个或多个核苷酸)或无义突变(即,用另一个核苷酸取代一个单核苷酸,这样使得引入终止密码子)。在一些方法中,靶序列的失活导致该靶序列的“敲除(knock-out)”。

  疾病模型

  可以使用本发明的方法产生可以用作疾病模型的动物或细胞。如在此使用,“疾病”是指受试者的疾病、障碍或适应症。例如,可以使用本发明的方法产生以下动物或细胞,该动物或细胞在一个或多个与疾病相关的核酸序列中包括修饰,或以下植物、动物或细胞,一个或多个与疾病相关的核酸序列的表达在该植物、动物或细胞中被改变。这样的核酸序列可以编码疾病相关蛋白序列或可以是疾病相关控制序列。因此,应该理解的是在本发明的实施例中,植物、受试者、患者、生物或细胞可以是非人受试者、患者、生物或细胞。因此,本发明提供了由本发明方法产生的动物或细胞或其子代。该子代可以是产生的动物的克隆或可以通过与同一物种的其他个体杂交而由有性繁殖产生,以在其后代中基因渗入另外的令人希望的性状。在多细胞生物(特别是动物)的情况下,该细胞可以是在体内或离体的。在该细胞处于培养中的情况下,如果满足适当的培养条件并且优选地,如果该细胞适合地适于此目的(例如,干细胞),则可以建立细胞系。因此,还设想了细胞系。

  在一些方法中,可以使用疾病模型研究突变对动物或细胞的影响以及使用在疾病研究中常用的措施对疾病的发展和/或进展的影响。可替代地,这样的一种疾病模型有用于研究药物活性化合物对疾病的影响。

  在一些方法中,可以使用疾病模型评估潜在的基因疗法策略的效力。也就是说,可以将疾病相关基因或多核苷酸进行修饰,这样使得疾病发展和/或进展被抑制或减少。具体而言,该方法包括修饰疾病相关基因或多核苷酸,这样使得产生一种改变的蛋白质,其结果是,该动物或细胞具有改变的反应。因此,在一些方法中,可以将基因修饰动物与易患该疾病的动物进行比较,这样使得可以评估基因疗法事件的效果。

  在另一个实施例中,本发明提供了一种研发生物活性剂的方法,该生物活性剂调制与疾病基因相关的细胞信号传导事件。该方法包括使测试化合物与细胞接触,该细胞包括一种或多种载体,这一种或多种载体驱动CRISPR酶、连接到tracr配对序列上的指导序列和tracr序列中的一种或多种的表达;并且检测读出的变化,该变化指示与例如包含在该细胞中的疾病基因的突变相关的细胞信号传导事件的减少或增加。

  可以与用于筛选细胞功能变化的本发明的方法组合来构建细胞模型(包括如在此所述的类器官或细胞集合)、或动物模型。可以使用这样的一种模型研究由本发明的CRISPR复合物修饰的基因组序列对感兴趣的细胞功能的影响。例如,可以使用细胞功能模型研究修饰的基因组序列对细胞内信号传导或细胞外信号传导的影响。可替代地,可以使用细胞功能模型研究修饰的基因组序列对感知觉的影响。在一些这样的模型中,修饰一个或多个与该模型中的信号传导生化学途径相关的基因组序列。

  已经具体研究了若干疾病模型。这些疾病模型包括新生(de novo)自闭症风险基因CHD8、KATNAL2和SCN2A;以及综合征性自闭症(安格曼综合征(Angelman Syndrome))基因UBE3A。这些基因以及所得的自闭症模型当然是优选的,但用于显示本发明的跨基因和对应的模型的广阔的适用性。

  可以通过当将测试模型细胞和对照细胞与候选试剂接触时,测定它们之间的对应的基因的mRNA水平差异而确定一个或多个与信号传导生化途径相关的基因组序列的改变的表达。可替代地,通过检测编码的多肽或基因产物的水平差异而确定与信号传导生化途径相关的序列的差异表达。

  为了在mRNA转录物或对应的多核苷酸水平上测定试剂诱导的变化,首先根据本领域的标准方法提取包含在样品中的核酸。例如,可以根据陈述于萨姆布鲁克(Sambrook)等人(1989)中的程序使用各种水解酶分离mRNA或遵循由制造商提供的随附说明书通过核酸结合树脂提取mRNA。然后,根据本领域广泛已知的方法或基于在此示例的方法,通过扩增程序或常规的杂交测定(例如Northern印迹分析)检测包含在提取的核酸样品中的mRNA。

  出于本发明的目的,扩增意指利用引物和聚合酶的能够以合理的保真度复制靶序列的任何方法。可以通过天然或重组DNA聚合酶,如TaqGoldTM、T7DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段以及逆转录酶进行扩增。一种优选的扩增方法是PCR。具体而言,可以使分离的RNA经受逆转录测定,该测定与定量聚合酶链式反应(RT-PCR)耦合,以便定量与信号传导生化途径相关的序列的表达水平。

  在扩增测定中可以实时地执行基因表达水平的检测。在一个方面,可以用荧光DNA结合剂直接使扩增产物可视化,这些荧光DNA结合剂包括但不限于DNA嵌入剂和DNA沟结合剂。因为掺入进双链DNA分子中的嵌入剂的量典型地与扩增DNA产物的量成比例,可以常规地通过使用本领域的常规光学系统定量嵌入的染料的荧光而确定扩增产物的量。适于本申请的DNA结合染料包括SYBR绿、SYBR蓝、DAPI、碘化丙锭、Hoeste、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素(fluorcoumanin)、玫瑰树碱、道诺霉素、氯喹、偏端霉素D、色霉素、乙菲啶(homidium)、光辉霉素、多吡啶钌、安曲霉素等。

  在另一个方面,可以在扩增反应中利用其他荧光标记物(如序列特异的探针),以促进扩增产物的检测和定量。基于探针的定量扩增依赖于希望的扩增产物的序列特异的检测。它利用荧光的靶标特异的探针(例如,探针),从而导致增加的特异性和敏感性。用于进行基于探针的定量扩增的方法本领域是确立的并且教导于美国专利号5,210,015中。

  在又另一个方面,可以使用与以下序列具有序列同源性的杂交探针进行常规的杂交测定,这些序列与信号传导生化途径相关。典型地,在杂交反应中,允许探针和与信号传导生化途径相关的序列形成稳定的复合物,这些序列被包含在来源于测试受试者的生物样品内。本领域的技术人员应该意识到的是,在将反义核酸用作探针核酸的情况下,提供于样品中的靶多核苷酸被选择为与该反义核酸的序列互补。相反地,在核苷酸探针是有义核酸的情况下,该靶多核苷酸被选择为与该有义核酸的序列互补。

  可以在不同严格度条件下进行杂交。用于实践本发明的适合的杂交条件是这样的,使得探针和与信号传导生化途径相关的序列之间的识别相互作用既是充分特异的又是充分稳定的。增加杂交反应的严格度的条件在本领域是广泛已知且公开的。参见例如,(萨姆布鲁克(Sambrook)等人,(1989);非放射性原位杂交应用手册(Nonradioactive In Situ Hybridization Application Manual),宝灵曼公司(Boehringer Mannheim),第二版)。可以使用固定在任何固体支持物上的探针进行杂交测定,所述固体支持物包括但不限于硝化纤维、玻璃、硅以及多种基因阵列。如描述于美国专利号5,445,934中,在高密度基因芯片上执行优选的杂交测定。

  对于在杂交测定过程中形成的探针-靶标复合物的常规检测,将核苷酸探针络合至可检测标记物上。适于在本发明中使用的可检测标记物包括通过光化学、生物化学、光谱学、免疫化学、电学、光学或化学手段可检测的任何组合物。多种多样的适当的可检测标记物在本领域是已知的,包括荧光或化学发光标记物、放射性同位素标记物、酶或其他配体。在优选的实施例中,可能希望的是利用荧光标记物或酶标签,如地高辛、β-半乳糖苷酶、脲酶、碱性磷酸酶或过氧化物酶、亲和素/生物素复合物。

  用于检测或定量杂交强度的检测方法将典型地取决于以上选择的标记物。例如,可以使用照相底片或感光成像仪检测放射性标记物。可以使用检测发射光的光检测器检测并定量荧光标记物。典型地通过为酶提供底物并测量由酶对底物的作用而产生的反应产物来检测酶标记物;并且最后,通过简单地使着色的标记物可视化而检测比色标记物。

  还可以通过检查对应的基因产物确定与信号传导生化途径相关的序列的试剂诱导的表达变化。确定蛋白质水平典型地涉及a)使包含在生物样品中的蛋白质与特异性结合到与信号传导生化途径相关的蛋白质上的试剂接触;并且(b)鉴定这样形成的任何试剂:蛋白质复合物。在此实施例的一个方面,特异性结合与信号传导生化途径相关的蛋白质的该试剂是一种抗体,优选单克隆抗体。

  通过在将允许在该试剂和与信号传导生化途径相关的蛋白质之间形成复合物的条件下,通过使该试剂与来源于测试样品的与信号传导生化途径相关的蛋白质的样品接触而进行该反应。可以根据本领域中的标准程序直接地或间接地检测复合物的形成。在直接检测方法中,这些试剂提供有可检测的标记物并且未反应的试剂可以从复合物中除去;由此剩余的标记物的量指示形成的复合物的量。对于这样的方法,优选的是选择即使在严格洗涤条件过程中仍附接至这些试剂上的标记物。优选的是,该标记物不干扰结合反应。在替代方案中,间接检测程序可以使用包含用化学方法或酶方法引入的标记物的试剂。令人希望的标记物通常不干扰所得的试剂:多肽复合物的结合或稳定性。然而,标记物典型地被设计成是用于有效结合并且因此产生可检测的信号的抗体可及的。

  适于检测蛋白质水平的多种多样的标记物在本领域是已知的。非限制性实例包括放射性同位素、酶、胶体金属、荧光化合物、生物发光化合物以及化学发光化合物。

  可以通过标准定量测定定量在结合反应过程中形成的试剂:多肽复合物的量。如上所示,可以通过仍留在结合位点处的标记物的量直接测量试剂:多肽复合物的形成。在一个替代方案中,测试与信号传导生化途径相关的蛋白质与标记的类似物结合特定试剂上的位点的竞争能力。在此竞争测定中,捕获的标记物的量与存在于测试样品中的与信号传导生化途径相关的蛋白质序列的量成反比。

  多种用于蛋白质分析的基于以上概括的总则的技术在本领域是可获得的。它们包括但不限于放射免疫测定、ELISA(酶联免疫放射测定)、“夹层”免疫测定、免疫放射测定、原位免疫测定(使用例如,胶体金、酶或放射性同位素标记物)、蛋白质印迹分析、免疫沉淀测定、免疫荧光测定以及SDS-PAGE。

  特异性识别或结合到与信号传导生化途径相关的蛋白质上的抗体对于执行前述蛋白质分析而言是优选的。在希望的情况下,可以使用识别特定类型的翻译后修饰(例如,信号传导生化途径诱导的修饰)的抗体。翻译后修饰包括但不限于糖基化、脂化、乙酰化以及磷酸化。这些抗体可以购自商业供应商。例如,特异性识别酪氨酸磷酸化蛋白质的抗磷酸酪氨酸抗体可以获得自多个供应商,包括英杰公司和珀金埃尔默公司(Perkin Elmer)。抗磷酸酪氨酸抗体在检测响应于ER应激而在其酪氨酸残基上存在差异磷酸化的蛋白质中是特别有用的。这样的蛋白质包括但不限于真核翻译起始因子2α(eIF-2α)。可替代地,可以通过用展示出希望的翻译后修饰的靶蛋白免疫宿主动物或抗体产生细胞而使用常规的多克隆或单克隆抗体技术产生这些抗体。

  在实践主题方法中,可以令人希望的是,在不同身体组织中、在不同细胞类型中和/或在不同亚细胞结构中辨别与信号传导生化途径相关的蛋白质的表达谱。可以通过使用能够结合到优先表达于某些组织、细胞类型或亚细胞结构中的蛋白质标记的组织特异的、细胞特异的或亚细胞结构特异的抗体进行这些研究。

  还可以通过检查基因产物相对于对照细胞的活性变化而确定与信号传导生化途径相关的基因的改变的表达。与信号传导生化途径相关的蛋白质的试剂诱导的活性变化的测定将取决于处于研究之下的生物活性和/或信号传导途径。例如,在该蛋白质是一种激酶的情况下,可以通过本领域已知的多种测定确定它磷酸化一种或多种下游底物的能力的变化。代表性测定包括但不限于用抗体进行免疫印迹和免疫沉淀,这些抗体是如识别磷酸化蛋白质的抗磷酸酪氨酸抗体。此外,可以通过高通量化学发光测定检测激酶活性,如AlphaScreenTM(可获得自珀金埃尔默公司)和eTagTM测定(陈-辉(Chan-Hui)等人(2003)《临床免疫学》(Clinical Immunology)111:162-174)。

  在与信号传导生化途径相关的蛋白质是使得细胞内pH条件波动的信号传导级联的一部分的情况下,可以将pH敏感的分子(如荧光pH染料)用作报道分子。在与信号传导生化途径相关的蛋白质是一种离子通道的另一个实例中,可以监测膜电位和/或细胞内离子浓度的波动。多种商业试剂盒和高通量装置特别适于快速且稳健地筛选离子通道调节剂。代表性仪器包括FLIPRTM(分子设备公司(Molecular Devices,Inc.))和VIPR(奥罗拉生物科学公司(Aurora Biosciences))。这些仪器能够同时检测微板的1000多个样品孔中的反应,并且能够提供一秒内或甚至一毫秒内的实时测量和功能数据。

  在实践在此披露的任何方法中,可以经由本领域已知的一种或多种方法将适合的载体引入进细胞或胚胎中,这些方法包括但不限于,显微注射、电穿孔、声致穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染、磁转染、脂转染、刺穿转染(impalefection)、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体进行递送。在一些方法中,通过显微注射将该载体引入进胚胎中。可以将这个或这些载体显微注射进胚胎的细胞核或细胞质中。在一些方法中,通过核转染将这个或这些载体引入进细胞中。

  CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用DNA)。

  靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是一个以异常高的水平被表达的基因;它可以是一个以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。

  CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用DNA)。不希望被理论所束缚,据信该靶序列应该与PAM(原型间隔子邻近基序)相关;也就是说,与由CRISPR复合物识别的短序列相关。对PAM的精确序列和长度要求取决于使用的CRISPR酶而不同,但是PAM典型地是临近原型间隔子(也就是说,靶序列)的2-5个碱基对序列。在以下实例部分中给出PAM序列的实例,并且熟练人员将能够鉴定与给定的CRISPR酶一起使用的另外的PAM序列。

  CRISPR复合物的靶多核苷酸可以包括多个疾病相关基因和多核苷酸以及信号传导生化途径相基因和多核苷酸,如分别提交于2012年12月12日和2013年1月2日、标题均为用于序列操纵的系统方法和组合物(SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION)的分别具有博德(Broad)参考号BI-2011/008/WSGR案卷号44063-701.101和BI-2011/008/WSGR案卷号44063-701.102的美国临时专利申请61/736,527和61/748,427中所列举,将所有这些申请的内容通过引用以其全文结合在此。

  靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是一个以异常高的水平被表达的基因;它可以是一个以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。

  疾病相关基因和多核苷酸的实例列于表A和B中。在万维网上可获得的疾病具体信息可获得自约翰斯·霍普金斯大学的麦考斯克-纳森遗传医学研究所(McKusick-Nathans Institute of Genetic Medicine,Johns Hopkins University)(巴尔的摩,马里兰州)和国立医学图书馆的国家生物技术信息中心(National Center for Biotechnology Information,National Library of Medicine)(贝塞斯达,马里兰州)。信号传导生化途径相关基因和多核苷酸的实例列于表C中。

  这些基因和途径的突变可以导致产生不当的蛋白质或以不当的量影响功能的蛋白质。通过引用而特此结合来自于2012年12月12日提交的美国临时申请61/736,527的基因、疾病和蛋白质的另外的实例。这样的基因、蛋白质和途径可以是CRISPR复合物的靶多核苷酸。

  表A

  表B:

  表C:

  上述代谢相关的靶标(尤其是高亮的那些)在它们被表达于肝脏的情况下是特别优选的。

  本发明的实施例还涉及与敲除基因、扩增基因以及修复与DNA重复不稳定性和神经障碍相关的具体突变有关的方法和组合物(罗伯特D.·威尔斯(Robert D.Wells)、芦沢哲夫(Tetsuo Ashizawa),遗传不稳定性与神经疾病(Genetic Instabilities and Neurological Diseases),第二版,学术出版社(Academic Press),2011年10月13日-《医学》(Medical))。已经发现串联重复序列的特定方面对超过二十种人类疾病负责(重复不稳定新见:RNA·DNA杂交体的作用(New insights into repeat instability:role of RNA·DNA hybrids).麦基弗EI(McIvor EI)、波拉克U(Polak U)、纳皮尔拉拉M(Napierala M).《RNA生物学》(RNA Biol.)2010年9月-10月;7(5):551-8)。可以利用CRISPR-Cas系统校正基因组不稳定性缺陷。

  本发明的一个另外的方面涉及利用CRISPR-Cas系统校正EMP2A和EMP2B基因缺陷,这些基因已经被鉴定为与拉福拉病(Lafora disease)相关。拉福拉病是一种由可以作为青年期的癫痫发作而开始的进行性肌阵挛性癫痫表征的常染色体隐性病症。该疾病的少数病可以由尚未鉴定的基因的突变引起。该疾病引起发作、肌肉痉挛、行走困难、痴呆,并且最终引起死亡。当前没有疗法被证明有效对抗疾病进展。与癫痫相关的其他遗传异常还可以靶向CRISPR-Cas系统并且基础遗传学进一步描述于由朱利亚诺阿文济尼(Giuliano Avanzini)、杰弗里L.诺贝尔斯(Jeffrey L.Noebels)编辑的《癫痫与遗传癫痫遗传学》(Genetics of Epilepsy and Genetic Epilepsies),马里亚尼儿科神经学基金会(Mariani Foundation Paediatric Neurology):20;2009)中。

  转让给加莫生物科技公司(Sangamo BioSciences,Inc.)的美国专利公开号20110158957的涉及使T细胞受体(TCR)基因失活的方法也可以被修饰为本发明的CRISPR Cas系统。在另一个实例中,转让给加莫生物科技公司的美国专利公开号20100311124和转让给Cellectis公司的美国专利公开号20110225664的方法(两者都涉及使谷氨酰胺合成酶基因表达基因失活)也可以被修饰为本发明的CRISPR Cas系统。。

  本发明的若干另外的方面涉及校正与范围广泛的遗传性疾病相关的缺陷,这些遗传性疾病在专题小节遗传性障碍(Genetic Disorders)下被进一步描述于国立卫生研究院的网站(网址为health.nih.gov/topic/GeneticDisorders)。遗传性脑病可以包括但不限于,肾上腺脑白质营养不良、胼胝体发育不全、艾卡尔迪综合征(Aicardi Syndrome)、阿尔佩斯病(Alpers'Disease)、阿尔茨海默病、巴特综合征(Barth Syndrome)、巴藤病(Batten Disease)、CADASIL、小脑变性、费波瑞病(Fabry's Disease)、格斯特曼-施特劳斯纳病(Gerstmann-Straussler-Scheinker Disease)、亨廷顿病以及其他三联体重复障碍、莱氏病(Leigh's Disease)、莱施-奈恩综合征、门克斯病、线粒体肌病以及NINDS空洞脑(Colpocephaly)。这些疾病在小节遗传性脑部障碍(Genetic Brain Disorders)下被进一步描述于国立卫生研究院的网站。

  在一些实施例中,该病症可以是瘤形成。在一些实施例中,在该病症是瘤形成的情况下,有待被靶向的基因是列于表A中的那些基因中的任一种(在这种情况下是PTEN等)。在一些实施例中,该病症可以是年龄相关性黄斑变性。在一些实施例中,该病症可以是一种精神分裂症障碍。在一些实施例中,该病症可以是一种三核苷酸重复障碍。在一些实施例中,该病症可以是脆性X综合征。在一些实施例中,该病症可以是一种分泌酶相关障碍。在一些实施例中,该病症可以是一种朊病毒相关障碍。在一些实施例中,该病症可以是ALS。在一些实施例中,该病症可以是一种药物成瘾。在一些实施例中,该病症可以是自闭症。在一些实施例中,该病症可以是阿尔茨海默病。在一些实施例中,该病症可以是炎症。在一些实施例中,该病症可以是帕金森病。

  例如,美国专利公开号20110023145描述了使用锌指核酸酶基因修饰与自闭症谱系障碍(ASD)相关的细胞、动物以及蛋白质。自闭症谱系障碍(ASD)是一组由社会交往和沟通的质量损伤以及行为、兴趣和活动的限制性重复和刻板性模式表征的障碍。这三种障碍自闭症、阿斯佩格综合征(AS)和未另行规定的广泛性发育障碍(PDD-NOS)是具有不同的严重程度、相关智力功能和医疗条件的同一障碍的连续体。ASD是主要由遗传决定的障碍,具有大约90%遗传力。

  美国专利公开号20110023145包括编辑任何编码与ASD相关的蛋白质的染色体序列,这些序列可以被应用于本发明的CRISPR Cas系统。典型地基于与ASD相关的蛋白质与ASD的发生率或适应症的实验相关性选择与ASD相关的蛋白质。例如,相对于缺少ASD的群体,在具有ASD的群体中,与ASD相关的蛋白质的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地,可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定与ASD相关的蛋白质,包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

  可能和与ASD相关的蛋白质相关的疾病状态或障碍的非限制性实例包括自闭症、阿斯佩格综合征(AS)、未另行规定的广泛性发育障碍(PDD-NOS)、雷特综合征、结节性硬化、苯丙酮尿症、史-伦-奥三氏综合征(Smith-Lemli-Opitz syndrome)以及脆性X综合征。通过非限制性实例的方式,与ASD相关的蛋白质包括但不限于以下蛋白质:ATP10C氨基磷脂-MET MET受体转运ATP酶酪氨酸激酶(ATP10C)BZRAP1MGLUR5(GRM5)代谢型谷氨酸受体5(MGLUR5)CDH10钙粘素-10MGLUR6(GRM6)代谢型谷氨酸受体6(MGLUR6)CDH9钙粘素-9NLGN1神经连接蛋白-1CNTN4接触蛋白-4NLGN2神经连接蛋白-2CNTNAP2接触蛋白相关的SEMA5A神经连接蛋白-3蛋白样2(CNTNAP2)DHCR7 7-脱氢胆固醇NLGN4X神经连接蛋白-4X-还原酶(DHCR7)连接的DOC2A双重C2样-结构域-NLGN4Y神经连接蛋白-4Y-包含蛋白α连接的DPP6二肽基NLGN5神经连接蛋白-5氨肽酶样蛋白6EN2锯齿状2(EN2)NRCAM神经细胞粘附分子(NRCAM)MDGA2脆性X智力迟钝NRXN1轴突蛋白-1 1(MDGA2)FMR2(AFF2)AF4/FMR2家族成员2OR4M2嗅觉受体(AFF2)4M2FOXP2叉头框蛋白P2OR4N4嗅觉受体(FOXP2)4N4FXR1脆性X智力OXTR催产素受体阻滞,常染色体(OXTR)同系物1(FXR1)FXR2脆性X智力PAH苯丙氨酸阻滞,常染色体羟化酶(PAH)同系物2(FXR2)GABRA1γ-氨基丁酸PTEN磷酸酶和受体亚基α-1张力蛋白同源物(GABRA1)(PTEN)GABRA5GABAA(.γ.-氨基丁酸PTPRZ1受体类型酸)受体α5酪氨酸蛋白亚基(GABRA5)磷酸酶ζ(PTPRZ1)GABRB1γ-氨基丁酸RELN颤蛋白受体亚基β-1(GABRB1)GABRB3GABAA(.γ.-氨基丁酸RPL1060S核糖体酸)受体.β.3亚基蛋白L10(GABRB3)GABRG1γ-氨基丁酸SEMA5A脑信号蛋白(Semaphorin)-5A受体亚基γ-1(SEMA5A)(GABRG1)HIRIP3HIRA-相互作用蛋白3SEZ6L2发作相关6同系物(小鼠)样2HOXA1同源盒蛋白Hox-A1SHANK3SH3和多重(HOXA1)锚蛋白重复结构域3(SHANK3)IL6白介素-6SHBZRAP1SH3和多重锚蛋白重复结构域3(SHBZRAP1)LAMB1层粘连蛋白亚基β-1SLC6A4血清素(LAMB1)转运体(SERT)MAPK3丝裂原激活蛋白TAS2R1味觉受体激酶3类型2成员1TAS2R1MAZ Myc相关的锌指TSC1结节性硬化蛋白的蛋白1MDGA2MAM结构域包含TSC2结节性硬化糖基磷脂酰肌醇蛋白2锚定物2(MDGA2)MECP2甲基CpG结合UBE3A泛素蛋白蛋白2(MECP2)连接酶E3A(UBE3A)MECP2甲基CpG结合WNT2无翅型蛋白2(MECP2)MMTV整合位点家族,成员2(WNT2)。

  与ASD相关的其染色体序列被编辑的蛋白质的一致性可以并且将会变化。在优选实施例中,与ASD相关的其染色体序列被编辑的蛋白质可以是由BZRAP1基因编码的苯二氮卓受体(外周)相关蛋白1(BZRAP1)、由AFF2基因编码的AF4/FMR2家族成员2蛋白(AFF2)(亦称MFR2)、由FXR1基因编码的脆性X智力迟钝常染色体同系物1蛋白(FXR1)、由FXR2基因编码的脆性X智力迟钝常染色体同系物2蛋白(FXR2),由MDGA2基因编码的含MAM结构域的糖基磷脂酰肌醇锚定物2蛋白(MDGA2)、由MECP2基因编码的甲基CpG结合蛋白2(MECP2)、由MGLUR5-1基因编码的代谢型谷氨酸受体5(MGLUR5)(亦称GRM5)、由NRXN1基因编码的轴突蛋白1蛋白或由SEMA5A基因编码的脑信号蛋白-5A蛋白(SEMA5A)。在一个示例性实施例中,该基因修饰动物是大鼠,并且编码与ASD相关的蛋白质的编辑的染色体序列如下所列:BZRAP1苯二氮卓受体XM_002727789,(外周)相关XM_213427,蛋白1(BZRAP1)XM_002724533,XM_001081125AFF2(FMR2)AF4/FMR2家族成员2XM_219832,(AFF2)XM_001054673FXR1脆性X智力NM_001012179迟钝,常染色体同系物1(FXR1)FXR2脆性X智力NM_001100647迟钝,常染色体同系物2(FXR2)MDGA2含MAM结构域的NM_199269糖基磷脂酰肌醇锚定物2(MDGA2)MECP2甲基CpG结合NM_022673蛋白2(MECP2)MGLUR5代谢型谷氨酸NM_017012(GRM5)受体5(MGLUR5)NRXN1轴突蛋白-1NM_021767SEMA5A脑信号蛋白-5A(SEMA5A)NM_001107659。

  示例性动物或细胞可以包括一、二、三、四、五、六、七、八或九个或更多个失活的编码与ASD相关的蛋白质的染色体序列,以及零、一、二、三、四、五、六、七、八、九个或更多个编码与ASD相关的蛋白质的染色体整合的序列。编辑的或整合的染色体序列可以被修饰为编码一种改变的与ASD相关的蛋白质。与ASD相关的蛋白质的突变的非限制性实例包括轴突蛋白1中的L18Q突变,其中位置18处的亮氨酸被谷氨酰胺替换;神经连接蛋白3中的R451C突变,其中位置451处的精氨酸被半胱氨酸替换;神经连接蛋白4中的R87W突变,其中位置87处的精氨酸被色氨酸替换;以及血清素转运体中的I425V突变,其中位置425处的异亮氨酸被缬氨酸替换。ASD相关染色体序列中的许多其他突变和染色体重排已经与ASD相关并且在本领域是已知的。参见例如,弗赖塔格(Freitag)等人(2010)《欧洲儿童与青少年精神病学》(Eur.Child.Adolesc.Psychiatry)19:169-178,以及布坎(Bucan)等人(2009)《PLoS遗传学》(PLoS Genetics)5:e1000536,将其披露通过引用以其全文结合在此。

  与帕金森病相关的蛋白质的实例包括但不限于α-突触核蛋白、DJ-1、LRRK2、PINK1、帕金蛋白、UCHL1、Synphilin-1以及NURR1。

  成瘾相关的蛋白质的实例可以包括例如ABAT。

  炎症相关蛋白的实例可以包括例如由Ccr2基因编码的单核细胞趋化蛋白-1(MCP1)、由Ccr5基因编码的C-C趋化因子受体类型5(CCR5)、由Fcgr2b基因编码的IgG受体IIB(FCGR2b,亦称CD32)或由Fcer1g基因编码的FcεR1g(FCER1g)蛋白。

  心血管疾病相关蛋白的实例可以包括例如IL1B(白介素1,β)、XDH(黄嘌呤脱氢酶)、TP53(肿瘤蛋白p53)、PTGIS(前列腺素I2(前列腺环素)合酶)、MB(肌红蛋白)、IL4(白介素4)、ANGPT1(血管生成素1)、ABCG8(ATP-结合盒,亚家族G(WHITE),成员8)或CTSK(组织蛋白酶K)。

  例如,美国专利公开号20110023153描述了使用锌指核酸酶基因修饰与阿尔茨海默病相关的细胞、动物以及蛋白质。曾经修饰的细胞和动物可以进一步使用已知的用于研究靶向突变对AD的发展和/或进展的影响的方法,使用AD研究中常用的措施进行测试-如但不限于,学习和记忆、焦虑、抑郁、成瘾、感觉运动功能以及测量行为、功能、病理、代谢和生化功能的测定。

  本披露包括编码与AD相关的蛋白质的任何染色体序列的编辑。典型地基于AD相关蛋白与AD障碍的实验相关性选择AD相关蛋白。例如,相对于缺少AD障碍的群体,在具有AD障碍的群体中,AD相关蛋白的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地,可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定AD相关蛋白,包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

  阿尔茨海默病相关蛋白的实例可以包括例如由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR)、由UBA1基因编码的泛素样改性剂激活酶1(UBA1)或由UBA3基因编码的NEDD8-激活酶E1催化亚基蛋白(UBE1C)。

  通过非限制性实例的方式,与AD相关的蛋白质包括但不限于如下所列的蛋白质:染色体序列编码蛋白ALAS2δ-氨基酮戊酸合酶2(ALAS2)ABCA1ATP-结合盒转运体(ABCA1)ACE血管紧张素I-转化酶(ACE)APOE载脂蛋白E前体(APOE)APP淀粉样蛋白前体蛋白(APP)AQP1水通道蛋白1(AQP1)BIN1Myc盒依赖性相互作用蛋白1或桥接整合蛋白1(BIN1)BDNF脑源性神经营养因子(BDNF)BTNL8嗜乳脂蛋白样蛋白8(BTNL8)C1ORF491号染色体开放阅读框49CDH4钙粘素-4CHRNB2神经元乙酰胆碱受体亚基β-2CKLFSF2CKLF样MARVEL跨膜结构域-包含蛋白2(CKLFSF2)CLEC4E C型凝集素结构域家族4,成员e(CLEC4E)CLU簇集蛋白(也称为载脂蛋白J)CR1红细胞补体受体1(CR1,也称为CD35、C3b/C4b受体和免疫粘附受体)CR1L红细胞补体受体1(CR1L)CSF3R粒细胞集落刺激因子3受体(CSF3R)CST3胱抑素C或胱抑素3CYP2C细胞色素P450 2C DAPK1死亡相关蛋白激酶1(DAPK1)ESR1雌激素受体1FCAR IgA受体的Fc片段(FCAR,也称为CD89)FCGR3B IgG的Fc片段,低亲和性IIIb,受体(FCGR3B或CD16b)FFA2游离脂肪酸受体2(FFA2)FGA纤维蛋白原(因子I)GAB2GRB2-相关结合蛋白2(GAB2)GAB2GRB2-相关结合蛋白2(GAB2)GALP甘丙肽样肽GAPDHS甘油醛-3-磷酸脱氢酶,精子发生的(GAPDHS)GMPB GMBP HP结合珠蛋白(HP)HTR75-羟色胺(血清素)受体7(腺苷酸环化酶偶联的)IDE胰岛素降解酶IF127IF127IFI6干扰素,α-可诱导蛋白6(IFI6)IFIT2具有三角形四肽重复的干扰素诱导的蛋白2(IFIT2)IL1RN白介素-1受体拮抗剂(IL-1RA)IL8RA白介素8受体,α(IL8RA或CD181)IL8RB白介素8受体,β(IL8RB)JAG1锯齿状1(JAG1)KCNJ15钾内向整流通道,亚家族J,成员15(KCNJ15)LRP6低密度脂蛋白受体相关蛋白6(LRP6)MAPT微管相关蛋白tau(MAPT)MARK4MAP/微管亲和性调节激酶4(MARK4)MPHOSPH1M期磷蛋白1MTHFR 5,10-亚甲基四氢叶酸还原酶MX2干扰素诱导的GTP-结合蛋白Mx2NBN Nibrin,也称为NBN NCSTN呆蛋白NIACR2烟酸受体2(NIACR2,也称为GPR109B)NMNAT3烟酰胺核苷酸腺苷酰转移酶3NTM Neurotrimin(或HNT)ORM1血清类粘蛋白(Orosmucoid)1(ORM1)或α-1-酸性糖蛋白1 P2RY13 P2Y嘌呤受体13(P2RY13)PBEF1烟酰胺磷酸核糖转移酶(NAmPRTase或Nampt)也称为前B细胞集落增强因子1(PBEF1)或内脂素PCK1磷酸烯醇丙酮酸羧激酶PICALM磷脂酰肌醇结合网格蛋白装配蛋白(PICALM)PLAU尿激酶型纤维蛋白溶酶原激活剂(PLAU)PLXNC1丛状蛋白(Plexin)C1(PLXNC1)PRNP朊病毒蛋白PSEN1早老素1蛋白(PSEN1)PSEN2早老素2蛋白(PSEN2)PTPRA蛋白质酪氨酸磷酸酶受体A型蛋白(PTPRA)RALGPS2具有PH结构域和SH3结合基序的Ral GEF 2(RALGPS2)RGSL2G-蛋白信号传导样调节剂2(RGSL2)SELENBP1含硒结合蛋白1(SELNBP1)SLC25A37线粒体铁转运蛋白(Mitoferrin)-1SORL1含分拣蛋白相关受体L(DLR类别)A重复的蛋白质(SORL1)TF转铁蛋白TFAM线粒体转录因子A TNF肿瘤坏死因子TNFRSF10C肿瘤坏死因子受体超家族成员10C(TNFRSF10C)TNFSF10肿瘤坏死因子受体超家族,(TRAIL)成员10a(TNFSF10)UBA1泛素样改性剂激活酶1(UBA1)UBA3NEDD8-激活酶E1催化亚基蛋白(UBE1C)UBB泛素B蛋白(UBB)UBQLN1泛醌蛋白(Ubiquilin)-1UCHL1泛素羧基末端酯酶L1蛋白(UCHL1)UCHL3泛素羧基末端水解酶同工酶L3蛋白(UCHL3)VLDLR极低密度脂蛋白受体蛋白(VLDLR)。

  在示例性实施例中,与AD相关的其染色体序列被编辑的蛋白质可以是由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR)、由UBA1基因编码的泛素样改性剂激活酶1(UBA1)、由UBA3基因编码的NEDD8-激活酶E1催化亚基蛋白(UBE1C)、由AQP1基因编码的水通道蛋白1(AQP1)、由UCHL1基因编码的泛素羧基末端酯酶L1蛋白(UCHL1)、由UCHL3基因编码的泛素羧基末端水解酶同工酶L3蛋白(UCHL3)、由UBB基因编码的泛素B蛋白(UBB)、由MAPT基因编码的微管相关蛋白tau(MAPT)、由PTPRA基因编码的蛋白质酪氨酸磷酸酶受体A型蛋白(PTPRA)、由PICALM基因编码的磷脂酰肌醇结合网格蛋白装配蛋白(PICALM)、由CLU基因编码的簇集蛋白(也称为载脂蛋白J)、由PSEN1基因编码的早老素1蛋白、由PSEN2基因编码的早老素2蛋白、由SORL1基因编码的含分拣蛋白相关受体L(DLR类别)A重复的蛋白质(SORL1)蛋白质、由APP基因编码的淀粉样蛋白前体蛋白(APP)、由APOE基因编码的载脂蛋白E前体(APOE)或由BDNF基因编码的脑源性神经营养因子(BDNF)。在一个示例性实施例中,该基因修饰动物是大鼠,并且编码与AD相关的蛋白质的编辑的染色体序列如下:APP淀粉样蛋白前体蛋白(APP)NM_019288AQP1水通道蛋白1(AQP1)NM_012778BDNF脑源性神经营养因子NM_012513CLU簇集蛋白(也称为NM_053021载脂蛋白J)MAPT微管相关蛋白NM_017212tau(MAPT)PICALM磷脂酰肌醇结合NM_053554网格蛋白装配蛋白(PICALM)PSEN1早老素1蛋白(PSEN1)NM_019163PSEN2早老素2蛋白(PSEN2)NM_031087PTPRA酪氨酸磷酸酶NM_012763受体A型蛋白(PTPRA)SORL1含分拣蛋白相关受体L(DLR NM_053519,类别)A重复的XM_001065506,蛋白质(SORL1)XM_217115UBA1泛素样改性剂激活NM_001014080酶1(UBA1)UBA3NEDD8-激活酶E1 NM_057205催化亚基蛋白(UBE1C)UBB泛素B蛋白(UBB)NM_138895UCHL1泛素羧基末端NM_017237酯酶L1蛋白(UCHL1)UCHL3泛素羧基末端NM_001110165水解酶同工酶L3蛋白(UCHL3)VLDLR极低密度脂蛋白NM_013155受体蛋白(VLDLR)

  该动物或细胞可以包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个破坏的、编码与AD相关的蛋白质的染色体序列以及零、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个编码与AD相关的蛋白质的染色体整合序列。

  编辑的或整合的染色体序列可以被修饰为编码一种改变的与AD相关的蛋白质。AD相关染色体序列中的许多突变已经与AD相关。例如,APP中的V7171(即位置717处的缬氨酸变为异亮氨酸)错义突变引起家族性AD。早老素-1蛋白中的多重突变,如H163R(即位置163处的组氨酸变为精氨酸)、A246E(即位置246处的丙氨酸变为谷氨酸)、L286V(即位置286处的亮氨酸变为缬氨酸)以及C410Y(即位置410处的半胱氨酸变为酪氨酸)引起家族性3型阿尔茨海默病。早老素-2蛋白中的突变,如N141I(即位置141处的天冬酰胺变为异亮氨酸)、M239V(即位置239处的甲硫氨酸变为缬氨酸)以及D439A(即位置439处的天冬氨酸变为丙氨酸)引起家族性4型阿尔茨海默病。AD相关基因和疾病的遗传变体的其他相关性在本领域是已知的。参见例如,韦林(Waring)等人(2008)《神经病学年鉴》(Arch.Neurol.)65:329-334,将其披露通过引用以其全文结合在此。

  自闭症谱系障碍相关蛋白的实例可以包括例如由BZRAP1基因编码的苯二氮卓受体(外周)相关蛋白1(BZRAP1)、由AFF2基因编码的AF4/FMR2家族成员2蛋白(AFF2)(亦称MFR2)、由FXR1基因编码的脆性X智力迟钝常染色体同系物1蛋白(FXR1)或由FXR2基因编码的脆性X智力迟钝常染色体同系物2蛋白(FXR2)。

  黄斑变性相关蛋白的实例可以包括例如由ABCR基因编码的ATP-结合盒,亚家族A(ABC1)成员4蛋白(ABCA4)、由APOE基因编码的载脂蛋白E蛋白(APOE)或由CCL2基因编码的趋化因子(C-C基序)配体2蛋白(CCL2)。

  精神分裂症相关蛋白的实例可以包括NRG1、ErbB4、CPLX1、TPH1、TPH2、NRXN1、GSK3A、BDNF、DISC1、GSK3B及其组合。

  涉及肿瘤抑制的蛋白质的实例可以包括例如ATM(共济失调性毛细血管扩张突变的)、ATR(共济失调性毛细血管扩张和Rad3相关的)、EGFR(表皮生长因子受体)、ERBB2(v-erb-b2红白血病病毒癌基因同系物2)、ERBB3(v-erb-b2红白血病病毒癌基因同系物3)、ERBB4(v-erb-b2红白血病病毒癌基因同系物4)、Notch 1、Notch 2、Notch 3或Notch 4。

  与分泌酶障碍相关的蛋白质的实例可以包括例如PSENEN(早老素增强子2同系物(秀丽隐杆线虫))、CTSB(组织蛋白酶B)、PSEN1(早老素1)、APP(淀粉样蛋白β(A4)前体蛋白)、APH1B(前咽缺陷1同系物B(秀丽隐杆线虫))、PSEN2(早老素2(阿尔茨海默病4))或BACE1(β-位点APP-切割酶1)。

  例如,美国专利公开号20110023146描述了使用锌指核酸酶基因修饰与分泌酶相关障碍相关的细胞、动物以及蛋白质。分泌酶对于将前蛋白加工成其生物活性形式是必需的。分泌酶途径的各种组分的缺陷促成许多障碍,特别是具有标志性淀粉样蛋白生成或淀粉样蛋白斑块的那些,如阿尔茨海默病(AD)。

  分泌酶障碍以及与这些障碍相关的蛋白质是一套影响众多障碍的易感性、障碍的存在、障碍的严重性或其任何组合的相异蛋白质。本披露包括编码与分泌酶障碍相关的蛋白质的任何染色体序列的编辑。典型地基于分泌酶相关蛋白质与分泌酶障碍的发展的实验相关性选择与分泌酶障碍相关的蛋白质。例如,相对于没有分泌酶障碍的群体,在具有分泌酶障碍的群体中,与分泌酶障碍相关的蛋白质的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地,可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定与分泌酶障碍相关的蛋白质,包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

  通过非限制性实例的方式,与分泌酶障碍相关的蛋白质包括PSENEN(早老素增强子2同系物(秀丽隐杆线虫))、CTSB(组织蛋白酶B)、PSEN1(早老素1)、APP(淀粉样蛋白β(A4)前体蛋白)、APH1B(前咽缺陷1同系物B(秀丽隐杆线虫))、PSEN2(早老素2(阿尔茨海默病4))、BACE1(β-位点APP-切割酶1)、ITM2B(膜内在蛋白2B)、CTSD(组织蛋白酶D)、NOTCH1(Notch同系物1、易位相关(果蝇))、TNF(肿瘤坏死因子(TNF超家族,成员2))、INS(胰岛素)、DYT10(肌张力障碍10)、ADAM17(ADAM金属肽酶结构域17)、APOE(载脂蛋白E)、ACE(血管紧张素I转化酶(肽基二肽酶A)1)、STN(他汀)、TP53(肿瘤蛋白p53)、IL6(白介素6(干扰素,β2))、NGFR(神经生长因子受体(TNFR超家族,成员16))、IL1B(白介素1,β)、ACHE(乙酰胆碱酯酶(Yt血型))、CTNNB1(连环蛋白(钙粘素相关蛋白),β1,88kDa)、IGF1(胰岛素样生长因子1(生长调节素C))、IFNG(干扰素,γ)、NRG1(神经调节蛋白1)、CASP3(半胱天冬酶3,凋亡相关半胱氨酸肽酶)、MAPK1(丝裂原激活蛋白激酶1)、CDH1(钙粘素1,1型,E-钙粘素(上皮))、APBB1(淀粉样蛋白β(A4)前体蛋白结合,家族B,成员1(Fe65))、HMGCR(3-羟基-3-甲基戊二酰-辅酶A还原酶)、CREB1(cAMP反应元件结合蛋白1)、PTGS2(前列腺素内过氧化物合酶2(前列腺素G/H合酶和环氧合酶))、HES1(长毛和裂口增强蛋白(hairy and enhancer of split)1,(果蝇))、CAT(过氧化氢酶)、TGFB1(转化生长因子,β1)、ENO2(烯醇酶2(γ,神经元的))、ERBB4(v-erb-a红白血病病毒癌基因同系物4(禽的))、TRAPPC10(运输蛋白粒子复合物10)、MAOB(单胺氧化酶B)、NGF(神经生长因子(β多肽))、MMP12(基质金属肽酶12(巨噬细胞弹性蛋白酶))、JAG1(锯齿状1(艾欧吉勒综合征(Alagille syndrome)))、CD40LG(CD40配体)、PPARG(过氧化物酶体增殖剂激活的受体γ)、FGF2(成纤维细胞生长因子2(碱性的))、IL3(白介素3(集落刺激因子,多重的))、LRP1(低密度脂蛋白受体相关蛋白1)、NOTCH4(Notch同系物4(果蝇))、MAPK8(丝裂原激活蛋白激酶8)、PREP(脯氨酰内肽酶)、NOTCH3(Notch同系物3(果蝇))、PRNP(朊病毒蛋白)、CTSG(组织蛋白酶G)、EGF(表皮生长因子(β-尿抑胃素))、REN(肾素)、CD44(CD44分子(印度血型))、SELP(选择素P(颗粒膜蛋白140kDa,抗原CD62))、GHR(生长激素体)、ADCYAP1(腺苷酸环化酶激活多肽1(脑垂体的))、INSR(胰岛素受体)、GFAP(胶质酸性蛋白)、MMP3(基质金属肽酶3(溶基质素1,前明胶酶(progelatinase)))、MAPK10(丝裂原激活蛋白激酶10)、SP1(Sp1转录因子)、MYC(v-myc骨髓细胞瘤病病毒癌基因同系物(禽的))、CTSE(组织蛋白酶E)、PPARA(过氧化物酶体增殖剂激活受体α)、JUN(jun癌基因)、TIMP1(TIMP金属肽酶抑制剂1)、IL5(白介素5(集落刺激因子,嗜酸性粒细胞))、IL1A(白介素1,α)、MMP9(基质金属肽酶9(明胶酶B,92kDa明胶酶,92kDa IV型胶原酶))、HTR4(5-羟色胺(血清素)受体4)、HSPG2(硫酸乙酰肝素蛋白多糖2)、KRAS(v-Ki-ras2柯尔斯顿(Kirsten)大鼠肉瘤病毒癌基因同系物)、CYCS(细胞色素c,躯体的)、SMG1(SMG1同系物,磷脂酰肌醇3-激酶相关激酶(秀丽隐杆线虫))、IL1R1(白介素1受体,I型)、PROK1(前动力蛋白1)、MAPK3(丝裂原激活蛋白激酶3)、NTRK1(神经营养酪氨酸激酶受体,1型)、IL13(白介素13)、MME(膜金属内肽酶)、TKT(转酮醇酶)、CXCR2(趋化因子(C-X-C基序)受体2)、IGF1R(胰岛素样生长因子1受体)、RARA(视黄酸受体,α)、CREBBP(CREB结合蛋白)、PTGS1(前列腺素内过氧化物合酶1(前列腺素G/H合酶和环氧合酶))、GALT(半乳糖-1-磷酸尿甙基转移酶(uridylyltransferase))、CHRM1(胆碱能受体,毒蕈碱1)、ATXN1(共济失调蛋白1)、PAWR(PRKC,凋亡,WT1,调节剂)、NOTCH2(Notch同系物2(果蝇))、M6PR(甘露糖-6-磷酸受体(阳离子依赖性的))、CYP46A1(细胞色素P450,家族46、亚家族A,多肽1)、CSNK1D(酪蛋白激酶1,δ)、MAPK14(丝裂原激活蛋白激酶14)、PRG2(蛋白多糖2,骨髓(自然杀伤细胞激活剂,嗜酸性粒细胞颗粒主要碱性蛋白))、PRKCA(蛋白激酶C,α)、L1CAM(L1细胞粘附分子)、CD40(CD40分子,TNF受体超家族成员5)、NR1I2(核受体亚家族1,I组,成员2)、JAG2(锯齿状2)、CTNND1(连环蛋白(钙粘素相关蛋白)、δ1)、CDH2(钙粘素2,1型、N-钙粘素(神经元的))、CMA1(糜酶1、肥大细胞)、SORT1(分拣蛋白1)、DLK1(δ样1同系物(果蝇))、THEM4(硫酯酶超家族成员4)、JUP(连接斑珠蛋白(junction plakoglobin))、CD46(CD46分子,补体调节蛋白)、CCL11(趋化因子(C-C基序)配体11)、CAV3(小窝蛋白3)、RNASE3(核糖核酸酶,RNA酶A家族、3(嗜酸性粒细胞阳离子蛋白))、HSPA8(热休克70kDa蛋白8)、CASP9(半胱天冬酶9,凋亡相关半胱氨酸肽酶)、CYP3A4(细胞色素P450,家族3,亚家族A,多肽4)、CCR3(趋化因子(C-C基序)受体3)、TFAP2A(转录因子AP-2α(激活增强子结合蛋白2α))、SCP2(固醇载体蛋白2)、CDK4(细胞周期蛋白依赖性激酶4)、HIF1A(缺氧可诱导的因子1,α亚基(基本螺旋-环-螺旋转录因子))、TCF7L2(转录因子7样2(T细胞特异的,HMG盒))、IL1R2(白介素1受体,II型)、B3GALTL(β1,3-半乳糖转移酶样)、MDM2(Mdm2p53结合蛋白同系物(小鼠))、RELA(v-rel网状内皮组织增殖病毒癌基因同系物A(禽的))、CASP7(半胱天冬酶7,凋亡相关半胱氨酸肽酶)、IDE(胰岛素降解酶)、FABP4(脂肪酸结合蛋白4,脂肪细胞)、CASK(钙/钙调蛋白依赖性丝氨酸蛋白激酶(MAGUK家族))、ADCYAP1R1(腺苷酸环化酶激活多肽1(脑垂体的)受体类型I)、ATF4(激活转录因子4(tax-反应增强子元件B67))、PDGFA(血小板衍生的生长因子α多肽)、C21或f33(21号染色体开放阅读框33)、SCG5(分泌粒蛋白V(7B2蛋白))、RNF123(环指蛋白123)、NFKB1(B细胞中的κ轻多肽基因增强子的核因子1)、ERBB2(v-erb-b2红白血病病毒癌基因同系物2、神经/胶质母细胞瘤衍生的癌基因同系物(禽的))、CAV1(小窝蛋白1,胞膜窖蛋白,22kDa)、MMP7(基质金属肽酶7(基质溶解素,子宫的))、TGFA(转化生长因子,α)、RXRA(类视黄醇X受体,α)、STX1A(突触融合蛋白1A(脑的))、PSMC4(蛋白酶体(前体,巨蛋白因子)26S亚基,ATP酶,4)、P2RY2(嘌呤能受体P2Y,G蛋白偶联的,2)、TNFRSF21(肿瘤坏死因子受体超家族,成员21)、DLG1(discs,大的同系物1(果蝇))、NUMBL(numb同系物(果蝇)样)、SPN(涎福林(sialophorin))、PLSCR1(磷脂混杂酶1)、UBQLN2(泛醌蛋白2)、UBQLN1(泛醌蛋白1)、PCSK7(前蛋白转化酶枯草杆菌/科信(kexin)类型7)、SPON1(脊椎蛋白1,细胞外基质蛋白)、SILV(西尔弗(silver)同系物(小鼠))、QPCT(谷氨酰胺-肽环转移酶)、HESS(长毛和裂口增强蛋白5(果蝇))、GCC1(GRIP和含卷曲螺旋结构域的1)及其任何组合。

  该基因修饰动物或细胞可以包括1、2、3、4、5、6、7、8、9、10个或更多个破坏的、编码与分泌酶障碍相关的蛋白质的染色体序列以及零、1、2、3、4、5、6、7、8、9、10个或更多个编码破坏的与分泌酶障碍相关的蛋白质的染色体整合序列。

  与肌萎缩性侧索硬化相关的蛋白质的实例可以包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩性侧索硬化2)、FUS(融合在肉瘤中)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)以及VAGFC(血管内皮生长因子C)及其任何组合。

  例如,美国专利公开号20110023144描述了使用锌指核酸酶基因修饰与肌萎缩性侧索硬化(ALS)疾病相关的细胞、动物以及蛋白质。ALS由涉及随意运动的脑皮层、脑干和脊髓中的某些神经细胞的逐步稳定退化表征。

  运动神经元障碍以及与这些障碍相关的蛋白质是一套影响患上运动神经元障碍的易感性、运动神经元障碍的存在、运动神经元障碍的严重性或其任何组合的相异蛋白质。本披露包括编码与一种特定的运动神经元障碍ALS疾病相关的蛋白质的任何染色体序列的编辑。典型地基于ALS相关蛋白与ALS的实验相关性选择与ALS相关的蛋白质。例如,相对于没有ALS的群体,在具有ALS的群体中,与ALS相关的蛋白质的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地,可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定与ALS相关的蛋白质,包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

  通过非限制性实例的方式,与ALS相关的蛋白质包括但不限以下蛋白质:SOD1超氧化物歧化酶1,ALS3肌萎缩性侧索可溶性硬化3SETX senataxin ALS5肌萎缩性侧索硬化5FUS融合在肉瘤中ALS7肌萎缩性侧索硬化7ALS2肌萎缩性侧索DPP6二肽基肽酶6硬化2NEFH神经微丝,重PTGS1前列腺素-多肽内过氧化物合酶1SLC1A2溶质载体家族1TNFRSF10B肿瘤坏死因子(胶质高亲和性受体超家族,谷氨酸转运体),成员10b成员2PRPH外周蛋白HSP90AA1热休克蛋白90kDaα(胞质的),类别A成员1GRIA2谷氨酸受体,IFNG干扰素,γ离子型的,AMPA 2 S100B S100钙结合FGF2成纤维细胞生长因子2蛋白质B AOX1醛氧化酶1CS柠檬酸合酶TARDBP TAR DNA结合蛋白TXN硫氧还原蛋白RAPH1Ras缔合MAP3K5丝裂原激活蛋白质(RaIGDS/AF-6)和激酶5普列克底物蛋白(pleckstrin)同源性结构域1NBEAL1蛋白激酶锚定蛋白(neurobeachin)样1GPX1谷胱甘肽过氧化物酶1ICA1L胰岛细胞自身抗原RAC1ras-相关C3肉毒菌1.69kDa样毒素底物1MAPT微管相关ITPR2肌醇1,4,5-蛋白tau三磷酸受体,2型ALS2CR4肌萎缩性侧索GLS谷氨酰胺酶硬化2(青少年)染色体区域,候选物4ALS2CR8肌萎缩性侧索CNTFR睫状神经营养因子硬化2(青少年)受体染色体区域,候选物8ALS2CR11肌萎缩性侧索FOLH1叶酸水解酶1硬化2(青少年)染色体区域,候选物11FAM117B具有序列P4HB的家族脯氨酰基4-羟化酶,相似性117,成员Bβ多肽CNTF睫状神经营养因子SQSTM1死骨片(sequestosome)1STRADB STE20相关激酶NAIP NLR家族,凋亡适配器β抑制蛋白YWHAQ酪氨酸3-SLC33A1溶质载体家族33单加氧酶/色氨酸(乙酰-CoA转运体),一种5-单加氧酶成员1激活蛋白,θ多肽TRAK2运输蛋白,图4图4同系物,SAC1驱动蛋白结合2脂质磷酸酶结构域包含NIF3L1NIF3NGG1相互作用INA互联蛋白(internexin)神经因子3样1中间丝蛋白,αPARD3B par-3分区COX8A细胞色素c氧化酶缺陷3同系物B亚基VIIIA CDK15细胞周期蛋白依赖性激酶HECW1HECT,C2和WW 15结构域包含E3泛素蛋白连接酶1NOS1一氧化氮合酶1MET met原癌基因SOD2超氧化物歧化酶2,HSPB1热休克27kDa线粒体蛋白1NEFL神经微丝,轻CTSB组织蛋白酶B多肽ANG血管生成素,HSPA8热休克70kDa核糖核酸酶,RNA酶A蛋白8家族,5VAPB VAMP(囊泡-ESR1雌激素受体1相关膜蛋白)-相关蛋白B和C SNCA突触核蛋白,αHGF肝细胞生长因子CAT过氧化氢酶ACTB肌动蛋白,βNEFM神经微丝,介质TH酪氨酸羟化酶多肽BCL2B-细胞CLL/淋巴瘤2FAS Fas(TNF受体超家族,成员6)CASP3半胱天冬酶3,凋亡-CLU簇集蛋白相关半胱氨酸肽酶SMN1运动神经元的存活G6PD葡萄糖-6-磷酸1,端粒脱氢酶BAX BCL2-相关X HSF1热休克转录蛋白因子1RNF19A环指蛋白19A JUN jun癌基因ALS2CR12肌萎缩性侧索HSPA5热休克70kDa硬化2(青少年)蛋白5染色体区域,候选物12MAPK14丝裂原激活蛋白IL10白介素10激酶14APEX1APEX核酸酶TXNRD1硫氧还原蛋白还原酶1(多功能DNA修复酶)1NOS2一氧化氮合酶2,TIMP1TIMP金属肽酶可诱导的抑制剂1CASP9半胱天冬酶9,相关半胱氨酸凋亡肽酶的凋亡-XIAP X-连接的抑制剂GLG1高尔基体糖蛋白1EPO促红细胞生成素VEGFA血管内皮ELN弹性蛋白生长因子A GDNF胶质细胞衍生的NFE2L2核因子(红系(erythroid)-神经营养因子衍生的2)样2SLC6A3溶质载体家族6HSPA4热休克70kDa(神经递质蛋白4转运体,多巴胺),成员3APOE载脂蛋白E PSMB8蛋白酶体(前体,巨蛋白因子)亚基,β类型,8DCTN1动力蛋白激活蛋白(dynactin)1TIMP3TIMP金属肽酶抑制剂3KIFAP3驱动蛋白相关SLC1A1溶质载体家族1蛋白3(神经元/上皮高亲和性谷氨酸转运体,系统Xag),成员1SMN2运动神经元的存活CCNC细胞周期蛋白C 2,着丝粒MPP4膜蛋白,STUB1STIP1同源性和U-棕榈酰化的4盒包含蛋白1ALS2淀粉样蛋白β(A4)PRDX6过氧化物酶6前体蛋白SYP突触素CABIN1钙调磷酸酶结合蛋白1CASP1半胱天冬酶1,凋亡-GART磷酸核糖甘氨酰胺相关半胱氨酸甲酰转移酶,肽酶磷酸核糖甘氨酰胺合成酶,磷酸核糖氨基咪唑合成酶CDK5细胞周期蛋白依赖性激酶5ATXN3共济失调蛋白3RTN4浆膜蛋白(reticulon)4C1QB补体成分1,q亚成分,B链VEGFC神经生长因子HTT亨廷顿蛋白(huntingtin)受体PARK7帕金森病7XDH黄嘌呤脱氢酶GFAP胶质纤维酸性MAP2微管相关蛋白2CYCS细胞色素c,躯体的FCGR3B IgG的Fc片段,低亲和性IIIb,CCS UBL5(泛素样5超氧化物歧化酶)的铜分子伴侣MMP9基质金属肽酶SLC18A3溶质载体家族189((囊状乙酰胆碱),成员3TRPM7瞬时受体HSPB2热休克27kDa潜在的阳离子通道,蛋白2亚家族M,成员7AKT1v-akt鼠胸腺瘤DERL1Der1样结构域家族,病毒癌基因同系物1成员1CCL2趋化因子(C--C基序)NGRN突触生长相关蛋白(neugrin),轴突配体2赘生物(outgrowth)相关GSR谷胱甘肽还原酶TPPP3促微管蛋白聚合蛋白家族成员3APAF1凋亡肽酶BTBD10BTB(POZ)结构域激活因子1包含10GLUD1谷氨酸CXCR4趋化因子(C--X--C基序)脱氢酶1受体4SLC1A3溶质载体家族1FLT1fms相关酪氨酸(胶质高亲和性谷氨酸转运体),成员3激酶1PON1对氧磷酶1AR雄激素受体LIF白血病抑制因子ERBB3v-erb-b2红白血病病毒癌基因同系物3LGALS1凝集素,半乳糖苷-CD44CD44分子结合,可溶的,1TP53肿瘤蛋白p53TLR3toll样受体3GRIA1谷氨酸受体,GAPDH甘油-3-离子型的,AMPA 1磷酸脱氢酶GRIK1谷氨酸受体,DES结蛋白离子型的,红藻氨酸(kainate)1CHAT胆碱乙酰转移酶FLT4fms相关酪氨酸激酶4CHMP2B染色质修饰的BAG1BCL2相关蛋白2B永生基因(athanogene)MT3金属硫蛋白3CHRNA4胆碱能受体,烟碱的,α4GSS谷胱甘肽合成酶BAK1BCL2-拮抗剂(antagonist/killer)1KDR激酶插入结构域GSTP1谷胱甘肽S-转移酶受体(III型pi 1受体酪氨酸激酶)OGG18-氧桥鸟嘌呤(oxoguanine)DNA IL6白介素6(干扰素,糖基化酶β2)。

  该动物或细胞可以包括1、2、3、4、5、6、7、8、9、10个或更多个破坏的、编码与ALS相关的蛋白质的染色体序列以及零、1、2、3、4、5、6、7、8、9、10个或更多个编码破坏的与ALS相关的蛋白质的染色体整合序列。与ALS相关的优选蛋白包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩性侧索硬化2)、FUS(融合在肉瘤中)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)以及VAGFC(血管内皮生长因子C)及其任何组合。

  与朊病毒病相关的蛋白质的实例可以包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩性侧索硬化2)、FUS(融合在肉瘤中)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)以及VAGFC(血管内皮生长因子C)及其任何组合。

  与朊病毒病症中的神经退行性疾病相关的蛋白质的实例可以包括例如A2M(α-2-巨球蛋白)、AATF(凋亡拮抗转录因子)、ACPP(前列腺的酸性磷酸酶)、ACTA2(肌动蛋白α2平滑肌主动脉)、ADAM22(ADAM金属肽酶结构域)、ADORA3(腺苷A3受体)或ADRA1D(α-1D肾上腺素能受体(Alpha-1D adrenergic receptor或Alpha-1D adrenoreceptor))。

  与免疫缺陷相关的蛋白质的实例可以包括例如A2M[α-2-巨球蛋白];AANAT[芳烷基胺N-乙酰转移酶];ABCA1[ATP-结合盒,亚家族A(ABC1),成员1];ABCA2[ATP-结合盒,亚家族A(ABC1),成员2];或ABCA3[ATP-结合盒,亚家族A(ABC1),成员3]。

  与三核苷酸重复障碍相关的蛋白质的实例包括例如AR(雄激素受体)、FMR1(脆性X智力迟钝1)、HTT(亨廷顿蛋白)或DMPK(强直性肌营养不良蛋白激酶)、FXN(弗氏共济失调蛋白(frataxin))、ATXN2(共济失调蛋白2)。

  与神经传递障碍相关的蛋白质的实例包括例如SST(生长抑素)、NOS1(一氧化氮合酶1(神经元的))、ADRA2A(肾上腺素能的,α-2A-,受体)、ADRA2C(肾上腺素能的,α-2C-,受体)、TACR1(速激肽受体1)或HTR2c(5-羟色胺(血清素)受体2C)。

  神经发育相关序列的实例包括例如A2BP1[共济失调蛋白2-结合蛋白1]、AADAT[氨基己二酸氨基转移酶],AANAT[芳烷基胺N-乙酰转移酶]、ABAT[4-氨基丁酸氨基转移酶]、ABCA1[ATP-结合盒,亚家族A(ABC1),成员1]或ABCA13[ATP-结合盒,亚家族A(ABC1),成员13]。

  可用本发明系统治疗的优选病症的另外的实例可以选自:艾卡迪-古铁雷斯综合征(Aicardi-Goutières Syndrome);亚历山大病;阿伦-赫恩登-达德利综合征(Allan-Herndon-Dudley Syndrome);POLG相关障碍;α-甘露糖苷贮积症(II和III型);阿尔斯特伦综合征(Syndrome);安格曼;综合征;共济失调-毛细血管扩张;神经元蜡样-脂褐质沉积;β-地中海贫血;双侧视神经萎缩和1型(婴儿)视神经萎缩;视网膜母细胞瘤(双侧的);卡纳万病(Canavan Disease);脑-眼-面-骨骼综合征(Cerebrooculofacioskeletal Syndrome)1[COFS1];脑腱黄瘤病;科尼利亚迪兰吉综合征(Cornelia de Lange Syndrome);MAPT相关障碍;遗传性朊病毒病;德拉韦综合征(Dravet Syndrome);早期发病家族性阿尔茨海默病;弗里德赖希共济失调[FRDA];多发性畸形;岩藻糖苷贮积症;福山(Fukuyama)先天性肌营养不良;半乳糖唾液酸贮积症;戈谢病(Gaucher Disease);有机酸血症;噬血细胞淋巴组织细胞增生症;早衰症;粘脂贮积症II;婴儿游离唾液酸贮积病;PLA2G6相关神经变性;耶韦尔和朗格-尼尔森综合征(Jervell and Lange-Nielsen Syndrome);结合性大疱性表皮松解;亨廷顿病;克拉伯病(Krabbe Disease)(婴儿的);线粒体DNA相关雷吉综合征(Mitochondrial DNA-Associated Leigh Syndrome)和NARP;莱施-奈恩综合征;LIS1相关无脑回;洛氏综合征(Lowe Syndrome);槭糖尿病;MECP2复制综合征;ATP7A相关铜转运障碍;LAMA2相关肌营养不良;芳基硫酸酯酶A缺乏;I、II或III型粘多糖贮积症;过氧化物酶体生物发生障碍,齐薇格谱系综合征(Zellweger Syndrome Spectrum);伴随脑铁累积障碍的神经变性;酸性鞘磷脂酶缺乏;C型尼曼-皮克病;甘氨酸脑病;ARX相关障碍;尿素循环障碍;COL1A1/2相关成骨不全;线粒体DNA缺失综合征;PLP1相关障碍;佩里综合征(Perry Syndrome);费伦-麦克德米德综合征(Phelan-McDermid Syndrome);II型糖原贮积症(蓬佩病(Pompe Disease))(婴儿的);MAPT相关障碍;MECP2相关障碍;1型肢近端型点状软骨发育不全(Rhizomelic Chondrodysplasia Punctata Type 1);罗伯茨综合征(Roberts Syndrome);桑德霍夫病(Sandhoff Disease);辛德勒病(Schindler Disease)-1型;腺苷脱氨酶缺乏;史-伦-奥三氏综合征;脊髓性肌萎缩;婴儿发病脊髓小脑性共济失调;己糖胺酶A缺乏;1型致死性发育不良;胶原VI型相关障碍;I型乌谢尔综合征(Usher Syndrome);先天性肌营养不良;沃尔夫-赫奇霍恩综合征(Wolf-Hirschhorn Syndrome);溶酶体酸脂酶缺乏;以及着色性干皮病。

  如将是显而易见的,设想的是可以使用本发明系统靶向任何感兴趣的多核苷酸序列。使用本发明系统进行治疗可能是有用的病症或疾病的一些实例被包括在上表中并且当前与那些病症相关的基因的实例也被提供于此。然而,示例的基因并不是穷尽性的。

  例如,“野生型StCas9”是指来自嗜热链球菌的野生型Cas9,其蛋白质序列在登录号G3ECR1下给出于SwissProt数据库中。类似地,化脓链球菌Cas9在登录号Q99ZW2下被包括在SwissProt中。

  实例

  以下实例出于说明本发明的不同实施例的目的而给出并且并不意在以任何方式限制本发明。本发明实例连同在此描述的方法目前代表优选的实施例,是示例性的,并且并不旨在限制本发明的范围。涵盖在如由权利要求书的范围所定义的本发明的精神内的在此的变化以及其他用途是本领域普通技术人员可以想到的。

  实例1:真核细胞的细胞核中的CRISPR复合物活性

  一个示例性II型CRISPR系统是来自化脓链球菌SF370的II型CRISPR座位,该座位包含四个基因Cas9、Cas1、Cas2和Csn1的聚簇以及两个非编码RNA元件tracrRNA和由非重复序列的短段(间隔子,每个约30bp)间隔开的重复序列(同向重复)的特征性阵列。在此系统中,以四个连续步骤产生靶向的DNA双链断裂(DSB)(图2A)。第一步,从CRISPR座位转录两个非编码RNA前-crRNA阵列和tracrRNA。第二步,将tracrRNA杂交到前-crRNA的同向重复上,然后将其加工成含有单独的间隔子序列的成熟crRNA。第三步,该成熟crRNA:tracrRNA复合物经由在crRNA的间隔子区与原型间隔子DNA之间形成异源双链体而指导Cas9到由原型间隔子和对应的PAM组成的DNA靶标。最后,Cas9介导PAM上游的靶DNA的切割,以在原型间隔子内产生一个DSB(图2A)。此实例描述了一种用于将此RNA可编程的核酸酶系统适配成指导真核细胞的细胞核中的CRISPR复合物活性的示例性过程。

  细胞培养和转染

  在37℃下,伴随5%CO2孵育,将人类胚肾(HEK)细胞系HEK293FT(生命技术公司)维持在补充有10%胎牛血清(海可隆公司(HyClone))、2mM GlutaMAX(生命技术公司)、100U/mL青霉素及100μg/mL链霉素的杜尔贝科改良伊格尔培养基(Dulbecco’s modified Eagle’s Medium)(DMEM)中。在37℃下,在5%CO2下,用补充有5%胎牛血清(海可隆公司)、2mM GlutaMAX(生命技术公司)、100U/mL青霉素及100μg/mL链霉素的DMEM维持小鼠neuro2A(N2A)细胞系(ATCC)。

  在转染前一天,将HEK 293FT或N2A细胞以200,000个细胞/孔的密度接种到24孔板(康宁公司(Corning))中。遵循制造商推荐的方案,使用Lipofectamine 2000(生命技术公司)转染细胞。对于24孔板的每个孔,使用总共800ng的质粒。

  基因组修饰的Surveyor测定和测序分析

  如上所述,用质粒DNA转染HEK 293FT或N2A细胞。转染后,在基因组DNA提取之前,将细胞在37℃下孵育72小时。遵循制造商的方案,使用QuickExtract DNA提取试剂盒(Epicentre)提取基因组DNA。简言之,将细胞重悬于QuickExtract溶液中并在65℃下孵育15分钟并且在98℃下孵育10分钟。将提取的基因组DNA立即加工或存储在-20℃下。

  对于每个基因而言,PCR扩增围绕CRISPR靶位点的基因组区域,并且遵循制造商的方案,使用QiaQuick Spin柱(凯杰公司(Qiagen))纯化产物。将总共400ng的纯化的PCR产物与2μl 10X Taq聚合酶PCR缓冲液(Enzymatics公司)和超纯水混合,至终体积为20μl,并使其经受重退火过程,以使得可以形成异源双链体:95℃持续10min,以-2℃/s 95℃降至85℃,以-0.25℃/s 85℃降至25℃,并且在25℃保持1分钟。重退火后,遵循制造商推荐的方案,将产物用Surveyor核酸酶和Surveyor增强子S(转基因组学公司(Transgenomics))处理,并且在4%-20%Novex TBE聚丙烯酰胺凝胶(生命技术公司)上进行分析。将凝胶用SYBR Gold DNA染色剂(生命技术公司)染色30分钟并用Gel Doc凝胶成像系统(伯乐公司)成像。定量是基于作为切割的DNA的部分的量度的相对条带强度。图7提供了此Surveyor测定的一个示意图。

  用于检测同源重组的限制性片段长度多态性测定。

  将HEK 293FT和N2A细胞用质粒DNA转染,并且如上所述,在基因组DNA提取之前,将其在37℃下孵育72小时。使用引物在同源重组(HR)模板的同源臂外PCR扩增靶基因组区域。将PCR产物分离在1%琼脂糖凝胶上并用MinElute GelExtraction试剂盒(凯杰公司)提取。将纯化产物用HindIII(费尔芒斯公司(Fermentas))消化并在6%Novex TBE聚丙烯酰胺凝胶(生命技术公司)上进行分析。

  RNA二级结构预测和分析

  使用质心结构预测算法,使用由维也纳大(University of Vienna)的理论化学研究所(Institute for Theoretical Chemistry)研发的在线网络服务器RNAfold进行RNA二级结构预测(参见例如A.R.格鲁伯(A.R.Gruber)等人,2008,《细胞》(Cell)106(1):23-24;以及PA卡尔(PA Carr)和GM丘奇(GM Church),2009,《自然生物技术》(Nature Biotechnology)27(12):1151-62)。

  RNA纯化

  将HEK 293FT细胞如上所述地维持和转染。通过胰酶消化收获细胞,随后在磷酸盐缓冲生理盐水(PBS)中洗涤。遵循制造商的方案,用TRI试剂(西格玛公司)提取总细胞RNA。使用Naonodrop(赛默飞世尔科技公司(Thermo Scientific))对提取的总RNA进行定量并归一化至同一浓度。

  哺乳动物细胞中的crRNA和tracrRNA表达的Northern印迹分析

  将RNA与等体积的2X加样缓冲液(Ambion)混合,加热至95℃持续5min,在冰上冷冻1min,并且然后在将凝胶预跑胶至少30分钟后,加样到8%变性聚丙烯酰胺凝胶(SequaGel,国立诊断公司(National Diagnostics))上。将样品以40W极限电泳1.5小时。之后,在室温下,将RNA转移到半干转移设备(伯乐公司)中的300mA的Hybond N+膜(通用电气医疗公司(GE Healthcare))上,持续1.5小时。使用Stratagene UV Crosslinker the Stratalinker(Stratagene)上的自动交联按钮将RNA交联到该膜上。在42℃下,伴随旋转,将该膜在ULTRAhyb-Oligo杂交缓冲液(Ambion)中预杂交30min,并且然后添加探针并杂交过夜。探针订购自IDT并将其用具有T4多核苷酸激酶(新英格兰生物实验室(New England Biolabs)))的[γ-32P]ATP(珀金埃尔默公司)标记。将该膜用预加温的(42℃)2xSSC、0.5%SDS洗涤一次,持续1min,随后在42℃下洗涤两次,每次持续30分钟。将该膜在室温下向荧光屏暴露一小时或过夜并且然后用感光成像仪(Typhoon)扫描。

  细菌CRISPR系统构建和评价

  从具有用于吉布森拼接(Gibson Assembly)的侧翼同源臂的化脓链球菌SF370基因组DNA PCR扩增CRISPR座位元件(包括tracrRNA、Cas9和前导子)。将两个BsaI类型IIS位点引入在两个同向重复之间,以促进方便地插入间隔子(图8)。使用Gibson Assembly Master Mix(NEB)将PCR产物克隆进EcoRV-消化的pACYC184中,在tet启动子的下游。省略其他内源CRISPR系统元件,Csn2的最后50bp除外。将编码具有互补突出端的间隔子的寡聚物(整合DNA技术公司(Integrated DNA Technology))克隆进BsaI-消化的载体pDC000(NEB)中并且然后用T7连接酶(Enzymatics公司)连接,以产生pCRISPR质粒。包含具有PAM的间隔子的激发质粒

  在哺乳动物细胞中的表达(图6A中所示出的表达构建体,其中功能性是如显示于图6B中的Surveyor测定的结果所确定的)。将转录起始位点标为+1,并且还指示了转录终止子和通过Northern印迹探测的序列。还通过Northern印迹确认了加工的tracrRNA的表达。图6C显示了提取自293FT细胞的总RNA的Northern印迹分析的结果,用携带长或短tracrRNA以及SpCas9和DR-EMX1(1)-DR的U6表达构建体转染这些细胞。左图和右图分别是来自用或没用SpRNA酶III转染的293FT细胞。U6指示用靶向人类U6snRNA的探针进行印迹的加样对照。短tracrRNA表达构建体的转染产生丰富水平的加工形式的tracrRNA(约75bp)。在Northern印迹上检测极低量的长tracrRNA。

  为了促进转录精确起始,选择基于RNA聚合酶III的U6启动子,以驱动tracrRNA的表达(图2C)。类似地,研发基于U6启动子的构建体,以表达由单个间隔子组成的前-crRNA阵列,该单个间隔子侧翼为两个同向重复(DR,还被术语“tracr配对序列”所涵盖;图2C)。将起始间隔子设计成靶向人EMX1座位(图2C)中的33-碱基对(bp)靶位点(满足Cas9的NGG识别基序的30-bp原型间隔子加3-bp CRISPR基序(PAM)序列),该座位是大脑皮层的发育中的一个关键基因。

  为了测试CRISPR系统(SpCas9、SpRNA酶III、tracrRNA以及前-crRNA)在哺乳动物细胞中的异源表达是否可以实现哺乳动物染色体的靶向切割,用CRISPR组分的组合转染HEK 293FT细胞。由于哺乳动物细胞核中的DSB通过导致形成indel的非同源末端连接(NHEJ)途径而部分地修复,使用Surveyor测定检测靶EMX1座位处的潜在的切割活性(图7)(参见例如格斯钦(Guschin)等人,2010,《分子生物学方法》(Methods Mol Biol)649:247)。所有四种CRISPR组分的共转染能够在原型间隔子中诱导高达5.0%切割(参见图2D)。所有CRISPR组分(减去SpRNA酶III)的共转染在原型间隔子中也诱导高达4.7%indel,表明可能存在能够辅助crRNA成熟的内源性哺乳动物RNA酶,如例如相关的切丁酶(Dicer)和Drosha酶。除去剩余的三种组分中的任何组分消除CRISPR系统的基因组切割活性(图2D)。包含已证实切割活性的靶座位的扩增子的桑格测序:在43个测序的克隆中,发现5个突变的等位基因(11.6%)。使用多种指导序列的类似实验产生了高达29%的indel百分比(参见图3-6、10和11)。这些结果定义了一种在哺乳动物细胞中的有效的CRISPR介导的基因组修饰的三组分系统。为了优化切割效率,申请人还测试了tracrRNA的不同亚型是否影响切割效率并且发现,在实例系统中,仅仅短(89-bp)转录物形式能够介导人类EMX1基因组座位的切割(图6B)。

  图12提供了哺乳动物细胞中的crRNA加工的另外的Northern印迹分析。图12A示出了一个示意图,显示了侧翼为两个同向重复(DR-EMX1(1)-DR)的单个间隔子的表达载体。靶向人EMX1座位原型间隔子1(参见图6)的30bp间隔子和同向重复序列显示于图12A下方的序列中。直线指示其反向互补系列用于产生供EMX1(1)crRNA检测用的Northern印迹探针的区域。图12B显示了提取自293FT细胞的总RNA的Northern印迹分析,用携带DR-EMX1(1)-DR的U6表达构建体转染这些细胞。左图和右图分别是来自用或没用SpRNA酶III转染的293FT细胞。DR-EMX1(1)-DR仅在存在SpCas9和短tracrRNA的情况下被加工为成熟crRNA并且不依赖于SpRNA酶III的存在。检测的来自转染的293FT总RNA的成熟crRNA是约33bp并且比来自化脓链球菌的39-42bp成熟crRNA短。这些结果证明,CRISPR系统可以被移植进真核细胞中并被重新编程,以促进内源哺乳动物靶多核苷酸的切割。

  图2示出了描述于此实例中的细菌CRISPR系统。图2A示出了一个示意图,显示了来自化脓链球菌SF370的CRISPR座位和通过此系统CRISPR介导的DNA切割的建议机制。加工自同向重复-间隔子阵列的成熟crRNA指导Cas9到以下基因组靶标,这些靶标由互补原型间隔子和原型间隔子相邻基序(PAM)组成。靶标-间隔子碱基配对后,Cas9介导靶DNA中的双链断裂。图2B示出了具有使得可以导入到哺乳动物细胞核中的核定位信号(NLS)的化脓链球菌Cas9(SpCas9)和RNA酶III(SpRNase III)的工程化。图2C示出了由组成型EF1a启动子驱动的SpCas9和SpRNA酶III以及由RNA Pol3启动子U6驱动的tracrRNA和前-crRNA阵列(DR-间隔子-DR)的哺乳动物表达,上述启动子促进转录精确起始和终止。将来自具有令人满意的PAM序列的人EMX1座位的原型间隔子用作前-crRNA阵列中的间隔子。图2D示出了SpCas9介导的次要插入和缺失的Surveyor核酸酶测定。使用和不使用SpRNA酶III、tracrRNA以及携带EMX1-靶间隔子的前-crRNA阵列表达SpCas9。图2E示出了靶座位与EMX1-靶向crRNA之间的碱基配对的一个示意表示以及一个显示了与SpCas9切割位点邻近的微小缺失的示例性色谱图。图2F示出了从43个克隆扩增子的测序分析鉴定出的突变的等位基因,这些扩增子显示出多种微小插入和缺失。破折号指示缺失的碱基,并且非比对或错配碱基指示插入或突变。比例尺=10μm。

  为了进一步简化该三组分系统,改编嵌合的crRNA-tracrRNA杂交体设计,其中成熟crRNA(包括指导序列)可以经由茎-环而融合到部分tracrRNA上,以模拟天然的crRNA:tracrRNA双链体。为了增加共递送效率,产生双顺反子表达载体,以驱动嵌合的RNA和SpCas9在转染细胞中的共表达。平行地,使用该双顺反子载体表达前-crRNA(DR-指导序列-DR)与SpCas9,以诱导用分开表达的tracrRNA加工为crRNA(比较图11B的上图和底图)。图8提供了前-crRNA阵列(图8A)或嵌合的crRNA(由图8B中的指导序列插入位点的下游和EF1α启动子的上游的短线表示)与hSpCas9的双顺反子表达载体的示意图,显示了各种元件的位置和指导序列插入点。图8B中的围绕指导序列插入位点的位置的展开的序列还显示了部分DR序列(GTTTAGAGCTA SEQ ID NO:___)和部分tracrRNA序列(TAGCAAGTTAAAATAAGGCTAGTCCGTTTTT SEQ ID NO:___)。可以使用退火的寡核苷酸将指导序列插入在BbsI位点之间。寡核苷酸的序列设计显示在图8中的示意图的下方,其中指示了适当的连接适配子。WPRE表示土拨鼠肝炎病毒转录后调节元件。通过靶向与上述相同的EMX1座位而测试嵌合RNA介导的切割效率。使用扩增子的Surveyor测定和桑格测序两者,申请人确认到嵌合的RNA设计以大约4.7%的修饰率而促进人EMX1座位的切割(图3)。

  通过设计靶向人EMX1和PVALB以及小鼠Th座位中的多个位点的嵌合RNA,通过靶向人类和小鼠细胞两者中的另外的基因组座位而测试CRISPR介导的切割在真核细胞中的普遍性。图13示出了人类PVALB(图13A)和小鼠Th(图13B)座位中的一些另外的靶向原型间隔子的选择。提供了各自的最后的外显子内的基因座位位和三个原型间隔子的位置的示意图。加下划线的序列包括30bp的原型间隔子序列和对应于PAM序列的3’端处的3bp。分别在DNA序列的上方和下方指示了有义链和反义链上的原型间隔子。人类PVALB和小鼠Th座位分别达到了6.3%和0.75%的修饰率,证明了CRISPR系统跨多种生物在修饰不同座位方面的广阔适用性(图5)。虽然对于每个座位而言,使用嵌合的构建体仅伴随三分之一的间隔子检测切割,但是当使用共表达的前-crRNA安排时,所有靶序列都被切割,伴随达到27%的有效的indel产生(图6和13)。

  图11提供了可以被重新编程为靶向哺乳动物细胞中的多个基因组座位的SpCas9的另外的图解。图11A提供了人EMX1座位的示意图,显示了五个原型间隔子的位置,由加下划线的序列指示。图11B提供了前-crRNA/trcrRNA复合物的示意图,显示了前-crRNA和tracrRNA的同向重复区之间的杂交(上),以及嵌合的RNA设计的示意图,包括一个20bp指导序列和由部分同向重复组成的tracr配对和tracr序列以及以发夹结构杂交的tracrRNA序列(下)。比较人EMX1座位中的五个原型间隔子处的Cas9介导的切割的效率的Surveyor测定的结果示于图11C中。使用加工的前-crRNA/tracrRNA复合物(crRNA)或嵌合的RNA(chiRNA)靶向每个原型间隔子。

  由于RNA的二级结构对于分子间相互作用可以是决定性的,使用基于最小自由能和玻尔兹曼(Boltzmann)加权结构集合的结构预测算法比较基因组靶向实验中使用的所有指导序列的假定的二级结构(参见例如格鲁贝尔(Gruber)等人,2008,《核酸研究》(Nucleic Acids Research),36:W70)。分析揭示到在大多数情况下,在嵌合的crRNA背景下有效的指导序列基本上不含二级结构基序,而无效的指导序列更可能形成可以阻止与靶原型间隔子DNA进行碱基配对的内部二级结构。因此,可能的是,当使用嵌合的crRNA时,间隔子二级结构的变异性可能影响CRISPR介导的干扰的效率。

  SpCas9的另外的载体设计显示于图22中,示出了掺入连接到指导寡核苷酸的插入位点的U6启动子和连接到SpCas9编码序列上的Cbh启动子的单个表达载体。显示于图22b中的载体包括一个连接到H1启动子上的tracrRNA编码序列。

  在细菌测定中,所有的间隔子均促进有效的CRISPR干扰(图3C)。这些结果表明,可能存在影响哺乳动物细胞中的CRISPR活性效率的另外的因素。

  为了研究CRISPR介导的切割的特异性,使用一系列具有单点突变的EMX1-靶向嵌合的crRNA分析指导序列中的单核苷酸突变对哺乳动物基因组中的原型间隔子切割的影响(图3A)。图3B示出了比较当与不同突变的嵌合的RNA配对时Cas9的切割效率的Surveyor核酸酶测定的结果。PAM的5’的高达12-bp的单碱基错配基本上消除了由SpCas9进行的基因组切割,而在离上游位置更远处具有突变的间隔子保留针对原始原型间隔子靶标的活性(图3B)。除PAM之外,SpCas9在间隔子的最后12-bp内具有单碱基特异性。此外,CRISPR能够像一对靶向同一EMX1原型间隔子的TALE核酸酶(TALEN)一样有效地介导基因组切割。图3C提供了一个示意图,显示了靶向EMX1的TALEN的设计并且图3D显示了比较TALEN和Cas9的效率的Surveyor凝胶(n=3)。

  已经通过易错NHEJ机制建立了一套用于在哺乳动物细胞中实现CRISPR介导的基因编辑的组分,测试CRISPR刺激同源重组(HR)的能力,同源重组是一种用于使得基因组中的编辑精确的高保真基因修复途径。野生型SpCas9能够介导位点特异的DSB,这些DSB可以通过NHEJ和HR两者进行修复。另外,将SpCas9的RuvC I催化结构域中的天冬氨酸至丙氨酸取代(D10A)工程化,以将核酸酶转化为切口酶(SpCas9n;示于图4A中)(参见例如萨普拉诺萨克斯(Sapranausaks)等人,2011,《核酸研究》(Nucleic Acids Research),39:9275;加索纳斯(Gasiunas)等人,2012,《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA),109:E2579),这样使得带切口的基因组DNA经历高保真同源定向修复(HDR)。Surveyor测定确认到,SpCas9n在EMX1原型间隔子靶标处不产生indel。如图4B所示,EMX1-靶向的嵌合crRNA与SpCas9的共表达在靶位点中产生indel,而与SpCas9n的共表达不产生indel(n=3)。此外,327个扩增子的测序未检测到由SpCas9n诱导的任何indel。选择相同的座位,以通过用靶向EMX1、hSpCas9或hSpCas9n的嵌合RNA以及用于在原型间隔子附近引入一对限制酶切位点(HindIII和NheI)的HR模板共转染HEK 293FT细胞而测试CRISPR介导的HR。图4C提供了HR策略的示意图,包含重组点的相对位置和引物退火序列(箭头)。SpCas9和SpCas9n的确催化将HR模板整合进EMX1座位中。PCR扩增靶区域,随后用HindIII进行限制酶切消化揭示了对应于期望片段尺寸的切割产物(显示于图4D中的限制性片段长度多态性分析中的箭头),其中SpCas9和SpCas9n介导类似水平的HR效率。申请人使用基因组扩增子的桑格测序进一步证实了HR(图4E)。这些结果证明了CRISPR促进哺乳动物基因组中的靶向基因插入的实用性。鉴于14-bp(来自间隔子的12-bp和来自PAM的2-bp)特异地靶向野生型SpCas9,切口酶的可获得性可以显著减少脱靶修饰的可能性,因为单链断裂不是易错NHEJ途径的底物。

  构建模拟具有阵列的间隔子的CRISPR座位的天然构造的表达构建体(图2A),以测试多元序列靶向的可能性。使用编码一对EMX1-和PVALB-靶向间隔子的单CRISPR阵列,在两个座位处都检测到了有效的切割(图4F,显示了crRNA阵列的示意设计和显示出切割的有效修饰的Surveyor印迹两者)。使用针对由119bp间隔开的EMX1内的两个靶标的间隔子通过共存DSB还检测到了较大基因组区的靶向缺失,并且检测到了1.6%缺失效率(182个扩增子中的3个;图4G)。这证明,CRISPR系统可以介导单个基因组中的多元编辑。

  实例2:CRISPR系统修饰和替代方案

  使用RNA编程序列特异的DNA切割的能力定义了一个新类别的针对多种研究和工业应用的基因组工程化工具。可以进一步改善CRISPR系统的若干方面,以增加CRISPR靶向的效率和通用性。优化的Cas9活性可以依赖于处于比存在于哺乳动物细胞核中的游离Mg2+高的水平的游离Mg2+的可获得性(参见例如季聂克(Jinek)等人,2012,《科学》(Science),337:816),并且对恰好位于原型间隔子的下游的NGG基序的偏好限制靶向人类基因组中的平均每12-bp的能力(图9,评价了人类染色体序列的正链和负链两者)。这些约束中的一些可以通过探索CRISPR座位跨微生物宏基因组的多样性而克服(参见例如马卡洛娃(Makarova)等人,2011,《自然微生物学综述》(Nat Rev Microbiol),9:467)。可以通过类似于实例1中描述的方法将其他CRISPR座位移植进哺乳动物细胞环境中。例如,图10示出了来自嗜热链球菌LMD-9的CRISPR 1的用于在哺乳动物细胞中进行异源表达的II型CRISPR系统的适应,以实现CRISPR介导的基因组编辑。图10A提供了来自嗜热链球菌LMD-9的CRISPR 1的示意图。图10B示出了嗜热链球菌CRISPR系统的表达系统的设计。使用组成型EF1α启动子表达人类密码子优化的hStCas9。使用促进转录精确起始的U6启动子表达tracrRNA和crRNA的成熟版本。示出了来自成熟crRNA和tracrRNA的序列。crRNA序列中的由小写字母“a”指示的单个碱基用于除去作为RNA polIII转录终止子的polyU序列。图10C提供了一个示意图,显示了靶向人EMX1座位的指导序列。图10D显示了使用Surveyor测定的靶座位中的hStCas9介导的切割的结果。RNA指导间隔子1和2分别诱导了14%和6.4%。在这两个原型间隔子位点处跨生物复制物的切割活性的统计分析还提供于图5中的。图14提供了嗜热链球菌CRISPR系统的另外的原型间隔子和在人EMX1座位中的对应的PAM序列靶标示意图。两个原型间隔子序列被高亮并且通过相对于对应的高亮序列为3’加下划线而指示满足NNAGAAW基序的对应的PAM序列。两个原型间隔子均靶向反义链。

  实例3:样品靶序列选择算法

  设计一个软件程序,以基于指定的CRISPR酶的希望的指导序列长度和CRISPR基序序列(PAM),在输入DNA序列的两条链上鉴定候选CRISPR靶序列。例如,可以通过在输入序列和该输入序列的反向补体两者上检索5’-Nx-NGG-3’而鉴定来自化脓链球菌的Cas9的具有PAM序列NGG的靶位点。同样地,可以通过在输入序列和该输入序列的反向互补体两者上检索5’-Nx-NNAGAAW-3’而鉴定化脓链球菌CRISPR1的Cas9的具有PAM序列NNAGAAW的靶位点。同样地,可以通过在输入序列和该输入序列的反向互补体两者上检索5’-Nx-NGGNG-3’而鉴定化脓链球菌CRISPR3的Cas9的具有PAM序列NGGNG的靶位点。可以通过程序固定或由使用者指定Nx中的值“x”,如20。

  由于在DNA靶位点的基因组中出现多次可以导致非特异的基因组编辑,因此在鉴定所有潜在的位点后,基于序列在相关参比基因组中出现的次数,该程序将其滤出。对于其序列特异性是通过‘种子(seed)’序列(如来自PAM序列的11-12bp 5’,包括PAM序列本身)确定的那些CRISPR酶,过滤步骤可以基于该种子序列。因此,为了避免另外的基因组座位处的编辑,基于种子:PAM序列在相关基因组中出现的次数过滤结果。可以允许使用者选择种子序列的长度。处于通过过滤器的目的,还可以允许使用者指定种子:PAM序列在基因组中出现的次数。默认筛选独特序列。通过改变种子序列的长度和该序列在基因组中出现的次数两者而改变过滤水平。该程序可以另外或可替代地通过提供鉴定的一个或多个靶序列的反向互补体而提供与报告的一个或多个靶序列互补的指导序列的序列。一些靶位点在人类基因组中的示例性可视化提供于图18中。

  用于优化序列选择的方法和算法的另外的细节可以发现于通过引用结合在本文的美国申请序列号61/064,798(代理人案号44790.11.2022;博德参考号BI-2012/084)中。

  实例4:多种嵌合的crRNA-tracrRNA杂交体的评价

  此实例描述了针对具有掺入不同长度的野生型tracrRNA序列的tracr序列的嵌合的RNA(chiRNAs;在单个转录物中包括指导序列、tracr配对序列以及tracr序列)而获得的结果。图16a示出了嵌合的RNA和Cas9的双顺反子表达载体的示意图。Cas9由CBh启动子驱动并且嵌合的RNA由U6启动子驱动。嵌合的指导RNA由接合到tracr序列的20bp指导序列(N)组成(从下链的第一个“U”到该转录物的结尾),其在如指示的各点被截短。指导和tracr序列由tracr-配对序列GUUUUAGAGCUA(SEQ ID NO:___),随后是环序列GAAA隔开。人EMX1和PVALB座位处的Cas9介导的indel的SURVEYOR测定的结果分别示于图16b和16c中。箭头指示预期的SURVEYOR片段。ChiRNA由其“+n”标志指示,并且crRNA是指指导序列和tracr序列被表达为分开的转录物的杂交体RNA。一式三份地进行的这些结果的定量示于图17a和17b的直方图中,分别对应于图16b和16c(“N.D.”指示未检测到indel)。原型间隔子ID及其对应的基因组靶标、原型间隔子序列、PAM序列以及链位置提供于表D中。将指导序列设计成与整个原型间隔子序列互补(在杂交体系统中的分开的转录物的情况下),或仅为部分加下划线(在嵌合的RNA的情况下)。

  表D:

  这些分别是SEQ ID NO:___至____。

  用于优化指导序列的另外的细节可以发现于通过引用结合在本文的美国申请序列号61/836,127(代理人案号44790.08.2022;博德参考号BI-2013/004G)中。

  初始,靶向人HEK 293FT细胞中的EMX1座位内的三个位点。使用SURVEYOR核酸酶测定评估每种chiRNA的基因组修饰效率,该测定检测由DNA双链断裂(DSB)及其通过非同源末端连接(NHEJ)DNA损伤修复途径进行的随后修复造成的突变。被指定为chiRNA(+n)的构建体指示,野生型tracrRNA的直达第+n个核苷酸被包括在嵌合的RNA构建体中,其中48、54、67和85的值用于n。嵌合的RNA在所有三个EMX1靶位点处都包含长片段的野生型tracrRNA(chiRNA(+67)和chiRNA(+85))介导的DNA切割,其中chiRNA(+85)尤其展示出比以分开的转录物形式表达指导序列和tracr序列的对应的crRNA/tracrRNA杂交体显著更高水平的DNA切割(图16b和17a)。还使用chiRNA靶向PVALB座位中的两个位点,其不产生使用杂交体系统(作为分开的转录物而表达的指导序列和tracr序列)的可检测的切割。chiRNA(+67)和chiRNA(+85)能够在两个PVALB原型间隔子处介导显著的切割(图16c和17b)。

  对于EMX1和PVALB座位中的所有五个靶标,伴随增加的tracr序列长度观察到一致增加的基因组修饰效率。不希望受任何理论的束缚,由tracrRNA的3’端形成的二级结构可以在增强CRISPR复合物形成率方面发挥一定作用。

  实例5:Cas9多样性

  CRISPR-Cas系统是一种由跨细菌和古生菌的相异物种利用的针对侵入型外源DNA的获得性免疫机制。II型CRISPR-Cas9系统由一套编码负责将外源DNA“捕获(acquisition)”进CRISPR座位中的蛋白质的基因以及一套编码负责“执行(execution)”DNA切割机制的蛋白质的基因组成;这些包括DNA核酸酶(Cas9)、非编码反式激活cr-RNA(tracrRNA)以及侧翼为同向重复的外源DNA衍生的间隔子阵列(crRNA)。当被Cas9成熟后,tracRNA和crRNA双链体指导Cas9核酸酶到由间隔子指导序列规定的靶DNA序列,并且在靶DNA中介导短序列基序附近的DNA中的双链断裂,该导短序列基序为切割所需并且对于每种CRISPR-Cas系统而言是特异的。II型CRISPR-Cas系统发现在整个细菌界中并且在用于靶标切割的Cas9蛋白序列和尺寸、tracrRNA和crRNA同向重复序列、这些元件的基因组组织以及基序要求方面高度相异。一个物种可以具有多种相异的CRISPR-Cas系统。

  申请人评价了来自基于与已知Cas9的序列同源性和与已知亚结构域直向同源的结构鉴定的细菌种类的207个假定的Cas9,这些亚结构域包括HNH内切核酸酶结构域和RuvC内切核酸酶结构域[信息来自尤金库宁(Eugene Koonin)和基拉马卡洛娃(Kira Makarova)]。基于此套的蛋白质序列保守的系统发生分析揭示了五个Cas9家族,包括三组大的Cas9(~1400个氨基酸)和两组小的Cas9(~1100个氨基酸)(参见图19和20A-F)。

  Cas9和Cas9酶转化为切口酶或DNA结合蛋白的突变及其具有的改变的功能性的用途的另外的细节可以发现于通过引用结合在本文的美国申请序列号61/836,101和61/835,936(代理人案号分别为44790.09.2022和4790.07.2022并且博德参考号分别为BI-2013/004E和BI-2013/004F)中。

  实例6:Cas9直向同源物

  申请人分析了Cas9直向同源物,以鉴定相关的PAM序列和对应的嵌合的指导RNA。具有一套展开的PAM提供了跨基因组的更广泛的靶向并且还显著增加独特靶位点的数目并且提供了在基因组中鉴定具有增加水平的特异性的新颖的Cas9的潜力。

  可以通过测试每种Cas9容忍指导RNA及其DNA靶标之间的错配的能力评价Cas9直向同源物的特异性。例如,已经通过测试指导RNA中的突变对切割效率的影响表征了SpCas9的特异性。用指导序列与靶DNA之间的单个或多个错配建立指导RNA文库。基于这些发现,可以基于以下准则选择SpCas9的靶位点:

  为了最大化SpCas9编辑具体基因的特异性,应该在感兴趣的座位内选择一个靶位点,这样使得潜在的‘脱靶’基因组序列遵守以下四个约束:首先,它们的后面不应该是具有的5’-NGG或NAG序列的PAM。其次,它们与靶序列的整体序列相似性应该是最小化的。第三,最大数目的错配应该位于脱靶位点的PAM-近侧区内。最后,最大数目的错配应该是连续的或由少于四个碱基隔开。

  可以使用类似的方法评价其他Cas9直向同源物的特异性和建立在靶标种类的基因组内选择特定靶位点的标准。如前所述,基于此套的蛋白质序列保守的系统发生分析揭示了五个Cas9家族,包括三组大的Cas9(约1400个氨基酸)和两组小的Cas9(约1100个氨基酸)(参见图19和20A-F)。Cas直向同源物的另外的细节可以发现于通过引用结合在本文的美国申请序列号61/836,101和61/835,936(代理人案号分别为44790.09.2022和4790.07.2022并且博德参考号分别为BI-2013/004E和BI-2013/004F)中。

  实例7:用于简化克隆和递送的方法改进。

  并非在质粒上编码U6-启动子和指导RNA,申请人用DNA寡核苷酸扩增了U6启动子,以添加到指导RNA上。可以将生成的PCR产物转染到细胞中,以驱动指导RNA的表达。

  允许产生由靶向人EMX1座位的U6-启动子::指导RNA组成的PCR产物的示例性引物对:

  正向引物:AAACTCTAGAgagggcctatttcccatgattc(SEQ ID NO:___)

  反向引物(携带指导RNA,该指导RNA已加下划线):acctctagAAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATGCTGTTTTGTTTCCAAAACAGCATAGCTCTAAAACCCCTAGTCATTGGAGGTGACGGTGTTTCGTCCTTTCCACaag(SEQ ID NO:___)

  实例8:用于改善活性的方法改进:

  并非使用pol3启动子(特别是RNA聚合酶III(例如U6或H1启动子)在真核细胞中表达指导RNA,申请人在真核细胞中表达T7聚合酶,以使用T7启动子驱动指导RNA的表达。

  此系统的一个实例可以涉及引入三段DNA:

  1.Cas9的表达载体

  2.T7聚合酶的表达载体

  3.包含融合到T7启动子上的指导RNA的表达载体

  实例9:用于减少Cas9的毒性的方法改进:将Cas9以mRNA的形式递送。

  将Cas9以mRNA的形式递送使得可以在细胞中瞬时表达Cas9,以减少毒性。例如,可以使用以下引物对扩增人源化SpCas9:

  正向引物(用以添加到用于体外转录的T7启动子上):TAATACGACTCACTATAGGAAGTGCGCCACCATGGCCCCAAAGAAGAAGCGG(SEQ ID NO:___)

  反向引物(用以添加到polyA尾上):GGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTttcttaCTTTTTCTTTTTTGCCTGGCCG(SEQ ID NO:___)

  申请人用处于RNA或DNA盒形式的指导RNA将Cas9mRNA转染进细胞中,以驱动指导RNA在真核细胞中的表达。

  实例10:用于减少Cas9的毒性的方法改进:使用诱导型启动子

  申请人仅当需要进行基因组修饰时才瞬时开启Cas9表达。可诱导系统的实例包括四环素诱导型启动子(Tet-开或Tet-关)、小分子双杂交体转录激活系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素)。

  实例11:Cas9系统用于体内应用的改进

  申请人执行了具有小分子量的Cas9的宏基因组检索。大多数Cas9同系物相当大。例如,SpCas9的长度为1368aa左右,这对于容易包装进供递送的病毒载体中而言太大。从存放在GenBank中的序列生成表示出Cas9同系物的长度分布的图表(图23)。一些序列可能已经被错误注释并且因此每个长度的准确频率不一定是精确的。尽管如此,但是它提供了对Cas9蛋白分布的模糊认识并且表明存在较短的Cas9同系物。

  通过计算分析,申请人发现在细菌菌株弯曲杆菌属中,存在两个具有少于1000个氨基酸的Cas9蛋白。下文呈现了来自空肠弯曲杆菌的一种Cas9的序列。以此长度,CjCas9可以被容易地包装进AAV、慢病毒、腺病毒以及其他用于稳健地递送进原代细胞和递送进动物模型体内的病毒载体中。在本发明的一个优选实施例中,使用来自金黄色葡萄球菌的Cas9蛋白。

  >空肠弯曲杆菌Cas9(CjCas9)(SEQ ID NO:___)

  MARILAFDIGISSIGWAFSENDELKDCGVRIFTKVENPKDGESLALPRRLARSARKRLARRKARLNHLKHLIANEFKLNYEDYQSFDESLAKAYKGSLISPYELRFRALNELLSKQDFARVILHIAKRRGYDDIKNSDDKEKGAILKAIKQNEEKLANYQSVGEYLYKEYFQKFKENSKEFTNVRNKKESYERCIAQSFLKDELKLIFKKQREFGFSFSKKFEEEVLSVAFYKRALKDFSHLVGNCSFFTDEKRAPKNSPLAFMFVALTRIINLLNNLKNTEGILYTKDDLNALLNEVLKNGTLTYKQTKKLLGLSDDYEFKGEKGTYFIEFKKYKEFIKALGEHNLSQDDLNEIAKDITLIKDEIKLKKALAKYDLNQNQIDSLSKLEFKDHLNISFKALKLVTPLMLEGKKYDEACNELNLKVAINEDKKDFLPAFNETYYKDEVTNPVVLRAIKEYRKVLNALLKKYGKVHKINIELAREVGKNHSQRAKIEKEQNENYKAKKDAELECEKLGLKINSKNILKLRLFKEQKFFCAYSGEKIKISDLQDEKMLFIDHIYPYSRSFDDSYMNKVLVFTKQNQEKLNQTPFEAFGNDSAKWQKIEVLAKNLPTKKQKRILDKNYKDKEQKNFKDRNLNDTRYIARLVLNYTKDYLDFLPLSDDFNTKLNDTQKGSKVHVEAKSGMLTSALRHTWGFSAKDRNNHLHHAIDAVIIAYANNSIVKAFSDFKKEQESNSAELYAKKISELDYKNKRKFFEPFSGFRQKVLDKIDEIFVSKPERKKPSGALHEETFRKEEEFYQSYGGKEGVLKALELGKIRKVNGKIVKNGDMFRVDIFKHKKTNKFYAVPIYTMDFALKVLPNKAVARSKKGEIKDWILMDENYEFCFSLYKDSLILIQTKDMQEPEFVYYNAFTSSTVSLIVSKHDNKFETLSKNQKILFKNANEKEVIAKSIGIQNLKVFEKYIVSALGEVTKAEFRQREDFKK.

  此CjCas9的假定的tracrRNA元件是:

  TATAATCTCATAAGAAATTTAAAAAGGGACTAAAATAAAGAGTTTGCG GGACTCTGCGGGGTTACAATCCCCTAAAACCGCTTTTAAAATT(SEQ ID NO:___)

  同向重复序列是:

  ATTTTACCATAAAGAAATTTAAAAAGGGACTAAAAC(SEQ ID NO:___)

  CjCas9的嵌合的指导RNA的一个实例是:

  NNNNNNNNNNNNNNNNNNNNNGUUUUAGUCCCGAAAGGGACUAAAAUAAAGAGUUUGCGGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(SEQ ID NO:___)

  实例12:Cas9优化

  用于增强功能或用于开发新的功能,申请人通过组合来自不同Cas9同系物的片段而产生了嵌合的Cas9蛋白。例如,嵌合的Cas9蛋白的两个实例:

  例如,申请人将St1Cas9(来自此蛋白的片段为粗体)的N-末端与SpCas9(来自此蛋白的片段被加下划线)的C-末端融合。

  >St1(N)Sp(C)Cas9(SEQ ID NO:___)

  MSDLVLGLDIGIGSVGVGILNKVTGEIIHKNSRIFPAAQAENNLVRRTNRQGRRLARRKKHRRVRLNRLFEESGLITDFTKISINLNPYQLRVKGLTDELSNEELFIALKNMVKHRGISYLDDASDDGNSSVGDYAQIVKENSKQLETKTPGQIQLERYQTYGQLRGDFTVEKDGKKHRLINVFPTSAYRSEALRILQTQQEFNPQITDEFINRYLEILTGKRKYYHGPGNEKSRTDYGRYRTSGETLDNIFGILIGKCTFYPDEFRAAKASYTAQEFNLLNDLNNLTVPTETKKLSKEQKNQIINYVKNEKAMGPAKLFKYIAKLLSCDVADIKGYRIDKSGKAEIHTFEAYRKMKTLETLDIEQMDRETLDKLAYVLTLNTEREGIQEALEHEFADGSFSQKQVDELVQFRKANSSIFGKGWHNFSVKLMMELIPELYETSEEQMTILTRLGKQKTTSSSNKTKYIDEKLLTEEIYNPVVAKSVRQAIKIVNAAIKEYGDFDNIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

  >Sp(N)St1(C)Cas9(SEQ ID NO:___)

  MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARE

  制备嵌合的Cas9的益处包括:

  降低毒性,

  改善在真核细胞中的表达,

  增强特异性,

  减少蛋白质的分子量,通过组合来自不同Cas9同系物的最小结构域使得蛋白质更小;以及

  改变PAM序列要求

  实例13:将Cas9作为通用DNA结合蛋白而利用

  通过使负责切割DNA靶标的两条链的两个催化结构域(D10和H840)突变,申请人使用Cas9作为通用DNA结合蛋白。为了上调在靶座位的基因转录,申请人将转录激活结构域(VP64)融合到Cas9上。申请人推测见到Cas9-VP64融合蛋白的较强的核定位应该是重要的,因为转录因子激活强度是在靶标处花费的时间的函数。因此,申请人克隆了一套Cas9-VP64-GFP构建体,将它们转染进293细胞中并在转染后12小时在荧光显微镜下评估其定位。

  将相同的构建体克隆为2A-GFP而非直接融合,以便在功能上测试不存在庞大GFP干扰的构建体。申请人选择用Cas9反式激活因子靶向Sox2座位,因为这对于细胞重新编程可以是有用的并且该座位已经被验证为TALE-TF介导的转录激活的靶标。对于Sox2座位,申请人选择了转录起始位点(TSS)附近的八个靶标。每个靶标的长度均为20bp,具有一个相邻的NGG原型间隔子邻近基序(PAM)。将每个Cas9-VP64构建体与每个PCR产生的嵌合的crispr RNA(chiRNA)共转染进293细胞中。转染后72小时,使用RT-qPCR评估转录激活。

  为了进一步优化转录激活因子,申请人滴定了转染进293细胞中的chiRNA(Sox2.1和Sox2.5)与Cas9(NLS-VP64-NLS-hSpCas9-NLS-VP64-NLS)的比例,并使用RT-qPCR进行定量。这些结果指示可以将Cas9用作通用DNA结合结构域,以上调靶座位处的基因转录。

  申请人设计了第二代构建体。(下表)。

  

  申请人使用这些构建体通过RT-qPCR评估转录激活(VP64融合的构建体)和阻遏(仅有Cas9)。申请人使用抗-His抗体评估每个构建体的细胞定位,使用Surveyor核酸酶测定评估核酸酶活性,并使用凝胶迁移测定评估DNA结合亲和性。在本发明的一个优选实施例中,该凝胶迁移测定是EMSA凝胶迁移测定。

  实例14:Cas9转基因和基因敲入小鼠

  为了产生表达Cas9核酸酶的小鼠,申请人提交了两个通用策略转基因和基因敲入。可以应用这些策略产生任何其他感兴趣的模式生物,例如大鼠。对于这些通用策略中的每个策略,申请人制备了组成型活性Cas9和条件表达的Cas9(Cre重组酶依赖性的)。在以下背景下表达组成型活性Cas9核酸酶:pCAG-NLS-Cas9-NLS-P2A-EGFP-WPRE-bGHpolyA。pCAG是启动子,NLS是核定位信号,P2A是肽切割序列,EGFP是增强型绿色荧光蛋白,WPRE是土拨鼠肝炎病毒转录后调节元件,并且bGHpolyA是牛生长激素poly-A信号序列(图25A-B)。该条件版本在启动子之后NLS-Cas9-NLS之前具有一个另外的终止盒元件loxP-SV40polyA x3-loxP(即pCAG-loxP-SV40polyAx3-loxP-NLS-Cas9-NLS-P2A-EGFP-WPRE-bGHpolyA)。这些重要的表达元件可以如在图26中可视化。组成型构建体应该在整个发育过程中在所有细胞类型中进行表达,而条件型构建体将仅当同一细胞正在表达Cre重组酶时才允许Cas9表达。当Cre处于组织特异的启动子的表达之下时,后一版本才将允许Cas9的组织特异的表达。此外,可以通过将Cre置于诱导型启动子(如TET on或off系统)的表达之下而在成年小鼠中诱导Cas9表达。

  Cas9构建体的验证:以三种方式在功能上验证每个质粒:1)瞬时转染进293个细胞中,随后确认GFP表达;2)瞬时转染进293细胞中,随后使用识别P2A序列的抗体进行免疫荧光;以及3)瞬时转染,随后是Surveyor核酸酶测定。取决于感兴趣的细胞,这些293细胞可以是293FT或293T细胞。在一个优选的实施例中,这些细胞是293FT细胞。条件型和组成型构建体的Surveyor的结果分别示于凝胶的顶行和底行。在存在和不存在靶向hEMX1座位的嵌合的RNA(嵌合的RNA hEMX1.1)的情况下测试每个构建体。结果指示,构建体仅在嵌合的RNA的存在下才可以成功地靶向hEMX1座位(并且在条件型构建体的情况下,是Cre)。将凝胶定量并且将结果呈现为三个样品的平均的切割效率和标准差。

  转基因的Cas9小鼠:为了产生具有构建体的转基因小鼠,申请人将纯的线性DNA注射进来自假怀孕的CB56雌鼠的受精卵的原核中。对首建者小鼠进行鉴定、基因分型,并与CB57小鼠回交。将构建体成功地克隆并通过桑格测序进行证实。

  基因敲入Cas9小鼠:为了产生Cas9基因敲入小鼠,申请人将相同的组成型和条件型构建体靶向Rosa26座位。申请人通过将每个构建体克隆进具有以下元件的Rosa26靶向载体中而将其完成:Rosa26短同源臂-组成型/条件型Cas9表达盒-pPGK-Neo-Rosa26长同源臂-pPGK-DTA。pPGK是赋予对新霉素的抗性的阳性选择标记Neo、1kb短臂,4.3kb长臂以及由PGK驱动的阴性选择白喉毒素(DTA)的启动子。

  将这两种构建体在R1mESC中电穿孔并且在应用新霉素选择之前,允许生长2天。挑选存活5-7天的单独的菌落并使其在单独的孔中生长。5-7天后,收获菌落,将一半冷冻并且将另一半用于基因分型。通过基因组PCR进行基因分型,其中一个引物在供体质粒(AttpF)内退火并且另一引物在短同源臂(Rosa26-R)外退火。在针对条件构建体情况下收获的22个菌落中,7个是阳性的(左侧)。在针对组成型构建体情况下收获的27个菌落中,零个是阳性的(右侧)。可能的是Cas9在mESC中引起一定水平的毒性并且出于此原因,不存在阳性克隆。为了对其进行测试,申请人将Cre表达质粒引入正确靶向的条件型Cas9细胞中并且在多天后在培养物中发现了极低的毒性。正确靶向的条件型Cas9细胞中的Cas9的减少的拷贝数(1-2个拷贝/个细胞)足以允许稳定表达和相对地没有细胞毒性。此外,此数据指示,Cas9拷贝数决定毒性。电穿孔后,每个细胞都应该得到若干拷贝的Cas9并且这可能是为什么在组成型Cas9构建体的情况下没有发现阳性菌落。这提供了较强的证据,即利用条件型Cre依赖性策略应该显示出减少的毒性。申请人将正确靶向的细胞注射进囊胚中并植入雌性小鼠体内。鉴定并回交嵌合体。对首建者小鼠进行鉴定和基因分型。

  条件型Cas9小鼠的实用性:申请人已经在293细胞中显示,可以通过与Cre共表达而激活Cas9条件型表达构建体。申请人还显示,当表达Cre时,正确靶向的R1mESC可以具有活性Cas9。因为在Cas9之后为P2A肽切割序列并且然后为EGFP,申请人通过观察EGFP而鉴定成功表达。这个相同的观念在于,什么使条件型Cas9小鼠如此有用。申请人可以将其条件型Cas9小鼠与普遍表达Cre的小鼠(ACTB-Cre系)杂交并且可以得到在每个细胞中表达Cas9的小鼠。应当仅仅采用嵌合的RNA的递送,以便诱导在胚胎小鼠或成年小鼠中的基因组编辑。有趣的是,如果条件型Cas9小鼠与在组织特异的启动子下表达Cre的小鼠杂交,在也表达Cre的组织中将会仅有Cas9。通过将嵌合的RNA递送到相同的组织中,此途径可以用来仅仅在精确的组织中编辑基因组。

  实例15:Cas9多样性和嵌合的RNA

  CRISPR-Cas系统是一种由跨细菌和古生菌的相异物种利用的针对侵入型外源DNA的获得性免疫机制。II型CRISPR-Cas系统由一套编码负责将外源DNA“捕获”进CRISPR座位中的蛋白质的基因以及一套编码负责“执行”DNA切割机制的蛋白质的基因组成;这些包括DNA核酸酶(Cas9)、非编码反式激活cr-RNA(tracrRNA)以及侧翼为同向重复的外源DNA衍生的间隔子阵列(crRNA)。当被Cas9成熟后,tracrRNA和crRNA双链体指导Cas9核酸酶到由间隔子指导序列规定的靶DNA序列,并且在靶DNA中介导短序列基序附近的DNA中的双链断裂,该导短序列基序为切割所需并且对于每种CRISPR-Cas系统而言是特异的。II型CRISPR-Cas系统发现在整个细菌界中并且在用于靶标切割的Cas9蛋白序列和尺寸、tracrRNA和crRNA同向重复序列、这些元件的基因组组织以及基序要求方面高度相异。一个物种可以具有多种相异的CRISPR-Cas系统。

  申请人评价了来自基于与已知Cas9的序列同源性和与已知亚结构域直向同源的结构鉴定的细菌种类的207个假定的Cas9,这些亚结构域包括HNH内切核酸酶结构域和RuvC内切核酸酶结构域[信息来自尤金库宁(Eugene Koonin)和基拉马卡洛娃(Kira Makarova)]。基于此套的蛋白质序列保守的系统发生分析揭示了五个Cas9家族,包括三组大的Cas9(~1400个氨基酸)和两组小的Cas9(~1100个氨基酸)(参见图19A-D和20A-F)。

  申请人还已经使用体外方法优化了Cas9指导RNA。

  实例16:Cas9突变

  在此实例中,申请人显示以下突变可以将SpCas9转化为切口酶:D10A、E762A、H840A、N854A、N863A、D986A。

  申请人提供了显示出序列突变点位于SpCas9基因内何处的序列(图24A-M)。申请人还显示,这些切口酶仍能够介导同源重组。此外,申请人显示,具有这些突变的SpCas9(单独地)不诱导双链断裂。

  所有Cas9直向同源物共享3-4个RuvC结构域和一个HNH结构域的通用结构。最5'的RuvC结构域切割非互补链,而HNH结构域切割互补链。所有符号都是就指导序列而言的。

  在5'RuvC结构域中的催化残基是通过感兴趣的Cas9与其他Cas9直向同源物(来自化脓链球菌II型CRISPR座位、嗜热链球菌CRISPR座位1、嗜热链球菌CRISPR座位3以及凶手弗朗西斯菌(Franciscilla novicida)II型CRISPR座位)的同源性比较而鉴定的,并且保守性Asp残基被突变为丙氨酸以将Cas9转化成互补链切口酶。类似地,在HNH结构域中的保守性His和Asn残基被突变为丙氨酸以将Cas9转化为非互补链切口酶。

  实例17:Cas9转录激活和Cas9阻遏物

  Cas9转录激活

  设计并测试第二代构建体(表1)。使用这些构建体通过RT-qPCR评估转录激活(VP64融合的构建体)和阻遏(仅有Cas9)。申请人使用抗-His抗体评估每个构建体的细胞定位,使用Surveyor核酸酶测定评估核酸酶活性,并使用凝胶迁移测定评估DNA结合亲和性。

  Cas阻遏物

  先前已经显示,可以将dCas9用作通用DNA结合结构域,以阻遏基因表达。申请人报告了改进的dCas9设计以及至阻遏物结构域KRAB和SID4x的dCas9融合。从表1中的建立用于使用Cas9来调制转录的质粒文库中,通过qPCR在功能上表征了以下阻遏物质粒:pXRP27、pXRP28、pXRP29、pXRP48、pXRP49、pXRP50、pXRP51、pXRP52、pXRP53、pXRP56、pXRP58、pXRP59、pXRP61以及pXRP62。

  将每个dCas9阻遏物质粒都与两个靶向β-连环蛋白基因的编码链的指导RNA共转染。转染后72小时,分离RNA并通过RT-qPCR定量基因表达。内源对照基因为GAPDH。将两个验证的shRNA用作阳性对照。阴性对照是某些未用gRNA转染的质粒,这些质粒被表示为“pXRP##对照”。当使用指定的靶向策略时,质粒pXRP28、pXRP29、pXRP48以及pXRP49可以阻遏β-连环蛋白基因。这些质粒对应于没有功能性结构域的dCas9(pXRP28和pXRP28)和融合到SID4x上的dCas9(pXRP48和pXRP49)。

  另外的工作研究:重复以上实验,靶向不同基因,利用其他gRNA确定最优靶向位置和多元阻遏。

  表1

  实例18:涉及胆固醇生物合成、脂肪酸生物合成以及其他代谢障碍的基因,编码涉及淀粉样蛋白以及其他疾病的错误折叠蛋白的基因,导致细胞转化的癌基因,潜伏病毒基因,以及导致负显性障碍(在其他障碍中)的基因的靶向缺失。

  申请人证明使用病毒或纳米粒子递送系统向对其有需要的受试者或患者的肝脏、脑、眼、上皮、造血或另一组织进行CRISPR-Cas系统的基因递送,该受试者或患者罹患代谢障碍、淀粉样变性和蛋白聚积相关疾病、由于基因突变和基因转位所致的细胞转化、基因突变的负显性作用、潜伏病毒感染以及其他相关症状。

  研究设计:患有代谢障碍、淀粉样变性和蛋白聚积相关疾病的对其有需要的受试者或患者,包括但不限于人类、非灵长类人类、犬、猫、牛、马、其他家养动物以及相关哺乳动物。CRISPR-Cas系统由嵌合的指导RNA指导并靶向有待切割的人类基因组座位的一个特定位点。切割和非同源末端连接介导的修复之后,移码突变导致基因的敲除。

  申请人选择靶向涉及上述障碍的基因的指导-RNA,使其以最小脱靶活性对内源座位特异。可以将两个或更多个指导RNA编码进单个CRISPR阵列中,以在DNA中诱导同时的双链断裂,从而导致受影响的基因或染色体区域的微小缺失。

  基因靶标的鉴定和设计

  对于每个候选疾病基因,申请人都选择了包括蛋白质编码外显子的感兴趣DNA序列、包括并侧翼于已知的负显性突变位点的序列、包括并侧翼于病理重复序列的序列。对于基因敲除途径,离起始密码子最近的早期编码外显子为实现完全敲除提供了最佳选择并使截短的蛋白质产物保留部分功能的可能性最小化。

  申请人分析了紧邻NGG基序(对于SpCas9系统)或NNAGAAW(对于St1Cas9系统)的5’的所有可能的可靶向的20-bp序列的感兴趣的序列。申请人选择了用于在基因组中识别独特的单个RNA-指导的Cas9的序列,以使基于计算算法的脱靶效应最小化,以确定特异性。

  将指导序列克隆进递送系统中

  将指导序列合成为双链的20-24bp寡核苷酸。对寡核苷酸进行5’-磷酸化处理和退火以形成双链体后,取决于递送方法,将寡核苷酸连接进适合的载体中:

  基于病毒的递送方法

  已经在别处描述了基于AAV的载体(PX260、330、334、335)

  基于慢病毒的载体使用类似的克隆策略,即将指导序列直接连接进单个载体中,该载体携带一个U6启动子驱动的嵌合的RNA支架和一种EF1a启动子驱动的Cas9或Cas9切口酶。

  在别处描述了病毒产生。

  基于纳米粒子的RNA递送方法

  1.将指导序列合成为编码T7启动子-指导序列-嵌合的RNA的寡核苷酸双链。通过PCR方法将一个T7启动子添加到Cas9的5’上。

  2.将T7驱动的Cas9和指导-嵌合的RNA在体外转录,并且使用商业试剂盒为Cas9mRNA进一步加帽和A-添尾(A-tailed)。根据试剂盒说明书纯化RNA产物。

  流体动力尾静脉递送方法(用于小鼠)

  如在上文和在本申请别处所描述的,将指导序列克隆进AAV质粒中。

  细胞系的体外验证

  转染

  1.DNA质粒转染

  使用基于脂质、化学或电穿孔的方法将携带指导序列的质粒转染进人类胚肾(HEK293T)或人类胚胎干(hES)细胞、其他相关细胞类型中。对于HEK293T细胞(~260,000个细胞)的24孔转染,使用Lipofectamine 2000将总共500ng的DNA转染进每个单孔中。对于hES细胞的12孔转染,使用Fugene HD将总共1ug的DNA转染进单孔中。

  2.RNA转染

  将如上所述的纯化RNA用于转染进HEK293T细胞中。根据制造商的说明,可以使用Lipofectamine 2000将1-2ug的RNA转染进~260,000个细胞中。Cas9和嵌合的RNA的RNA递送显示于图28中。

  体外indel形成的测定

  转染后72小时收获细胞并且测定作为双链断裂的指征的indel形成。

  简言之,使用高保真聚合酶PCR扩增靶序列周围的基因组区域(~400-600bp扩增子尺寸)。将产物纯化,归一化至相等浓度,并从95℃缓慢退火至4℃,以允许形成DNA异源双链体。退火后,使用Cel-I酶切割异源双链体,并且将生成的产物在聚丙烯酰胺凝胶上分离并计算indel效率。

  动物的体内原理论证

  递送机制

  在别处描述了AAV或慢病毒产生。

  纳米粒子配制品:将RNA混合进纳米粒子配制品中

  使用商业试剂盒在小鼠中执行DNA质粒的流体动力尾静脉注射。

  将Cas9和指导序列作为病毒、纳米粒子-包衣的RNA混合物或DNA质粒而递送,并注射进受试动物体内。一个平行组的对照动物注射无菌盐水、Cas9和GFP或指导序列以及单独的GFP。

  注射后三周,测试动物的症状的改善并将其处死。针对indel形分析相关器官系统。表型测定包括HDL、LDL、脂质的血液水平。

  indel形成的测定

  使用商业试剂盒从组织中提取DNA;将如针对体外证明所描述的进行indel测定。

  CRISPR-Cas系统的治疗应用可适合于实现候选疾病基因的组织特异的且暂时受控的靶向缺失。实例包括涉及胆固醇和脂肪酸代谢、淀粉样蛋白疾病、负显性疾病、潜伏病毒感染(在其他障碍中)的基因。

  用于在座位位处引入靶向的indel的单个指导-RNA的实例

  用于在基因座位位处引入染色体微小缺失的指导-RNA对的实例

  实例19:携带引起疾病的突变的基因的修复的靶向整合;酶缺陷以及其他相关疾病的重构。

  研究设计

  I.基因靶标的鉴定和设计

  ·描述于实例22中

  II.将指导序列和修复模板克隆进递送系统中

  ·以上描述于实例22中

  ·申请人将DNA修复模板克隆为包括具有疾病等位基因的同源臂以及一个野生型修复模板

  III.细胞系的体外验证

  a.以上转染描述于实例22中;将Cas9、指导RNA和修复模板共转染进相关细胞类型中。

  b.体外修复的测定

  i.申请人在转染后72小时收获细胞并测定修复

  ii.简言之,申请人使用高保真聚合酶PCR扩增了修复模板周围的基因组区域。针对突变体等位基因的减少的发生率,申请人对产物进行了测序。

  IV.动物的体内原理论证

  a.以上递送机制描述于实例22和34中。

  b.体内修复的测定

  i.如描述于体外证明中的,申请人进行了修复测定。

  V.治疗应用

  CRISPR-Cas系统可适合于实现候选疾病基因的组织特异的且暂时受控的靶向缺失。实例包括涉及胆固醇和脂肪酸代谢、淀粉样蛋白疾病、负显性疾病、潜伏病毒感染(在其他障碍中)的基因。

  修复模板的一个单个错义突变的实例:

  实例20:CRISPR-Cas系统在青光眼、淀粉样变性和亨廷顿病中的治疗应用

  青光眼:申请人设计了靶向mycilin(MYOC)基因的第一个外显子的指导RNA。申请人使用腺病毒载体(Ad5)包装Cas9以及靶向MYOC基因的指导RNA两者。申请人将腺病毒载体注射进小梁网中,其中的细胞已经牵涉于青光眼的病理生理学中。申请人最初在携带突变的MYOC基因的小鼠模型中对其进行了测试,以察看它们是否改善视敏度并降低眼压。人类中的治疗应用利用类似的策略。

  淀粉样变性:申请人设计了靶向肝脏中的运甲状腺素蛋白(TTR)基因的第一个外显子的指导RNA。申请人使用AAV8包装Cas9以及靶向TTR基因的第一个外显子的指导RNA。AAV8已经显示具有有效的肝脏靶向并且将被静脉内给予。可以使用肝脏特异的启动子(如白蛋白启动子)或使用组成型启动子驱动Cas9。pol3启动子驱动指导RNA。

  可替代地,申请人利用质粒DNA的流体动力递送来敲除TTR基因。申请人递送了一个编码Cas9的质粒和靶向TTR的外显子1的指导RNA。

  作为一种另外的替代途径,申请人给予了RNA的组合(Cas9的mRNA和指导RNA)。可以使用脂质体(如来自生命技术公司的Invivofectamine)包装RNA并静脉内递送。为了减少RNA诱导的免疫原性、增加Cas9表达的水平和指导RNA稳定性,申请人使用5’加帽修饰了Cas9mRNA。申请人还将修饰的RNA核苷酸掺入了Cas9mRNA和指导RNA中,以增加其稳定性并减少免疫原性(例如TLR的激活)。为了增加效率,申请人给予了多剂量的病毒、DNA或RNA。

  亨廷顿病:申请人基于患者的HTT基因中的等位基因特异的突变设计了指导RNA。例如,在对HTT而言杂合的、具有扩增的CAG重复的患者体内,申请人鉴定了对于突变HTT等位基因而言独特的核苷酸序列并将其用于设计指导RNA。申请人保证突变甲基位于指导RNA的最后9bp内(诸位申请人已经确定具有区别靶标尺寸与指导RNA之间的单个DNA碱基错配的能力)。

  申请人将突变HTT等位基因特异的指导RNA和Cas9包装进AAV9中并递送进亨廷顿病患者的纹状体中。经由开颅术将病毒立体定向地注射进纹状体中。已知AAV9有效地转导神经元。申请人使用神经元特异的启动子(如人类突触蛋白I)驱动Cas9。

  实例21:CRISPR-Cas系统在HIV中的治疗应用

  慢性病毒感染是显著的发病率和死亡率的来源。虽然针对这些病毒中的许多病毒存在有效靶向病毒复制的不同方面的常规的抗病毒疗法,但是由于“病毒潜伏期”当前治疗形式在本质上通常是非治愈性的。就其本质而言,病毒潜伏期由病毒生命周期中的未进行活性病毒产生的休眠期表征。在此阶段过程中,病毒在很大程度上能够逃避免疫监视和常规治疗两者,从而允许它在宿主体内建立长期存在的病毒储库,从这些病毒储库随后重新激活可以允许病毒继续繁殖和传播。病毒潜伏期的关键在于通过游离型或前病毒潜伏而完成的稳定地维持病毒基因组,该游离型或前病毒潜伏分别将病毒基因组存储在细胞质中或将它整合在宿主基因组中。在不存在预防初次感染的有效疫苗接种的情况下,由潜伏贮存器表征的慢性病毒感染和溶解活性的发作可以具有显著的后果:人乳头瘤病毒(HPV)可以导致宫颈癌,丙型肝炎病毒(HCV)容易诱发肝细胞癌,并且人类免疫缺陷病毒最终摧毁宿主免疫系统,从而使得对机会性感染易感。因此,这些感染需要终生使用当前可获得的抗病毒治疗。更复杂的事情是这些病毒基因组中的许多的较高的可突变性,这导致了对其而言不存在有效疗法的抗性菌株的进化。

  CRISPR-Cas系统是一种能够以可以多元的、序列特异的方式诱导双链DNA断裂(DSB)的细菌获得性免疫系统并且最近已经在哺乳动物细胞系统内重构。已经显示,用一个或众多指导-RNA靶向DNA可以分别导致间插序列的indel和缺失两者。因此,这一新的技术代表了一种手段,通过该手段可以在单个细胞中以较高效率和特异性完成靶向和多元DNA诱变。结果,递送直接针对病毒DNA序列的CRISPR-Cas系统甚至在不存在正在进行的病毒产生的情况下仍可以允许靶向破坏和缺失潜伏的病毒基因组。

  作为一个实例,被HIV-1慢性感染代表了一个全球性健康问题,其中影响的个人为3300万并且年发生率为260万次感染。使用同时靶向病毒复制的多个方面的高效抗逆转录病毒疗法(HAART)已经允许在很大程度上将HIV感染作为一种慢性而非晚期病疾进行管理。不进行治疗的话,HIV进展为AIDS通常在9-10年内发生,从而导致耗竭宿主免疫系统并且机会性感染的出现通常将在之后不久导致死亡。继发于病毒潜伏期,HAART的中断总是导致病毒反跳。此外,针对通过可获得的手段无法控制的HIV抗性菌株,甚至可以在疗法方面选择暂时中断。另外,HAART治疗的费用是显著的:在美国每年每人$10,000-15,0000。因此,直接靶向HIV基因组而非病毒复制过程的治疗途径代表了一种手段,通过该手段潜伏的贮存器的根除可以允许治愈性治疗选择。

  HIV-1靶向的CRISPR-Cas系统的研发和递送代表了一种可与现存的靶向DNA诱变的手段可区分的独特途径,即具有众多治疗意义的ZFN和TALEN。CRISPR介导的DSB对HIV-1基因组的靶向破坏和缺失以及与HAART结合的indel可以允许同时预防活性病毒产生以及宿主体内的潜伏的病毒储库的耗竭。

  一旦整合进宿主免疫系统内,CRISPR-Cas系统允许产生HIV-1抗性亚群体,该亚群体即使在不存在彻底的病毒根除的情况下仍可以允许维持和重构宿主免疫活性。这可以通过破坏病毒基因组而潜在地预防初次感染,从而预防病毒产生和整合,代表了一种“疫苗接种”手段。CRISPR-Cas系统的多元性质允许同时靶向单独细胞内的基因组的多个方面。

  如在HAART中,通过需要同时获取多个获得性突变而使病毒通过诱变而进行的逃避最小化。可以同时靶向HIV-1的多种菌株,这使重复感染的机会最小化并防止随后产生新的重组菌株。核苷酸而非蛋白质介导的CRISPR-Cas系统的序列特异性允许快速产生治疗而无需显著改变递送机制。

  为了将其完成,申请人产生了靶向绝大多数HIV-1基因组的CRISPR-Cas指导RNA,同时考虑了HIV-1株变体,以使覆盖面和效力最大。HIV-1亚型和变体之间的基因组保守的序列分析应该允许靶向基因组的侧翼保守区,目的是缺失间插病毒序列或诱导将破坏病毒基因功能的移码突变。

  通过宿主免疫系统的常规腺病毒或慢病毒介导的感染,申请人完成了CRISPR-Cas系统的递送。取决于途径,宿主免疫细胞可以是a)分离的、用CRISPR-Cas转导的、选择的、并且重新引入该宿主中的或b)通过全身递送CRISPR-Cas系统体内转导的。第一种途径允许产生抗性免疫群体,而第二种更可能靶向宿主体内的潜伏病毒储库。

  实例22:囊性纤维化中的δF508或其他突变的靶向校正

  本发明的一个方面提供了一种药物组合物,该药物组合物可以包括一种CRISPR-Cas基因疗法粒子和一种生物相容的药物载体。根据另一个方面,一种用于治疗在CFTR基因中具有突变的受试者的基因疗法方法包括向受试者的细胞给予治疗有效量的CRISPR-Cas基因疗法粒子。

  此实例展示了使用腺相关病毒(AAV)粒子的CRISPR-Cas系统在对其有需要的受试者或患者的气道中的基因转移或基因递送,所述受试者或患者患有囊性纤维化或囊性纤维化相关症状。

  研究设计:对其有需要的受试者或患者:相关的人类、非灵长类人类、犬、猫、牛、马以及其他家养动物。此研究测试了通过AAV载体对CRISPR-Cas系统进行基因转移的效力。申请人确定了足以进行基因表达的转基因水平并利用了一种包括靶向δF508或其他CFTR诱导的突变的Cas9酶的CRISPR-Cas系统。

  这些经治疗的受试者的每一侧肺接受支气管内递送的药学上有效量的雾化AAV载体系统,同时自然地呼吸。对照受试者接受等量的具有内部对照基因的假型AAV载体系统。该载体系统可以与一种药学上可接受的生物或相容的药物载体一起递送。给予载体三周或适当的时间间期后,测试经治疗的受试者的囊性纤维化相关症状的改善。

  申请人使用了一种腺病毒或一种AAV粒子。

  申请人将以下各自可操作地连接到一种或多种调节序列(对于Cas9而言是Cbh或EF1a启动子,对于嵌合的指导RNA是U6或H1启动子)上的基因构建体克隆进一种或多种腺病毒或AAV载体或任何其他相容的载体中:靶向嵌合的指导RNA的CFTRδ508(图31B),δF508突变的修复模板(图31C)以及具有任选地一个或多个核定位信号或序列(NLS)(例如,两个(2)NLS)的密码子优化的Cas9酶。

  Cas9靶位点的鉴定

  申请人分析了人类CFTR基因组座位并鉴定了Cas9靶位点(图31A)。(PAM可以包含一个NGG或一个NNAGAAW基序)。

  基因修复策略

  申请人经由先前讨论的递送方法之一将包括Cas9(或Cas9切口酶)和指导RNA的腺病毒/AAV载体系统连同包括包含F508残基的同源性修复模板的腺病毒/AAV载体系统一起引入受试者体内。CRISPR-Cas系统由CFTRδ508嵌合的指导RNA指导并靶向有待切口或切割的CFTR基因组座位的一个特定位点。在切割之后,将修复模板经由同源重组插入切割位点中,从而校正导致囊性纤维化或引起囊性纤维化相关症状的缺失。可以采用用来指导递送并提供CRISPR系统的系统性引入的此策略来靶向基因突变,以编辑或另外地操纵如那些在表B中的引起代谢、肝脏、肾和蛋白质疾病和障碍的基因。

  实例23:基因敲除细胞文库的产生

  此实例展示了如何产生其中的每个细胞都具有单基因被敲除的细胞文库:

  申请人制备了ES细胞的文库,其中每个细胞都具有单基因被敲除,并且ES细胞的整个文库将有每个单基因的敲除。此文库对于筛选细胞过程以及疾病的基因功能是有用的。

  为了制备此细胞文库,申请人将由诱导型启动子(例如,多西环素诱导型启动子)驱动的Cas9整合到ES细胞中。另外,申请人将靶向特异的基因的单个指导RNA整合到ES细胞中。为了制备ES细胞文库,申请人简单地将ES细胞与编码靶向人类基因组中的每个基因的指导RNA的基因的文库混合。申请人首先将单个BxB1attB位点引入人类ES细胞的AAVS1座位中。然后,申请人使用BxB1整合酶来促进各个的指导RNA基因整合到AAVS1座位中的BxB1attB位点中。为了促进整合,每个指导RNA基因都被包含在携带单个attP位点的质粒上。这样,BxB1将使基因组中的attB位点与含有指导RNA的质粒上的attP位点重组。

  为了产生该细胞文库,申请人采用具有整合的单个指导RNA的细胞的文库,并且诱导Cas9表达。在诱导之后,Cas9介导由该指导RNA指定的位点处的双链断裂。为了验证此细胞文库的多样性,申请人进行了全外显子组测序,以保证申请人能够在每个单靶向基因中观察到突变。此细胞文库可以用于多种应用(包括基于全文库的筛选),或可以被分选进各个细胞克隆中以促进快速产生具有各个人类基因被敲除的克隆细胞系。

  实例24:使用Cas9工程化微藻

  递送Cas9的方法

  方法1:申请人使用在组成型启动子(如Hsp70A-Rbc S2或β2-微管蛋白)的控制之下表达Cas9的载体递送Cas9和指导RNA。

  方法2:申请人使用在组成型启动子(如Hsp70A-Rbc S2或β2-微管蛋白)的控制之下表达Cas9和T7聚合酶的载体递送Cas9和T7聚合酶。将使用包含驱动指导RNA的T7启动子的载体递送该指导RNA。

  方法3:申请人将Cas9mRNA和体外转录的指导RNA递送到藻类细胞中。RNA可以在体外转录。Cas9mRNA将由Cas9的编码区以及来自的Cop1的3’UTR组成,以保证Cas9mRNA的稳定。

  用于同源重组,申请人提供了一个另外的同源定向修复模板。

  在β-2微管蛋白启动子的控制之下驱动Cas9的表达的盒的序列(之后为Cop1的3’UTR)。(SEQ ID NO:)

  TCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAGCCCCAAGAAGAAGAGAAAGGTGGAGGCCAGCTAAGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGAT GGTACT

  在β-2微管蛋白启动子的控制之下驱动T7聚合酶的表达的盒的序列(之后为Cop1的3’UTR):(SEQ ID NO:___)

  TCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACatgcctaagaagaagaggaaggttaacacgattaacatcgctaagaacgacttctctgacatcgaactggctgctatcccgttcaacactctggctgaccattacggtgagcgtttagctcgcgaacagttggcccttgagcatgagtcttacgagatgggtgaagcacgcttccgcaagatgtttgagcgtcaacttaaagctggtgaggttgcggataacgctgccgccaagcctctcatcactaccctactccctaagatgattgcacgcatcaacgactggtttgaggaagtgaaagctaagcgcggcaagcgcccgacagccttccagttcctgcaagaaatcaagccggaagccgtagcgtacatcaccattaagaccactctggcttgcctaaccagtgctgacaatacaaccgttcaggctgtagcaagcgcaatcggtcgggccattgaggacgaggctcgcttcggtcgtatccgtgaccttgaagctaagcacttcaagaaaaacgttgaggaacaactcaacaagcgcgtagggcacgtctacaagaaagcatttatgcaagttgtcgaggctgacatgctctctaagggtctactcggtggcgaggcgtggtcttcgtggcataaggaagactctattcatgtaggagtacgctgcatcgagatgctcattgagtcaaccggaatggttagcttacaccgccaaaatgctggcgtagtaggtcaagactctgagactatcgaactcgcacctgaatacgctgaggctatcgcaacccgtgcaggtgcgctggctggcatctctccgatgttccaaccttgcgtagttcctcctaagccgtggactggcattactggtggtggctattgggctaacggtcgtcgtcctctggcgctggtgcgtactcacagtaagaaagcactgatgcgctacgaagacgtttacatgcctgaggtgtacaaagcgattaacattgcgcaaaacaccgcatggaaaatcaacaagaaagtcctagcggtcgccaacgtaatcaccaagtggaagcattgtccggtcgaggacatccctgcgattgagcgtgaagaactcccgatgaaaccggaagacatcgacatgaatcctgaggctctcaccgcgtggaaacgtgctgccgctgctgtgtaccgcaaggacaaggctcgcaagtctcgccgtatcagccttgagttcatgcttgagcaagccaataagtttgctaaccataaggccatctggttcccttacaacatggactggcgcggtcgtgtttacgctgtgtcaatgttcaacccgcaaggtaacgatatgaccaaaggactgcttacgctggcgaaaggtaaaccaatcggtaaggaaggttactactggctgaaaatccacggtgcaaactgtgcgggtgtcgacaaggttccgttccctgagcgcatcaagttcattgaggaaaaccacgagaacatcatggcttgcgctaagtctccactggagaacacttggtgggctgagcaagattctccgttctgcttccttgcgttctgctttgagtacgctggggtacagcaccacggcctgagctataactgctcccttccgctggcgtttgacgggtcttgctctggcatccagcacttctccgcgatgctccgagatgaggtaggtggtcgcgcggttaacttgcttcctagtgaaaccgttcaggacatctacgggattgttgctaagaaagtcaacgagattctacaagcagacgcaatcaatgggaccgataacgaagtagttaccgtgaccgatgagaacactggtgaaatctctgagaaagtcaagctgggcactaaggcactggctggtcaatggctggcttacggtgttactcgcagtgtgactaagcgttcagtcatgacgctggcttacgggtccaaagagttcggcttccgtcaacaagtgctggaagataccattcagccagctattgattccggcaagggtctgatgttcactcagccgaatcaggctgctggatacatggctaagctgatttgggaatctgtgagcgtgacggtggtagctgcggttgaagcaatgaactggcttaagtctgctgctaagctgctggctgctgaggtcaaagataagaagactggagagattcttcgcaagcgttgcgctgtgcattgggtaactcctgatggtttccctgtgtggcaggaatacaagaagcctattcagacgcgcttgaacctgatgttcctcggtcagttccgcttacagcctaccattaacaccaacaaagatagcgagattgatgcacacaaacaggagtctggtatcgctcctaactttgtacacagccaagacggtagccaccttcgtaagactgtagtgtgggcacacgagaagtacggaatcgaatcttttgcactgattcacgactccttcggtacgattccggctgacgctgcgaacctgttcaaagcagtgcgcgaaactatggttgacacatatgagtcttgtgatgtactggctgatttctacgaccagttcgctgaccagttgcacgagtctcaattggacaaaatgccagcacttccggctaaaggtaacttgaacctccgtgacatcttagagtcggacttcgcgttcgcgtaaGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT

  由T7启动子驱动的指导RNA的序列(T7启动子,N表示靶向序列):(SEQ ID NO:)

  gaaatTAATACGACTCACTATANNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt

  基因递送:

  来自衣藻资源中心(Chlamydomonas Resource Center)的莱茵衣藻株CC-124和CC-125将被用于电穿孔。电穿孔方案遵循来自GeneArt Chlamydomonas Engineering试剂盒的标准推荐方案。

  而且,申请人产生组成性地表达Cas9的莱茵衣藻系。这可以通过使用pChlamy1(使用PvuI线性化)并选择潮霉素抗性菌落而完成。以下是包含Cas9的pChlamy1的序列。以此方式实现基因敲除,简单地需要递送指导RNA的RNA。对于同源重组,申请人递送了指导RNA以及线性化同源重组模板。

  pChlamy 1-Cas9:(sEQ ID NO:___)

  TGCGGTATTTCACACCGCATCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGTTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGTCGCTGAGGCTTGACATGATTGGTGCGTATGTTTGTATGAAGCTACAGGACTGATTTGGCGGGCTATGAGGGCGGGGGAAGCTCTGGAAGGGCCGCGATGGGGCGCGCGGCGTCCAGAAGGCGCCATACGGCCCGCTGGCGGCACCCATCCGGTATAAAAGCCCGCGACCCCGAACGGTGACCTCCACTTTCAGCGACAAACGAGCACTTATACATACGCGACTATTCTGCCGCTATACATAACCACTCAGCTAGCTTAAGATCCCATCAAGCTTGCATGCCGGGCGCGCCAGAAGGAGCGCAGCCAAACCAGGATGATGTTTGATGGGGTATTTGAGCACTTGCAACCCTTATCCGGAAGCCCCCTGGCCCACAAAGGCTAGGCGCCAATGCAAGCAGTTCGCATGCAGCCCCTGGAGCGGTGCCCTCCTGATAAACCGGCCAGGGGGCCTATGTTCTTTACTTTTTTACAAGAGAAGTCACTCAACATCTTAAAATGGCCAGGTGAGTCGACGAGCAAGCCCGGCGGATCAGGCAGCGTGCTTGCAGATTTGACTTGCAACGCCCGCATTGTGTCGACGAAGGCTTTTGGCTCCTCTGTCGCTGTCTCAAGCAGCATCTAACCCTGCGTCGCCGTTTCCATTTGCAGGAGATTCGAGGTACCATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAGCCCCAAGAAGAAGAGAAAGGTGGAGGCCAGCTAACATATGATTCGAATGTCTTTCTTGCGCTATGACACTTCCAGCAAAAGGTAGGGCGGGCTGCGAGACGGCTTCCCGGCGCTGCATGCAACACCGATGATGCTTCGACCCCCCGAAGCTCCTTCGGGGCTGCATGGGCGCTCCGATGCCGCTCCAGGGCGAGCGCTGTTTAAATAGCCAGGCCCCCGATTGCAAAGACATTATAGCGAGCTACCAAAGCCATATTCAAACACCTAGATCACTACCACTTCTACACAGGCCACTCGAGCTTGTGATCGCACTCCGCTAAGGGGGCGCCTCTTCCTCTTCGTTTCAGTCACAACCCGCAAACATGACACAAGAATCCCTGTTACTTCTCGACCGTATTGATTCGGATGATTCCTACGCGAGCCTGCGGAACGACCAGGAATTCTGGGAGGTGAGTCGACGAGCAAGCCCGGCGGATCAGGCAGCGTGCTTGCAGATTTGACTTGCAACGCCCGCATTGTGTCGACGAAGGCTTTTGGCTCCTCTGTCGCTGTCTCAAGCAGCATCTAACCCTGCGTCGCCGTTTCCATTTGCAGCCGCTGGCCCGCCGAGCCCTGGAGGAGCTCGGGCTGCCGGTGCCGCCGGTGCTGCGGGTGCCCGGCGAGAGCACCAACCCCGTACTGGTCGGCGAGCCCGGCCCGGTGATCAAGCTGTTCGGCGAGCACTGGTGCGGTCCGGAGAGCCTCGCGTCGGAGTCGGAGGCGTACGCGGTCCTGGCGGACGCCCCGGTGCCGGTGCCCCGCCTCCTCGGCCGCGGCGAGCTGCGGCCCGGCACCGGAGCCTGGCCGTGGCCCTACCTGGTGATGAGCCGGATGACCGGCACCACCTGGCGGTCCGCGATGGACGGCACGACCGACCGGAACGCGCTGCTCGCCCTGGCCCGCGAACTCGGCCGGGTGCTCGGCCGGCTGCACAGGGTGCCGCTGACCGGGAACACCGTGCTCACCCCCCATTCCGAGGTCTTCCCGGAACTGCTGCGGGAACGCCGCGCGGCGACCGTCGAGGACCACCGCGGGTGGGGCTACCTCTCGCCCCGGCTGCTGGACCGCCTGGAGGACTGGCTGCCGGACGTGGACACGCTGCTGGCCGGCCGCGAACCCCGGTTCGTCCACGGCGACCTGCACGGGACCAACATCTTCGTGGACCTGGCCGCGACCGAGGTCACCGGGATCGTCGACTTCACCGACGTCTATGCGGGAGACTCCCGCTACAGCCTGGTGCAACTGCATCTCAACGCCTTCCGGGGCGACCGCGAGATCCTGGCCGCGCTGCTCGACGGGGCGCAGTGGAAGCGGACCGAGGACTTCGCCCGCGAACTGCTCGCCTTCACCTTCCTGCACGACTTCGAGGTGTTCGAGGAGACCCCGCTGGATCTCTCCGGCTTCACCGATCCGGAGGAACTGGCGCAGTTCCTCTGGGGGCCGCCGGACACCGCCCCCGGCGCCTGATAAGGATCCGGCAAGACTGGCCCCGCTTGGCAACGCAACAGTGAGCCCCTCCCTAGTGTGTTTGGGGATGTGACTATGTATTCGTGTGTTGGCCAACGGGTCAACCCGAACAGATTGATACCCGCCTTGGCATTTCCTGTCAGAATGTAACGTCAGTTGATGGTACT

  对于所有修饰的莱茵衣藻细胞而言,申请人使用了PCR、SURVEYOR核酸酶测定和DNA测序,以验证成功的修饰。

  实例25:Cas9靶向多种疾病类型的用途

  涉及蛋白质编码序列中的突变的疾病:

  可以通过靶向负显性等位基因而靶向显性障碍。申请人使用Cas9靶向负显性等位基因中的独特序列并经由NHEJ引入突变。NHEJ诱导的indel可能能够在负显性等位基因中引入移码突变并消除负显性蛋白。如果该基因是充分单的(haplo-sufficient),这可以起作用(例如MYOC突变诱导的青光眼和亨廷顿病)。

  可以通过修复两个等位基因中的疾病突变而靶向隐性障碍。对于分裂细胞,申请人使用Cas9在突变位点附近引入双链断裂并使用外源重组模板增加同源重组率。对于分裂细胞,这可以经由携带互补突出端的外源DNA片段的NHEJ介导的连接使用催化两个等位基因中的突变序列的替换的多元切口酶活性而实现。

  申请人还使用Cas9引入保护性突变(例如,用于预防HIV感染的CCR5的失活、用于减少胆固醇或将A673T引入APP中以减少阿尔茨海默病的可能性的PCSK9的失活)。

  涉及非编码序列的疾病

  申请人使用Cas9破坏启动子区域中的非编码序列,以改变转录因子结合位点并改变增强子或阻遏物元件。例如,可以使用Cas9切除造血干细胞中的Klf1增强子EHS1,以减少BCL11a水平并重新激活分化的红细胞中的胎珠蛋白基因表达。

  申请人还使用Cas9破坏5’或3’非翻译区中的功能性基序。例如,用于强直性肌营养不良的治疗,可以使用Cas9除去DMPK基因中的CTG重复扩展。

  实例26:多元切口酶

  也可以使用在本申请中详细说明的Cas9的优化和教导的方面产生Cas9切口酶。申请人使用与指导RNA对组合的Cas9切口酶,以产生具有限定的突出端的DNA双链断裂。当使用两对指导RNA时,可能的是切除间插DNA片段。如果外源DNA段被这两对指导RNA切割以产生可与基因组DNA相容的突出端,则可以将该外源DNA片段连接进该基因组DNA中,以替换被切除的片段。例如,可以将其用于除去亨廷顿蛋白(huntintin)(HTT)基因中的三核苷酸重复扩展,以治疗亨廷顿病。

  通过提供了带有较少数目的CAG重复的外源DNA,则可能能够产生带有相同突出端的DNA片段并可以被连接进HTT基因组座位中并替换被切除的片段。

  (SEQ ID NO:___至____)

  将外源DNA片段连接进基因组中无需同源重组机器并且因此可以在有丝分裂后细胞(如神经元)中使用此方法。

  实例27:CRISPR系统的递送

  可以将Cas9及其嵌合的指导RNA或tracrRNA和crRNA的组合作为DNA或RNA而递送。递送均作为RNA(正常的或包含碱基或骨架修饰)分子的Cas9和指导RNA可以用来减少Cas9蛋白在细胞中坚持的时间量。这可以减少靶细胞中的脱靶切割活性的水平。由于递送作为mRNA的Cas9花费时间翻译成蛋白质,所以可能有利的是在递送Cas9mRNA后若干小时递送指导RNA,以使可供与Cas9蛋白相互作用的指导RNA的水平最大化。

  在指导RNA量有限的情况下,可以令人希望的是引入作为mRNA的Cas9和呈DNA表达盒形式的指导RNA,用驱动指导RNA的表达的启动子。以此方式,可获得的指导RNA的量将经由转录而放大。

  可以引入多种递送系统,以向宿主细胞中引入Cas9(DNA或RNA)和指导RNA(DNA或RNA)。这些递送系统包括使用脂质体、病毒载体、电穿孔、纳米粒子、纳米线(沙莱克(Shalek)等人,《纳米快报》(Nano Letters),2012)、外来体。可以使用分子特洛伊木马脂质体(巴德里智(Pardridge)等人,《冷泉港草案》(Cold Spring Harb Protoc);2010;doi:10.1101/pdb.prot5407)地递送Cas9和指导RNA跨过血脑屏障。

  实例28:三核苷酸重复障碍的治疗策略

  如先前在应用中所提及的,CRISPR复合物的靶多核苷酸可以包括多个疾病相关基因和多核苷酸并且这些疾病相关基因中的一些可以属于一套称为三核苷酸重复障碍的遗传障碍(还称为三核苷酸重复扩展障碍、三联体重复扩展障碍或密码子反复障碍)。

  这些疾病由以下突变引起,在这些突变中,某些基因的三核苷酸重复超过了通常在基因中可以变化的正常的稳定的阈值。更多的重复扩展障碍的发现已经允许基于基础的相似特征将这些障碍分类为多个类别。由特定基因的蛋白质编码部分中的CAG重复扩展引起的亨廷顿病(HD)和脊髓小脑共济失调被包括在类别I中。具有倾向于使得它们表型相异的扩展并包括在量值上通常较小并且还发现于基因的外显子中的扩展的疾病或障碍被包括在类别II中。类别III包括由比类别I或II大得多的并且通常位于蛋白质编码区外的重复扩展表征的障碍或疾病。类别III疾病或障碍的实例包括但不限于脆性X综合征、强直性肌营养不良、两种脊髓小脑共济失调、青少年肌阵挛性癫痫以及弗里德赖希共济失调。

  还可以采用类似的治疗策略(像下文针对弗里德赖希共济失调提及的策略)解决其他三核苷酸重复或扩展障碍。例如,可以使用几乎相同的策略治疗的另一种三联体重复疾病是强直性肌营养不良1(DM1),其中在3'UTR中存在扩展的CTG基序。在弗里德赖希共济失调中,该疾病由线粒体型共济失调蛋白(FXN)的第一个内含子中的GAA三核苷酸的扩展引起。一种使用CRISPR的治疗策略是从第一个内含子上切除GAA重复。认为扩展的GAA重复影响DNA结构并且导致募集关闭线粒体型共济失调蛋白(frataxin)基因的异染色质的形成(图32A)。

  下文列出了优于其他治疗策略的竞争优势:

  siRNA敲低在此情况下是不适用的,因为疾病归因于线粒体型共济失调蛋白的减少的表达。病毒基因疗法当前处于探索之中。使用HSV-1基的载体在动物模型中递送线粒体型共济失调蛋白基因并且已经显示出治疗效果。然而,基于病毒的线粒体型共济失调蛋白递送的长期效力受若干问题的困扰:首先,难于将线粒体型共济失调蛋白的表达调节为与健康个体中的天然水平相匹配,并且其次,线粒体型共济失调蛋白长期过量表达导致细胞死亡。

  可以使用核酸酶切除GAA重复,以恢复健康基因型,但是锌指核酸酶和TALEN策略需要递送两对高效核酸酶,这对于递送以及核酸酶工程化两者而言都是困难的(通过ZFN或TALEN有效切除基因组DNA难于实现)。

  与以上策略相比之下,CRISPR-Cas系统具有清晰的优势。Cas9酶更有效并且更具多元性,这意味着可以同时设置一个或多个靶标。到目前为止,在人类细胞中Cas9对基因组DNA的有效切除>30%并且可以高达30%,并且在未来可以得到改进。此外,相对于某些三核苷酸重复障碍(像亨廷顿病(HD)),如果在两个等位基因之间存在差异,则可以解决编码区中的三核苷酸重复。确切地,如果HD患者对于突变的HTT而言是杂合的并且在野生型与突变的HTT等位基因之间存在核苷酸差异(如SNP),则可以使用Cas9特异性靶向突变的HTT等位基因。ZFN或TALEN将不具有基于单碱基差异而区分两个等位基因的能力。

  在采用使用CRISPR-Cas 9酶解决弗里德赖希共济失调的策略中,申请人设计了若干侧翼于GAA扩展的指导RNA靶向位点并且选择了最有效且特异的位点(图32B)。

  申请人递送了靶向FXN的内含子1的指导RNA连同Cas9的组合,以介导GAA扩展区域的切除。可以使用AAV9介导将Cas9有效递送进脊髓中。

  如果将邻近GAA扩展的Alu元件认为是重要的,则对可以被靶向的位点的数目可以存在约束,但是申请人可以采用避免将其破坏的策略。

  替代性策略:

  并非使用Cas9修饰基因组,申请人还可以使用基于Cas9(核酸酶活性缺陷的)的DNA结合结构域直接激活FXN基因,以将转录激活结构域靶向FXN基因。

  实例29:用于使用Cas9切口酶使脱靶切割最小化的策略

  如先前在本申请中所提及的,可以经由一个或多个以下突变将Cas9突变,以介导单链切割:D10A、E762A和H840A。

  为了经由NHEJ介导基因基因敲除,申请人使用了Cas9的切口酶版本连同两个指导RNA。由每个单独的指导RNA产生的脱靶切口可以无需突变而首先被修复,仅当靶位点彼此相邻时才发生双链断裂(这可以经由NHEJ而导致突变)。由于通过双切口引入的双链断裂不是钝的,末端加工酶(如TREX1)的共表达将增加NHEJ活性的水平。

  处于表格形式的以下靶标列表是针对涉及以下疾病的基因:

  拉福拉病-靶标GSY1或PPP1R3C(PTG)以减少神经元中的糖原。

  高胆固醇血症-靶标PCSK9

  在间隔子(0至3bp)中具有不同数目的核苷酸的靶序列成对列出(L和R)。每个间隔子都还可以独自地与野生型Cas9一起使用,以在靶座位处引入双链断裂。

  用于改善指导RNA的稳定性并增加特异性的替代性策略

  1.可以经由硫酯键而非磷酸酯键(像在天然RNA中)连接指导RNA的5’中的核苷酸。硫酯键可以防止指导RNA被内源RNA降解机械熟化。

  2.指导RNA的指导序列(5’20bp)中的核苷酸可以使用桥接的核酸(BNA)作为碱基,以改进结合特异性。

  实例30:用于快速、多元基因组编辑的CRISPR-Cas

  本发明的方面涉及以下方案和方法,通过这些方案和方法,可以在靶标设计后3-4天内测试基因修饰的效率和特异性,并且可以在2-3周内得到修饰的克隆细胞系。

  可编程的核酸酶是用于以高精度介导基因组改变的强大技术。可以使用来自微生物CRISPR获得性免疫系统的RNA-指导的Cas9核酸酶通过简单地在其指导RNA中指定一个20-nt靶向序列而在真核细胞中促进有效的基因组编辑。申请人描述了一套用于应用Cas9以在哺乳动物细胞中促进有效的基因组编辑并产生用于下游功能研究的细胞系的方案。以靶标设计开始,可以在3-4天内实现有效且特异的基因修饰,并且可以在2-3内得到修饰的克隆细胞系。

  工程化生物系统和生物的能力跨基础科学、医药和生物技术拥有巨大的应用潜力。促进内源基因组座位的精确编辑的可编程的序列特异的内切核酸酶现在允许在广泛的物种中系统地询问遗传元件和致病性遗传变异,包括先前用基因方法不易处理的那些。近年来已经出现了多种基因组编辑技术,包括锌指核酸酶(ZFN)、转录激活因子样效应核酸酶(TALEN)和RNA-指导的CRISPR-Cas核酸酶系统。前两种技术使用将内切核酸酶催化结构域束缚为模块化DNA-结合蛋白用于在特定基因组座位处诱导靶向的DNA双链断裂(DSB)的共同策略。相比之下,Cas9是一种通过与靶DNA进行沃森-克里克碱基配对而由小RNA指导的核酸酶,呈现了一种易于设计、有效且很好地适于多种细胞类型和生物的高通量和多元基因编辑的系统。在此,申请人描述了一套用于应用最近研发的Cas9核酸酶在哺乳动物细胞中促进有效的基因组编辑并产生用于下游功能研究的细胞系的方案。

  像ZFN和TALEN一样,Cas9通过刺激靶基因组座位处的DSB而促进基因组编辑。当被Cas9切割后,靶座位经历两种主要途径之一进行DNA损伤修复,即易错非同源末端连接(NHEJ)或高保真同源定向修复(HDR)途径。两种途径都可以用于实现希望的编辑结果。

  NHEJ:在不存在修复模板的情况下,NHEJ过程重新连接DSB,这可以留下一个处于indel突变形式的瘢痕。可以利用此过程实现基因敲除,因为发生在编码外显子内的indel可以导致移码突变并形成提前终止密码子。还可以采用多个DSB在基因组中介导较大的缺失。

  HDR:同源定向修复是NHEJ的一种主要的替换性DNA修复途径。尽管HDR典型地以低于NHEJ的频率发生,但是可以利用它在存在外源引入的修复模板的情况下在靶座位处产生精确的限定的修饰。该修复模板可以处于类似于具有侧翼于插入序列的同源臂的常规DNA靶向构建体而设计的双链DNA的形式,或单链DNA寡核苷酸(ssODN)的形式。后者提供了一种用于在基因组中进行小编辑的有效且简单的方法,如引入用于探测致病性遗传变异的单核苷酸突变。不同于NHEJ,HDR通常仅在分裂细胞中有活性并且其效率取决于细胞类型和状态而变化。

  CRISPR概述:相比之下,CRISPR-Cas系统最低是一个由Cas9核酸酶和短指导RNA组成的双组分系统。将Cas9重新靶向不同座位或同时编辑多个基因简单地需要克隆一个不同的20-bp寡核苷酸。尽管Cas9核酸酶的特异性尚未彻底阐明,CRISPR-Cas系统的简单的沃森-克里克碱基配对似乎比ZFN或TALEN结构域的碱基配对更可预测。

  II型CRISPR-Cas(规律间隔成簇短回文重复)是一种使用Cas9切割外源遗传元件的细菌获得性免疫系统。Cas9由一对非编码RNA指导,即一个可变的crRNA和一个必需的辅助tracrRNA。包含一个20-nt指导序列的crRNA经由沃森-克里克碱基配对通过定位靶DNA而确定特异性。在天然细菌系统中,共转录多种crRNA,以指向针对不同靶标的Cas9。在来源于化脓链球菌的CRISPR-Cas系统中,靶DNA必须紧接在一个5’-NGG/NRG原型间隔子邻近基序(PAM)之前,该基序可以针对其他CRISPR系统而变化。

  CRISPR-Cas通过异源表达人类密码子优化的Cas9和必需的RNA组分而在哺乳动物细胞中重构。此外,可以将crRNA和tracrRNA融合以产生嵌合的合成的指导RNA(sgRNA)。Cas9因此可以通过改变sgRNA内的20-nt指导序列而重新指向任何感兴趣的靶标。

  鉴于其易于实施和多种能力,Cas9已经被用于经由NHEJ和HDR两者而产生携带特异的突变的工程化真核细胞。另外,直接将sgRNA和编码Cas9的mRNA注射进胚胎中已经使得可以快速产生具有多个修饰的等位基因的转基因小鼠;这些结果拥有编辑以另外的方式可用基因方法易处理的生物的前景。

  在其催化结构域之一中携带破坏的突变的Cas9已经被工程化为切口而非切割DNA,从而允许单链断裂和优先通过HDR进行修复,从而潜在地减少来自脱靶DSB的不想要的indel。另外,具有两个突变的DNA切割催化残基的Cas9突变体已经被适配成使得可以在大肠杆菌中进行转录调节,从而展示了功能化Cas9用于相异应用的潜力。本发明的某些方面涉及用于多元编辑人类细胞的Cas9的构建和应用。

  申请人已经提供了人类密码子优化的核定位序列侧翼的Cas9,以促进真核基因编辑。申请人描述了设计20-nt指导序列的考虑因素、用于快速构建sgRNA并对其进行功能验证的方案,并且最后使用Cas9核酸酶在人类胚肾(HEK-293FT)和人类干细胞(HUES9)系中介导基于NHEJ和HDR的两种基因组修饰。此方案可以被同样地应用于其他细胞类型和生物。

  sgRNA的靶标选择:在用于基因靶向的20-nt指导序列的选择中存在两个主要考虑因素:1)靶序列应该在化脓链球菌Cas9的5’-NGG PAM之前,和2)指导序列应该被选择为使脱靶活性最小化。申请人提供了一种采用感兴趣的输入序列并鉴定适合的靶位点的在线Cas9靶向设计工具。为了用实验方法评估每个sgRNA的脱靶修饰,申请人还为每个预期靶标提供了计算预测的脱靶位点,这些位点是根据申请人对碱基配对错配的身份、位置和分布的作用的定量特异性分析排列的。

  关于计算预测的脱靶位点的详细信息如下:

  脱靶切割活性的考虑因素:类似于其他核酸酶,Cas9可以按减少的频率切割基因组中的脱靶DNA靶标。给定的指导序列展现出脱靶活性的程度取决于以下因素的组合,包括酶浓度、利用的特定指导序列的热力学以及类似序列在靶基因组中的丰度。对于Cas9的常规应用,重要的是考虑使脱靶切割水平最小化并且还能够检测脱靶切割的存在的方式。

  最小化脱靶活性:对于在细胞系中应用,申请人推荐了以下两个步骤来减少脱靶基因组修饰的水平。首先,使用我们的在线CRISPR靶标选择工具可以计算评估给定的指导序列具有脱靶位点的可能性。通过在基因组中彻底检索作为与指导序列类似的序列的脱靶序列而进行这些分析。sgRNA与其靶DNA之间的错配碱基的作用的综合性实验研究揭示到错配耐受是1)位置依赖性的-指导序列的3’末端的8-14bp比5’碱基更不耐受错配,2)数量依赖性的-通常超过3个错配是不被容忍的,3)指导序列依赖性的-一些指导序列比其他指导序列更不耐受错配,以及4)浓度依赖性的-脱靶切割对转染DNA的量高度敏感。申请人的靶位点分析网络工具(在网站enome-engineering.org/tools可获得)整合了这些标准,以为靶基因组中的可能的脱靶位点提供预测。其次,申请人推荐滴定Cas9和sgRNA表达质粒的量,以使脱靶活性最小化。

  脱靶活性的检测:使用申请人的CRISPR靶向网络工具可以产生最可能的脱靶位点以及进行那些位点的SURVEYOR或测序分析的引物的列表。对于使用Cas9产生的同基因克隆,申请人强烈推荐对这些候选脱靶位点进行测序,以检查任何不希望的突变。值得注意的是可能在未被包括在预测候选物列表中的位点中存在脱靶修饰并且应该进行全基因组测序以完全验证不存在脱靶位点。此外,在于同一基因组内诱导若干DSB的多元测定中,可能存在较低的转位事件率并且可以使用多种技术(如深度测序)对其进行评价。

  在线工具为1)制备sgRNA构建体、2)测定靶标修饰效率和3)评估潜在的脱靶位点处的切割所需的所有寡核苷酸和引物提供了序列。值得注意的是因为用于表达sgRNA的U6RNA聚合酶III启动子偏好鸟嘌呤(G)核苷酸作为其转录物的第一个碱基,所以在20-nt指导序列未以G开始的情况下,在sgRNA的5’附加一个额外的G。

  sgRNA构建和递送途径:取决于希望的应用,可以将sgRNA作为1)包含表达盒的PCR扩增子或2)sgRNA表达质粒而递送。基于PCR的sgRNA递送将默认sgRNA序列附加到用于扩增U6启动子模板的反向PCR引物上。可以将生成的扩增子与包含Cas9的质粒(PX165)共转染。此方法最适于快速筛选多个候选sgRNA,因为可以在获得sgRNA-编码引物后仅仅几个小时进行用于功能测试的细胞转染。因为此简单方法省却了基于质粒的克隆和序列验证的需要,所以它特别适于测试或共转染大量用于产生较大的敲除文库或其他规模敏感的应用的sgRNA。注意的是,与基于质粒的sgRNA递送所需的~20-bp寡核苷酸相比,sgRNA-编码引物超过100-bp。

  sgRNA的表达质粒的构建也是简单且快速的,涉及使用一对部分互补的寡核苷的单个克隆步骤。在将寡核苷酸对退火后,可以将生成的指导序列插入带有Cas9和具有sgRNA序列的剩余部分的不变支架两者的质粒(PX330)中。还可以将转染质粒修饰为使得可以产生用于体内递送的病毒。

  除基于PCR和质粒的递送方法之外,还可以将Cas9和sgRNA两者作为RNA而引入进细胞中。

  修复模板的设计:传统地,靶向的DNA修饰具有包含侧翼于改变位点的同源臂的基于质粒的供体修复模板的所需用途。每侧的同源臂的长度可以变化,但是典型地长于500bp。可以使用此方法产生较大的修饰,包括插入报告基因(如荧光蛋白或抗生素抗性标记)。靶向质粒的设计和构建已经在别处进行了描述。

  最近,已经使用单链DNA寡核苷酸(ssODN)代替靶向质粒,用于在限定的座位内进行短修饰而无需克隆。为了实现较高的HDR效率,ssODN在每侧包含至少40bp的与靶区域同源的侧翼序列,并且可以相对于靶座位以有义或反义方向定向。

  功能测试

  SURVEYOR核酸酶测定:申请人通过SURVEYOR核酸酶测定或PCR扩增子测序检测了indel突变。申请人的在线CRISPR靶标设计工具为两个途径提供了推荐的引物。然而,也可以手动地设计SURVEYOR或测序引物,以从基因组DNA扩增感兴趣的区域并使用NCBI引物-BLAST避免非特异的扩增子。SURVEYOR引物应该被设计为在Cas9靶标的任一侧扩增300-400bp(对于总共600-800bp的扩增子而言),以允许通过凝胶电泳而清晰地可视化切割条带。为了防止形成过量的引物二聚体,SURVEYOR引物应该被设计为典型地长度为25-nt之下并且解链温度为~60℃。申请人推荐在SURVEYOR核酸酶消化过程期间针对特异的PCR扩增子以及不存在非特异的切割的情况测试每对候选引物。

  质粒-或ssODN-介导的HDR:可以经由修饰的区域的PCR-扩增和测序检测HDR。为此目的,PCR引物应该在由同源臂跨越的区域外退火,以避免错误地检测到残余的修复模板(HDR Fwd(正向)和Rev(反向),图30)。对于ssODN介导的HDR,可以使用SURVEYOR PCR引物。

  通过测序检测indel或HDR:申请人通过桑格或下一代深度测序(NGS)检测了靶向的基因组修饰。对于前者,可以使用SURVEYOR或HDR引物扩增来自修饰的区域的基因组DNA。应该将扩增子亚克隆进供转化的质粒(如pUC19)中;可以对单独的菌落测序,以揭示克隆基因型。

  申请人为较短的扩增子设计了下一代测序(NGS)引物,这些扩增子典型地在100-200bp尺寸范围内。对于检测NHEJ突变,重要的是设计在引发区和Cas9靶位点之间具有至少10-20bp的引物,以允许检测较长的indel。申请人为两步PCR方法提供了指南,以为多元深度测序附加条形码适配子。归因于Illumina平台的通常较低水平的假阳性indel,申请人推荐了该平台。然后可以通过读取比对程序(如ClustalW、Geneious或简单的序列分析脚本)进行脱靶分析(先前所述)。

  材料与试剂

  sgRNA制备:

  超纯的无DNA酶RNA酶蒸馏水(生命技术公司,目录号10977-023)

  Herculase II融合聚合酶(安捷伦技术公司,目录号600679)

  关键。标准Taq聚合酶,缺少3’-5’外切核酸酶校正活性,具有较低的保真性并且可以导致扩增错误。Herculase II是一种以最小优化而产生高产率的PCR产物的高保真聚合酶(保真性与Pfu相当)。可以替代其他高保真聚合酶。

  Herculase II反应缓冲液(5x;安捷伦技术公司,包括聚合酶)

  dNTP混合溶液(各自25mM;Enzymatics公司,目录号N205L)

  MgCl2(25mM;赛默飞世尔科技公司,目录号R0971)

  QIAquick凝胶提取试剂盒(凯杰公司,目录号28704)

  QIAprep spin miniprep试剂盒(凯杰公司,目录号27106)

  UltraPure TBE缓冲液(10X;生命技术公司,目录号15581-028)

  SeaKem LE琼脂糖(龙沙公司,目录号50004)

  SYBR Safe DNA染色剂(10,000x;生命技术公司,目录号S33102)

  1-kb Plus DNA梯(生命技术公司,目录号10787-018)

  TrackIt CyanOrange上样缓冲液(生命技术公司,目录号10482-028)

  快速消化BbsI(FastDigest BpiI)(费尔芒斯/赛默飞世尔科技公司,目录号FD1014)

  Fermentas Tango缓冲液(费尔芒斯/赛默飞世尔科技公司,目录号BY5)

  DL-二硫苏糖醇(DTT;费尔芒斯/赛默飞世尔科技公司,目录号R0862)

  T7DNA连接酶(Enzymatic公司,目录号L602L)

  关键的:不替代更常用的T4连接酶。T7连接酶在粘性末端具有比平头末端高1,000倍的活性并且具有比可商购的浓缩T4连接酶高的整体活性。

  T7 2X Rapid Ligation缓冲液(包括T7DNA连接酶,Enzymatics公司,目录号L602L)

  T4多核苷酸激酶(新英格兰生物实验室,目录号M0201S)

  T4DNA连接酶反应缓冲液(10X;新英格兰生物实验室,目录号B0202S)

  腺苷5’-三磷酸(10mM;新英格兰生物实验室,目录号P0756S)

  PlasmidSafe ATP-依赖性DNA酶(Epicentre,目录号E3101K)

  One Shot Stbl3化学感受态大肠杆菌(E.coli)(生命技术公司,目录号C7373-03)

  SOC培养基(新英格兰生物实验室,目录号B9020S)

  LB培养基(西格玛公司,目录号L3022)

  LB琼脂培养基(西格玛公司,目录号L2897)

  氨苄西林,无菌过滤的(100mg ml-1;西格玛公司,目录号A5354)

  哺乳动物细胞培养:

  HEK293FT细胞(生命技术公司,目录号R700-07)

  杜尔贝科最低伊格尔培养基(Dulbecco's minimum Eagle’s medium)(DMEM,1X,高葡萄糖;生命技术公司,目录号10313-039)

  杜尔贝科最低伊格尔培养基(DMEM,1X,高葡萄糖,无酚红;生命技术公司,目录号31053-028)

  杜尔贝科磷酸盐缓冲盐水(DPBS,1X;生命技术公司,目录号14190-250)

  胎牛血清,合格的且热灭活的(生命技术公司,目录号10438-034)

  Opti-MEM I减血清培养基(FBS;生命技术公司,目录号11058-021)

  青霉素-链霉素(100x;生命技术公司,目录号15140-163)

  TrypLETMExpress(1X,无酚红;生命技术公司,目录号12604-013)

  Lipofectamine 2000转染试剂(生命技术公司,目录号11668027)

  Amaxa SF Cell LineX Kit S(32RCT;龙沙公司,目录号V4XC-2032)

  HUES 9细胞系(哈佛干细胞科学(HARVARD STEM CELL SCIENCE))

  Geltrex无LDEV的减少的生长因子基膜基质(生命技术公司,目录号A1413201)

  mTeSR1培养基(干细胞技术公司(Stemcell Technologies),目录号05850)

  Accutase细胞脱离溶液(干细胞技术公司,目录号07920)

  ROCK抑制剂(Y-27632;密理博公司(Millipore),目录号SCM075)

  Amaxa P3Primary CellX Kit S(32RCT;龙沙公司,目录号V4XP-3032)

  基因分型分析:

  QuickExtract DNA提取溶液(Epicentre,目录号QE09050)

  检验员、RFLP分析或测序的PCR引物(参见引物表)

  Herculase II融合聚合酶(安捷伦技术公司,目录号600679)

  关键。因为Surveyor测定对单碱基错配敏感,所以特别重要的是使用高保真聚合酶。可以替代其他高保真聚合酶。

  Herculase II反应缓冲液(5x;安捷伦技术公司,包括聚合酶)

  dNTP混合溶液(各自25mM;Enzymatics公司,目录号N205L)

  QIAquick凝胶提取试剂盒(凯杰公司,目录号28704)

  Taq缓冲液(10x;金斯瑞公司(Genscript),目录号B0005)

  用于标准凝胶电泳的SURVEYOR突变检测试剂盒(转基因组学公司,目录号706025)

  UltraPure TBE缓冲液(10x;生命技术公司,目录号15581-028)

  SeaKem LE琼脂糖(龙沙公司,目录号50004)

  4%-20%TBE Gels 1.0mm,15孔(生命技术公司,目录号EC62255BOX)

  Hi-Density TBE样品缓冲液(5X;生命技术公司,目录号LC6678)

  SYBR Gold核酸凝胶染色剂(10,000X;生命技术公司,目录号S-11494)

  1-kb Plus DNA梯(生命技术公司,目录号10787-018)

  TrackIt CyanOrange上样缓冲液(生命技术公司,目录号10482-028)

  快速消化HindIII(FastDigest HindIII)(费尔芒斯/赛默飞世尔科技公司,目录号FD0504)

  设备

  过滤的无菌移液管(康宁公司)

  标准1.5ml微量离心管(艾本德公司(Eppendorf),目录号0030125.150)

  Axygen 96孔PCR平板(VWR,目录号PCR-96M2-HSC)

  Axygen 8-Strip PCR管(飞世尔科技公司(Fischer Scientific),目录号14-222-250)

  Falcon管,聚丙烯,15ml(BD福尔肯公司,目录号352097)

  Falcon管,聚丙烯,50ml(BD福尔肯公司,目录号352070)

  带有细胞滤网帽的圆底管(BD福尔肯公司,目录号352235)

  皮氏培养皿(60mm×15mm;BD生物科学公司(BD Biosciences),目录号351007)

  组织培养平板(24孔;BD福尔肯公司,目录号353047)

  组织培养平板(96孔,平底;BD福尔肯公司,目录号353075)

  组织培养皿(100mm;BD福尔肯公司,353003)

  带有可编程的温度步进功能的96孔热循环仪(应用生物系统公司Veriti(Applied Biosystems Veriti),目录号4375786)。

  台式微量离心机5424,5804(艾本德公司)

  凝胶电泳系统(PowerPac基础电源,伯乐公司,目录号164-5050,和Sub-Cell GT系统凝胶托盘,伯乐公司,目录号170-4401)

  Novex XCell SureLock Mini-Cell(生命技术公司,目录号EI0001)

  数字凝胶成像系统(GelDoc EZ,伯乐公司,目录号170-8270,和蓝色样品托盘,伯乐公司,目录号170-8273)

  蓝光透射仪和橙色过滤器护目镜(SafeImager 2.0;英杰公司,目录号G6600)

  凝胶定量软件(伯乐公司,ImageLab,包括GelDoc EZ,或可在网站rsbweb.nih.gov/ij/获得的来自国立卫生研究院的开放源ImageJ)UV分光光度计(NanoDrop 2000c,赛默飞世尔科技公司)

  试剂准备

  三硼酸EDTA(TBE)电泳溶液:将TBE缓冲液稀释于蒸馏水中成1X工作溶液,用于铸造琼脂糖凝胶并用作供凝胶电泳用的缓冲液。可以将缓冲液存储在室温(18℃-22℃)下持续至少1年。

  ·ATP,10mM将10mM ATP分为50-μl等分部分并存储在-20℃下,持续长达1年;避免重复的冻融循环。

  ·DTT,10mM在蒸馏水中制备10mM DTT溶液并以20-μl等分部分存储在-70℃下,持续长达2年;用于每个反应,使用一个新的等分部分,因为DTT容易被氧化。

  ·D10培养基用于培养HEK293FT细胞,通过给DMEM补充1X GlutaMAX和10%(vol/vol)胎牛血清而制备D10培养基。如在该方案中所指示,此培养基还可以补充有1X青霉素-链霉素。可以提前制备D10培养基并存储在4℃下,持续长达1个月。

  ·mTeSR1培养基用于培养人类胚胎干细胞,通过补充5X添加物(包括mTeSR1基础培养基)和100ug/ml Normocin而制备mTeSR1培养基。

  程序

  靶向组分的设计以及在线工具的使用·定时1d

  输入靶基因组DNA序列。申请人提供了一种在线Cas9靶向设计工具,该工具采用感兴趣的输入序列,鉴定并排列适合的靶位点,并计算预测每个预期靶标的脱靶位点。可替代地,可以通过鉴定正好位于任何5’-NGG的上游的20-bp序列而手动地选择指导序列。

  订购如通过该在线工具所指定的必需的寡核苷酸和引物。如果手动地选择位点,则应该设计寡核苷酸和引物。

  sgRNA表达构建体的制备

  为了产生sgRNA表达构建体,可以使用基于PCR或质粒的方案。

  (A)经由PCR扩增·定时2h

  (i)申请人制备了稀释的U6PCR模板。申请人推荐使用PX330作为PCR模板,但是可以同样地将任何含U6质粒用作PCR模板。申请人用ddH2O将模板稀释至浓度为10ng/ul。注意的是,如果将已经包含U6驱动的sgRNA的质粒或盒用作模板,则需要进行凝胶提取,以保证产物仅包含预期的sgRNA而不包含从模板带入的痕量sgRNA。

  (ii)申请人制备了稀释的PCR寡核苷酸。将U6-Fwd和U6-sgRNA-Rev引物在ddH2O中稀释至终浓度为10uM(将10ul的100uM引物添加至90ul ddH2O中)。

  (iii)U6-sgRNA PCR反应。申请人按照需要为每个U6-sgRNA-Rev引物和预混合液设置了以下反应:

  (iv)申请人使用以下循环条件在来自步骤(iii)的反应上进行了PCR反应:

  (v)反应完成后,申请人使产物在凝胶上跑胶,以验证成功的单条带扩增。用1X SYBR Safe染料在1X TBE缓冲液中铸造2%(wt/vol)琼脂糖凝胶。使5ul的PCR产物在该凝胶中以15V cm-1跑胶20-30min。成功的扩增子应该产生单个的370-bp产物并且模板应该是不可见的。应该不必对PCR扩增子进行凝胶提取。

  (vi)申请人根据制造商的指导,使用QIAquick PCR纯化试剂盒纯化了PCR产物。将DNA在35ul的缓冲液EB或水中洗脱。可以将纯化的PCR产物存储在4℃或-20℃下。

  (B)将sgRNA克隆进含Cas9的双顺反子表达载体中·定时3d

  (i)制备sgRNA寡核苷酸插入片段。申请人将每个sgRNA设计的寡核苷酸的顶链和底链再悬浮至终浓度为100uM。如下使寡核苷酸磷酸化和退火:

  (ii)使用以下参数在热循环仪中退火:

  37℃持续30m

  95℃持续5m

  以5℃/m降至25℃

  (iii)申请人通过将1ul的寡核苷酸添加至199ul室温ddH2O中而以1:200稀释了磷酸化且退火的寡核苷酸。

  (iv)将sgRNA寡核苷酸克隆进PX330中。申请人为每个sgRNA设置了Golden Gate反应。申请人还推荐设置了一种无插入物,仅PX330作为阴性对照。

  (v)将Golden Gate反应孵育总共1h:

  循环数 条件

  1-637℃持续5m,21℃持续5m

  (vi)申请人用PlasmidSafe外切核酸酶处理了Golden Gate反应,以消化任何残余的线性化DNA。此步骤是任选的但被强烈推荐。

  (vii)申请人将PlasmidSafe反应在37℃下孵育了30min,随后在70℃下失活30min。暂停点:完成后,可以将反应冷冻并且稍后继续。环状DNA应该至少1周是稳定的。

  (viii)转化。申请人根据与细胞一起提供的方案将PlasmidSafe处理的质粒转化进感受态大肠杆菌菌株中。申请人推荐Stbl3用于迅速转化。简言之,申请人将来自步骤(vii)的5ul的产物添加进20ul的冰冷化学感受态Stbl3细胞中。然后将其在冰上孵育10m,在42℃下热休克30s,立即返回冰上持续2m,添加100ul的SOC培养基,并且将其在包含100ug/ml氨苄西林的LB平板上铺板,并在37℃下孵育过夜。

  (ix)第2天:申请人检查了平板的菌落生长情况。典型地,在阴性对照平板上不存在菌落(仅连接了BbsI-消化的PX330,没有退火的sgRNA寡核苷酸),并且在PX330-sgRNA克隆平板上存在数十至数百个菌落。

  (x)申请人从每个平板中挑选了2-3个菌落,以检查sgRNA的正确插入。申请人使用无菌移液管尖端将单菌落接种进3ml具有100ug/ml氨苄西林的LB培养基的培养物中。在37℃下孵育并振荡过夜。

  (xi)第3天:申请人根据制造商的说明书使用QiAprep Spin miniprep试剂盒从过夜培养物中分离出质粒DNA。

  (xii)序列验证CRISPR质粒。申请人通过使用U6-Fwd引物从U6启动子测序证实了每个菌落的序列。任选的:使用以下引物表中列出的引物对Cas9基因进行测序。

  申请人参考了PX330克隆载体序列的测序结果,以检查20bp指导序列插入在U6启动子与sgRNA支架的剩余部分之间。可以在网站crispr.genome-engineering.org找到处于GenBank载体图谱格式的PX330图谱的细节和序列(*.gb文件)。

  (任选的)设计ssODN模板·定时3d提前计划

  设计和订购ssODN。有义或反义ssODN可以直接从供应商购买。申请人推荐设计在任一侧上具有至少40bp和用于优化HDR效率的90bp的同源臂。在申请人的经验中,反义寡核苷酸具有稍微更高的修饰效率。

  申请人将ssODN ultramer再悬浮并稀释至终浓度为10uM。不将有义和反义ssODN合并或退火。存储在-20℃下。

  注意对于HDR应用,申请人推荐将sgRNA克隆进PX330质粒中。

  sgRNA的功能验证:细胞培养和转染·定时3-4d

  CRISPR-Cas系统已经被用于多种哺乳动物细胞系中。每个细胞系的条件可以变化。以下方案详细说明了HEK239FT细胞的转染条件。注意对于ssODN介导的HDR转染,使用Amaxa SF Cell Line Nucleofector试剂盒优化ssODN的递送。将在下节中对其进行描述。

  HEK293FT维持。根据制造商的推荐维持细胞。简言之,申请人在37℃和5%CO2下将细胞培养在D10培养基(补充有10%胎牛血清的GlutaMax DMEM)中。

  为了传代,申请人移除培养基并且通过将DPBS轻轻地添加到容器的侧面而将其冲洗一次,以便移动细胞。申请人将2ml的TrypLE添加至T75烧瓶中并在37℃下孵育5m。添加10ml的温D10培养基以失活并将其转移至50ml Falcon管中。申请人通过轻轻地研磨而使细胞解离,并且必要时重新接种新的烧瓶。申请人典型地使细胞以1:4或1:8的分传比每2-3d传代一次,绝不允许细胞达到大于70%的汇合。当达到传代数15时,细胞系被重新启动。

  制备供转染用的细胞。在以1.3x105个细胞/孔的接种密度和500ul的接种体积进行转染之前16-24h,申请人将良好解离的细胞在24孔平板上铺板在没有抗生素的D10培养基中。根据制造商手册按需要按比例放大或缩小。建议不要铺比推荐的密度多的细胞,因为这样做可以降低转染效率。

  在转染的当天,细胞的汇合最佳为70%-90%。根据制造商的方案,可以用Lipofectamine 2000或Amaxa SF Cell Line Nucleofector试剂盒转染细胞。

  (A)对于克隆进PX330中的sgRNA,申请人转染了500ng的序列已证实的CRISPR质粒;如果转染超过一种质粒,以等摩尔比例混合并且总共不超过500ng。

  (B)对于通过PCR扩增的sgRNA,申请人将以下项混合:

  PX165(仅有Cas9)200ng

  sgRNA扩增子(各自)40ng

  pUC19填充总DNA至500ng

  申请人推荐在技术上一式三份地转染用于可靠地定量并包括转染对照(例如GFP质粒)以监测转染效率。另外,可以将PX330克隆质粒和/或sgRNA扩增子作为阴性对照而单独地转染,用于下游的功能测定。

  申请人将Lipofectamine复合物轻轻地添加至细胞中,因为HEK293FT细胞可以容易地从平板上脱离并导致转染效率较低。

  申请人在转染后24h通过使用荧光显微镜估计对照(例如,GFP)转染中的荧光细胞的分数而检查了细胞的效率。典型地,超过70%的细胞被转染。

  申请人给培养基补充了另外500ul的温D10培养基。将D10非常缓慢地添加至孔的侧面并且不要使用冷的培养基,因为细胞可以容易地脱离开。

  在收获用于indel分析之前,将细胞在转染后孵育总共48-72h。48h后indel效率未显著增加。

  (任选的)CRISPR质粒和ssODN或靶向质粒的共转染用于进行HR·定时3-4d

  线性化靶向质粒。如果可能的话,通过在同源臂之一的附近或在任一同源臂的远端在载体骨架中的限制酶切位点处切割一次而将靶向载体线性化。

  申请人使少量的线性化质粒在未切割的质粒旁边在0.8%-1%琼脂糖凝胶上跑胶,以检查成功的线性化。线性化质粒应该跑到超螺旋质粒的上方。

  申请人用QIAQuick PCR纯化试剂盒纯化了线性化质粒。

  制备供转染用的细胞。申请人在T75或T225烧瓶中培养HEK293FT。在转染当天之前,为重组的细胞计数订计划。对于Amaxa条状比色皿格式,每个转染使用2x106个细胞。

  制备供转染用的平板。申请人将1ml的温D10培养基添加进12孔平板的每个孔中。将平板置于恒温箱中,以保持培养基是温的。

  核转染。申请人根据适于以下步骤的Amaxa SF Cell Line Nucleofector 4D试剂盒制造商的说明书转染HEK293FT细胞。

  a.用于ssODN和CRISPR共转染,将以下DNA预混合在PCR管中:

  pCRISPR质粒(Cas9+sgRNA)500ng

  ssODN模板(10uM)1ul

  b.用于HDR靶向质粒和CRISPR共转染,将以下DNA预混合在PCR管中:

  CRISPR质粒(Cas9+sgRNA) 500ng

  线性化靶向质粒 500ng

  对于转染对照,参见上节。另外,申请人推荐转染单独的ssODN或靶向质粒作为阴性对照。

  解离成单细胞。申请人移除培养基并用DPBS轻轻地冲洗一次,注意不要移动细胞。将2ml的TrypLE添加至T75烧瓶中并在37℃下孵育5m。添加10ml的温D10培养基以失活并将其在50ml Falcon管中轻轻地研磨。推荐轻轻地研磨细胞并解离为单细胞。较大的团块将降低转染效率。申请人从悬浮液中取了一个10ul的等分部分并将其稀释于90ul的D10培养基中用于计数。申请人对细胞进行了计数并计算了转染所需的细胞数目和悬浮液体积。申请人使用Amaxa Nucleocuvette条典型地每个条件转染2x105个细胞,并且推荐计算比所需多20%的细胞,以调节在随后的吸移步骤中的体积损失。将所需体积转移至新的Falcon管中。

  申请人使新管以200x g旋降,持续5m。

  如由Amaxa所推荐的,申请人通过将SF溶液与S1添加物混合而制备了转染溶液。对于Amaxa条状比色皿,每个转染需要总共20ul的补充SF的溶液。同样地,申请人推荐计算比所需多20%的体积。

  申请人从来自步骤23的沉淀细胞中完全移除培养基并将其轻轻地再悬浮于适当体积(20ul/2x105个细胞)的补充S1的SF溶液中。不要将细胞在SF溶液中留延长的时间段。

  将20ul的再悬浮的细胞吸移进来自步骤20的每个DNA预混合液中。轻轻地吸移以混合并转移至Nucleocuvette条室中。针对每个转染条件将其重复。

  使用由Amaxa推荐的Nucleofector 4D程序CM-130将细胞电穿孔。

  申请人轻轻地并缓慢地将100ul的温D10培养基吸移进每个Nucleocuvette条室中,并将全部体积转移至来自步骤19的预加温的平板中。关键.细胞在此阶段是非常脆弱的并且粗鲁的吸移可以引起细胞死亡。孵育24h。在此时,可以从阳性转染对照中的荧光细胞的分数估计转染效率。核转染典型地产生大于70%-80%的转染效率。申请人将1ml温D10培养基缓慢地添加至每个孔中而未移动细胞。将细胞孵育总共72h。

  人类胚胎干细胞(HUES 9)培养和转染·定时3-4d

  维持hESC(HUES9)系。申请人常规地用mTesR1培养基将HUES9细胞系维持在无进料器的条件中。申请人通过添加5X包括基础培养基和100ug/ml Normocin的添加物而制备了mTeSR1培养基。申请人制备了进一步补充有10uM Rock抑制剂的mTeSR1培养基的一个10ml的等分部分。包衣组织培养平板。将冷的GelTrex 1:100地稀释于冷的DMEM中并包衣100mm组织培养平板的整个表面。

  将平板在37℃下置于恒温箱中持续至少30m。在37℃下解冻一小瓶15ml Falcon管中的细胞,添加5ml的mTeSR1培养基,并在200x g下沉淀5m。抽出GelTrex包衣并用约1x106个细胞接种10ml的包含Rock抑制剂的mTeSR1培养基。转染后24h换为正常的mTeSR1培养基并且每天重新给料。细胞传代。每天用新鲜的mTeSR1培养基为细胞重新给料并在达到70%汇合之前传代。抽出mTeSR1培养基并用DPBS将细胞洗涤一次。通过添加2ml Accutase并在37℃下孵育3-5m而使细胞解离。向脱离开的细胞中添加10ml mTeSR1培养基,转移至15ml Falcon管中并轻轻地再悬浮。在具有10uM Rock抑制剂的mTeSR1培养基中在GelTrex包衣的平板上重新铺板。铺板后24h换为正常的mTeSR1培养基。

  转染。申请人推荐在使用Amaxa P3Primary Cell 4-D Nucleofector试剂盒(龙沙公司)转染之前,在解冻后将细胞培养至少1周。转染之前2h,用新鲜的培养基为对数期生长细胞重新给料。用accutase解离为单细胞或不超过10个细胞的小聚簇并轻轻地再悬浮。为核转染所需的细胞数目计数并以200x g旋降,持续5m。完全地移除培养基并再悬浮于推荐体积的补充S1的P3核转染溶液中。在1X Rock抑制剂的存在下,将电穿孔的细胞轻轻地铺进包衣的平板中。

  检查转染是否成功并且在核转染后24h开始每天用普通的mTeSR1培养基重新给料。典型地,申请人用Amaxa核转染观察到大于70%的转染效率。收获DNA。转染后48-72h,使用accutase使细胞解离并通过添加5x体积的mTeSR1而失活。将细胞以200x g旋降,持续5m。可以将沉淀的细胞直接加工,用于使用QuickExtract溶液提取DNA。推荐不要不用accutase而机械地解离细胞。推荐不要在未灭活accutase的情况下或不按以上推荐的速度使细胞旋降;这样做可以导致细胞溶解。

  通过FACS分离克隆细胞系。定时·2-3h亲身实践的;2-3周扩展

  可以在转染后24h通过FACS或通过连续稀释进行克隆分离。

  制备FACS缓冲液。可以在补充有1X青霉素/链霉素的普通D10培养基中分选无需使用彩色荧光分选的细胞。如果还需要彩色荧光分选,则用无酚DMEM或DPBS替代正常的DMEM。补充1X青霉素/链霉素并通过.22umSteriflip过滤器进行过滤。

  准备96孔平板。申请人向每个孔中添加了100ul补充有1X青霉素/链霉素的D10培养基并根据希望的克隆数目的需要准备了平板的数目。

  制备供FACS用的细胞。申请人通过完全吸除培养基并向24孔平板的每个孔中添加100ul TrypLE而使细胞解离。孵育5m并添加400ul温D10培养基。

  将再悬浮的细胞转移至15ml Falcon管中并轻轻地研磨20次。建议在显微镜下进行检查,以保证解离单细胞。

  将细胞以200x g旋降,持续5分钟。

  申请人抽出培养基,并且将细胞再悬浮于200ul的FACS培养基中。

  通过35um目过滤器将细胞过滤进标记的FACS管中。申请人推荐使用带有细胞滤网帽的BD Falcon 12x75mm管。将细胞放在冰上直到分选。

  申请人将单细胞分选进从步骤55准备的96孔平板中。申请人推荐在每个平板上的一个单个指定的孔中,分选100个细胞作为阳性对照。

  注意。可以将细胞的剩余部分保存和用于以群体水平进行基因分型,以测量整体修饰效率。

  申请人将细胞返回恒温箱总并允许它们扩增2-3周。分选后5d,添加100ul的温D10培养基。必要时,每3-5d更换100ul的培养基。

  分选后1周检查菌落的“克隆”外观:从中心点辐射的圆菌落。划出空的或可能已经接种有双联体或多联体的孔。

  当超过60%的细胞汇合时,申请人准备了一套用于传代的复制平板。将100ul的D10培养基添加至复制平板中的每个孔中。申请人通过上下剧烈吸移20次而直接将细胞解离。将20%的再悬浮体积铺进准备的复制平板中,以保存克隆系。之后每2-3d更换培养基并相应地传代。

  使用剩余的80%细胞进行DNA分离和基因分型。

  任选的:通过稀释分离克隆细胞系。定时·2-3h亲身实践的;2-3周扩展

  申请人如上所述地将细胞从24孔平板上解离。确保解离成单细胞。可以使用细胞滤网防止细胞聚集。

  在每个条件下对细胞的数目计数。将每个条件连续稀释于D10培养基中至终浓度为0.5个细胞/100ul。对于每个96孔平板,申请人推荐稀释至终计数为12ml的D10中有60个细胞。推荐将细胞数目的精确计数用于适当的克隆稀释。可以在中间的连续稀释阶段中对细胞重新计数以保证精确度。

  使用多通道移液管将100ul的稀释的细胞吸移进96孔平板的每个孔中。

  注意。可以将细胞的剩余部分保存和用于以群体水平进行基因分型,以测量整体修饰效率。

  铺板后约1周申请人检查了菌落的“克隆”外观:从中心点辐射的圆菌落。划出可能已经接种有双联体或多联体的孔。

  申请人将细胞返回恒温箱总并允许它们扩增2-3周。如在上节中详细说明的,根据需要为细胞重新给料。

  用于CRISPR切割效率的SURVEYOR测定。定时·5-6h

  在测定转染细胞的切割效率之前,申请人推荐使用以下描述的方案在阴性(未转染的)对照样品上通过SURVEYOR核酸酶消化步骤测试每个新的SURVEYOR引物。偶然地,甚至单条带的干净的SURVEYOR PCR产物可以产生非特异的SURVEYOR核酸酶切割条带并潜在地干扰准确的indel分析。

  收获细胞的DNA。将细胞解离并以200x g旋降,持续5m。注意。根据需要在此阶段需要复制平板,以保存转染细胞系。

  完全地抽出上清液。

  申请人根据制造商的说明书使用QuickExtract DNA提取溶液。申请人典型地为24孔平板的每个孔使用50ul的溶液并为96孔平板的每个孔使用10ul的溶液。

  申请人用ddH2O将提取的DNA归一化至终浓度为100-200ng/ul。暂停点:可以将提取的DNA存储在-20℃下,持续若干个月。

  设置SURVEYOR PCR。使用由申请人的在线/计算机算法工具提供的SURVEYOR引物将以下项预混合:

  申请人为每个反应添加了100-200ng的来自步骤74的归一化的基因组DNA模板。

  使用以下循环条件进行PCR反应,持续不超过30个扩增循环:

  申请人使2-5ul的PCR产物在1%凝胶上跑胶,以检查单条带产物。尽管将这些PCR条件设计为与大部分SURVEYOR引物对一起工作,但是一些引物可能需要通过调节模板浓度、MgCl2浓度和/或退火温度而进行另外的优化。

  申请人使用QIAQuick PCR纯化试剂盒与归一化洗脱液纯化了PCR反应至20ng/ul。暂停点:可以将纯化的PCR产物存储在-20℃下。

  DNA异源双链体形成。如下设置退火反应:

  Taq PCR缓冲液,10X2ul

  归一化的DNA(20ng/ul) 18ul

  总体积 20ul

  81|使用以下条件使反应退火:

  SURVEYOR核酸酶S消化。申请人制备了预混合液并将冰上的以下组分添加至来自步骤81的退火的异源双链体,总终体积为25ul:

  使孔涡旋并旋降。将反应在42℃下孵育1h。

  任选的:可以添加2ul来自SURVEYOR试剂盒的终止溶液。暂停点.可以将消化的产物存储在-20℃下用于稍后的分析。

  可视化SURVEYOR反应。可以在2%琼脂糖凝胶上使SURVEYOR核酸酶消化产物可视化。用于更好地拆分,可以使产物在4%-20%梯度聚丙烯酰胺TBE凝胶上跑胶。申请人用推荐的加样缓冲液加样了10ul的产物并根据制造商的说明书在凝胶上跑胶。典型地,申请人跑胶直到溴酚蓝染料已经迁移到凝胶的底部。同一凝胶上包括DNA梯和阴性对照。

  申请人用稀释于TBE中的1X SYBR Gold染料将凝胶染色。将凝胶轻轻地摇动15m。

  申请人使用定量成像系统使凝胶成像而未过度暴露这些条带。阴性对照应该仅具有一个对应于PCR产物的尺寸的条带,但是可以偶尔具有其他尺寸的非特异的切割条带。如果它们与靶切割条带在尺寸上不同,则这些条带将不干扰分析。由申请人的在线/计算机算法工具提供的靶切割条带尺寸的总和应该等于PCR产物的尺寸。

  估计切割强度。申请人使用ImageJ或其他凝胶定量软件定量了积分强度。

  对于每个泳道,申请人使用以下公式计算了切割的PCR产物的分数(f切割):f切割=(b+c)/(a+b+c),其中a是未消化的PCR产物的积分强度并且b和c是每个切割产物的积分强度。可以使用以下公式基于双链体形成的二项式概率分布估计切割效率:

  用于评估CRISPR切割效率的桑格测序。定时·3d

  初始步骤与SURVEYOR测定的步骤71-79相同。注意:如果将适当的限制酶切位点附加至正向和反向引物上,则可以将SURVEYOR引物用于桑格测序。对于克隆进推荐的pUC19骨架中,可以使用EcoRI用于Fwd引物并使用HindIII用于Rev引物。

  扩增子消化。如下设置消化反应:

  pUC19骨架消化。如下设置消化反应:

  组分量(ul)

  快速消化缓冲液,10X3

  快速消化EcoRI 1

  快速消化HindIII 1

  FastAP碱性磷酸酶1

  pUC19载体(200ng/ul) 5

  ddH2O20

  总体积30

  申请人使用QIAQuick PCR纯化试剂盒纯化了消化反应。暂停点:可以将纯化的PCR产物存储在-20℃下。

  申请人如下以1:3的载体:插入片段比例将消化的pUC19骨架与桑格扩增子连接:

  转化。申请人根据与细胞一起提供的方案将PlasmidSafe处理的质粒转化进感受态大肠杆菌菌株中。申请人推荐Stbl3用于迅速转化。简言之,将5ul来自步骤95的产物添加进20ul的冰冷的化学感受态Stbl3细胞中,在冰上孵育10m,在42℃下热休克30s,立即返回冰上持续2m,添加100ul的SOC培养基,并在包含100ug/ml氨苄西林的LB平板上铺板。将其在37℃下孵育过夜。

  第2天:申请人检查了平板的菌落生长情况。典型地,在阴性对照平板上不存在菌落(仅连接了EcoRI-HindIII消化的pUC19,没有桑格扩增子插入片段),并且在pUC19-桑格扩增子克隆平板上存在数十至数百个菌落。

  第3天:申请人根据制造商的说明书使用QIAprep Spin miniprep试剂盒从过夜培养物中分离出质粒DNA。

  桑格测序。申请人通过使用pUC19-For引物从pUC19骨架测序证实了每个菌落的序列。申请人参照了预期的基因组DNA序列的测序结果,以检查Cas9诱导的NHEJ突变的存在。%编辑效率=(#修饰的克隆)/(#总克隆)。重要的是挑选合理数目的克隆(>24),以产生准确的修饰效率。

  微小缺失的基因分型。定时·2-3d亲身实践的;2-3周扩展

  如上所述的,用一对靶向有待缺失的区域的sgRNA转染细胞。

  转染后24h,如上所述的,通过FACS或连续稀释分离克隆系。

  将细胞扩增2-3周。

  如上所述的,申请人使用10ul QuickExtract溶液从克隆系中收获了DNA并用ddH2O将基因组DNA归一化至终浓度为50-100ng/ul。

  PCR扩增修饰的区域。如下设置PCR反应:

  注意:如果缺失尺寸超过1kb,用In-Fwd和In-Rev引物设置一套平行的PCR反应,以筛选野生型等位基因的存在。

  为了筛选倒置,如下设置PCR反应:

  注意:引物作为外-Fwd+内Fwd或外-Rev+内-Rev而配对。

  申请人为每个反应添加了100-200ng的来自步骤103的归一化的基因组DNA模板。

  使用以下循环条件进行PCR反应:

  申请人使2-5ul的PCR产物在1%-2%凝胶上跑胶,以检查产物。尽管将这些PCR条件设计为与大部分引物一起工作,但是一些引物可能需要通过调节模板浓度、MgCl2浓度和/或退火温度而进行另外的优化。

  经由HDR针对靶向修饰进行基因分型。定时·2-3d,2-3h亲身实践的

  如上所述的,申请人使用QuickExtract溶液收获了DNA并用TE将基因组DNA归一化至终浓度为100-200ng/ul。

  PCR扩增修饰的区域。如下设置PCR反应:

  申请人为每个反应添加了100-200ng的来自步骤109的基因组DNA模板并按以下程序跑胶。

  申请人使5ul的PCR产物在0.8%-1%凝胶上跑胶,以检查单条带产物。引物可能需要通过调节模板浓度、MgCl2浓度和/或退火温度而进行另外的优化。

  申请人使用QIAQuick PCR纯化试剂盒纯化了PCR反应。

  在HDR实例中,将HindIII限制酶切位点插入EMX1基因中。通过限制酶切消化PCR扩增子而对其进行检测:

  i.将DNA在37℃下消化10m:

  ii.申请人使10ul具有加样染料的消化的产物在4%-20%梯度聚丙烯酰胺TBE凝胶上跑胶,直到二甲苯蓝条带已经迁移到凝胶的底部。

  iii.申请人用1X SYBR Gold染料将凝胶染色同时摇动15m。

  iv.如上在SURVEYOR测定章节中所述的,使切割产物成像并对其进行定量。通过以下公式估计HDR效率:(b+c)/(a+b+c),其中a是未消化的HDR PCR产物的积分强度,并且b和c是HindIII-切割片段的积分强度。

  可替代地,可以克隆来自步骤113的纯化的PCR扩增子并使用桑格测序或NGS进行基因分型。

  深度测序和脱靶分析·定时1-2d

  在线CRISPR靶标设计工具针对每个鉴定的靶位点产生了候选基因组脱靶位点。可以通过SURVEYOR核酸酶测定、桑格测序或下一代深度测序进行这些位点处的脱靶分析。鉴于这些位点中的许多处的修饰率较低或不可检测的可能性,申请人推荐用Illumina Miseq平台进行深度测序,用于获得较高的灵敏度和精确度。方案将随测序平台而变化;在此,申请人简要地描述了一种用于附接测序适配子的融合PCR方法。

  设计深度测序引物。为较短的扩增子设计下一代测序(NGS)引物,这些扩增子典型地在100-200bp尺寸范围内。可以使用NCBI引物-Blast手动地设计引物或用在线CRISPR靶标设计工具产生(网站为genome-engineering.org/tools)。

  从Cas9靶向的细胞中收获基因组DNA。用ddH2O将QuickExtract基因组DNA归一化至100-200ng/ul。

  初始文库制备PCR。使用来自步骤116的NGS引物准备初始文库制备PCR

  为每个反应添加100-200ng的归一化的基因组DNA模板。

  使用以下循环条件进行PCR反应,持续不超过20个扩增循环:

  使2-5ul的PCR产物在1%凝胶上跑胶,以检查单条带产物。与基因组DNAPCR一样,NGS引物可能需要通过调节模板浓度、MgCl2浓度和/或退火温度而进行另外的优化。

  使用QIAQuick PCR纯化试剂盒纯化PCR反应并用洗脱液归一化至20ng/ul。暂停点:可以将纯化的PCR产物存储在-20℃下。

  Nextera XT DNA样品制备试剂盒。遵循制造商的方案,用独特的条形码为每个样品产生Miseq测序就绪的文库。

  分析测序数据。可以通过读取比对程序(如ClustalW、Geneious或简单的序列分析脚本)进行脱靶分析。

  定时

  步骤1-2设计并合成sgRNA寡核苷酸和ssODN:1-5d,取决于供应商而可变

  步骤3-5构建CRISPR质粒或PCR表达盒:2h至3d

  步骤6-53转染进细胞系中:3d(1h亲身实践时间)

  步骤54-70任选地衍生克隆系:1-3周,取决于细胞类型而可变

  步骤71-91经由SURVEYOR对NHEJ进行功能验证:5-6h

  步骤92-124经由桑格或下一代深度测序进行基因分型:2-3d(3-4h亲身实践时间)

  解决在此的实例涉及的情况

  讨论

  可以容易地将CRISPR-Cas多元化,以促进同时修饰若干基因并以较高效率介导染色体微小缺失。申请人使用了两种sgRNA展示以高达68%的效率同时靶向HEK293FT细胞中的人类GRIN2B和DYRK1A座位。同样地,可以使用一对sgRNA介导微小缺失,如切除外显子,可以通过PCR在克隆水平上对微小缺失进行基因分型。注意的是外显子接合的精确位置可以变化。申请人还展示了使用ssODN和靶向载体在HEK 293FT和HUES9细胞中用Cas9的野生型和切口酶突变体两者介导HDR(图30)。注意的是申请人还不能使用Cas9切口酶在HUES9细胞中检测到HDR,这可能是归因于在HUES9细胞中效率较低或修复活性方面的潜在差异。尽管这些值是典型的,但是给定的sgRNA的切割效率仍存在一些可变性,并且在个别情况下某些sgRNA可能不工作,究其原因仍是未知的。申请人推荐为每个座位设计两种sgRNA,并在预期的细胞类型中测试其效率。

  实例31:NLS

  Cas9转录调节剂:申请人着手将Cas9/gRNA CRISPR系统变成通用的DNA结合系统,在该系统中可以执行超过DNA切割的功能。例如,通过将一个或多个功能结构域融合到无催化活性的Cas9上,申请人已经给予了新颖的功能,如转录激活/抑制、甲基化/脱甲基化或染色质修饰。为了完成此目标,申请人通过将两个核酸酶活性必需的残基D10和H840变为丙氨酸而制备了无催化活性的Cas9突变体。通过突变这两个残基,Cas9的核酸酶活性被消除同时维持结合靶DNA的能力。申请人决定聚焦以测试申请人的假设的功能结构域是转录激活因子VP64和转录阻遏物SID和KRAB。

  Cas9核定位:申请人假设最有效的Cas9转录调节剂将牢固地定位于细胞核,在细胞核中它将对转录具有最大的影响。此外,细胞质中的任何残余的Cas9都可能具有不想要的作用。申请人确定野生型Cas9因为不包括多个核定位信号(NLS)而不定位进细胞核中(尽管CRISPR系统无需具有一个或多个NLS,但是有利地具有至少一个或多个NLS)。因为需要多个NLS序列,所以推断难于将Cas9进入细胞核中并且融合到Cas9上的任何另外的结构域都可能破坏核定位。因此,申请人制备了四种具有不同NLS序列的Cas9-VP64-GFP融合构建体(pXRP02-pLenti2-EF1a-NLS-hSpCsn1(10A,840A)-NLS-VP64-EGFP、pXRP04-pLenti2-EF1a-NLS-hSpCsn1(10A,840A)-NLS-VP64-2A-EGFP-NLS、pXRP06-pLenti2-EF1a-NLS-EGFP-VP64-NLS-hSpCsn1(10A,840A)-NLS、pXRP08-pLenti2-EF1a-NLS-VP64-NLS-hSpCsn1(10A,840A)-NLS-VP64-EGFP-NLS)。将这些构建体克隆进处于人类EF1a启动子的表达之下的lenti骨架中。还添加了WPRE元件,用于更稳健地表达蛋白质。使用Lipofectame 2000将每个构建体转染进HEK 293FT细胞中并在转染后24小时成像。当融合蛋白在该融合蛋白的N-末端和C-末端上都具有NLS序列时获得最佳核定位。观察到的最高核定位出现在具有四个NLS元件的构建体中。

  为了更稳健地理解NLS元件对Cas9的影响,申请人通过将同一α输入蛋白NLS序列融合在三个串联重复的看着为零的N-末端或C-末端而制备了16个Cas9-GFP融合。使用Lipofectame 2000将每个构建体转染进HEK293FT细胞中并在转染后24小时成像。值得注意地,NLS元件的数目不与核定位的范围直接相关。在C-末端上添加NLS比在N-末端上添加对核定位具有更大的影响。

  Cas9转录激活因子:申请人通过靶向Sox2座位并通过RT-qPCR定量转录激活而在功能上对Cas9-VP64蛋白进行了测试。选择了八个DNA靶位点来跨Sox2的启动子。使用Lipofectame 2000将每个构建体转染进HEK293FT细胞中并且在转染后72小时,从细胞中提取总RNA。在40ul反应中,将1ug的RNA反转录成cDNA(qScript Supermix)。将2ul的反应产物添加进单个的20ul TaqMan测定qPCR反应中。在生物和技术上一式三份地进行每个实验。没有RT对照并且没有模板对照反应显示出无扩增。不显示出强烈的核定位的构建体pXRP02和pXRP04导致无激活。对于的确显示出较强的核定位的构建体pXRP08,观察到适度的激活。可以在指导RNA Sox2.4和Sox2.5的情况下观察到统计学上有义意的激活。

  实例32:体内小鼠数据

  材料与试剂

  Herculase II融合聚合酶(安捷伦技术公司,目录号600679)

  10x NE缓冲液4(NEB,目录号B7004S)

  BsaI HF(NEB,目录号R3535S)

  T7DNA连接酶(Enzymatic公司,目录号L602L)

  快速消化缓冲液,10X(赛默飞世尔科技公司,目录号B64)

  快速消化NotI(赛默飞世尔科技公司,目录号FD0594)

  FastAP碱性磷酸酶(赛默飞世尔科技公司,目录号EF0651)

  Lipofectamine2000(生命技术公司,目录号11668-019)

  胰蛋白酶(生命技术公司,目录号15400054)

  Forceps#4(西格玛公司,目录号Z168777-1EA)

  Forceps#5(西格玛公司,目录号F6521-1EA)

  10x汉克氏平衡盐溶液(Hank’s Balanced Salt Solution)(西格玛公司,目录号H4641-500ML)

  青霉素/链霉素溶液(生命技术公司,目录号P4333)

  Neurobasal(生命技术公司,目录号21103049)

  B27添加物(生命技术公司,目录号17504044)

  L-谷氨酰胺(生命技术公司,目录号25030081)

  谷氨酸盐(西格玛公司,目录号RES5063G-A7)

  β-巯基乙醇(西格玛公司,目录号M6250-100ML)

  HA兔抗体(细胞信号传导,目录号3724S)

  细胞成像试剂盒(生命技术公司,目录号R37601)

  30G世界精密仪器(World Precision Instrument)注射器(世界精密仪器(World Precision Instruments),目录号NANOFIL)

  立体定位仪(科夫仪器(Kopf Instruments))

  UltraMicroPump3(世界精密仪器,目录号UMP3-4)

  蔗糖(西格玛公司,目录号S7903)

  氯化钙(西格玛公司,目录号C1016)

  乙酸镁(西格玛公司,目录号M0631)

  Tris-HCl(西格玛公司,目录号T5941)

  EDTA(西格玛公司,目录号E6758)

  NP-40(西格玛公司,目录号NP40)

  苯甲基磺酰氟(西格玛公司,目录号78830)

  氯化镁(西格玛公司,目录号M8266)

  氯化钾(西格玛公司,目录号P9333)

  β-甘油磷酸酯(西格玛公司,目录号G9422)

  甘油(西格玛公司,目录号G9012)

  DyeCycleTMRuby Stain(生命技术公司,目录号S4942)

  FACS Aria Flu-act-细胞分选仪(美国剑桥MIT的科赫研究所(Koch Institute)

  DNAeasy Blood&Tissue试剂盒(凯杰公司,目录号69504)

  程序

  构建在脑中体内使用的gRNA多元体

  申请人设计并PCR扩增了靶向小鼠TET和DNMT家族成员的单个的gRNA(如在此描述的)。在N2a细胞系中评估靶向效率(图33)。为了在体内获得若干基因的同时修饰,在AAV包装的载体中对有效的gRNA进行多元化(图34)。为了促进系统效率的进一步分析,申请人向该系统上添加了与人类突触蛋白I启动子的控制之下的GFP-KASH结构域融合蛋白一致的表达盒(图34)。此修饰允许在神经元群体中进一步分析系统效率(更详细的程序参见章节分选细胞核与体内结果)。使用以下引物使用Herculase II融合聚合酶PCR扩增该系统的所有4个部分:

  第一U6Fw:

  gagggtctcgtccttgcggccgcgctagcgagggcctatttcccatgattc(SEQ ID NO:___)

  第一gRNA Rv:

  ctcggtctcggtAAAAAAgcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgctaTTTCtagctctaaaacNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCAC(SEQ ID NO:___)

  第二U6Fw:

  gagggtctcTTTaccggtgagggcctatttcccatgattcc(SEQ ID NO:___)

  第二gRNA Rv:

  ctcggtctcctcAAAAAAgcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgctaTTTCtagctctaaaacNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCAC(SEQ ID NO:__)

  第三U6Fw:

  gagggtctcTTTgagctcgagggcctatttcccatgattc(SEQ ID NO:___)

  第三gRNA Rv:

  ctcggtctcgcgtAAAAAAgcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgctaTTTCtagctctaaaacNNNNNNNNNNNNNNNNNNNNGGTGTTTCGTCCTTTCCA(SEQ ID NO:___)

  hSyn_GFP-kash Fw:gagggtctcTTacgcgtgtgtctagac(SEQ ID NO:___)

  hSyn_GFP-kash Rv:

  ctcggtctcAaggaCAGGGAAGGGAGCAGTGGTTCACGCCTGTAATCCCAGCAATTTGGGA GGCCAAGGTGGGTAGATCACCTGAGATTAGGAGTTGC(SEQ ID NO:___)

  (NNNNNNNNNNNNNNNNNNNN是反向互补序列靶向的基因组序列)

  申请人使用了Golden Gate策略在单步反应中组装了该系统的所有部分(1:1分子比):

  使用Herculase II融合聚合酶和以下引物PCR扩增Golden Gate反应产物:

  Fw 5’cctgtccttgcggccgcgctagcgagggcc

  Rv 5’cacgcggccgcaaggacagggaagggagcag

  使用NotI限制酶切位点将PCR产物克隆进AAV骨架中在ITR序列之间:

  AAV骨架消化:

  在37℃下孵育20min后,使用QIAQuick PCR纯化试剂盒纯化样品。如下以1:3载体:插入片段比例连接标准化的样品:

  用连接反应产物转化细菌后,申请人用桑格测序确认了获得的克隆。

  与Cas9构建体共转染后,在N2a细胞中测试阳性DNA克隆(图35和36)。

  设计用于AAV递送的新的Cas9构建体

  尽管其具有独特的功能,AAV递送系统具有包装限制-为了成功地在体内递送表达盒,则它的尺寸不得不<4.7kb。为了减少SpCas9表达盒的尺寸并促进递送,申请人测试了若干改变:不同启动子、较短的polyA信号以及最后是较小版本的来自金黄色葡萄球菌的Cas9(SaCas9)(图37和38)。所有测试的启动子先前已经被测试并且公开为在神经元中有活性,包括小鼠Mecp2(格雷(Gray)等人,2011)、大鼠Map1b和截短的大鼠Map1b(刘(Liu)和费舍尔(Fischer),1996)。替代性合成polyA序列先前也已显示具有功能(莱维特(Levitt)等人,1989;格雷(Gray)等人,2011)。在用Lipofectamine 2000转染后,在N2a细胞中表达所有克隆的构建体,并用蛋白质印迹法进行测试(图39)。

  在初级神经元中测试AAV多元系统

  为了确认研发的系统在神经元中的功能性,申请人使用体外初级神经元培养物。根据先前由班克(Banker)和戈斯林(Goslin)(班克和戈斯林,1988)公开的方案制备小鼠皮层神经元。

  第16天,从胚胎中获得神经元细胞。胚胎提取自安乐死的怀孕雌鼠,并且将头部置于冰冷的HBSS中。然后,用镊子(#4和#5)从头骨中提取大脑并将其转移至另一个更换的冰冷的HBSS中。在立体显微镜和#5镊子的辅助下在填充有冰冷的HBSS的皮氏培养皿中进行另外的步。将半球彼此分离并与脑干分离并清除脑膜。然后,非常谨慎地解剖海马体并将其置于填充有冰冷的HBSS的15ml锥形管中。可以使用在海马体解剖后留下的皮层,在除去脑干残留物和嗅球后使用类似的方案进行另外的细胞分离。将分离的海马体用10ml冰冷的HBSS洗涤三次并通过在37℃下于HBSS中用胰蛋白酶孵育15min而解离(4ml HBSS,添加10μl 2.5%胰蛋白酶/海马体)。胰酶消化后,将海马体非常谨慎地洗涤三次,以用预加热至37℃的HBSS除去任何痕量的胰蛋白酶并在温HBSS中解离。申请人通常使用1ml移液管尖端在1ml HBSS中解离获得自10-12个胚胎的细胞并稀释解离的细胞直到4ml。将细胞以250个细胞/mm2的密度铺板并在37℃和5%CO2下培养长达3周。

  HBSS

  435ml H2O

  50ml 10x汉克氏平衡盐溶液

  16.5ml 0.3M HEPES pH 7.3

  5ml青霉素-链霉素溶液

  过滤(0.2μm)并存储在4℃下

  神经元铺板培养基(100ml)

  97ml Neurobasal

  2ml B27添加物

  1ml青霉素-链霉素溶液

  250μl谷氨酰胺

  125μl谷氨酸

  用来自HEK293FT细胞的过滤培养基的浓缩AAV1/2病毒或AAV1病毒转导神经元,培养4-7天之间并且在转导后在培养物中保存至少一周,以允许递送的基因表达。

  AAV驱动的系统的表达

  申请人使用蛋白质印迹法确认了AAV递送后SpCas9和SaCas9在神经元培养物中的表达(图42)。转导后一周,用β-巯基乙醇在NuPage SDS加样缓冲液中收集神经元,以使蛋白质在95℃下变性5min。将样品在SDS PAGE凝胶上分离并转移到PVDF膜上,用于进行WB蛋白质检测。用HA抗体检测Cas9蛋白。

  用荧光显微镜确认来自gRNA多元AAV的Syn-GFP-kash的表达(图50)。

  毒性

  为了评估具有CRISPR系统的AAV的毒性,申请人在病毒转导后一周测试了神经元的整体形态(图45)。另外,申请人用细胞成像试剂盒测试了设计的系统的潜在的毒性,该试剂盒允许区分培养物中的活细胞和死细胞。它是基于细胞内酯酶活性的存在(如通过将非荧光钙黄绿素AM酶促转化为强烈的绿色荧光钙黄绿素所确定的)。另一方面,该试剂盒的红色的细胞不通透性组分仅进入具有受损膜的细胞并结合到死细胞中的产荧光DNA上。两种荧光团都可以容易地用荧光显微镜在活细胞中可视化。AAV驱动的Cas9蛋白和多元gRNA构建体在初级皮层神经元中的表达耐受性良好并且无毒(图43和44),这指示设计的AAV系统适于体内测试。

  病毒产生

  根据描述于麦克卢尔(McClure)等人,2011中的方法产生浓缩的病毒。上清液病毒产生出现在HEK293FT细胞中。

  脑部手术

  对于病毒载体注射,通过腹膜内注射用氯胺酮/甲苯噻嗪混合物(氯胺酮剂量为100mg/kg并且甲苯噻嗪剂量为10mg/kg)麻醉的10-15周龄的雄性C57BL/6N小鼠。将腹膜内给予Buprenex用作优先购买的镇痛剂(1mg/kg)。使用耳内定位螺柱和齿条将动物固定在Kopf立体定位仪中,以维持头骨不动。使用手持电钻,在前囟后面-3.0mm且在海马体的CA1区域中的供注射的侧面3.5mm处钻出一个洞(1-2mm)。使用深度为2.5mm的30G世界精密仪器注射器,注射总体积为1ul的AAV病毒粒子溶液。通过流速为0.5ul/min的‘世界精密仪器UltraMicroPump3’注射泵监测注射,以防止损伤组织。当完成注射时,以0.5mm/min的速度缓慢地移除注射针。注射后,用6-0爱惜良(Ethilon)缝合线将皮肤缝合。在手术后,给动物供应1mL乳酸林格氏溶液(皮下的)并放在温度受控的(37℃)环境中,直到恢复走动。术后3周,通过深度麻醉将动物处以安乐死,随后除去组织,用于细胞核分选或用4%多聚甲醛灌注用于免疫化学。

  分选细胞核与体内结果

  申请人设计了一种用GFP特异地在遗传上标记gRNA靶向的神经元细胞核的方法,用于标记的细胞核的荧光激活细胞分选术(FACS)以及DNA、RNA和核内蛋白的下游加工。为了这个目的,诸位申请人的多元靶向载体被设计成表达在GFP与小鼠细胞核膜蛋白结构域KASH(斯塔尔DA(Starr DA),2011,《当代生物学》(Current biology))之间的融合蛋白和用于靶向特定的感兴趣的基因座位的3个gRNA(图34)。在人类突触蛋白启动子的控制之下表达GFP-KASH,以特异性标记神经元。该融合蛋白GFP-KASH的氨基酸是:

  MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKSGLRSREEEEETDSRMPHLDSPGSSQPRRSFLSRVIRAALPLQLLLLLLLLLACLLPASEDDYSCTQANNFARSFYPMLRYTNGPPPT(SEQ ID NO:___)

  AAV1/2介导的递送进入脑后一周,观察到GFP-KASH的稳健表达。对于FACS和标记的细胞核的下游加工,术后3周将海马体解剖并加工,用于使用梯度离心步骤进行细胞核纯化。为了这个目的,使用2ml Dounce均质机(西格玛公司)将组织在320mM蔗糖、5mM CaCl、3mM Mg(Ac)2、10mM Tris pH 7.8、0.1mM EDTA、0.1%NP40、0.1mM苯甲基磺酰氟(PMSF)、1mMβ-巯基乙醇中匀化。根据制造商的方案,将匀浆在4℃下以3.500rpm以25%至29%梯度离心30min。将细胞核沉淀物再悬浮于340mM蔗糖、2mM MgCl2、25mM KCl、65mM甘油磷酸酯、5%甘油、0.1mM PMSF、1mMβ-巯基乙醇中并向标记的细胞核中添加DyeCycleTM Ruby Stain(生命技术公司)(为DNA提供近红外发射)。使用Aria Flu-act-细胞分选仪和BDFACS Diva软件通过FACS分选标记的和纯化的细胞核。最后,使用DNAeasy Blood&Tissue试剂盒(凯杰公司),将分选的GFP+和GFP-细胞核用于纯化基因组DNA,用于对靶向的基因组区域进行Surveyor测定分析。可以容易地使用同一途径从靶向的细胞中纯化出细胞核RNA或蛋白质,用于下游加工。由于2-载体系统(图34),诸位申请人在此途径中使用有效的Cas9介导的DNA切割预期仅在脑中的一小部分的细胞中出现(用多元靶向载体和Cas9编码载体两者共转染的细胞)。在此描述的方法使得诸位申请人可以从表达3种感兴趣的gRNA并且因此应该会经历Cas9介导的DNA切割的细胞群体中特异地纯化出DNA、RNA和核内蛋白。通过使用此方法,诸位申请人能够可视化仅发生在一小部分的细胞中的有效的体内DNA切割。

  实质上,申请人在此显示的是靶向的体内切割。此外,申请人使用了一种多元途径,其中同时但是独立地靶向若干不同序列。呈现的系统可以适于研究脑部病理病症(基因敲除,例如帕金森病)并且还为进一步研发脑中的基因组编辑工具开辟了一个领域。通过将核酸酶活性替换为基因转录调节剂或表观遗传调节剂,可以回答关于脑中的基因调节和表观改变不仅在病理病症而且在生理过程(如学习和记忆形成)中的作用的整个范围的科学问题。最后,呈现的技术可以应用于更复杂的哺乳动物系统(如灵长类)中,该技术允许克服当前的技术局限。

  实例33:模型数据

  已经具体研究了若干疾病模型。这些疾病模型包括新生(de novo)自闭症风险基因CHD8、KATNAL2和SCN2A;以及综合征性自闭症(安格曼综合征(Angelman Syndrome))基因UBE3A。这些基因以及生成的自闭症模型当然是优选的,但是显示本发明可以被应用于任何基因并且因此任何模型都是可能的。

  申请人已经使用Cas9核酸酶在人类胚胎干细胞(hESC)中制备了这些细胞系。通过用Cbh-Cas9-2A-EGFP和pU6-sgRNA瞬时转染hESC而建立了这些系。为最经常地靶向相同外显子的每个基因设计了两种sgRNA,在这些外显子中患者无义(敲除)突变最近已经由自闭症患者的全外显子组测序研究得到描述。为此项目特异建立了Cas9-2A-EGFP和pU6质粒。

  实例34:AAV产生系统或方案

  在此提供了为高通量筛选用途研发并且与其一起工作特别好的AAV产生系统或方案,但是它在本发明中也具有较广泛的适用性。操纵内源基因表达提出了各种挑战,因为表达率取决于许多因素,包括调节元件、mRNA加工和转录物稳定性。为了克服此挑战,申请人研发了一种用于供递送的基于腺相关病毒(AAV)的载体。AAV具有一个基于ssDNA的基因组并且因此较不易受重组影响。

  AAV1/2(血清型AAV1/2,即杂交体或嵌合体AAV1/AAV2衣壳AAV)肝素纯化的浓缩病毒方案

  培养基:D10+HEPES

  500ml瓶DMEM高葡萄糖+Glutamax(GIBCO)

  50ml Hyclone FBS(热灭活的)(赛默飞世尔)

  5.5ml HEPES溶液(1M,GIBCO)

  细胞:低传代HEK293FT(产生病毒时传代<10次,解冻新的传代2-4次的细胞用于产生病毒,生长直到3-5次传代)

  转染试剂:聚乙烯亚胺(PEI)“Max”

  将50mg PEI“Max”溶解于50ml无菌的超纯H20中

  将pH调节至7.1

  用0.22um fliptop过滤器过滤

  用封口膜将管和包裹物密封

  在-20℃下将等分部分冷冻(用于存储,也可以立即使用)

  细胞培养

  在D10+HEPES中培养低传代HEK293FT

  每天传代1:2与1:2.5之间

  有利地不允许达到细胞超过85%的汇合

  对于T75

  -温10ml HBSS(-Mg2+,-Ca2+,GIBCO)+1ml TrypLE Express(GIBCO)/烧瓶至37℃(水浴)

  完全地抽出培养基

  -轻轻地添加10ml温HBSS(以完全洗掉培养基)

  -添加1ml TrypLE/烧瓶

  -将烧瓶在恒温箱(37℃)中放置1min

  -摇动烧瓶以使细胞脱离开

  -添加9ml D10+HEPES培养基(37℃)

  -上下吸移5次,以产生单细胞悬浮液

  -以1:2-1:2.5(对于T75,是12ml培养基)比例分离(如果细胞生长更缓慢,则丢弃并解冻新的批次,它们未处于最佳生长)

  -当存在足够的细胞时即转移至T225中(对于易于处理大量的细胞)

  AAV产生(5*15cm培养皿尺度/构建体):

  将21.5ml培养基中的1千万个细胞铺进15cm培养皿中

  在37℃下孵育18-22小时

  在80%汇合处转染是理想的

  每个平板

  预温的22ml培养基(D10+HEPES)

  准备具有DNA混合物的管(使用无内毒素大量质粒提取DNA(endofree maxiprep DNA)):

  5.2ug感兴趣的质粒载体

  4.35ug AAV 1血清型质粒

  4.35ug AAV 2血清型质粒

  10.4ug pDF6质粒(腺病毒辅助基因)涡旋至混合

  添加434uL DMEM(无血清!)

  添加130ul PEI溶液

  涡旋5-10秒

  向预温的培养基添加DNA/DMEM/PEI混合物

  简单地涡旋至混合

  将15cm培养皿中的培养基替换为DNA/DMEM/PEI混合物

  返回37℃恒温箱中

  收获之前孵育48h(确保培养基没有变得太酸)

  收获病毒:

  1.将培养基谨慎地从15cm培养皿中抽出(有利地不要移动细胞)

  2.向每个平板中添加25ml RT DPBS(英杰公司)并用细胞刮棒轻轻地移除细胞。将悬浮液收集在50ml管中。

  3.将细胞在800x g下沉淀10分钟。

  4.丢弃上清液

  暂停点:希望的话,将细胞沉淀物冷冻在-80C下

  5.将沉淀物再悬浮于150mM NaCl、20mM Tris pH 8.0中,每个组织培养平板使用10ml。

  6.在dH2O中制备10%脱氧胆酸钠的新鲜溶液。向每个组织培养平板中添加1.25ml的此溶液至终浓度为0.5%。添加benzonase核酸酶,至终浓度为50个单位/ml。将管充分混合。

  7.在37℃下孵育1小时(水浴)。

  8.通过在3000x g下离心15min除去细胞碎片。转移至干净的50ml管中并且保证已经除去所有的细胞碎片,以防止堵塞肝素柱。

  AAV1/2的肝素柱纯化:

  1.使用蠕动泵设置HiTrap肝素柱,这样使得溶液以每分钟1ml流过该柱。重要的是保证没有将气泡引入进该肝素柱中。

  2.使用蠕动泵,用10ml 150mM NaCl、20mM Tris(pH 8.0)平衡该柱。

  3.病毒的结合:向柱上施加50ml病毒溶液并允许流过。

  4.洗涤步骤1:用20ml 100mM NaCl、20mM Tris(pH 8.0)洗涤柱。(使用蠕动泵)

  5.洗涤步骤2:使用3ml或5ml注射器继续用1ml 200mM NaCl、20mM Tris(pH 8.0)洗涤该柱,随后用1ml 300mM NaCl、20mM Tris(pH 8.0)洗涤。

  丢弃流过物(flow-through)。

  (在以上病毒溶液流过50min过程中准备具有不同缓冲液的注射器)

  6.洗脱使用5ml注射器和轻压(流速<1ml/min)通过施加以下项将病毒从该柱上洗脱下来:

  1.5ml 400mM NaCl,20mM Tris,pH 8.0

  3.0ml 450mM NaCl,20mM Tris,pH 8.0

  1.5ml 500mM NaCl,20mM Tris,pH 8.0

  将这些收集在15ml离心管中。

  AAV1/2的浓度:

  1.浓缩步骤1:使用具有100,000分子量截留的Amicon ultra 15ml离心过滤装置浓缩洗脱的病毒。将柱洗脱物加样进浓缩器中并在2000x g下离心2分钟(在室温下)。检查浓缩体积-它应该是大约500μl。必要的话,以1min间隔离心,直到达到正确体积。

  2.缓冲液交换:向过滤装置中添加1ml无菌DPBS,以1min间隔离心,直到达到正确体积(500ul)。

  3.浓缩步骤2:向Amicon Ultra 0.5ml 100K过滤装置中添加500ul浓缩物。在6000g下离心2min。检查浓缩体积-它应该是大约100μl。必要的话,以1min间隔离心,直到达到正确体积。

  4.回收:倒置滤芯并插入新鲜的收集管中。在1000g下离心2min。

  等分并在-80℃下冷冻

  每个注射位点典型地需要1ul,因此推荐小的等分部分(例如5ul)(避免冻融病毒)。

  使用qPCR确定DNA酶I-抗性GC粒子效价(参见分离方案)

  材料

  Amicon Ultra,0.5ml,100K;密理博公司;UFC510024

  Amicon Ultra,15ml,100K;密理博公司;UFC910024

  Benzonase核酸酶;西格玛-奥德里奇公司,E1014

  HiTrap肝素柱体;西格玛-奥德里奇公司;54836

  脱氧胆酸钠;西格玛-奥德里奇公司;D5670

  AAV1上清液产生方案

  培养基:D10+HEPES

  500ml瓶DMEM高葡萄糖+Glutamax(英杰公司)

  50ml Hyclone FBS(热灭活的)(赛默飞世尔)

  5.5ml HEPES溶液(1M,GIBCO)

  细胞:低传代HEK293FT(产生病毒时传代<10次)

  解冻新的传代2-4次的细胞用于产生病毒,生长直到2-5次传代

  转染试剂:聚乙烯亚胺(PEI)“Max”

  将50mg PEI“Max”溶解于50ml无菌的超纯H20中

  将pH调节至7.1

  用0.22um fliptop过滤器过滤

  用封口膜将管和包裹物密封

  在-20℃下将等分部分冷冻(用于存储,也可以立即使用)

  细胞培养

  在D10+HEPES中培养低传代HEK293FT每天传代1:2与1:2.5之间

  有利地一定让细胞达到超过85%的汇合

  对于T75

  -温10ml HBSS(-Mg2+,-Ca2+,GIBCO)+1ml TrypLE Express(GIBCO)/烧瓶至37℃(水浴)

  -完全地抽出培养基

  -轻轻地添加10ml温HBSS(以完全洗掉培养基)

  -添加1ml TrypLE/烧瓶

  -将烧瓶在恒温箱(37℃)中放置1min

  -摇动烧瓶以使细胞脱离开

  -添加9ml D10+HEPES培养基(37℃)

  -上下吸移5次,以产生单细胞悬浮液

  -以1:2-1:2.5(对于T75,是12ml培养基)比例分离(如果细胞生长更缓慢,则丢弃并解冻新的批次,它们未处于最佳生长)

  -当存在足够的细胞时即转移至T225中(对于易于处理大量的细胞)

  AAV产生(单个15cm培养皿尺度)

  将21.5ml培养基中的1千万个细胞铺进15cm培养皿中

  在37℃下孵育18-22小时

  在每个平板80%汇合处转染是理想的

  预温的22ml培养基(D10+HEPES)

  准备具有DNA混合物的管(使用无内毒素大量质粒提取DNA(endofree maxiprep DNA)):

  5.2ug感兴趣的质粒载体

  8.7ug AAV 1血清型质粒

  10.4ug DF6质粒(腺病毒辅助基因)

  涡旋至混合

  添加434uL DMEM(无血清!)添加130ul PEI溶液

  涡旋5-10秒

  向预温的培养基添加DNA/DMEM/PEI混合物

  简单地涡旋至混合

  将15cm培养皿中的培养基替换为DNA/DMEM/PEI混合物

  返回37℃恒温箱中

  收获之前孵育48h(有利地进行监测,以保证培养基没有变得太酸)

  收获病毒:

  从15cm培养皿中除去上清液

  用0.45um过滤器过滤(较低的蛋白质结合)等分并在-80℃下冷冻

  转导(24孔格式中的原代神经元培养物,5DIV)

  将有待转导的神经元的每个孔中的完全neurobasal培养基替换为新鲜的neurobasal(通常替换每个孔中的500ul中的400ul)

  在37℃水浴中解冻AAV上清液

  在恒温箱中平衡30min

  向每个孔中添加250ul AAV上清液

  在37℃下孵育24h

  移除培养基/上清液并替换为新鲜的完全neurobasal

  48h后表达开始可见,感染后6-7天左右饱和

  具有GOI的pAAV质粒的构建体不应该超过4.8kb(包括两个ITRS)。

  人类密码子优化序列(即针对在人类中的表达而优化的)序列的实例:下面提供了SaCas9:

  ACCGGTGCCACCATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCATGAAAAGGAACTACATTCTGGGGCTGGACATCGGGATTACAAGCGTGGGGTATGGGATTATTGACTATGAAACAAGGGACGTGATCGACGCAGGCGTCAGACTGTTCAAGGAGGCCAACGTGGAAAACAATGAGGGACGGAGAAGCAAGAGGGGAGCCAGGCGCCTGAAACGACGGAGAAGGCACAGAATCCAGAGGGTGAAGAAACTGCTGTTCGATTACAACCTGCTGACCGACCATTCTGAGCTGAGTGGAATTAATCCTTATGAAGCCAGGGTGAAAGGCCTGAGTCAGAAGCTGTCAGAGGAAGAGTTTTCCGCAGCTCTGCTGCACCTGGCTAAGCGCCGAGGAGTGCATAACGTCAATGAGGTGGAAGAGGACACCGGCAACGAGCTGTCTACAAAGGAACAGATCTCACGCAATAGCAAAGCTCTGGAAGAGAAGTATGTCGCAGAGCTGCAGCTGGAACGGCTGAAGAAAGATGGCGAGGTGAGAGGGTCAATTAATAGGTTCAAGACAAGCGACTACGTCAAAGAAGCCAAGCAGCTGCTGAAAGTGCAGAAGGCTTACCACCAGCTGGATCAGAGCTTCATCGATACTTATATCGACCTGCTGGAGACTCGGAGAACCTACTATGAGGGACCAGGAGAAGGGAGCCCCTTCGGATGGAAAGACATCAAGGAATGGTACGAGATGCTGATGGGACATTGCACCTATTTTCCAGAAGAGCTGAGAAGCGTCAAGTACGCTTATAACGCAGATCTGTACAACGCCCTGAATGACCTGAACAACCTGGTCATCACCAGGGATGAAAACGAGAAACTGGAATACTATGAGAAGTTCCAGATCATCGAAAACGTGTTTAAGCAGAAGAAAAAGCCTACACTGAAACAGATTGCTAAGGAGATCCTGGTCAACGAAGAGGACATCAAGGGCTACCGGGTGACAAGCACTGGAAAACCAGAGTTCACCAATCTGAAAGTGTATCACGATATTAAGGACATCACAGCACGGAAAGAAATCATTGAGAACGCCGAACTGCTGGATCAGATTGCTAAGATCCTGACTATCTACCAGAGCTCCGAGGACATCCAGGAAGAGCTGACTAACCTGAACAGCGAGCTGACCCAGGAAGAGATCGAACAGATTAGTAATCTGAAGGGGTACACCGGAACACACAACCTGTCCCTGAAAGCTATCAATCTGATTCTGGATGAGCTGTGGCATACAAACGACAATCAGATTGCAATCTTTAACCGGCTGAAGCTGGTCCCAAAAAAGGTGGACCTGAGTCAGCAGAAAGAGATCCCAACCACACTGGTGGACGATTTCATTCTGTCACCCGTGGTCAAGCGGAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAATGATATCATTATCGAGCTGGCTAGGGAGAAGAACAGCAAGGACGCACAGAAGATGATCAATGAGATGCAGAAACGAAACCGGCAGACCAATGAACGCATTGAAGAGATTATCCGAACTACCGGGAAAGAGAACGCAAAGTACCTGATTGAAAAAATCAAGCTGCACGATATGCAGGAGGGAAAGTGTCTGTATTCTCTGGAGGCCATCCCCCTGGAGGACCTGCTGAACAATCCATTCAACTACGAGGTCGATCATATTATCCCCAGAAGCGTGTCCTTCGACAATTCCTTTAACAACAAGGTGCTGGTCAAGCAGGAAGAGAACTCTAAAAAGGGCAATAGGACTCCTTTCCAGTACCTGTCTAGTTCAGATTCCAAGATCTCTTACGAAACCTTTAAAAAGCACATTCTGAATCTGGCCAAAGGAAAGGGCCGCATCAGCAAGACCAAAAAGGAGTACCTGCTGGAAGAGCGGGACATCAACAGATTCTCCGTCCAGAAGGATTTTATTAACCGGAATCTGGTGGACACAAGATACGCTACTCGCGGCCTGATGAATCTGCTGCGATCCTATTTCCGGGTGAACAATCTGGATGTGAAAGTCAAGTCCATCAACGGCGGGTTCACATCTTTTCTGAGGCGCAAATGGAAGTTTAAAAAGGAGCGCAACAAAGGGTACAAGCACCATGCCGAAGATGCTCTGATTATCGCAAATGCCGACTTCATCTTTAAGGAGTGGAAAAAGCTGGACAAAGCCAAGAAAGTGATGGAGAACCAGATGTTCGAAGAGAAGCAGGCCGAATCTATGCCCGAAATCGAGACAGAACAGGAGTACAAGGAGATTTTCATCACTCCTCACCAGATCAAGCATATCAAGGATTTCAAGGACTACAAGTACTCTCACCGGGTGGATAAAAAGCCCAACAGAGAGCTGATCAATGACACCCTGTATAGTACAAGAAAAGACGATAAGGGGAATACCCTGATTGTGAACAATCTGAACGGACTGTACGACAAAGATAATGACAAGCTGAAAAAGCTGATCAACAAAAGTCCCGAGAAGCTGCTGATGTACCACCATGATCCTCAGACATATCAGAAACTGAAGCTGATTATGGAGCAGTACGGCGACGAGAAGAACCCACTGTATAAGTACTATGAAGAGACTGGGAACTACCTGACCAAGTATAGCAAAAAGGATAATGGCCCCGTGATCAAGAAGATCAAGTACTATGGGAACAAGCTGAATGCCCATCTGGACATCACAGACGATTACCCTAACAGTCGCAACAAGGTGGTCAAGCTGTCACTGAAGCCATACAGATTCGATGTCTATCTGGACAACGGCGTGTATAAATTTGTGACTGTCAAGAATCTGGATGTCATCAAAAAGGAGAACTACTATGAAGTGAATAGCAAGTGCTACGAAGAGGCTAAAAAGCTGAAAAAGATTAGCAACCAGGCAGAGTTCATCGCCTCCTTTTACAACAACGACCTGATTAAGATCAATGGCGAACTGTATAGGGTCATCGGGGTGAACAATGATCTGCTGAACCGCATTGAAGTGAATATGATTGACATCACTTACCGAGAGTATCTGGAAAACATGAATGATAAGCGCCCCCCTCGAATTATCAAAACAATTGCCTCTAAGACTCAGAGTATCAAAAAGTACTCAACCGACATTCTGGGAAACCTGTATGAGGTGAAGAGCAAAAAGCACCCTCAGATTATCAAAAAGGGCTAAGAATTC(SEQ ID NO:___)

  实例35:使用Cas9切口酶和两种指导RNA最小化脱靶切割

  Cas9是一种可以在20bp RNA指导的帮助下靶向基因组中的特定位置的RNA-指导的DNA核酸酶。然而,该指导序列可以容忍指导序列与DNA-靶序列之间的一些错配。当该指导RNA将Cas9靶向具有几个与该指导序列不同的碱基的脱靶序列时,归因于脱靶切割的可能性,该灵活性是不令人希望的。对于所有实验应用(基因靶向、作物工程、治疗应用等),重要的是能够改进Cas9介导的基因靶向的特异性并减少Cas9的脱靶修饰的可能性。

  申请人研发了一种使用与两种指导RNA组合的Cas9切口酶突变体以促进基因组中的靶向的双链断裂而无脱靶修饰的方法。可以通过使其切割活性无效而从Cas9核酸酶产生Cas9切口酶突变体,这样使得并非切割DNA双链体的两条链,仅仅切割一条链。可以通过在Cas9核酸酶的一个或多个结构域(例如Ruvc1或HNH)中诱导突变而产生Cas9切口酶。这些突变可以包括但不限于Cas9催化结构域中的突变,例如在SpCas9中,这些突变可以在位置D10或H840处。这些突变可以包括但不限于SpCas9中的D10A、E762A、H840A、N854A、N863A或D986A,但是可以通过在其他CRISPR酶或Cas9直向同源物中在对应的位置处诱导突变而产生切口酶。在本发明的一个最优选的实施例中,该Cas9切口酶突变体是一种具有D10A突变的SpCas9切口酶。

  这工作的方式是与Cas9切口酶组合的每个指导RNA都将诱导双螺旋DNA靶标的靶向的单链断裂。由于每个指导RNA切口一条链,所以最终结果是双链断裂。此方法消除脱靶突变的原因是因为非常不可能存在与两种指导序列都具有较高水平的相似性的脱靶位点(20bp+2bp(PAM)=22bp针对每个指导的特异性,并且两种指导意味着任何脱靶位点将不得不具有接近于44bp的同源序列)。尽管仍可能的是单独的指导可能具有脱靶,但是那些脱靶将仅仅是带切口的,这不可能会被诱变的NHEJ过程修复。因此,DNA双链切口的多元化提供了一种强有力的引入靶向的DNA双链断裂而无脱靶诱变效应的方式。

  申请人进行了以下实验,这些实验涉及用编码Cas9(D10A)切口酶的质粒以及一种或多种指导物的DNA表达盒共转染HEK293FT细胞。申请人使用Lipofectamine 2000转染了细胞,并且在转染后转染48或72小时收获了细胞。如在此先前所描述的,使用SURVEYOR核酸酶测定检测双切口诱导的NHEJ(图51、52和53)。

  申请人进一步鉴定了涉及当与两种指导RNA结合时通过Cas9切口酶突变体的有效切割的参数,并且这些参数包括但不限于该5’突出端的长度。针对具有至少26个碱基对的5’突出端报道了有效的切割。在本发明的一个优选实施例中,5’突出端是至少30个碱基对并且更优选至少34个碱基对。长达200个碱基对的突出端对于切割而言可以是可接受的,然而少于100个碱基对的5’突出端是优选的并且少于50个碱基对的5’突出端是最优选的(图54和55)。

  实例36:体内SaCas9项目

  这个项目开始是因为在鉴定作为哺乳动物细胞中的功能性基因组工程工具的化脓链球菌(Sp)以及嗜热链球菌(St)CRISPR/Cas系统之后,申请人想进一步探索II型CRISPR/Cas系统的多样性。

  通过定义用于在哺乳动物细胞中应用的新的功能性II型CRISPR/Cas系统,申请人将潜在地能够发现:

  (1)具有更高效率和/或特异性的CRISPR/Cas系统

  (2)具有允许靶向更宽范围的基因组座位的不同原型间隔子邻近基序(PAM)的CRISPR/Cas系统

  (3)具有更小尺寸的CRISPR/Cas系统,这样申请人可在一种单载体中用具有包装尺寸限制(当前Sp或St系统超过这个4.7kb的限制)和其他希望的性状的哺乳动物病毒递送系统如腺病毒伴随病毒(AAV)载体对它们进行体内递送。

  用于体内应用的Sa CRISPR/Cas系统的鉴定和设计。申请人在金黄色葡萄球菌(Sa)中测试了一种新的II型CRISPR/Cas系统,其在体外在dsDNA切割测定中起作用,并且鉴定NNGRRT的假定PAM。此系统的组分是来自Sa的一种Cas9蛋白,具有来自Sa的同向重复(DR)的一种指导CRISPR RNA,其将形成具有来自Sa的tracrRNA的一种功能性指导RNA复合体。这种三组分系统类似于所有其他II型CRISPR/Cas系统。因此,申请人设计一种两组分系统,其中申请人通过一种短茎环融合该Sa tracrRNA至该Sa指导CRISPR RNA中以形成一种嵌合指导RNA,如申请人采用化脓链球菌(Sp)CRISPR/Cas系统时精确。此嵌合指导RNA能够支持对dsDNA的体外切割。因此,申请人决定将完整的两组分系统:cas9以及该嵌合的指导RNA,克隆至一个AAV载体中以测试其在生物机体中的功能性。

  申请人选择该AAV系统是因为它是一种非整合、基于ssDNA的、非免疫原哺乳动物病毒,其在不同组织/器官中依赖于血清型具有广谱取向,已显示对于体内应用是安全的,并且也支持生物机体中转基因的长期表达。

  初始AAV载体的设计具有(1)驱动具有单个NLS以及HA表位标签的SaCas9蛋白的CMV启动子。(2)驱动该嵌合RNA的人U6启动子(参见附图)。这些被放置在来自进行了最好研究的AAV血清型2的两个反向末端重复(ITR)之间,这些反向末端重复充当病毒包装信号。

  在内源哺乳动物基因组上的PAM序列测试如下:SaCas9靶间隔子是横跨多个基因选择的以覆盖不同的潜在PAM序列。不同间隔子被克隆至U6-sgRNA(单个-指导RNA)表达dsDNA盒中,将U6-sgRNA表达dsDNA盒共转染至哺乳动物细胞系中(针对人靶标是293FT,针对小鼠靶标是N2a和Hepa)。转染后72小时,将所有基因组DNA进行提取并且经受surveyor核酸酶测定。在TBE Page凝胶上跑胶以检测基因组切割。定量基因组DNA切割效率并且绘图。

  所有测试靶标的基因组切割效率以及其他统计学的汇总

  所有测试靶标的基因组切割效率以及其他统计学的汇总(整理好的)

  来自该PAM测试的结果示于图56-62中。在100个靶标上进行的全面测试鉴定了针对SaCas9的PAM可以描述为NNGRR(而不是前文指出的NNGRRT)。

  PAM测试汇总:(1)NNGRR,用于通用的SaCas9的PAM-有助于设计新的靶标,(2)用新的靶标测试双切口酶,(3)NNGRG可能是更有力的PAM?

  用于证明该CRISPR/Cas系统的体内应用和治疗潜力的靶标。

  小鼠Pcsk9基因。此基因在调节脂类代谢中是关键基因,Pcsk9蛋白在胆固醇平衡中发挥主要调节作用。在自然情况下通过人类SNP敲低或破坏此基因或在动物模型中敲低或破坏此基因都导致LDL-受体水平和血液胆固醇水平减少。阻断PCSK9的药物可以降低胆固醇,所以已经显示Pcsk9可作为高胆固醇血症等的有力药物靶标。

  小鼠Hmgcr基因。此基因是脂类代谢中的另一关键基因,Hmgcr蛋白产物是甲羟戊酸途径的控速酶,甲羟戊酸途径是产生胆固醇及其他类异戊二烯的代谢途径。已经显示敲低或破坏此基因可减少血液胆固醇水平等。

  人类SERPINA1(人类AAT)基因。SERPINA1基因编码称为α-1抗胰蛋白酶(A1AT)的蛋白质。它是属于丝氨酸蛋白酶抑制剂超家族的蛋白酶抑制剂。它保护组织免受炎症细胞的酶影响。在由于遗传缺陷(此基因中的突变)它不存在时,不能抑制来自炎症细胞的酶导致肺部的弹性,从而在成人中导致呼吸并发症,如肺气肿或COPD(慢性阻塞性肺病)并且在成人或儿童中导致硬化。这是一种在人类中称作AAT缺乏的疾病。引起此疾病的最常见突变之一是PiZ等位基因、或Z等位基因。此突变是在人类AAT基因(SPERINA1)的位置342处的谷氨酸至赖氨酸的突变,并且在此情况下申请人的靶标精确地靶向人类基因组中的此基因组座位。申请人还设计了用于校正此突变的同源重组(HR)模板,这样使得当在体内共递送呈AAV形式的Sa CRISPR/Cas系统和HR模板时,申请人可以校正肝脏中的此突变,以治疗此疾病。

  AAV病毒设计的CMV版本的测试:申请人测试了用载体的CMV启动子版本包装AAV病毒。目标是证明Sa CRISPR/Cas系统在体内的递送,并且然后测试带有其指导嵌合RNA的表达的SaCas9能否支持体内基因组工程化(内源基因组座位的切割)。

  申请人选择使用肝脏作为我们的靶器官,并且使用尾静脉注射程序将AAV递送到生物体(小鼠)中。正如以前的论文显示的(参见参考文献),AAV8是支持经由尾静脉注射而高效转导肝细胞并且还支持转导后转基因的长期表达的AAV血清型。

  因为基于肝素柱的纯化产生最快的周转时间和高度纯化的病毒,申请人决定尝试使用肝素柱纯化申请人的AAV8病毒。然而,由于AAV2在结合到肝素柱上具有最佳效率,将其他AAV血清型与AAV2混合,以产生在病毒粒子中带有AAV2和AAV8衣壳蛋白两者的‘镶嵌病毒(mosaic virus)’,从而允许经由肝素柱进行纯化。然而,申请人测试了AAV2-AAV8镶嵌病毒的组合,但是它较弱地结合到肝素柱上。因此,申请人决定使用基于氯仿-PEG的纯化方法来纯化纯的AAV8病毒以用于申请人的应用。

  申请人从所有四种构建体中纯化了AAV2/8(用AAV2包装信号ITR包装的血清型AAV8病毒):

  靶向小鼠Pcsk9基因编码区的CMV-SaCas9-U6-嵌合的-指导-RNA。靶向Pcsk9的第一外显子内的起始密码子,所以申请人可以破坏此基因。

  靶向小鼠Hmgcr基因编码区的CMV-SaCas9-U6-嵌合的-指导-RNA。靶向Hmgcr的第一外显子内的起始密码子,所以申请人可以破坏此基因。靶向最后一个外显子内的处于基因末尾的关键磷酸化位点(在人类中是丝氨酸872)处的新位点,所以申请人可以功能性地破坏Hmgcr基因产物活性的调节。

  靶向人类SERPINA1(人类AAT)基因编码区的CMV-SaCas9-U6-嵌合的-指导-RNA。靶向Z等位基因位点,即在人类AAT基因(SPERINA1)的位置342处的谷氨酸至赖氨酸的突变。

  CMV-GFP病毒作为对照病毒并且还作为报告病毒。这是带有驱动GFP报告基因的表达的CMV启动子的病毒。所以绿色荧光可以作为肝脏细胞转导效率的指示物并且还作为用于监测转基因的表达水平和持续时间的标记。申请人希望使用这来验证申请人正在使用的AAV2/8系统。

  程序:申请人克隆、扩增和纯化如上所列出的病毒载体。申请人首先在培养的小鼠肝细胞或人类293FT细胞中针对靶基因组座位的切割效率验证了所有靶标。申请人挑选了最佳靶标,经由尾静脉注射AAV2/8病毒粒子,每只动物总计1E11病毒粒子左右。然后申请人:(1)在不同时间点处死动物,以获得供使用荧光显微镜和免疫组织化学检查表达用的肝脏组织,并且还使用surveyor核酸酶测定和基因组测序验证了基因组工程化(基因组编辑)。(2)随时间从动物中取血样,以检查表型改变。(3)申请人还使用来自(1)和(2)的材料用qPCR、ELISA或western印迹检测靶基因表达的破坏,或检测脂类水平变化(对于Pcsk9和Hmgcr而言是血液胆固醇水平)、血清酶水平或其他表型改变。

  结果:来自经由surveyor测定进行的所有靶标的体外筛选和基因组切割验证的Surveyor结果。来自注射有AAV2/8SaCas9(靶向Pcsk9)病毒的小鼠的肝脏组织的切割效率的时间历程分析。用AAV2/8CMV-GFP进行的肝脏细胞转导与转基因(GFP)表达:来自肝脏切片的图像,用AAV2/8SaCas9病毒进行的肝脏细胞转导与转基因(SaCas9)表达:来自肝脏切片的图像。从注射有AAV2/8SaCas9(靶向Pcsk9)病毒的小鼠的肝脏组织提取的gDNA的Surveyor结果。

  病毒,动物和注射参数:

  AAV2/8-CMV-SaCas9-Pcsk9-靶标1

  AAV2/8-CMV-EGFP-WPRE

  小鼠-8周,C57BL/6

  尾静脉注射

  注射体积:100ul的1.0E12(vp/ml)储备溶液

  递送的病毒粒子:1.0E11总vp/小鼠

  动物处理和数据收集

  第一时间点1周。然后2、3、4周。总计4个时间点。

  向注射AAV-SaCas9-Pcsk9&AAV-EGFP的小鼠灌注盐水。

  从右心房收集血液,约100ul。

  急性解剖肝脏组织,切成较小的块,放进-80℃存储室用于Surveyor&蛋白质分析(X12管)以及用于qPCR(RNA稍后,X4管)。

  使用凯杰DNA提取和QuickExtract进行处理。

  使用西格玛和凯杰RNA提取试剂盒进行RNA分析。

  使用细胞信号传导Ripa缓冲液进行蛋白质提取。

  经由尾静脉注射AAV2/8病毒递送的SaCas9对肝脏组织的切割的时间历程测定

  重新设计具有肝脏特异性TBG启动子系统的AAV载体。因为来自SaCas9病毒(AAV2/8)的CMV版本的基因组切割效率不是很高,并且GFP对照报告病毒也显示这可能是由于CMV版本病毒不支持Sa CRISPR/Cas系统的强烈和长期表达。在调查参考文献之后,我发现了TBG启动子(甲状腺素结合球蛋白),一种用于以高水平在肝脏中特异性表达蛋白质的很强的启动子。将获得自addgene的TBG启动子克隆到申请人自己的AAV载体中之后,制成了新批次的AAV2/8病毒的TBG版本。该新TBG版本病毒包括与CMV版本相同的靶标组(Pcsk9、Hmgcr、人类AAT、GFP),并且另外包括作为阴性对照的Rosa26靶标(Rosa26是人类基因组中的安全港(safe-harbor)基因组座位)。

  用于治疗性校正人类α-1抗胰蛋白酶缺乏(AAT)的新人类SERPINA1靶标。人类AAT综合征是由引起人类SERPINA1基因中的氨基酸变化Glu342Lys的单碱基G-至-A突变导致的严重障碍(游佐(Yusa)等人《自然》(Nature)2011)。申请人使用CRISPR/Cas靶向此基因并且用AAV2/8在体内递送到肝脏(在人类中此疾病的相关器官)组织中,以便实现针对此障碍的基因疗法。图65中的测试是在递送靶向人类SERPINA1基因座位的SaCas9和U6-sgRNA盒后在人类293FT细胞中筛选功能性CRISPR/Cas靶标,随后进行surveyor测定。方案:将靶向人类SERPINA1基因的表达sgRNA的dsDNA与SaCas9质粒共转染进人类HEK 293FT细胞系中。孵育72小时之后进行测定。扩增基因组DNA然后使其经受surveyor核酸酶测定。图65中的图像显示了总共24种不同间隔子设计中的12种的凝胶分析,DNA梯在左边。

  对于申请人的治疗设计,为了实现高效校正,申请人追踪列于右侧的与人类AAT突变(Z等位基因,GAG-AAG/Glu-Arg突变)最密切的靶标,其中间隔子靶标15号是最密切的且效率最高。

  申请人策略是共递送靶向此位点的CRISPR/Cas系统与带有SERPINA1基因组区域的野生型拷贝(未突变的)的校正载体。

  靶向磷酸化丝氨酸残基(控制Hmgcr的活性以调节胆固醇合成和最后一个外显子)的小鼠Hmgcr新靶标。将表达sgRNA的dsDNA与SaCas9质粒共转染进小鼠肝细胞细胞系中。孵育72小时之后进行测定。扩增基因组DNA然后使其经受surveyor核酸酶测定。左上侧图像显示了12个样品的凝胶分析,对于6种间隔子设计中的每者,彼此挨着放置两个重复(参见图66)。DNA梯在左边。

  经由具有TBG的AAV2/8版本构建体体内递送SaCas9以用于体内基因组工程化。

  病毒,动物和注射参数:AAV2/8-TBG-EGFP-WPRE

  AAV2/8-CMV-EGFP-WPRE

  小鼠-8周,C57BL/6

  尾静脉注射

  注射体积:100ul的1.0E12(vp/ml)储备溶液

  递送的病毒粒子:1.0E11总vp/小鼠。

  图67显示了来自注射有EGFP的TBG版本与CMV版本的小鼠的急性解剖的肝脏组织(注射后6天,GFP通道图像,10X)。

  CMV对TBG启动子,用于与AAV2/8一起体内递送进小鼠肝脏中。相比于CMV,TBG在相同时间点具有强得多的表达和转导效率。

  载脂蛋白B(ApoB)是乳糜微粒和低密度脂蛋白(LDL)的主要载脂蛋白,它负责将胆固醇带给组织。ApoB的破坏使得胆固醇的水平降低,潜在地使得心脏状况更健康。

  实例37:经由Cas9进行的体细胞组织的高效体内基因组编辑

  来自微生物CRISPR系统的RNA-指导的内切核酸酶Cas9已经作为真核细胞的通用基因组编辑平台而出现。然而,将Cas9在体内应用于哺乳动物体细胞组织中在很大程度上仍具挑战性,这是由于化脓链球菌Cas9(SpCas9)的基因递送方面的困难,该化脓链球菌Cas9是最常用的Cas9,其大分子量阻碍包装进病毒载体中。申请人已经鉴定了六种小Cas9直向同源物及其相应的原型间隔子邻近基序(PAM),将其针对哺乳动物基因组编辑进行优化。具体地说,申请人已经显示来自金黄色葡萄球菌的Cas9(SaCas9)(它比SpCas9小23%)能以与SpCas9同等的水平高效地编辑哺乳动物基因组,并且可以与其单一指导RNA(sgRNA)一起被包装进作为递送到成年小鼠中的单一载体的腺相关病毒(AAV)中。申请人证明靶向小鼠肝脏并且在注射3周内在体内观察到30%基因修饰。证明AAV介导的Cas9递送到出生后动物中进一步扩展了该系统用于探询基础生物学、为人类疾病建模以及推进治疗开发的潜力。

  CRISPR(规律间隔成簇短回文重复)-Cas系统是来自细菌和古生菌的RNA-指导的内切核酸酶系统,它提供针对外源核酸的获得性免疫。在三个CRISPR-Cas类别中,作为基因组工程化平台,II型系统迄今已经吸引了最多的兴趣,因为它相对简单且被良好表征的机制-单一核酸内切酶(Cas9)和两个小RNA,即包含靶向DNA的指导序列(间隔子)的CRISPR RNA(crRNA)和辅助反向激活crRNA(tracrRNA),介导靶DNA(原型间隔子)的切割;此双RNA复合体已经被进一步工程化为嵌合的单一指导RNA(sgRNA)。对Cas9活性而言关键的附加要求是在靶DNA中存在原型间隔子邻近基序(PAM),它在CRISPR-Cas系统之间是不同的。

  利用Cas9在体细胞组织中在体内广泛应用的能力,同时免去了对胚胎操纵的需要,将证明非常有用于加速基础研究和允许临床应用。一个主要挑战是将Cas9基因组编辑系统递送到动物中。腺相关病毒(AAV)载体对于体内高效基因递送而言是有吸引力的候选物,因为它们的免疫原性潜力较低,来自宿主-基因组整合的致癌风险减少并且血清型特异性被良好表征。然而,用于最佳转基因递送的受限负荷物尺寸(约4.5kb)使得难以包装SpCas9(约4.2kb)和适当的控制元件(启动子、polyA信号)。虽然若干较小的Cas9直向同源物已经用于哺乳动物基因组编辑,但是它们在靶向序列的可用性方面仍是相对受限的,这是由于对更长和更具特异性的PAM的需要,并且在切割效率方面不能与SpCas9匹敌。这突出了进一步探索用于另外适合的Cas9的II型CRISPR系统的生态多样性的可能和需求。

  为了鉴定一组不同的小Cas9蛋白,申请人从来自GenBank的800多个已知Cas9中选择了六种代表性Cas9直向同源物并且针对哺乳动物表达对其序列进行了优化(图70a)。这些Cas9属于IIA和IIC型亚家族。使用在CRISPR阵列内发现的特征性同向重复基序,申请人针对潜在的tracrRNA搜索了侧翼于CRISPR座位的2-kb窗口,这些潜在的tracrRNA与这些重复包含强的序列同源性,包含至少两个另外的预测茎环和150-nt内的不依赖Rho的转录终止信号。从这些潜在的tracrRNA,申请人针对每种直向同源物构建了sgRNA支架(图70和表S1)。由于tracrRNA的全长3’端改进细胞中的sgRNA丰度并且介导与Cas931的相互作用,申请人包括了每种直向同源物的全长tracrRNA 3’端。申请人然后切割了包含固定序列靶标的质粒文库,随后在体外细胞裂解物测定中切割作为PAM的随机化7-mer(5’-NNNNNNN),并且通过对被成功切割的靶标测序来鉴定假定PAM(图70b,c)。申请人观察到类似于SpCas9,这些Cas9直向同源物在PAM的上游3bp处切割靶标(图74)。为了验证来自该文库的共有PAM,申请人随后在生物化学裂解物反应中切割了带有假定PAM的DNA模板,并且显示这些sgRNA设计与这些Cas9直向同源物组合的确可以靶向带有适当的共有PAM的位点,尽管效率不同(图70d和表S2)。

  已经使用细胞裂解物验证了这些Cas9直向同源物的活性,申请人力图测试它们在哺乳动物细胞中诱导双链断裂的能力。申请人在人类胚肾(HEK 293FT)细胞中共转染了靶向具有适当PAM的内源人类基因组座位的Cas9直向同源物及其对应的sgRNA。然而,在测试的六种Cas9直向同源物之中,通过SURVEYOR测定只有来自金黄色葡萄球菌的Cas9(称为SaCas9)可再现地产生了indel(图75和表S3)。因此,申请人聚焦于优化SaCas9和sgRNA以应用于体内哺乳动物基因组编辑。

  尽管许多II型CRISPR系统享有具有约36-bp同向重复和约30-bp间隔子的共同特征,但是先前研究已经报道了在不同系统之中成熟crRNA中的间隔子以及同向重复序列的长度不同。申请人因此力图测试SaCas9sgRNA的这两个参数的最佳长度(图71a)。申请人发现,虽然SaCas9耐受一系列间隔子或指导物长度,但是当它是18-nt或之下时,切割效率出现显著下降(图71b),与可以使用较短的sgRNA长度的SpCas9形成对比。类似地,耐受一系列的同向重复:tracrRNA抗重复双链体长度(图71c)。基于这些结果,申请人选择较短的20-nt指导物,14-bp重复:抗重复双链体sgRNA构造用于下游应用。

  由于在细胞裂解物与可以影响DNA切割效率的内源哺乳动物核环境之间可能存在潜在差异,申请人想要验证体外5’-NNGRR(T)共有PAM是否控制哺乳动物细胞中的SaCas9切割。从基于116个不同基因组靶位点的内源基因组切割的SURVEYOR分析,申请人确定SaCas9可以高效地切割具有5'-NNGRR PAM的基因组靶标而对第六个位置中的T没有要求(图71d,表S4)。平均而言,5'-GRR基序每7.6-bp便出现在人类基因组中,从而允许SaCas9具有各式各样的可供使用的靶标(图76)。

  在用于哺乳动物基因组编辑的Cas9直向同源物中,SpCas9在靶向特异性方面仍是最佳表征的,跨多种细胞类型和物种其编辑效率始终如一地高。对于小鼠肝癌(Hepa1-6)细胞中的三种靶标,SaCas9的编辑效率与SpCas9的编辑效率表现相当(图71e)。此外,申请人针对靶向带有重叠5’-NGGRR PAM的共同座位的SaCas9和SpCas9两者测定了高度相似基因组序列处的基因组脱靶indel突变。在与预期靶标具有序列相似性的31个基因组广度的座位处,SaCas9以与SpCas9相当的活性切割脱靶位点(图71f,表S5)。

  已经针对哺乳动物细胞中的SaCas9建立并验证了最佳sgRNA构造,申请人力图将SaCas9掺入AAV载体中用于体内使用。在AAV中,小尺寸的SaCas9(3.2kb)在共表达SaCas9和U6-驱动的sgRNA的双盒设计中为长达600-bp的启动子留有足够空间(图72a)。应用Cas9蛋白修饰体细胞组织或成年动物中的内源座位的能力使得可以在相关组织类型中快速测试基因功能并且进行治疗应用于基因校正。在可被AAV靶向的器官之中,对于证明CRISPR-Cas介导的体内基因组工程化的可行性和治疗潜力而言,肝脏特别具有吸引力,因为它可通过血管内递送达到并且它在许多对人类疾病而言重要的代谢途径中具有核心作用。申请人选择靶向编码前蛋白转化酶枯草杆菌蛋白酶/科信类型9(Pcsk9)的小鼠座位,Pcsk9是一种主要表达于肝脏中并且牵涉在胆固醇平衡中的酶,它的减少已经在降低心血管疾病的风险中显示出希望。可设想的是,可以通过在本文中披露的方法靶向表达于肝脏中的其他基因(包括但不限于例如ApoB;血管生成素;HMGCR等)。

  使用AAV2/8(一种高效嗜肝AAV血清型),申请人使用单一载体设计经由尾静脉注射递送了8×1010个病毒粒子,该单一载体设计包含巨细胞病毒(CMV)启动子驱动的SaCas9和靶向Pcsk9的U6启动子驱动的sgRNA(图72a,b)。indel形成百分比从第1周的大约5%增加至第11周的28%,从而证明了SaCas9和单一载体设计的体内编辑能力(图72c)。为了进一步提高基因组修饰效率,申请人在Hepa1-6细胞中筛选了靶向Pcsk9的另外的指导物(图77),并且使用肝脏特异性甲状腺素结合球蛋白(TBG)启动子提供更大的肝细胞特异性和表达。血管内递送2×1011个病毒粒子之后,申请人观察到肝脏中的indel形成从注射后1周的11%变至3周时的大约30%(图72c-e)。跨来自肝脏内的多个位置的样品,Pcsk9基因修饰水平保持一致,表明递送遍及靶器官是均匀的(图72d)。所有小鼠都从AAV注射中活下来并且在实验的整个持续时间都没有展现出任何身体不适迹象。

  来自金黄色葡萄球菌的新颖Cas9直向同源物的小尺寸和效率为快速且通用的体内编辑做好了准备,同时通过启动子和血清型选择保持了靶标特异性。此外,这里描述的PAM鉴定方法为在所有II型CRISPR系统中鉴定PAM呈现了可推广的途径。虽然某些Cas9直向同源物比其他直向同源物更快地适应哺乳动物基因组编辑,但是SaCas9在细胞中以类似于SpCas9的稳固效率切割内源靶标并且另外展现出相似程度的特异性。然而,需要另外的研究来完全表征SaCas9的特异性以及延长的Cas9体内表达的影响。

  虽然Cas9系统的AAV-递送是迈向基因疗法应用的有希望的一步,但是更直接的影响在于对普通生物学和在细胞系和转基因模型之上的动物中的疾病两者的遗传贡献的高效探询。此类体细胞的或出生后的基因操纵允许无先例地在空间和时间上控制可以是发育上重要的或被条件性表达系统不当地控制的靶基因修饰,以及模拟可以对某些致病过程的自然进程更好地建模的基因突变的逐步积累的能力。最后,病毒载体介导的基因修饰允许以与转基因动物产生相比显著更高的通量研究疾病的遗传变体,特别是在具有漫长的妊娠期和发育期的生物中。通过AAV递送这里描述的金黄色葡萄球菌Cas9使得可能的体内机遇代表了另一件不断扩大的希望允许跨基础科学、医学和生物技术应用迅猛发展的Cas9基因组工程化工具箱。

  方法汇总

  将人类胚肾(HEK 293FT)和小鼠肝脏肝癌(Hepa1-6)细胞系维持在37℃和5%CO2气氛下,并且使用Lipofectamine 2000每120,000个细胞用总共500ng DNA转染。经由尾静脉向8-10周龄的C57BL/6小鼠注射稀释于无菌磷酸盐缓冲血清(pH 7.4)中的AAV。在下文提供了SURVEYOR和体外切割测定、计算方法、细胞培养条件、AAV产生和注射的延伸描述。

  细胞培养和转染。

  在37℃下,伴随5%CO2孵育,将人类胚肾(HEK)293FT(生命技术公司)和Hepa1-6(ATCC)细胞系维持在补充有10%FBS(海可隆公司)、2mM GlutaMAX(生命技术公司)、100U/ml青霉素及100μg/ml链霉素的杜尔贝科改良伊格尔培养基(DMEM)中。

  在转染前一天将细胞以240,000个细胞/孔的密度接种进24孔平板(康宁公司)中,并且根据制造商推荐的方案使用Lipofectamine 2000(生命技术公司)在70%-80%汇合率时转染。对于24孔平板的每个孔,使用总共500ngDNA。

  用于基因组修饰的SURVEYOR核酸酶测定。

  在使用QuickExtract DNA提取溶液(Epicentre)提取基因组DNA之前,将转染的细胞在37℃下孵育72h。将沉淀的细胞重悬于QuickExtract溶液中并在65℃下孵育15min,在68℃下孵育15min,并且在98℃下孵育10min。使用Dounce均质机(西格玛公司)和100ul DPBS(gibco)从组织切片中提取基因组肝脏DNA。将10ul的匀化肝脏提取物添加到90ul QuickExtract DNA提取溶液(Epicentre)中并如上孵育。

  对于每个基因而言,将在CRISPR靶位点侧翼的基因组区域进行PCR扩增(互补序列),并且遵循制造商的方案,使用QiaQuick Spin柱(凯杰公司)纯化产物。将总共200ng的纯化的PCR产物与1μl 10×Taq DNA聚合酶PCR缓冲液(Enzymatics公司)混合,至终体积为10μl,并使其经受重退火过程,以使得可以形成异源双链体:95℃持续10min,以-0.5℃/s从95℃降至4℃。重退火后,遵循制造商推荐的方案,将产物用SURVEYOR核酸酶和SURVEYOR增强子S(转基因组学公司)处理,并且在4%-20%Novex TBE聚丙烯酰胺凝胶(生命技术公司)上进行分析。将凝胶用SYBR Gold DNA染色剂(生命技术公司)染色30min并用Gel Doc凝胶成像系统(伯乐公司)成像。基于相对条带强度进行量化。通过式100×(1-(1-(b+c)/(a+b+c))1/2)确定Indel百分比,其中a是未消化的PCR产物的积分强度,并且b和c是每个切割产物的积分强度。

  体外转录以及切割测定

  Cas9直向同源物是人类密码子优化的并且通过GenScript合成,并且如上所述地转染到293FT细胞中。用补充有蛋白酶抑制剂混合液(罗氏公司(Roche))的裂解缓冲液(20mM HEPES、100mM KCl、5mM MgCl2、1mM DTT、5%甘油、0.1%Triton X-100)从293FT细胞制备全细胞裂解物。遵循制造商推荐的方案,使用自定义寡聚物(互补序列)以及HiScribe T7体外转录试剂盒(NEB)在体外转录T7驱动的sgRNA。如下进行体外切割测定:对于20μl切割反应,将10μl的细胞裂解物与2μl切割缓冲液(100mM HEPES、500mM KCl、25mM MgCl2、5mM DTT、25%甘油)、1μg体外转录的RNA以及200ng EcoRI线性化的pUC19质粒DNA或来自包含靶序列的哺乳动物基因组DNA的200ng纯化的PCR扩增子一起孵育。孵育30m后,使用QiaQuick Spin柱纯化切割反应并且用终浓度为80ng/ul的RNA酶A处理30min并且在1%琼脂糖E-凝胶(英杰公司)上进行分析。

  体外PAM筛选

  使用ARNold终止子搜索工具1,2预测不依赖Rho的转录终止。对于PAM文库,将简并7-bp序列克隆到pUC19载体中。对于每种直向同源物,如上用1μg T7转录的sgRNA和400ng具有简并PAM的pUC19进行体外切割测定。通过NheI将切割的质粒线性化,凝胶提取,并且与亿明达专用测序适配子连接。将带条形码并纯化的DNA文库通过Quant-iT PicoGreen dsDNA测定试剂盒或Qubit 2.0荧光计(生命技术公司)定量并且以等摩尔比率聚池化以用于使用亿明达MiSeq个人测序仪(生命技术公司)的测序。

  计算分析

  将MiSeq读数(read)通过要求至少23的平均Phred质量(Q得分)连同与条形码匹配的完美序列过滤。针对对应于每种直向同源物的读数,提取简并区。然后将所有提取的区分组并且用Weblogo3进行分析。对于全基因组脱靶分析,通过深度测序确定indel频率并且如先前描述的4分析。

  AAV产生&递送

  病毒产生和滴定

  对于病毒产生,如制造商所推荐的,将293FT细胞(生命技术公司)维持在无抗生素培养基(DMEM,高葡萄糖与GlutaMax和丙酮酸钠,补充有10%FBS和终浓度为10mM的HEPES)中。对于每种载体,使细胞在至少十个15cm组织培养皿中生长并且在37℃和5%CO2下孵育,直到它们的汇合率达到70%-80%左右。对于病毒产生质粒的转染,将PEI“Max”(波利塞斯公司(Polysciences))以1mg/mL溶解于水中并且将溶液的pH调节至7.1。

  对于转染,将8ug的pAAV8血清型包装质粒、10ug的pDF6辅助质粒和6ug的携带感兴趣构建体的pAAV质粒添加至1mL无血清DMEM中。然后将125uL的PEI“Max”溶液添加至混合物中。将所得最终转染混合物短暂涡旋并且在室温下孵育5至10秒。孵育之后,将混合物添加至20mL的维持培养基中,充分混合,并且施加至每个培养皿中以替换旧的生长培养基。在转染后48h与72h之间收获细胞。将细胞从培养皿上刮下并且通过离心沉淀。然后根据先前公开的方案从沉淀物中纯化AAV8病毒粒子。

  还通过宾夕法尼亚大学(University of Pennsylvania)和波士顿儿童医院(Children's Hospital Boston)的载体核心设施产生病毒,并且使用针对SaCas9转基因的定制TaqMan探针通过qPCR滴定,以匹配内部生产。

  动物注射和处理

  遵循IPB批准的方案,将所有小鼠维持在动物设施中。经由尾静脉注射向8-10周龄的C57/BL6小鼠递送AAV。将AAV的所有剂量用无菌磷酸盐缓冲血清(pH 7.4)(Gibco)调节至100uL或200uL。

  注射后在描述的时间点收获组织。使用氯胺酮/甲苯噻嗪麻醉小鼠并且使其经受用30ml PBS进行的穿心灌注。移出肝脏的中叶并在4%多聚甲醛中固定用于组织学分析,同时将剩下的肝叶切成尺寸小于1x1x3mm3的小块并且冷冻在-80℃下用于随后的基因组DNA提取,或浸于RNALater(安比昂(Ambion))中用于RNA提取。

  使用已知方法针对Cas9直向同源物中的每者进行特异性、毒性、表型和耐受性的体内动物研究(例如,小鼠)。

  表S1:Cas9直向同源物和预测的RNA组分的清单

  表S2:用于在体外裂解物反应中验证PAM的靶标

  表S3:用于HEK 293FT细胞中的直向同源物活性测试的靶标

  表S4:用于在哺乳动物细胞系中确定PAM的靶标

  表S5:用于SaCas9和SpCas9特异性研究的基因组广度的脱靶

  互补序列

  斜体:HA标签

  加下划线:NLS序列

  食清洁剂细小棒菌Cas9(SEQ ID NO:___)

  ATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCATGGAGAGGATTTTCGGCTTTGACATCGGCACAACAAGTATCGGATTCAGCGTGATTGATTACAGTAGCACCCAGTCCGCAGGCAACATCCAGAGGCTGGGCGTGCGCATTTTCCCTGAGGCAAGGGACCCAGATGGGACCCCCCTGAACCAGCAGCGGAGACAGAAACGCATGATGAGGCGCCAGCTGCGACGGAGAAGGATTCGCCGAAAGGCACTGAATGAGACACTGCACGAAGCCGGCTTTCTGCCAGCTTACGGGTCTGCAGATTGGCCCGTGGTCATGGCCGACGAGCCTTATGAACTGCGGAGAAGGGGACTGGAGGAAGGCCTGAGTGCTTACGAGTTCGGACGGGCAATCTATCATCTGGCCCAGCACCGGCATTTTAAAGGCAGAGAACTGGAGGAATCCGATACACCCGACCCTGATGTGGACGATGAGAAGGAAGCCGCTAACGAGAGAGCAGCCACTCTGAAGGCCCTGAAAAATGAACAGACCACACTGGGAGCATGGCTGGCCCGCCGACCCCCTTCTGACCGCAAGCGAGGAATCCACGCCCATAGGAACGTGGTCGCTGAGGAGTTCGAGCGCCTGTGGGAAGTGCAGTCCAAGTTTCACCCCGCTCTGAAATCTGAGGAAATGCGGGCAAGAATCAGTGATACAATTTTCGCCCAGAGGCCTGTGTTTTGGCGCAAGAACACTCTGGGAGAGTGCAGATTCATGCCTGGCGAACCACTGTGTCCCAAGGGGTCCTGGCTGTCTCAGCAGCGGAGAATGCTGGAGAAACTGAACAATCTGGCTATCGCAGGCGGGAATGCTAGGCCACTGGATGCAGAGGAACGCGACGCCATTCTGAGTAAGCTGCAGCAGCAGGCCAGCATGTCCTGGCCAGGCGTGCGGTCAGCTCTGAAGGCACTGTACAAACAGAGAGGCGAGCCCGGGGCTGAAAAGAGCCTGAAATTCAACCTGGAGCTGGGAGGCGAATCCAAGCTGCTGGGAAATGCCCTGGAGGCTAAACTGGCAGATATGTTTGGCCCTGACTGGCCAGCTCACCCCCGAAAGCAGGAGATCCGGCACGCAGTGCATGAACGGCTGTGGGCTGCAGATTACGGCGAGACACCCGACAAGAAAAGAGTCATCATTCTGTCCGAGAAGGATCGAAAAGCTCATCGGGAAGCCGCTGCAAACTCTTTCGTGGCAGACTTTGGAATTACTGGCGAGCAGGCAGCTCAGCTGCAGGCCCTGAAGCTGCCAACCGGCTGGGAACCTTATAGCATCCCAGCACTGAACCTGTTCCTGGCCGAGCTGGAAAAGGGGGAGAGGTTTGGAGCCCTGGTGAATGGACCTGATTGGGAAGGCTGGAGGCGCACAAACTTCCCCCACCGCAATCAGCCTACTGGGGAGATCCTGGACAAGCTGCCAAGTCCCGCCTCAAAAGAGGAAAGGGAACGCATTAGCCAGCTGCGCAACCCAACCGTGGTCCGAACACAGAATGAGCTGAGAAAGGTGGTCAACAATCTGATCGGGCTGTATGGAAAACCCGATCGAATCCGGATTGAAGTGGGCCGGGACGTCGGGAAGTCCAAAAGAGAAAGGGAGGAAATCCAGTCCTGGCATTCGACGGAACGAGAAGCAGAGAAAGAAAGCCACTGAAGATCTGATCAAAAACGGAATTGCTAATCCTAGCCGGGACGATGTGGAGAAGTGGATCCTGTGGAAAGAGGGCCAGGAAAGATGCCCATACACCGGCGACCAGATTGGCTTCAATGCCCTGTTTAGAGAAGGCAGATATGAGGTGGAACACATCTGGCCTCGCTCTCGAAGTTTTGATAACAGCCCAAGGAATAAGACACTGTGTCGCAAAGACGTGAACATCGAGAAGGGAAATAGGATGCCTTTCGAGGCATTTGGCCATGACGAAGATCGGTGGAGCGCCATCCAGATTAGACTGCAGGGCATGGTGTCAGCCAAAGGGGGAACTGGGATGAGCCCCGGAAAGGTCAAACGCTTCCTGGCTAAGACCATGCCTGAGGATTTTGCAGCCCGGCAGCTGAACGACACAAGATACGCTGCAAAGCAGATCCTGGCCCAGCTGAAAAGGCTGTGGCCAGACATGGGACCTGAGGCTCCAGTGAAGGTCGAAGCAGTGACTGGACAGGTCACCGCCCAGCTGCGCAAACTGTGGACTCTGAACAATATTCTGGCTGACGATGGGGAGAAAACCAGAGCAGATCACAGGCACCATGCCATCGACGCTCTGACAGTGGCCTGCACTCATCCTGGAATGACCAACAAGCTGAGCAGGTATTGGCAGCTGCGCGACGATCCACGAGCAGAGAAGCCAGCTCTGACTCCACCCTGGGATACCATCCGCGCCGACGCTGAGAAAGCCGTGTCTGAAATTGTGGTCAGTCACCGGGTGAGAAAGAAAGTCAGCGGCCCACTGCATAAGGAGACTACCTACGGCGATACAGGGACTGACATTAAGACCAAATCCGGCACATATAGACAGTTCGTGACCAGGAAGAAAATCGAGTCACTGAGCAAGGGGGAGCTGGATGAAATTCGCGACCCCCGAATCAAAGAAATTGTGGCAGCTCACGTCGCAGGACGAGGAGGCGACCCCAAGAAGGCCTTCCCTCCATACCCCTGTGTGTCTCCCGGAGGCCCTGAGATCCGGAAGGTCAGACTGACCAGTAAACAGCAGCTGAACCTGATGGCCCAGACAGGGAATGGATACGCTGACCTGGGCTCCAACCACCATATCGCAATCTACCGGCTGCCCGATGGGAAGGCCGACTTCGAGATTGTGTCACTGTTTGATGCTAGCAGAAGGCTGGCACAGAGAAATCCAATCGTGCAGAGGACACGAGCAGACGGAGCCAGCTTCGTCATGTCCCTGGCAGCCGGAGAGGCCATCATGATTCCCGAAGGCTCAAAGAAAGGGATCTGGATTGTGCAGGGAGTCTGGGCAAGCGGACAGGTGGTCCTGGAGAGGGACACCGATGCTGACCACTCTACAACTACCCGCCCTATGCCAAACCCCATCCTGAAGGACGATGCCAAGAAAGTGAGTATCGATCCTATTGGCCGAGTCCGGCCATCAAATGAC

  白喉棒状杆菌Cas9(SEQ ID NO:___)

  ATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCATGAAGTACCATGTCGGAATCGATGTCGGAACCTTTTCTGTGGGGCTGGCTGCTATTGAAGTGGATGACGCTGGAATGCCTATTAAGACCCTGAGTCTGGTGTCACACATTCATGACTCAGGACTGGATCCTGACGAGATCAAGAGCGCTGTGACCAGGCTGGCAAGCTCCGGAATCGCCCGGAGAACAAGGCGCCTGTACCGACGGAAGAGAAGGCGCCTGCAGCAGCTGGATAAGTTCATCCAGAGGCAGGGCTGGCCAGTGATCGAGCTGGAAGATTACAGCGACCCCCTGTATCCTTGGAAGGTGCGCGCCGAACTGGCCGCTTCTTATATTGCTGACGAGAAGGAACGGGGGGAGAAACTGAGTGTGGCTCTGAGACACATCGCAAGGCATCGCGGATGGAGGAACCCTTACGCCAAGGTGTCTAGTCTGTATCTGCCAGATGGCCCCTCAGACGCCTTCAAGGCTATTAGGGAGGAAATCAAACGCGCTAGCGGCCAGCCTGTGCCAGAGACTGCAACCGTCGGGCAGATGGTGACCCTGTGCGAACTGGGCACACTGAAGCTGCGAGGAGAGGGAGGAGTGCTGAGTGCACGGCTGCAGCAGTCAGATTACGCCCGCGAGATCCAGGAAATTTGTCGAATGCAGGAGATCGGCCAGGAACTGTATCGCAAGATCATTGACGTGGTGTTCGCAGCCGAGTCCCCAAAGGGCTCTGCCTCAAGCCGGGTGGGGAAAGATCCTCTGCAGCCAGGAAAGAACAGAGCACTGAAAGCCAGCGACGCTTTTCAGCGATACCGGATTGCTGCACTGATCGGCAATCTGAGAGTCAGGGTGGATGGGGAGAAGAGGATTCTGAGCGTGGAGGAGAAGAACCTGGTGTTCGACCACCTGGTGAATCTGACTCCAAAGAAAGAGCCCGAATGGGTGACCATCGCCGAAATTCTGGGCATCGATCGCGGGCAGCTGATCGGAACAGCTACTATGACCGACGATGGAGAGCGAGCAGGAGCCCGACCCCCTACACACGATACTAACAGAAGTATTGTGAACAGCCGGATCGCACCACTGGTCGACTGGTGGAAAACAGCTAGCGCACTGGAGCAGCACGCCATGGTGAAGGCACTGTCCAACGCCGAAGTCGACGATTTTGATTCTCCCGAGGGAGCAAAAGTGCAGGCATTCTTTGCCGATCTGGACGATGACGTCCACGCCAAGCTGGACAGCCTGCATCTGCCTGTGGGACGAGCAGCTTACTCCGAGGACACTCTGGTCAGACTGACCCGACGGATGCTGAGTGATGGGGTGGACCTGTATACCGCCCGGCTGCAGGAGTTCGGAATTGAACCTAGCTGGACCCCACCCACACCAAGAATCGGAGAGCCTGTCGGCAATCCAGCCGTCGACCGGGTGCTGAAAACAGTGAGCAGATGGCTGGAATCCGCAACAAAGACTTGGGGCGCCCCAGAGAGGGTCATCATTGAGCACGTGCGCGAAGGCTTCGTCACTGAGAAACGCGCTCGAGAAATGGATGGGGACATGAGAAGGCGCGCAGCCCGGAACGCCAAGCTGTTTCAGGAGATGCAGGAAAAGCTGAATGTGCAGGGCAAACCCAGTCGAGCCGATCTGTGGAGATACCAGTCAGTGCAGAGACAGAACTGCCAGTGTGCCTATTGCGGGTCCCCAATTACCTTTTCTAATAGTGAAATGGACCACATCGTGCCCAGAGCAGGGCAGGGATCCACCAACACAAGGGAGAATCTGGTCGCCGTGTGCCATCGCTGTAACCAGTCTAAGGGCAATACACCCTTCGCTATTTGGGCAAAAAACACTTCTATCGAAGGGGTCAGTGTGAAGGAGGCCGTGGAACGGACCAGACATTGGGTCACTGATACCGGCATGAGAAGCACTGACTTCAAGAAGTTCACCAAGGCTGTGGTCGAGCGGTTTCAGAGAGCAACAATGGATGAGGAAATCGACGCCAGAAGCATGGAATCCGTCGCCTGGATGGCTAATGAGCTGAGGAGCCGCGTGGCTCAGCACTTCGCATCCCATGGAACCACAGTCAGGGTGTACCGAGGCAGCCTGACAGCAGAGGCTCGACGGGCATCTGGGATCAGTGGAAAGCTGAAATTCTTTGATGGCGTGGGGAAGTCCAGGCTGGATAGAAGGCACCATGCTATTGACGCTGCAGTGATCGCATTCACCTCTGACTATGTGGCCGAAACACTGGCTGTCCGCTCAAACCTGAAACAGAGCCAGGCCCACCGACAGGAGGCTCCTCAGTGGAGAGAGTTCACCGGCAAGGATGCAGAGCATCGAGCAGCTTGGAGAGTGTGGTGCCAGAAGATGGAAAAACTGAGCGCCCTGCTGACCGAGGACCTGCGAGATGACCGGGTGGTCGTGATGTCTAACGTGCGACTGCGGCTGGGAAATGGCAGTGCCCACAAGGAAACCATTGGCAAACTGTCAAAGGTGAAACTGTCCTCTCAGCTGTCAGTCAGCGATATCGACAAAGCAAGTTCAGAGGCCCTGTGGTGTGCTCTGACCAGAGAGCCCGGATTCGATCCTAAGGAAGGCCTGCCCGCTAACCCTGAGAGACACATCAGGGTGAATGGGACACATGTCTACGCCGGGGACAATATTGGACTGTTTCCAGTGTCAGCAGGAAGCATCGCACTGAGGGGAGGATACGCAGAGCTGGGCAGCTCCTTCCACCATGCTCGCGTGTATAAAATTACTTCCGGCAAGAAACCCGCATTTGCCATGCTGAGGGTGTACACCATCGATCTGCTGCCTTATCGCAACCAGGACCTGTTTAGCGTGGAACTGAAGCCACAGACAATGTCCATGAGGCAGGCTGAGAAGAAACTGCGCGACGCTCTGGCAACTGGGAATGCAGAATATCTGGGATGGCTGGTCGTGGATGACGAGCTGGTCGTGGATACATCTAAGATTGCCACTGACCAGGTCAAAGCAGTGGAGGCCGAACTGGGGACTATCCGCCGATGGCGGGTGGATGGATTCTTTTCCCCCTCTAAACTGAGACTGAGGCCTCTGCAGATGTCCAAGGAGGGGATCAAGAAAGAGTCCGCTCCCGAACTGTCTAAAATCATTGACAGACCAGGATGGCTGCCCGCCGTGAACAAGCTGTTCTCTGATGGAAATGTCACCGTCGTGCGGAGAGACTCTCTGGGACGCGTGCGACTGGAGAGTACAGCCCACCTGCCTGTCACTTGGAAGGTGCAG

  巴氏链球菌Cas9(SEQ ID NO:___)

  ATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCATGACTAACGGCAAGATTCTGGGGCTGGACATTGGCATCGCAAGCGTGGGGGTGGGGATTATTGAGGCAAAAACTGGAAAGGTGGTGCATGCCAATTCCCGGCTGTTCTCTGCCGCTAACGCTGAGAACAATGCAGAACGGAGAGGGTTTAGGGGATCTAGGCGCCTGAATCGACGGAAGAAACACCGCGTGAAGCGAGTCCGGGATCTGTTCGAGAAATACGGAATCGTCACCGACTTTCGCAACCTGAATCTGAACCCTTATGAGCTGCGAGTGAAGGGCCTGACCGAACAGCTGAAAAACGAGGAACTGTTCGCAGCCCTGAGAACAATCTCTAAGAGAAGGGGGATTAGTTACCTGGACGATGCCGAGGACGATAGTACCGGATCAACAGACTATGCTAAGAGCATCGATGAGAATCGCCGACTGCTGAAAAACAAGACACCAGGCCAGATTCAGCTGGAGAGGCTGGAAAAGTACGGCCAGCTGCGCGGGAATTTCACCGTCTATGACGAGAACGGGGAAGCCCATCGCCTGATCAATGTGTTTAGTACATCAGATTACGAGAAAGAAGCACGGAAGATCCTGGAGACACAGGCCGACTACAACAAGAAAATCACAGCTGAGTTCATTGACGATTATGTGGAAATCCTGACCCAGAAACGAAAGTACTATCACGGCCCCGGGAACGAAAAGAGCCGGACTGACTACGGACGGTTCCGGACCGATGGGACCACACTGGAGAATATTTTCGGAATCCTGATTGGCAAGTGCAACTTTTACCCTGATGAATATCGAGCAAGCAAGGCCAGCTACACCGCACAGGAGTATAATTTCCTGAACGACCTGAACAATCTGAAGGTGAGCACCGAAACAGGGAAGCTGTCAACAGAGCAGAAAGAAAGCCTGGTGGAGTTTGCCAAGAATACTGCTACCCTGGGACCCGCTAAACTGCTGAAGGAGATCGCAAAAATTCTGGACTGTAAGGTGGATGAGATCAAAGGATACAGAGAGGACGATAAAGGCAAGCCAGATCTGCATACCTTCGAGCCCTATAGGAAACTGAAGTTTAATCTGGAAAGCATCAACATTGACGATCTGTCCCGCGAAGTGATCGACAAGCTGGCTGATATTCTGACTCTGAACACCGAGAGAGAAGGAATCGAGGACGCAATTAAGAGGAATCTGCCAAACCAGTTCACAGAGGAACAGATCAGCGAGATCATCAAGGTGCGGAAGAGCCAGTCCACTGCTTTCAATAAGGGCTGGCACTCTTTTAGTGCAAAACTGATGAACGAGCTGATCCCCGAACTGTACGCCACCTCCGACGAGCAGATGACAATTCTGACTCGGCTGGAAAAATTCAAGGTCAATAAGAAAAGCTCCAAAAACACAAAGACTATCGACGAGAAGGAAGTCACTGATGAGATCTACAATCCTGTGGTCGCCAAGAGCGTGAGACAGACCATCAAAATCATTAACGCTGCAGTCAAGAAATATGGCGACTTCGATAAGATCGTGATTGAAATGCCACGGGATAAAAATGCTGACGATGAGAAGAAGTTCATCGACAAGAGAAATAAGGAGAACAAGAAGGAAAAGGACGATGCCCTGAAAAGGGCCGCTTACCTGTATAATTCTAGTGACAAGCTGCCCGATGAGGTGTTCCACGGCAACAAGCAGCTGGAAACCAAAATCCGACTGTGGTATCAGCAGGGGGAGCGGTGCCTGTATAGTGGAAAGCCCATCTCAATTCAGGAGCTGGTGCATAACTCTAACAATTTCGAAATCGATCACATTCTGCCTCTGTCACTGAGCTTTGACGATAGTCTGGCCAATAAGGTGCTGGTCTACGCTTGGACAAACCAGGAGAAAGGCCAGAAAACCCCTTATCAGGTCATCGACTCCATGGATGCAGCCTGGTCTTTCAGGGAGATGAAGGACTACGTGCTGAAACAGAAGGGACTGGGCAAGAAAAAGCGCGACTATCTGCTGACTACCGAGAACATCGATAAGATTGAAGTGAAGAAGAAGTTCATCGAGAGGAATCTGGTGGATACTCGCTACGCATCTCGAGTGGTCCTGAACTCTCTGCAGAGTGCCCTGAGAGAGCTGGGGAAAGACACTAAGGTGTCTGTGGTCAGGGGACAGTTCACCAGTCAGCTGCGGAGAAAATGGAAGATCGATAAGAGCCGCGAGACATACCACCATCACGCAGTGGACGCCCTGATCATTGCTGCATCAAGCCAGCTGAAACTGTGGGAGAAGCAGGACAATCCCATGTTTGTGGATTATGGCAAGAACCAGGTGGTCGACAAACAGACTGGGGAGATCCTGTCCGTGTCTGACGATGAGTACAAGGAACTGGTGTTCCAGCCCCCTTATCAGGGCTTTGTGAATACCATCTCCTCTAAAGGGTTCGAGGACGAAATTCTGTTTAGCTACCAGGTGGATTCCAAATATAACCGGAAGGTCAGTGACGCAACCATCTACTCAACAAGAAAAGCCAAGATTGGCAAGGATAAGAAAGAGGAAACCTACGTGCTGGGAAAAATCAAGGACATCTACTCCCAGAATGGCTTCGATACCTTCATCAAGAAGTACAACAAAGATAAGACTCAGTTCCTGATGTATCAGAAGGACTCTCTGACATGGGAGAACGTGATCGAAGTCATTCTGAGGGACTACCCAACAACTAAGAAAAGCGAGGACGGCAAAAATGATGTGAAGTGCAACCCCTTTGAGGAATACAGGCGCGAGAATGGGCTGATCTGTAAGTATTCCAAGAAAGGGAAAGGAACTCCCATCAAGAGCCTGAAGTACTATGACAAGAAACTGGGGAACTGCATCGATATTACCCCAGAGGAATCACGCAATAAGGTCATCCTGCAGAGCATTAACCCTTGGCGAGCCGACGTGTACTTCAATCCAGAGACACTGAAGTACGAACTGATGGGCCTGAAATATTCAGATCTGAGCTTTGAAAAGGGCACTGGGAACTACCATATCAGCCAGGAGAAATATGACGCTATCAAAGAGAAGGAAGGAATTGGCAAGAAATCCGAGTTCAAGTTTACACTGTACCGCAACGACCTGATCCTGATCAAGGATATCGCCAGTGGCGAGCAGGAAATCTACAGATTCCTGTCAAGAACTATGCCCAATGTGAACCACTACGTCGAGCTGAAGCCTTACGACAAGGAAAAGTTCGATAACGTGCAGGAGCTGGTCGAAGCACTGGGAGAGGCAGATAAAGTGGGACGATGTATCAAAGGACTGAATAAGCCAAACATCAGCATCTACAAGGTGAGAACCGACGTCCTGGGAAACAAATATTTCGTGAAGAAAAAGGGCGACAAACCCAAGCTGGATTTTAAGAACAACAAGAAG

  灰色奈瑟菌Cas9(SEQ ID NO:___)

  ATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCATGGCTGCCTTCAAACCTAATCCTATGAACTACATCCTGGGCCTGGACATTGGAATCGCTTCTGTCGGGTGGGCTATCGTGGAAATCGACGAGGAAGAGAACCCTATCAGACTGATTGATCTGGGAGTCAGAGTGTTTGAAAGGGCAGAGGTGCCAAAGACCGGCGACTCCCTGGCCGCTGCACGGAGACTGGCTCGGTCTGTCAGGCGCCTGACACGACGGAGAGCACACAGGCTGCTGCGAGCTAGGCGCCTGCTGAAGAGAGAGGGCGTGCTGCAGGCCGCTGACTTCGATGAAAACGGCCTGATCAAGAGCCTGCCCAATACTCCTTGGCAGCTGAGAGCAGCCGCTCTGGACAGGAAGCTGACCCCACTGGAGTGGTCTGCCGTGCTGCTGCACCTGATCAAGCATCGCGGCTACCTGAGTCAGCGAAAAAATGAAGGGGAGACAGCAGATAAGGAGCTGGGAGCACTGCTGAAAGGAGTGGCCGACAACACTCATGCTCTGCAGACCGGCGATTTTAGGACACCCGCTGAGCTGGCACTGAATAAGTTCGAAAAAGAGAGTGGACACATTCGAAACCAGCGGGGCGACTATTCACATACCTTCAACCGCAAGGATCTGCAGGCCGAGCTGAATCTGCTGTTTGAAAAGCAGAAAGAGTTCGGGAATCCCCACGTGTCCGACGGGCTGAAAGAAGGAATCGAGACACTGCTGATGACTCAGAGGCCTGCACTGTCTGGCGATGCCGTGCAGAAGATGCTGGGGCATTGCACCTTTGAACCAACAGAGCCCAAGGCAGCCAAAAACACCTACACAGCCGAGAGGTTCGTGTGGCTGACAAAGCTGAACAATCTGCGCATCCTGGAACAGGGCAGTGAGCGGCCCCTGACTGACACCGAAAGAGCCACACTGATGGATGAGCCTTACAGGAAGTCTAAACTGACTTATGCCCAGGCTCGCAAGCTGCTGGACCTGGACGATACTGCCTTCTTTAAGGGCCTGAGGTACGGGAAAGATAATGCAGAAGCCAGCACCCTGATGGAGATGAAGGCCTATCACGCTATCTCCCGCGCCCTGGAAAAAGAGGGCCTGAAGGACAAGAAATCTCCCCTGAACCTGAGTCCTGAACTGCAGGATGAGATTGGGACCGCTTTTAGCCTGTTCAAGACTGACGAGGATATCACCGGACGCCTGAAAGACCGAGTGCAGCCCGAAATTCTGGAGGCACTGCTGAAGCACATCAGTTTTGATAAATTCGTGCAGATTTCACTGAAGGCCCTGCGACGGATCGTCCCTCTGATGGAGCAGGGCAATCGGTACGACGAGGCCTGCACCGAGATCTACGGAGATCATTATGGCAAGAAAAACACAGAAGAGAAAATCTATCTGCCCCCTATTCCTGCCGACGAGATCCGGAATCCAGTGGTCCTGAGAGCTCTGTCACAGGCAAGAAAAGTGATCAACGGAGTGGTCAGAAGGTACGGCAGCCCTGCTAGGATCCACATTGAAACCGCACGCGAAGTGGGAAAGTCCTTTAAAGACCGCAAGGAAATCGAGAAGCGACAGGAAGAGAATAGAAAAGATAGGGAAAAGTCTGCTGCAAAATTCAGGGAGTACTTTCCAAACTTCGTGGGCGAACCCAAGAGTAAAGACATCCTGAAGCTGCGCCTGTACGAGCAGCAGCACGGGAAGTGTCTGTATAGCGGAAAAGAAATTAACCTGGGCCGGCTGAATGAAAAGGGCTATGTGGAGATCGATCATGCACTGCCCTTTTCCAGAACATGGGACGATTCTTTCAACAATAAGGTCCTGGCTCTGGGGAGCGAGAACCAGAACAAGGGAAATCAGACTCCTTACGAATATTTCAACGGGAAGGACAATAGCCGAGAATGGCAGGAGTTTAAAGCCCGCGTGGAGACAAGCCGGTTCCCACGAAGCAAGAAACAGCGGATTCTGCTGCAGAAGTTTGACGAAGATGGATTCAAAGAGAGAAACCTGAATGACACCCGGTACATCAACAGATTTCTGTGCCAGTTCGTGGCTGATCACATGCTGCTGACCGGAAAGGGCAAACGCCGAGTCTTTGCAAGCAACGGCCAGATCACAAATCTGCTGAGGGGCTTCTGGGGGCTGCGGAAGGTGAGAGCCGAGAATGACCGCCACCATGCACTGGATGCCGTGGTCGTGGCTTGTTCCACTATTGCAATGCAGCAGAAGATCACCAGGTTTGTGCGCTATAAAGAGATGAACGCCTTCGACGGAAAGACAATTGATAAAGAAACTGGCGAGGTGCTGCACCAGAAGGCACATTTTCCTCAGCCATGGGAGTTCTTCGCCCAGGAAGTGATGATCCGGGTCTTTGGGAAGCCTGACGGAAAACCAGAGTTCGAAGAGGCCGATACCCCAGAAAAGCTGCGGACACTGCTGGCTGAAAAACTGAGCTCCAGACCCGAGGCAGTGCACAAGTACGTCACCCCCCTGTTCATTAGCAGGGCCCCTAATCGCAAAATGTCCGGGCAGGGACATATGGAGACTGTGAAATCAGCTAAGCGGCTGGACGAAGGCATCAGCGTGCTGAGAGTCCCACTGACCCAGCTGAAGCTGAAAGATCTGGAGAAGATGGTGAACCGGGAAAGAGAGCCCAAGCTGTATGAAGCTCTGAAAGCAAGACTGGAGGCCCACAAGGACGATCCAGCTAAAGCATTTGCCGAGCCCTTCTACAAATATGACAAGGCCGGCAATCGGACACAGCAGGTGAAGGCTGTCAGAGTGGAGCAGGTCCAGAAAACTGGGGTCTGGGTGCACAACCATAATGGAATTGCCGACAACGCTACAATCGTCCGGGTGGATGTGTTCGAGAAAGGCGGGAAGTACTATCTGGTGCCTATCTACTCCTGGCAGGTCGCCAAGGGAATCCTGCCAGATAGAGCTGTCGTGCAGGGCAAAGACGAAGAGGATTGGACTGTGATGGACGATTCTTTCGAGTTTAAGTTCGTCCTGTACGCAAACGACCTGATCAAGCTGACAGCCAAGAAAAATGAATTTCTGGGGTATTTCGTGTCACTGAACAGGGCAACTGGAGCCATCGATATTCGCACACATGACACTGATAGCACCAAGGGAAAAAACGGCATCTTTCAGTCTGTGGGCGTCAAGACCGCCCTGAGTTTCCAGAAATATCAGATTGACGAACTGGGGAAGGAGATCCGACCCTGTCGGCTGAAGAAACGACCACCCGTGCGG

  金黄色葡萄球菌Cas9(SEQ ID NO:___)

  ATGAAAAGGAACTACATTCTGGGGCTGGACATCGGGATTACAAGCGTGGGGTATGGGATTATTGACTATGAAACAAGGGACGTGATCGACGCAGGCGTCAGACTGTTCAAGGAGGCCAACGTGGAAAACAATGAGGGACGGAGAAGCAAGAGGGGAGCCAGGCGCCTGAAACGACGGAGAAGGCACAGAATCCAGAGGGTGAAGAAACTGCTGTTCGATTACAACCTGCTGACCGACCATTCTGAGCTGAGTGGAATTAATCCTTATGAAGCCAGGGTGAAAGGCCTGAGTCAGAAGCTGTCAGAGGAAGAGTTTTCCGCAGCTCTGCTGCACCTGGCTAAGCGCCGAGGAGTGCATAACGTCAATGAGGTGGAAGAGGACACCGGCAACGAGCTGTCTACAAAGGAACAGATCTCACGCAAAGCAAAGCTCTGGAAGAGAAGTATGTCGCAGAGCTGCAGCTGGAACGGCTGAAGAAAGATGGCGAGGTGAGAGGGTCAATTAATAGGTTCAAGACAAGCGACTACGTCAAAGAAGCCAAGCAGCTGCTGAAAGTGCAGAAGGCTTACCACCAGCTGGATCAGAGCTTCATCGATACTTATATCGACCTGCTGGAGACTCGGAGAACCTACTATGAGGGACCAGGAGAAGGGAGCCCCTTCGGATGGAAAGACATCAAGGAATGGTACGAGATGCTGATGGGACATTGCACCTATTTTCCAGAAGAGCTGAGAAGCGTCAAGTACGCTTATAACGCAGATCTGTACAACGCCCTGAATGACCTGAACAACCTGGTCATCACCAGGGATGAAAACGAGAAACTGGAATACTATGAGAAGTTCCAGATCATCGAAAACGTGTTTAAGCAGAAGAAAAAGCCTACACTGAAACAGATTGCTAAGGAGATCCTGGTCAACGAAGAGGACATCAAGGGCTACCGGGTGACAAGCACTGGAAAACCAGAGTTCACCAATCTGAAAGTGTATCACGATATTAAGGACATCACAGCACGGAAAGAAATCATTGAGAACGCCGAACTGCTGGATCAGATTGCTAAGATCCTGACTATCTACCAGAGCTCCGAGGACATCCAGGAAGAGCTGACTAACCTGAACAGCGAGCTGACCCAGGAAGAGATCGAACAGATTAGTAATCTGAAGGGGTACACCGGAACACACAACCTGTCCCTGAAAGCTATCAATCTGATTCTGGATGAGCTGTGGCATACAAACGACAATCAGATTGCAATCTTTAACCGGCTGAAGCTGGTCCCAAAAAAGGTGGACCTGAGTCAGCAGAAAGAGATCCCAACCACACTGGTGGACGATTTCATTCTGTCACCCGTGGTCAAGCGGAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAATGATATCATTATCGAGCTGGCTAGGGAGAAGAACAGCAAGGACGCACAGAAGATGATCAATGAGATGCAGAAACGAAACCGGCAGACCAATGAACGCATTGAAGAGATTATCCGAACTACCGGGAAAGAGAACGCAAAGTACCTGATTGAAAAAATCAAGCTGCACGATATGCAGGAGGGAAAGTGTCTGTATTCTCTGGAGGCCATCCCCCTGGAGGACCTGCTGAACAATCCATTCAACTACGAGGTCGATCATATTATCCCCAGAAGCGTGTCCTTCGACAATTCCTTTAACAACAAGGTGCTGGTCAAGCAGGAAGAGAACTCTAAAAAGGGCAATAGGACTCCTTTCCAGTACCTGTCTAGTTCAGATTCCAAGATCTCTTACGAAACCTTTAAAAAGCACATTCTGAATCTGGCCAAAGGAAAGGGCCGCATCAGCAAGACCAAAAAGGAGTACCTGCTGGAAGAGCGGGACATCAACAGATTCTCCGTCCAGAAGGATTTTATTAACCGGAATCTGGTGGACACAAGATACGCTACTCGCGGCCTGATGAATCTGCTGCGATCCTATTTCCGGGTGAACAATCTGGATGTGAAAGTCAAGTCCATCAACGGCGGGTTCACATCTTTTCTGAGGCGCAAATGGAAGTTTAAAAAGGAGCGCAACAAAGGGTACAAGCACCATGCCGAAGATGCTCTGATTATCGCAAATGCCGACTTCATCTTTAAGGAGTGGAAAAAGCTGGACAAAGCCAAGAAAGTGATGGAGAACCAGATGTTCGAAGAGAAGCAGGCCGAATCTATGCCCGAAATCGAGACAGAACAGGAGTACAAGGAGATTTTCATCACTCCTCACCAGATCAAGCATATCAAGGATTTCAAGGACTACAAGTACTCTCACCGGGTGGATAAAAAGCCCAACAGAGAGCTGATCAATGACACCCTGTATAGTACAAGAAAAGACGATAAGGGGAATACCCTGATTGTGAACAATCTGAACGGACTGTACGACAAAGATAATGACAAGCTGAAAAAGCTGATCAACAAAAGTCCCGAGAAGCTGCTGATGTACCACCATGATCCTCAGACATATCAGAAACTGAAGCTGATTATGGAGCAGTACGGCGACGAGAAGAACCCACTGTATAAGTACTATGAAGAGACTGGGAACTACCTGACCAAGTATAGCAAAAAGGATAATGGCCCCGTGATCAAGAAGATCAAGTACTATGGGAACAAGCTGAATGCCCATCTGGACATCACAGACGATTACCCTAACAGTCGCAACAAGGTGGTCAAGCTGTCACTGAAGCCATACAGATTCGATGTCTATCTGGACAACGGCGTGTATAAATTTGTGACTGTCAAGAATCTGGATGTCATCAAAAAGGAGAACTACTATGAAGTGAATAGCAAGTGCTACGAAGAGGCTAAAAAGCTGAAAAAGATTAGCAACCAGGCAGAGTTCATCGCCTCCTTTTACAACAACGACCTGATTAAGATCAATGGCGAACTGTATAGGGTCATCGGGGTGAACAATGATCTGCTGAACCGCATTGAAGTGAATATGATTGACATCACTTACCGAGAGTATCTGGAAAACATGAATGATAAGCGCCCCCCTCGAATTATCAAAACAATTGCCTCTAAGACTCAGAGTATCAAAAAGTACTCAACCGACATTCTGGGAAACCTGTATGAGGTGAAGAGCAAAAAGCACCCTCAGATTATCAAAAAGGGCAGCGGAGGCAAGCGTCCTGCTGCTACTAAGAAAGCTGGTCAAGCTAAGAAAAAGAAAGGATCCTACCCATACGATGTTCCAGATTACGCTTAA

  红嘴鸥弯曲杆菌Cas9(SEQ ID NO:___)

  ATGTACCCATACGATGTTCCAGATTACGCTTCGCCGAAGAAAAAGCGCAAGGTCGAAGCGTCCATGAGGATTCTGGGGTTTGACATTGGCATTAACAGCATCGGGTGGGCTTTTGTGGAGAACGACGAACTGAAGGACTGCGGAGTGCGGATCTTCACAAAGGCCGAGAACCCAAAAAATAAGGAAAGCCTGGCACTGCCCCGGAGAAATGCACGCAGCTCCAGGCGCCGACTGAAACGGAGAAAGGCCCGGCTGATCGCTATTAAGAGAATCCTGGCCAAAGAGCTGAAGCTGAACTACAAGGACTATGTCGCAGCTGATGGAGAGCTGCCAAAGGCCTACGAAGGATCCCTGGCATCTGTGTACGAGCTGCGGTATAAGGCCCTGACACAGAACCTGGAAACTAAAGATCTGGCCAGAGTGATCCTGCACATTGCTAAGCATAGGGGGTACATGAACAAGAACGAGAAGAAATCAAACGACGCTAAGAAAGGAAAGATCCTGAGCGCTCTGAAAAACAATGCACTGAAGCTGGAGAACTACCAGAGCGTGGGCGAATACTTCTACAAGGAGTTCTTTCAGAAATACAAGAAAAACACAAAGAACTTCATCAAGATCCGCAACACTAAGGATAATTACAACAATTGCGTGCTGTCTAGTGACCTGGAAAAAGAGCTGAAGCTGATCCTGGAAAAACAGAAGGAGTTCGGCTACAACTACTCTGAAGATTTCATCAACGAGATTCTGAAGGTCGCCTTCTTTCAGCGGCCCCTGAAGGACTTCAGTCACCTGGTGGGGGCCTGCACTTTCTTTGAGGAAGAGAAAAGGGCCTGTAAGAACAGCTACTCTGCCTGGGAGTTTGTGGCTCTGACCAAGATCATTAACGAGATCAAGAGCCTGGAGAAGATCAGCGGCGAAATTGTGCCAACCCAGACAATCAACGAGGTCCTGAATCTGATCCTGGACAAGGGGTCTATCACCTACAAGAAATTCAGAAGTTGTATCAATCTGCATGAGAGTATCAGCTTCAAGAGCCTGAAGTATGATAAAGAAAACGCCGAGAATGCTAAACTGATCGACTTCCGCAAGCTGGTGGAGTTTAAGAAAGCCCTGGGAGTCCACAGCCTGTCCCGGCAGGAACTGGATCAGATCTCCACTCATATCACCCTGATTAAGGACAACGTGAAGCTGAAAACCGTCCTGGAGAAATACAACCTGAGTAATGAACAGATCAACAATCTGCTGGAAATTGAGTTCAACGATTATATCAACCTGAGCTTCAAGGCCCTGGGAATGATTCTGCCACTGATGCGCGAGGGCAAACGATACGACGAGGCCTGCGAGATCGCCAATCTGAAACCTAAGACCGTGGACGAGAAGAAAGATTTCCTGCCAGCATTTTGTGATTCCATTTTCGCCCACGAGCTGTCTAACCCCGTGGTCAATAGGGCTATCAGCGAATACCGCAAGGTGCTGAACGCACTGCTGAAGAAATATGGAAAGGTCCACAAAATTCATCTGGAGCTGGCTCGCGACGTGGGCCTGTCCAAGAAAGCACGAGAGAAGATCGAAAAAGAGCAGAAGGAAAACCAGGCCGTGAATGCATGGGCCCTGAAGGAATGCGAGAATATTGGCCTGAAGGCCAGCGCAAAGAACATCCTGAAACTGAAGCTGTGGAAAGAACAGAAGGAGATCTGTATCTACTCCGGAAATAAGATCTCTATTGAGCACCTGAAAGATGAAAAGGCCCTGGAGGTGGACCATATCTACCCCTATTCTAGGAGTTTCGACGATTCTTTTATCAACAAAGTGCTGGTGTTCACCAAGGAAAATCAGGAGAAACTGAACAAGACACCTTTCGAGGCCTTTGGCAAGAATATTGAAAAATGGAGCAAGATCCAGACCCTGGCTCAGAACCTGCCATACAAGAAAAAGAATAAGATTCTGGACGAGAACTTCAAAGATAAGCAGCAGGAGGACTTTATCTCTCGAAATCTGAACGACACCCGGTATATCGCTACACTGATTGCAAAATACACAAAGGAGTATCTGAACTTCCTGCTGCTGAGCGAAAATGAGAACGCCAATCTGAAGAGTGGCGAAAAAGGGTCAAAGATCCACGTGCAGACTATTAGCGGGATGCTGACCTCCGTCCTGAGGCACACATGGGGGTTTGACAAAAAGGATCGCAACAATCATCTGCACCATGCACTGGATGCCATCATTGTGGCCTACAGTACAAATTCAATCATTAAGGCTTTCAGCGATTTCCGGAAAAACCAGGAGCTGCTGAAGGCCAGATTCTACGCTAAAGAACTGACTTCCGATAACTATAAACATCAGGTCAAGTTCTTTGAGCCTTTCAAGAGTTTTAGAGAAAAAATCCTGTCAAAGATCGACGAGATTTTCGTGTCCAAACCACCTCGAAAGCGAGCTAGGCGCGCACTGCACAAGGATACCTTTCATTCTGAGAACAAGATCATTGACAAGTGCAGCTACAACTCCAAGGAAGGCCTGCAGATTGCCCTGAGCTGTGGAAGAGTGAGGAAAATCGGCACTAAGTATGTCGAGAATGATACCATCGTGAGGGTCGACATTTTCAAAAAGCAGAACAAGTTTTACGCTATCCCAATCTACGCAATGGATTTTGCCCTGGGGATCCTGCCCAATAAGATCGTGATTACTGGAAAAGATAAGAACAATAACCCCAAACAGTGGCAGACCATTGACGAATCATACGAGTTCTGCTTTAGCCTGTATAAGAATGACCTGATCCTGCTGCAGAAAAAGAACATGCAGGAACCTGAGTTCGCCTACTATAACGATTTTTCAATCAGCACATCAAGCATTTGTGTGGAGAAACACGACAACAAGTTCGAAAATCTGACTAGCAACCAGAAGCTGCTGTTTTCCAATGCAAAAGAGGGCTCTGTGAAGGTCGAAAGTCTGGGGATCCAGAACCTGAAAGTGTTCGAGAAGTACATCATTACCCCCCTGGGAGATAAAATTAAGGCTGACTTTCAGCCTCGAGAAAACATCAGCCTGAAAACCAGTAAAAAGTATGGCCTGAGG

  引物

  实例38:使用AAV载体和肝脏特异性的Cas9启动子将指导物和SaCas9静脉内递送到肝脏而在体内见到的ApoB基因型和表型变化

  在这个实例中,尤其是:

  ·AAV2/8是靶向肝脏的腺病毒载体;

  ·TBG是肝脏-特异性启动子,并且在此用于驱动SaCas9的表达;

  ·U6在此用于驱动sgRNA(指导物)的表达;

  ·ApoB是脂质代谢基因。它可以被认为是在肝脏递送中的“金标准”,并且被广泛用于肥胖症的小鼠模型中

  ·“靶标1到靶标4”意味着选择ApoB内的4种靶标,其中靶标1和三(T1和T3)是最有用的;

  ·如在此所见,相比于安德森/殷(Anderson/Yin’s)(NBT 2884)使用的流体动力学递送作为递送方法,通过从病毒载体表达进行的递送是个改进,因为流体动力学递送需要注射若干毫升流体,对于鼠体是有压力的并且可以是致命的。流体动力学递送是非常适用于质粒(裸)DNA的递送,而申请人已经显示,将指导物和Cas9序列包装在病毒递送载体之内在大大增加的效率方面是优选的。实际上,仅需要引入相对小的体积,并且这可以通过静脉内(i.v.)进行,这可能是在治疗学上更加可接受的。

  ·特别令人鼓舞的不仅是在肝脏“金-标准”基因(如ApoB)中见到的基因型改变,而还记录了表型改变。以前用PCSK9的工作已经不仅显示出基因型改变,还有表型改变,因此用ApoB见到的表型改变验证了CRISPR递送至肝脏的合理性以及其在肝脏中实现表型改变的能力。这与治疗学上更加可接受的递送手段(i.v.,相比于流体动力学递送)相组合。这样,CRISPR(指导物和Cas9)的病毒递送是优选的,尤其是经静脉内)。

  ·靶标包括:PCSK9、HMGCR、APOB、LDLR、ANGPTL3、F8、F9/FIX、AAT、FAH、HPD、TAT、ATP7B、UGT1A1、OTC、ARH

  材料和方法

  病毒和注射参数

  使用的构建体:-AAV2/8-TBG-SaCas9-U6-sgRNA(Apob-靶标1到靶标4)。

  体外测试:全部是在Hepa细胞中以10%-15%效率对Apob座位的诱导的切割。

  体内结果:小鼠-8周,C57BL/6(每个时间点2个动物,并且1个动物作为注射盐水的野生型对照)

  尾静脉注射:

  注射体积:100ul的0.8E12vp/ml(vp=病毒粒子)

  递送的病毒粒子:0.8E11总vp/动物

  组织处理和数据收集

  如下发生的组织处理和数据收集:

  第一时间点约1周(8天)。第二时间点约4周。

  盐水灌注随后为肝组织的急性解剖。

  (A)一半的肝脏放入-80C储存以用于Surveyor&qPCR&Western印迹蛋白分析(X12管/动物)。

  (B)一半的肝脏放入冷冻保护剂中并且快速冷冻用于低温恒温器处理。使冷冻切片经受H&E和油红染色。

  使用QuickExtract和Surveyor测定来检测和定量来自2片肝/动物的indel。

  结果

  体内Indel评估

  图中示出针对ApoB指导物(靶标)随着时间(注射后长达4周)的体内indel评估。图78A显示指导物(靶标)1诱导ApoB中indel的最高百分比。靶标2和4在仅导致零个或非常少的indel形成的意义上显示出很小影响或没有影响,而靶标3示出一些活性。图78B显示了在注射后4周针对indel形成效率的Surveyor核酸酶凝胶测定的结果。

  可以见到靶标1具有几乎9%的indel形成,代表显著水平的靶座位

  4个被设计为靶向的指导物中有2个显示表型改变

  在使用的三种指导物中有两种见到表型改变(靶标1和3),如在图57B中所见,该图示出用以检测在递送AAV-Cas9-sgRNA之后体内肝脂质积累表型的油红染色。在2个图中的左边(靶标1和3)积累的显示的油的红色斑块示出ApoB已经被破坏并且与右下角的对照进行比较。Apob基因已经由于Cas9-诱导的靶向基因组切割而被破坏,产生了这种生理/表型改变。靶标2显示没有超过对照的明显差异,并且靶标4未示。这个油红O染色是这样一种测定,其中肝脏中的脂肪是通过组织学染色可视化。这种染色频繁用于对肝脏中脂肪量的评估的研究中。在临床实践中,该油红O染色主要被要求用在肝脏活检样本的冷冻切片上,以评估在肝脏移植和其他手术过程中在肝脏中的脂肪的量。对于关于实例的此方面的方案和信息,提及的是:梅勒姆(Mehlem)等人,“通过油红O对中性脂质成像以便分析健康和疾病中的代谢状态(Imaging of neutral lipids by oil red O for analyzing the metabolic status in health and disease),”《自然方案》(Nature Protocols)8,1149-1154(2013);马泽加(Maczuga)等人,“对靶向于载脂蛋白B100的发夹结构的治疗表达包括在鼠类肝脏中表型改变和转录组改变(Therapeutic expression of hairpins targeting apolipoprotein B100induces phenotypic and transcriptome changes in murine liver),”《基因疗法》(Gene Therapy)(2014)21,60-70;库恩尼夫(Koornneef)等人,“通过AAV-递送的shRNA对载脂蛋白B的敲低降低了小鼠体内的血浆胆固醇(Apolipoprotein B Knockdown by AAV-delivered shRNA Lowers Plasma Cholesterol in Mice),”《分子疗法》(Molecular Therapy)(2011)194,731-740;塔丁-斯特普斯(Tadin-Strapps)等人,“siRNA-诱导的肝ApoB敲低降低了具有类人类血清脂质的小鼠模型中的血清LDL-胆固醇(siRNA-induced liver ApoB knockdown lowers serum LDL-cholesterol in a mouse model with human-like serum lipids),”《脂质研究杂志》(Journal of Lipid Research)52卷,1084-1097(2011)。在图中的比例尺代表20微米。

  实例39:SaCas9优化实验

  对以下进行研究:指导物长度优化;内含子测试;H1启动子;D10A双-切口酶测试;另外的长度/DN测试。

  SaCas9指导物长度测试:以确定sgRNA指导物长度:20对比21对比22bp,连同在指导物的起点处(5’端)的‘G’的作用。可提及图80:

  靶位点:

  A1:AAVS1

  E1:EMX1

  T1、T2、…:靶位点的编号

  TGC、GTC、…:从PAM的5’-端起,在位置23、22、21nt处的碱基组成

  本实例的实验是通过以下进行的:1.使用NNGRR作为PAM在两种感兴趣基因AAVS1和EMX1内选择靶标。2.合成相应于这些靶标的寡聚物,但改变在sgRNA内指导序列部分的长度,从20至21、至22。3.使用这些寡聚物产生sgRNA表达盒并且与表达SaCas9蛋白的质粒共转染进HEK293Ft细胞系中。4.转染后72小时,收获细胞并且然后通过Surveyor测定进行分析以检测indel。5.然后计算由Cas9诱导的Indel形成频率,并且以此总结于图中。

  图80显示跨一定范围的靶标并且在两个不同基因(AAVS1和EMX1)内,由灰色条表示的21nt/碱基对(bp)至少相比于20或22个碱基对(分别由黑色和白色条代表)是最佳间隔子长度。不认为这些靶标和基因是重要的,仅具代表性。这样,显现出21个nt或碱基对是最佳的用于良好长度,尤其是在SaCas9中或对于SaCas9。图80还显示,在指导/靶序列的5’端处的G nt可以例如对于U6启动子是有利的。

  内含子测试

  这个实验着手于测试指导序列是否可被插入Cas9内含子序列中。

  使用了以下构建体。注意指导RNA(sgRNA)存在于内含子内(在Cas9N’与C’末端外显子之间)。

  CMV-SaCas9(N-末端)-内含子(sgRNA)-SaCas9(C-末端)

  构建体在Hepa细胞中表达。

  将每个内含子用2种不同的指导物测试:Pcsk9和Hmgcr sgRNA。

  示出总共9个构建体:三个EBV1三个EBV2和三个ADV:

  -泳道1-3:示出EBV1-152(基于EBV,来自EBV基因组的152bp内含子1)

  -泳道4-6:示出EBV2(基于EBV,来自EBV基因组的W重复的内含子)

  -泳道7-9:显示ADV(基于腺病毒的内含子,类似来源如基亚尼(Kiani)等人,“在哺乳动物细胞中CRISPR转录抑制装置和分层的回路(CRISPR transcriptional repression devices and layered circuits in mammalian cells),”《自然方法》(Nature Methods)doi:10.1038/nmeth.2969,在线公开于2014年5月5日,以及尼西姆(Nissim)等人,“在人类细胞中用整合的RNA和CRISPR/Cas Toolkit对基因网络进行多元和可编程的调节(Multiplexed and Programmable Regulation of Gene Networks with an Integrated RNA and CRISPR/Cas Toolkit in Human Cells),”54卷,第4期,p698-710,2014年5月22日;DOI:http://dx.doi.org/10.1016/j.molcel.2014.04.022)。

  在每一组的设计中,三种构建体对应于在内含子内sgRNA的三个不同插入位点。

  ADV-设计3

  结果示于图81中。这些结果提供了以下原理论证:成功地将指导序列包装进SaCas9内含子中确实是可能的。携带指导序列的sgRNA被插入到衍生自腺病毒的合成内含子内,并且然后该完整的内含子-sgRNA盒插入到SaCas9基因中。可以将内含子插入SaCas9基因之内的任何地方而不显著破坏SaCas9蛋白的正常表达。可以将多个内含子与sgRNA插入SaCas9基因内的不同位置中。定位是灵活的并且该广泛途径在以下两种方式中是有利的:

  尺寸最小化允许构建体中的bp或nt总数降低。

  多元化允许更大程度的多元化(共递送多种指导物),因为‘空间’在此处总是一个问题。因为指导物不一定需要特异性启动子,一种或多种指导物可以类似地包装到一个/该Cas9内含子中。

  上述文本使用‘一个/该’,因为如以上所讨论的,一定数目的合成内含子可以被引入Cas9中。可以有利的是将sgRNA插入以下位置中,该位置接近该内含子的5’端但距离其至少5-15bp并且还在内含子的分支点前。如果本领域技术人员希望的话,可以缺失一些在内含子中间的5’剪接供体位点与分支点之间的内含子间隔子序列。这在Cas9、尤其是SaCas9中实现是出人意料的,原因包括sgRNA结构在Sa和Sp之间是不同的。

  目前,ADV是优选的,但这种途径跨一系列病毒和Cas9s(Sa、Sp等)具有广泛的适用性。

  H1启动子测试

  该实验着手于研究U6启动子的替代启动子。

  A)全长H1

  制成以下构建体:

  CMV-SaCas9,采用驱动一种sgRNA的原始H1启动子(Pcsk9-靶标201或Hmgcr-新靶标5)

  如可以在图82中所见,全长H1启动子(灰色条)仍弱于U6启动子(黑色条),因为U6示出对于每个测试的靶标而言增加的indel百分比形成。

  B)双H1启动子测试(短H1)

  制成以下构建体:

  TBG-SaCas9,采用驱动两种sgRNA(Pcsk9-靶标201和Hmgcr-新靶标5)的两种短H1启动子,其中同时以相同的取向和相反的取向使用双短H1启动子。

  如可以在图83中所见,短H1启动子弱于全长H1。

  SaCas9切口酶测试(使用D10A突变体)

  此实验考虑了在构建体中两种指导序列的5’端之间的距离,并且然后关于D10A SaCAs9双切口酶的切割效率对此测量。靶标是针对人AAT1基因。这些测试是将20bp+G指导物克隆进质粒中进行的。

  最佳的结果显示在-5和+1bp(5’到5’)之间,参见图84。

  实例40:使用CRISPR-Cas9在哺乳动物脑中的基因功能的体内探询

  此工作呈现以下主要点:第一次证实了在有丝分裂后神经元中体内成功的AAV-介导的Cas9递送连同高效的基因组修饰。开发了使得能够容易从表达Cas9和sgRNA的细胞分离神经元核的核标记技术。证实了针对神经元转录组的RNAseq分析的应用;将电生理学研究与Cas9-介导的基因组干扰整合。并且证实了多元靶向以及使用Cas9-介导的基因组编辑研究关于啮齿动物行为的基因功能的能力。

  携带疾病相关突变的转基因动物模型对于研究神经障碍是极其有用的,有助于阐明疾病的遗传机制和病理生理学机制1。然而,产生携带单一或多个基因修饰的动物模型是特别劳动密集的并且需要经过多个世代的耗时的育种。因此,为了协助在正常和疾病相关脑过程中基因功能的快速剖析,我们需要准确且高效地在体内操纵神经元的基因组的能力。已经显示来自化脓链球菌的CRISPR-相关内切核酸酶Cas9(SpCas9)介导正复制的真核细胞中单基因和多基因的准确且高效的基因组切割,导致移码插入/缺失(indel)突变2,3。在此,我们将Cas9-介导的基因组干扰与生物化学、测序、电生理学、以及行为读出进行整合,以研究体内单独基因以及基因群在神经过程中的功能以及它们在脑障碍中的作用。

  讨论

  腺相关病毒(AAV)载体常用于将重组基因递送进小鼠脑中4。AAV系统的主要限制是其小的包装尺寸,以大约4.5kb加帽,不含ITR5,这限制了可以包装进单一载体内的基因材料的量。由于SpCas96的大小已经是4.2kb,在单一AAV载体内剩下少于0.3kb用于其他基因元件,我们设计了将SpCas9(AAV-SpCas9)和sgRNA表达盒(AAV-SpGuide)包装在两种单独的病毒载体上的双载体系统(图89a)。在设计AAV-SpCas9载体时,我们比较了不同的短神经元特异性启动子连同多聚腺苷酸化信号来优化SpCas9表达。对于我们的最终设计,我们选择了小鼠Mecp2启动子(235bp,pMecp2)7和最小多聚腺苷酸化信号(48bp,spA)8,所基于的是它们在培养的初级小鼠皮层神经元中实现足够水平的SpCas9表达的能力(图89-c)。为了促进对表达SpCas9的神经元进行免疫荧光鉴定,我们用HA-表位标签标记SpCas9。对于AAV-SpGuide载体,我们包装一种U6-sgRNA表达盒连同与KASH核跨膜结构域9稠合的由人类突触蛋白I启动子驱动的绿色荧光蛋白(GFP)(图85a)。该GFP-KASH融合蛋白将GFP引导到外部核膜(图89c,d),并且使得能够进行基于荧光的鉴定和经AAV-SpGuide转导的完整神经元核的纯化。

  为了测试我们的双载体递送系统的递送功效,我们首次将培养的初级小鼠皮层神经元在体外经AAV-SpCas9和AAV-SpGuide转导,并且观察到稳固的表达(图89e),其中具有大于80%的共转导效率(图89e)。重要的是,与未转导的神经元相比,SpCas9的表达不会不利地影响转导的神经元的形态学和存活率(图89c,f)。

  已经建立一种高效的递送系统后,我们接下来寻求测试在小鼠初级神经元中SpCas9-介导的基因组编辑。然而SpCas9已经用来实现在多种分裂细胞类型中高效的基因组修饰,尚未清楚的是SpCas9是否能用于在有丝分裂后神经元中高效地实现基因组编辑。对于我们的初始测试,我们靶向Mecp2基因,该基因在雷特综合征10(一种自闭症谱系障碍)中发挥主要作用。MeCP2蛋白普遍表达于遍及脑的神经元中,但几乎不存在于神经胶质细胞中11,12,并且它的缺陷已经显示与神经元中严重的形态学和电生理学表型相关,并且认为两者可促成患有雷特综合征的患者中观察到的神经症状13-16。为了靶向Mecp2,我们首先设计了几种靶向小鼠Mecp2基因的外显子3的sgRNA(图90a),并且使用Neuro-2a细胞评价了它们的功效。使用SURVEYOR核酸酶测定鉴定出最高效的sgRNA(图90b)。我们选择最有效的sgRNA(Mecp2靶标5)用于随后的体外和体内Mecp2靶向实验。

  为了评估在神经元中我们的双载体系统的编辑效率,我们在体外7天转导初级小鼠皮层神经元(7DIV,图91a),并且在转导后7天使用SURVEYOR核酸酶测定测量indel比率(图91b)。注意到,用靶向Mecp2的AAV-SpCas9和AAV-SpGuide共转导的神经元培养物示出与对照神经元相比MeCP2蛋白水平高达80%的降低(图91c,d)。对于观察到的在相对低indel频率(约14%)与稳固的蛋白耗尽(约80%)之间的矛盾,一种可能的解释可以是在靶位点处仅由SpCas9的结合可以干扰转录,这已经在大肠杆菌中示出17,18。我们使用具有失活的RuvC和HNH催化结构域两者的SpCas9的突变体研究了这个可能性19,20(D10A和H840A,dSpCas9)。dSpCas9和靶向Mecp2的sgRNA的共表达没有降低MeCP2蛋白水平(图91a,d),表明在活性SpCas9的存在下观察到的MeCP2水平的降低是由于Mecp2座位中的修饰的发生。对于在检测到的低水平indel与高水平蛋白耗尽之间的矛盾,另一种可能的解释可以是由于通过SURVEYOR核酸酶测定低估了实际indel比率-已经在先前显示SURVEYOR的检测准确性对于indel序列组成是敏感的21

  已经在先前显示MeCP2功能缺失与神经元中的树突树异常和树突棘形态发生缺陷相关联14,16。MeCP2损失的这些表型也已经重现在从MeCP-KO iPS细胞分化的神经元中15。因此,我们研究在神经元中SpCas9-介导的MeCP2-耗尽是否可以类似地重演雷特综合征的形态学表型。的确,当与对照神经元相比时,共表达了SpCas9和靶向Mecp2的sgRNA的神经元展现出改变的树突树形态学和树突棘密度(图92)。这些结果证实在细胞测定中可以使用SpCas9以通过使得在有丝分裂后神经元中能够进行靶向敲除而协助基因功能的研究。

  考虑到由异质细胞类型的错综复杂网络组成的神经系统的复杂性,能够高效地编辑体内神经元的基因组将使得能够引导对嵌入在天然背景中的相关细胞类型中的基因功能的测试。因此,我们立体定向地将高滴度AAV-SpCas9和AAV-SpGuide的混合物(1:1比率)注射入成年小鼠的海马体齿状脑回中。我们观察到,在病毒注射后4周,在海马体颗粒细胞中两种载体的高的共转导效率(超过80%)(图85b,c),导致Mecp2座位的基因组修饰。(图85d)。使用SURVEYOR核酸酶测定,我们在获得自经注射的脑区域的脑打孔样品(brain punch)中检测到约13%的indel频率(图85e)。类似于我们在培养的初级神经元中发现的,SpCas9-介导的对Mecp2座位的切割高效地以超过60%降低了MeCP2蛋白水平。此外,与单独的AAV-SpCas9相比,当用AAV-SpCas9和AAV-SpGuide注射时,在齿状脑回中MeCP2-阳性核的数目降低超过75%(图85g-h)。这些结果表明SpCas9可用于直接扰动完整生物背景内的特定基因。

  靶向的基因组干扰可以与定量读出偶联,以提供关于特定基因组元件的生物学功能的见解。为了协助对于经AAV-SpCas9和AAV-SpGuide转导的细胞的分析,我们开发了一种使用荧光激活细胞分选术(FACS)纯化GFP-KASH标记的核的方法(图86a)。可以将分选的核直接用于纯化核DNA和RNA,以用于下游生物化学或测序分析。使用桑格测序,我们发现14个单一GFP阳性细胞核中有13个包含sgRNA靶位点处的indel突变。

  除了基因组DNA测序外,还可以使用纯化的GFP-阳性核以用于RNAseq分析以研究MeCP2耗尽的转录结果(图86b和图93)。为了测试Mecp2敲除对来自齿状脑回的神经元的转录的影响,我们使用来自接受了AAV-SpCas9连同对照sgRNA(该对照sgRNA已经被设计为靶向细菌lacZ基因并且不是小鼠基因组)或靶向Mecp2的sgRNA的动物的、经FACS纯化的GFP+核制备了RNAseq文库。所有的sgRNA已经被优化为最小化它们的脱靶得分(CRISPR设计工具:http://tools.genome-engineering.org)2。我们能够发现在对照与Mecp2sgRNA表达核之间差异性表达(p<0.01)的基因(图86b)。我们在基因中鉴定出一些感兴趣的在表达Mecp2sgRNA的核中下调的候选物:Hpca、Olfm1、和Ncdn,已经在先前报道它们在学习行为中发挥着重要作用22-24;以及Cplx2,已经示出它涉及突触泡释放并且与神经元放电率相关25,26。这些结果证实,SpCas9-介导的基因组干扰和群体水平RNAseq分析的组合提供了一种用以表征神经元中的转录调节并且表明对于特定神经元功能或疾病过程可以是重要的基因的方式。

  在脑中SpCas9-介导的体内基因组编辑还可以与电生理学记录来偶联,以研究基因组干扰对特定细胞类型或回路组分的影响。为了研究MeCP2耗尽对神经元生理学的功能性作用,我们立体定向地将靶向Mecp2的AAV-SpCas9和AAV-SpGuide共递送到雄性小鼠的初级视觉皮层(V1)的浅层。选择V1,是因为该浅层皮质兴奋性神经元对于双光子成像和双光子指导的靶向记录是更加可及的。在SpCas9递送后两周,使小鼠经受双光子指导的近细胞记录,以比较在小鼠V1的2/3层中KASH-GFP+神经元和GFP-邻近神经元的电生理学响应(图86a-c)。我们以20度增量测量了对18个漂移光栅的神经元响应,并且通过平均化响应计算了细胞的由载体诱发的放电率(FR)和取向选择性指数(OSI)。与邻近的GFP-兴奋性神经元相比,对于兴奋性GFP+的MeCP2敲除神经元的FR和OSI两者均显著降低(图86d-e)。相比之下,当与邻近的未感染的神经元相比时,对照sgRNA表达连同SpCas9不具有对FR和OSI的任何作用(图86d-e)。这些结果显示在两周内,在成年V1皮层神经元中SpCas9介导的对MeCP2的耗尽改变体内兴奋性神经元的视觉响应特性,并且进一步证实了SpCas9在协助体内哺乳动物脑中的靶基因敲除中以用于研究神经元回路的基因功能和剖析的多功能性。

  SpCas9系统的一个关键优点是它能够促进多元基因组编辑2。在活体动物的脑中引入多基因的稳定敲除将具有潜在深远的应用,例如在生理和神经病理病症中多基因机制的因果探询。为了测试脑中多元基因组编辑的可能性,我们设计了多元sgRNA表达载体,该载体由三种串联的sgRNA连同用于核标记的GFP-KASH一起组成(图87a)。我们选择了靶向DNA甲基转移酶基因家族(DNMT)的sgRNA,该家族由Dnmt1、Dnmt3a和Dnmt3b组成。Dnmt1和Dnmt3a高度表达于成年脑中,并且先前显示DNMT活性改变DNA甲基化,并且Dnmt3a和Dnmt1两者对于突触可塑性以及学习和记忆形成是必要的27。我们设计了具有高修饰效率的针对Dnmt3a和Dnmt1的单独sgRNA。为了避免由Dnmt3b带来的任何潜在补偿效应,我们决定还额外地靶向该基因,即使它主要在神经发育期间表达27。我们最终选择单独sgRNA用于对所有三种靶向基因进行同时的DNA切割(图88b和图94)。

  为了测试体内多元基因组编辑的功效,我们立体定向地将高滴度AAV-SpCas9和AAV-SpGuide的混合物递送到雄性成年小鼠的背侧和腹侧齿状脑回中。4周后,将海马体解剖并且经FACS分选靶细胞核。我们通过使用SURVEYOR核酸酶测定(图88c)并且测序(图95)检测到在分选的核群体中约19%(Dnmt3a)、18%(Dnmt1)和4%(Dnmt3b)的indel频率。靶向多个座位提出了关于在单独细胞中多重敲除的有效率的问题。通过使用单一核分选与靶向测序的组合,我们量化了对单独神经元核中的多个DNMT座位的同时靶向(图88d)。在至少一个Dnmt座位中携带修饰的神经元核中,多于70%的核包括Dnmt3a和Dnmt1两者中的indel(约40%在所有3个座位处包含indel,并且约30%在Dnmt3a和Dnmt1两个座位处包括indel)。这些结果符合齿状脑回中的Dnmt3a和Dnmt1蛋白耗尽水平(图88e)。由于在成年脑中Dnmt3b的低表达,我们不能检测Dnmt3b蛋白。

  近来对SpCas9的研究已经示出,虽然在20-nt sgRNA序列内的每个碱基均贡献于总体的特异性,部分地匹配sgRNA的基因组座位可以导致脱靶双链断裂和indel形成28,29。为了评估脱靶修饰的比率,我们用计算机鉴定了一系列高度相似的基因组靶位点2,并且使用靶向深度测序定量修饰比率。最常见被预测的脱靶座位的Indel分析揭示0-1.6%的indel形成比率,证实SpCas9修饰是特异性的。为了增加在体内SpCas9-介导的基因组编辑的特异性,未来研究可以使用脱靶最小化策略例如形成双切口30,31以及截短的sgRNA28。

  Dnmt3a和Dnmt1的敲低已经在先前示出影响海马体依赖的记忆形成27。因此,我们进行了情境性恐惧-条件化行为测试,以研究SpCas9-介导的三重敲除(Dnmt3a、Dnmt1和Dnmt3b)对记忆获得和巩固的影响。虽然我们未观察到在对照与三重敲除小鼠之间在记忆获得阶段中的任何区别,当在训练情境条件下测试时敲除小鼠示出受损的记忆巩固(图88f)。当小鼠在改变的情境下测试时这一效应消除。我们的结果证实在齿状脑回神经元中CRIPSR-Cas9-介导的DNMT家族成员的敲除足以探测行为任务中的基因的功能。

  总之,我们的结果证实AAV-介导的体内递送SpCas9和sgRNA提供了用于实现在完整神经回路内的精确基因组干扰的快速且有力的技术。而SpCas9已经广泛用于工程化分裂细胞,我们证实了SpCas9还可以用来经由NHEJ-介导的indel产生高效地工程化有丝分裂后神经元的基因组。Cas9-介导的基因组干扰可以与生化、测序、电生理学、和行为分析相组合以研究靶向的基因组元件的功能。我们证实了SpCas9-介导的靶向单个或多个基因可以重演使用经典的更耗时的遗传小鼠模型观察到的形态学、电生理学、和行为表型。当前研究采用了化脓链球菌Cas9可以用于实现细胞类型特异性靶向,该化脓链球菌Cas9不仅使得对两种AAV载体的使用成为必需,而且限制了启动子元件的大小。在给定Cas9直系同源物的多样性的情况下,其中一些直系同源物大幅短于SpCas92,32,33,应该可能的是对表达Cas9和sgRNA两者的单一AAV载体工程化,如在此所述。

  参考文献

  1.内斯特勒(Nestler),E.J.&海曼(Hyman),S.E.,神经精神病学障碍的动物模型(Animal models of neuropsychiatric disorders).《自然神经科学》(Nat Neurosci)13,1161-1169(2010)。

  2.丛(Cong),L.等人,使用CRISPR/Cas系统进行的多元基因组工程化(Multiplex genome engineering using CRISPR/Cas systems).《科学》(Science)339,819-823(2013)。

  3.玛丽,P.等人,经由Cas9进行RNA-指导的人类基因组工程化(RNA-guided human genome engineering via Cas9).《科学》(Science)339,823-826(2013)。

  4.伯格(Burger),C.、纳什(Nash),K.&曼德尔(Mandel),R.J.,在神经系统中重组腺相关病毒载体(Recombinant adeno-associated viral vectors in the nervous system).《人类基因疗法》(Hum Gene Ther)16,781-791(2005)。

  5.吴(Wu),Z.、杨(Yang),H.&科洛西(Colosi),P.基因组的大小对AAV载体包装的影响(Effect of genome size on AAV vector packaging).《分子理论》(Mol Ther)18,80-86(2010)。

  6.戴尔特彻瓦(Deltcheva),E.等人,通过反式编码的小RNA和宿主因子RNA酶III进行的CRISPR RNA成熟(CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III)《自然》(Nature)471,602-607(2011)。

  7.格雷(Gray)S.J.等人,在外周和中枢神经系统中使用自我互补载体优化启动子以用于重组腺-相关病毒-介导的基因表达(Optimizing promoters for recombinant adeno-associated virus-mediated gene expression in the peripheral and central nervous system using self-complementary vectors).《人类基因疗法》(Hum Gene Ther)22,1143-1153(2011)。

  8.莱维特(Levitt),N.、布里格斯(Briggs),D.、吉尔(Gil),A.&普劳德富特(Proudfoot),N.J.,高效的合成的聚(A)位点的定义(Definition of an efficient synthetic poly(A)site).《基因开发》(Genes Dev)3,1019-1025(1989)。

  9.奥斯特伦德(Ostlund),C.等人,核骨架和细胞骨架(LINC)复合物蛋白的接头的动力学和分子相互作用(Dynamics and molecular interactions of linker of nucleoskeleton and cytoskeleton(LINC)complex proteins).《细胞科学杂志》(J Cell Sci)122,4099-4108(2009)。

  10.沙鲁尔(Chahrour),M.&左格比(Zoghbi),H.Y.,雷特综合征的故事:从临床至神经生物学(The story of Rett syndrome:from clinic to neurobiology).《神经元》(Neuron)56,422-437(2007)。

  11.凯西(Kishi),N.&马克利斯(Macklis),J.D.,DMECP2逐步表达于迁移后神经元中并且涉及神经元成熟而不是细胞命运决定(MECP2is progressively expressed in post-migratory neurons and is involved in neuronal maturation rather than cell fate decisions).《分子和细胞神经科学》(Molecular and cellular neurosciences)27,306-321(2004)。

  12.斯科纳(Skene),P.J.等人,神经元MeCP2表达为近组蛋白-八聚体水平并且在全局上改变染色质状态(Neuronal MeCP2is expressed at near histone-octamer levels and globally alters the chromatin state).《分子细胞》(Molecular cell)37,457-468(2010)。

  13.陈(Chen),R.Z.、阿克巴里因(Akbarian),S.、都德(Tudor),M.&耶尼施(Jaenisch),R.,在CNS神经元中甲基-CpG结合蛋白-2的缺陷导致小鼠中的雷特-样表型(Deficiency of methyl-CpG binding protein-2in CNS neurons results in a Rett-like phenotype in mice).《自然遗传学》(Nat Genet)27,327-331(2001)。

  14.周(Zhou),Z.等人,脑-特异性的MeCP2磷酸化调节活性-依赖性的Bdnf转录、树突生长、和树突棘成熟(Brain-specific phosphorylation of MeCP2regulates activity-dependent Bdnf transcription,dendritic growth,and spine maturation).《神经元》(Neuron)52,255-269(2006)。

  15.李(Li),Y.等人,在人-胚胎-干-细胞衍生的雷特综合征神经元中的全局转录和翻译抑制(Global transcriptional and translational repression in human-embryonic-stem-cell-derived Rett syndrome neurons).《细胞-干细胞》(Cell Stem Cell)13,446-458(2013)。

  16.阮(Nguyen),M.V.等人,MeCP2对于在出生后脑发育后期期间和在成熟成年人脑中维持成熟的神经元网络和全脑解剖结构是关键的(MeCP2is critical for maintaining mature neuronal networks and global brain anatomy during late stages of postnatal brain development and in the mature adult brain).《神经科学杂志》(J Neurosci)32,10021-10034(2012)。

  17.江(Jiang),W.、比卡德(Bikard),D.、科克斯(Cox),D.、张(Zhang),F.&马拉菲尼(Marraffini),L.A.,使用CRISPR-Cas系统对细菌基因组进行RNA指导的编辑(RNA-guided editing of bacterial genomes using CRISPR-Cas systems).《自然生物技术》(Nature biotechnology)31,233-239(2013)。

  18.齐(Qi),L.S.等人,改变CRISPR作为RNA-指导的平台以用于基因表达的序列特异性控制.《细胞》(Cell)152,1173-1183(2013)。

  19.萨普拉诺斯卡斯(Sapranauskas,R.)等人,嗜热链球菌CRISPR/Cas系统在大肠杆菌中提供免疫力(The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli).《核酸研究》(Nucleic acids research)39,9275-9282(2011)。

  20.季聂克(Jinek),M.等人,在自适应细菌免疫中的可编程双重-RNA-指导的DNA核酸内切酶(A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity).《科学》(Science)337,816-821(2012)。

  21.邱(Qiu),P.等人,使用Surveyor核酸酶进行的突变检测(Mutation detection using Surveyor nuclease).《生物技术》(BioTechniques)36,702-707(2004)。

  22.小林(Kobayashi),M.等人,海马钙结合蛋白缺陷小鼠展示了在与受损空间和联想记忆相关的cAMP响应元件结合蛋白激活中的缺陷(Hippocalcin-deficient mice display a defect in cAMP response element-binding protein activation associated with impaired spatial and associative memory).《神经科学》(Neuroscience)133,471-484(2005)。

  23.伊达木(Dateki),M.等人,神经软骨蛋白负调节CaMKII磷酸化并且神经系统-特异性基因破坏导致癫痫发作(Neurochondrin negatively regulates CaMKII phosphorylation,and nervous system-specific gene disruption results in epileptic seizure).《生物化学杂志》(The Journal of biological chemistry)280,20503-20508(2005)。

  24.中谷(Nakaya),N.等人,在嗅质蛋白1的N-末端一半中的缺失修饰了其与突触蛋白的相互作用并且引起小鼠脑营养不良和异常行为(Deletion in the N-terminal half of olfactomedin 1modifies its interaction with synaptic proteins and causes brain dystrophy and abnormal behavior in mice).《实验神经学》(Experimental neurology)250,205-218(2013)。

  25.雷姆(Reim),K等人,复蛋白调节Ca2+-依赖的神经递质释放的后期步骤(Complexins regulate a late step in Ca2+-dependent neurotransmitter release).《细胞》(Cell)104,71-81(2001)。

  26.爱德华松(Edwardson),J.M.等人,突变体亨廷顿蛋白的表达通过耗尽复蛋白II阻断PC12细胞中的胞吐作用(Expression of mutant huntingtin blocks exocytosis in PC12cells by depletion of complexin II).《生物化学杂志》(The Journal of biological chemistry)278,30849-30853(2003)。

  27.冯(Feng),J.等人,Dnmt1和Dnmt3a维持DNA甲基化并且调节在成人前脑神经元中的突触功能(Dnmt1and Dnmt3a maintain DNA methylation and regulate synaptic function in adult forebrain neurons).《自然神经科学》(Nat Neurosci)13,423-430(2010)。

  28.付(Fu),Y.等人,在人类细胞中由CRISPR-Cas核酸酶诱导的高频率脱靶诱变(High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells).《自然生物技术》(Nature biotechnology)31,822-826(2013)。

  29.徐(Hsu),P.D.等人,RNA-指导的Cas9核酸酶的DNA靶向特异性(DNA targeting specificity of RNA-guided Cas9nucleases).《自然生物技术》(Nature biotechnology)31,827-832(2013)。

  30.兰(Ran),F.A.等人,通过RNA-指导的CRISPR Cas9形成双切口以用于增强的基因组编辑特异性(Double nicking by RNA-guided CRISPR Cas9for enhanced genome editing specificity).《细胞》(Cell)154,1380-1389(2013)。

  31.玛丽(Mali),P.等人,用于靶向特异性筛选的CAS9转录激活因子和用于协作基因组工程化的配对切口酶(CAS9transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering).《自然生物技术》(Nature biotechnology)31,833-838(2013)。

  32.奥斯维尔特(Esvelt),K.M.&王(Wang),H.H.,基因组规模工程化以用于系统和合成生物学(Genome-scale engineering for systems and synthetic biology).《分子系统生物学》(Molecular systems biology)9,641(2013)。

  33.李(Li),W.、腾(Teng),F.、李(Li),T.&周(Zhou),Q,在大鼠中使用CRISPR-Cas系统而造成多基因突变的同时产生和种系传递(Simultaneous generation and germline transmission of multiple gene mutations in rat using CRISPR-Cas systems).《自然生物技术》(Nat Biotechnol)31,684-686(2013)。

  方法

  DNA构建体

  对于SpCas9靶标选择和单一指导RNA(sgRNA)的产生,将20-nt靶序列选择为在5′-NGG PAM序列之前。为了最小化脱靶效应,使用CRIPSR设计工具(http://tools.genome-engineering.org)。使用U6启动子作为模板,经PCR扩增sgRNA,使用的正向引物为:5’-cgcacgcgtAATTCGAACGCTGACGTCATC-3’,包含sgRNA的具有20-nt DNA靶位点(加粗)的反向引物为:

  5’-

  CACACGCGTAAAAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACG

  GACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAACGGTGTTTCGTCCTTTCCAC-3’。(SEQ ID NO:)

  对照sgRNA序列被设计为靶向来自大肠杆菌的lacZ基因:靶序列:TGCGAATACGCCCACGCGATGGG(SEQ ID NO:)EGFP-KASH1构建体是来自沃尔曼教授(Prof.Worman)(哥伦比亚大学(Columbia University),纽约州(NYC))的慷慨礼物,并且用作用于将编码盒在人类突触蛋白启动子(hSyn)下克隆进AAV骨架的PCR模板。接着,使用MluI位点引入U6-Mecp2sgRNA编码序列。对于多基因靶向策略,如上所述PCR扩增单独的sgRNA。通过使用金门(Golden Gate)克隆策略将所有三种sgRNA与PCR扩增的hSyn-GFP-KASH-bGHpA盒连接。在PCR扩增后,将包含3种sgRNA和hSyn-GFP-KASH-bGH pA的金门连接产物克隆进AAV骨架中。对所有获得的构建体进行测序验证。为了寻找用以在神经元中驱动SpCas9表达的最佳启动子序列,我们测试了:hSyn1、小鼠截短的Mecp2(pMecp2)、以及截短的大鼠Map1b(pMap1b)启动子序列2。使用以下引物来扩增启动子区域:

  hSyn_F:5’-GTGTCTAGACTGCAGAGGGCCCTG-3’;(SEQ ID NO:)

  hSyn_R:5’-GTGTCGTGCCTGAGAGCGCAGTCGAGAA-3’;(SEQ ID NO:)

  Mecp2_F 5’-GAGAAGCTTAGCTGAATGGGGTCCGCCTC-3’;(SEQ ID NO:)

  Mecp2_R 5’-CTCACCGGTGCGCGCAACCGATGCCGGGACC-3’;(SEQ ID NO:)

  Map1b-283/-58_F 5’-GAGAAGCTTGGCGAAATGATTTGCTGCAGATG-3’;(SEQ ID NO:)

  Map1b-283/-58_R 5’-CTCACCGGTGCGCGCGTCGCCTCCCCCTCCGC-3’。(SEQ ID NO:)

  大鼠map1b启动子的另一种截短物是与以下寡聚物组装在一起:

  5’-

  AGCTTCGCGCCGGGAGGAGGGGGGACGCAGTGGGCGGAGCGGAGACAGC

  ACCTTCGGAGATAATCCTTTCTCCTGCCGCAGAGCAGAGGAGCGGCGGGAGAGGAACACTTCTCCCAGGCTTTAGCAGAGCCGGA-3’以及

  5’-

  CCGGTCCGGCTCTGCTAAAGCCTGGGAGAAGTGTTCCTCTCCCGCCGCTC

  CTCTGCTCTGCGGCAGGAGAAAGGATTATCTCCGAAGGTGCTGTCTCCGCTCCGCCCACTGCGTCCCCCCTCCTCCCGGCGCGA-3’。(SEQ ID NO:)

  将短的合成多聚腺苷酸化信号(spA)3使用以下寡聚物进行组装:

  5’-

  AATTCAATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGGTTTTTTGTGTGC-3’(SEQ ID NO:)以及

  5’-GGCCGCACACAAAAAACCAACACACAGATCTAATGAAAATAAAGATCTTTTATTG-3’。(SEQ ID NO:)

  先前描述了SpCas9和其D10A突变体形式(dSpCas9)4,5。将编码红色荧光蛋白(mCherry)的在EF1α启动子控制下的质粒用于采用(生命技术公司(Life Technologies)的神经元转染。

  细胞系培养物和转染

  Neuro-2a(N2a)细胞生长在含有5%胎牛血清(BSA)的DMEM中。对于HEK293FT细胞,使用了含有10%胎牛血清(FBS)的DMEM。将细胞保持在37℃、5%CO2气氛中。根据制造商的方案使用或聚乙烯亚胺(Polyethylenimine)(PEI)“MAX”试剂(波利塞斯公司)转染细胞。

  浓缩的AAV载体的生产

  使用等比例的AAV1和AAV2血清型质粒以及pDF6辅助质粒产生高滴度AAV1/2粒子,并且在肝素亲和柱上进行纯化6。通过qPCR确定病毒粒子的滴度。高滴度AAV1粒子是由UNC载体核心服务部(UNC Vector Core Services)(北卡罗来纳州教堂山大学)产生的。在DMEM中的低滴度AAV1粒子是如前所述产生的7。简言之,使用PEI“MAX”将HEK293FT细胞用转基因质粒、pAAV1血清型质粒和pDF6辅助质粒转染。将培养物在48h后收集,并且通过0.45μm PVDF过滤器(密理博)进行过滤。

  初级皮层神经元培养

  根据由MIT动物保护委员会(MIT CAC)批准的方案将用于获得神经元以用于组织培养的动物处死。从胚胎龄16天的小鼠脑制备原代培养物8。使用任一性别的胚胎。将细胞铺板在聚-D-赖氨酸(PDL)包被的24孔板(BD生物科学)或层粘连蛋白/PDL包被的盖玻片(VWR)上。使培养物在补充有B27、Glutamax(生命技术公司)和青霉素/链霉素混合物的Neurobasal培养基中在37℃和5%CO2生长。

  对于AAV转导,将500μl Neurobasal培养基中的皮层神经元在7DIV用300μl(以1:1比率双重感染)包含AAV1的来自HEK293FT细胞7的条件培养基孵育。转导一周后已经将神经元收获用于下游处理或固定在4%多聚甲醛中以用于免疫荧光染色或形态学分析。

  对于神经元形态学的可视化,使用(生命技术公司)将在DIV7的细胞用EF1α-mCherry表达载体进行转染持续一周,如先前所述9。对于总树突长度的测量,使用ImageJ软件追踪单独神经元的所有树突。对用荧光显微镜在40x物镜下(蔡司(Zeiss)AxioCam Ax10显微镜,Axiocam MRm摄像机)采集的图像进行初级树突、树突尖的数目的定量、以及肖尔(Sholl)分析10。对于树突数目,对所有长于10μm的非-轴突突出物的末端进行计数。对于肖尔分析,将在直径上具有5μm梯级的同心圆自动地绘制在细胞体周围,并且使用具有肖尔插件的ImageJ软件对跨每个圆的树突的数目进行计数。

  将AAV1/2立体定向地注射进小鼠脑中

  MIT CAC批准了此处描述的所有动物程序。将成年(12-16周龄)雄性C57BL/6N小鼠通过腹膜内(i.p.)注射100mg/kg氯胺酮和10mg/kg甲苯噻嗪进行麻醉。给予先发止痛(Buprenex,1mg/kg,i.p.)。根据批准的程序进行开颅术,并且将1μl的1:1AAV混合物(1x1013Vg/ml的sMecp2-SpCas9;6x1012Vg/ml的DNMT 3xsgRNA;3-5x1012Vg/ml的hSyn-GFP-KASH)注射进:背侧齿状脑回(前/后:-1.7;中间外侧:0.6;背侧/腹侧:-2.15)和/或腹侧齿状脑回(前/后:-3.52;中间外侧:2.65;背侧/腹侧:-3)中。对于体内电生理学记录实验,病毒注射坐标是(前囱)侧面3mm和后部缝合线前面1mm。使用德雷梅尔钻子将头骨变薄,伴随偶尔用盐水冷却,并且将剩余的硬脑膜使用填充有悬浮于矿物油中的病毒的玻璃微量移液器穿刺。在相邻位点处在200-250μm的深度处进行若干次(3-4)注射。将体积为150-200nl的病毒混合物以75nl/min速率注射在每个位点。在每次注射后,该移液管保持在适当位置持续3-5分钟,之后再撤回以防止泄漏。对切口进行缝合,并且在手术后给予适当的术后镇痛剂(美洛昔康,1-2mg/kg)持续三天。

  体内双光子指导的靶向松散膜片记录(loose patch recording)

  病毒注射两周后,将小鼠用于电生理学实验。将小鼠用2%异氟烷麻醉,并且使用0.8%异氟烷维持。将皮肤切离,用sugi清洗,并且使用胶水和牙科用丙烯酸类将金属顶板附接到头骨上,并且将2mm x2mm开颅术在初级视皮层(V1)上进行。然后将暴露的区域用在人工脑脊液(aCSF;140mM NaCl、5mM KCl、2mM CaCl2、1mM MgCl2、0.01mM EDTA、10mM HEPES、10mM葡萄糖;pH 7.4)中的1.5%琼脂糖薄层覆盖。将抗体温度在实验期间用加热毯保持在37.5℃。

  使用萨特P-2000激光拉制仪(萨特仪器(Sutter Instruments))拉制硼硅酸盐移液管(WPI)。顶圆直径是1μm左右,而电阻是在3-5MΩ之间。使用Matlab(迈斯沃克公司(MathWorks))编写的控制MultiClamp700B放大器(阿克森(Axon))的定制软件(网络棱镜(Network Prism),苏尔实验室(Sur lab)进行记录。将玻璃移液管电极以20°-35°角度插入脑中,并且将Ag/AgCl接地电极片(华纳仪器(Warner Instruments))定位在与脑和目标相同的溶液中。对于荧光可视化,将移液管用亚历克萨荧光染料594(分子探针公司(Molecular Probes))填充。使用10x透镜将移液管首先靶向于注射部位,并且然后使用25x透镜经由在770nm处的同时双光子成像而靶向于单独的GFP+细胞。通过在快速的时变5mV指令电压脉冲期间在电压钳中观察到的阻力偏转来检测细胞接近度。一旦电阻已经增加5-10MΩ,则放大器切换至电流钳,并且尖峰在零注射电流的情况下在4KHz的贝塞尔过滤器和300Hz的AC过滤器下被记录。事后将病毒注射的脑进行灌注,并且进行免疫组织化学法。

  视觉刺激和来自体内双光子指导的靶向松散膜片记录的数据分析

  为了评估取向选择性和基因组被编辑的神经元的调谐,我们使用Matlab PsychToolbox-3编写的定制软件呈现取向光栅。将光栅优化以用于细胞响应性,并且通过以20度梯级从0-360度分级取向来呈现,其中对于144秒的总呈现时长,每个光栅呈现的前面为持续4秒“关”,随后为4秒“开”。将数据直接采集入Matlab中并保存为.mat文件。尖峰检测是经由使用人工定义的阈值的分析例程、随后使用尖峰形状模板匹配以用于进一步验证来进行的。将每个尖峰标记并且以图形用户界面显示在屏幕上,在该界面上它被实验者手动评论假阳性和阴性。然后将响应于每个刺激的尖峰时间基于它们相对于病毒刺激的时间设置而分组为“开”或“关”期,并且对于各个刺激的“开”尖峰递减在相等时期期间观察到的“关”尖峰数目。对于取向实验,#尖峰/刺激=(#尖峰“开”)-(#尖峰“关”),因为“开”和“关”时期是相同的持续时间。

  对于每一种感兴趣的细胞,使用这些方法来收集对于每个定向刺激(0至360度,以20度为梯级)的响应。然后对于每个试验将这些响应转变为取向对响应的“调谐曲线”。通过针对优选取向来取矢量平均值根据下式计算取向选择性指数(OSI):

  组织制备和细胞核的纯化

  将整个海马体或齿状脑回在冰冷的DPBS(生命科学公司)中快速解剖,并且冲击冷冻在干冰上。对于细胞核纯化,使用2ml Dounce均质机(西格玛公司)将组织在2ml冰冷的匀化缓冲液(HB)(320mM蔗糖、5mM CaCl、3mM Mg(Ac)2、10mM Tris pH 7.8、0.1mM EDTA、0.1%NP40、0.1mM PMSF、1mMβ-巯基乙醇)中轻柔地匀化;用研杵A进行25次,随后用研杵B进行25次。接着,将3ml的HB添加至总计5ml,并且保持在冰上持续5min。对于梯度离心,添加5ml的50%OptiPrepTM密度梯度介质(西格玛公司),该介质包含5mM CaCl、3mM Mg(Ac)2、10mM Tris pH 7.8、0.1mM PMSF、1mMβ-巯基乙醇,并且进行混合。将裂解物轻柔地加载在圆锥形30ml离心管(贝克曼库尔特公司(Beckman Coulter),SW28转子)中的10ml 29%等渗OptiPrepTM溶液的顶部。在10,100xg(7,500rpm)下将样品在4℃离心30min。去除上清液,并且将核沉淀轻柔地重悬于65mMβ-甘油磷酸盐(pH 7.0)、2mM MgCl2、25mM KCl、340mM蔗糖和5%甘油中。使用亮视野显微镜术控制纯化核的数量和质量。

  细胞核分选

  将纯化的GFP-阳性(GFP+)和阴性(GFP-)的完整核用DyeCycleTM宝石红染色剂(1:500,生命科技公司)共标记,并且使用BD FACSAria III(科赫研究所流式细胞术核心(Koch Institute Flow Cytometry Core),MIT)进行分选。将GFP+和GFP-核收集在用1%BSA包被且包含400μl重悬缓冲液(65mMβ-甘油磷酸盐pH 7.0、2mM MgCl2、25mM KCl、340mM蔗糖和5%甘油)的1.5ml艾本德管中。在分选之后,将所有样品保持在冰上并且在10,000xg下在4℃离心20min。将核沉淀储存在-80℃或直接用于下游加工。

  基因组DNA提取和SURVEYORTM测定

  对于sgRNA的功能测试,将50%-70%汇合的N2a细胞用单一PCR扩增的sgRNA和SpCas9载体共转染。将仅用SpCas9转染的细胞充当阴性对照。转染后48h收获细胞,并且根据制造商的方案使用DNeasy血液&组织试剂盒(凯杰公司(Qiagen))提取DNA。为了从AAV1转导的初级神经元分离基因组DNA,在AAV转导后7天根据制造商的说明使用DNeasy血液&组织试剂盒。

  将分选的核或解剖的组织在裂解缓冲液(10mM Tris pH 8.0、10mM NaCl、10mM EDTA、0.5mM SDS、蛋白酶K(PK,1mg/ml)和RNA酶A)中在55℃裂解持续30min。接着,根据标准程序进行氯仿-苯酚提取,随后用乙醇沉淀DNA。最后将DNA重悬于TE缓冲液(10mM Tris pH 8.0、0.1mM EDTA)中并且用于下游分析。通过SURVEYORTM核酸酶测定(转基因组学公司(Transgenomics)使用列于附表2中的PCR引物进行单独sgRNA的功能测试。如前所述,进行谱带强度定量11。

  RNA文库制备和测序

  在SpCas9连同靶向Mecp2的指导物(4个动物)或SpCas9连同靶向lacZ的gRNA(4个动物)的双侧病毒递送后两周,将齿状脑回在冰冷的DPBS(生命科学公司)中快速解剖,并且立即转移至RNA-later溶液(安比昂(Ambion))中。24小时后将在4℃的组织移到-80℃。将100个靶向的神经元核的群体经FACS分选到10μl TCL缓冲液中,该缓冲液补充有1%2-巯基乙醇(凯杰公司)。在离心后,将样品被立即冷冻在-80℃。将RNA通过AMPure RNAcleanXP SPRI珠粒(贝克曼库尔特基因组公司(Beckman Coulter Genomics))按照制造商的说明进行纯化,并且用80%乙醇洗涤三次,省略最终洗脱。将带有捕获的RNA的珠粒进行空气干燥并且立即处理用于cDNA合成。将不具有核的样品用作阴性对照。在根据SMART-seq2方案12的cDNA文库制备中,对于每个动物使用三个群体样品,总计24个群体样品,该方案仅将逆转录酶用0.1ul的Maxima H Minus酶(200U/ul,赛默飞世尔科技公司)替代,并且将PCR反应按比例缩小到25ul体积。使用内斯特里(Nextera)XT DNA样品制备试剂盒(亿明达(Illumina))采用以下修饰进行标记反应和最终的PCR扩增。所有反应体积以4倍按比例缩小,并且在PCR扩增步骤后通过取2.5ul的各个样品将文库聚池化。将池化的文库使用两轮0.7体积的AMPure XP SPRI珠粒清除物(bead cleanup)(贝克曼库尔特基因组公司)进行清洁并且进行尺寸选择。将样品加载在高灵敏度DNA芯片(安捷伦)上以检查该该文库的质量,而定量是用Qubit高灵敏度DNA试剂盒(英杰公司(Invitrogen))进行的。将池化的文库稀释到4nM和12pmol的最终浓度,并且使用亿明达Miseq以75bp配对末端读数(paired end reads)进行测序。

  RNA文库数据分析

  基于小鼠mm9UCSC基因组和已知的基因转录组13确立Bowtie2指数,并且使用Bowtie2采用以下命令行选项将配对末端读数直接地与这个指数进行比对:-q--phred33-quals-n 2-e 99999999-125-I 1-X 1000-a-m 200-p 4--chunkmbs 512。接着,以默认参数对于由Bowtie2建立的比对来运行RSEM v1.27,以估计表达水平。对于各基因,将RSEM的基因水平表达估计值(τ)乘以1,000,000以获得转录物/百万(TPM)估计值,并且将TPM估计值通过取log2(TPM+1)转化为对数-空间(log-space)。基因被认为是被检测到的,如果它们的经转化的表达水平等于或高于2(在log2(TPM+1)标度上)。如果文库具有低于8000个基因被检测到,则过滤掉该文库。基于该标准,将4个文库过滤并从下游分析中排除。为了发现对照动物与表达Mecp2sgRNA的动物之间差异性表达的基因,在20个随机排列运行中使用学生t-检验(Matlab V2013b)和交叉分析,其中在每一运行中来自每个动物的一个文库被随机选择排除(这导致每次在t-检验中使用总计12个文库)。针对每个样品,对所有的具有高于0.9分位数(通常在5log2(TPM+1)左右)的平均表达水平的基因运行t-检验。然后,选择在多于三分之一的排列运行中具有显著性(p<0.01)的基因。使用分层聚簇(Matlab V2013b)跨样品将这些基因的log2(TPM+1)表达水平进行聚簇。

  免疫荧光染色

  细胞培养:对于初级神经元的免疫荧光染色,在病毒递送后7天,在室温下将细胞用4%多聚甲醛(PFA)进行固定持续20分钟。在用PBS洗涤3次后,将细胞在室温下用在PBS中5%的正常山羊血清(NGS)(生命技术公司)、5%驴血清(DS)(西格玛公司)和0.1%Triton-X100(西格玛公司)进行封闭持续30分钟。将细胞与在2.5%NGS、2.5%DS和0.1%Triton-X100中的一级抗体在室温下孵育1小时,或在4℃孵育过夜。在用PBST洗涤3次后,将细胞与二级抗体在室温下孵育1小时。最后,将盖玻片使用具有DAPI的VECTASHIELD HardSet封固剂(Mounting Medium)(载体实验室(Vector Laboratories))进行封固,并且使用蔡司(Zeiss)AxioCam Ax10显微镜和Axiocam MRm摄像机进行成像。使用Zen 2012软件(蔡司)处理图像。通过使用ImageJ软件1.48h和神经元检测器插件(Neuron detector plugin)进行定量。

  在病毒递送后4周将小鼠通过致死剂量的氯胺酮/甲苯噻嗪处死,并且依次心脏灌注PBS、PFA。将固定的组织使用振动切片机(莱卡(Leica),VT1000S)进行切片。接着,将30μm切片在柠檬酸钠缓冲液(10mM脱水柠檬酸三钠,0.05%吐温20,pH 6.0)中煮沸2min,并且在室温下冷却20min。将切片用在TBST(137mM NaCl,20mM Tris pH 7.6,0.2%吐温-20)中的4%正常山羊血清(NGS)封闭1小时。使用薄片切片机(莱卡RM2125RTS)将石蜡切片切到8μm,并且如先前所述进行染色14。

  将切片与稀释于具有4%NGS的TBST中的一级抗体在4℃孵育过夜。在TBST中洗涤3次后,将样品与二级抗体孵育。在用TBST洗涤3次后,将切片使用具有DAPI的VECTASHIELD HardSet封固剂进行封固,并且用共聚焦显微镜(蔡司LSM 710,Ax10ImagerZ2,Zen 2012软件)可视化。

  使用以下一级抗体:兔抗-Dnmt3a(圣克鲁兹(Santa Cruz),1:100);兔抗-MeCP2(密理博,1:200);小鼠抗-NeuN(密理博公司,1:50-1:400);鸡抗-GFAP(艾碧康,1:400);小鼠抗-Map2(西格玛,1:500);鸡抗-GFP(阿维斯实验室(Aves labs),1:200-1:400);小鼠抗-HA(细胞信号传导,1:100)。二级抗体:亚历克萨荧光染料568或633(生命技术公司,1:500-1:1,000)。

  测定的定量

  根据制造商的说明使用测定(生命技术公司)对对照和转导的初级神经元进行染色。为了避免来自GFP-KASH表达的GFP信号的干扰,将细胞仅针对DEAD(乙锭均二聚物)和DAPI(所有细胞)进行染色。将染色的细胞使用荧光显微镜进行成像,并且通过使用ImageJ 1.48h软件和神经元检测器插件对DEAD、GFP和DAPI阳性细胞进行计数。

  Western印迹分析

  将转导的初级皮层神经元(24孔,在病毒递送后7天)和转导的组织样品(在病毒递送后4周)用50μL的冰冷的RIPA缓冲液(细胞信号传导公司(Cell Signaling))进行裂解,该缓冲液包含0.1%SDS和蛋白酶抑制剂(罗氏,西格玛)。在Bioruptor声处理器(戴基诺德(Diagenode))中对细胞裂解物进行声处理持续5min,并且使用BCA蛋白测定试剂盒(皮尔斯生物技术公司(Pierce Biotechnology,Inc.))确定蛋白浓度。将蛋白裂解物溶解于SDS-PAGE样品缓冲液中,在还原条件下在4%-15%Tris-HCl凝胶(伯乐公司)上进行分离,并且通过Western印迹进行分析,该Western印迹使用一级抗体:兔抗-Dnmt3a(圣克鲁兹(Santa Cruz),1:500)、小鼠抗-Dnmt1(罗福斯生物制剂(Novus Biologicals),1:800)、兔抗-Mecp2(密理博,1:400),兔抗-微管蛋白(细胞信号传导公司,1:10,000),随后使用二级抗-小鼠和抗-兔HRP抗体(西格玛-奥德里奇公司,1:10,000)。将GAPDH直接地用兔HRP偶联的抗-GAPDH抗体(细胞信号传导公司,1:10,000)可视化。微管蛋白或GAPDH充当上样对照。将印迹用具有ImageLab 4.1软件的ChemiDocTMMP系统(BioRad)成像,并且使用ImageJ软件1.48h进行定量。

  延迟性情境性恐惧条件反射(DCFC)

  在双侧SpCas9/DNMT 3xsgRNA递送到12周龄C57BL/6N雄性小鼠的背侧和腹侧的齿状脑回中后8周,使动物对实验者和行为室适应7天。将注射SpCas9/GFP-KASH的同窝仔充当对照。在DCFC的第1天,测试之前和之后将小鼠笼子放置在隔离的接待室中以使小鼠离开听觉线索。将单独的小鼠放置到FC腔室(医学联合公司(Med Associates Inc.))并且进行12min的适应期。在适应之后,将小鼠放回它们的家笼中。第二天(训练日),将单独的小鼠放置在该腔室中,并且允许适应4分钟。在另一个20秒(音调前)间隔后,85dB、2.8kHz水平的音调(听觉线索)呈现20秒,随后为18秒延迟间隔,之后呈现电击足底(0.5mA,2秒)。在电击足底之后,40秒间隔(音调后/电击)先于下一个起始于20秒音调前时期的相同试验。将训练试验重复6次,之后将小鼠放回它们的家笼中。在第3天(测试日),将小鼠首先放置在条件化情境腔室中持续3分钟。接着,小鼠经历4x100秒测试试验,这些试验起始于20秒间隔,之后为20秒音调和60秒音调后间隔。最后,将小鼠放置在改变的情境条件化腔室中(平地板对网格、四聚体腔室对七聚体腔室,香草醛气味),并且重复该测试试验。对木僵行为进行记录,并且手动地进行盲离线分析(blind off-line)并用诺达思(Noldus)EthoVision XT软件(诺达思信息技术(Noldus Information Technology))证实。

  深度测序分析和indel检测

  使用CRISPR设计工具(http://crispr.mit.edu/)以发现针对脑中由CRISPR-SpCas9靶向的DNMT家族基因而言潜在的脱靶。在病毒递送后12周将来自齿状脑回的靶细胞核经FACS分选,并且将基因组DNA如以上所述的进行纯化。对于每个感兴趣基因,将在CRISPR靶位点侧翼的基因组区通过融合PCR方法进行扩增,以将亿明达P5适配子连同唯一样品特异性条形码附接至靶扩增子(对于中靶-和脱靶-引物,参见附表3)15。将带条形码并纯化的DNA样品通过Qubit 2.0荧光计(生命技术公司)定量并且以等摩尔比率池化。然后用亿明达MiSeq个人测序仪(生命技术公司)对测序文库进行测序,其中读数(read)长度为300bp。

  如先前在15中所述的对MiSeq读数进行分析。简言之,将读数通过Phred质量(Q分)进行过滤,并且使用史密斯-沃特曼(Smith-Waterman)算法与靶位点的上游和下游50个核苷酸的基因组区域进行比对。Indel被估计处于从靶位点(总共30bp)的上游5个核苷酸到下游5个核苷酸的比对区域中。使用针对每个样品的阴性对照将indel的包含或排除估计为假定的切割事件。我们使用来自阴性对照样品的数据的每靶区域每读数误差率(per-target-region-per-read error rate),计算了具有含真indel的靶区域的读数部分的最大似然估计(MLE)。针对每个靶标的MLE分数和切割率列于附表1中。

  统计分析

  以最少两个独立生物重复进行所有实验。使用学生双尾t-检验用Prism6(GraphPad)进行统计。

  附表

  附表1.对于DNMT靶向的脱靶分析

  (SEQID号:___至___)

  附表2.在SURVEYOR测定中使用的PCR引物

  附表3.用于中靶-和脱靶-基因组座位扩增的引物

  参考文献

  1.奥斯特伦德(Ostlund),C.等人,核骨架和细胞骨架(LINC)复合物蛋白的接头的动力学和分子相互作用(Dynamics and molecular interactions of linker of nucleoskeleton and cytoskeleton(LINC)complex proteins).《细胞科学杂志》(J Cell Sci)122,4099-4108(2009)。

  2.格雷(Gray)S.J等人,在外周和中枢神经系统中使用自我互补载体优化启动子以用于重组腺-相关病毒-介导的基因表达(Optimizing promoters for recombinant adeno-associated virus-mediated gene expression in the peripheral and central nervous system using self-complementary vectors).《人类基因疗法》(Hum Gene Ther)22,1143-1153(2011)。

  3.莱维特(Levitt),N.、布里格斯(Briggs),D.、吉尔(Gil),A.&普劳德富特(Proudfoot),N.J.,高效的合成的聚(A)位点的定义(Definition of an efficient synthetic poly(A)site).《基因开发》(Genes Dev)3,1019-1025(1989)。

  4.季聂克(Jinek),M.等人,在自适应细菌免疫中的可编程双重-RNA-指导的DNA核酸内切酶(A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity).《科学》(Science)337,816-821(2012)。

  5.丛(Cong),L.等人,使用CRISPR/Cas系统进行的多元基因组工程化(Multiplex genome engineering using CRISPR/Cas systems).《科学》(Science)339,819-823(2013)。

  6.麦克卢尔(McClure),C.,科尔(Cole),K.L.,伍尔夫(Wulff),P.,克卢格曼(Klugmann),M.&默里(Murray),A.J.,重组腺相关病毒载体的产生和滴度测定(Production and titering of recombinant adeno-associated viral vectors).《可视化实验杂志》(J Vis Exp),e3348(2011)。

  7.科纳曼(Konermann),S.等人,哺乳动物内源性转录和表观遗传状态的光控制(Optical control of mammalian endogenous transcription and epigenetic states).《自然》(Nature)500,472-476(2013)。

  8.班克(Banker),G.&戈斯林(Goslin),K.,神经元细胞培养物中的发育(Developments in neuronal cell culture).《自然》(Nature)336,185-186(1988)。

  9.斯维希(Swiech),L.等人,CLIP-170和IQGAP1协作地调节树突形态(CLIP-170and IQGAP1cooperatively regulate dendrite morphology).《神经科学杂志》(J Neurosci)31,4555-4568(2011)。

  10.肖尔(Sholl),D.A.,在猫的视觉和运动皮质的神经元中的树突组织(Dendritic organization in the neurons of the visual and motor cortices of the cat).《解剖学杂志》(J Anat)87,387-406(1953)。

  11.兰(Ran),F.A.等人,使用CRISPR-Cas9系统进行基因组工程化(Genome engineering using the CRISPR-Cas9system).《自然方案》(Nature protocols)8,2281-2308(2013)。

  12.皮切利(Picelli),S.等人,用于灵敏地分析在单细胞中的全长转录组的Smart-seq2(Smart-seq2for sensitive full-length transcriptome profiling in single cells).《自然方法》(Nature methods)10,1096-1098(2013)。

  13.藤田(Fujita),P.A.等人,UCSC基因组浏览器数据库:更新2011(The UCSC Genome Browser database:update 2011).《核酸研究》(Nucleic acids research)39,D876-882(2011)。

  14.齐戈尼斯(Tzingounis),A.V.等人,KCNQ5钾通道介导小鼠海马体中超极化后电流的组分(The KCNQ5potassium channel mediates a component of the afterhyperpolarization current in mouse hippocampus).《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the United States of America)107,10232-10237(2010)。

  15.徐(Hsu),P.D.等人,RNA-指导的Cas9核酸酶的DNA靶向特异性(DNA targeting specificity of RNA-guided Cas9nucleases).《自然生物技术》(Nature biotechnology)31,827-832(2013)。

  16.邱(Qiu),P.等人,使用Surveyor核酸酶进行的突变检测(Mutation detection using Surveyor nuclease).《生物技术》(BioTechniques)36,702-707(2004)。

  实例41:对核标记技术的进一步研究

  此实例涉及Cas9的表位标记。简言之,我们发现三重表位标签(确切地为3xHA)改进检测信号。

  材料和方法

  细胞培养和转染

  在37℃下,伴随5%CO2孵育,将人类胚肾(HEK)细胞系293FT(生命技术公司)或小鼠Hepa1-6(西格玛-奥德里奇公司)细胞系维持在补充有10%胎牛血清(海可隆公司(HyClone))、2mM GlutaMAX(生命技术公司)、100U/mL青霉素及100μg/mL链霉素的杜尔贝科改良伊格尔培养基(Dulbecco’s modified Eagle’s Medium)(DMEM)中。

  将细胞以120,000个细胞/孔的密度在转染之前24小时接种到24-孔板(康宁(Corning))上。遵循制造商推荐的方案,使用Lipofectamine 2000(生命技术公司)在80%-90%汇合率时转染细胞。将总共500ng Cas9质粒以及100ng U6-sgRNA PCR产物进行转染。

  用于基因组修饰的SURVEYOR核酸酶测定

  将293FT和HUES62细胞用DNA进行转染,如上所述。转染后,在基因组DNA提取之前,将细胞在37℃下孵育72小时。遵循制造商的方案,使用QuickExtract DNA提取溶液(Epicentre)提取基因组DNA。简言之,将沉淀的细胞重悬于QuickExtract溶液中并在65℃下孵育15分钟,68℃下孵育15分钟,并且在98℃下孵育10分钟。

  对于每个基因而言,将在CRISPR靶位点侧翼的基因组区域进行PCR扩增,并且遵循制造商的方案,使用QiaQuick Spin柱(凯杰公司(Qiagen))纯化产物。将总共400ng的纯化的PCR产物与2微升10X Taq DNA聚合酶PCR缓冲液(Enzymatics公司)和超纯水混合,至终体积为20微升,并使其经受重退火过程,以使得可以形成异源双链体:95℃持续10min,以-2℃/s从95℃降至85℃,以-0.25℃/s从85℃降至25℃,并且在25℃保持1分钟。重退火后,遵循制造商推荐的方案,将产物用SURVEYOR核酸酶和SURVEYOR增强子S(转基因组学公司(Transgenomics))处理,并且在4%-20%Novex TBE聚丙烯酰胺凝胶(生命技术公司)上进行分析。将凝胶用SYBR Gold DNA染色剂(生命技术公司)染色30分钟并用Gel Doc凝胶成像系统(伯乐公司)成像。基于相对条带强度进行量化。通过式100×(1-(1-(b+c)/(a+b+c))1/2)确定Indel百分比,其中a是未消化的PCR产物的积分强度,而b和c是每个切割产物的积分强度。

  Western印迹

  将HEK 293Ft细胞转染并裂解于1X RIPA缓冲液(西格玛-奥德里奇)中,该缓冲液补充有蛋白酶抑制剂(罗氏)。将裂解物加载到Bolt 4%-12%Bis-Tris Plus凝胶(英杰公司)上,并且转移至硝酸纤维素膜上。将膜在Tris-缓冲盐水中封闭,该盐水包含0.1%吐温-20和5%封闭剂(G-生物科学(G-Biosciences))。将膜用兔抗-FLAG(1:5,000,艾碧康)、HRP-缀合的抗-GAPDH(1:5,000,细胞信号传导技术公司)以及HRP-缀合的抗兔(1:1,000)抗体进行探测,并且用Gel Doc XR+系统(伯乐公司)可视化。

  参考文献

  班克(Banker)G、戈斯林(Goslin)K,神经元细胞培养物中的发育(Developments in neuronal cell culture).《自然》(Nature).1988年11月10日;336(6195):185-6。

  比德尔(Bedell)、V.M.等人,使用高效率TALEN系统进行体内基因组编辑(In vivo genome editing using a high-efficiency TALEN system).《自然》(Nature)491,114-U133(2012)。

  布哈雅(Bhaya),D.、戴维森(Davison),M.&巴郎镐(Barrangou),R.,细菌和古细菌中的CRISPR-Cas系统:用于获得性防御和调节的通用小RNA(CRISPR-Cas systems in bacteria and archaea:versatile small RNAs for adaptive defense and regulation).《遗传学年评》(Annu Rev Genet)45,273-297(2011)。

  博维斯-沃佐维奇(Bobis-Wozowicz),S.、奥斯克(Osiak),A.、拉赫曼(Rahman),S.H.&凯思曼(Cathomen),T.,使用锌指核酸酶的多能干细胞中的靶向基因组编辑(Targeted genome editing in pluripotent stem cells using zinc-finger nucleases).《方法》(Methods)53,339-346(2011)。

  博赫(Boch),J.等人,打破TAL-III型效应器的DNA结合特异性的密码(Breaking the code of DNA binding specificity of TAL-type III effectors).《科学》(Science)326,1509-1512(2009)。

  伯根哈根(Bogenhagen),D.F.&布朗(Brown),D.D.,转录终止所需的非洲蟾蜍5S DNA中的核苷酸序列(Nucleotide sequences in Xenopus 5S DNA required for transcription termination).《细胞》(Cell)24,261-270(1981)。

  布尔特曼(Bultmann),S.等人,通过组合设计者TALE和抑制表观遗传修饰剂而靶向转录激活沉默的oct4多能性基因(Targeted transcriptional activation of silent oct4pluripotency gene by combining designer TALEs and inhibition of epigenetic modifiers).《核酸研究》(Nucleic Acids Res)40,5368-5377(2012)。

  卡尔松(Carlson),D.F.等人,家畜中的有效的TALEN介导的基因敲除(Efficient TALEN-mediated gene knockout in livestock).《美国国家科学院院刊》(Proc Natl Acad Sci U S A)109,17382-17387(2012)。

  陈(Chen),F.Q.等人,使用ssDNA寡核苷酸用锌指核酸酶进行高效基因组编辑(High-frequency genome editing using ssDNA oligonucleotides with zinc-finger nucleases).《自然方法》(Nat Methods)8,753-U796(2011)。

  丘(Cho),S.W.、吉姆(Kim),S.、吉姆(Kim),J.M.&吉姆(Kim),J.S.,在人细胞中用Cas9RNA-指导的核酸内切酶进行的靶标基因组工程化(Targetedgenome engineering in human cells with the Cas9RNA-guided endonuclease).《自然生物技术》(Nat Biotechnol)31,230-232(2013)。

  克里斯汀(Christian),M.等人,用TAL效应器核酸酶靶向DNA双链断裂(Targeting DNA double-strand breaks with TAL effector nucleases).《遗传学》(Genetics)186,757-761(2010)。

  丛(Cong),L.等人,使用CRISPR-Cas系统进行的多元基因组工程化(Multiplex genome engineering using CRISPR/Cas systems).《科学》(Science)339,819-823(2013)。

  戴尔特彻瓦(Deltcheva),E.等人,通过反式编码的小RNA和宿主因子RNA酶III进行的CRISPR RNA成熟(CRISPR RNAmaturation by trans-encoded small RNA and host factor RNase III).《自然》(Nature)471,602-607(2011)。

  德沃(Deveau),H.、加尔诺(Garneau),J.E.&莫万诺(Moineau),S.,CRISPR-Cas系统及其在噬菌体-细菌相互作用中的角色(CRISPR-Cas system and its role in phage-bacteria interactions).微生物学年鉴(Annu Rev Microbiol)64,475-493(2010)。

  丁(Ding),Q.等人,一种用于产生人类干细胞基的疾病模型的TALEN基因组编辑系统(A TALEN genome-editing system for generating human stem cell-based disease models).《细胞-干细胞》(Cell Stem Cell)12,238-251(2013)。

  加尔诺(Garneau),J.E.等人,CRISPR-Cas细菌免疫系统切割噬菌体和质粒DNA(The CRISPR-Cas bacterial immune system cleaves bacteriophage and plasmid DNA).《自然》(Nature)468,67-71(2010)。

  加斯诺斯(Gasiunas),G.、巴郎镐(Barrangou),R.、霍瓦特(Horvath),P.&西克斯尼斯(Siksnys),V.,Cas9-crRNA核糖核蛋白复合体在细菌中针对获得性免疫介导特异的DNA切割(Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria).《美国国家科学院院刊》(Proc Natl Acad Sci U S A)109,E2579-2586(2012)。

  格尤特思(Geurts),A.M.等人,经由胚胎微注射锌指核酸酶敲除大鼠(Knockout Rats via Embryo Microinjection of Zinc-Finger Nucleases).《科学》(Science)325,433-433(2009)。

  格雷(Gray)SJ、福蒂(Foti)SB、施瓦兹(Schwartz)JW、帕夏博纳(Bachaboina)L、泰勒-布雷克(Taylor-Blake)B、科尔曼(Coleman)J、埃莱尔(Ehlers)MD、泽尔卡(Zylka)MJ、麦克考恩(McCown)TJ、萨穆尔斯基(Samulski)RJ.,使用自互补载体优化外周和中枢神经系统中的重组腺相关病毒介导的基因表达的启动子(Optimizing promoters for recombinant adeno-associated virus-mediated gene expression in the peripheral and central nervous system using self-complementary vectors).《人类基因治疗》(Hum Gene Ther.)2011年9月;22(9):1143-53.doi:10.1089/hum.2010.245。

  格斯钦(Guschin),D.Y.等人,用于监测内源性基因修饰的快速和一般分析(A rapid andgeneral assay formonitoring endogenousgenemodification).《方法分子生物学》(Methods Mol Biol)649,247-256(2010)。

  黑斯蒂(Hasty),P.、里维拉-佩雷斯(Rivera-Perez),J.&布兰得利(Bradley),A.,胚胎干细胞中的基因靶向所需的同源性长度(The length of homology required for gene targeting in embryonic stem cells).《分子与细胞生物学》(Mol Cell Biol)11,5586-5591(1991)。

  霍瓦特(Horvath),P.&巴尔朗勾(Barrangou),R.,CRISPR-Cas,细菌和古细菌的免疫系统(CRISPR-Cas,the immune system of bacteria and archaea).《科学》(Science)327,167-170(2010)。

  徐(Hsu),P.D.&张(Zhang),F.,使用靶向的基因组工程技术剖分神经功能(Dissecting neural function using targeted genome engineering technologies).《ACS化学神经科学》(ACS Chem Neurosci)3,603-610(2012)。

  黄(Hwang),W.Y.等人,使用CRISPR-Cas系统在斑马鱼中进行有效的基因组编辑(Efficient genome editing in zebrafish using a CRISPR-Cas system).《自然生物技术》(Nat Biotechnol)31,227-229(2013)。

  江(Jiang),W.、比卡德(Bikard),D.、科克斯(Cox),D.、张(Zhang),F.&马拉菲尼(Marraffini),L.A.,使用CRISPR-Cas系统对细菌基因组进行RNA指导的编辑(RNA-guided editing of bacterial genomes using CRISPR-Cas systems).《自然生物技术》(Nat Biotechnol)31,233-239(2013)。

  季聂克(Jinek),M.等人,在自适应细菌免疫中的可编程双重-RNA-指导的DNA核酸内切酶(A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity).《科学》(Science)337,816-821(2012)。

  季聂克(Jinek),M.等人,人类细胞中的RNA编程的基因组编辑(RNA-programmed genome editing in human cells).eLife 2,e00471(2013)。

  卡普利特(Kaplitt),M.G.等人,用携带腺相关病毒(AAV)的GAD基因对帕金森病进行基因治疗的安全性与可容许性:开放标签的I期试验(Safety and tolerability of gene therapy with an adeno-associated virus(AAV)borne GAD gene for Parkinson’s disease:an open label,phase I trial).《柳叶刀》(Lancet).2007年6月23日;369(9579):2097-105。

  莱维特(Levitt)N.、布里格斯(Briggs)D.、吉尔(Gil)A.、普劳德富特(Proudfoot)N.J.,高效的合成的聚(A)位点的定义(Definition of an efficient synthetic poly(A)site).《基因开发》(Genes Dev)1989;3:1019-1025。

  刘(Liu)D、费舍尔(Fischer)I.,两个替代性启动子指导大鼠微管相关蛋白质1B基因的神经元特异性表达(Two alternative promoters direct neuron-specific expression of the rat microtubule-associated protein 1B gene).《神经科学杂志》(J Neurosci.)1996年8月15日;16(16):5026-36。

  洛佩斯(Lopes),V.S.等人,使用腺相关病毒用大MYO7A cDNA进行的视网膜基因治疗(Retinal gene therapy with a large MYO7A cDNA using adeno-assocaited virus).《基因治疗》(Gene Ther),2013年1月24日,doi:10.1038/gt 2013.3.[Epub优先出版]

  马赫福兹(Mahfouz),M.M.等人,具有新颖的DNA结合特异性的从头工程化的转录激活因子样效应器(TALE)杂合核酸酶产生双链断裂(De novo-engineered transcription activator-like effector(TALE)hybrid nuclease with novel DNA binding specificity creates double-strand breaks).《美国国家科学院院刊》(Proc Natl Acad Sci U S A)108,2623-2628(2011)。

  马卡洛夫(Makarova),K.S.等人,CRISPR-Cas系统的进化与分类(Evolution and classification of the CRISPR-Cas systems).《自然微生物学综述》(Nat Rev Microbiol)9,467-477(2011)。

  玛丽,P.等人,经由Cas9进行RNA-指导的人类基因组工程化(RNA-guided human genome engineering via Cas9).《科学》(Science)339,823-826(2013)。

  麦克卢尔(McClure)C、科尔(Cole)KL、伍尔夫(Wulff)P、克卢格曼(Klugmann)M、默里(Murray)AJ,重组腺相关病毒载体的产生和滴度测定(Production and titering of recombinant adeno-associated viral vectors).《可视化实验杂志》(J Vis Exp),2011年11月27日;(57):e3348.doi:10.3791/3348。

  米凯利斯(Michaelis),L.M.,Maud“Die kinetik der invertinwirkung.”《生物化学》(Biochem.)z(1913)。

  米勒(Miller),J.C.等人,用于高度特异的基因组编辑的改进的锌指核酸酶构造(An improved zinc-finger nuclease architecture for highly specific genome editing).《自然生物技术》(Nat Biotechnol)25,778-785(2007)。

  米勒(Miller),J.C.等人,用用于有效基因组编辑的TALE核酸酶构造(A TALE nuclease architecture for efficient genome editing).《自然生物技术》(Nat Biotechnol)29,143-148(2011)。

  莫斯科(Moscou),M.J.&保达诺夫(Bogdanove),A.J.,简单的密码管理由TAL效应器进行的DNA识别(A simple cipher governs DNA recognition by TAL effectors).《科学》(Science)326,1501(2009)。波蒂厄斯(Porteus),M.H.&巴尔的摩(Baltimore),D.,嵌合的核酸酶刺激人类细胞中的基因靶向(Chimeric nucleases stimulate gene targeting in human cells).《科学》(Science)300,763(2003)。

  墨索里诺(Mussolino),C.等人,新颖的TALE核酸酶支架允许与较低的毒性组合的较高的基因组编辑活性(A novel TALE nuclease scaffold enables high genome editing activity in combination with low toxicity).《核酸研究》(Nucleic acids research)39,9283-9293(2011)。

  纳斯瓦尼(Nathwani),A.C.等人,腺病毒相关病毒载体介导的B型血友病的基因转移(Adenovirus-associated virus vector-mediated gene transfer in hemophilia B).《新英格兰医学杂志》(N Engl J Med.)2011年12月22日;365(25):2357-65.doi:10.1056/NEJMoa1108046.电子出版日2011年12月10日。

  奥利韦拉(Oliveira),T.Y.等人,转位捕获测序:一种用于高通量标绘染色体重排的方法(Translocation capture sequencing:a method for high throughput mapping of chromosomal rearrangements).《免疫学方法杂志》(J Immunol Methods)375,176-181(2012)。

  佩雷斯(Perez),E.E.等人,使用锌指核酸酶通过基因组编辑在CD4(+)T细胞中建立HIV-1抗性(Establishment of HIV-1resistance in CD4(+)T cells by genome editing using zinc-finger nucleases).《自然生物技术》(Nat Biotechnol)26,808-816(2008)。

  齐(Qi),L.S.等人,改变CRISPR作为RNA-指导的平台以用于基因表达的序列特异性控制.《细胞》(Cell)152,1173-1183(2013)。

  雷明顿药物科学(REMINGTON’S PHARMACEUTICAL SCIENCES)(马克出版公司(Mack Pub.Co.),新泽西州1991)

  雷荣(Reyon),D.等人,用于高通量基因组编辑的TALEN的FLASH组装(FLASH assembly of TALENs for high-throughput genome editing).《自然生物技术》(Nat Biotechnol)30,460-465(2012)。

  萨利赫-德哈利(Saleh-Gohari),N.&荷雷德(Helleday),T.,保守同源重组优先修复人类细胞中的处于细胞周期的S期的DNA双链断裂(Conservative homologous recombination preferentially repairs DNA double-strand breaks in the S phase of the cell cycle in human cells).《核酸研究》(Nucleic Acids Res)32,3683-3688(2004)。

  桑德尔(Sander),J.D.等人,通过情境依赖性组装的无选择性锌指核酸酶工程(CoDA)(Selection-free zinc-finger-nuclease engineering by context-dependent assembly(CoDA)).《自然方法》(Nat Methods)8,67-69(2011)。

  萨亚纳(Sanjana),N.E.等人,用于基因组工程的转录激活因子样效应器工具箱(A transcription activator-like effector toolbox for genome engineering).《自然-实验手册》(Nat Protoc)7,171-192(2012)。

  萨普拉诺斯卡斯(Sapranauskas),R.等人,嗜热链球菌CRISPR-Cas系统在大肠杆菌中提供免疫力(The Streptococcus thermophilus CRISPR-Cas system provides immunity in Escherichia coli).《核酸研究》(Nucleic Acids Res)39,9275-9282(2011)。

  沈(Shen),B.等人,经由Cas9/RNA介导的基因靶向产生基因修饰的小鼠(Generation of gene-modified mice via Cas9/RNA-mediated gene targeting).《细胞研究》(Cell Res)23,720-723(2013)。

  斯米蒂斯(Smithies),O.、格雷格(Gregg),R.G.、博格斯(Boggs),S.S.、科拉雷斯基(Koralewski),M.A.&库切尔拉帕提(Kucherlapati),R.S.,提供同源重组将DNA序列插入人类染色体β-珠蛋白座位中(Insertion of DNA sequences into the human chromosomal beta-globin locus by homologous recombination).《自然》(Nature)317,230-234(1985)。

  索德奈尔(Soldner),F.等人,产生在两个早期发作的帕金森蛋白点突变处排他地相异的同基因多能干细胞(Generation of isogenic pluripotent stem cells differing exclusively at two early onset Parkinson point mutations).《细胞》(Cell)146,318-331(2011)。

  高须(Takasu),Y.等人,使用锌指核酸酶mRNA注射靶向诱变家蚕(Targeted mutagenesis in the silkworm Bombyx mori using zinc finger nuclease mRNA injection).《昆虫生物化学与分子生物学》(Insect Biochem Molec)40,759-765(2010)。

  腾格里(Tangri)S等人,具有减少的免疫原性的合理工程化的治疗性蛋白质(Rationally engineered therapeutic proteins with reduced immunogenicity),《免疫学杂志》(J Immunol.)2005年5月15日;174(6):3187-96。

  托马斯(Thomas),K.R.、福尔杰(Folger),K.R.&卡佩基(Capecchi),M.R.,将基因高频靶向哺乳动物基因组中的特定位点(High frequency targeting of genes to specific sites in the mammalian genome).《细胞》(Cell)44,419-428(1986)。

  杜施(Tuschl),T.,扩展小RNA干扰(Expanding small RNA interference).《自然生物技术》(Nat Biotechnol)20,446-448(2002)。

  乌尔诺夫(Urnov),F.D.、雷巴尔(Rebar),E.J.、福尔摩斯(Holmes),M.C.、张(Zhang),H.S.&格雷戈里,P.D.(Gregory,P.D.),用工程化的锌指核酸酶进行的基因组编辑(Genome editing with engineered zinc finger nucleases).《遗传学自然评论》(Nat Rev Genet)11,636-646(2010)。

  沃尔顿(Valton),J.等人,克服转录激活因子样效应器(TALE)DNA结合结构域对胞嘧啶甲基化的敏感性(Overcoming transcription activator-like effector(TALE)DNA binding domain sensitivity to cytosine methylation).《生物化学杂志》(J Biol Chem)287,38427-38432(2012)。

  王(Wang),H.等人,在通过CRISPR-Cas介导的基因组工程一步产生携带多个基因突变的小鼠(One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR-Cas-Mediated Genome Engineering).《细胞》(Cell)153,910-918(2013)。

  渡边(Watanabe),T.等人,使用锌指和TAL效应器核酸酶在半变态昆虫中进行非转基因基因组修饰(Non-transgenic genome modifications in a hemimetabolous insect using zinc-finger and TAL effector nucleases).《自然通讯》(Nat Commun)3(2012)。

  威尔逊(Wilson),E.B.,可能的推断、继承法则与统计推断(Probable inference,the law of succession,and statistical inference).《美国统计协会杂志》(J Am Stat Assoc)22,209-212(1927)。

  伍德(Wood),A.J.等人,使用ZFN和TALEN跨物种进行靶向的基因组编辑(Targeted genome editing across species using ZFNs and TALENs).《科学》(Science)333,307(2011)。

  吴(Wu),S.、应(Ying),G.X.、吴(Wu),Q.&卡佩基(Capecchi),M.R.,一种用于构建基因靶向载体的方案:产生钙粘素家族及以外的基因敲除小鼠(A protocol for constructing gene targeting vectors:generating knockout mice for the cadherin family and beyond).《自然-实验手册》(Nat Protoc)3,1056-1076(2008)。

  张(Zhang),F.等人,有效构建用于调控哺乳动物转录的序列特异的TAL效应器(Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription).《自然生物技术》(Nat Biotechnol)29,149-153(2011)。

  * * *

  虽然已经在此示出并描述了本发明的优选实施例,但是对本领域的普通技术人员而言应该显而易见是这样的实施例仅以举例方式提供。在不偏离本发明的情况下众多变化、改变和取代现在将被本领域的普通技术人员想到。应该理解的是,在实践本发明中可以采用在此描述的本发明的实施例的不同替代方案。

《用于肝靶向和治疗的CRISPR-CAS系统、载体和组合物的递送与用途.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)