欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> CHO细胞的合成启动子、使用转录因子结合位点模块生产合成启动子的方法独创技术86135字

CHO细胞的合成启动子、使用转录因子结合位点模块生产合成启动子的方法

2021-02-26 01:33:04

CHO细胞的合成启动子、使用转录因子结合位点模块生产合成启动子的方法

  本发明涉及用于在哺乳动物细胞,特别是中国仓鼠卵巢(CHO)细胞中使用的合成启动子构建体,以及包含该合成启动子构建体的重组宿主细胞。本发明进一步涉及用于生产这些启动子构建体、所述重组细胞的方法,以及这些合成启动子构建体、所述重组细胞中任一项例如在重组蛋白表达中的用途。

  背景技术

  中国仓鼠卵巢(CHO)细胞衍生自中国仓鼠的卵巢并被广泛用于基因研究、毒性筛选和基因表达,特别是用于重组蛋白的表达。它们首先在20世纪60年代引进,生长在悬浮培养中,并且在它们的培养基中需要脯氨酸。

  CHO细胞是用于大规模生产重组蛋白治疗剂的最常用的哺乳动物宿主细胞系。因此,CHO细胞是生物制药产业中的重要工具。

  当使用CHO细胞生产重组蛋白时所面临的主要挑战之一是,可能难以准确地控制重组蛋白的表达水平。鉴于目前生物产业领域(portfolio)的候选生物制药产品是多样化的,包括很多要求基因转录的蛋白特异性控制与多肽特异性折叠和装配速率在动力学上协调的“难以表达”(DTE)的蛋白质,准确控制重组蛋白表达水平的能力是尤其重要的。例如,已经表明,可通过调整重链(HC)和轻链(LC)基因表达比例(Ho等,2013)而显著改善单克隆抗体(mAb)表达。

  具有优化表型(蛋白折叠、糖基化、细胞凋亡等)的新的细胞工厂的开发也会需要同时变化多个基因的转录活性的能力(Datta等,2013;Lanza等,2012)。

  此时,在CHO细胞中的重组基因转录仍常规使用强病毒启动子(诸如人巨细胞病毒立即早期1(hCMV-IE1,或CMV)启动子)控制,尽管与细胞应激诱导、细胞周期依赖性以及表观遗传沉默有联系(Dale,2006;Kim等,2011)。CMV是目前用于驱动大部分生物制药产品表达的“金标准”启动子。它是由病毒进化出的高度复杂的元件,以使其能够感染许多哺乳动物宿主细胞(Stinski和Isomura,2008)。然而,尽管其使用了>25年以驱动生物制药生产,关于它如何在CHO细胞中机械地发挥功能知之甚少,并且因此,通常不能获得精确地控制或改善其转录活性的策略。

  因此合成启动子提供了具有潜在吸引力的解决方案,因为它们可以用可预测地改造宿主细胞功能的复杂的、定制的控制子替换在表达载体中功能不明确和不可控的遗传元件。

  已经通过筛选(i)随机DNA序列或合成的寡核苷酸重复序列或(ii)已知的顺式调控元件的组装体(例如,转录因子结合位点,或调控元件,或TFRE)(两者均为最小核心启动子基序的上游)传统上生产合成启动子。这些努力已经导致了被设计为在一系列生物以及哺乳动物细胞(Ferreira等,2011;Schlabach等,2010)中发挥功能的合成启动子文库,所述生物主要是微生物,诸如棒状杆菌(Corynebacterium)(Yim等,2013)、酿酒酵母(Saccharomyces)(Blazeck等,2012)、毕赤酵母(Pichia)(Stadlmayr等,2010)和链霉菌(Streptomyces)(10)。这些研究已经证明,通过合成启动子提供的精致的基因表达控制是高度背景依赖性的,因此需要为每种宿主细胞类型特异性构建启动子。例如,Schlabach等描述了在HeLa细胞中筛选的哺乳动物细胞的合成启动子的合成(CMV活性的207%),而且还报告了在不同哺乳动物细胞类型中高度可变的报告基因表达(CMV的21-113%)(Schlabach等,2010)。

  然而,先前很少有研究探讨在CHO细胞中的合成启动子的利用。等通过随机化在嵌合启动子内分离TFRE的序列,创建了一个小的在活性方面具有十倍范围的启动子库(<20)(等,2002)。此外,通过构建具有模仿那些在高度有活性的启动子中所发现的核苷酸组成的连续序列,Grabherr等构建了具有大致相等活性的5种合成启动子(Grabherr等,2011)。但是,这两种研究针对在哺乳动物细胞中的广泛活性(在多种不同的细胞系进行了测试)并且两者均不寻求专门设计与CHO细胞工厂的反式激活机制相一致发挥作用的合成启动子。

  因此,上述启动子构建体两者均不能够使得在相对宽的动态范围可预测地、精确地和强力地控制CHO基因表达,并且所报告的合成启动子活性显著低于CMV的活性成为可能。

  最近,Le等利用转录组学数据来鉴定具有所希望的表达动力学的CHO内源性启动子(Le等,2013)。虽然这是一个鉴定具有不连续的表达水平的启动子的有希望的途径,但是其仅限于天然存在的活性。此外,定义控制特定基因表达的基因组调控序列可能是一个显著的挑战。

  因此,对于可以为目前生物制药生产挑战提供易于处理的解决方案的中国仓鼠卵巢细胞(CHO)-特异性基因表达控制技术存在需求。本发明寻求解决上述挑战。

  发明概述

  本发明人在功能上筛选了与转录因子调控元件相关的基序并首次鉴定了在CHO细胞中有活性的元件。

  活性元件已经被使用并且组合来制备在重组宿主细胞、特别是CHO细胞中有用的合成启动子。

  然后这些CHO-活性元件被用来构建显示横跨三个数量级的表达的大的合成启动子文库。

  因而本发明人已构建了第一合成启动子文库,所述文库专门设计以利用CHO细胞工厂预先存在的转录激活机制。

  本发明人已进一步表明,下一代文库可以针对具体表达水平定制并构建多个在例如瞬时生产过程中具有超过hCMV-IE1的活性的启动子。此外,横跨宽的动态表达范围的相对启动子活性在不同的CHO细胞宿主和长期补料分批瞬时生产两者中都得到保持。

  通过该合成启动子技术使得能够进行强力的精密基因表达控制,将有利于建立定制的、合成哺乳动物细胞工厂,所述哺乳动物细胞工厂包含以经设计的最佳化学计量操作的多个遗传组分。此外,可以利用它使得能够实现重组基因转录的优化蛋白特异性控制,以利于生产难以表达的蛋白质。允许在补料分批瞬时SEAP生产中具有比CMV更高滴度的本发明的合成启动子也可用于优化早期产物的生产(例如瞬时表达),例如,用于毒理学和临床试验测试的显影材料(Daramola等,2013)。

  在第一方面,本发明提供了包含适合用于引发在其中重组蛋白表达的合成启动子的CHO细胞,所述合成启动子包含启动子核心和其上游两个或更多个转录因子调控元件,所述调控元件独立地选自NFKB-RE、E-框、AP1、CRE、GC-框、E41F、C/EBPα-RE、OCT和RARE。

  本发明还提供了适合用于在CHO细胞中促进重组蛋白表达的合成启动子,所述合成启动子包含启动子核心和其上游两个或更多个转录因子调控元件的混合物,所述调控元件独立地选自NFKB-RE、E-框、AP1、CRE、GC-框、E4F1、C/EBPα-RE、OCT和RARE,特别是至少一种调控元件的两种或更多个拷贝。

  产生适合用于在给定的哺乳动物重组宿主细胞中促进重组蛋白表达的合成启动子的方法,其包括以下步骤:

  A)选择两个或更多适合于在所选哺乳动物重组宿主细胞系中使用的转录因子调控元件,

  B)制备一种或多种合成启动子构建体,所述合成启动子构建体包含那些转录因子调控元件中的两个或更多个转录因子调控元件,所述转录因子调控元件独立地选自步骤A)中所选的那些转录因子调控元件,

  C)测试步骤B)中制备的合成启动子构建体在所选哺乳动物重组宿主细胞中的活性。

  本发明人还鉴定了可以在CHO细胞中负调控基因表达的至少一个转录因子/转录因子调控元件,即YY1。因此,在一个实施方案中,本发明提供了一种CHO细胞,其中所述转录因子YY1的活性被敲低或敲除。

  在一个实施方案中,本发明提供了对YY1特异性的阻断诱饵(blockdecoy)。

  本发明在下列段落中进行概括:

  1.CHO细胞,其包含适合用于引发在其中重组蛋白表达的合成启动子,所述合成启动子包含启动子核心和其上游两个或更多个转录因子调控元件,所述调控元件独立地选自NFKB-RE、E-框、AP1、CRE、GC-框、E41F、C/EBPα-RE、OCT和RARE。

  2.根据段落1的CHO细胞,其中所述启动子核心选自CMV、SV40、UbC、EF1A、PGK和CAGG,诸如CMV核心,特别是hCMV-IE1。

  3.根据段落1或2的CHO细胞,其中所述合成启动子包含2-50个转录因子调控元件,例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个,例如5、6、7或8个所述调控元件。

  4.根据段落1-3任一项的CHO细胞,其中所述转录因子调控元件所有彼此相同。

  5.根据段落1-3任一项的CHO细胞,其中所述转录因子调控元件是不同类型的组合。

  6.根据段落1-5任一项的CHO细胞,其中所述转录因子调控元件彼此串联。

  7.根据段落1-6任一项的CHO细胞,其中所述合成启动子包含NFKB-RE,例如其两个或更多个其拷贝。

  8.根据段落1-7任一项的CHO细胞,其中所述合成启动子包含E-框,例如其两个或更多个其拷贝。

  9.根据段落1-8任一项的CHO细胞,其中所述合成启动子包含CRE,例如其两个或更多个其拷贝。

  10.根据段落5的CHO细胞,其中所述组合中的每个转录因子调控元件独立地选自NFKB-RE、E-框、GC-框、C/EBPα-RE、CRE和E41F,特别是选自NFKB-RE、E-框、GC-框和C/EBPα-RE,尤其是NFKB-RE和E-框,特别是组合中至少一个调控元件的2个或更多个拷贝。

  11.根据段落1-10任一项的CHO细胞,其中合成启动子DNA序列是全长CMV启动子序列的量的0.9或更少,例如0.8、0.75、0.7、0.6、0.5或更少。

  12.根据段落1-11任一项的CHO细胞,其中所述合成启动子具有大于CMV启动子的每单位DNA转录活性的每单位其DNA序列的转录活性,例如活性增加1.2、1.4、1.5、1.6、1.8、2.0、2.2、2.4或2.5倍。

  13.根据段落1-12任一项的CHO细胞,其中所述CHO细胞选自CHO-S、CHO-K1和CHO-DG44。

  14.根据段落1-13任一项的CHO细胞,其中所述转录因子调控元件YY1的活性被抑制,例如通过对YY1特异性的阻断诱饵。

  15.根据段落14的CHO细胞,其中所述细胞被突变以缺失转录因子YY1和/或使得其沉默由此抑制YY1的活性。

  16.根据段落1-15任一项的CHO细胞,其中所述细胞进一步包含编码在合成启动子控制下的重组蛋白的多核苷酸序列。

  17.根据段落16的CHO细胞,其中所述重组蛋白是抗体或其抗原结合片段。

  18.根据段落1-17任一项的CHO细胞,其中所述启动子展示相比启动子核心或野生型启动子提高的蛋白表达。

  19.根据段落18的CHO细胞,其中所述提高的蛋白表达是更高水平的重组蛋白表达。

  20.根据段落1-19任一项的CHO细胞,其中所述合成启动子包含SEQIDNO:30-169任一项所示的序列。

  21.根据段落20的CHO细胞,其中所述合成启动子包含SEQIDNO:126-169任一项所示的序列。

  22.根据前述段落任一项的CHO细胞,其中所述合成启动子不包含任何CpG岛。

  23.根据段落1-22任一项的CHO细胞,其包含两个或更多个启动子,例如两个或更多个如权利要求1-22任一项所限定的合成启动子。

  24.根据段落1-23任一项的CHO细胞,其中所述合成启动子具有适合特定细胞的性质,例如在合成启动子中的转录因子调控元件对应该细胞中所发现的转录因子。

  25.根据段落1-23任一项的CHO细胞,其中所述合成启动子具有适合其相关的特定重组蛋白表达的性质。

  26.合成启动子,其适合用于在CHO细胞中促进重组蛋白表达,所述合成启动子包含启动子核心和其上游两个或更多个转录因子调控元件的混合物,所述调控元件独立地选自NFKB-RE、E-框、AP1、CRE、GC-框、E41F、C/EBPα-RE、OCT和RARE,特别是组合中至少一种调控元件的两个或更多个拷贝。

  27.合成启动子,其适合用于在CHO细胞中促进重组蛋白表达,所述合成启动子包含启动子核心和其上游两个或更多个转录因子调控元件的混合物,所述调控元件独立地选自包含NFKB-RE和CRE的组或由NFKB-RE和CRE组成的组。

  28.根据段落26或27的合成启动子序列,其中合成启动子DNA序列是全长CMV启动子序列的量的0.9或更少,例如0.8、0.75、0.7、0.6、0.5或更少。

  29.根据段落26-28任一项的合成启动子序列,其中所述合成启动子具有大于CMV启动子的每单位DNA转录活性的每单位其DNA序列的转录活性,例如活性增加1.2、1.4、1.5、1.6、1.8、2.0、2.2、2.4或2.5倍。

  30.产生适合用于在给定的哺乳动物重组宿主细胞中促进重组蛋白表达的合成启动子的方法,其包括以下步骤:

  a)鉴定转录因子调控元件的基序,

  b)测试与启动子核心组合的在步骤a)中鉴定的每种转录因子调控元件在所选哺乳动物重组宿主细胞系中的活性,

  c)从步骤(b)中选择两个或更多个转录因子调控元件,所述调控元件在所选哺乳动物重组宿主细胞系中比单独启动子核心更有活性,

  d)制备一种或多种合成启动子构建体,所述合成启动子构建体包含那些转录因子调控元件中的两个或更多个转录因子调控元件,所述转录因子调控元件独立地选自步骤c)中所选的那些转录因子调控元件,

  e)测试步骤d)中制备的合成启动子构建体在所选哺乳动物重组宿主细胞中的活性,

  f)鉴定展示相比野生型启动子相同或提高的蛋白表达的合成启动子构建体。

  31.根据段落30的方法,其进一步包括下列步骤:

  g)选择那些转录因子调控元件中的两个或更多个转录因子调控元件,所述转录因子调控元件与在步骤f)中鉴定的构建体相关,和

  h)制备一种或多种包含TFRE构建体的合成启动子构建体,所述启动子构建体包含在步骤g)中独立地选择的那些元件,或由那些元件组成。

  32.根据段落31的方法,其中在步骤h)中制备的TFRE构建体包含反映它们在步骤f)中鉴定的构建体中相对丰度的化学计量的转录因子调控元件。

  33.根据段落30-32任一项的方法,其中所述方法的步骤(f)进一步包括鉴定最经常与相比野生型启动子展示降低的蛋白表达的启动子构建体相关的转录因子调控元件,并且排除步骤(g)中的那些转录因子调控元件。

  34.鉴定适合用于在给定的哺乳动物重组宿主细胞中以所希望的水平促进重组蛋白表达的合成启动子的方法,其包括以下步骤:

  a)获得权利要求26-28中限定的两个或更多个启动子构建体。

  b)测试步骤a)中获得的合成启动子构建体,以确定在所选哺乳动物重组宿主细胞中被每种构建体驱动的重组蛋白表达的水平

  c)如果在步骤(b)中经测试的合成启动子构建体促进重组蛋白以所希望的水平表达,则选择该合成启动子构建体。

  35.根据段落34的方法,其中在步骤(a)中获得的两个或更多个合成启动子每种包含独立地选自SEQIDNO:30-169或SEQIDNO:126-169任一项的序列。

  36.根据段落34或35的方法,其中所希望的蛋白表达水平高于使用野生型启动子获得的表达水平。

  37.根据段落34或35的方法,其中所希望的蛋白表达水平低于使用野生型启动子获得的表达水平。

  38.构建转录因子调控元件构建体文库的方法,包括随机连接以5:3的比例的转录因子调控元件NFKB-RE和E-框的步骤。

  39.构建转录因子调控元件构建体文库的方法,包括以5:3:1:1的比例随机连接转录因子调控元件NFKB-RE、E-框、GC-框和C/EBPα-RE的步骤。

  40.CHO细胞,其中转录因子调控元件YY1的活性被敲低或敲除。

  41.根据段落40的CHO细胞,其中YY1活性通过对YY1特异性的阻断诱饵而被敲低或敲除。

  42.根据段落40的CHO细胞,其中所述细胞被突变以缺失转录因子调控元件YY1和/或使得其沉默由此抑制YY1的活性。

  43.根据段落40-43任一项的CHO细胞,其中所述细胞进一步包含编码在合成启动子控制下的重组蛋白的多核苷酸序列。

  44.根据段落43的CHO细胞,其中所述重组蛋白是抗体或其抗原结合片段。

  45.根据段落40-44任一项的CHO细胞,其中所述细胞类型选自CHO-S、CHO-K1和CHO-DG44。

  有利地,本发明人发现,某些转录因子调控元件在CHO细胞中特别有活性并且当掺入到本发明的启动子构建体中时,能够调节转录,例如相比当使用单独的核心启动子时增加重组蛋白表达水平。因此,本发明人已经发现,包含这些转录因子调控元件的组合的启动子构建体使得能够精确控制CHO细胞中对宽的动态范围(超过三个数量级)的重组基因转录。

  有利地,因为合成启动子是专门设计的,而不是进化而来的,所述启动子缺乏冗余序列,并相应地每单位DNA序列具有更有效的转录活性。例如,如本文所述的合成启动子2/01(SEQIDNO:126)表现出相对CMV启动子2.2倍的活性增加,但是不到CMV的一半大小。

  然而,精确控制并不总是涉及增加的表达,因为其它因素,诸如重组系统的稳定性、对于适当折叠的要求、以及表达难以表达的蛋白(诸如双特异性抗体)的能力,可以意味着最高水平的重组蛋白表达并不总是终极目标。实际上,本发明的一个显著优点是所提供的灵活性,其使得表达水平能够取决于包括在合成启动子中的TFRE的组合根据需要进行调整。

  例如,对于容易表达的蛋白质,其中转录速率已证明对于生产发挥高水平的控制(McLeod等,2011;O'Callaghan等,2010),本发明的合成启动子可以用于最大化重组基因转录水平(例如,通过使用合成启动子2/01)。

  相比较而言,对于其中最大化转录不可能是有益的难以表达的蛋白(例如,双特异性抗体,融合蛋白),所述启动子可以用于提供与多肽特异性折叠和装配速率动力学上协调的优化的蛋白特异性转录活性。例如,一个潜在的应用是在单克隆抗体(mAb)的表达中,其中,例如,不同活性的两种合成启动子可用来实现mAb特异性轻链:重链(LC:HC)表达比例来优化mAb的生产(Ho等,2013;Pybus等,2013)。

  因此,在一个实施方案中,所述合成启动子适于或选择为适合用于特定重组蛋白的表达,即所述启动子的性质与特定蛋白的合适表达相匹配。

  如本文所采用的特定蛋白的合适表达指的是当相比对于已知的CMV启动子获得的结果时,最大限度地提高以期望形式的给定蛋白表达的启动子,例如增加产量和/或增加适当地折叠的蛋白的量。

  在一个实施方案中,本发明的合成启动子不含有CpG岛。在CMV中的CpG岛已经被证明干扰基质附着区域的功能性(Girod等,2005)。已知CpG岛中胞嘧啶的甲基化产生不稳定性。因此,因为本发明的启动子不具有CpG岛,所述启动子可以具有增强的稳定性,当用于表达重组蛋白时导致高度可重现的表达水平。

  有利地,本发明的合成启动子与现有转录增强技术(诸如遍在作用染色质开放元件、细菌人工染色体和位点特异性整合系统)更相容(Mader等,2012;Zhou等,2010)。

  另外,可以将本发明的启动子与在研究应用中需要高度精确调控的其它表达控制的技术一起利用。例如,它们可以结合TFRE特异性诱饵技术(Brown等,2013),或最近描述的控制翻译起始速率的合成元件(Ferreira等,2013)使用。因此,在一方面,本发明提供了包含对至少YY1特异性的转录因子调控元件的阻断诱饵。

  在一个实施方案中,在本公开的合成启动子中两个或更多个转录因子调控元件是串联的。

  在一个实施方案中,在本公开的合成启动子中两个或更多个转录因子调控元件是完全相同的。

  在一个实施方案中,在本公开的合成启动子中两个或更多个转录因子调控元件是不同类型的组合。

  在一个实施方案中,所述两个或更多个转录因子调控元件是不同类型的组合,包括相同TFRE的一个或多个的多个拷贝,诸如相同TFRE的一个或多个的3、4、5、6、7、8、9、10个或更多拷贝。在一个实例中,所述合成启动子包含两个或更多个,诸如3、4、5、6、7、8、9、10个或更多拷贝的NFKB-RE。

  在一个实施方案中,所述合成启动子包含两个或更多个,诸如3、4、5、6、7、8、9、10个或更多拷贝的E-框。

  在一个实施方案中,所述合成启动子包含两个或更多个,诸如3、4、5、6、7、8、9、10个或更多拷贝的CRE。

  在一个实施方案中,所述合成启动子包含两个或更多个,诸如3、4、5、6、7、8、9、10个或更多拷贝的NFKB-RE和两个或更多个,诸如3、4、5、6、7、8、9、10个或更多拷贝的E-框。

  在一个实施方案中,所述合成启动子包含两个或更多个,诸如3、4、5、6、7、8、9、10个或更多拷贝的NFKB-RE和两个或更多个,诸如3、4、5、6、7、8、9、10个或更多拷贝的CRE。

  当合成启动子包含两种或更多种(诸如两种类型)的转录因子调控元件以及一种或多种的多个拷贝时,则这些可以以任何合适的排列提供,例如作为一整串的第一TFRE(诸如3、4、5、6、7、8、9、10个或更多拷贝的NFKB-RE),随后是一整串的至少第二TFRE(诸如3、4、5、6、7、8、9、10个或更多拷贝的E-框)。可选地,第一和第二TFRE等可以随机混合或以这样的模式,其中一个拷贝(或小串)的第一TFRE随后是一个拷贝(或小串)的第二TFRE,其随后是一个拷贝(或小串)的第一TFRE等。

  有利地,本发明人已经发现,当不同类型的转录因子调控元件被组合在合成启动子中时,其导致表达水平的不同调节水平,例如相对CMV启动子表达水平增加或减少。可选地或额外地,本文提供的合成启动子可以具有提高的表达稳定性和/或优化用于表达特定蛋白,使得所述蛋白以所希望的形式表达,例如恰当地折叠。

  相比当构建体仅由一种类型的转录因子调控元件组成时,包含转录因子调控元件的组合的启动子构建体具有不同的转录活性,并且因此显著地延伸了可以获得的潜在转录活性范围,由此导致宽范围的来自合成启动子的不同转录活性,其可以然后匹配特定重组蛋白的适合表达。因此,所述启动子构建体可以用于精确控制哺乳动物细胞特别是CHO细胞中的蛋白表达。

  例如,通过利用特定的TFRE组合,所述合成启动子可以改进以展示所希望的生物生产功能性,诸如在亚生理温度(Al‐Fageeh等,2006)或在静止期细胞生长期间(Prentice等,2007)活性的增加。

  在一个实施方案中,本公开的合成启动子小于野生型CMV启动子,例如,序列为CMV启动子大小的约0.9或更小,诸如CMV启动子大小的0.8、0.75、0.7、0.6、0.5或更小。如本文所采用的大小的0.5是指CMV启动子一半大小的合成启动子,即含有CMV启动子的碱基对数目的约1/2或CMV启动子的分子量的一半。

  有利地,能够以制备比CMV启动子更小的合成启动子允许在表达载体中更多的空间编码其它遗传材料,例如更大的重组基因或在多基因的工程载体中功能基因(例如分子伴侣、氧化还原蛋白、解折叠的蛋白应答反式激活因子、囊泡运输组件等)数量的增加。更小的合成启动子也具有每单位DNA的比CMV启动子对应值增加的转录活性。

  在一个实施方案中,两个或更多个转录因子调控元件独立选自激活蛋白1调控元件(AP1-RE)、CC(A/T)6GG元件(CArG调控)、CCAAT置换蛋白调控元件(CDP-RE)、CCAAT增强子结合蛋白α调控元件(C/EBPα-RE)、细胞性成髓细胞瘤调控元件(cMyb-RE)、cAMP调控元件(CRE)、延伸因子2调控元件(E2F-RE)、E4F1调控元件(E4F1-RE)、早期生长反应蛋白1调控元件(EGR1-RE)、ERR-α调控元件(ERRE)、增强框(E-框)、GATA-1调控元件(GATA-RE)、GC-框、糖皮质激素调控元件(GRE)、独立生长因子1调控元件(Gfi1-RE)、Helios调控元件(HRE)、肝细胞核因子1调控元件(HNF-RE)、胰岛素启动子因子1调控元件(IPF1-RE)、干扰素刺激调控元件(ISRE)、肌细胞增强子因子2调控元件(MEF2-RE)、Msx同源框调控元件(MSX-RE)、神经生长因子诱导基因-B调控元件(NBRE)、核因子1调控元件(NF1-RE)、活化T细胞的核因子调控元件(NFAT-RE)、核因子κB调控元件(NFkB-RE)、八聚体基序(OCT)、视黄酸调控元件(RARE)和阴阳1调控元件(YY1-RE)。这些元件的序列提供于表1、SEQIDNO1-28中。

  在一个实施方案中,所述两个或更多个转录因子调控元件独立地选自NFKB-RE、E-框、AP1、CRE、GC-框、E41F、C/EBPα-RE、OCT和RARE。

  在一个实施方案中,所述两个或更多个转录因子调控元件独立地选自NFKB-RE、E-框、CRE、GC-框、E41F和C/EBPα-RE。

  在一个实施方案中,所述两个或更多个转录因子调控元件选自NFKB-RE(SEQIDNO:25)、E-框(SEQIDNO:11)、GC-框(SEQIDNO:13)和C/EBPα-RE(SEQIDNO:4)。

  有利地,这四种转录因子调控元件与高表达启动子构建体显著相关。因此,包含这些特定转录因子调控元件的启动子构建体能够使CMV启动子的转录活性翻倍。

  在一个实例中,所述两个或更多个转录因子调控元件独立地选自NFKB-RE、E-框和GC-框。

  在一个实例中,所述两个或更多个转录因子调控元件独立地选自NFKB-RE、E-框和C/EBPα-RE。

  在一个进一步的实施方案中,所述两个或更多个转录因子调控元件独立地选自NFKB-RE和E-框。

  在一个进一步的实施方案中,所述两个或更多个转录因子调控元件独立地选自NFKB-RE和CRE。

  在一个实施方案中,所述转录因子调控元件不是YY1。

  有利地,在本发明的高表达启动子构建体中主要是2或3个转录因子调控元件的这些组合,并且因此有可能对表达水平发挥特别强的影响。

  因此,在一个实施方案中,所利用的合成启动子提供相比已知的启动子特别是野生型CMV启动子增加的表达水平,例如在表达水平上5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100%或更高的增加。

  在另一个实施方案中,采用合成启动子,例如在文库或集合中,以提供横跨三个数量级的比活性。这使得能够为了特定目的优化转录活性,例如,选择标志物的表达、抗体重链:轻链比例的控制和对于难以表达的蛋白质的多肽特异性控制。

  因此,在一个实施方案中,所采用的合成启动子提供了相比已知启动子,特别是野生型CMV启动子降低的表达水平。然而,通常会选择这些启动子,因为它们具有超过和高于已知启动子的有利性质,诸如允许产生更多具有适当折叠或类似的蛋白。

  在一个实施方案中,转录因子调控元件具有选自SEQIDNO:1-28的核苷酸序列,例如转录因子调控元件具有选自SEQIDNO:1、4、6、8、11、13、25、26和27的核苷酸序列,诸如选自SEQIDNO:4、11、13和25的核苷酸序列,特别是选自SEQIDNO:11和15的核苷酸序列。

  在一个实施方案中,合成启动子包含2-50个转录因子调控元件,例如2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19或20个转录因子调控元件。

  有利地,使用两个或更多个不同的合成启动子序列控制两个或更多个重组基因(例如重链和轻链基因)的表达可有助于最小化基因拷贝丢失。在当前的标准表达系统中,两个相同的CMV启动子用于控制两个基因的表达,这可能导致通过同源重组的基因拷贝丢失。在又一个实施方案中,每个启动子包含4、或5、或6、或7、或8或9或10或11或12个或更多的转录因子调控元件。

  本发明的合成启动子可以掺入更多类型的转录因子调控元件,从而进一步增加可以获得的转录活性的范围。

  在一个实施方案中,核心启动子衍生自选自下列的启动子:CMV、SV40、UbC、EF1A、PGK和CAGG,诸如CMV。

  在一个实施方案中,启动子或核心启动子不是EAAT2,尤其不是WO03/070965中公开的SEQIDNO:1、2和/或3。在一个实施方案中,启动子或核心启动子不是衍生自EAAT2。

  在一个实施方案中,启动子或启动子核心不是COX-2基因启动子。在一个实施方案中,启动子或核心启动子不是衍生自COX-2基因启动子。

  有利地,本发明人已经发现,CMV核心启动子的转录活性可以通过包括CMV核心启动子的上游转录因子调控元件的嵌段(block)可靠地进行修饰。因此,CMV核心启动子(SEQIDNO:170)特别适合用在本发明的合成启动子构建体中。

  在另一个实施方案中,核心启动子衍生自诱导型启动子,例如选自TRE、PTRE3G和c-Fos。

  有利地,使用诱导型启动子作为核心启动子,通过允许控制重组蛋白的表达时机,提供本发明的启动子构建体的转录活性的进一步控制水平。

  在一个实施方案中,本发明的合成启动子包含选自SEQIDNO:30-169的核苷酸序列。

  有利地,这些合成启动子由至多7个转录因子调控元件构成,所述调控元件独立地选自NFKB-RE、E-框、AP1-RE、CRE、GC-框、E4F1-RE和C/EBPα-RE,本发明人已经发现它们在CHO细胞中特别有活性。当掺入到本发明的合成启动子时,以任意方向5’至3’或3’至5’,这些TFRE导致宽范围的不同转录活性。

  在一个实施方案中,根据本公开的合成启动子包含部分或全部的来自CMV的近端启动子,例如10、20、30、40、50%的近端启动子。

  在一个实施方案中,根据本公开的合成启动子包含部分或全部的来自CMV的远端启动子,例如10、20、30、40、50%的远端启动子。

  在一个实施方案中,根据本公开的合成启动子包含部分或全部的来自CMV的近端启动子,和部分或全部的远端启动子,例如独立地10、20、30、40、50%的近端启动子和近端启动子。

  在一个实例中,所述合成启动子包含TFRE构建体,所述TFRE构建体由两个或更多个,诸如3、4、5、6、7、8、9、10个或更多个拷贝的NFKB-RE和两个或更多个,诸如3、4、5、6、7、8、9、10个或更多个拷贝的E-框以及任选地一个或多个拷贝的GC-框和/或C/EBPα-RE组成。

  在一个实施方案中,本发明的合成启动子包含选自SEQIDNO:30-169的核苷酸序列。

  在一个实例中,本发明的合成启动子包含选自SEQIDNO:126-169的核苷酸序列。

  在一个实例中,本发明的合成启动子包含选自SEQIDNO:126-150的核苷酸序列。在一个实例中,本发明的合成启动子包含选自SEQIDNO:30、31、32、126、128和144的核苷酸序列。

  有利地,仅使用NFKB-RE、E-框、GC-框和C/EBPα-RE这4个转录因子调控元件构建具有SEQIDNO:126-169的转录因子调控元件构建体。因此,使用这些TFRE获得的表达水平相比具有SEQIDNO:30-125的构建体往往显著更高。

  在另一方面,本发明提供了哺乳动物细胞特异性合成启动子构建体的文库,所述构建体包含多个如本文定义的合成启动子。

  在另一方面,本发明提供了转录因子调控元件构建体的文库,所述构建体具有例如SEQIDNO:30-169,诸如SEQIDNO:126-169。

  有利地,本发明的转录因子调控元件构建体的文库和含有它们被设计用于在CHO细胞中表达蛋白的合成启动子构建体的文库,提供了具有不同表达水平范围的可用的启动子构建体的储存库。文库提供了方便的资源,从其中用户可以容易地选择具有所希望的表达水平的启动子构建体或对任何给定的蛋白质测试所希望的表达水平。

  在一个实施方案中,本发明提供了包含根据本公开的合成启动子序列的质粒或载体。

  在一个实施方案中,所述质粒或载体进一步包含多核苷酸序列,诸如编码重组蛋白的基因或可转录的多核苷酸序列。后者包括RNAi、shRNA和其它有用的多核苷酸序列。

  在一个实施方案中,所述质粒或载体可以包含一对限制性酶切位点,例如中间夹有编码重组蛋白的多核苷酸序列或可转录的多核苷酸。限制性酶切位点有利于质粒或载体中遗传材料的交换。

  如上文所讨论,本公开还延伸到哺乳动物细胞,诸如包含本文所述合成启动子的CHO细胞。

  在一个实施方案中,所述细胞用根据本公开的目标多核苷酸(例如,基因)相关联的合成启动子,质粒或载体瞬时转染。

  在一个实施方案中,所述细胞用根据本公开的合成启动子稳定转染,例如其中所述合成启动子与目标多核苷酸(例如基因)相关联。

  本发明还提供了用根据本公开的一系列合成启动子稳定转染的细胞(例如CHO细胞)文库。如本文采用的一系列合成启动子意在指其中通常每个细胞含有稳定整合到其基因组中的不同的合成启动子或不同的合成启动子的组合。

  在一方面,本发明提供了哺乳动物宿主细胞,其包含如上文定义的合成启动子或表达载体。在一个实施方案中,所述哺乳动物宿主细胞选自中国仓鼠卵巢(CHO)细胞,小鼠骨髓瘤细胞和杂交瘤细胞。合适的细胞类型的实例包括淋巴细胞系,例如NS0骨髓瘤细胞和SP2细胞和COS细胞。用于在本发明中使用的合适的CHO细胞类型可以包括CHO和CHO-K1细胞(包括dhfr-CHO细胞),诸如CHO-DG44细胞和CHO-DXB11细胞,并且其可以与DHFR可选择标志物一起使用,或可以与谷氨酰胺合成酶可选择标志物一起使用的CHOK1-SV细胞。在一个实施方案中,CHO独立地选自CHO-S、CHO-K1和CHO-DG44。

  在一个实施方案中,相比野生型细胞(例如WO2010/092335(通过引用并入本文)中所公开的),宿主细胞(诸如CHO细胞)具有增加的Ero1和/或XBP1表达水平。

  在一个实施方案中,如PCT/EP2013/070317(通过引用并入本文)中所公开的,用NHEJ蛋白(非同源末端连接蛋白)或其功能片段转染宿主细胞(诸如CHO细胞)。

  在一个实例中,本发明提供了包含适合用于引发在其中重组蛋白表达的合成启动子的CHO细胞,所述合成启动子包含启动子核心和其上游至少一种TFRE构建体,其中每种TFRE构建体由两个或更多个转录因子调控元件组成,所述调控元件独立地选自NFKB-RE、E-框、AP1、CRE、GC-框、E41F、C/EBPα-RE、OCT和RARE。

  在一方面,本发明提供了包含如上文所述的两个或更多个合成启动子的CHO细胞,例如直接组合以产生新的嵌合体。有利地,这提供了修饰转录因子调控元件组合的容易的方法,其目前是通过将额外的启动子插入到要转染入细胞的表达载体中实现的。

  在一方面,本发明提供了包含两个或更多个如上述合成启动子的CHO细胞,其中每个启动子用于指导不同重组蛋白的合成,例如抗体或其抗原结合片段的重链和轻链。应当理解的是,当这些启动子被掺入载体时,这些不同的合成启动子可以在相同或不同的载体上。

  在一个实施方案中,本发明还提供了质粒、载体或细胞的文库,所述质粒、载体或细胞每个包含根据本公开的合成启动子。如上文所讨论的,本公开还延伸到包含本公开的所述合成启动子或质粒/载体的宿主细胞的文库。

  在一个实例中,本发明提供了鉴定适合用于在给定的哺乳动物重组宿主细胞中促进重组蛋白表达的合成启动子的方法,包括以下步骤:

  a)获得两个或多个合成启动子的文库,所述合成启动子每个包含启动子核心和其上游的转录因子调控元件构建体,所述构建体包含选自SEQIDNO:30-169任一项或由SEQIDNO:30-169任一项组成的序列。

  b)测试步骤a)中获得的合成启动子构建体的文库,以确定在所选哺乳动物重组宿主细胞中被每种构建体驱动的重组蛋白表达的水平

  c)如果在步骤(b)中经测试的合成启动子构建体促进重组蛋白以所希望的水平表达,则选择该合成启动子构建体。

  在进一步的方面,本发明提供了优化用于表达特定蛋白的启动子和细胞组合的方法。因此,本发明提供了一种方法,其包括步骤i):在可比较的条件下对于相同的蛋白,分析各自包括根据本公开的合成启动子的至少两种宿主细胞(诸如至少两种CHO细胞)的至少一个参数(诸如表达水平)。

  在一个实施方案中,所述方法进一步包括选择最适合于给定蛋白的表达的细胞和合成启动子组合的步骤。

  如在此上下文中所使用的不同的是意在指其中细胞中元件的组合对于其所比较的细胞是不一样的(不相同的),例如,如果被比较的细胞的基因组是基本上相同的,则在细胞中的合成启动子将是不同的(或在细胞中的另一实体将是不同的)。如果在所述至少两种细胞中的合成启动子是相同的,则一些元件(例如在细胞基因组中的元件或基因)将是不同的(不相同的)。

  因此,该方法提供了用于通常当在类似条件下进行分析时至少两种细胞的比较的方法,例如在基本上相同的时间或在相同的实验中进行分析。

  应该理解的是,可使用本文上述的TFRE元件构建进一步的文库并用于生成合成启动子和启动子文库并如上文所述进行筛选。在一个实例中,本发明提供了构建TFRE构建体文库的方法,所述方法包括随机连接TFRE元件NFKB-RE、E-框、GC-框和C/EBPα-RE的步骤。在一个实例中,构建这样的文库,其中例如这些元件以5:3:1:1的比例随机连接。

  在一个实施方案中,本发明提供了构建TFRE构建体文库的方法,所述方法包括随机连接TFRE元件NFKB-RE和E-框和/或CRE的步骤。在一个实例中,构建这样的文库,其中例如这些元件以5:3的比例随机连接。

  在一个实施方案中,所述合成启动子的文库用例如本文所公开的TFRE的各种组合的不同排列组合进行专门设计(合理设计)。

  如上所讨论,可以采用本文公开内容制备具有一系列活性的启动子。具有覆盖横跨三个数量级的活性的不连续的启动子的提供,允许CHO细胞工程师精确改造合适的细胞工厂,其中细胞功能的系统水平控制可能需要化学计量上平衡的几个基因的组成型表达。

  在一个实施方案中,本公开的合成启动子,包含该启动子的质粒和包含启动子、质粒或载体的细胞(诸如哺乳动物细胞,特别是CHO细胞细胞)适合用于驱动多核苷酸(例如DNA或RNA,例如RNAi、shRNA等)的转录。

  在一个方面,本发明提供了生成适合用于在给定的哺乳动物重组宿主细胞中促进重组蛋白表达的合成启动子的方法,其包括以下步骤:

  a)鉴定转录因子调控元件的基序,

  b)测试与启动子核心组合的在步骤a)中鉴定的每种转录因子调控元件在所选哺乳动物重组宿主细胞系中的活性,

  c)选择两个或更多个转录因子调控元件,所述调控元件在所选哺乳动物重组宿主细胞系中比单独启动子核心更有活性,

  d)制备一种或多种合成启动子构建体,所述构建体包含那些转录因子调控元件中的两个或更多个转录因子调控元件,所述转录因子调控元件独立地选自步骤c)中所选的那些转录因子调控元件,

  e)测试步骤d)中制备的构建体在所选哺乳动物重组宿主细胞中的活性,

  f)鉴定相比野生型启动子(诸如从其衍生启动子核心的野生型启动子)展示提高的蛋白表达的合成启动子构建体。

  在一个实施方案中,所述方法进一步包括步骤:

  g)选择那些转录因子调控元件中的两个或更多个转录因子调控元件,所述调控元件与在步骤f)中鉴定的构建体相关,和

  h)制备一种或多种包含TFRE构建体的合成启动子构建体,其包含在步骤g)中独立地选择的那些元件,或由那些元件组成。

  有利地,额外的步骤允许进一步改进由上述方法所生产的合成启动子构建体,由此导致用于展示增强的表达(例如,增强的表达水平)的靶宿主细胞系的启动子构建体。

  在一个实施方案中,步骤h)中制备的合成启动子构建体包含由反映它们在步骤f)中鉴定的构建体中相对丰度的化学计量的转录因子调控元件组成的TFRE构建体。

  有利地,通过掺入以反映它们在高表达合成启动子中相对丰度的化学计量的各种转录因子调控元件,这进一步提炼和帮助分离更有可能增强核心启动子的基础转录活性的转录因子调控元件。

  在一个实施方案中,所述方法进一步包括鉴定转录因子调控元件的步骤,并且不在步骤g)中选择这些调控元件,所述调控元件最经常与相比野生型启动子展示减少活性的启动子构建体相关联。

  在上述方法中,“活性”通常是由任何给定启动子驱动的蛋白表达的水平,例如重组蛋白或报告基因表达的水平。

  在相关的方面,本发明提供了合成本发明的启动子的方法,其包括步骤:

  a.分析哺乳动物细胞系中报告基因的表达水平,其中所述报告基因表达由多个合成启动子驱动,其中每个启动子包含一个或多个转录因子调控元件构建体,位于核心启动子的上游,并且其中每个TFRE构建体由单一类型的转录因子调控元件组成;

  b.比较由合成启动子驱动的报告基因表达水平与由具有已知活性水平的对照启动子驱动的报告基因表达水平;

  c.鉴定具有高于对照启动子构建体表达水平的报告基因表达水平的合成启动子,由此鉴定在哺乳动物细胞系中有活性的转录因子调控元件;和

  d.选择在步骤c中经鉴定的转录因子调控元件并将那些元件中的两个或更多个元件掺入转录因子调控元件构建体,并将所述构建体掺入合成启动子,其中每个转录因子调控构建体仅由所选的转录因子调控元件组成。

  有利地,上述方法允许本发明的启动子的合成,其中没有哪一种特定转录因子调控元件会在靶宿主细胞系中有活性并因此适合用于靶宿主细胞系的事先知识。

  在一个相关实施方案中,上述方法进一步包括步骤:

  e.分析哺乳动物细胞系中报告基因的表达水平,其中所述报告基因表达由来自步骤d的多个合成启动子驱动;

  f.鉴定具有最高和最低表达水平的启动子;

  g.确定来自步骤f的启动子构建体中每个转录因子调控元件的相对频率,由此鉴定与更高表达水平相关联的转录因子调控元件;和

  h.选择在步骤g中经鉴定的转录因子调控元件并将那些元件掺入包含一个或多个转录因子调控构建体的合成启动子中,其中每个构建体仅由所选的转录因子调控元件组成。

  显然,上文公开的方法可以进行修改以用另一种所希望的参数替换蛋白表达水平,例如在功能测定中所表达蛋白的活性或蛋白折叠的适当性/水平。

  如本文采用的多个合成启动子指各自含有不同合成启动子或不同合成启动子组合的类似细胞群体,使得来自不同群体的表达水平可以进行比较。

  在一个实施方案中,所述重组蛋白可以是抗体或其抗原结合片段,例如如下文更详细地所讨论的。

  有利地,额外的步骤允许进一步改进由上述方法所生产的合成启动子构建体,由此导致用于展示增强的表达水平的靶宿主细胞系的启动子构建体。

  在一个实施方案中,转录因子调控元件以衍生自它们在来自步骤d的合成启动子构建体中相对表现的化学计量,掺入在步骤h中的启动子构建体。

  有利地,通过掺入反映它们在高表达合成启动子中相对丰度的化学计量的各种转录因子调控元件,这进一步提炼和帮助分离更有可能增强核心启动子的基础转录活性的转录因子调控元件。

  附图说明

  图1:显示描绘报告基因测定结果的图,以鉴定在CHO细胞中有活性的转录因子调控元件。

  28个转录因子调控元件(TFRE)(见表1)衍生自已知在哺乳动物细胞中有活性的常见病毒启动子中的转录因子结合位点的信息学分析。

  使用SEAP/GFP报告构建体评价所述28个TFRE在CHO-S细胞(表2中所示的序列表)中转录活性。报告构建体的一般结构的示意图也显示在图1中。将七个拷贝的每种TFRE(如表1所述)克隆到编码GFP或SEAP报告基因的报告载体中最小CMV核心启动子的串联上游。

  在24孔板中的CHO-S细胞(2×105)用1μgSEAP(黑色条)或GFP(白色条)TFRE报告载体转染。转染后24小时测量在细胞培养上清液中的SEAP活性和细胞内的GFP。数据表示为相对于仅包含最小CMV核心启动子(核心)的载体的活性的倍数变化。与TFRE序列没有已知的同源性的随机8bp序列(8聚体)也用作-ve对照。条代表各自一式三份进行的三次独立实验的平均值+SD,对于每个TFRE-报告构建体使用三个克隆衍生的质粒。

  图2:显示指示一些比较本发明的第1代合成启动子(在表3中所示的序列)的表达水平的报告基因测定的结果的图。

  第1代合成启动子通过等比例的NFκB、CRE、E-框、GC-框、E4F1和C/EBPαTFRE随机连接构建。合成启动子被插入到SEAP报告质粒中最小CMV核心启动子的上游,并且转染到CHO-S细胞中。图2包括第1代合成启动子的一般结构的示意图。

  SEAP表达在转染后24小时进行定量。数据表示为启动子1/01(序列参见表3)显示的产率的百分比。从对照CMV-SEAP报告基因的SEAP产率显示为黑色条。每个条代表两次转染的平均值,对于每个启动子观察到SEAP产率小于10%的变化。

  图3A/B:显示了一系列图,其每一个显示相对于其中存在TFRE的第1代启动子构建体的表达水平的TFRE丰度的分析结果。

  在每个合成启动子中的每个TFRE的数目相对该启动子(A-F)的相对活性作图。在每一种情况下显示线性回归线,其中线的斜率表示每个TFRE在不同活性的启动子中存在的程度。

  高于均值:高于平均表达水平(即高表达构建体)。

  低于均值:低于平均表达水平(即低表达构建体)。

  图4:显示指示一些比较本发明的第2代合成启动子构建体(在表4中所示的序列)的表达水平的报告基因测定的结果的图。

  第2代合成启动子通过以5:3:1:1的比例随机连接NFκB、E-框、GC-框、C/EBPαTFRE进行构建。将合成启动子插入到SEAP报告质粒中最小CMV核心启动子的上游,并且转染到CHO-S细胞中。SEAP表达在转染后24小时进行定量。数据表示为有CMV对照启动子(黑色条)展示的生产的百分比。从来自第1代文库(1/01;图2)报告基因的最有活性的启动子的SEAP生产显示为检查条。否则,每个条代表两次转染的平均值,对于每个启动子观察到SEAP生产小于10%的变化。

  启动子构建体1/01(阴影条):最高的第1代启动子,其产生最高的表达水平。

  图5:显示了一系列图,其每一个显示相对于其中存在TFRE的第2代启动子构建体的表达水平的TFRE丰度的分析结果。

  在每个合成启动子中的每个TFRE的数目相对该启动子(A-D)的相对活性作图。在每一种情况下显示线性回归线,其中线的斜率表示每个TFRE在不同活动的启动子中存在的程度。

  高于均值:高于平均表达水平(即高表达构建体)。

  低于均值:低于平均表达水平(即低表达构建体)。

  图6:显示报告基因测定结果,其指示在CHO-S细胞、CHO-K1细胞和CHO-DG44细胞中确定的具有不同相对活性的7个合成启动子的相对活性。细胞(2×105)用250ngSEAP-报告载体转染,并且在转染后24小时定量SEAP产率。数据表示为在每个细胞系中CMV启动子的活性的百分比。值代表一式三份进行的三个独立实验的平均值+S.D。

  有趣的是,每个启动子的相对性能在所有测试细胞系中不是相同的。

  图7:显示报告基因测定结果,其涉及使用图6中所描绘的相同的合成启动子构建体在CHO-S细胞的补料分批培养中较长期的瞬时表达(即,进行超过7天)。

  CHO-S细胞(6×106)用7.5μg的SEAP报告载体转染,其中SEAP表达是在具有不同活性的合成启动子或对照CMV启动子的控制下。SEAP产率和活细胞浓度在旋管生物反应器中经过7天补料分批过程进行测量。显示了在第7天(白色条)的平均IVCD(活细胞密度的积分)和SEAP滴度(黑色条)。SEAP数据表示为对照CMV启动子活性的百分比。两个独立的转染均重复进行。

  图8:显示根据本公开的合成启动子的各种序列。

  发明详述

  如本文所用“以串联”是指序列“成线性”一个接一个。

  如本文所用,术语“转录因子”是指任何细胞因子,包括结合顺式作用区域和正调节或负调节基因表达的蛋白质,例如,转录因子可以结合基因编码序列的上游,以通过协助或阻断RNA聚合酶结合来增强或抑制该基因的转录。转录因子或抑制子或共活化因子或共抑制子等涵盖在此定义之内。

  如本文所用,术语“转录因子调控元件”或“TFRE”或“调控元件”指的是被转录因子识别和结合的核苷酸序列。

  TFRE包含核酸序列,适当地,双链DNA序列。TFRE可包括顺式作用区域,并且还可以包括额外的核酸。启动子和增强子元件的核心六至八个核苷酸可足以用于结合其相应的转录因子。

  因此,TFRE可以由6至8个核酸碱基组成。本发明的TFRE可以是6个或更多,8个或更多,10个或更多,15个或更多,20个或更多,25个或更多,或30个或更多碱基的长度。本发明的TFRE可以是100个或更少,75个或更少,50个或更少,30个或更少,25个或更少,20个或更少,或15个或更少碱基的长度。

  然而本领域技术人员将明白,并不总是排除来自其它转录因子的影响,例如普通转录因子或者杂乱结合到多核苷酸的转录因子。因此,这样的合成启动子构建体被认为是由转录因子来特异性地进行控制,其中至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,或至少99%的转录活性或抑制活性通过转录因子介导,转录因子调控元件已被掺入所述启动子用于所述转录因子。

  特别合适的TFRE是在目标细胞或组织中具有活性的TFRE。这种TFRE可被鉴定为与在目标细胞或组织中表达的基因相关联,例如,当与另一种细胞或组织相比时,TFRE可与在该细胞或组织中差异表达的基因相关联。基因的差异表达可以通过比较在两种不同的细胞或组织中的基因表达,或在不同条件下的相同细胞或组织中的基因表达而看出。

  在一种细胞或组织类型中的表达可以与在不同但相关的组织类型中的表达相比较,例如,当目标细胞或组织是疾病细胞或组织或已经如本文所述进行人为操纵时,在该细胞或组织中的基因表达可以与相当的正常或未处理的细胞或组织中的相同基因的表达进行比较。这可以允许在两种细胞或组织类型之间鉴定差异调控的基因。

  与这样的基因相关联的TFRE通常位置接近细胞的基因组内基因的编码序列,例如,这样的TFRE可以位于该区域内该编码序列的紧接的上游或下游。这样的TFRE可以位置接近调节该基因表达的启动子或其它调控序列。TFRE的位置可以由本领域技术人员使用各种已知的方法(诸如在本说明书中描述的那些方法)来确定。

  本发明的转录因子调控元件的一些合适的实例显示于下表1中。

  表1——转录因子调控元件:针对不连续的转录因子调控元件的存在(转录因子结合位点),对10个认为在CHO细胞中表现出活性的病毒启动子进行了调查,所述调查使用转录元件搜索系统(TESS)和转录亲和预测(TRAP)算法用严格的搜索参数以最大限度地减少假阳性。列出了在一个以上病毒启动子中存在的单个TFRE的DNA序列。图1中显示了它们在CHO-S细胞中活化重组报告基因转录的相对能力的测量结果。

  

  

  应当理解,本发明的转录调控元件不限于在说明书中提到的具体序列,还包括它们的结构和功能类似物/同系物。这样的类似物可以含有通过直接或通过随机诱变引入一个或多个核苷酸的截短、缺失、插入以及取代。对于已知的转录抑制子可以引入截短,以缺失一个或多个结合位点。

  此外,这样的序列可以衍生自与本发明的序列表现出高度同一性的、在自然界天然发现的序列。约20个核苷酸或更多的核酸将被认为与本发明的转录因子调控元件具有高度同一性,如果其在严格条件下杂交到相关转录因子。可选地,核酸将被认为与本发明的转录因子调控元件具有高度同一性,如果其包含具有如通过标准比对算法确定的至少70%、75%、80%、85%、90%、95%或更多百分比同一性的约20个或更多个核苷酸的连续序列,所述算法诸如,例如,基本局部比对工具(BLAST)(描述于Altshul等,J.Mol.Biol.1990,215:403-410中),Needleman等,J.Mol.Biol.1970,48:444-453的算法,或Meyers等,Comput.Appl.Biosci.1988,4:11-17的算法。

  本发明的转录因子调控元件可以从早就已知在靶宿主细胞中有活性的转录因子调控元件中进行选择,或者可以是通过使用本领域技术人员已知的方法通过核心启动子上游序列的计算机分析确定的推定的调控元件。

  在一个实施方案中,本发明提供了选自本文所述的转录因子调控元件组合的组合的用途,例如用于在宿主中的提高转录、翻译或表达,特别是通过掺入到合成启动子。

  在一个实施方案中,本发明提供了合成启动子的用途,例如,如本文所述的用于在哺乳动物宿主细胞(诸如CHO细胞)中驱动表达。

  这些计算机分析通常通过比较各种生物体的基因组之间的非编码调控序列,以使得能够鉴定在候选基因的启动子中显著富集,或来自通过微阵列分析鉴定的簇,以及可潜在地作为转录因子调控元件发挥作用的保守区域。这些软件套装的实例包括TRAFAC、CORG、CONSITE、CONFAC、VAMP和CisMoIsAnalyser。

  如本文所用,术语“启动子”或“启动子构建体”是指DNA片段,所述DNA片段含有用于基因有效转录的组件,并包括一种或多种转录因子调控元件;核心启动子区域;和任选地,来自5'-非翻译区或内含子的序列。

  如本文所用,术语“合成启动子构建体”或“合成启动子”指人工或工程化或装配的启动子序列,例如包含两个或更多个的转录因子调控元件,诸如含有一个或多个转录因子调控元件构建体。

  如本文所用,术语“转录因子调控元件构建体”或“TFRE构建体”是指包含多于一个转录调控元件序列的组装的双链DNA分子。所述构建体可通过本领域技术人员会知晓的不同手段来创建;包括以随机或定向方式将各种双链转录调控元件连接在一起。所述构建体也可包含其它核酸序列,例如不介导转录因子的结合,但允许结合位点的正确的空间布置的间隔子。间隔子区域,例如可以是共同的单链突出端,其允许不同TFRE很容易地彼此连接。

  TFRE通常是彼此串联的,但可以由单链突出端序列分开。

  所述构建体可包含相同的至少两个转录因子调控元件。

  所述构建体可包含用于至少两个不同的转录因子的至少两个不同的转录因子调控元件。

  所述构建体也可包含多个,例如,2、3、4、5、6、7、8、9或10个或更多的转录因子调控元件。这些中许多可以是相同的,或者它们可以全部是不同的。

  当在构建物内组装时,转录因子调控元件结合在靶宿主细胞中表达的多种转录因子并有效地驱动重组蛋白或报告蛋白的表达。然而,同样组合的转录因子调控元件可以在非靶宿主细胞中是无活性的,由于缺乏结合到该序列元件所希望的特定转录因子。因此,通过了解在靶宿主细胞中有活性的转录因子和共调控因子的准确概况而最有效地利用基因转录的组合性质。

  如本文所用,术语“核心启动子”或“启动子核心”指短的DNA区段,其是启动转录所需的启动子的最小部分。核心启动子序列可以衍生自各种不同的来源,包括原核和真核基因。这方面的实例是多巴胺β-羟化酶基因最小启动子和巨细胞病毒(CMV)立即早期基因启动子。在一个实例中,核心启动子衍生自选自下列的启动子:CMV、SV40、UbC、EF1A、PGK和CAGG,诸如CMV。

  核心启动子可以是“诱导型”,其中,响应于诱导剂转录被启动,或者与不存在诱导剂的情况下的转录水平(如果有的话)相比,可操作地连接的可表达的多核苷酸的转录水平增加。

  可选地,启动子可以是“组成型”的,其中,所述转录活性不受诱导剂的存在的影响。

  术语“诱导剂”用于指影响来自诱导型启动子的转录的化学、生物或物理试剂。诱导剂可以是,例如,细胞所暴露的应激条件(例如,热休克或冷休克),毒性剂(诸如重金属离子),或营养、激素、生长因子等的缺乏;或者可以暴露于影响细胞的生长或分化状态的分子(诸如激素或生长因子)。

  核心启动子,也可以“组织特异性”或“组织优选”的方式调节,使得其仅在特定组织类型中转录可操作连接的编码区时有活性。

  如本文所用,术语‘野生型启动子’是指如其在自然界中存在的启动子序列。

  除非另外指出,否则术语“CMV启动子”是指通常公认的全长hCMV-IE1启动子(即,核心和近端元件)GenBank登录号:M60321.1,碱基595-1193)。如本文所用的术语“CMV核心”或“hCMV-IE1核心”指的是本文所提供的如SEQIDNO:170的最小hCMV-IE1核心启动子。

  如本文所用术语“可操作地连接”指的是核酸序列中通过可操作的功能连接(即,能够影响其它元件的功能或对其它元件功能作出响应)并且不是实际位置的元件或结构。因此,对于核酸序列中的元件或者结构没有必要是串联或邻近顺序被可操作地连接。

  如本文所用的术语“载体”指的是将核酸递送入细胞或生物体的任何载体。载体的一个实例是“质粒”,其是环状双链DNA环,其中可以连接另外的DNA区段,并且可以独立地复制染色体DNA。质粒存在或主要衍生自细菌并且有时衍生自其它微生物。然而,线粒体和叶绿体DNA,嗜杀酵母和其他情况,通常排除在外。

  另一类型的载体是病毒载体,其中额外的DNA区段可连接到病毒序列。某些载体能够在其被引入其中的宿主细胞中自主复制(例如,具有细菌复制起始点的细菌载体和附加型哺乳动物载体)。其它载体(例如,非附加型哺乳动物载体)可以整合到宿主细胞的基因组中,在那里它们随后与宿主基因组一起复制。在本说明书中,术语“质粒”和“载体”可以互换使用,因为质粒是最常用的载体形式。

  通过其可以构建载体的一般方法、转染方法和培养方法是本领域技术人员熟知的。在这方面,参考“CurrentProtocolsinMolecularBiology”,1999,F.M.Ausubel(ed),WileyInterscience,NewYork和冷泉港出版社制作的Maniatis手册。

  本发明的载体可包含可选择标志物,其是这样的蛋白,所述蛋白的表达允许人们鉴定已转化的或用含有标志物基因的载体转染的细胞。

  各种各样的选择标志物是本领域中已知的,例如,可选择标志物可以是新霉素磷酸转移酶的基因(nptII),其表达赋予对抗生素卡那霉素抗性的酶,和相关抗生素新霉素、巴龙霉素、庆大霉素和G418的基因,或潮霉素磷酸转移酶的基因(hpt),其表达赋予对潮霉素抗性的酶。

  如本文所用的术语“表达载体”,是指编码在靶宿主细胞中表达的重组蛋白的载体。本发明可以提供多个如本文所述的不同的表达载体。这些可形成一个文库。

  如本文所用,“宿主细胞”是包含一个或多个本发明的合成启动子、载体或表达载体的细胞。所述细胞可以是哺乳动物细胞。所述宿主细胞可以是培养的细胞或体细胞。合适的哺乳动物宿主细胞包括CHO,骨髓瘤或杂交瘤细胞。

  可使用任何合适的方法来实现本发明的将载体转染入靶宿主细胞。多种转染方法在本领域中是已知的,并且本领域技术人员将能够根据载体类型和所希望的宿主细胞的类型来选择合适的方法。

  如本文所用的术语“瞬时表达”是指宿主细胞指导重组基因序列的转录和翻译的能力。这种转录和翻译在将基因序列引入宿主细胞后不久发生。即使当携带可操作地连接到功能性启动子的报告基因序列的质粒导入不能复制或扩增(propagate)所述质粒的宿主细胞中时,也可以发生这样的表达。

  如本文所用,“重组蛋白”是指使用重组DNA技术构建或生产的蛋白。目标蛋白可以是从外源载体表达的与内源蛋白或其突变形式(例如具有减弱的生物活性)相同的外源序列,或其片段。可选地,目的蛋白可以是通常不由宿主细胞表达的异源蛋白。

  重组蛋白可以是任何合适的蛋白,包括治疗、预防或诊断性蛋白。

  在根据本发明的合成启动子的控制下表达的重组蛋白可以,例如是免疫原性蛋白,包含两个异源蛋白的融合蛋白或抗体。用作重组蛋白的抗体包括单克隆、多价、多特异性、人源化、全人或嵌合抗体。所述抗体可以是具有全长重链和轻链的完整抗体分子或其片段,例如VH、VL、VHH、Fab、修饰的Fab、Fab'、F(ab')2、FV或scFv片段。

  表达后,如果需要的话,抗体片段可以被进一步处理,例如通过缀合到另一实体或例如所述抗体片段可以进行PEG化,以产生具有所希望的性能(例如类似于整个抗体)的产品。

  被抗体或其片段结合的目标抗原的实例可以包括但不限于,任何医学相关蛋白诸如疾病或感染期间上调的那些蛋白,例如受体和/或它们相应的配体。细胞表面蛋白的具体实例包括粘附分子,例如整联蛋白诸如β1整联蛋白,例如VLA-4、E-选择素、P-选择素或L-选择素、CD2、CD3、CD4、CD5、CD7、CD8、CD11a、CD11b、CD18、CD19、CD20、CD23、CD25、CD33、CD38、CD40、CD45、CDW52、CD69、CD134(OX40)、ICOS、BCMP7、CD137、CD27L、CDCP1、DPCR1、DPCR1、dudulin-2、FLJ20584、FLJ40787、HEK2、KIAA0634、KIAA0659、KIAA1246、KIAA1455、LTBP2、LTK、MAL2、MRP2、连接素样-2、NKCC1、PTK7、RAIG1、TCAM1、SC6、BCMP101、BCMP84、BCMP11、DTD、癌胚抗原(CEA)、人乳脂肪球蛋白(HMFG1和2)、MHCI类和MHCII类抗原和VEGF,并且在适当时,其受体。

  可溶性抗原包括白细胞介素诸如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-8、IL-12、IL-16、IL-23,病毒抗原例如呼吸道合胞病毒或巨细胞病毒抗原,免疫球蛋白诸如IgE,干扰素诸如干扰素α、干扰素β或干扰素γ,肿瘤坏死因子-β,集落刺激因子诸如G-CSF或GM-CSF,以及血小板衍生生长因子诸如PDGF-α和PDGF-β,并且当适当时,其受体。其它抗原包括细菌细胞表面抗原,细菌毒素,病毒诸如流感病毒、EBV、HepA、B和C,生物恐怖主义试剂,放射性核素和重金属,以及蛇和蜘蛛毒液和毒素。

  如本文所用的术语“报告基因”是指编码容易测定的蛋白的核酸序列。其中较常用的报告基因是下列“报告蛋白”的那些基因:氯霉素乙酰转移酶(CAT)、分泌型碱性磷酸酶(SEAP)、β-半乳糖苷酶(GAL)、β-葡糖醛酸酶(GUS)、萤光素酶(LUC)和绿色荧光蛋白(GFP)。本领域普通技术人员会意识到其它可用的报告基因。

  本发明还提供了“报告基因测定法”,作为一种方法,通过该方法可以分析细胞内特定的合成启动子的转录活性。这些测定法可包括连接用于可视化启动子活性的报告基因到目标启动子的下游,以由此获得报告构建体,在测试细胞中引入报告构建体,并在所测量的表达的报告蛋白水平的基础上量化启动子活化的条件。

  报道基因可以,例如编码分泌型报告蛋白,当其转录和翻译时,将导致分泌型报告蛋白合成和分泌到外部培养基中。通过测定培养基监测报告分子的存在中,而不需要破坏或破裂微生物宿主细胞。培养基的等分试样通过能够检测报告分子的任何手段进行评价。这种手段可以是,例如,通过免疫测定法或通过本领域已知的其它手段。因此报告分子在外部培养基中的积累率是任何启动子构建体的转录活性的指示,所述启动子构建体存在于所克隆的片段附近并在质粒/表达载体上的报告基因序列之前。

  可选地,如果使用视觉上可识别的报告基因诸如萤光素酶(其导致在底物萤光素和ATP的存在下光子的发射),则报告蛋白的表达水平可以容易地使用光度计监测。

  在一个实施方案中,重组蛋白不是报告蛋白,即,本公开的构建体不包含报告基因。

  在一个实施方案中,重组蛋白不是萤光素酶,即,本公开的构建体不包含编码萤光素酶的基因。

  如本文所用的术语“转录活性”是指在DNA中编码的信息转录到RNA分子中,或者RNA分子的核苷酸中编码的信息翻译成蛋白质中限定的氨基酸序列。

  具有“高”转录活性的启动子构建体是指这样的构建体,其能够被定义为高于在一系列启动子构建体获得的平均表达水平的“高”表达水平来表达重组蛋白或报告蛋白。作为参考点,具有最高活性水平的合成启动子超过广泛承认为在CHO细胞中最强的启动子之一的hCMV-IE1的活性。

  相反,具有“低”转录活性的启动子构建体是指这样的构建体,其被定义为低于在一系列启动子构建体获得的平均表达水平的“低”表达水平来表达重组蛋白或报告蛋白。

  因此,术语“转录活性”和“表达水平”在本说明书中可互换使用。

  术语“寡核苷酸”、“多核苷酸”或“核苷酸序列”在本文中广义地用于指由磷酸二酯键连接在一起的两个或更多个脱氧核糖核苷酸或核糖核苷酸的序列。因此,术语包括RNA和DNA,其可以是基因或其部分、cDNA、合成的多聚脱氧核糖核酸序列或多聚核糖核酸序列等,并且可以是单链或双链的,以及DNA/RNA杂交体。此外,术语“寡核苷酸”、“多核苷酸”和“核苷酸序列”包括天然存在的核酸分子,其可从细胞中分离出来,以及合成的分子,其可以例如通过化学合成的方法或通过酶促方法诸如通过聚合酶链式反应(PCR)进行制备。

  制备核苷酸序列的合成方法包括,例如,磷酸三酯和磷酸二酯法(参见Narang等,Meth.Enzymol.68:90,(1979)、美国专利号4,356,270、美国专利号4,458,066、美国专利号4,416,988、美国专利号4,293,652,和Brown等,Meth.Enzymol.68:109,(1979),其各自通过引用并入本文)。在各种实施方案中,本发明的寡核苷酸或在本发明的方法中有用的多核苷酸可以包含核苷或核苷酸类似物,或磷酸二酯键以外的主链键。

  包含寡核苷酸(多核苷酸)的核苷酸通常是天然存在的脱氧核糖核苷酸,诸如连接到2'-脱氧核糖的腺嘌呤、胞嘧啶、鸟嘌呤或胸腺嘧啶,或核糖核苷酸诸如连接到核糖的腺嘌呤、胞嘧啶、鸟嘌呤或尿嘧啶。然而,多核苷酸也可含有核苷酸类似物,包括非天然存在的合成核苷酸或修饰的天然存在的核苷酸。作为含有这种核苷酸类似物的多核苷酸,这样的核苷酸类似物是本领域熟知和可商购获得的(Lin等,Nucl.AcidsRes.22:5220-5234(1994);Jellinek等,Biochemistry34:11363-11372(1995);Pagratis等,NatureBiotechnol.15:68-73(1997),其各自通过引用并入本文)。

  连接寡核苷酸或多核苷酸的核苷酸的共价键通常是磷酸二酯键。但是,共价键也可以是任何许多其它键,包括硫酯(thiodiester)键、硫代磷酸酯键、肽样键或任何本领域技术人员已知的可用于连接核苷酸以产生合成多核苷酸的其它键(参见,例如Tarn等,Nucl.AcidsRes.22:977-986(1994);Ecker和Crooke,BioTechnology13:351360(1995),其各自通过引用并入本文)。当核苷酸序列要被暴露于可能含有核酸降解活性的环境时,包括,例如,组织培养基或施用到活体后,掺入非天然存在的核苷酸类似物或连接核苷酸或类似物的键可以是特别有用的,因为修饰的核苷酸序列可以对降解较不敏感。

  包含天然存在的核苷酸和磷酸二酯键的多核苷酸可以是化学合成的,或可以使用重组DNA方法,使用合适的多核苷酸作为模板来产生。相比较而言,包含核苷酸类似物或磷酸二酯键以外的共价键的多核苷酸通常是化学合成的,尽管诸如T7聚合酶的酶可以将某些类型的核苷酸类似物掺入多核苷酸,并且因此,可用于从适当的模板重组生产这样的多核苷酸(Jellinek等,同上,1995)。

  如本文所用,术语“文库”其中上下文规定是指两个或更多的TFRE构建体,两个或更多的合成启动子或两个或更多的本公开的表达载体或两种或更多的本公开的细胞。在整个说明书中描述的术语“文库”在其最广泛的意义上使用,并且还可以涵盖可以或不可以组合以产生本公开的文库的子文库。

  通过本发明的方法鉴定为在目标细胞或组织类型中有活性的TFRE可以用于靶向基因到该细胞或组织类型。例如,当本发明的方法表明,TFRE特异性地在特定的细胞类型而不是对照细胞类型中有活性时,则该TFRE可用于在目标细胞类型中特异性地指导表达。因此,本发明的TFRE可以与期望在特定细胞类型中表达的基因进行组合。

  在本说明书的上下文中,术语“包含”意在意味着“包括”。

  术语“约”或“大约”指在给定值或范围的20%以内,优选地在10%以内,并更优选在5%以内。

  当技术上适当时,本发明的实施方案可以进行组合。

  实施方案在本文中描述为包含某些特征/元素。本公开还延伸到由所述特征/要素组成或基本上由所述特征/要素组成的分开的实施方案。

  技术参考文献,诸如专利和专利申请通过引用并入本文。

  本文具体和明确记载的任何实施方案可单独的或与一种或多种进一步的实施方案组合形成免责声明的基础。

  本发明现在将参考以下实施例进行描述,所述实施例仅仅是说明性的并且不应该以任何方式解释为限制本发明的范围。

  参考文献

  Al‐FageehMB,MarchantRJ,CardenMJ,SmalesCM.2006.Biotechnologyandbioengineering93(5):829-835.

  BlazeckJ,GargR,ReedB,AlperHS.2012.Biotechnologyandbioengineering109(11):2884-2895.

  BrownAJ,MainwaringDO,SweeneyB,JamesDC.2013.Analyticalbiochemistry443(2):205-210.DaleL.2006.BioProcessInternational4:14-22.

  DaramolaO,StevensonJ,DeanG,HattonD,PettmanG,HolmesW,FieldR(2013)BiotechnologyProgressVolume30,Issue1,pages132–141,January/February2014.

  DattaP,LinhardtRJ,SharfsteinST.2013.BiotechnologyandBioengineeringVolume110,Issue5,pages1255–1271,May2013.

  FerreiraJP,OvertonKW,WangCL.2013.ProceedingsoftheNationalAcademyofSciences110(28):11284-11289.

  FerreiraJP,PeacockRW,LawhornIE,WangCL.2011.Systemsandsyntheticbiology5(3-4):131-138.

  GirodPA,Zahn‐ZabalM,MermodN.2005.Biotechnologyandbioengineering91(1):1-11.

  GrabherrMG,PontillerJ,MauceliE,ErnstW,BaumannM,BiagiT,SwoffordR,RussellP,ZodyMC,DiPalmaF.2011.Exploitingnucleotidecompositiontoengineerpromoters.PloSOne6(5):e20136.

  HaiT,CurranT.1991.ProceedingsoftheNationalAcademyofSciences88(9):3720-3724.

  HoSC,KohEY,vanBeersM,MuellerM,WanC,TeoG,SongZ,TongY,BardorM,YangY.2013.Journalofbiotechnology165(3-4):157-166.

  KimM,O'CallaghanPM,DromsKA,JamesDC.2011.Biotechnologyandbioengineering108(10):2434-2446.

  A.M.Lanza,J.K.Cheng,andH.S.Alper,CurrentOpinioninChemicalEngineering(2012).LeH,VishwanathanN,KantardjieffA,DooI,SriencM,ZhengX,SomiaN,HuW-S.2013.MetabolicEngineering.2013Nov;20:212-20.

  MaderA,PreweinB,ZborayK,CasanovaE,KunertR.2012.Appliedmicrobiologyandbiotechnology:1-6.

  MankeT,RoiderHG,VingronM.2008.Statisticalmodelingoftranscriptionfactorbindingaffinitiespredictsregulatoryinteractions.PLoSComputBiol4(3):e1000039.

  McLeodJ,O'CallaghanPM,PybusLP,WilkinsonSJ,RootT,RacherAJ,JamesDC.2011.Biotechnologyandbioengineering108(9):2193-2204.

  O'CallaghanPM,McLeodJ,PybusLP,LoveladyCS,WilkinsonSJ,RacherAJ,PorterA,JamesDC.2010.Biotechnologyandbioengineering106(6):938-951.

  OgawaR,KagiyaG,KodakiT,FukudaS,YamamotoK.2007.BioTechniques42(5):628.

  PasottiL,PolitiN,ZuccaS,DeAngelisMGC,MagniP.2012.Bottom-upengineeringofbiologicalsystemsthroughstandardbricks:Amodularitystudyonbasicpartsanddevices.PloSOne7(7):e39407.

  PrenticeH,TonkinC,CaamanoL,SiskW.2007.Journalofbiotechnology128(1):50-60.

  SchlabachMR,HuJK,LiM,ElledgeSJ.2010.ProceedingsoftheNationalAcademyofSciences107(6):2538.

  SchugJ.2008.Curr.Protoc.Bioinform.21:2.6.1-2.6.15

  StadlmayrG,A,RothmüllerM,MaurerM,SauerM,MattanovichD,GasserB.2010.Journalofbiotechnology150(4):519-529.

  StinskiMF,IsomuraH.2008.Medicalmicrobiologyandimmunology197(2):223-231.J,KuskP,JohansenTE,JensenPR.2002.Gene297(1):21-32.

  YimSS,AnSJ,KangM,LeeJ,JeongKJ.2013.Biotechnologyandbioengineering110(11):2959-2969

  ZhouH,LiuZ-g,SunZ-w,HuangY,YuW-y.2010.Journalofbiotechnology147(2):122-129.

  实施例1:鉴定CHO-S细胞中有活性的转录因子调控元件

  转录因子调控元件的计算机分析

  为了鉴定能够在CHO-S细胞中反式活化重组基因的不连续的TFRE(转录因子结合位点),发明人调查了通常已知在CHO细胞中有活性的10个病毒启动子中的推定TFRE。

  下面的启动子序列从GenBank数据库中检索到:hCMV-IE1(登录号M60321.1)、小鼠CMV-IE1(M11788)、大鼠CMV-IE1(U62396)、豚鼠CMV-IE1(CS419275)、小鼠CMV-IE2(L06816.1)、猿猴病毒40早期启动子和增强子(NC_001669.1)、腺病毒主要晚期启动子(KF268310)、骨髓增生肉瘤病毒长末端重复(LTR)(K01683.1)、劳斯肉瘤病毒LTR(J02025.1)和人类免疫缺陷病毒LTR(K03455.1)。

  根据Schug(Schug2008)和Manke等(Manke等,2008)先前描述的方法,使用转录元件搜索系统(TESS:http://www.cbil.upenn.edu/cgi-bin/tess/tess)和转录亲和预测工具(TRAP:http://trap.molgen.mpg.de/cgi-bin/trap_form.cgi)分析启动子。使用严格的搜索参数以尽量减少假阳性。

  使用扫描DNA序列的转录因子(TF)结合位点的在线搜索工具(特别是转录元件搜索系统(TESS)和转录亲和预测工具(TRAP)),采用严格的搜索参数(Mankeetal.2008;Schug2008)以最大限度地减少假阳性。在所有的病毒启动子序列中,67个不连续的TFRE鉴定为存在于一个或多个启动子中。为了进一步最小化该库(设计空间),过滤掉了未存在于至少两个启动子中的TFRE。

  基于上述计算机分析,鉴定了28个转录因子调控元件(TFRE)(参见下表2)。

  表2——通过病毒启动子的生物信息学调查鉴定的转录因子调控元件:针对不连续的转录因子调控元件的存在(转录因子结合位点),对10个已知在CHO细胞中表现出活性的病毒启动子进行了调查,所述调查使用转录元件搜索系统(TESS)和转录亲和预测(TRAP)算法用严格的搜索参数以最大限度地减少假阳性。列出了在大于一个病毒启动子中存在的28个单个TFRE。

  

  

  TFRE-报告载体构建

  在本研究中利用先前描述的(Brown等,2013)无启动子报告载体(亚克隆自pSEAP2对照(Clontech,Oxford,UK))。这些质粒含有最小的hCMV-IE1核心启动子(5’-AGGTCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTAGATACGCCATCCACGCTGTTTTGACCTCCATAGAAGAC-3’)(SEQIDNO:170),其在分泌型碱性磷酸酶(SEAP)或涡轮绿色荧光蛋白(GFP)开放阅读框(ORF)的上游。

  为了创建RE报告质粒,其中含有表1中每个TFRE共有序列的7个重复拷贝的合成寡核苷酸进行合成(Sigma)、PCR扩增并且插入到CMV核心启动子上游的KpnI和XhoI位点。三个对于每个TFRE报告基因克隆衍生的质粒使用Qiagen质粒微型试剂盒(Qiagen,Crawley,UK)进行纯化。通过DNA测序证实所有质粒构建体的序列。

  细胞培养和转染

  CHO-S和CHO-K1细胞在分别补充8mM和6mML-谷氨酰胺(Sigma)的CD-CHO培养基(LifeTechnologies)中培养。CHO-DG44细胞在补充有8mML-谷氨酰胺和18mL/LpluronicF68(LifeTechnologies)的CD-DG44培养基(LifeTechnologies)中培养。所有细胞在通气的Erlenmeyer瓶(Corning,UK)中在5%(v/v)CO2中,在37℃常规地培养,以140rpm振荡并且每3-4天以2×105个细胞/ml的接种密度继代培养。细胞浓度和活力通过使用Vi-Cell细胞活力分析仪(Beckman-Coulter,HighWycombe,UK)的自动台盼蓝排除测定法确定。转染前两小时,来自中期指数期培养物的2×105个细胞接种到24孔板(Nunc,UK)的各个孔中。细胞用根据制造商的说明书制备的包含DNA和阳离子脂质体(Lipofectamine)(LifeTechnologies)的DNA-脂质复合物转染。转染的细胞在蛋白表达分析前孵育24小时。

  报告基因表达的定量

  使用SensolytepNPPSEAP比色报告基因测定试剂盒(CambridgeBiosciences,Cambridge,UK)根据制造商的说明书对SEAP蛋白的表达进行定量。使用FlouroskanAscentFL荧光仪(激发滤光片:485nm,发射滤光片:520nm)对GFP蛋白的表达进行定量。在用无启动子载体转染的细胞中确定背景荧光/吸光度。

  报告基因测定的结果示于图1。用CMV核心启动子(相对于TSS为-34至+48,包括TATA框和起始元件)观察到可以忽略不计的基础活性。

  可以看出,相比单独使用核心启动子时,大部分TFRE没有导致SEAP/GFP的表达水平增加。然而,7个TFRE,即NFKB-RE、E-框、AP1-RE、CRE、GC-框、E4F1-RE和C/EBPα-RE相比单独核心启动子CMV显示更高的SEAP/GFP表达水平。

  选择这7个TFRE用于掺入第1代合成启动子。

  实施例2:第1代启动子的构建和分析

  合成启动子文库构建

  从互补的单链5'磷酸化寡核苷酸(Sigma,Poole,UK)构建合成启动子TFRE,通过在95℃加热5分钟,然后经过2小时缓慢冷却到25℃,在STE缓冲液(100mMNaCl,50mMTris-HCl,1mMEDTA,pH7.8,Sigma)中退火。寡核苷酸被设计为使得所得到的双链嵌段含有特定TFRE(表1),和在每个5'末端的4bpTCGA单链突出端。例如,用于NFkB-RE嵌段的序列如下(RE位点加下划线):5'-TCGATGGGACTTTCCA-3'SEQIDNO:171和5'-TCGATGGAAAGTCCCA-3'SEQIDNO:172。

  为了构建第1代合成启动子文库,使用鉴定为在CHO-S细胞中有转录活性的所有7个TFRE。化学合成包含每个TFRE序列的单个拷贝的寡核苷酸构件嵌段。NFκB、CRE、E-框、GC-框、E4F1和C/EBPα;由于先前观察到在CRE和AP1位点之间的功能冗余(Hai和Curran1991),将AP1从文库中省略。

  通过用高浓度T4DNA连接酶(LifeTechnologies,Paisley,UK)连接以合适的化学计量摩尔比的TFRE合成转录因子调控元件嵌段。包含KpnI和XhoI位点的“克隆嵌段”包括在以1:20摩尔比的TFRE的连接混合物中。连接的分子用KpnI和XhoI(Promega,Southampton,UK)消化、凝胶提取(Qiaquick凝胶提取试剂盒,Qiagen)并且插入在无启动子SEAP报告载体中最小CMV核心启动子的上游。纯化和测序克隆衍生的质粒。使用SEAPORF的上游的hCMV-IE1启动子(以下简称CMV)构建对照CMV启动子报告质粒。

  SEAP的瞬时产率用来确定合成启动子的相对活性,因为其既最大化通量,又提供合成启动子转录活化的直接读出,而无整合特异性效应或沉默的潜在干扰。虽然SEAP产率不是转录活性的直接测量,在这个实验室以前的实验已经证实,在细胞培养物上清液中的SEAP活性与转染后的SEAPmRNA水平线性相关。此外,测定条件进行了优化,使得对照CMV-SEAP报告活性在关于质粒拷贝数(DNA载量)和测量的SEAP输出的线性测定范围的中心(数据未显示)。

  从随机挑取的110个转化的大肠杆菌菌落纯化的质粒DNA用于测量SEAP报告产率。对每个合成启动子在转染24小时后测量SEAP产率,并且每个启动子进行测序,以揭示其TFRE嵌段组成。发现报告质粒的一小部分(14)缺乏启动子插入并且在进一步分析时排除这些质粒。

  剩下的96个启动子的相对转录活性显示于图2,并且它们的TFRE嵌段组成列于下表3。这些数据显示,第1代合成启动子活性横跨两个数量级,其中最有活性的合成启动子展示比衍生自CMV对照载体增加1.2倍的SEAP产率。

  表3:第1代启动子:N=NFκB-RE、E=E-框、G=GC-框、B=C/EBPα-RE、C=CRE、F=E4F1-RE。反向的TFRE通过单引号指示(即相对SEAP报告基因3′至5′)。所有其它TFRE都以5′至3′方向。

  

  

  

  

  

  合成启动子组成的分析表明,(i)合成启动子长度在7和31个TFRE之间变化(平均值=11.9±4.2个嵌段;189±66bp),虽然相对转录活性与启动子长度无关,(ii)在第1代文库中六个TFRE的相对丰度大致相等的,和(iii)个别TFRE可以正向或反向方向存在[即共有的TF识别序列(见表1)可存在于任一DNA链上],但这与合成启动子活性不明显相关,无论关于存在的一般频率还是关于特定TFRE嵌段的相对方向。

  因此,本发明人推断合成启动子活性的变化是启动子内特定TFRE不同相对丰度和/或位置效应的结果(即,TFRE的特定相邻或远端的组合可影响启动子强度)。尽管鉴于文库的大小后者难以计算,但本发明人通过确定不同活性的合成启动子中个别TFRE存在的相对频率解决了前者。这些数据显示于表3中。

  虽然没有单一的TFRE对合成启动子强度展示明显占优的影响,但是个别TFRE要么在高转录活性启动子(NFκB,E-框)中相对丰富,在启动子间平均分布(C/EBPα,GC-框),要么在低活性启动子(E4F1,CRE)中相对丰富。这种偏倚通过多重线性回归分析证实,其中无论所有因子模型(包含所有6个TFRE,r2=0.57,P=1.7×10-14)还是排除C/EBPα和GC-框的TFRE(因为这些不改善模型拟合;r2=0.56,p=8.84x10-16)的简约模型都预测TFRE嵌段的最佳化学计量比是NFκB1.58:E-框1。

  其它TFRE是中性(C/EBPα,GC-框)或负效应物(E4F1,CRE)。整个文库中特异性启动子序列分析证实了位点名称为正、中性或负。例如,最强的启动子(1/01)在文库中含有正(NFκB,E-框):负(E4F1,CRE)位点(9:1)的最高比例。此外,三个最有活性的启动子(1/01-1/03)是文库中仅有的含有多于7个正位点和少于3个负位点的启动子。也有多个实例,其中大量正位点明显被大量负位点抵消以产生相对较弱的启动子,例如启动子1/37,1/52和1/68,其分别具有8:8、8:8和9:11的正:负比例。

  因此,本实施例证明,本发明的合成启动子具有取决于所选择的启动子构建体而适于表达重组蛋白至特定表达水平的潜力。

  实施例3:第2代合成启动子的构建和分析

  基于上述第1代合成启动子的分析,本发明人通过使用衍生自第1代启动子组成的分析的最佳比例的TFRE的混合物的随机连接,创建第2代合成启动子文库,寻求进一步提高合成启动子活性。

  利用初始的7个鉴定的TFRE(参见图1)中的四个,用于构建第2代合成启动子文库,所述合成启动子以定量衍生自它们在第1代合成启动子构建体中活性合成启动子中的相对表现的化学计量。所用的化学计量比为5:3:1:1(NFkB-RE:E-框:C/EBPa-RE:GC框)。

  具体而言,初始的7个TFRE中,负的TFRE,E4F1和CRE(参见图3)已被省略(即含有更大数目的这些TFRE的启动子与更低的报告基因的表达水平相关),而基于增加的复杂性可能是有利的假设将中性TFRE,C/EBPα和GC-框包括在内。例如,在第1代文库中的三个最有活性的合成启动子都包含至少两个拷贝的中性TFRE(参见表3),并且因此,它们可以促进未知的位置效应。本发明人预期,第2代启动子将含有与第1代启动子相同的平均数量的TFRE(12)。

  使用如上述实施例2中相同的构建方法生成第2代启动子构建体(序列参见下表4)。

  表4:第2代启动子:N=NFκB-RE、E=E-框、G=GC-框、B=C/EBPα-RE。

  反向的TFRE通过单引号指示(即相对SEAP报告基因3′至5′)。所有其它TFRE都以5′至3′方向。

  

  

  随机挑取50个转化的大肠杆菌菌落,对纯化的质粒DNA中合成启动子进行测序并且利用44个包含启动子序列的报告质粒测量SEAP报告产率。第2代启动子的相对转录活性显示于图4。

  相比第1代启动子,第2代的合成启动子展示出活性显著增加。特别是,平均表达水平(相对于CMV)从第1代启动子的21.2%转变为第2代文库的116%。事实上,结果表明,大量第2代启动子比最高的第1代启动子具有更高的活性。25个第2代合成启动子(文库的57%)取得了比CMV启动子对照更高的SEAP产率,并且最强的启动子(2/01)表现出2.2倍的增加。

  图5显示了相对于其中存在TFRE的第2代合成启动子构建体的表达水平,每个TFRE的相对丰度的分析结果。

  第2代启动子的TFRE嵌段组成的分析表明,整个文库中TFRE的相对化学计量基本上如所设计的(NFκB5:E-框2.81:GC-框1.32:C/EBPα1.15)。如图5所示,对于第2代启动子,GC-框和C/EBPα的影响通常是负的,而NFκB和E-框保持正效应。

  但是,考虑到第2代启动子的组成(参见表4的序列),结果表明,无论NFκB还是E-框的TFRE嵌段都不可以单独支持高转录活性-这两者的组合是必须的。

  最有力的启动子(2/01-2/03)含有相对大量的以大致相等的比例的两种TFRE,以及相应地少量的负GC-框和C/EBPα嵌段。一些较低活性的启动子都含有相对大量的NFκB或E-框嵌段(例如2/11、2/13、2/17),但(i)含有次优比例的NFκB:E-框(2/11、2/17)或(ii)还含有相对大量的GC-框和C/EBPα嵌段(2/13)。

  因此,本实施例证实,第2代启动子能够成功地延伸在使用第1代启动子构建体的CHO细胞中可以获得的可能的转录活性范围。

  实施例4:分析不同CHO宿主细胞类型中的第1和2代启动子构建体

  为了确定本发明的合成启动子是否强力并可预测地执行,本发明人评价了它们在不同CHO宿主细胞系中的相对功能性能力。

  选择来自第1和2代文库的一组7个启动子,覆盖宽范围的启动子活性(即,1/51<1/17<1/04<1/02<2/19<2/03<2/01)。这些活性是与CMV的活性相比的。

  图6显示了在三种常用宿主细胞系CHO-S、CHO-DG44和CHO-K1中从所有启动子的SEAP产率。启动子活性的相对等级顺序在所有三个细胞系中得到维持,例外是2/03在CHO-K1优于2/01—与最初的筛选相反(参见实施例3),启动子2/03和2/01在CHO-DG44及CHO-S中具有大致相等的表达。

  在每个细胞系中,性能最强的合成启动子比CMV驱动显著更高的SEAP产率—在CHO-DG44、CHO-S和CHO-K1细胞中分别为3.1倍、1.9倍和1.7倍。在一般情况下,CHO-DG44细胞表现出比CHO-S或CHO-K1细胞显著更少的报告产率,可能由于其降低了通过脂质体转染的“转染能力”。

  尽管如此,本实施例表明启动子构建体的顺序在不同的CHO细胞类型间通常保持,并表明启动子构建体在所测试的3种类型以外的其它CHO细胞类型中也将是有效的,并且还表明,合成启动子在转化型哺乳动物细胞范围中可能是有功能的,并且可以在癌症靶向基因治疗应用中使用。

  实施例5:分析更长期瞬时转染中的第1和2代启动子构建体

  接下来,为了确定合成启动子在产业相关的生产过程中的功能性,在补料分批SEAP生产过程中利用CHO-S宿主细胞以更长期瞬时转染(7天)来评价同一组启动子。

  采用瞬时系统(而不是稳定的),以确保生产的变化性直接关系到启动子活性中的差异,而不是细胞特异性、位点特异性整合或启动子沉默(例如甲基化,缺失)假象。

  在转染前2小时,将来自中间指数期CHO-S培养物的6×106个细胞接种到6mL工作体积的50mLCultiFlask生物反应器(Sartorius,Surrey,UK)中。细胞用根据制造商的说明书制备的DNA:阳离子脂质体复合物转染。通过在第2、4和6天用10%v/vCHOCDEffiicientFeedA(LifeTechnologies)营养补充维持补料分批培养7天。以24小时的间隔测量SEAP表达和细胞生长。

  SEAP表达测定的结果示于图7。可以看到,相比短期瞬时表达结果(即来自实施例4的静态微孔板实验,参见图6),活性的相对顺序大部分保留,这表明,使用本发明的合成启动子构建体可以长期实现强力并可再现的表达水平。

  此外,由启动子2/03驱动的最高的SEAP滴度,是由CMV介导的表达获得的滴度的超过1.65倍。

  IVCD结果进一步表明,当用本发明的启动子构建体转染CHO细胞时,细胞生存力不显著受影响。这一点是重要的,因为它表明启动子构建体具有在宿主细胞中使用而不对正常的细胞功能产生不利影响的潜力。

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

  

《CHO细胞的合成启动子、使用转录因子结合位点模块生产合成启动子的方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)