欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种单模块DNA文库及TALENs识别模块的连接方法独创技术35196字

一种单模块DNA文库及TALENs识别模块的连接方法

2021-02-19 08:40:02

一种单模块DNA文库及TALENs识别模块的连接方法

  技术领域tt

  本发明涉及基因工程领域,尤其涉及一种TALE连接单元库、包含该ttTALE连接单元库中所有TALE连接单元的DNA文库、TALENs识别模块的tt连接方法以及转录激活子样效应因子核酸酶质粒的构建方法。tt

  背景技术tt

  按照人类的意愿对基因组进行定向靶向修饰一直是许多科学家的梦tt想。在内源的基因组上特异地删除或加入我们需要的序列,一方面可以构tt建出各种动物模型用于生物学基础研究和疾病机理研究,另一方面可以生tt产动物反应器用以廉价生产我们需要的又很难从其他途径得到的生物组tt分。人们一直没有找到简单高效的方法对基因组进行基因组靶向修饰。传tt统的基因打靶技术依赖于细胞内自然发生的同源染色体随机交换,其打靶tt效率非常低,通常只有10-6~10-8,这种打靶方法只在小鼠中得到了广泛了tt应用,而在其他模式动物及大型哺乳动物中都因效率太低而得不到广泛应tt用。tt

  2009年两个研究组发现植物病原体Xanthomonas中的一种可以调节tt植物基因表达的转录激活子样效应因子(transcription activator-like tteffector,TALE)表现出DNA结合特异性,而其识别密码具有模块化和tt简单化的特点,为科学家们开发出更简易的新型基因组靶向修饰技术带来tt了新希望。tt

  TALE与Fok1融合后即形成转录激活子样效应因子核酸酶tt(transcription activator-like effector nucleases,TALENs)。TALENs由数tt十个特异性识别DNA的串联“蛋白模块”和两侧的N-末端及C-末端序列组tt成。每个“蛋白模块”包含34个氨基酸,第12和13位残基是靶向识别的tt关键位点,被称作重复可变的di-residues(RVDs)位点。tt

  实践中,TALENs技术大大提高了基因打靶效率,应用范围和可操作tt性,但如何把十几个高度重复的DNA的识别模块组装起来成为了TALENstttttt广泛应用的一个限制因素。研究者们在怎样制作TALENs做出了各种各样tt的努力。有的采用化学合成的方法,有的采用两步分子克隆的方法,也有tt的采用一步分子克隆的方法。但都有各自的缺陷,因为需合成的DNA高tt度重复的序列化学合成非常困难,成本也非常高;两步法因为需两步连接tt所以材料成本、时间成本、测序成本都较高;现在公开的唯一一个可一步tt连接的方法最多只能连接14个识别模块,而自然界中常见的识别模块的tt长度为12-23,在实际应用中很多情况需要大于14个识别模块的TALENs,tt14个片段长度的限制不止影响此种方法应用,而且不利于TALENs特异tt性的提高,并且因其需要酶切,纯化,再连接造成操作繁琐,工艺流程复tt杂,酶切纯化后的DNA保存困难,特别是单链的尾巴容易降解。tt

  以前有研究者用单模块连接TALENs,如连接18个识别模块,一个tt反应连接18个片段难度非常大,世界范围内还没有人能实现;以前也有tt建立在双模块基础上的研究,但其只能连接14个识别模块。tt

  发明内容tt

  本发明提供了一种转录激活子样效应因子(TALE)连接单元库,利tt用该连接单元库可以连接12个以上的识别模块。tt

  技术方案为,TALENs识别模块的连接方法,步骤包括:tt

  (1)根据所需连接的识别模块的顺序,从单元库中选择识别模块所tt对应的连接单元;所需连接的识别模块数量至少为1;tt

  所述的单元库包括4组×k个连接单元;4组连接单元分别识别4种tt碱基,任意两组连接单元的粘性末端碱基序列一一对应相同;tt

  所述的连接单元为识别单碱基识别模块及两端经二类限制性内切酶tt酶切形成的第一粘性末端和第二粘性末端;每组的连接单元包含相同的单tt碱基识别模块;tt

  同一组的k个连接单元分为两部分,第一部分包含n个连接单元,第tt二部分包含m个连接单元;其中n≥2,m=0~n-1;tt

  第一部分所有连接单元两端的粘性末端碱基序列互不相同,对第一部tt分所有连接单元进行顺序编号,第i个连接单元的第二粘性末端与第i+1tt个连接单元的第一粘性末端互补,1≤i≤n-1;tt

  第二部分连接单元中任意两个连接单元至少一个粘性末端碱基序列tttttt不同,且第二部分连接单元中的任意一个连接单元的第一粘性末端与第一tt部分连接单元中第p个连接单元的第二粘性末端互补,第二粘性末端与第tt一部分连接单元中第q个连接单元的第一粘性末端互补,其中p≤n-2,3tt≤q≤n,q-p≥3;tt

  (2)利用DNA连接酶使连接单元依次连接。具体为,用二类限制性tt内切酶和DNA连接酶,将连接单元重组接入TALENs载体中,用消化线tt性DNA的酶进行消化处理,得到转录激活子样效应因子核酸酶质粒。优tt选的,在TALENs载体上含有0个、1个或2个识别模块;并且TALENstt载体中带有DNA切割蛋白基因,以及位于转录激活子样效应因子氨基酸tt序列框架N端和C端的碱基序列。所述的位于转录激活子样效应因子氨tt基酸序列框架N端和C端的碱基序列分别如SEQ ID No.43和44所示。tt

  所述TALEN载体可选用pEF1a-NLS-TALE backbone-Fok1(R)-pA或ttpEF1a-NLS-TALE backbone-Fok1(L)-IRES-PURO-pA,所述DNA切割蛋白tt基因即为Fok1。TALENs载体预先经二类限制性内切酶酶切,酶切产生的tt两个粘性末端分别与第1个碱基识别模块的第一粘性末端以及第n个碱基tt识别模块第二粘性末端互补。tt

  步骤(2)中,所述二类限制性内切酶(type IIs enzyme)可以为Bsa ttⅠ。所述的DNA连接酶可以为T4连接酶。tt

  优选的,在步骤(1)所述的单元库中,连接单元连接在载体上。载tt体为PMD18-T载体、topo载体、puc19载体或puc18。tt

  当连接单元连接在载体上时,步骤(2)中,在同一体系内,采用二tt类限制性内切酶和DNA连接酶将各DNA片段中连接单元重组接入ttTALENs载体中。用消化线性DNA的酶进行消化处理,得到转录激活子tt样效应因子核酸酶质粒。tt

  以25μL计,连接体系包括:载体:40-200ng;识别模块:50-200ng/tt识别模块;二类限制性内切酶:0.5-2μL;DNA连接酶:0.5-2μL;DNAtt连接酶缓冲液:2.5μL;双蒸水:补足至25μL。连接程序优选为:37℃,tt5min;16℃,10min,20个循环;80℃,10min。tt

  具体的,在步骤(1)中,从单元库中选取各识别模块对应的连接单tt元;第一部分连接单元的数量n为11-18个;tt

  单元库中所选择连接的连接单元数量a等于n时,从第一部分各组中tt选取识别相应碱基、序号为1~n的连接单元依次相连;tt

  单元库中所选择连接的连接单元数量a小于n时,从第一部分各组中tt选取识别相应碱基、序号为1~b的连接单元,并从第二部分中选取识别相tt应碱基、并且第一粘性末端能与第一部分b号连接单元第二粘性末端的互tt补、第二粘性末端能与第一部分第(n+2+b-a)连接单元第一粘性末端互tt补的连接单元,再与第一部分的第(n+2+b-a)至第n个连接单元相连接,tta-1≥b≥1。tt

  更优选的,在步骤(1)中,从单元库中选取各识别模块对应的连接tt单元;第一部分连接单元的数量n为18个;tt

  单元库中所选择连接的连接单元数量a小于18时,从第一部分各组tt中选取识别相应碱基、序号为1~b的连接单元,并从第二部分中选取识别tt相应碱基、并且第一粘性末端能与第一部分b号连接单元第二粘性末端的tt互补、第二粘性末端能与第一部分第(20+b-a)连接单元第一粘性末端互tt补的连接单元,再与第一部分的第(20+b-a)至第18个连接单元相连接,tta-1≥b≥1;tt

  单元库中所选择连接的连接单元数量a=18时,从第一部分各组中选tt取识别相应碱基、序号为1~n的连接单元依次相连。tt

  更优选的,在长度小于18时,从第一部分各组中选取识别相应碱基、tt序号为1~(q+a-20)的连接单元,并从第二部分中选取识别相应碱基、tt并且第一粘性末端能与(q+a-20)号连接单元第二粘性末端的连接单元,tt再与第一部分的第q~第18个连接单元相连接。tt

  优选的,所述单元库第一部分连接单元数量为18个,编号为1~18tt的连接单元第一粘性末端及第二粘性末端碱基序列分别如SEQ ID No.5~tt40的第9~12个碱基所示。tt

  步骤(2)所述的消化线性质粒的质粒酶可以为Plasmid-Safe核酸酶。tt因为连接时会有连接不完全现象,只连接上部分片段,这种连接不完全的tt线性DNA会通过重组的方式降低连接的效率,因此,在转化之前用可以tt消化线性DNA的酶Plasmid-SafeTMATP-Dependent DNase(Epicentre,货tttttt号:E3105K)进行消化处理,提高连接效率。tt

  该方法中,各识别模块之间能够顺序连接;同时,识别模块之间、识tt别模块与载体之间一旦连接上,就无法被二类限制性内切酶(type IIs ttenzyme)再切开,所以把几个片断和载体放在同一体系里,用二类限制性tt内切酶(type IIs enzyme)和DNA连接酶边切边连,一次即可把最多19tt个DNA片段和一个载体连接成环;即一步把TALENs连接成功,第一次tt实现了19个片段的一次连接。tt

  一种转录激活子样效应因子连接单元库,包括4组×k个连接单元;tt4组连接单元分别识别4种碱基,任意两组连接单元的粘性末端碱基序列tt一一对应相同;所述的连接单元为识别单碱基识别模块及两端的第一粘性tt末端和第二粘性末端;同一组的连接单元包含相同的单碱基识别模块;所tt述的单碱基识别模块是指该Tale连接单元编码的氨基酸能够识别碱基A、ttT、C、G。tt

  同一组的k个连接单元分为两部分,第一部分包含n个连接单元,第tt二部分包含m个连接单元;其中n≥2,m=0~n-1;tt

  第一部分所有连接单元两端的粘性末端碱基序列互不相同,对第一部tt分所有连接单元进行顺序编号,第i个连接单元的第二粘性末端与第i+1tt个连接单元的第一粘性末端互补,1≤i≤n-1;优选的,n=11~18。tt

  第二部分连接单元中任意两个连接单元至少一个粘性末端碱基序列tt不同,且第二部分连接单元中的任意一个连接单元的第一粘性末端与第一tt部分连接单元中第p个连接单元的第二粘性末端互补,第二粘性末端与第tt一部分连接单元中第q个连接单元的第一粘性末端互补,其中p≤n-3,3tt≤q≤n,q-p≥3。tt

  连接单元中,两端的第一粘性末端和第二粘性末端通过二类限制性内tt切酶酶切形成。优选的,二类限制性内切酶为BsaⅠ、BsmB1、BsmA1或ttBbs1,最优为BsaⅠ。tt

  这种转录激活子样效应因子连接单元库,优选的情况,18≥n≥11,ttm=n-11,n≥q≥10,n-1≥p≥1,m+2≥q-p≥3。tt

  上述的连接单元的粘性末端有4个碱基,沿5'-3'方向,正义链第一粘tt性末端的第2~4个碱基编码亮氨酸,第1个碱基为甘氨酸密码子的最后一tt个碱基,正义链的最后两个碱基为甘氨酸密码子的前两个碱基;沿5'-3'tttttt方向,反义链的第二粘性末端的第1~3个碱基的互补序列编码亮氨酸,tt第4个碱基的互补序列为甘氨酸密码子的最后一个碱基。tt

  每个连接单元的粘性末端有4个碱基,沿5'-3'方向,正义链的第一粘tt性末端的第2~4个碱基编码亮氨酸,正义链的第1个碱基为甘氨酸密码子tt的最后一个碱基;正义链的最后两个碱基为甘氨酸密码子的前两个碱基。tt沿5'-3'方向,反义链的第二粘性末端的第1~3个碱基的互补序列编码亮tt氨酸,第4个碱基的互补序列为甘氨酸密码子的最后一个碱基;反义链的tt前两个碱基的互补序列为甘氨酸密码子的前两个碱基。当相邻的连接单元tt通过互补的粘性末端连接到一起时,连接单元之间的正义链编码的氨基酸tt依次为甘氨酸和亮氨酸。tt

  优选的,上述转录激活子样效应因子连接单元库的第一部分连接单元tt数量为18个,编号为1~18的连接单元第一粘性末端及第二粘性末端碱tt基序列分别如SEQ ID No.5~40的第9~12个碱基所示。即n=18,m=7,tt18≥q≥10,15≥p≥1,9≥q-p≥3。tt

  上述转录激活子样效应因子连接单元库的构建方法,是在单碱基识别tt模块两端加上酶切位点,步骤包括:tt

  第一部分编号为1~18的连接单元构建:以含有4个单碱基识别模块tt的载体为模板,分别以18对引物序列F1/R1~F18/F18为引物对,进行PCRtt扩增;tt

  第二部分编号为19~25的连接单元构建:以含有4个单碱基识别模tt块的载体为模板进行PCR扩增,所使用的引物对分别为:Fq-2/Rq-b、Fq-3/Rttq-1、Fq-4/Rq-1、Fq-5/Rq-1、Fq-6/Rq-1、Fq-7/Rq-1和Fq-8/Rq-1;18≥q≥10;tt

  引物F1/R1~F18/F18的核苷酸序列如SEQ ID No.5~40所示。tt

  一种单模块DNA文库,包括与上述的转录激活子样效应因子连接单tt元库的连接单元数量相同的DNA片段,包含了前述的转录激活子样效应tt因子连接单元库的所有连接单元;每个DNA片段包含一个不同的连接单tt元(即碱基序列互异);每个连接单元两末端与DNA片段的其余部分连接tt处有二类限制性内切酶酶切位点,也就是说,利用二类限制性内切酶(type ttIIs enzyme)对DNA片段进行酶切,就可以得到所述的Tale连接单元。tt所述DNA片段为重组质粒或PCR扩增产物。重组质粒的原始载体为ttPMD18-T载体、topo载体、puc19载体或puc18。tt

  优选的,其中二类限制性内切酶(type IIs enzyme),可以是BsaⅠ、ttBsmB1、BsmA1、Bbs1等,优选为BsaⅠ。tt

  n的值决定了TALENs的大小,TALENs一般需要12个以上的识别tt模块,也就是说n≥12,最多可以是23个识别模块,但18个识别模块即tt可满足一般要求,即n=18。以n=18为例,如果连接单元库只有第一部分tt的18个连接单元,那么利用这个连接单元库只能实现19个识别模块的连tt接(TALEN载体上已有半个识别模块),而不能实现18、17、…12个识tt别模块的连接,因为第一部分连接单元中每个连接单元两端的粘性末端各tt不相同,只能从1至18顺序连接,且TALENs载体的两个粘性末端只能tt分别与第1个连接单元的第一粘性末端和第18个连接单元的第二粘性末tt端互补。因此,为了能够实现小于19个识别模块的连接,本发明还设计tt了第二部分连接单元。tt

  第二部分连接单元如跨桥一样可以减少TALENs中识别模块的数量,tt从第p个识别模块,直接跨越到第q个识别模块,而省去了中间的识别模tt块,省去的数量为q-p-2,比如为了减少1、2、…、6个识别模块,可以tt设置q-p=、3、4、…、9。为保证获得12个识别模块以上的TALENs,q-ptt≤7。从上述分析也可以看出,第二部分连接单元的起始连接位置是不影tt响最终TALEN连接的,p可以是1~n-2的任意位置。tt

  由于连接单元本身无法进行很好的保存和扩增,因此将连接单元插入tt相应的原始载体当中,构成环状结构,以便于保存和扩增。tt

  与现有技术相比,本发明的有益效果为:tt

  (1)本发明以四个单碱基识别模块为基础,通过设计合适的引物,tt可以构建得到含有100个连接单元(含有能识别单碱基的识别模块、二类tt限制性内切酶酶切位点)的DNA文库;通过该DNA文库,可以把识别tt模块的酶切和连接放在一个反应中进行,避免了识别模块酶切后的纯化、tt再连接步骤,提高了生产效率,改进了生产工艺,速度快,效率高,操作tt简单,可以实现一步将12-19个识别模块快速连接起来,得到转录激活子tt样效应因子核酸酶(TALENs)质粒;tt

  (2)本发明方法使用的识别单元是质粒或质粒的PCR产物,避免了tttttt保存酶切产物中遇到的末端单链尾巴破坏和降解的问题,且操作步骤更简tt单,更节约成本。tt

  附图说明tt

  图1为本发明包含100个识别模块的DNA文库示意图;tt

  图2为本发明实施例1中,TALE连接单元库中每组25个连接单元的tt示意图;tt

  图3为本发明TALE连接单元库中单个连接单元的示意图;tt

  图4为TALENs载体pEF1a-NLS-TALE backbone-Fok1(R)-pA示意图;tt

  图5为TALENs载体pEF1a-NLS-TALE ttbackbone-Fok1(L)-IRES-PURO-pA示意图;tt

  图6为实施例2中,19个识别模块连接时的连接步骤示意图;tt

  图7为实施例2中,不同数量的识别碱基的相应模模块的选择块示意tt图;tt

  图8为实施例2中的电泳图;圈中的为酶切正确的克隆;tt

  图9为实施例3中,TALE连接单元库中每组25个连接单元的结构示tt意图;tt

  图10为实施例3中,不同数量的识别碱基的相应模模块的选择块示tt意图。tt

  具体实施方式tt

  以下实施例中所使用的技术,包括PCR扩增与检测、细胞转染等分tt子生物学技术,以及细胞培养、检测技术等,除非特别说明,均为本领域tt内的技术人员已知的常规技术;所使用的仪器设备、试剂和细胞系等,除tt非是本说明书特别注明,均为一般本领域的研究和技术人员可以通过公共tt途径获得的。tt

  实施例1TALENs识别模块之间的连接及重组载体的构建tt

  1、4个识别模块(modular)tt

  (1)合成分别识别4个单碱基A、T、C、G的识别模块NI、NG、ttHD、NN序列见表1,分别如SEQ ID No.1~4所示。tt

  表1四个单碱基识别模块的序列tt

  2、将识别模块加上酶切位点和接头制作100个质粒库tt

  (1)PCR扩增添加酶切识别序列和连接接头tt

  以F1/R1;F2/R2;F3/R3;F4/R4;F5/R5;F6/R6;F7/R7;F8/R8;ttF9/R9;F10/R10;F11/R11;F12/R12;F13/R13;F14/R14;F15/R15;F16/R16;ttF17/R17;F18/R18为引物,以含有4个单碱基识别模块的T载体为模板tt做PCR,共4×18=72个(第一部分连接单元,以n=18为例);tt

  以F16/R17;F15/R17;F14/R17;F13/R17;F12/R17;F11/R17;F10/R17tt为引物,以含有4个模块的T载体为模板做PCR,共4×7=28个(第二tt部分连接单元,以m=7,q=17、p=9-15为例);tt

  共72+28=100个(k=25)。tt

  PCR体系:Plasmid:1μL;Primers:0.1μL+0.1μL;Buffer:1.5μL;ttdNTP:0.8μL;Mgso4:0.35μL;水:11.48μL;DNA聚合酶:1单位。tt

  PCR程序:95℃,2min;95℃,15s,55.8℃,30s,68℃,22s,36tt个循环;68℃,1min。tt

  F1、R1;F2、R2;F3、R3;F4、R4;F5、R5;F6、R6;F7、R7;ttF8、R8;F9、R9;F10、R10;F11、R11;F12、R12;F13、R13;F14、ttR14;F15、R15;F16、R16;F17、R17;F18、R18引物的序列见表2,tt分别如SEQ ID NO.5~40所示。18对引物都带有BsaⅠ酶切识别序列ttttttGGTCTCN‘NNNN。这个酶属于type IIs enzymes,同一个酶切识别序列可tt以产生多个粘性识别末端,理论上可以产生44个粘性识别末端,再加上每tt个模块的结尾和开头Gly密码子4种,Leu密码子6种的限制,利用一个tttype IIs enzyme可以产生24种接头。选取其中的19种设计了引物,除了ttF1与R18外,Fn只可与Rn-1的粘性末端相连,而不能与其他引物上的粘tt性末端相连。tt

  表218对引物的碱基序列tt

  

  

  注:小写字母为BsaⅠ酶切识别序列。tt

  表318个连接单元的第一粘性末端和第二粘性末端的碱基序列tt

  

  

  (2)将100个PCR产物进行胶回收纯化,连接入PMD18-T体系tt

  将4个识别模块片段连入PMD18-T载体(购自Takara),连接方法tt为:①取PCR产物2.7μL;②加入3μL solution1和0.3μL PMD18-T载tt体;③16℃,2h;④转化DH5a感受态细胞,涂布氨苄霉素平板;⑤挑取tt克隆、小量提取质粒、PCR鉴定、测序,最后得到连接到载体PMD18-Ttt中的带有BsaⅠ酶切位点和不同接头的100个识别模块组成的质粒库,如tt图1所示,分别用A1~A25、T1~T25、C1~C25和G1~G25表示。这100tttttt个识别模块分别对应了本发明Tale连接单元库的100个连接单元,每组tt25个连接单元的结构如图2所示。其中第一部分为序号1-18的18个连接tt单元(n=18),第i个连接单元的第二粘性末端与第i+1个连接单元的第tt一粘性末端互补。其中第二部分为序号19-25的7个连接单元(m=7),tt每个连接单元的第二粘性末端与第一部分的第18个连接单元第一粘性末tt端互补(q=18),且每个连接单元的第一粘性末端分别与第一部分第9~tt15(p=9~15)个连接单元的第二粘性末端互补。tt

  其中,单个连接单元的结构如图3所示,每个连接单元的粘性末端有tt4个碱基,沿5'-3'方向,正义链的前端即第一粘性末端的第2~4个碱基编tt码亮氨酸,正义链第一粘性末端的第1个碱基为甘氨酸密码子的最后一个tt碱基,正义链的最后两个碱基为甘氨酸密码子的前两个碱基。反义链的第tt二粘性末端的第1~3个碱基的互补序列编码亮氨酸。tt

  PCR库的获得:以上述质粒库中的100个识别模块为模板,利用引物ttassem-F、assem-R进行PCR,得到PCR库。引物所结合的位置分别在识tt别模块的上下游400bp左右处,最终获得的PCR库中,每个含识别模块tt的PCR片段大小约为950bp。tt

  表3引物assem-F和assem-R的碱基序列tt

  

  PCR扩增体系(50μL)为:DNA模板:0.5μL(约50ng);引物:tt每个0.3μL(50μM);pfx酶(Invitrogen):0.25μL;10×buffer:5μL;ttdNTP:2.5μL(2.5μM);MgSO4:1μL;ddH2O:40.15μL。tt

  PCR程序:95℃,2min;95℃,15s,68℃,30s,68℃,50s,36tt个循环;68℃,5min。tt

  PCR产物纯化:将所得的PCR产物进行琼脂糖凝胶电泳,确定浓度。tt使用天根公司的通用型DNA纯化回收试剂盒(离心柱型)纯化PCR片段,tt纯化后在进行琼脂糖凝胶电泳标定各个产物的浓度。tt

  (3)TALEN载体的酶切tt

  两个TALENs载体(pEF1a-NLS-TALE backbone-Fok1(R)-pA;ttpEF1a-NLS-TALE backbone-Fok1(L)-IRES-PURO-pA)的结构示意图分别tt如图4和图5所示。TALENs载体中转录激活子样效应因子氨基酸序列框tt架N端和C端序列分别下所示;在连接前需要预先用BsaⅠ酶切两ttTALENs载体,胶回收后,电泳标定浓度。tt

  N端序列为:tt

  ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACAT ttCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGG ttAAGGTGGGCATCCACGGggtaccCATGgTAGATTTGAGAACTTTGGGAT ttATTCACAGCAGCAGCAGGAAAAGATCAAGCCCAAAGTGAGGTCGA ttCAGTCGCGCAGCATCACGAAGCGCTGGTGGGTCATGGGTTTACACAT ttGCCCACATCGTAGCCTTGTCGCAGCACCCTGCAGCCCTTGGCACGGT ttCGCCGTCAAGTACCAGGACATGATTGCGGCGTTGCCGGAAGCCACA ttCATGAGGCGATCGTCGGTGTGGGGAAACAGTGGAGCGGAGCCCGA ttGCGCTTGAGGCCCTGTTGACGGTCGCGGGAGAGCTGAGAGGGCCTC ttCCCTTCAGCTGGACACGGGCCAGTTGCTGAAGATCGCGAAGCGGGG ttAGGAGTCACGGCGGTCGAGGCGGTGCACGCGTGGCGCAATGCGCTC ttACGGGAGCACCCCTCAACCTGACCgagaccCtt

  C端序列为:tt

  ggtctcAACTCACGCCTGAGCAGGTAGTGGCTATTGCATCCAATgga ttGGGGGCAGACCCGCACTGGAGTCAATCGTGGCCCAGCTTTCGAGGC ttCGGACCCCGCGCTGGCCGCACTCACTAATGATCATCTTGTAGCGCTG ttGCCTGCCTCGGCGGACGACCCGCCTTGGATGCGGTGAAGAAGGGGC ttTCCCGCACGCGCCTGCATTGATTAAGCGGACCAACAGAAGGATTCCC ttGAGAGGACATCACATCGAGTGGCAtt

  (4)TALENs的连接tt

  上文已说明过除了F1与R18外(F1粘性末端与TALENs载体N端tt序列连接,R18粘性末端与TALENs载体C端序列连接),Fn可与Rn-1的tt粘性末端相连,而不能与其他引物上的粘性末端相连。另外连接单元之间,tt连接单元与载体之间一旦连接上就无法被BsaⅠ再切开,所以把几个片段tttttt和载体放在同一体系里,用BsaⅠ和T4连接酶边切边连,即可一步把ttTALENs连接成功。tt

  下面以19个连接单元的连接为例,说明连接策略。因最后一个可以tt识别碱基T(或A或C或G)的半个模块已在载体上,所以只要连18个tt模块即可。首先选择与靶位点相对应的18个模块再加上TALENs载体,tt用BsaⅠ和T4连接酶边切边连。tt

  连接体系为:tt

  Vector:150ng,tt

  Modulars:50ng/modular,tt

  BsaⅠ(NEB):1μL,tt

  T4Ligase(fermentas):1μL,tt

  T4Buffer(NEB):2.5μL,tt

  H2O:补足25μL;tt

  连接程序为:37℃,5min;16℃,10min,20个循环;80℃,10min。tt

  在进行到10个循环时,补加BsaⅠ(NEB):1μL,T4Ligase(fermentas):tt1μL。tt

  连接步骤见图6。因为连接时会有连接不完全,只连接上了1-17个片tt段,这种连接不完全的线性DNA会通过重组的方式降低连接的效率,所tt以在转化之前用可以消化线性化DNA的酶Plasmid-SafeTMATP-Dependent ttDNase(Epicentre,货号:E3105K)消化线性质粒,体系为:tt

  在25μL酶连体系的基础上加1μL plasmid-safe nuclease和0.5μLttATP,于37℃消化1h。tt

  取10μL转化GBE180感受态,挑克隆,小抽,BamH1/Pst1酶切鉴定,tt酶切出的较小的片段大小应为连入片段大小加上550bp。把酶切正确的质tt粒送测序,测序正确即可得到正确的TALENs质粒。测序引物的序列如表tt4所示。tt

  表4测序引物的序列tt

  

  Day1:tt

  连接:5h;tt

  plasmid-safe nuclease消化:1h;tt

  转化:1h;tt

  Day2:tt

  挑克隆:30min;tt

  摇菌:13h;tt

  Day3:tt

  小抽,酶切鉴定送测序;tt

  Day4:tt

  比对序列。tt

  得到确认正确的质粒只需要4天,并且同时,本发明方法使用的识别tt单元是质粒或质粒的PCR产物,避免了保存酶切产物中遇到的末端单链tt尾巴破坏和降解的问题,且操作步骤更简单,更节约成本。tt

  以上获得的是采用第一部分连接单元的72个单碱基识别模块连接而tt成的18个连接单元的TALEN质粒,若想获得12~17个连接单元的ttTALENs质粒,即18>a≥1,q=18时,则需利用第二部分连接单元的28tt个单碱基识别模块,具体的连接方式见图7。tt

  例如,当连接长度a=16时,从第一部分各组中选取识别相应碱基、tt序号为1~14的连接单元,并从第二部分中选取识别相应碱基、并且第一tt粘性末端能与14号连接单元第二粘性末端的连接单元(序号20),再与第tt一部分的第18个连接单元相连接。tt

  图7中,编号为19、20、21、22、23、24、25的连接单元即属本发tt明第二部分连接单元。方便起见,本具体实施方式中,第二部分连接单元tt的单碱基识别模块均位于TALE序列的倒数第二个连接单元(n-1)位置;tt实际操作中,可位于TALE序列的1~n-1中的任一位置。tt

  实施例2tt

  连接可识别如下DNA序列的TALEN(SEQ ID NO:47和48):tt

  片段一:CGCGCGCGCGCGCGCGCGT;tt

  片段二:CCCACTCCCCATCCAGT。tt

  (1)从PCR库中选择所需的识别模块tt

  针对片段一(CGCGCGCGCGCGCGCGCGT),需连接18个连接单元tt(载体上原已含有第19位T的识别模块);选择图1中的单碱基识别模块ttC1、G2、C3、G4、C5、G6、C7、G8、C9、G10、C11、G12、C13、G14、ttC15、G16、C17、G18;此连接载体为pEF1a-NLS-TALE ttbackbone-Fok1(R)-pA;tt

  针对片段二(CCCACTCCCCATCCAGT),需连接16个连接单元(载tt体上原已含有第17位T的识别模块);选择图1中的单碱基识别模块C1、ttC2、C3、A4、C5、T6、C7、C8、C9、C10、A11、T12、C13、C14、A20、ttG18;A20的第一粘性末端与第一部分第14个识别模块的第二粘性末端互tt补,第二粘性末端与第一部分第18个粘性末端互补,因此可从第14个识tt别模块跨越到第18个识别模块,省去了两个识别模块。此连接载体为ttpEF1a-NLS-TALE backbone-Fok1(L)-IRES-PURO-pA;tt

  (2)按照以下连接体系:tt

  Vector:150ng,tt

  Modulars:50ng/modular,tt

  BsaⅠ(NEB):1μL,tt

  T4Ligase(fermentas):1μL,tt

  T4Buffer(NEB):2.5μL,tt

  H2O:补足25μL;tt

  连接程序为:37℃,5min;16℃,10min,20个循环;80℃,10min;tt

  在进行到10个循环时,补加BsaⅠ(NEB):1μL,T4Ligase(fermentas):tt1μL;tt

  (3)plasmid-safe nuclease消化:1h;tt

  (4)转化GBE180感受态,挑克隆,小抽,BamH1/Pst1酶切鉴定,tt电泳后凝胶图见图8。tt

  图8中,针对DNA片段一的TALENs片段的酶切结果中,酶切正确tt的条带为3.3kb和2.3kb,7个克隆中有3个的酶切结果正确,成功率为tt43%;针对DNA片段二的TALENs片段的酶切结果中,酶切正确的条带tt为4.5kb和1.8kb,6个克隆中有3个的酶切结果正确,成功率为50%。tt

  将酶切正确的6个克隆送测序,结果显示酶切正确的克隆,测序全部tttttt正确。说明此方法进行连接效率高,简单,高效。tt

  实施例3tt

  用实施例1的步骤和方法构建识别模块和重组载体。tt

  1、四个单碱基识别模块的合成同实施例1。tt

  2、将识别模块加上酶切位点和接头制作100个质粒库。tt

  (1)PCR扩增添加酶切识别序列和连接接头tt

  以n=18为例,针对第一部分连接单元构建方法同实施例1。tt

  第二部分连接单元中,19-25号连接单元的所用的引物对为:F8/R15、ttF9/R15、F10/R15、F11/R15、F12/R15、F13/R15、F14/R15。即m=7,q=14,ttp=7~13。tt

  酶切位点、粘性末端序列及引物序列同实施例1。其余同实施例1。tt

  (2)将100个PCR产物进行胶回收纯化,连接入PMD18-T体系tt

  同实施例1。最后得到连接到载体PMD18-T中的带有BsaⅠ酶切位点tt和不同接头的100个识别模块组成的质粒库,如图1所示,分别用A1~A25、ttT1~T25、C1~C25和G1~G25表示。每组25个连接单元的结构如图9所tt示。其中第一部分为序号1-18的18个连接单元(n=18),第i个连接单tt元的第二粘性末端与第i+1个连接单元的第一粘性末端互补。其中第二部tt分为序号19-25的7个连接单元(m=7),每个连接单元的第二粘性末端tt与第一部分的第16个连接单元第一粘性末端互补(q=16),且每个连接tt单元的第一粘性末端分别与第一部分第7~13(p=7~13)个连接单元的tt第二粘性末端互补。tt

  单个连接单元的结构和粘性末端构成同实施例1。tt

  用与实施例1相同的方法获得PCR库,利用引物assem-F、assem-Rtt进行PCR,得到PCR库。引物所结合的位置分别在识别模块的上下游400ttbp左右处,最终获得的PCR库中,每个含识别模块的PCR片段大小约为tt950bp。tt

  (3)TALEN载体的酶切,同实施例1。tt

  需要连接11-17个模块时,连接策略如图10所示。tt

  例如,当连接长度a=16时,从第一部分各组中选取识别相应碱基、tt序号为1~12的连接单元,并从第二部分中选取识别相应碱基、并且第一tttttt粘性末端能与14号连接单元第二粘性末端的连接单元(序号20),再与第tt一部分的第16至第18个连接单元相连接。tt

  用上述文库连接可识别以下DNA序列的TALEN。tt

  片段三:CGCGCGCGCGCGT,13个碱基,需连接12个连接单元(载tt体上原已含有第13位T的识别模块)tt

  从文库中选择单碱基识别模块C1、G2、C3、G4、C5、G6、C7、G8、ttC24、G16、C17、G18;C24的第一粘性末端与G8的第二粘性末端互补,tt第二粘性末端与G16的第一粘性末端互补,因此可以从第8个识别模块跨tt越到第16个模块,省去了6个识别模块。tt

  连接载体为pEF1a-NLS-TALE backbone-Fok1(L)-IRES-PURO-pA。tt

  片段四:CCCACTCCCCATCCAGT,需连接16个连接单元(载体上tt原已含有第17位T的识别模块);选择图1中的单碱基识别模块C1、C2、ttC3、A4、C5、T6、C7、C8、C9、C10、A11、T12、C20、C16、A17、ttG18。C20的第一粘性末端与T12的第二粘性末端互补,第二粘性末端与ttG16的第一粘性末端互补,因此可以从第12个识别模块跨越到第16个模tt块,省去了2个识别模块。tt

  用与实施例2相同的方法连接TALENs片段,酶切鉴定,酶切正确率tt40%~50%。酶切正确的克隆送测序,结果显示酶切正确的克隆测序结果全tt部正确。tt

《一种单模块DNA文库及TALENs识别模块的连接方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)