欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种DNA文库及构建转录激活子样效应因子核酸酶质粒的方法独创技术20289字

一种DNA文库及构建转录激活子样效应因子核酸酶质粒的方法

2023-03-13 15:17:28

一种DNA文库及构建转录激活子样效应因子核酸酶质粒的方法

  技术领域t

  本发明涉及基因工程领域,尤其涉及一种Tale连接单元库、包含该Talett连接单元库中所有Tale连接单元的DNA文库以及构建转录激活子样效应tt因子核酸酶质粒的方法。tt

  背景技术t

  按照人类的意愿对基因组进行定向靶向修饰一直是许多科学家的梦tt想。在内源的基因组上特异地删除或加入我们需要的序列,一方面可以构tt建出各种动物模型用于生物学基础研究和疾病机理研究,另一方面可以生tt产动物反应器用以廉价生产我们需要的又很难从其他途径得到的生物组tt分。人们一直没有找到简单高效的方法对基因组进行基因组靶向修饰。传tt统的基因打靶技术依赖于细胞内自然发生的同源染色体随机交换,其打靶tt效率非常低,通常只有10-6-10-8,这种打靶方法只在小鼠中得到了广泛了tt应用,而在其他模式动物及大型哺乳动物中都因效率太低而得不到广泛应tt用。tt

  2009年两个研究组发现植物病原体Xanthomonas中的一种可以调节tt植物基因表达的转录激活子样效应因子(transcription activator-like tteffector,TALE)表现出DNA结合特异性,而其识别密码具有模块化和tt简单化的特点,为科学家们开发出更简易的新型基因组靶向修饰技术带来tt了新希望。tt

  TALE与Fok1融合后即形成转录激活子样效应因子核酸酶tt(transcription activator-like effector nucleases,TALEN)。TALEs由数十tt个特异性识别DNA的串联“蛋白模块”和两侧的N-末端及C-末端序列组tt成。每个“蛋白模块”包含34个氨基酸,第12和13位残基是靶向识别的tt关键位点,被称作重复可变的di-residues(RVDs)位点。tt

  实践中,TALEN技术大大提高了基因打靶效率,应用范围和可操作tt性,但如何把十几个高度重复的DNA的识别模块组装起来成为了TALENtt广泛应用的一个限制因素。研究者们在怎样制作TALEN做出了各种各样tt的努力。有的采用化学合成的方法,有的采用两步分子克隆的方法,也有tt的采用一步分子克隆的方法。但都有各自的缺陷,因为需合成的DNA高tttttt度重复的序列化学合成非常困难,成本也非常高;两步法因为需两步连接tt所以材料成本、时间成本、测序成本都较高;现在公开的唯一一个可一步tt连接的方法最多只能连接14个识别模块,而自然界中常见的识别模块的tt长度为12-23,在实际应用中很多情况需要大于14个识别模块的TALEN,tt14个片段长度的限制不止影响此种方法应用,而且不利于TALEN特异性tt的提高,并且因其需要酶切,纯化,再连接造成操作繁琐,工艺流程复杂,tt酶切纯化后的DNA保存困难,特别是单链的尾巴容易降解。tt

  以前有研究者用单模块连接TALEN,如连接18个识别模块,一个反tt应连接18个片段难度非常大,世界范围内还没有人能实现;以前也有建tt立在双模块基础上的研究,但其只能连接14个识别模块。tt

  发明内容t

  本发明提供了一种转录激活子样效应因子(Tale)连接单元库,利用tt该连接单元库可以连接14个以上的识别模块。tt

  一种转录激活子样效应因子连接单元库,包括16组×n个双碱基识别tt模块和4组×m个单碱基识别模块,每个双碱基识别模块或单碱基识别模tt块两末端均有经二类限制性内切酶酶切形成第一粘性末端和第二粘性末tt端,n表示每组双碱基识别模块的数量,m表示每组单碱基识别模块的数tt量;m≤n;tt

  在同一组双碱基识别模块中,第i个双碱基识别模块的第二粘性末端tt与第i+1个双碱基识别模块的第一粘性末端互补;两组双碱基识别模块的tt粘性末端碱基序列一一对应相同,1≤i≤n-1;tt

  在同一组单碱基识别模块中,第j个单碱基识别模块的第二粘性末端tt与第j+1个单碱基识别模块的第一粘性末端互补;一组单碱基识别模块的tt全部单碱基识别模块的粘性末端碱基序列与一组双碱基识别模块的部分tt或全部双碱基识别模块的粘性末端碱基序列一一对应相同,两组单碱基识tt别模块的粘性末端碱基序列一一对应相同,1≤j≤m-1。tt

  本发明相当于对连接单元进行编号,双碱基识别模块为1、...、i、...、ttn,单碱基识别模块为1、...、j、...、m。tt

  其中二类限制性内切酶(type IIs enzyme),可以是Bsa I、BsmB1、ttBsmA1、Bbs1等,优选为Bsa I。tt

  单个连接单元的结构如图5所示,粘性末端有4个碱基,沿5’-3’方向,tt正义链的第2~4个碱基编码亮氨酸,正义链的第1个碱基为甘氨酸密码子tt的最后一个碱基,正义链的最后两个碱基为甘氨酸密码子的前两个碱基,tttttt反义链的第1~3个碱基的互补序列编码亮氨酸。tt

  当n大于等于7时,可以连接14个以上的识别模块,而当n等于9,ttm等于7时,最多可以连接19个识别模块。tt

  本发明所述的单碱基识别模块是指该Tale连接单元编码的氨基酸能tt够识别碱基A、T、C、G。所述的双碱基识别模块是指Tale连接单元编码tt的氨基酸能够识别AA、AT、AC、AG、TT、TA、TC、TG、CC、CA、ttCT、CG、GG、GA、GT、GC。同一组的双碱基识别模块或单碱基识别模tt块识别同一对碱基或同一个碱基。tt

  由于连接单元本身无法进行很好的保存和扩增,因此将连接单元插入tt相应的原始载体当中,构成环状结构,以便于保存和扩增。tt

  本发明还提供了一种DNA文库,包括数量与权利要求1~6任一所述tt的转录激活子样效应因子连接单元库的连接单元数量相同的DNA片段,tt每个DNA片段包含一个碱基序列互异的连接单元,连接单元两末端与ttDNA片段的其余部分连接处有二类限制性内切酶酶切位点。也就是说,tt利用二类限制性内切酶(type IIs enzyme)对DNA片段进行酶切,就可以tt得到所述的Tale连接单元。tt

  所述的DNA片段可以是重组质粒,也可以是PCR扩增产物,当选择tt为重组质粒时,原始载体可以是PMD18-T载体、topo、puc19、或puc18。tt

  本发明又提供了一种构建转录激活子样效应因子核酸酶质粒的方法,tt包括:tt

  (1)根据目的基因的靶序列确定识别模块,从所述的DNA文库中选tt取各识别模块对应的DNA片段;tt

  (2)在同一体系内,采用二类限制性内切酶和DNA连接酶将各DNAtt片段中连接单元连接入带有DNA切割蛋白以及转录激活子样效应因子氨tt基酸序列框架N端和C端的载体中;tt

  (3)用消化线性DNA的酶进行消化处理,得到转录激活子样效应因tt子核酸酶质粒。tt

  该方法中,各识别模块之间能够顺序连接;同时,识别模块之间、识tt别模块与载体之间一旦连接上,就无法被二类限制性内切酶(type IIs ttenzyme)再切开,所以把几个片断和载体放在同一体系里,用二类限制性tt内切酶(type IIs enzyme)和DNA连接酶边切边连,即可一步把TALENtt连接成功。tt

  步骤(2)中,所述二类限制性内切酶(type IIs enzyme)可以为Bsa I。tt

  所述的DNA连接酶可以为T4连接酶。tt

  以20μL连接体系计为:载体:40-200ng;识别模块:20-200ng/识别tt模块;二类限制性内切酶:0.5-2μL;DNA连接酶:0.5-2ul μL;DNA连tt接酶缓冲液:2μL;双蒸水:补足至20μL。tt

  连接程序优选为:37℃5min;16℃10min,15个循环;80℃,10min。tt

  所述的带有DNA切割蛋白以及转录激活子样效应因子氨基酸序列框tt架N端和C端的载体(TALEN载体)的碱基序列可以如SEQ ID NO.41tt或42所示。tt

  TALEN载体预先经二类限制性内切酶酶切,酶切产生的两个粘性末tt端分别与第1个双碱基识别模块或单碱基识别模块的第一粘性末端以及第tti个双碱基识别模块或第j个单碱基识别模块的第二粘性末端互补。tt

  步骤(3)中,所述的消化线性质粒的质粒酶可以为Plasmid-Safe核tt酸酶。因为连接时会有连接不完全现象,只连接上部分片段,这种连接不tt完全的线性DNA会通过重组的方式降低连接的效率,因此,在转化之前tt用可以消化线性DNA的酶Plasmid-SafeTM ATP-Dependent DNasett(Epicentre,货号:E3105K)进行消化处理,可以消化线性DNA,提高tt连接效率。tt

  本发明以20个识别模块为基础,通过设计合适的引物,可以构建得tt到含有172个连接单元(含有能识别一个或两个碱基的识别模块、二类限tt制性内切酶位点)的DNA文库;通过该DNA文库,可以把识别模块的tt酶切和连接放在一个反应中进行,避免了识别模块酶切后的纯化、再连接tt步骤,提高了生产效率,改进了生产工艺,可以实现一步将12-19个识别tt模块快速连接起来,得到连接转录激活子样效应因子核酸酶(TALEN)质tt粒。tt

  本发明方法使用的识别单元是质粒或质粒的PCR产物,避免了保存tt酶切产物中遇到的末端单链尾巴破坏和降解的问题,且操作步骤更简单,tt更节约成本。tt

  附图说明t

  图1为包含172个识别单元的DNA文库示意图;tt

  图2为最终载体pEF1a-NLS-TALE backbone-Fok1(R)-pA示意图;tt

  图3为最终载体pEF1a-NLS-TALE backbone-Fok1(L)-IRES-PURO-pAtt示意图;tt

  图4为19个识别模块连接时的连接步骤示意图;tt

  图5为本发明连接单元的结构示意图。tt

  图6为不同数量的识别碱基的相应单双模的选择块示意图;tt

  图7为实施例2中的电泳图;其中,中间为1kb的DNA Marker,markertt左面为连接二的酶切图,右面为连接一的酶切图;tt

  具体实施方式t

  以下实施例中所使用的技术,包括PCR扩增与检测、细胞转染等分tt子生物学技术,以及细胞培养、检测技术等,除非特别说明,均为本领域tt内的技术人员已知的常规技术;所使用的仪器设备、试剂和细胞系等,除tt非是本说明书特别注明,均为一般本领域的研究和技术人员可以通过公共tt途径获得的。tt

  实施例1TALENs识别模块之间的连接及重组载体的构建tt

  1、20个识别模块(modular)的获得tt

  (1)合成分别识别4个单碱基A、T、C、G以及16个双碱基AA、ttAT、AC、AG、TA、TT、TC、TG、CA、CT、CC、CG、GA、GT、GC、ttGG的20个识别模块NI、NG、HD、NN、NI-NI、NI-NG、NI-HD、NI-NN、ttNG-NI、NG-NG、NG-HD、NG-NN、HD-NI、HD-NG、HD-HD、HD-NN、ttNN-NI、NN-NG、NN-HD、NN-NN,序列见表1,分别如SEQ ID NO:1-20tt所示。tt

  表1tt

  2.将基本模块加上酶切位点和接头制作172个质粒库tt

  (1)PCR扩增添加酶切识别序列和连接接头tt

  以F1、R1;F2、R2;F3、R3;F4、R4;F5、R5;F6、R6;F7、R7;ttF8、R8;F9、R9为引物,以含有16个双模块的T载体为模板做PCR,tt共16×9=144个;tt

  以F1、R1;F2、R2;F3、R3;F4、R4;F5、R5;F6、R6;F7R7为tt引物,以含有4个单模块的T载体为模板做PCR,共4×7=28个;tt

  共144+28=172个。tt

  PCR体系:Plasmid:1ul;Primers:0.1ul+0.1ul;Buffr:1.5ul;dNTP:tt0.8ul;Mgso4:0.35ul;水:11.48ul;DNA聚合酶:1单位。tt

  PCR程序:95度2min;95度15s,55.8度30s,68度22s,36个tt循环;68度1min。tt

  F1、R1;F2、R2;F3、R3;F4、R4;F5、R5;F6、R6;F7、R7;ttF8、R8;F9、R9引物的序列见表2,分别如SEQ ID NO:21-38所示。18tt条引物都带有Bsa I酶切识别序列GGTCTCN‘NNNN。这个酶属于type IIs ttenzymes,同一个酶切识别序列可以产生多个粘性识别末端,理论上可以tt产生44个粘性识别末端,再加上每个模块的结尾和开头Gly密码子4种,ttLeu密码子6种的限制,利用一个type IIs enzyme可以产生24种接头。选tt取其中的10种设计了引物,除了F1与R9外,Fn可与Rn-1的粘性末端相tt连,而不能与其他引物上的粘性末端相连(n为3-9的整数)。tt

  表2tt

  

  注:小写字母为Bsa I酶切识别序列。tt

  (2)将172个PCR产物进行胶回收纯化,连接入PMD18-T体系tt

  将20个基本模块片段连入PMD18-T载体(购自Takara),连接方法tt为:①取PCR产物2.7μl;②加入3μl  solution 1和0.3ul  PMD18-T载体;tt③16℃,2h;④转化DH5a感受态细胞,涂布卡纳霉素平板;⑤挑取克隆、tt小量提取质粒、PCR鉴定、测序,最后得到连接到载体PMD18-T中的带tt有Bsa I酶切位点和不同接头的172个质粒库。最后得到172质粒库示意tt图如图1所示。tt

  PCR库的获得tt

  首先用引物assem-F、assem-R,以172个质粒库为模板PCR,得到tt172个PCR库。引物所结合的位置分别在识别模块的上下游400bp左右处,tt加上识别模块PCR片段大小约为1050bp(双模块)或950bp(单模块)。tt

  表3tt

  

  PCR扩增体系(50μl)为:DNA模板(Template):0.5μl(约50ng);tt引物(Primer):每个0.3μl(50μM);pfx酶(Invitrogen):0.25μl;10×缓tt冲液(buffer):5μl;dNTP:2.5μl(2.5μM);mgso4:1ul;ddH2O:40.15μl。tt

  PCR程序:95℃2min;95℃15s,68℃30s,68℃50s,36个循环;tt68℃,5min。tt

  PCR产物纯化:将所得的PCR产物进行琼脂糖凝胶电泳,确定浓度。tt使用天根公司的通用型DNA纯化回收试剂盒(离心柱型)纯化PCR片段,tt纯化后在进行琼脂糖凝胶电泳标定各个产物的浓度。tt

  (3)酶切两个TALEN载体pEF1a-NLS-TALE backbone-Fok1(R)-pA;ttpEF1a-NLS-TALE backbone-Fok1(L)-IRES-PURO-pA,示意图见图2和图tt3,序列分别为SEQ ID NO:41和SEQ ID NO:42。TALEN载体中转录激活tt子样效应因子氨基酸序列框架N端和C端序列分别如SEQ ID NO:43和ttSEQ ID NO:44所示;在连接TALEN前需要预先用Bsa I酶切两个TALENtt载体,得到能与识别模块连接的接头,胶回收后,电泳标定浓度。tt

  N端序列:tt

  ATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACAT ttCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGG ttAAGGTGGGCATCCACGGggtaccCATGgTAGATTTGAGAACTTTGGGAT ttATTCACAGCAGCAGCAGGAAAAGATCA AGCCCAAAGTGAGGTCGAttttttCAGTGGGGCAGCATCAGGAAGGGCTGGTGGGTCATGGGTTTACACAT ttGCCCACATCGTAGCCTTGTCGCAGCACCCTGCAGCCCTTGGCACGGT ttCGCCGTCAAGTACCAGGACATGATTGCGGCGTTGCCGGAAGCCACA ttCATGAGGCGATCGTCGGTGTGGGGAAACAGTGGAGCGGAGCCCGA ttGCGCTTGAGGCCCTGTTGACGGTCGCGGGAGAGCTGAGAGGGCCTC ttCCCTTCAGCTGGACACGGGCCAGTTGCTGAAGATCGCGAAGCGGGG ttAGGAGTCACGGCGGTCGAGGCGGTGCACGCGTGGCGCAATGCGCTC ttACGGGAGCACCCCTCAACCTGACCgagaccCtt

  C端序列:tt

  ggtctcAACTCACGCCTGAGCAGGTAGTGGCTATTGCATCCAATgga ttGGGGGCAGACCCGCACTGGAGTCAATCGTGGCCCAGCTTTCGAGGC ttCGGACCCCGCGCTGGCCGCACTCACTAATGATCATCTTGTAGCGCTG ttGCCTGCCTCGGCGGACGACCCGCCTTGGATGCGGTGAAGAAGGGGC ttTCCCGCACGCGCCTGCATTGATTAAGCGGACCAACAGAAGGATTCCC ttGAGAGGACATCACATCGAGTGGCAtt

  (4)TALEN的连接tt

  上文已说明过除了F1与R9外(F1与载体左端连接,R9与载体右端tt连接),Fn可与Rn-1的粘性末端相连,而不能与其他引物上的粘性末端相tt连。另外识别模块之间,识别模块与载体之间一旦连接上无法被Bsa I在tt切开,所以把几个片段和载体放在同一体系里,用Bsa I和T4连接酶边tt切边连,即可一步把TALEN连接成功。tt

  下面以19个识别模块的连接为例,说明连接策略。因最后一个可以tt识别碱基T的半个模块已在载体上,所以只要连18个模块即可,连接示tt意图见图4。首先选择与靶位点相对应的9个模块再加上TALEN的载体,tt用Bsa I和T4连接酶边切边连。tt

  连接体系为:tt

  Vector:150ngtt

  Modulars:50ng/modulartt

  Bsa I  (NEB):1ultt

  T4Ligase(fermentas):1ultt

  T4Buffer(NEB):2ultt

  H2O:补足20ultt

  连接程序为:37℃5min;16℃10min,15个循环;80℃,10min。tt

  连接步骤见图4。因为连接时会有连接不完全,只连接上1-8个片段,tt这种连接不完全的线性DNA会通过重组的方式降低连接的效率,所以在tt转化之前用可以消化线性化DNA的酶Plasmid-SafeTM ATP-Dependent ttDNase(Epicentre,货号:E3105K)消化线性质粒,体系为:tt

  在20ul酶连体系的基础上加1ul plasmid-safe nuclease和0.5ulttATP,于37℃消化1h。tt

  取10ul转化Trans-T1感受态,挑克隆,小抽,BamH1/Pst1酶切鉴定,tt酶切出的较小的片段大小应为连入片段大小加上550bp。把酶切正确的质tt粒送测序,测序正确即可得到正确的TALEN质粒。测序引物如下表:tt

  表4tt

  

  Dayl:tt

  连接:4.5htt

  plasmid-safe nuclease消化:1htt

  转化:1htt

  Day2:tt

  挑克隆30mintt

  摇菌:6h(Trans-T1生长较快)tt

  小抽,酶切鉴定送测序:1.5htt

  Day3:tt

  比对序列tt

  得到确认正确的质粒只需要3天,并且同时,本发明方法使用的识别tt单元是质粒或质粒的PCR产物,避免了保存酶切产物中遇到的末端单链tt尾巴破坏和降解的问题,且操作步骤更简单,更节约成本。tt

  同样地,如果是所需的识别碱基是12-18,而不是19,相应的把靠前tt端双模块换成单模块,每换一个既可减少一个识别模块。不同数量的识别tt碱基的相应单双模的选择块见图6。tt

  实施例2tt

  连接可识别碱基tt

  片段一:CGCGCGCGCGCGCGCGCGT(SEQ ID NO:47),片段二ttttttCCCACTCCCCATCCAGT(SEQ ID NO:48)的TALEN。tt

  (1)首先从PCR库中选择所需的识别模块:tt

  CGCGCGCGCGCGCGCGCGT选择模块CG-1、CG-2、CG-3、CG-4、ttCG-5、CG-6、CG-7、CG-8、CG-9;此连接载体为pEF1a-NLS-TALE ttbackbone-Fok1(R)-pAtt

  CACTCCCCATCCAGT选择模块C-1、A-2、C-3、TC-4、CC-5、CA-6、ttTC-7、CA-8、GT-9。此连接载体为pEF1a-NLS-TALE ttbackbone-Fok1(L)-IRES-PURO-pAtt

  (2)按照以下连接体系:tt

  Vector:150ngtt

  Modulars:50ng/modulartt

  Bsa I(NEB):1ultt

  T4Ligase(fermentas):1ultt

  T4Buffer(NEB):2ultt

  H2O:补足20ultt

  连接程序为:37℃5min;16℃10min,15个循环;80℃,10min。tt

  (3)然后plasmid-safenuclease消化:1h。tt

  (4)转化Trans-T1感受态,挑克隆,小抽,BamH1\EcoR1酶切鉴定,tt电泳后凝胶图见图7。tt

  图中,酶切正确的条带分别为:连接一:3.1k和2.2k;连接二:4.2ktt和3.7k;如图:中间为1kb的DNA Marker,marker左面为连接二的酶切tt图,右面为连接一的酶切图。连接一和连接二的成功率分别为70%和80%。tt将酶切正确的15个克隆送测序,结果显示酶切正确的克隆,测序全部正tt确。说明此方法进行连接效率高,简单,高效。tt

《一种DNA文库及构建转录激活子样效应因子核酸酶质粒的方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)