欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种sgRNA及其应用独创技术15629字

一种sgRNA及其应用

2020-11-08 14:46:14

  一种sgRNA及其应用

  技术领域

  本发明涉及生物技术领域,具体地说,涉及一种sgRNA及其应用。

  背景技术

  快速寻找控制表型的重要或关键基因的方法往往是通过功能缺失型或功能获得型高通量筛选。在基因敲除文库之前,多采用RNA干扰文库或shRNA文库方法进行筛选。然而其存在脱靶效应明显的缺点,且并非基因敲除文库,只能使基因部分沉默表达。

  原核生物第二类适应性免疫系统CRISPR/Cas9系统的工作原理在于,Cas9核酸内切酶在sgRNA的引导下切割双链DNA,造成双链的断裂,利用基因组修复的不稳定性产生修复错误(碱基的缺失或插入),从而造成移码突变,实现基因敲除的目的。目前在人类、小鼠以及斑马鱼等生物中,此技术已得到广泛应用并取得成功,证明其是一个基因编辑的有效工具。CRISPR/Cas9-sgRNA系统中的sgRNA决定了基因编辑的位点和基因编辑的效率。研究已经表明,不同的sgRNA有不同的编辑效率和有效性。故如何获得基因敲除效果更好的sgRNA是一个值得研究的技术方向。

  发明内容

  本发明针对猪全基因组蛋白编码基因以及miRNA设计了一种特异性sgRNA,并将其构建为质粒文库,进一步在此基础上构建了猪小肠上皮细胞敲除文库,可以利用该策略实现高通量筛选猪重要的功能基因。

  具体地,本发明的技术方案如下:

  第一方面,本发明提供了一种sgRNA,其能够识别猪全基因组的靶基因之一,所述靶基因为蛋白编码基因或miRNA;所述靶基因含有PAM位点,所述PAM位点为NGG,N为任意碱基;

  当所述靶基因为蛋白编码基因时,所述sgRNA的靶序列为所述靶基因的不同转录本的CDS的交集序列;若所述靶基因的不同转录本的CDS没有交集,所述sgRNA的靶序列为所述靶基因的核苷酸序列最长的转录本;

  当所述靶基因为miRNA时,所述sgRNA的靶序列为miRNA前体序列或成熟序列;

  所述sgRNA还具有以下结构:

  (1)所述sgRNA的核苷酸序列包含X-NGG结构,其中,X包含与所述靶序列互补的核苷酸序列,X的长度为20bp;所述sgRNA的核苷酸序列中的NGG与所述靶基因的PAM位点一致;

  (2)所述sgRNA的核苷酸序列中,G和C的总含量为45-70%;

  (3)所述sgRNA的核苷酸序列中不含有4个以上连续排列的T。

  第二方面,本发明提供一种表达载体,其包括与至少一个表达控制序列可操作地连接的编码上述sgRNA的DNA片段。

  优选地,根据脱靶位点mismatch情况和数量对每一个sgRNA进行打分,经过评分筛选后用于载体文库构建。

  本发明所述的表达载体,其是病毒、真菌或细菌表达载体。

  优选地,所述表达载体包含lentiGuide-Pro载体。对应于该载体,本发明的sgRNA在其核苷酸序列的X-NGG结构的左右两侧分别连接有左臂(核苷酸序列如SEQ ID NO.1所示)和右臂(核苷酸序列如SEQ ID NO.2所示),以与该载体连接。

  第三方面,本发明提供一种载体文库,其包括多个上述的表达载体。

  优选地,载体文库中表达载体的数量为>110000的正整数。

  本发明所述的载体文库,其中,针对每个所述靶基因,包含4-6个特异性表达载体,每个所述特异性表达载体含有不同的所述sgRNA的DNA片段。

  优选地,本发明针对猪全基因组基因,sgRNA的平均覆盖深度为4-6,即每个基因平均有4-6种特异性sgRNA。

  更优选地,每个基因的多个sgRNA分别靶定到该基因的不同位置。

  本发明所述的载体文库,其分为A库和B库,针对同一个所述靶基因,每个库中均具有2-3个所述特异性表达载体。

  本发明所述的载体文库,其还包括阴性对照载体,所述阴性对照载体对所述猪全基因组的任意基因均不具有识别功能(不靶定基因组的任何位置)。

  本发明所述的载体文库,其可识别(靶向)≥96%的所述猪全基因组的靶基因。

  作为本发明的一种实施方式,本发明的基于CRISPR/Cas9方法构建的猪全基因组敲除文库的方法,包括以下步骤:

  1、提供N种表达猪特异性sgRNA的载体,其中N为>110000的正整数,所述的猪特异性sgRNA是针对猪全基因组的靶基因,所述靶基因选自:(a)蛋白编码基因和(b)miRNA;

  并且,所述的猪特异性sgRNA具有以下结构特征:

  (1)sgRNA针对的靶基因中含有PAM位点,所述PAM位点为NGG,N为任意碱基;所述sgRNA的结构为X-NGG,其中X包含与所述靶基因的核苷酸序列互补的核苷酸序列,X的长度为20bp;

  (2)sgRNA的GC含量选择45-70%;

  (3)排除有连续4个及以上T的sgRNA;

  (4)对于靶向蛋白编码基因的特异性sgRNA的设计:获取不同转录本之间CDS的交集序列,使用交集序列作为靶序列,对于在不同转录本公共区域为0的基因,则选择最长的一个转录本来选取sgRNA。对于靶向miRNA基因的特异性sgRNA,其结合位置为miRNA前体序列或成熟序列。

  2、将所设计的sgRNA分成A、B两个库,每个库的sgRNA均针对猪全基因组靶基因,各含有X、Y条sgRNA,X、Y是大于55000的正整数。

  3、任选多种阴性对照载体分别加入A、B两个库中,所述阴性对照载体不靶定基因组的任何位置,每个库含1000种阴性对照载体。

  作为本发明的一种实施方式,一种制备上述猪全基因组sgRNA文库的方法如下:

  (a)以本发明的sgRNA结构为模板,进行PCR扩增,获得扩增产物;

  (b)将所述产物与线性化表达载体连接,形成连接产物;

  (c)将所述连接产物转化大肠杆菌,并抽提质粒,从而获得所述的猪全基因组特异性sgRNA文库。

  第四方面,本发明提供一种猪细胞文库,其包含以上述载体文库敲除真核基因后的猪细胞。

  本发明所述的猪细胞文库,其构建方法如下:

  构建可稳定表达Cas9蛋白的猪细胞系;以及

  以所述载体文库中的表达载体侵染所述猪细胞系,所述表达载体为慢病毒表达载体。

  具体地,作为本发明的一种实施方式,构建CRISPR/Cas9的双载体慢病毒敲除文库方法如下:

  1.构建稳定表达Cas9蛋白的真核细胞系:以慢病毒载体转染小肠上皮细胞IPEC-J2细胞系,筛选稳定表达Cas9蛋白的真核细胞系。

  2.将上述载体文库的A、B两库包装成慢病毒形式,分别侵染上述稳定表达Cas9蛋白的真核细胞系,MOI=0.3,病毒感染24h后,加入puro进行筛选,加药筛选7天后,即获得真核基因敲除的细胞文库。

  本发明的有益效果至少在于:

  本发明利用CRISPR/Cas9系统,针对猪全基因组蛋白编码基因以及miRNA设计了一种特异性sgRNA,并将其构建为质粒文库。该双载体形式的针对猪全基因组水平的敲除文库可分成A、B两库,并还有阴性对照,两者配合使用,既保证了文库的容量也保证了文库的有效性。可利用该手段实现高通量筛选猪的功能基因,尤其是可用于研究特发于猪肠道疾病的功能基因的挖掘。

  附图说明

  图1为实施例1的A库质量验证结果,其中HZZ-A-lib-NGS代表实施例1的A库,横坐标为比对到基因的reads数;

  图2为实施例1的B库质量验证结果,其中HZZ-B-lib-NGS代表实施例1的B库,横坐标为比对到基因的reads数;

  图3为实施例2的Cas9稳转细胞系的WB验证结果;其中,M为Marker;

  图4为实施例2的Cas9稳转细胞系qPCR验证结果,图中*数量不同代表实验组与NC组的差异显著性(**代表p<0.05;***代表p<0.01;****代表p<0.0001),纵坐标代表Cas9mRNA的差异倍数;

  图5为实施例2的KIT基因敲除效果检测结果。

  具体实施方式

  下面将结合实施例对本发明的优选实施方式进行详细说明。需要理解的是以下实施例的给出仅是为了起到说明的目的,并不是用于对本发明的范围进行限制。本领域的技术人员在不背离本发明的宗旨和精神的情况下,可以对本发明进行各种修改和替换。

  下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

  实施例1sgRNA文库构建

  sgRNA文库构建具体方法如下:

  1、靶序列选择:以猪全基因组作为对象,靶基因选自:蛋白编码基因和miRNA。

  对于靶基因是蛋白编码基因的,以同一靶基因不同转录本之间的CDS的交集序列作为靶序列,对于在不同转录本公共区域为0的基因,则选择最长的一个转录本作为靶序列。对于靶基因是miRNA的,以miRNA前体序列或成熟序列作为靶序列。

  2、sgRNA设计:

  sgRNA具有以下结构特征:

  (1)所述sgRNA的结构为X-NGG,其中X包含与所述靶基因的核苷酸序列互补的核苷酸序列,X的长度为20bp;NGG为sgRNA针对的靶基因中含有的PAM位点,N为任意碱基;

  (2)sgRNA的GC含量选择45-70%;

  (3)排除有连续4个及以上T的sgRNA。

  3、对获得的sgRNA进行评估过滤:根据脱靶位点mismatch情况和数量对每一个sgRNA进行打分。

  过滤标准为:过滤掉非特异性sgRNA,以及错配数多于5个碱基的sgRNA。

  4、病毒载体构建:

  (a)在上述筛选获得的sgRNA结构的左右两侧分别连接有左臂(核苷酸序列如SEQID NO.1所示)和右臂(核苷酸序列如SEQ ID NO.2所示)后,以其为模板,进行PCR扩增,获得扩增产物。

  (b)将所述产物与lentiGuide-Pro(addgene:52963;http://www.addgene.org/)载体连接,形成连接产物;

  (c)将所述连接产物进行大肠杆菌转化,抽提质粒;

  (d)将所述质粒采用PMD2.G、pSpax2(购自北京全式金生物技术有限公司)转入用于生产慢病毒的细胞中,产生慢病毒载体。

  最终构建得到的猪全基因组sgRNA文库中,一共由20000个靶基因设计得到115736个sgRNA载体,每个基因平均有4-6种特异性sgRNA,该文库覆盖度达到100%的所述猪全基因组的靶基因。将该文库分为A、B库,其中A库容量为58844条,B库容量为56892条。每个基因在A、B库中各有2-3种与之对应的sgRNA。

  A库、B库中还分别包含1000个阴性对照载体,所述阴性对照载体不靶定基因组的任何位置。

  本实施例进一步对构建得到的sgRNA的质量和表达载体文库的有效性进行了检验。

  为了能够检测构建的质粒文库的质量,对细胞中sgRNA barcodes进行深度测序。

  A库(HZZ-A-lib-NGS)的检验结果显示如图1所示,B库(HZZ-B-lib-NGS)的检验结果显示如图2所示。A库、B库sgRNA种类的覆盖率均为100%,且90%的sgRNA reads数是10%的sgRNA的reads数的3倍,说明本实施例的A库、B库的均一性好。

  实施例2猪细胞文库构建

  本实施例通过上述构建得到的文库进行猪细胞文库构建。该文库为基于CRISPR/Cas9系统的双载体慢病毒敲除文库。

  具体方法如下:

  1、构建稳定表达Cas9蛋白的真核细胞系:以慢病毒载体lentiCas9-Blast(addgene:52962,http://www.addgene.org/)通过慢病毒包装的方式转染猪小肠上皮细胞IPEC-J2细胞系,筛选稳定表达Cas9蛋白的真核细胞系。

  具体筛选方法为:

  将上述获得的细胞系培养24小时后,在上述细胞的培养液中加入杀稻瘟菌素筛选7天,并挑取稳定表达Cas9的单克隆细胞群,利用WB以及qPCR的方法进行验证。

  WB验证方法为:提取单克隆细胞株(泳道1为正常IPEC-J2细胞株,泳道2-7分别为待验证单克隆细胞株A21、A42、A63、A94、A135、B76),提取蛋白,以GAPDH作为对照基因,分别使用考马斯亮蓝液置于摇床染色标定蛋白含量。

  WB验证结果参见图3,从图3中可看出4,5,6泳道Cas9蛋白表达量较高,可用于后续实验。

  qPCR验证方法为:提取单克隆细胞株A21、A42、A63、A94、A135、B76以及正常IPEC-J2细胞系RNA,反转成cDNA后,以GAPDH为持家基因,检测Cas9的相对表达量。

  qPCR验证结果参见图4,NC代表正常IPEC-J2细胞系,从图4中可看出所有实验组(A21、A42、A63、A94、A135、B76)Cas9相对表达量均显著提高。

  稳转Cas9蛋白细胞系的质量验证试验:随机选择了猪的KIT基因(NCBI ID:396810)进行敲除效果的检测。

  将按照实施例1中所述方法设计的sgRNA,序列为:AGTGGAGGTGATTCTCATGG(如SEQID NO.3所示),按照实施例1-2中所述方法将该sgRNA包装成慢病毒载体后连接入原质粒,并转染至表达Cas9的IPEC-J2细胞系,通过PCR之后进行测序验证。其中引物设计如下KIT-F:CGAGATGTGACTCCTGCCAT(如SEQ ID NO.4所示);KIT-R:TGCCCCGATCACACTTCCTA(如SEQ IDNO.5所示)。测序结果(部分截取)如图5所示,根据图中套峰情况可知KIT基因被成功敲除。

  2、以实施例1构建的被包装成慢病毒形式的载体文库的A、B两库,分别侵染上述筛选获得的稳定高表达Cas9蛋白的真核细胞系猪的小肠上皮细胞IPEC-J2。

  具体地,将筛选出的高表达Cas9的IPEC-J2细胞系以3x106平铺于40个15cm皿的细胞培养板中,用sgRNA质粒包装的病毒液按照MOI=0.3进行感染,病毒感染24h后(使得每个细胞基本被1个病毒载体感染),加入嘌呤霉素puro进行筛选,加药筛选7天后,即获得真核基因敲除的细胞文库。

  虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

  序列表

  <110> 中国农业大学

  <120> 一种sgRNA及其应用

  <130> KHP201111623.7

  <160> 5

  <170> SIPOSequenceListing 1.0

  <210> 1

  <211> 27

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 1

  atatcttgtg gaaaggacga aacaccg 27

  <210> 2

  <211> 27

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 2

  gttttagagc tagaaatagc aagttaa 27

  <210> 3

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 3

  agtggaggtg attctcatgg 20

  <210> 4

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 4

  cgagatgtga ctcctgccat 20

  <210> 5

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 5

  tgccccgatc acacttccta 20

《一种sgRNA及其应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)