欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种高通量测序调取未知RNA全长序列的方法独创技术35310字

一种高通量测序调取未知RNA全长序列的方法

2021-03-22 01:28:27

一种高通量测序调取未知RNA全长序列的方法

  技术领域

  本发明涉及基因检测领域,尤其涉及一种高通量测序调取未知RNA全长序列的方法。

  背景技术

  调取RNA全长序列对于未知RNA研究是非常必要的。目前有很多调取未知RNA全长序列的方法,最代表性的就是MICHAEL A.FROHMAN等开发的快速扩增cDNA末端(Rapidamplification cDNA ends,RACE)方法,该方法利用末端脱氧核苷酸转移酶(Terminaldeoxynucleotidyl-transferase,TdT)将与oligo(dT)相连的Adaptor引入mRNA的3’末端(3’RACE)或cDNA的3’末端(5’RACE)的多聚腺苷酸(polyA)尾,通过基因特异性引物及Adaptor引物对cDNA末端进行PCR扩增后进行克隆测序。在RACE基础上衍生出几种扩增cDNA末端的方法,例如为了增加锚定引物与cDNA模板结合的稳定性及引物的特异性,在cDNA的3’末端加入poly(dC)尾并在与锚定引物相连的poly(dG)中加入脱氧肌苷的5’RACE方法;将Adaptor在反转录前连接到RNA的5’末端,通过Adaptor引物与基因特异性引物对cDNA的5’末端进行扩增等方法。

  对于获取的全新片段较短或同源性较高的未知RNA,因为难于设计合适的基因特异性反转录引物,不适合使用RACE及其衍生方法调取全长。RACE及其衍生方法对引物要求非常严格,不合适的引物可能导致实验失败。5’RACE及其衍生方法首先需要设计基因特异性反转录引物,反转录后在cDNA尾部引入含锚定引物的Adaptor,再使用基因特异性扩增引物与锚定引物进行PCR,产生具有限制性酶切位点靶序列,再进行克隆测序。现常用的RACE方法还需在基因特异性扩增引物和锚定引物之间设计巢式PCR引物进行巢式PCR。总之,RACE及其衍生方法需要设计多对引物,并且随着引物数量的增加,对实验结果的影响也越大。

  RACE及其衍生方法都是分别调取RNA的5’末端序列和3’末端序列,实验周期长,操作繁琐,实验成本高。

  因此,现有技术有待于进一步发展和进步。

  发明内容

  针对上述技术问题,本发明实施例提供了一种高通量测序调取未知RNA全长序列的方法。

  本发明技术方案如下:

  一种高通量测序调取未知RNA全长序列的方法,其中,根据RNA-seq获取的全新短片段序列设计该未知RNA的5’末端和3’末端基因特异性反转录引物,利用反转录酶和基因特异性反转录引物分别合成5’末端和3’末端一链cDNA,之后利用DNA聚合酶I分别合成5’末端和3’末端二链cDNA,将所合成的两个末端二链cDNA合并,超声打断后构建文库并测序,通过生物信息学分析,最终调取未知RNA全长序列。

  所述的一种高通量测序调取未知RNA全长序列的方法,其中,该未知RNA的5’末端和3’末端的基因特异性反转录引物设计具体为:5’末端基因特异性反转录引物(GSP1)与RNA-seq获取的全新短片段的RNA序列反向互补,3’末端基因特异性反转录引物(GSP2)与RNA-seq获取的全新短片段的RNA序列同向互补,两个末端基因特异性反转录引物所扩增的片段具有重叠区域。

  所述的一种高通量测序调取未知RNA全长序列的方法,其中,还包括:还包括:总RNA提取并去除核糖体RNA。

  所述的一种高通量测序调取未知RNA全长序列的方法,其中,利用反转录酶和基因特异性反转录引物,分别进行5’末端和3’末端一链cDNA合成,具体为:

  (1)制备下述混合物:

  

  65℃孵育5分钟,之后冰上冷却至少1分钟。

  (2)制备下述cDNA合成混合物:

  

  (3)将10μl cDNA合成混合物加入到RNA和基因特异性反转录引物的混合物中,轻柔混匀,瞬离至管底,50℃孵育50分钟,85℃孵育5分钟以终止反应,冰上冷却,得到一链cDNA,之后对一链cDNA进行磁珠纯化。

  所述的一种高通量测序调取未知RNA全长序列的方法,其中,使用DNA聚合酶I,分别进行5’末端和3’末端二链cDNA合成,具体为:

  (1)制备下述混合物:

  

  混匀并且冰上孵育5分钟。

  (2)加入下述酶:

  

  混匀并且在15℃孵育2.5小时制备二链cDNA。

  其中,10X second strand buffer是由500mM Tris-HCl,pH7.8,50mM MgCl2和10mM DTT组成。此缓冲液在未加入DTT时过滤,然后加入0.1M DTT(invitrogen)制备最终成分。

  所述的一种高通量测序调取未知RNA全长序列的方法,其中,将5’末端和3’末端二链cDNA合并后进行超声打断,打断片段大小为200bp。

  所述的一种高通量测序调取未知RNA全长序列的方法,其中,构建文库包括以下步骤:

  (1)末端修复和加尾反应,反应体系如下:

  

  涡旋震荡,冰浴,立刻转移到PCR仪孵育(20℃,30min;65℃,30min;4℃,∞),得到末端修复和加尾反应产物。

  (2)接头连接

  向末端修复和加尾反应产物中加入接头连接反应液,反应体系如下:

  

  完全混匀,瞬时离心,20℃孵育15分钟,得到加接头产物。

  (3)连接后纯化。

  (4)文库扩增,扩增体系如下:

  

  

  混匀,瞬时离心,按如下程序进行PCR反应,预变性:98℃1min;11个循环(变性:98℃15sec;退火:60℃30sec;延伸:72℃30sec);终延伸:72℃5min,得到PCR产物。

  所述的一种高通量测序调取未知RNA全长序列的方法,其中,文库构建后进行E-gel电泳,选取200bp-700bp片段进行胶回收,完成文库选择。

  所述的一种高通量测序调取未知RNA全长序列的方法,其中,使用Hiseq-PE150测序策略对文库进行测序。

  所述的一种高通量测序调取未知RNA全长序列的方法,其中,进行生物信息学分析,最终调取未知RNA全长序列,包括以下步骤:

  (1)质量控制:包括文库质量分析以及清除接头序列。

  (2)序列比对:使用软件Bowtie2 version 2.1.0及Samtools 0.1.19-44428cd对下机数据进行比对。

  (3)BLAT检验比对结果:在UCSC平台使用BLAT工具检验下机数据比对结果,并对比对结果进行可视化,最终调取未知RNA全长序列。

  有益效果

  本发明提供一种高通量测序调取未知RNA全长序列的方法,该方法具有以下优势:

  本方法具有较高的灵敏度,从实验结果(图2)看来,即使有同源杂序列影响,最终也可以获得未知RNA全长序列。这对于同源性较高的未知RNA全长序列的调取具有优势,因为如果未知RNA同源性较高,则使用基因特异性引物反转录时可能反转录出很多杂片段,使用RACE及其衍生方法,则增加了假阳性率,并且增加了阳性片段筛选的时间及成本。使用本方法,即使未知RNA具有高同源性,只要目标序列有扩增,即可检测到,很大程度上提高了检测的灵敏度和实验的成功率。

  另外,本实验引物设计具有较大的灵活空间,理论上,只要5’末端和3’末端的基因特异性反转录引物与RNA-seq获取的全新短片段的RNA序列互补且方向正确,并且两个末端引物扩增片段具有重叠区域即可使用本方法。

  本实验只需要设计一对5’末端和3’末端的基因特异性反转录引物及一对鉴定5’末端和3’末端二链cDNA中含有RNA-seq获取的全新短片段的引物即可,而鉴定5’末端和3’末端二链cDNA中含有RNA-seq获取的全新短片段的克隆测序步骤为可选做的质控步骤,并不决定实验结果,所以,本方法中使用较少的引物,可减少因引物原因产生的对实验结果的影响。

  因为反转录方向取决于引物方向,与RNA模板方向无关。因此,虽然5’末端和3’末端cDNA序列合成在超声打断前分开进行,但除了引物不同外,实验方法相同,且在超声打断时将5’末端和3’末端二链cDNA合并,之后通过同一个实验流程就可完成未知RNA全长序列的调取,简化了实验步骤,节约了时间成本。随着测序通量的加大及测序成本的降低,本方法总体上可节约实验成本。

  附图说明

  图1为本发明一种高通量测序调取未知RNA全长序列的方法原理图。

  图2为本发明具体实施例中克隆测序鉴定5’末端和3’末端二链cDNA中含有RNA-seq获取的全新短片段的PCR产物PAGE凝胶电泳图。

  图3为本发明具体实施例中文库E-gel电泳及胶回收位置图。

  图4为本发明具体实施例中下机原始数据的基本信息。

  图5为本发明具体实施例中下机数据fastq文件内所有碱基的质量值(a为reads1所有碱基的质量值,b为reads2所有碱基质量值)。

  图6划线部分为本发明具体实施例中高通量测序获得的未知RNA 3’末端cDNA序列及在UCSC平台使用BLAT工具对其进行检验的结果。

  图7划线部分为本发明具体实施例中高通量测序获得的未知RNA 5’末端cDNA序列及在UCSC平台使用BLAT工具对其进行检验的结果。

  图8划线部分为本发明具体实施例中高通量测序获得的未知RNA全长cDNA序列及在UCSC平台使用BLAT工具对其进行检验的结果。

  图9为本发明具体实施例中对高通量测序获得的未知RNA全长cDNA序列中未检测到的序列进行克隆测序鉴定的PAGE凝胶电泳图,M为50bp DNALadder,1为对未检测到的序列进行克隆测序鉴定的PCR产物。

  具体实施方式

  下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

  除非另有定义,本说明书所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本说明书中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是用于限制本发明。本说明书所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

  本方法基于如图1所示的实验原理设计,其具体实验步骤如下:

  1.引物设计

  (1)5’末端和3’末端基因特异性反转录引物设计

  因为反转录方向取决于引物方向,与RNA模板方向无关。因此,未知RNA的5’末端和3’末端的基因特异性反转录引物设计具体为:5’末端基因特异反转录引物(GSP1)与RNA-seq获取的全新短片段的RNA序列反向互补,3’末端基因特异反转录引物(GSP2)与RNA-seq获取的全新短片段的RNA序列同向互补,两个反转录引物扩增片段应具有重叠区域。使用Primer3设计基因特异性反转录引物,引物本身除满足上述要求外,还应满足一般的引物设计原则,如:GC含量、二级结构、Tm值等方面的要求。

  具体实施例中,RNA-seq获取的全新短片段(chr13:64,787,049-64,787,219,NCBI37/mm9)来自于本实验室建立的敲除与Sox2启动子互作的远端增强子(命名为E3)的小鼠胚胎干细胞(mES)细胞系的RNA-Seq数据,其具体序列(SEQ ID NO.1)为:CTGGTGCCATAATTCAGGGAACTGTGTTCTTGATGTACTATCTGAGACATTTGTGCTTCCCCCCATCCAGCTATCAGGCTGTTAGGCAATGCACTTCTAGGAATTAGAATTCTATAAGGAATCTCATGCTGGAAGAACAAAAAGACCCA,则RNA-seq获取的全新短片段相应的RNA序列(SEQ ID NO.2)为:UGGGUCUUUUUGUUCUUCCAGCAUGAGAUUCCUUAUAGAAUUCUAAUUCCUAGAAGUGCAUUGCCUAACAGCCUGAUAGCUGGAUGGGGGGAAGCACAAAUGUCUCAGAUAGUACAUCAAGAACACAGUUCCCUGAAUUAUGGCACCAG,因此设计5’末端基因特异反转录引物(GSP1)序列(SEQ ID NO.3)为:CTGGTGCCATAATTCAGGGA,3’末端基因特异反转录引物(GSP2)序列(SEQID NO.4)为:GGATCTTCACGTAACGGATTGT。(2)克隆测序鉴定5’末端和3’末端二链cDNA中含有RNA-seq获取的全新短片段,上游引物序列(SEQ ID NO.5)为:CTGGTGCCATAATTCAGGGA,下游引物序列(SEQ ID NO.6)为:CCTAGAAGTGCATTGCCTAACA,产物大小为101bp。

  2.总RNA提取

  (1)细胞来自于本实验室建立的敲除与Sox2启动子互作的远端增强子(命名为E3)的小鼠胚胎干细胞(mES)细胞系,当培养皿(60mm)中mES克隆长至平均大小为200-400μm时去掉培养基,直接向培养皿中的细胞加2ml Trizol,迅速轻摇使其充分和培养皿中所有细胞接触,裂解细胞并灭活RNA酶。室温放置5分钟,细胞裂解为匀浆状态,使用移液器将裂解的细胞轻轻吹打混匀,将其转移至无RNA酶的EP管中。

  (2)每500μl裂解后的细胞加入100μl氯仿,盖紧盖子剧烈混匀10-15秒,室温放置2分钟,然后4℃,12,000g离心15分钟。

  (3)将离心后的上层水相转移到新的无RNA酶的EP管中,转移过程注意不要吸到中间相。加入250μl异丙醇,轻柔颠倒摇匀,此时样本略微浑浊,室温放置10分钟,然后4℃,12,000g离心10分钟。

  (4)离心后管底可见小的乳白色沉淀,丢弃上清,加入500μl的75%(V/V)乙醇,然后4℃,7500g离心5分钟。

  (5)重复步骤(4)。

  (6)丢弃上清,风干5分钟,加入60μl Nuclease-free H2O,55℃金属浴10分钟,直接使用或放置-80℃保存备用。

  3.核糖体RNA去除(南京诺维赞生物技术公司;NR603)

  3.1实验步骤:

  3.1.1准备总RNA样品:

  在一个Nuclease-free离心管中,用Nuclease-free H2O将1μg总RNA稀释至11μl,冰上放置备用。

  3.1.2RNA样品与探针杂交:

  (1)在一个Nuclease-free微量离心管中配制如下反应液:

  

  使用移液器轻轻吸打10次充分混匀。

  (2)瞬时离心将样品收集至管底,将样品置于PCR仪中,进行探针杂交反应:

  

  3.1.3RNase H消化:

  (1)在冰上制备如下反应液:

  

  

  使用移液器轻轻吸打10次充分混匀。

  (2)将样品置于PCR仪中,进行RNase H消化反应:

  

  3.1.4DNase I消化:

  (1)在冰上制备如下反应液:

  

  使用移液器轻轻吸打10次充分混匀。

  (2)将样品置于PCR仪中,进行DNase I消化反应:

  

  瞬时离心将样品收集至管底,并置于冰上,立即进入下步操作。

  3.1.5使用VAHTS RNA Clean Beads(南京诺维赞生物技术公司;N412-01)纯化Ribosomal-depleted RNA。

  (1)涡旋振荡混匀VAHTS RNA Clean Beads,吸取110μl(2.2×)至上步RNA样品中,使用移液器吹打10次以彻底混匀。

  (2)冰上静置15分钟,使RNA结合到磁珠上。

  (3)将样品置于磁力架上5分钟,待溶液澄清后,小心移除上清。

  (4)保持样品始终处于磁力架上,加入200μl Nuclease-free H2O新鲜配制的80%乙醇漂洗磁珠,室温孵育30秒后,小心移除上清。

  (5)重复步骤(4)一次。

  (6)保持样品始终处于磁力架上,室温开盖干燥磁珠5-10分钟或者直至酒精被完全蒸发。

  (7)将样品从磁力架上取出,加入10μl Nuclease-free H2O,用移液器吹打6次以充分混匀,室温静置2分钟,在磁力架上静置5分钟,待溶液澄清后,小心吸取8μl上清至一个新的Nuclease-free离心管中。

  4.第一链cDNA合成(Invitrogen;18080-051):5’末端和3’末端分别进行一链cDNA合成,实验步骤如下:

  (1)制备下述混合物

  

  65℃孵育5分钟,之后冰上冷却至少1分钟。

  (2)制备下述cDNA合成混合物:

  

  (3)将10μl cDNA合成混合物加入到RNA和基因特异性反转录引物的混合物中,轻柔混匀,瞬离至管底。50℃孵育50分钟,85℃孵育5分钟以终止反应,冰上冷却,得到一链cDNA,之后对一链cDNA进行磁珠纯化。

  5.使用Agencourt AMPure XP磁珠(Beckman Coulter;A63881)分别纯化5’末端和3’末端一链cDNA,实验步骤如下:

  (1)24μl(1.2X)的AMPure XP磁珠加入一链cDNA,通过涡旋振荡或者多次上下吹打充分混匀。

  (2)室温静置15分钟以将cDNA结合到磁珠上。

  (3)将含有磁珠的样品放于磁力架上,静置5分钟或至溶液变澄清。

  (4)移液枪吸出上清液,加入200μl新鲜制备的80%EtOH(乙醇,体积分数85%),清洗两次。清洗时保证样品管始终在磁力架上,每次清洗时,常温孵育≥30秒。

  (5)第二次清洗后,略微旋转样品管,重新放回磁力架上,用10μl移液枪去除残余的EtOH,室温开盖干燥磁珠5-10分钟或者直到酒精被完全蒸发。

  (6)将样品从磁力架上取出,加入42.5μl Nuclease-free H2O,吸打或简单涡旋混合。室温孵育2分钟以从磁珠上洗脱一链cDNA。

  (7)将样品管放回磁力架上5分钟至溶液澄清,小心吸取40.5μl上清至一个新的Nuclease-free PCR管中。

  6.第二链cDNA合成:5’末端和3’末端cDNA分别进行二链合成,实验步骤如下:

  (1)制备下述混合物

  

  混匀并且冰上孵育5分钟。

  (2)加入下述酶:

  

  

  混匀并且在15℃孵育2.5小时。不要让温度高于15℃,不要使用热盖。

  其中,10X second strand buffer是由500mM Tris-HCl,pH7.8,50mM MgCl2和10mM DTT组成。此缓冲液在未加入DTT时过滤,然后加入0.1M DTT制备最终成分。

  7.5’末端和3’末端二链cDNA分别去除RNA

  将5’末端二链和3’末端二链cDNA分别加入5μl RNase A(Thermo;#EN0531),37℃反应1小时消化RNA。

  8.使用Agencourt AMPure XP磁珠分别纯化5’末端和3’末端二链cDNA,步骤如下:

  (1)66μl(1.2X)的AMPure XP磁珠加入二链cDNA,通过涡旋振荡或者多次上下吹打充分混匀。

  (2)室温静置15分钟以将二链cDNA结合到磁珠上。

  (3)将含有磁珠的样品放于磁力架上,静置5分钟或至溶液变澄清。

  (4)移液枪吸出上清液,加入500μl新鲜制备的80%EtOH(乙醇,体积分数85%),清洗两次。清洗时保证样品管始终在磁力架上,每次清洗时,常温孵育≥30秒。

  (5)第二次清洗后,略微旋转样品管,重新放回磁力架上,用10μl移液枪去除残余的EtOH,室温5-10分钟晾干或者直到酒精被完全蒸发。

  (6)加入62μl TE Buffer,吸打或简单涡旋混合。室温孵育2分钟以从磁珠上洗脱二链cDNA。

  (7)将样品管放回磁力架上5分钟至溶液澄清。小心吸取60μl上清至一个新的Nuclease-free PCR管中。

  9.将纯化后的5’末端和3’末端二链cDNA各取8μl用于克隆测序鉴定二链cDNA中含有RNA-seq获取的全新短片段,PCR结果如图2所示,可见本实验具有同源杂序列影响。克隆测序结果为两端二链cDNA中都含有目的片段。此步骤为选做步骤,如因RNA-seq获取的全新片段太短等原因难于设计PCR引物,可不做此克隆测序鉴定步骤,直接进行步骤10。

  9.1 5’末端和3’末端二链cDNA各做3个PCR重复,反应试剂及条件如下:

  

  预变性:98℃5min;35个循环(变性:98℃10sec;退火:55℃30sec;延伸:72℃1min);终延伸:72℃5min;保存:4℃∞min,得到PCR产物。

  9.2PCR产物跑12%的PAGE胶,切割目的条带并胶回收,步骤如下:

  (1)使用21G针头在0.5ml无DNA酶EP管底扎孔,每管扎3个孔。

  (2)将扎孔的0.5ml EP管放入1.5ml的无DNA酶的EP管中。

  (3)将切下的胶条放入0.5ml扎孔EP管内,盖上管盖。

  (4)室温20,000g离心4分钟,此时0.5ml EP管中的胶条已经离心至1.5ml的EP管中,呈细小的胶粒状。

  (5)弃掉0.5ml EP管,向胶粒中加入200μl无DNA酶水并且用手指轻弹管壁混匀。

  (6)将EP管置于70℃金属浴中孵育10分钟。

  (7)使用中等强度的涡旋振荡器混匀30秒,瞬离以使管壁上的液体离心至管底。

  (8)将1ml的枪头尖端去掉,用其吹打混匀胶溶液,将胶溶液转移到含有离心柱的离心管中。

  (9)室温20,000g离心3分钟,弃掉离心柱,收集离心液。

  (10)将3个PCR重复的离心液合在一起并吹打混匀,体积约为600μl。

  (11)向合在一起的离心液中加入25μl的5M NaCl并且混匀,然后加入12μlGlycogene(Invitrogen;10814-010)和750μl异丙醇并混匀。在-20℃孵育大于等于1小时。

  (12)4℃20,000g离心30分钟,在管底可见小的白色DNA团块。

  (13)去除上清并且使用750μl冷的80%(体积比)乙醇清洗团块。

  (14)4℃20,000g离心样品并且将乙醇去除干净。

  (15)室温风干DNA团块约10分钟,此时DNA团块颜色变淡呈胶状。

  (16)加入15μl无DNA酶水,吹打15下左右以重悬DNA,得到胶回收产物。

  9.3胶回收产物使用pClone007 Blunt Simple Vector Kit(北京擎科新业生物技术有限公司;TSV-007BS)连接到载体上,转化至TreliefTM 5α感受态细胞(北京擎科新业生物技术有限公司;TSC01)后挑选克隆测序。

  10.超声打断

  将5’末端和3’末端二链cDNA合并,转移到1.5ml Bioruptor打断管,使用Bioruptor Pico超声打断仪按照程序(on/off cycle time为30”/30”,13Cycle number)进行打断,片段大小为200bp。

  11.Ampure Beads纯化打断后二链cDNA

  (1)将120μl(1.2X)的Ampure XP磁珠加入到100μl打断后的二链cDNA,通过涡旋振荡或者多次上下吹打充分混匀。

  (2)室温静置15分钟以将DNA结合到磁珠上。

  (3)将含有磁珠的样品放于磁力架上,静置5分钟或直到溶液变澄清。

  (4)移液枪吸出上清液,加入500μl新鲜制备的80%EtOH(乙醇,体积分数85%),清洗两次。清洗时保证样品管始终在磁力架上,每次清洗时,常温孵育≥30秒。

  (5)第二次清洗后,略微旋转样品管,重新放回磁力架上,用10μl移液枪去除残余的EtOH,室温5-10分钟晾干或者直到酒精被完全蒸发。

  (6)加入27μl Nuclease-free H2O,吸打或简单涡旋混合。室温孵育2分钟以从磁珠上洗脱打断后的二链cDNA。

  (7)将样品管放回磁力架上5分钟至溶液澄清,小心吸取25μl上清至一个新的Nuclease-free PCR管中。

  12.文库构建(KAPA Biosystems;KK8504):

  12.1末端修复和加尾反应

  (1)在PCR管中进行下列操作

  

  (2)轻轻涡旋震荡,冰浴,立刻转移到PCR仪上立即进行孵育(20℃,30min;65℃,30min;4℃,∞),得到末端修复和加尾反应产物。

  12.2接头连接

  (1)在上述的末端修复和加尾反应管中配制接头连接反应液:

  

  (2)完全混匀,瞬时离心,20℃孵育15分钟,得到加接头产物。

  12.3连接后纯化

  (1)44μl(0.8X)的Ampure XP磁珠加入到加接头产物中,通过涡旋振荡或者多次上下吹打充分混匀。

  (2)室温静置15分钟以将DNA结合到磁珠上。

  (3)将含有磁珠的样品放于磁力架上,静置5分钟或至溶液变澄清。

  (4)移液枪吸出上清液,加入200μl新鲜制备的80%EtOH(乙醇,体积分数85%)清洗两次。清洗时保证样品管始终在磁力架上,每次清洗时,常温孵育≥30秒。

  (5)第二次清洗后,略微旋转样品管,重新放回磁力架上,用10μl移液枪去除残余的EtOH,室温5-10分钟晾干或者直到酒精被完全蒸发。

  (6)加入18μl Nuclease-free H2O,吸打或简单涡旋混合。室温孵育2分钟以从磁珠上洗脱DNA。

  (7)将管子放回磁力架上5分钟至溶液澄清,小心吸取16μl上清至新的PCR管中,得到纯化后的加接头产物。

  12.4文库扩增

  (1)在PCR管中配制扩增体系:

  

  (2)完全混匀,瞬时离心,按如下程序进行PCR反应。预变性:98℃1min;11个循环(变性:98℃15sec;退火:60℃30sec;延伸:72℃30sec);终延伸:72℃5min;保存:10℃∞min。得到PCR产物。

  12.5选择文库

  PCR产物跑E-gel,选取200bp-700bp片段大小使用Zymoclean Gel DNA RecoveryKit(Zymo Research;D4008)进行胶回收,具体如图3所示,其步骤如下:

  (1)按照3倍胶体积加入ADB,55℃金属浴,约每2分钟颠倒混匀一次,直至凝胶全部溶解。

  (2)全部液体转移至吸附柱中,室温,12,000g离心1分钟。

  (3)倒去液体,加入200μl DNA wash buffer,室温,12,000g离心30秒。

  (4)倒去液体,重复步骤(3)一次。

  (5)将吸附柱置于收集管中,加入14μl DNA Elution buffer,室温,12,000g离心1分钟,弃掉吸附柱,测浓度,-20℃保存。

  13.高通量测序

  13.1使用Hiseq-PE150测序策略对文库进行测序,数据量约为2G。

  13.2生物信息分析

  分析流程包括:质量控制、序列比对、BLAT检验比对结果。

  (1)质量控制

  质量控制包括文库质量分析以及清除接头序列,使用软件为FastQC v0.11.5和cutadapt version 1.8.dev0。图4和图5为应用FastQC v0.1对文库质量分析结果。图4为下机原始数据的基本信息。图5为下机数据fastq文件内所有碱基的质量值(a为reads1所有碱基的质量值,b为reads2所有碱基质量值)。

  (2)序列比对

  使用软件Bowtie2 version 2.1.0及Samtools 0.1.19-44428cd对下机数据进行比对,搜索RNA-seq获取的全新短片段及其邻近序列。结果为,高通量测序获得的未知RNA3’末端cDNA序列(SEQ ID NO.7)为:AAAGAAACAATCACACCCAATTCTATTTAGGTAAGCCAGTGACTTTATTGGGGTTACTTACAGGAGTGTGGATGACGCAAAGGTGGATGTACCACTGAAAAGCCCACCCCAGCATGGTGATGACTCATGAAAGCGGAATCCCTGGCATAC。高通量测序获得的未知RNA 5’末端cDNA序列(SEQ IDNO.8)为:TGATGTACTATCTGAGACATTTGTGCTTCCCCCCATCCAGCTATCAGGCTGTTAGGCAATGCACTTCTAGGAATTAGAATTCTATAAGGAATCTCATGCTGGAAGAACAAAAAGACCCAGGTAGTACATCAAGAACACAGTTCCCTG。

  (3)BLAT检验比对结果

  在UCSC平台使用BLAT工具检验下机数据比对结果,并对比对结果进行可视化,结果如图6和图7所示。图6划线部分为高通量测序获得的未知RNA 3’末端cDNA序列及在UCSC平台使用BLAT工具对其进行检验的结果。

  图7划线部分为高通量测序获得的未知RNA5’末端cDNA序列及在UCSC平台使用BLAT工具对其进行检验的结果。可见,高通量测序获得的未知RNA 5’末端cDNA序列中序列(SEQ ID NO.9):tagtacatcaagaacacagttccctg未比对到基因组上,推测是由于未知RNA存在不同转录本。BLAT检验结果显示,高通量测序获得的未知RNA 5’末端cDNA序列中未检测到的序列(SEQ ID NO.10)为:ggcaggaatgaagatattctaag。具体实施例9中对5’末端和3’末端二链cDNA中RNA-seq获取的全新短片段的克隆测序鉴定结果已证实此未检测到的序列为内含子序列。

  综上,图8划线部分为高通量测序获得的未知RNA全长cDNA序列及在UCSC平台使用BLAT工具对其进行检验的结果。BLAT检验结果显示,高通量测序获得的未知RNA全长cDNA序列中未检测到的序列(SEQ ID NO.11)还包括:tctctgttcctaaatttctggtgccataattcagggaactgtgttct。因已获得未知RNA 5’末端序列,且此未检测到的序列包含在5’末端序列和5’末端反转录起始位点之间,由此可推测其包含在未知RNA的cDNA序列中。对此未检测到的序列进行克隆测序鉴定,所用反转录试剂盒为HiScript III SuperMix for qPCR(+gDNAwiper)(南京诺维赞生物技术公司;R323-01)。上游引物序列(SEQ ID NO.12)为:GTACCACTGAAAAGCCCACC,下游引物序列(SEQ ID NO.13)为:AAGTGCATTGCCTAACAGCC,片段大小为177bp。PCR结果如图9,克隆测序结果证实此未检测到的序列包含在未知RNA的cDNA序列中。

  最终,高通量测序调取的未知RNA全长cDNA序列(SEQ ID NO.14)为:AAAGAAACAATCACACCCAATTCTATTTAGGTAAGCCAGTGACTTTATTGGGGTTACTTACAGGAGTGTGGATGACGCAAAGGTGGATGTACCACTGAAAAGCCCACCCCAGCATGGTGATGACTCATGAAAGCGGAATCCCTGGCATACTCTCTGTTCCTAAATTTCTGGTGCCATAATTCAGGGAACTGTGTTCTTGATGTACTATCTGAGACATTTGTGCTTCCCCCCATCCAGCTATCAGGCTGTTAGGCAATGCACTTCTAGGAATTAGAATTCTATAAGGAATCTCATGCTGGAAGAACAAAAAGACCCAGGTAGTACATCAAGAACACAGTTCCCTG,长度为344bp。

  高通量测序调取的未知RNA全长序列(SEQ ID NO.15)为:CAGGGAACUGUGUUCUUGAUGUACUACCUGGGUCUUUUUGUUCUUCCAGCAUGAGAUUCCUUAUAGAAUUCUAAUUCCUAGAAGUGCAUUGCCUAACAGCCUGAUAGCUGGAUGGGGGGAAGCACAAAUGUCUCAGAUAGUACAUCAAGAACACAGUUCCCUGAAUUAUGGCACCAGAAAUUUAGGAACAGAGAGUAUGCCAGGGAUUCCGCUUUCAUGAGUCAUCACCAUGCUGGGGUGGGCUUUUCAGUGGUACAUCCACCUUUGCGUCAUCCACACUCCUGUAAGUAACCCCAAUAAAGUCACUGGCUUACCUAAAUAGAAUUGGGUGUGAUUGUUUCUUU,长度为344nt。

  可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及本发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

  序列表

  <110> 中国农业科学院基因组研究所

  <120> 一种高通量测序调取未知RNA全长序列的方法

  <160> 15

  <170> SIPOSequenceListing 1.0

  <210> 1

  <211> 149

  <212> DNA

  <213> RNA-seq获取的全新短片段序列( mouse embryonic stem cells)

  <400> 1

  ctggtgccat aattcaggga actgtgttct tgatgtacta tctgagacat ttgtgcttcc 60

  ccccatccag ctatcaggct gttaggcaat gcacttctag gaattagaat tctataagga 120

  atctcatgct ggaagaacaa aaagaccca 149

  <210> 2

  <211> 149

  <212> RNA

  <213> RNA-seq获取的全新短片段的RNA序列( mouse embryonic stem cells)

  <400> 2

  ugggucuuuu uguucuucca gcaugagauu ccuuauagaa uucuaauucc uagaagugca 60

  uugccuaaca gccugauagc uggauggggg gaagcacaaa ugucucagau aguacaucaa 120

  gaacacaguu cccugaauua uggcaccag 149

  <210> 3

  <211> 20

  <212> DNA

  <213> 5'末端基因特异反转录引物GSP1序列(Synthetic sequence)

  <400> 3

  ctggtgccat aattcaggga 20

  <210> 4

  <211> 22

  <212> DNA

  <213> 3'末端基因特异反转录引物GSP2序列(Synthetic sequence)

  <400> 4

  ggatcttcac gtaacggatt gt 22

  <210> 5

  <211> 20

  <212> DNA

  <213> 克隆测序鉴定5'末端和3'末端二链cDNA中含有RNA-seq获取的全新短片段,上游引物序列(Synthetic sequence)

  <400> 5

  ctggtgccat aattcaggga 20

  <210> 6

  <211> 22

  <212> DNA

  <213> 克隆测序鉴定5'末端和3'末端二链cDNA中含有RNA-seq获取的全新短片段,下游引物序列(Synthetic sequence)

  <400> 6

  cctagaagtg cattgcctaa ca 22

  <210> 7

  <211> 150

  <212> DNA

  <213> 高通量测序获得的未知RNA 3'末端cDNA序列(mouse embryonic stem cells)

  <400> 7

  aaagaaacaa tcacacccaa ttctatttag gtaagccagt gactttattg gggttactta 60

  caggagtgtg gatgacgcaa aggtggatgt accactgaaa agcccacccc agcatggtga 120

  tgactcatga aagcggaatc cctggcatac 150

  <210> 8

  <211> 147

  <212> DNA

  <213> 高通量测序获得的未知RNA 5'末端cDNA序列(mouse embryonic stem cells)

  <400> 8

  tgatgtacta tctgagacat ttgtgcttcc ccccatccag ctatcaggct gttaggcaat 60

  gcacttctag gaattagaat tctataagga atctcatgct ggaagaacaa aaagacccag 120

  gtagtacatc aagaacacag ttccctg 147

  <210> 9

  <211> 26

  <212> DNA

  <213> 高通量测序获得的未知RNA 5'末端cDNA序列中未比对到基因组上的序列(mouse embryonic stem cells)

  <400> 9

  tagtacatca agaacacagt tccctg 26

  <210> 10

  <211> 23

  <212> DNA

  <213> 高通量测序获得的未知RNA 5'末端cDNA序列中未检测到的已证实为内含子的序列(mouse embryonic stem cells)

  <400> 10

  ggcaggaatg aagatattct aag 23

  <210> 11

  <211> 47

  <212> DNA

  <213> 高通量测序获得的未知RNA全长cDNA序列中未检测到的序列(mouse embryonicstem cells)

  <400> 11

  tctctgttcc taaatttctg gtgccataat tcagggaact gtgttct 47

  <210> 12

  <211> 20

  <212> DNA

  <213> 克隆测序鉴定高通量测序获得的未知RNA全长cDNA序列中未检测到的序列,上游引物序列(Synthetic sequence)

  <400> 12

  gtaccactga aaagcccacc 20

  <210> 13

  <211> 20

  <212> DNA

  <213> 克隆测序鉴定高通量测序获得的未知RNA全长cDNA序列中未检测到的序列,下游引物序列(Synthetic sequence)

  <400> 13

  aagtgcattg cctaacagcc 20

  <210> 14

  <211> 344

  <212> DNA

  <213> 高通量测序调取的未知RNA全长cDNA序列(mouse embryonic stem cells)

  <400> 14

  aaagaaacaa tcacacccaa ttctatttag gtaagccagt gactttattg gggttactta 60

  caggagtgtg gatgacgcaa aggtggatgt accactgaaa agcccacccc agcatggtga 120

  tgactcatga aagcggaatc cctggcatac tctctgttcc taaatttctg gtgccataat 180

  tcagggaact gtgttcttga tgtactatct gagacatttg tgcttccccc catccagcta 240

  tcaggctgtt aggcaatgca cttctaggaa ttagaattct ataaggaatc tcatgctgga 300

  agaacaaaaa gacccaggta gtacatcaag aacacagttc cctg 344

  <210> 15

  <211> 344

  <212> RNA

  <213> 高通量测序调取的未知RNA全长序列(mouse embryonic stem cells)

  <400> 15

  cagggaacug uguucuugau guacuaccug ggucuuuuug uucuuccagc augagauucc 60

  uuauagaauu cuaauuccua gaagugcauu gccuaacagc cugauagcug gaugggggga 120

  agcacaaaug ucucagauag uacaucaaga acacaguucc cugaauuaug gcaccagaaa 180

  uuuaggaaca gagaguaugc cagggauucc gcuuucauga gucaucacca ugcuggggug 240

  ggcuuuucag ugguacaucc accuuugcgu cauccacacu ccuguaagua accccaauaa 300

  agucacuggc uuaccuaaau agaauugggu gugauuguuu cuuu 344

《一种高通量测序调取未知RNA全长序列的方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)