欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种RNA高通量测序文库的构建方法独创技术28923字

一种RNA高通量测序文库的构建方法

2021-03-25 19:19:26

一种RNA高通量测序文库的构建方法

  技术领域

  本发明涉及分子生物学领域,具体而言,涉及一种不带poly(A)尾的RNA的高通量测序文库的构建方法,特别涉及微量样品如外泌体及细胞外囊泡中低起始量RNA的高通量测序文库的构建。

  技术背景

  小分子RNA(small RNA)是一大类调控分子,存在于几乎所有的生物体中,其长度一般为18-40个核苷酸(nucleotide,nt)。自1993年首次在秀丽线虫(Caenorhaditselegans)中发现small RNA后,人们越来越多地意识到small RNA的重要作用。它们以不同于“经典RNA”的作用方式,参与基因表达与调控、RNA的加工与剪切、蛋白质翻译、遗传“入侵”抑制、配子发生等生物学过程,在基因表达、生物个体发育、代谢及疾病的发生等生理过程起着重要的作用。根据小RNA的分子特征,可以为为4类:微小RNA(microRNA,miRNA)、piRNA(piwi-associated RNA)、小干扰RNA(small interfering RNA,siRNA)和核仁小RNA(snoRNA,small nucleolar RNA),其中miRNA的研究较多,进展最快。

  作为典型的线性的不带poly(A)尾的RNA,miRNA是一类长度为19-25nt的小分子RNA,最早在线虫中发现。lin-4和let-7这2种miRNA通过部分序列互补结合到靶mRNA的3’非编码区,调控线虫发育过程。在高通量测序技术诞生之前,miRNA的发现和研究速度一直较慢,这是由于传统的Sanger测序法操作复杂,花费大,测序深度有限,效率较低。自2005年以来,高通量测序技术被广泛用来发掘miRNA。高通量测序技术具有速度快、成本低、覆盖度深、产出巨大等优点,因此非常适合miRNA测序,尤其是对那些拷贝数低的miRNA。截止2016年12月,Sanger microRNA序列数据库miRBase(http://www.mirbase.org/)已经收录2800多种miRNA,其中人类成熟体miRNA有2500多种。研究表明,miRNA的异常表达与特定的癌症、疾病的发生和发展相关。在肿瘤研究领域,利用高通量测序手段,对miRNA的表达谱进行分析,寻找某些肿瘤中可能出现异常表达的miRNA,就可能找到作为肿瘤诊断和预后判断的新型生物标志物。当前,以高通量测序技术结合生物信息学分析已成为研究miRNA的一个非常重要的手段。

  与线性RNA相比,环状RNA(circular RNA,circRNA)受到的关注比较少,也比较难于研究。环状RNA是一类具有特殊未知功能的RNA,而且是客观大量存在的。环状RNA由前体RNA通过剪切,然后由线性RNA的头对尾连接形成。环状RNA很难与其它RNA区分开,扩增或片段化会破坏RNA环,而且早期RNA测序的分析算法会过滤掉环状RNA的标志性序列。由于技术和方法学问题,环状RNA一直被视为是罕见的剪切错误,从而把这部分客观存在的RNA忽略了。随着深度RNA测序及规模化生物信息技术的发展,研究者才真正发现在生物体内大量存在环状的RNA分子,环状RNA由于形成闭合的环状,在生物体内非常的稳定。

  在生物信息学、生化分析和深度测序的帮助下,研究者们对这些神秘分子有了空前的认识。对于环状RNA的功能,目前有几种假定的说法:(1)环状RNA可以作为“sponge”海绵吸miRNA,抑制其功能;(2)环状RNA通过碱基互补配对直接调控其他RNA水平;(3)环状RNA能与蛋白质结合,抑制蛋白质活性、募集蛋白质复合体的组分或调控蛋白质的活性;(4)环状RNA也可作为翻译的模板指导蛋白质的合成。在对circRNA结构和功能研究的基础上,有研究人员发现它们在动脉粥样硬化、神经系统紊乱、糖尿病和肿瘤等疾病发生过程中都发挥非常重要的作用。对环状RNA研究具有重要的意义:(1)环状RNA独具的竞争性内源(ceRNA)特征可为药物开发提供新的思路;(2)环状RNA的组织特异性和稳定性有可能使circRNA成为一种良好的生物标志物;(3)环状RNA的研究为生命的进化研究提供新的方向。

  目前对于不带poly(A)尾的RNA高通量测序文库构建方法主要有两种,即随机引物法和接头连接法。第一种随机引物法是将RNA利用随机引物逆转录成cDNA,然后合成双链的DNA,加上接头,从而完成文库的构建。这种方法虽然简单,但是在文库构建的过程中,容易导致小片段的RNA丢失。第二种方法是接头连接法,这种方法也是目前主流建库试剂盒所采用的方法。该方法是在去磷酸化RNA的3’端加上RNA接头,再对连接产物的5’端进行磷酸化处理,使其加上5’端的RNA接头,然后进行逆转录反应以及PCR扩增,从而完成文库的构建。该方法的主要问题是接头之间容易发生自连,从而会影响后续的测序数据的质量和产出。此外,该建库方法对RNA的起始量通常要求较高,一般要求在10ng以上。然而,在液体活检领域,体液来源的RNA含量通常都比较低,利用常规RNA建库方法常常需要相当多的体液样品。例如,利用传统的基于接头连接的RNA建库方法,全血样品至少需要10ml才能满足建库要求。因此,传统的建库方法的灵敏度已无法满足此类低丰度RNA的建库要求。液体活检领域亟待一种高灵敏度特别是能适用于所有不带poly(A)尾RNA的高通量测序文库构建方法。

  发明内容

  针对现有技术中存在的对不带poly(A)尾的RNA进行建库测序灵敏度及有效率均较低的问题,尤其是无法高效地对外泌体及细胞外囊泡等微量样品中不带poly(A)尾的RNA进行建库的问题,本发明提供了一种能针对获所有的不带poly(A)尾的RNA,并对其高效构建测序文库的方法。

  本发明所述的RNA高通量测序文库的构建方法包括以下步骤:(1)进行末端延伸反应,使poly(A)-RNA在其3’末端延伸出一段序列;(2)进行连接反应,使上述RNA在其5’端连接上接头R5A,得到RNA连接产物;(3)对上述RNA连接产物进行纯化;(4)利用特异的逆转录引物RTP对上述纯化后的RNA连接产物进行逆转录反应,获得相应的cDNA一链;(5)进行PCR扩增富集,即得到高通量测序文库。图1示意了利用该发明方法进行RNA高通量测序文库构建的流程图。

  在该方法中,RNA在经过末端延伸反应后,其3’端为一段同聚物。该同聚物由A、T、C、G或U这五种碱基中的任意一种组成,优选地为碱基A。本发明中的末端延伸法理论上可以无偏差地使所有RNA在3’端都延伸出一段同聚物,因此可以完整地、准确地反应样品中RNA转录本的真实状态。

  在该方法中,5’端接头R5A由两段序列构成:位于5’端的特异序列和位于3’端的唯一识别序列。其中,5’端特异序列为高通量测序平接头的3’端序列或完整全长序列;3’端唯一识别序列为由A、T、C和G这四种碱基组成的随机序列,长度为5nt。特别地,在该方法中,由于R5A的5’端是未经磷酸化修饰的,且连接反应体系中没有3’端接头,因此不会造成接头之间的自连,从而可以避免对测序数据质量的影响。此外,R5A 3’端含有一段连续的随机序列,一方面可以作为唯一识别序列,便于在后续数据分析时剔除PCR偏差带来的影响,另一方面还可以在一定程度上提高其与RNA之间的连接效率。更进一步地,R5A序列包含Seq IDNo:1。

  在该方法中,逆转录引物RTP由5’端的特异序列和3’端的特异序列两部分序列构成。其中,5’端特异序列为高通量测序平接头的3’端序列或完整全长序列;3’端的特异序列由RNA连接产物捕获序列和锚定序列两部分组成。RTP中的RNA连接产物捕获序列与上述RNA的3’端延伸序列相互补,该捕获序列的长度为2-50nt,优选地为10-30nt。锚定序列的第1位碱基(从5’端到3’端方向)为不与RNA 3’端同聚物互补的简并碱基;第2位碱基到3’最末端为由A、T、C和G这4种碱基组成的随机序列,序列长度为1-5nt,优选地为1-3nt,更优选地为1nt。更进一步地,RTP序列包含Seq ID No:2、Seq ID No:3、Seq ID No:4和Seq ID No:5等序列。

  在该方法中,用于文库扩增的PCR引物为高通量测序平台接头的5’端序列或完整全长序列。在PCR反应后,即可得到富集的、完整的测序文库。经过文库的片段筛选、纯化后和质检后即可进行上机测序。

  本发明方法的特征之一在于能够对不带poly(A)尾的RNA进行建库测序,覆盖所有不带poly(A)尾的RNA,包括线性RNA和环状RNA。线性的不带poly(A)尾的RNA可以直接利用本发明方法或者根据需要打断后进行高通量测序文库构建;非线性的RNA在进行打断后,可以利用该方法进行高通量测序文库构建。本发明方法的特征之二在于文库构建的灵敏度得到较大提升,对RNA起始量要求较少(起始量可低至1-10ng,甚至0.5-2ng),能够实现对外泌体和细胞外囊泡等微量样品中的RNA进行高通量测序文库的构建。

  附图说明

  下面结合附图对本发明的具体实施方式作进一步详细说明。

  构成本申请的一部分的说明书附图只是用来提供对本发明的进一步理解,并不构成对本发明的不当限定。在附图中:

  图1示意了利用该发明方法进行RNA高通量测序文库构建的流程图。

  图2示出了血浆外泌体的纳米颗粒跟踪分析仪检图。

  图3示出了血浆外泌体small RNA的生物芯片分析系统检测图;

  图4示出了miRNA文库的PAGE电泳结果(Ion Torrent平台)。M为20bp DNA ladder;1号泳道为阴性对照;2号泳道为起始量为10ng miRNA;3号泳道为起始量为2ng miRNA。

  图5示出了miRNA文库的生物芯片分析系统检测图(Ion Torrent平台)。(A)起始量为10ng miRNA的文库,(B)起始量为2ng miRNA的文库。

  图6示出了两种文库所鉴定的miRNA种类的文氏图(Ion Torrent平台)。(A)起始量为10ng miRNA所构建的文库,(B)起始量为2ng miRNA所构建的文库。

  图7示出了miRNA文库的PAGE电泳结果(Ion Torrent平台)。M为20bp DNA ladder;1号泳道为阴性对照;2号泳道为起始量为10ng miRNA所构建的文库;3号泳道为起始量为2ng miRNA所构建的文库。

  图8示出了片段化后的环状RNA的生物芯片分析系统检测结果(Ion torrent平台);

  图9示出了环状RNA文库电泳图谱(Ion Torrent平台)。M为20bp DNA ladder;1-2号泳道为本发明方法构建的文库,环状RNA起始量分别为50ng和10ng;3-4号泳道为NEB试剂盒法构建的文库,环状RNA起始量分别为50ng和10ng。

  图10示出了miRNA文库的PAGE电泳结果(Illumina平台)。M为20bp DNA ladder;1号泳道为阴性对照;2号泳道为起始量为10ng miRNA;3号泳道为起始量为2ng miRNA。

  图11示出了miRNA文库的生物芯片分析系统检测结果(Illumina平台)。(A)起始量10ngmiRNA所构建的文库,(B)起始量2ng miRNA所构建的文库。

  图12示出了两种文库所鉴定的miRNA种类(Ion Torrent平台)。(A)起始量10ngmiRNA所构建的文库,(B)起始量2ng miRNA所构建的文库。

  具体实施方式

  以下结合具体的实施例来进一步说明本发明的实施方式及增益效果,所举实例只用于解释本发明的有效性,并非用于限定本发明的使用和保护范围。

  实施例中所举测序平台只是用来演示本发明方法的通用性,并非用于限定本发明的使用和保护范围,本发明方法可以兼容所有高通量测序平台。

  实施例中所使用的实验方法和实验条件,如无特殊说明,均为常规方法和条件,或遵相应说明书选择。

  本发实施例中所述的室温系指室内常温,即20-30℃。

  下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

  实施例1

  本实例通过一种典型实施方式的血浆外泌体中的miRNA高通量测序文库构建过程为例,来描述本发明方法构建线性的不带poly(A)尾的RNA文库的原理和特征。在本实例中,接头与Ion Torrent测序平台相匹配,3’端末端同聚物由碱基A组成;逆转录引物中5’端的捕获序列由20个T碱基组成、锚定序列为VN(1)。

  本实例中涉及的相关序列:

  5’端接头R5A-1,CCTCTCTATGGGCAGTCGGTGATNNNNN;

  逆转录引物RTP-1,CCAUCUCAUCCCUGCGUGUCUCCGACT(20)VN(1)。

  1.血浆样本的收集及其外泌体的分离

  发明人于2016年5月在苏州大学第一附属医院收集了10ml的正常体检健康人的全血。全血样品装于EDTA-抗凝管,通过离心的方法分别分离了相应的血浆样本,血浆样品置于-80℃条件下保存或直接进入下一实验。

  从血浆样品中分离外泌体的具体操作为:

  1)完全冻融状态的血浆在4℃下2000×g离心20分钟,除去细胞;

  2)取上清移至新的离心管,4℃条件下16500×g离心30分钟,进一步除去细胞碎片;

  3)取上层液体转移至新的离心管,加入0.5倍体积的磷酸盐缓冲液,涡旋混匀;

  4)将样本经过0.22um一次性过滤器,去除大的囊泡,收集清液;

  5)将收集的清液在110000×g下离心70分钟,弃上清,再加入全血5倍体积的PBS溶液清洗沉淀,110000×g再次离心70分钟,弃除上清;

  6)用100ul磷酸盐缓冲液重悬全部沉淀,-20℃保存备用。

  7)取上述1ul外泌体重悬液,分别稀释1000倍后后,取1ml稀释液,利用纳米颗粒跟踪分析仪(Marlven公司,型号NS300)对外泌体进行检测,分析所分离的外泌体粒径及数量,具体检测结果如图2所示。

  2.外泌体中总RNA的提取

  1)将上述剩余的外泌体重悬溶液中加入2000μl TRIzol溶液,用力震荡至呈现均一液相,室温静置5分钟;

  2)加入氯仿400μl,用力振荡离心管,充分混匀,室温静置5分钟;

  3)4℃条件下,12000rpm高速离心15分钟后吸取上层水相到新的离心管中,注意不要吸到两层水相之间的蛋白质层。

  4)加入等体积的异丙醇,充分颠倒混匀,在-20℃条件下静置两小时;

  5)4℃条件下,12000rpm高速离心15分钟后小心弃掉上清液,加入1ml预冷的75%乙醇洗涤沉淀,4℃下7500rpm离心5分钟;

  6)弃去液体,室温下放置5分钟以充分晾干沉淀,加入20μl的不含RNA酶的无菌水进行溶解;

  7)利用生物芯片分析系统Bioanalyzer 2100配合Small RNA分析试剂盒(Agilent公司,货号5067-1548)检测总RNA中Small RNA纯度、浓度及片段分布情况,检测结果如图3所示。RNA样品置于冻存于-80℃保存或直接进入下一实验。

  3.利用本专利申请方法进行miRNA高通量测序文库构建

  分别以2ng和10ng的miRNA当量的上述RNA进行高通量测序文库的构建。

  1)RNA 3’端添加同聚腺苷酸序列

  配制如下反应体系:

  

  

  将上述反应液混合均匀,在恒温仪上进行如下反应:37℃5分钟然后65℃20分钟。

  2)连接5’端接头

  配制如下反应溶液:

  将上述反应液混合均匀,在恒温仪上执行以下程序:22℃60分钟。

  3)连接产物的纯化

  利用Oligo(dT)25磁珠(Thermo Fisher公司,货号61002)对连接产物进行纯化,并用5.5ul的不含RNA酶的无菌水进行洗脱。

  4)逆转录反应

  按下表配制连接反应液。

  将上述反应液混合均匀,在恒温仪上执行以下程序:42℃60分钟然后95℃3分钟。

  5)文库的扩增富集

  按下表配制连接反应液。

  将上述反应液混合均匀,在PCR仪上执行以下程序:98℃30秒预变性;98℃10秒、62℃30秒、72℃15秒,共15个循环;72℃60秒。

  4.文库PAGE电泳及纯化

  分别将本专利发明方法所构建的miRNA文库进行PAGE胶(6%)电泳,300V 1小时,待电泳结束后,回收纯化相应的目标条带。结果如图4所示,文库条带位于140bp附近,清晰明显,同预期一致。

  5.文库质检和高通量测序

  利用生物芯片分析系统Bioanalyzer2100配合高灵敏DNA分析试剂盒(Agilent公司,货号5067-4626)对文库的长度分布进行确定。结果如图5所示,文库长度分布同预期一致,浓度符合上机要求。

  利用高通量测序文库定量试剂盒:KAPA Library Quantification Kits(Kapa公司,货号KK4827)对文库的拷贝数进行确定,以确定测序上机量。利用Ion ProtonTM测序仪进行测序,按照每个文库10M raw reads的上样量进行测序。

  6.生物信息学分析

  1)原始数据质量评估和过滤处理

  利用FastQC、cutadapt、FASTX-Toolkit软件对测序原始数据进行质量评估和过滤处理。测序下机数据经过滤处理后的统计结果如表1所示,对于起始量为10ng和2ng miRNA的文库,两者在Clean Reads数和Q30比例这两个主要评估参数上结果相当。

  表1 原始数据质量统计结果

  

  (A)起始量为10ng miRNA的文库,(B)起始量为2ng miRNA的文库。

  2)比对参考序列

  利用Bowtie软件将序列同miRNA数据库miRBase和人类全参考基因组GRCh37(hg19)进行比对分析。结果如表2所示,对于miRNA起始量为10ng和2ng的文库,比对结果均达到理想水平。

  表2 clean reads比对结果统计

  

  (A)起始量为10ng miRNA的文库,(B)起始量为2ng miRNA的文库。

  3)文库之间的相关性分析

  两组文库之间的unique和overlapping miRNA相互关系如图6所示,对于建库起始量为10ng miRNA和2ng miRNA的文库,两种文库所鉴别出的miRNA在种类上具有较好一致性。pearson相关性分析如表3所示,上述两种文库的miRNA表达谱相似度较高。

  表3 miRNA文库的Spearson相关性分析(Ion Torrent平台)

  

  (A)起始量为10ng miRNA所构建的文库,(B)起始量为2ng所构建miRNA的文库。

  实施例2

  为例证本发明所述引物的有效范围,本实例仍以miRNA为例,所不同的是引物序列发生改变,其他条件均同实例实施例1。在本实例中,接头与Ion Torrent测序平台相匹配,逆转录引物中5’端的捕获序列由30个T碱基组成、锚定序列为VN(1)。

  本实例中涉及的相关序列:

  5’端接头R5A-2,CCTCTCTATGGGCAGTCGGTGATNNNNN;

  逆转录引物RTP-2,CCAUCUCAUCCCUGCGUGUCUCCGACT(30)VN(1)。

  1.血浆样本的收集及其中外泌体的分离同实例1。

  2.外泌体总RNA的提取同实例1。

  3.利用本专利申请方法进行miRNA高通量测序文库构建同实例1。

  4.文库PAGE纯化同实施例1。

  在本实施例的引物序列组合下,文库长度在150bp左右。经PAGE后的电泳结果如图7所示,条带位于150bp附近,同预期一致。

  实施例3

  本实例通过一种典型实施方式的血浆外泌体中的环状RNA的高通量测序文库构建过程为例,来描述利用本发明方法构建非线性的不带poly(A)尾的RNA文库的原理和特征。在本实例中,接头与Ion Torrent测序平台相匹配,3’端末端同聚物由碱基A组成;逆转录引物中5’端的捕获序列由20个T碱基组成、锚定序列为VN(1)。

  本实例中涉及的相关序列:

  5’端接头R5A-1,CCTCTCTATGGGCAGTCGGTGATNNNNN;

  逆转录引物RTP-1,CCAUCUCAUCCCUGCGUGUCUCCGACT(20)VN(1)。

  1.血浆样本的收集及其中外泌体的分离

  发明人于2016年5月在苏州大学第一附属医院收集了50ml正常体检健康人的全血,全血样品装于EDTA-抗凝管。全血中外泌体的方法和操作步骤同实施例1。

  2.外泌体中总RNA的提取

  方法和操作步骤同实施例1。

  3.去除上述RNA中的核糖体RNA

  采用核糖体RNA去除试剂盒:Ribo-Zero rRNA Removal Kit(Human,Mouse,Rat)试剂盒(Illumina公司,货号K1550-01)去除上述总RNA中的核糖体RNA,方法和步骤参照说明书进行,最后用20ul的无RNA酶水进行溶解。将上述去除核糖体RNA的RNA样品置于-80℃中保存备用或直接进入下一实验。

  4.去除总RNA中的poly(A)RNA

  1)充分混匀Oligo(dT)25磁珠(Thermo Fisher公司,货号61002),然后取30μl到1.5ml离心管中,置于磁力架上,静置3分钟,用枪头小心吸取丢弃上清液。

  2)加入100μl结合缓冲液充分吹打混匀,瞬时离心,在磁力架上,静置3分钟,用枪头小心吸取丢弃上清液。

  3)重复上述步骤一次。

  4)再加入50μl结合缓冲液,充分吹打混匀。

  5)将上述去除核糖体RNA的总RNA样品补无RNA酶水至50μl。

  6)将样品加入到上述Oligo(dT)25磁珠中,充分吹打混匀,65℃孵育5分钟,孵育结束后立刻置于冰上2分钟。

  7)混匀仪上室温孵育10分钟,瞬时离心,在磁力架上静置3分钟。

  8)将清液转移到另一个1.5ml离心管,使用无RNA酶水调整到180μl。加入18μl的3M的醋酸钠,2μl的糖原(10mg/ml),三倍体积的冰预冷的无水乙醇,轻微的涡旋混合,-20℃静置1个小时。4℃条件下16000×g离心30分钟,小心吸取丢弃上清液。待晾干后用20μl无RNA酶水溶解RNA沉淀,即得到了Poly(A)-RNA样品。

  5.然后进行RNase R消化

  利用RNase R(Epicentre公司,货号RNR07250)消化线性RNA。按下表配制反应体系:

  对上述20μl反应体系进行吹吸混匀,瞬时离心后置于37℃孵育1小时。消化结束后加20μL酚-氯仿-异戊醇(Thermo Fisher公司,货号15593-031),震荡混匀以终止消化,16000×g,4℃离心5分钟。弃上清,沉淀用6μL4M氯化锂,1μL糖原(10mg/ml),90μL预冷的无水乙醇颠倒重悬,-80℃沉淀1小时,16000×g,4℃离心30分钟,用预冷的75%乙醇洗涤两次。待晾干后用20μL无RNase酶水进行溶解,即得到了处理后的环状RNA样品。将上述环状RNA样品置于-80℃条件下保存或直接进入下一实验。

  6.RNA片段化

  利用NEB的RNA片段化试剂盒:RNase III RNA Fragmentation Module(NEB公司,货号E6146)对上述RNA进行片段化处理。按照下表建立RNA片段化体系:

  将上述反应液混合均匀,在恒温仪上37℃孵育5分钟,反应结束后加入10mM的EDTA终止反应。利用RNA纯化试剂盒(Qiagen公司,货号74204)进行纯化,用10μL的去RNA酶的水进行溶解,即得到片段化的RNA。利用生物芯片分析系统Bioanalyzer2100配合pico RNA芯片(Agilent公司,货号5067-1548)去除核糖体RNA后的总RNA样品进行检测。结果如图8所示,片段化后的环状RNA片段大小在200-300bp。将上述片段化后的RNA样品置于-80℃保存或直接进入下一实验。

  7.文库的构建

  分别以10ng和50ng的上述片段化后的环状RNA作为起始量进行高通量测序文库的构建。作为对比地,本实例中同时利用NEB的RNA建库试剂盒:NEBNext Ultra DirectionalRNA Library Prep Kit(NEB公司,货号E7420S)进行文库的构建,以同本发明的方法进行对比。

  8.文库的PAGE电泳和纯化同实施例1。

  结果如图9所示,本发明可以成功用于环状RNA的高通量测序的文库构建,本发明方法和NEB试剂盒所构建的文库条带均位于300bp至400bp位置处,为期望获得的条带范围。对于建库起始量为10ng的片段化的环状RNA样品,利用本发明方法构建的文库条带清晰,而利用NEB试剂盒所构建的文库条带微弱。

  实施例4

  为例证本发明方法的对高通量测序平台通用性和兼容性,本实施例仍以血浆外泌体中miRNA高通量测序文库构建过程为例,所不同的是接头替换成与Illumina测序平台的序列,其它条件均同实施例1所示。

  本实例中涉及的相关序列:

  5’端接头R5A-3,5’-CCUUGGCACCCGAGAAUUCCANNNNN;

  逆转录引物RTP-3,5’-CAGAGTTCTACAGTCCGACGATCT(20)VN(1)。

  1.血浆样本的收集及其外泌体的分离同实施例1。

  2.外泌体总RNA的提取同实施例1。

  3.利用本专利申请方法进行miRNA高通量测序文库构建同实施例1。

  4.文库PAGE纯化同实施例1。

  PAGE电泳后的结果如图10所示,文库条带位于140bp附近,均清晰明显,同预期一致。

  6.文库质检和高通量测序

  利用生物芯片分析系统Bioanalyzer2100配合高灵敏DNA分析试剂盒(Agilent公司,货号5067-4626)对文库的长度分布进行确定。结果如图11所示,文库长度分布同预期一致,浓度符合上机要求。

  利用高通量测序文库定量试剂盒:KAPA Library Quantification Kits(Kapa公司,货号KK4824)对文库的拷贝数进行确定,以确定测序上机量。利用Illumina测序仪进行测序,测序策略为HiSeq2500SE50,按照每个文库8M Raw Reads的上样量进行测序。

  7.生物信息学分析

  1)原始数据质量评估和过滤处理

  利用FastQC、cutadapt、FASTX-Toolkit软件对测序原始数据进行质量评估和过滤处理。测序下机数据经过滤处理后的统计结果如表4所示,对于起始量为10ng和2ng miRNA的文库,两者在Clean Reads数和Q30比例这两个主要评估参数上结果相当。

  表4 测序数据质量统计结果

  

  (A)起始量10ng miRNA所构建的文库,(B)起始量2ng miRNA所构建的文库。

  2)比对参考序列

  利用Bowtie软件将序列同miRNA数据库miRBase和人类全参考基因组GRCh37(hg19)进行比对分析。结果如表5所示,对于miRNA起始量为10ng和2ng的文库,比对结果均达到理想水平。

  表5 clean reads比对结果统计

  

  

  (A)起始量10ng miRNA所构建的文库,(B)起始量2ng miRNA所构建的文库。

  3)文库之间的相关性分析

  两组文库之间的unique和overlapping miRNA相互关系如图12所示,对于建库起始量为10ng miRNA和2ng miRNA的文库,两种文库所鉴别出的miRNA在种类上具有较好一致性。pearson相关性分析如表6所示,上述两种文库的miRNA表达谱相似度较高。

  表6 miRNA文库的Spearson相关性分析(Illumina平台)

  

  (A)起始量10ng miRNA所构建的文库,(B)起始量2ng miRNA所构建的文库。

  <110> 刘月星 李辉辉

  <120>一种RNA高通量测序文库的构建方法

  <141> 2016-12-10

  <160> 5

  <210> 1

  <211> 28

  <212> RNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (24)..(28)

  <223> n =a或g或c或t

  <400> 1

  cctctctatg ggcagtcggt gatnnnnn 28

  <210> 2

  <211> 33-80

  <212> DNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (32)..(80)

  <223> n =a或g或c或t,v =a或g或c

  <400> 2

  ccatctcatc cctgcgtgtc tccgact(5-50)vn(1-3) 33-80

  <210> 3

  <211> 33-80

  <212> DNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (32)..(80)

  <223> n =a或g或c或t,d =a或g或t

  <400> 3

  ccatctcatc cctgcgtgtc tccgact(5-50)dn(1-3) 33-80

  <210> 4

  <211> 33-80

  <212> DNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (32)..(80)

  <223> n =a或g或c或t,h =a或c或t

  <400> 4

  ccatctcatc cctgcgtgtc tccgact(5-50)hn(1-3) 33-80

  <210> 5

  <211> 33-80

  <212> DNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (32)..(80)

  <223> n =a或g或c或t,b =g或c或t

  <400> 5

  ccatctcatc cctgcgtgtc tccgact(5-50)bn(1-3) 33-80

《一种RNA高通量测序文库的构建方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)