欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 无参考基因组高通量简化甲基化测序文库的构建方法独创技术17392字

无参考基因组高通量简化甲基化测序文库的构建方法

2021-04-08 03:18:16

无参考基因组高通量简化甲基化测序文库的构建方法

  技术领域tt

  本发明涉及生物信息学技术领域,具体地说,涉及一种无参考基tt因组物种简化甲基化测序文库的构建方法。tt

  背景技术tt

  DNA甲基化是重要的表观遗传学修饰,在细胞发育和分化、调控tt基因表达、X染色体失活、基因沉默、疾病的发生等方面扮演着重要的tt角色,是目前新的研究热点之一。基于二代测序技术发展起来的DNAtt甲基化检测技术可以提供大量的高通量、全基因组DNA甲基化数据,tt极大地推动了表观遗传学研究的发展。重亚硫酸盐转换结合二代测序tt技术是目前最精准的DNA甲基化检测方法,能够检测单碱基水平的甲tt基化状态,被称为DNA甲基化检测的“金标准”。对基因组中未发生甲tt基化的胞嘧啶进行重亚硫酸盐处理,将其转换成U,经PCR扩增后变成ttT,重亚硫酸盐转换对甲基化的胞嘧啶不起作用;通过结合二代测序,tt即可绘制出单碱基分辨率的全基因组DNA甲基化图谱。目前常用的重tt亚硫酸盐转化结合二代测序技术的DNA甲基化检测技术有全基因组甲tt基化测序(Bisμlfite Sequencing,BS-seq)和简化代表性重亚硫酸盐tt测序(Reduced Representation Bisμlfite Sequencing,RRBS)。由于要确tt定甲基化的胞嘧啶的位点必须将重亚硫酸盐转化后的序列与参考基因tt组进行比较,因此,这两种技术目前只能用于人、小鼠、大鼠等有高tt质量参考基因组序列的物种,同时还存在着BS-seq建库成本高、RRBStt所需限制性内切酶MspI酶切效率低等问题。tt

  发明内容tt

  本发明的目的是提供一种无参考基因组高通量简化甲基化测序文tt库的构建方法。tt

  为了实现本发明目的,本发明的技术方案流程图见图1。tt

  具体地,本发明提供的无参考基因组高通量简化甲基化测序文库tt的构建方法,包括以下步骤:tt

  (1)将λDNA加入待测样品的基因组DNA中;用限制性内切tt酶对待测样品的基因组DNA酶切,获得5’末端具有磷酸化修饰的平tt末端DNA片段;添加碱基A,获得具有3’粘性末端A的DNA片段;tt

  (2)将步骤(1)获得的具有5’磷酸化和3’粘性末端A的DNAtt片段分别与含有不同条形码序列的甲基化接头相连,获得可以区分样tt品来源的连接产物;tt

  (3)纯化含有不同条形码的连接产物;将连接产物分为两份,一tt份作为对照组直接进行PCR扩增,另一份作为处理组经过重亚硫酸盐tt转化后再进行PCR扩增,获得两组含有相同条形码、仅在无甲基化的tt胞嘧啶位点不同的扩增产物序列;分别纯化两组PCR扩增产物,定量tt后混合每组的PCR扩增产物;将两组混合后的PCR扩增产物分别进tt行琼脂糖凝胶分离纯化,选择相同的特定长度片段序列,切胶回收;tt

  (4)特定长度片段的两组产物分别低循环PCR扩增,对目的片tt段范围内的序列进行富集;两组低循环扩增产物分别进行琼脂糖凝胶tt分离纯化,纯化产物构成简化甲基化测序文库。tt

  上述方法中,步骤(1)所述待测样品可以来自相同或不同的物种,tt样品数目≥1。tt

  其中,步骤(1)按照质量比1:1000将lamda噬菌体基因组DNAtt(λDNA)加入待测样品的基因组DNA中。λDNA为本领域已知的tt用于评估重亚硫酸盐转化效率的商品化DNA。tt

  本发明方法中,步骤(1)所述限制性内切酶是甲基化不敏感型tt限制性内切酶。甲基化不敏感型限制性内切酶酶切不完全率低,保证tt样品间酶切片段的一致性。本发明采用的限制性内切酶是一种平末端tt限制性内切酶,或多种平末端限制性内切酶的组合,其酶切产生的限tt制性片段是具有5’末端磷酸化修饰的平末端DNA片段。实施例中采tttttt用的限制性内切酶是平末端限制性内切酶HaeIII。tt

  本发明方法中,步骤(2)所述的含有不同条形码序列的甲基化接tt头是指接头序列中的胞嘧啶经过甲基化修饰且含有条形码序列。该含tt有不同条形码序列的甲基化接头可以通过商业途径购买得到。tt

  进一步地,步骤(2)的具有5’磷酸化和3’粘性末端A的DNAtt片段分别与含有不同条形码序列的甲基化接头的连接方法为混合体系tt置于20℃恒温金属浴孵育30min,65℃失活20min。本领域技术人员tt应当理解,连接反应的温度和时间根据所采用的连接酶来确定,并不tt局限于本申请所列的连接酶和连接的温度和时间等条件参数。tt

  本发明方法中,步骤(3)的PCR扩增所采用的引物与步骤(4)tt的低循环PCR扩增所采用的引物相同,均为根据步骤(2)的甲基化接tt头的序列设计得到。tt

  进一步地,本发明实施例中,步骤(3)和步骤(4)PCR扩增所tt采用的引物序列如SEQ ID NO.1-2所示。tt

  本发明方法中,步骤(3)所述的定量后混合每组的PCR扩增产tt物是根据测序深度的要求按照设定的质量比例将每组的PCR扩增产tt物进行混合;当待测样品数为1时,则无需混合。本领域技术人员应tt当理解,对于不同的测序深度的要求,可以按照本领域公知的设计原tt则,选择特定的质量比例将处理组和对照组中多个样品的PCR产物进tt行混合。tt

  本发明方法中,步骤(4)所述的低循环PCR是指循环数≤8的PCR。tt

  本发明的上述方法构建得到的高通量简化甲基化测序文库也属于tt本发明的保护范围。tt

  本发明提供了上述方法构建得到的高通量简化甲基化测序文库在tt高通量无参考基因组样品的甲基化状态研究中的应用tt

  本发明提供的高通量简化甲基化测序文库在后续应用时,通过比tt较处理组与对照组序列中均有的胞嘧啶位点,确定样品中的甲基化位tttttt点,分析这些位点及其周围区域的序列可以获得与遗传进化、生长发tt育相关的重要调控信息,为无参考基因组物种的表观遗传学提供研究tt基础。tt

  本发明具有下列优点及有益效果:(1)本发明采用了实验条件尽tt量一致的对照组和处理组平行操作,可以解决无参考基因组物种DNAtt甲基化研究的瓶颈;(2)使用了平末端限制性内切酶,该方法不需要tt片段随机打断和末端修饰,高度简化了文库准备步骤;(3)使用了酶tt切不完全率低的甲基化不敏感限制性内切酶和相同的切胶范围,保证tt了样品间所获得的测序片段的一致性;(4)对照组和重亚硫酸盐处理tt组中的对应样品使用了含有相同条形码序列的甲基化接头,且选择了tt相同的切胶范围,所获得的测序序列仅在无甲基化的胞嘧啶位点不同,tt保证了两组文库序列对应关系的一致性。tt

  附图说明tt

  图1为本发明构建无参考基因组高通量简化甲基化测序文库的流tt程图。tt

  图2为本发明实施例1PCR产物琼脂糖凝胶电泳图;图中PCK代表ttPCR反应阴性对照,1-9依次对应实施例1中的9个样品,JO2代表酶切连tt接反应的阳性对照,ECK代表酶切连接反应的阴性对照,所用Markertt为TaKaRa 100bp DNA Ladder。tt

  图3为本发明实施例1PCR纯化产物琼脂糖凝胶电泳图。;图中PCKtt代表PCR反应阴性对照,1-9依次对应实施例1中的9个样品,JO2代表酶tt切连接反应的阳性对照,ECK代表酶切连接反应的阴性对照,所用ttMarker为TaKaRa 100bp DNA Ladder。tt

  图4为本发明实施例1混合PCR纯化产物切胶前电泳图;所用ttMarker为NEB 50bp DNA Ladder。tt

  图5为本发明实施例1混合PCR纯化产物切胶后电泳图;所用ttMarker为NEB 50bp DNA Ladder。tt

  图6为本发明实施例1低循环PCR产物切胶前电泳图;图中1、2分tt别代表对照组和处理组。tt

  图7为本发明实施例1低循环PCR产物切胶后电泳图;图中1、2分tt别代表对照组和处理组。tt

  图8为本发明实施例1对照组文库质量控制检测图。tt

  图9为本发明实施例1处理组文库质量控制检测图。tt

  图10为本发明实施例1对照组文库测序产生的reads碱基质量得分tt(Quality score)图。tt

  图11为本发明实施例1处理组文库测序产生的reads碱基质量得分tt(Quality score)图。tt

  图12为本发明实施例1方法构建的高通量简化甲基化测序文库用tt于长苞冷杉甲基化水平研究所构建的进化树图。tt

  具体实施方式tt

  以下实施例进一步说明本发明的内容,但不应理解为对本发明的tt限制。在不背离本发明精神和实质的情况下,对本发明方法、步骤或tt条件所作的修改或替换,均属于本发明的范围。tt

  若未特别指明,实施例中所用的技术手段为本领域技术人员所熟tt知的常规手段。tt

  实施例1 无参考基因组高通量简化甲基化测序文库构建及其应用于tt长苞冷杉的表观遗传学进化分析tt

  本实施例选择长苞冷杉(Abies georgei)9个个体样品为实验材料,tt无参考基因组高通量简化甲基化测序文库构建包括如下步骤:tt

  1、长苞冷杉基因组DNA被稀释至100ng/μL(Nanodrop定量);tt

  2、基因组DNA片段化利用平末端限制性内切酶HaeIII对第一tt步稀释的基因组DNA进行酶切,酶切反应体系为:tt

  混合体系置于37℃恒温水浴孵育5小时。tt

  3、向第2步酶切反应产物中补加产生3’末端粘性A末端所需的tt反应试剂,包括:tt

  混合体系置于37℃恒温水浴孵育30min,75℃失活20min。tt

  4、向第3步加A反应产物中补加接头连接所需的反应试剂,包tt括:tt

  混合体系置于20℃恒温金属浴孵育30min,65℃失活20min。tt

  5、对上述连接产物进行过柱纯化,步骤如下:tt

  1)连接产物中300μL CP Buffer,混匀后转入吸附柱中;tt

  2)室温,10,000g离心1min,弃废液;tt

  3)加入700μL DNA Wash Buffer(确定已加入无水乙醇),室温,10,000ttx g离心1min,弃废液;tt

  4)室温,离心机最大相对离心力,离心2min;tt

  5)35μL Elution buffer洗脱,离心机最大相对离心力,离心1min,收tt集纯化产物。tt

  6、取上述纯化后连接产物20μL进行重亚硫酸盐转化(处理组),tt剩余未转化连接产物作为对照组。转化步骤如下:tt

  (1)向一管CT Conversion Reagent(EZ DNA Methylation-Gold ttkit)粉末中加入900μl ddH2O、300μl M-Dilution Buffer和50μl ttM-Dissolving Buffer,室温震荡10min;tt

  (2)取20μl纯化连接产物至0.2ml进口PCR管,加入130μltt的CT Conversion Reagent,充分混匀;tt

  (3)按如下程序反应:tt

  98℃      10mintt

  64℃      2.5htt

  反应产物中加入600μl的M-Binding Buffer,加入Zymo-Spin IC ttColumn,颠倒混匀,14000rpm离心30s,弃废液;加入100μl的M-Wash ttBuffer,14000rpm离心30s,弃废液;加入200μl的M-Desμlphonatio ttBuffer,室温静置17min,14000rpm离心30s;加入200μl的M-Wash ttBuffer,14000rpm离心30s,弃废液;重复此步骤一次;14000rpm,tt离心10sec;17μl的M-Elution Buffer洗脱DNA,静置1min,14000rpm,tt离心30sec,收集纯化产物。tt

  7、以上述对照组和处理组的连接产物为模板,进行PCR扩增,tt包括:tt

  对照组:tt

  PCR扩增循环条件为:tt

  处理组:tt

  PCR扩增循环条件为:tt

  取6μL PCR产物进行琼脂糖凝胶(1.8%)电泳检测,如图2所tt示。tt

  8、PCR产物磁珠纯化及检测,包括:取20μL PCR产物转入新tt的96孔板中,加入20μL AMPure XP磁珠,吹打混匀,室温静置5tt分钟。磁力架上静置5分钟,轻轻吸弃上清。加入100μL 80%乙醇缓tt慢吹吸清洗磁珠,磁力架上静置5分钟,轻轻吸弃上清。重复步骤3),tt这一步要将残留的乙醇吸干净。室温静置5分钟使乙醇尽量挥发干净。tt加入17μL Tris-HCl缓冲液,充分吹吸混匀,室温静置5分钟。磁力tttttt架上静置5分钟,将上清转入一个新的96孔板中。取3.5μL纯化产tt物进行琼脂糖凝胶电泳检测,结果如图3;取1.5μL纯化产物进行ttNanodrop定量。tt

  9、PCR纯化产物混合及切胶选片段,包括:对照组PCR纯化产tt物按照10∶10的质量比进行混合。处理组PCR纯化产物按照30∶30tt的质量比进行混合。分别取对照组和处理组600ng混合PCR纯化产物tt进行琼脂糖凝胶(2%)电泳分离(如图4),切取620bp-650bp的片段tt(如图5)。QIAquick Gel Extraction Kit纯化切胶片段,35μL Elution ttBuffer洗脱。tt

  10、低循环PCR扩增及二次切胶纯化,包括:以上述胶纯化片段tt产物为模板,进行低循环PCR扩增,包括:tt

  PCR扩增循环条件为:tt

  低循环PCR产物进行琼脂糖凝胶(2%)电泳分离(如图6),切取tt620bp-650bp的片段(如图7)。MinElute Gel Extraction Kit纯化切胶片tt段,30μL Elution Buffer洗脱,获得无参考基因组高通量甲基化测序tt文库。tt

  11、文库质量控制(Quality control)将第10步中获得的测序文tttttt库在Agilent 2100Bioanalyzer上进行质量检测,检测结果如图8和图tt9所示,对照组和处理组片段范围基本一致,构建得到无参考基因组tt高通量简化甲基化测序文库。tt

  12、测序将第11步中通过质检的文库稀释成适当浓度进行测tt序,测序平台为Illumina HighSeq2500,测序长度为双端126bp,测序tt产生的Reads碱基质量得分(Quality score)图见图10和图11;碱基tt质量得分是衡量测序质量的重要指标,质量得分越高代表碱基被测错tt的概率越小,纵坐标质量得分20和30分别代表碱基被测错的概率为tt1%和1‰;如图所示,每个位置质量得分超过30(即被测错的概率低tt于1‰)的碱基都占绝对优势。tt

  13、数据分析低质量数据过滤和数据质量评估:为了保证信tt息分析质量,对原始测序序列(Raw Reads)进行过滤,去掉含有带tt接头和低质量的Reads,并对得到的Clean Reads质量进行评估,统计tt结果见表1和表2。tt

  表1对照组样品测序数据评估统计tt

  表2甲基化组数据过滤统计表tt

  甲基化转换效率评估:利用噬菌体测序数据评估,结果如表3;tt从统计结果来看,转化效率正常。tt

  表3甲基化组数据过滤统计表tt

  参考基因组构造及序列比对:由于无参考基因组,因此为了识别tttttt甲基化位点,需要先用对照组9个样品的Clean Reads进行SLAF无参tt聚类,获得的SLAF标签作为参考基因组,结果见表4;处理组数据tt与参考SLAF标签进行比对,结果见表5。由于参考基因组为SLAFtt构造的,因此比对效率与有参考基因组的情况相比会偏低。tt

  表4 SLAF标签统计表tt

  表5比对结果统计tt

  C位点检测:根据处理组Clean Reads与参考SLAF标签的比对结tt果,提取胞嘧啶(C)位点的比对碱基信息,获得的C位点检测结果tt结果见表6【表中CpG、CHG和CHH(H=A,T or C)代表三种不同tt类型的C位点】;从统计结果来看,本申请所提供的方法可以有效检tt测无参考基因组样品中的不同类型的甲基化胞嘧啶位点。tt

  表6检测得到的C位点统计tt

  甲基化水平进化树分析:利用9个样本甲基化水平数据采用邻接法tt构建进化树;进化树的结果如图12。tt

  由此可以看出,利用本发明提供的方法获得的甲基化位点信息可tt以在无参考基因组的情况下构建出长苞冷杉的遗传进化关系,进而为tt长苞冷杉的表观遗传学进化研究提供重要依据。tt

  虽然,上文中已经用一般性说明及具体实施方案对本发明作了详tt尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本tt领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础tt上所做的这些修改或改进,均属于本发明要求保护的范围。tt

《无参考基因组高通量简化甲基化测序文库的构建方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)