欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 构建DNA甲基化文库的方法及其应用独创技术38241字

构建DNA甲基化文库的方法及其应用

2021-03-06 17:29:22

构建DNA甲基化文库的方法及其应用

  技术领域

  本发明涉及基因测序领域,具体涉及一种构建DNA甲基化文库的方法及其应用,尤其涉及一种构建DNA甲基化文库的方法,DNA甲基化检测方法及DNA甲基化检测试剂盒及其用途。

  背景技术

  循环肿瘤DNA(circulating tumor DNA,ctDNA)指通过肿瘤细胞坏死,细胞凋亡释放出的DNA进入血浆,并降解在循环血中的机体内源性DNA。循环核酸最早由Mandel和Metais于1947年发现,但由于缺乏高灵敏性和高特异性的实验方法,导致有关血中游离DNA与疾病相关性的研究在较长时期内进展缓慢。直到有效分离游离DNA技术的出现,特殊荧光染料与PCR技术相结合的检测技术的应用,使这一领域的研究在最近二十多年得到了较迅速发展。自发现血中游离DNA可含肿瘤细胞DNA相同基因突变后,应用分子生物学手段对循环游离核酸的研究兴趣日益增加,血中游离DNA在疾病的早期诊断、预后、监测等方面具有重要潜在价值。

  与组织活检相比,游离DNA(又称无细胞DNA,cfDNA)测序具有一些明显的优势。首先,与肿瘤活组织检查相比,无论哪个部位,采集外周血获得的cfDNA都是微创。其次,其可以在治疗过程中的任何时候采集血液,从而实时和动态地监测肿瘤中的分子变化,而不是依赖于侵袭性活检甚至成像的挑战。此外,对cfDNA的监测可能会检测到不明显或在成像时不确定的肿瘤(例如残余肿瘤切除后)。最后,ctDNA可能代表了患者恶性肿瘤的整个分子图像,而肿瘤活检可能受到肿瘤内异质性的影响。因此,循环肿瘤DNA能够对肿瘤的早期诊断、放化疗药物的疗效评估、肿瘤负荷和进展监测提供可靠的信息,具有无创、实时检测和早于影像学检查结果等优点,在肿瘤诊断、疗效监测和预后评估方面具有价值。

  DNA甲基化是一种控制基因表达的表观遗传调节因子,其通常导致基因沉默。肿瘤抑制基因甲基化修饰增加是许多肿瘤的早期事件,提示DNA甲基化模式的改变可能是与肿瘤发生相关的第一个可检测的肿瘤变化之一。而且与体细胞突变分析相比,DNA甲基化分析在癌症检测方面具有多项优势,包括更高的临床敏感性和动态范围,可以覆盖疾病中的许多甲基化靶区以及每个靶向基因组区域中多个改变的CpG位点。

  传统的全基因组亚硫酸盐测序(whole genome bisulfite sequencing,WGBS)技术是一种基于亚硫酸盐转化的DNA甲基化检测技术。这种传统的WGBS技术是对基因组DNA片段化后,末端修复加A,然后加上已知甲基化修饰序列的接头,通过重亚硫酸盐处理,将没有甲基化修饰C脱氨基成为U,再进行PCR扩增后转变为T,甲基化修饰的C则不变。最后将PCR得到产物进行测序。

  而目前针对ctDNA甲基化的检测技术比较少,最常见的方法是对一个或几个基因设计特定的引物对亚硫酸盐修饰后的产物进行PCR或者QPCR,进行定性或定量检测。比如SEPT9基因在肿瘤循环DNA中的甲基化情况检测。但这种方法,只能对某个靶向基因进行甲基化情况的定性或定量检测,在肿瘤的发生发展或者当中,并不是由一个共同的基因甲基化修饰情况所决定的。因此,为了获取更为精确更为全面的甲基化数据,仍然需要开发新的肿瘤细胞DNA甲基化检测技术。近年来,有一种新的甲基化CpG短串联扩增与测序用于循环游离DNA甲基化的检测。这种技术,通过对循环游离DNA进行BS处理后,选择性扩增甲基化CpG短串联CGCGCGG序列,随后对这些序列进行高通量测序分析。MCTA-Seq技术与以往的循环游离DNA检测技术相比,可以在一个反应中同时检测到近九千个CpG岛。但是,其缺点是只能够检测高甲基化修饰CpG位点,对于低甲基化修饰CpG位点或者CHG以及CHH位点的甲基化修饰情况则不能被检测到。DNA甲基化异常和肿瘤的发生、发展有着密切的关系,但是并不是只有高甲基修饰CpG区域才与肿瘤的发生,发展相关,低甲基化修饰区域以及其它区域如CHH和CHG区域的甲基化情况也可能与肿瘤发生,发展密切相关。

  然而,对于DNA甲基化的检测方法还有待进一步改进。

  发明内容

  本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种操作简便,省时省力的对DNA甲基化进行检测的方法,该方法通过构建DNA甲基化文库,对DNA甲基化文库测序,分析测序结果,获得DNA甲基化结果。

  本发明是基于发明人的如下发现所获得的:

  传统的全基因组亚硫酸盐测序技术存在两个问题:第一,建库所要求的起始量高(微克级别);第二,有效数据量低。由于亚硫酸盐转化包括变性、脱氨基和脱磺酸基,在这个过程中DNA先被变性成单链,然后将遭遇高温、高盐、酸性、碱性等环境,如过山车般遭受冰火两重天,最终状态好似经历千万年岁月洗礼的古DNA,表现为:单双链混合、出现缺刻、缺口损伤、含有dU核苷酸等。传统WGBS文库构建流程中,BS转化过程将导致大约90%的DNA模板丢失,是造成建库起始量高,有效数据量低的“罪魁祸首”。极不适合循环肿瘤DNA这种量少的样本的检测。

  为此,本发明提供了一种基于重亚硫酸盐转化的适合于样本量少的DNA甲基化检测的方法,尤其是适用于ctDNA甲基化检测的方法。

  根据本发明的第一方面,本发明提供了一种构建DNA甲基化文库的方法,包括:

  对DNA样本进行重亚硫酸盐转化处理,以便获得经过重硫酸盐转化后的单链DNA分子;通过线性扩增,在所述单链DNA分子的两端分别连接上第一接头序列和第二接头序列,以便获得将接头序列连接的DNA分子;利用所述经接头序列连接的DNA分子构建DNA甲基化文库。

  利用本发明的方法,来构建DNA甲基化文库,尤其可以适用于对ctDNA这种量比较少,而且片段化的DNA进行单碱基分辨率的全基因组甲基化分析,并具有操作简单,建库周期短的特点。而且通过该方法可以得到覆盖度广的检测结果,因此可以更为精确地获取肿瘤循环DNA甲基化数据,为筛选可靠的肿瘤甲基化标志物提供重要的手段。而且本发明的方法并不局限用于肿瘤循环DNA甲基化检测,也可应用于样本纯度、完整度较低且样本量少的DNA甲基化检测。

  根据本发明的实施例,以上构建DNA甲基化文库的方法可以进一步附加如下技术特征:

  在本发明的一些实施例中,所述第一接头序列和所述第二接头序列中均含有分子标签序列。

  在本发明的一些实施例中,所述分子标签序列为8~12nt随机核酸序列。

  在本发明的一些实施例中,所述分子标签序列为8~10nt随机核酸序列。

  在本发明的一些实施例中,所述第一接头序列和所述第二接头序列进一步含有PCR扩增互补序列。

  在本发明的一些实施例中,所述方法进一步包括:对所述单链DNA分子进行第一线性扩增,以便在所述单链DNA分子的一端连接上所述第一接头序列,获得连接有第一接头序列的DNA分子;对所述连接有第一接头序列的DNA分子进行第二线性扩增,以便在所述连接有第一接头序列的DNA分子的另一端连接上所述第二接头序列,获得所述经接头序列连接的DNA分子。通过两次线性扩增,在单链DNA的5’末端和3’末端分别引入接头序列,接头序列中含有随机核酸序列,可以同单链DNA进行随机配对,接头序列中还可以含有PCR扩增互补序列,可以用于后续PCR扩增富集,而且通过在单链DNA的两端连接上接头序列,还可以为后续环化成单链环以及测序提供基础。相对于指数扩增,本发明通过线性扩增可以避免了指数扩增带来的非特异性影响,保证了扩增的特异性,进而能够实现单碱基分辨率的全基因组甲基化分析,结果准确可信。。

  在本发明的一些实施例中,分别利用Klenow片段以及phi29DNA聚合酶进行所述第一线性扩增和所述第二线性扩增。

  在本发明的一些实施例中,将所述单链DNA分子和所述第一接头序列混合,在90~100摄氏度下反应2~5分钟,在30~35摄氏度下反应5~10分钟,然后加入Klenow片段和phi29DNA聚合酶,在30~35摄氏度下反应30~60分钟,得到连接有第一接头序列的DNA分子。

  在本发明的一些实施例中,将所述连接有第一接头序列的DNA分子和所述第二接头序列混合,在90~100摄氏度下反应2~5分钟,在30~35摄氏度下反应5~10分钟,然后加入Klenow片段和phi29DNA聚合酶,在30~35摄氏度下反应30~60分钟,得到所述经接头序列连接的DNA分子。

  在本发明的一些实施例中,所述DNA样本为ctDNA样本。

  在本发明的一些实施例中,向所述ctDNA中加入λDNA,然后进行重亚硫酸盐处理。当所述DNA样本为ctDNA样本时,由于ctDNA的含量通常比较少,仅在10ng左右,所以加入λDNA的目的是为了减少重亚硫酸盐处理时带来的损耗,增加目的DNA的回收率。

  在本发明的一些实施例中,所述ctDNA和所述λDNA的质量比为1:(20~50)。例如所述ctDNA和所述λDNA的质量比可以是1:20、1:25、1:30、1:35、1:40、1:45或1:50。在利用重亚硫酸盐处理试剂盒对目的DNA进行处理时,通常目的DNA的最佳范围是200ng-500ng,而ctDNA的含量通常在10ng左右,相应地加入约20~50倍的λDNA,能够减少重亚硫酸盐处理时对ctDNA带来的损耗,进而提高ctDNA回收效率。

  在本发明的一些实施例中,所述DNA的含量为1~15ng。例如所述DNA的含量可以是1ng、2ng、3ng、4ng、5ng、6ng、7ng、8ng、9ng、10ng、11ng、12ng、13ng、14ng或15ng,或上述数值之间的具体点值。优选地,所述DNA的含量为5~15ng。利用本发明的方法构建DNA甲基化文库,灵敏度高,DNA样本的含量可以低至1ng。在对肿瘤循环DNA(ctDNA)进行建库的过程中,ctDNA样本量在10ng左右,可以显著提高建库的效率。

  在本发明的一些实施例中,所述方法进一步包括:将所述经接头序列连接的DNA分子进行PCR扩增,以便得到PCR扩增产物;将所述PCR扩增产物变性为单链DNA,并将所述单链DNA环化成环状单链DNA。对经过第一接头序列和第二接头序列连接的DNA分子进行PCR扩增,获得大量PCR扩增产物,然后将PCR扩增产物高温变性为单链,在环化引物以及T4DNA连接酶以及ATP的作用下使得单链DNA环化成环状单链DNA。

  在本发明的一些实施例中,进一步包括,使用核酸外切酶消化未环化的单链DNA,得到可以用于上机测序的单链环状DNA文库。优选地,所述核酸外切酶为I或III型核酸外切酶。

  根据本发明的第二方面,本发明提供了一种DNA甲基化检测方法,包括:根据本发明第一方面任一实施例所述的方法构建DNA甲基化文库;对所述DNA甲基化文库进行测序,以便得到测序结果;对所述测序结果进行分析,以便获得DNA甲基化检测结果。

  在本发明的一些实施例中,使用单链环状文库测序平台进行所述测序;优选地,使用BGISEQ系列测序平台进行所述测序。

  根据本发明的第三方面,本发明提供了一种DNA甲基化检测试剂盒,所述试剂盒包括:重亚硫酸盐和λDNA。

  根据本发明的实施例,以上试剂盒可以进一步附加如下技术特征:

  在本发明的一些实施例中,所述试剂盒进一步包括:第一接头序列和第二接头序列,所述第一接头序列为SEQ ID NO:1,所述第二接头序列为SEQ ID NO:2。

  在本发明的一些实施例中,所述试剂盒进一步包括:PCR扩增引物序列,所述PCR扩增引物序列为SEQ ID NO:3和SEQ ID NO:4。

  在本发明的一些实施例中,所述试剂盒进一步包括:DNA环化引物,所述DNA环化引物可以实现单链DNA的环化,所述DNA环化引物的序列为SEQ ID NO:5。

  根据本发明的第四方面,本发明提供了一种试剂盒在肿瘤的检测和筛查领域中的应用。所述试剂盒为根据本发明第三方面所述的试剂盒。

  本发明所取得的有益效果为:本发明提供的DNA检测方法,将重亚硫酸盐处理的过程提前,能有效地在对重亚硫酸盐处理后的DNA片段上加上接头序列,避免了传统WGBS由于重亚硫酸盐转化导致模板丢失的缺点。同时可针对片段化,起始量低(低至ng级别)的DNA进行建库,尤其适合肿瘤细胞DNA甲基化检测。相比较于以往ctDNA甲基化的研究着重于部分靶向基因,或者是高甲基化区域的分析,而本发明中首次对ctDNA进行全基因组甲基化检测,覆盖的范围更广更全面。同时,本发明在重亚硫酸盐处理后,通过两轮线性扩增直接引入接头序列,省去了在扩增后再单独进行加接头的步骤,因此本发明具有节省时间,操作更为简单,便捷的优点。由于本方法具有单碱基分辨率特点,且能在覆盖更广的基因组范围内绘制出全基因组甲基化图谱,从中获得血浆游离DNA中更全面准确的甲基化信息,可为肿瘤检测筛选甲基化生物标志物提供可靠的数据。

  附图说明

  图1为根据本发明的实施例提供的样本1的甲基化率相关性分析图。

  图2为根据本发明的实施例提供的样本2的甲基化率相关性分析图。

  图3为根据本发明的实施例提供的对循环肿瘤DNA构建甲基化文库的技术路线图。

  具体实施方式

  下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

  根据本发明的一个方面,本发明提供了一种构建DNA甲基化文库的方法,包括:对DNA样本进行重亚硫酸盐转化处理,以便获得经过重硫酸盐转化后的单链DNA分子;通过线性扩增,在所述单链DNA分子的两端分别连接上第一接头序列和第二接头序列,以便获得经接头序列连接的DNA分子;利用所述经接头序列连接的DNA分子构建DNA甲基化文库。

  通过本发明同的构建DNA甲基化文库的方法,将重亚硫酸盐处理的过程提前,并能有效地在对重亚硫酸盐处理后的单链DNA片段上加上接头序列,可以避免传统WGBS由于重亚硫酸盐转化导致模板丢失的缺点,同时可针对片段化,起始量低的DNA进行建库,尤其适合肿瘤细胞DNA甲基化检测。由于本方法具有单碱基分辨率特点且能在覆盖更广的基因组范围内绘制出全基因组甲基化图谱,从中获得血浆游离DNA中更全面准确的甲基化信息,可为肿瘤检测筛选甲基化生物标志物提供可靠的数据。

  在本发明的一种具体实施方式中,所述第一接头序列含有长度为8~12nt的随机核酸序列;所述第二接头序列的长度为8~12nt的随机核酸序列。根据本发明的实施例,在将所述单链DNA分子纯化后,再分别在所述单链DNA分子的两端连接上第一接头序列和第二接头序列。

  在本发明的另一种具体实施方式中,所述第一接头序列和所述第二接头序列中均含有PCR扩增引物互补序列。第一接头序列和第二接头序列中含有PCR扩增引物互补序列,可以使得所述单链DNA分子的两端同时添加上PCR扩增引物互补序列,从而可以用于后续PCR的扩增,为后面的PCR富集做准备,也可以用于后续的环化处理成单链环以及测序。

  在本发明的一种具体实施方式中,所述方法还进一步包括:将所述单链DNA与所述第一接头序列混合,通过线性扩增以便得到第一扩增产物;将所述第一扩增产物与所述第二接头序列混合,通过线性扩增以便得到第二扩增产物。通过两轮线性扩增,可以在单链DNA模板上引入已知序列,操作步骤简单,快捷。例如可以在Klenow片段和phi29DNA聚合酶作用下,分别得到第一扩增产物和第二扩增产物。

  在本文中,“线性扩增”指的是将微量核酸通过线性化扩增予以放大。根据本发明的实施例,可以将所述单链DNA分子和所述第一接头序列混合,在90~100摄氏度下反应2~5分钟,在30~35摄氏度下反应5~10分钟,然后加入Klenow片段和phi29DNA聚合酶,在30~35摄氏度下反应30~60分钟,得到连接有第一接头序列的DNA分子。

  在本发明的另一种具体实施方式中,利用PCR扩增引物序列,对所述第二扩增产物进行PCR扩增。利用PCR扩增引物序列,实现对单链DNA分子的指数扩增,例如可以利用KAPAHiFi HotStart Uracil聚合酶进行所述扩增。

  根据本发明的另一种具体实施方式,所述构建DNA甲基化文库的方法还包括;将所述经接头序列连接的DNA分子进行PCR扩增,以便得到PCR扩增产物;将所述PCR扩增产物变性为单链DNA,并将所述单链DNA环化成环状单链DNA。根据本发明的实施例,利用高温将所述扩增产物变性为单链DNA,在环化引物、T4DNA连接酶(T4DNA Ligase)以及ATP作用下使单链DNA环化,得到环化产物。环化产物可以经过exo I和exo III作用下,得到可以上机测序的单链环状DNA文库。优选地,将所述PCR扩增产物经过磁珠纯化后,再变性成单链。所述单链环状DNA文库可以使用新一代测序仪进行高通量测序,最后进行DNA甲基化修饰状况分析。

  为此,本发明还提供了一种DNA甲基化检测方法,包括:根据本发明实施例提供的方法构建DNA甲基化文库;对所述DNA甲基化文库进行测序,以便得到测序结果;对所述测序结果进行分析,以便获得DNA甲基化检测结果。例如可以利用BGISEQ系列测序平台进行序列测定。在利用本发明的方法对人类的肿瘤情况进行检测和筛查时,在对测序数据进行分析时,可以参考序列hg19(已知的全基因组序列),先后经过滤、比对、甲基化分析等步骤。经过低质量及接头reads过滤后,例如可以使用BSMAP软件实现比对步骤(Yuanxin Xi,et al.,(2009).BSMAP:whole genome bisulfite sequence MAPping program.BMCBioinformatics,10:232)。BSMAP以SOAP(Li R,Li Y.,Kristiansen K.&Wang,J.(2008).SOAP:short oligonucleotide alignment program.Bioinformatics,24:713–714.)算法为基础,允许序列中的C和T比对到hg19基因组上的C,并通过HASH table seeding的方法加快比对过程。通过计数C位点上的支持C,T的reads数量即可得知序列甲基化信息,并以之为基础进行后续的比对信息分析。

  循环肿瘤DNA(circulating tumor DNA,ctDNA)指通过肿瘤细胞坏死,细胞凋亡释放出的DNA进入血浆,并降解在循环血中的机体内源性DNA。循环核酸最早由Mandel和Metais于1947年发现,但由于缺乏高灵敏性和高特异性的实验方法,导致有关血中游离DNA与疾病相关性的研究在较长时期内进展缓慢。直到有效分离游离DNA技术的出现,特殊荧光染料与PCR技术相结合的检测技术的应用,使这一领域的研究在最近二十多年得到了较迅速发展。循环肿瘤DNA(ctDNA)能够对肿瘤的早期诊断、放化疗药物的疗效评估、肿瘤负荷和进展监测提供可靠的信息,具有无创、实时检测和早于影像学检查结果等优点,在肿瘤诊断、疗效监测和预后评估方面具有价值。

  为此,根据本发明的一种具体实施方式,本发明提供了一种构建ctDNA甲基化文库的方法,包括:对ctDNA样本进行重亚硫酸盐转化处理,以便得到经过重硫酸盐转化后的单链DNA分子;通过线性扩增,在所述单链DNA分子的两端分别连接上第一接头序列和第二接头序列,以便获得两端经接头序列连接的DNA分子;利用所述两端经接头序列连接的DNA分子构建DNA甲基化文库。通过重亚硫酸盐转化ctDNA,可以使得无论是单链的ctDNA还是双链的ctDNA,均变成单链DNA,然后通过线性扩增将得到的单链DNA的5’末端和3’末端分别连接上第一接头序列和第二接头序列,所述第一接头序列和所述第二接头序列中均含有8~12nt随机核酸序列作为分子标签,实现同所述单链DNA分子的连接,得到两端经所述接头序列连接的DNA分子;最后利用所述两端经接头序列连接的DNA分子构建DNA甲基化文库。

  由于ctDNA的含量较少,为了减少重亚硫酸盐转化处理对于ctDNA损耗,将所述ctDNA和200ng~400ng片段化的λDNA混合,利用重亚硫酸盐转化处理。通过重亚硫酸盐转化处理,可以将非甲基化胞嘧啶转换为尿嘧啶。

  在本发明的另一种具体实施方式中,从血浆样本中提取得到所述ctDNA。根据本发明的实施例,通过对全血样本进行梯度离心处理,以便获取血浆样本。可以利用市面上已有的试剂盒从血浆样本中提取得到所述ctDNA。例如,可以使用游离核酸提取试剂盒(QIAampCirculating Nucleic Acid Kit)对血浆中循环肿瘤DNA进行提取。根据本发明的一些实施例,所述梯度离心包括:将全血样本在1600g~2500g条件下离心,分离得到第一上清;将所述第一上清在16000g~25000g条件下离心,分离获得第二上清,即为所述血浆样本。

  下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。

  实施例1

  该实施例通过利用肿瘤病人的血液样本获得循环肿瘤DNA,然后通过利用重亚硫酸盐转化处理,获得经重硫酸盐转化后的单链DNA分子;并通过线性扩增,分别在单链DNA分子的两端连接上接头序列;并利用经接头序列连接的DNA分子进行PCR扩增,得到PCR扩增产物;将PCR扩增产物变性为单链DNA,并将其环化成环状单链DNA。利用BGISEQ测序平台获得测序结果,得到肿瘤病人的DNA甲基化检测结果。

  同时将该检测结果与利用全基因组常规建库、测序的方法对上述肿瘤病人的肿瘤组织进行甲基化测的结果进行比较。经比较分析,两种检测方法所获得的甲基化检测结果基本一致。下面对该具体实验过程进行说明,同时以样本1和样本2为例,对利用两种检测方法得到的结果进行说明。样本1和样本2分别取自两个肿瘤病人。

  (一)循环肿瘤DNA提取

  通过梯度离心法获取肿瘤病人血浆,使用游离核酸提取试剂盒(QIAampCirculating Nucleic Acid Kit,货号:55114,厂家:Qiagen)对血浆中循环肿瘤DNA进行提取。

  1、按照梯度离心分离获得血浆,包括如下步骤:

  1.1采集5mL肿瘤病人全血至抗凝管后立即离心,离心条件为:离心转速1600g,时间10分钟,温度4℃。

  1.2离心得到的上清部分为血浆,用移液器取上清部分转移到新的离心管中,进行二次离心。离心条件为:离心转速16000g,时间10分钟,温度4℃。将二次离心得到的上清分装到2ml离心管中(每管500μL)。

  2、利用游离核酸提取试剂盒提取血浆中的ctDNA,包括如下步骤:

  2.1血浆样本前处理:取4管血浆,每管加入400μL ACLbuffer,5μL carrier RNA以及50μL蛋白酶K,混匀,60℃温育30分钟。

  2.2温育后加入900μL ACB buffer,混匀,轻微离心后置于冰河孵育5分钟。

  2.3将上述混合液转移到QIAamp Circulating Nucleic Acid Kit试剂盒的吸附柱中,8000rpm/s,离心1分钟,弃废液。

  2.4加入600μL ACW1buffer进行洗脱,8000rpm/s,离心1分钟,弃废液。

  2.5加入750μl ACW2buffer进行洗脱,8000rpm/s,离心1分钟,弃废液。

  2.6加入750μl无水乙醇进行洗脱,8000rpm/s,离心1分钟,弃废液。14000rpm/s再次离心3分钟后,将吸附柱置于新的收集管中,56℃温育10分钟。

  2.7将吸附柱转移到新的收集管中,加入30μl AVE buffer进行洗脱,放置3分钟后,14000rpm/s离心3分钟即可得到ctDNA。然后采用Qubit荧光定量仪(Invitrogen)进行浓度检测。

  (二)重亚硫酸盐处理

  向ctDNA中加入200ng片段化的λDNA,然后一起用重亚硫酸盐处理,从而使非甲基化胞嘧啶转换为尿嘧啶。具体包括如下步骤:

  在上述步骤获得的10ng ctDNA中加入200ng片段化的外源片段化λDNA,然后加入重亚硫酸盐处理2h。重亚硫酸盐处理采用甲基化试剂盒EZ DNA Methylation-Gold KitTM(ZYMO),具体步骤如下:

  A)CT Conversion Reagent的制备:从试剂盒中取出CT Conversion Reagent(固体混合物),然后添加900μl的水、50μl的M-Dissolving Buffer和300μl的M-DilutionBuffer到一管的CT Conversion Reagent中。在室温下溶解并且震荡10分钟或在摇床上摇动10分钟。

  B)M-WASH BUFFER的制备:添加24ml 100%的乙醇到M-Wash Buffer中来制备最终可以使用的M-Wash Buffer,加完乙醇后在盖子上打钩(用记号笔标记),表明可以使用。

  C)将待转换的DNA按照分装到PCR管中,补水至20μl。

  D)PCR管中添加130μL的CT Conversion Reagent,通过轻弹试管或移液器操作来混合样品。

  E)将样品管放到PCR仪上按以下步骤操作:

  98℃放置5分钟,

  64℃放置2.5小时,

  立刻进行下一步操作或者在4℃下存储(最多20小时)。

  F)添加600μL的M-Binding Buffer到Zymo-Spin ICTM Column中,并将柱放于试剂盒所提供的收集管中。

  G)装填样品到Zymo-Spin ICTM Column(含有M-Binding Buffer)。盖上盖后将柱颠倒数次来混合样品。

  H)全速(>10,000x g)离心30秒,去除流出液。

  I)添加200μL的M-Wash Buffer到柱中,全速离心30秒。

  J)添加200μL的M-Desulphonation Buffer到柱中并且在室温(20℃–30℃)下放置15分钟,在培养后,全速离心30秒。

  K)添加200μL的M-Wash Buffer到柱中,全速离心30秒;再添加200μL的M-WashBuffer并且离心30秒。

  L)直接添加10μL的M-Elution Buffer到柱基质中。将柱放置在1.5mL的管中,全速离心来洗脱DNA。

  (二)文库制备

  1、带UID接头随机引物扩增

  将经过重亚硫酸盐处理的ctDNA,加入8~12nt的UID接头,在Klenow Fragment和phi29DNA Polymerase作用下,进行两轮线性扩增,得到带有接头序列的BS处理过的ctDNA片段。

  1.1第一轮线性扩增

  按照表1给出的体系,首先加入经过重亚硫酸盐处理的ctDNA、10x PNK buffer(厂家:Enzymatics,货号:B904)、Ad153_UID8-L接头(20μM)以及dNTP(100mM)混匀,于95℃反应2分钟,接着30℃反应5分钟,然后按照表1中所示,加入Klenow Fragment(5U/μL,厂家Enzymatics,货号P706L)以及phi29polymerase(10U/μL,厂家THERMO,货号EP0091),混匀,在30℃下反应30分钟。其中,Ad153_UID8-L接头序列如表7所示的SEQ ID NO:1。

  表1线性扩增试剂体系

  1.2第二轮线性扩增

  向步骤1.1得到的扩增产物依照表2给出的线性扩增体系加入Ad153_UID8-R接头(20μM)、10x PNK buffer(厂家:Enzymatics,货号:B904)以及水(H2O),混匀,在95℃反应2分钟,接着在30℃反应5分钟,然后按照表2所示,加入Klenow Fragment(5U/μL,厂家Enzymatics,货号P706L)以及phi29polymerase(10U/μL,厂家THERMO,货号EP0091)混匀后,30℃反应30分钟。

  其中,所用到的Ad153_UID8-R接头序列如表所示的SEQ ID NO:2。反应完成后,用1.0倍XP磁珠对反应物进行纯化,最后回溶于23μL TE buffer中。

  表2线性扩增体系

  

  

  2、PCR扩增

  以带有接头序列且经过重亚硫酸盐处理转换后的ctDNA为模板,加入特别设计的PCR引物序列,用针对重亚硫酸盐转换后的DNA的KAPA HiFi HotStart Uracil聚合酶进行扩增。

  包括:按照表3给出的PCR扩增体系,加入以下试剂,其中AD153-F序列以及AD153-R序列分别为表7给出的SEQ ID NO:3和SEQ ID NO:4。

  表3PCR扩增体系

  混匀后,按照以下程序进行反应:

  表4PCR扩增程序

  

  反应完后,加入用1.0倍XP磁珠对反应物进行纯化,再回溶于23μL TE buffer中。然后采用Qubit(Invitrogen)进行浓度检测。

  3、单链环环化反应

  扩增产物经过磁珠纯化后,高温变性成单链DNA,在DNA环化引物(Ad153splintoligo),T4DNA Ligase以及ATP作用下使单链DNA环化。环化产物经过exo I和exo III作用下,去除未环化的线性DNA,得到可以上机测序的单链环状DNA文库。

  3.1热变性与单链环化

  取上述纯化产物170ng,加水补足48.2μL体系,混匀后95℃反应5分钟,然后立即置于4℃。依次加入以下试剂,其中Ad153splint oligo序列如表7中SEQ ID NO:5所示。

  表5热变性体系

  混匀后,37℃反应30分钟。

  3.2exo I和exo III酶切

  上述反应结束后,依次加入以下试剂:

  表6酶切体系

  混匀后,37℃反应30分钟,获得单链环状文库。然后用2.5倍XP磁珠进行纯化回收,溶于42μL TE buffer中。

  表7序列信息

  

  

  其中,N为A,T,C或G中的任意之一。

  (三)测序及数据分析

  将上述获得的单链环状文库作为模板,在phi29polymerase的作用下进行滚环扩增,形成DNB(DNA纳米球)。然后在BGI seq-500测序平台中进行双末端测序。通过数据分析比较得到ct DNA甲基化修饰情况。所述数据分析过程如下:首先使用Trimmomatic对测序获得的序列(即reads)进行过滤,用soapnuke对低质量reads进行过滤,然后使用bsmap将过滤后的reads比对回hg19参考基因组,根据bsmap比对时的错配原则,对甲基化的碱基计数,计算甲基化比例,最后统计全范围内的甲基化水平。

  所得到的数据结果如下:

  1、表8显示基本数据分析结果。

  表8两个样本比对结果

  

  其中,比对率为比对上的数据与原始数据的百分比。在哺乳动物中,非CG位点是低甲基化修饰的,因此默认其位点的甲基化水平为0。如果重亚硫酸盐处理的转换效率为100%,则对于非CG位点测序得到的的甲基化水平应该为0。通过测序检测计算出非CG位点甲基化水平,则非甲基化C转换率的计算即为:1减去非CG位点的甲基化水平。所计算得到的非甲基化C转换率越高,得到的数据越可靠。

  从表8可以看出,两个样本的比对率分别为92.87%与90.53%,重亚硫酸盐转换效率都在99%以上。比对率,转换效率都在正常范围内。

  2、覆盖度分布图

  表9显示两个样本的全基因组覆盖度分布情况。

  表9覆盖度数据

  其中,覆盖率也称覆盖度,为覆盖到全基因组上的碱基数目与全基因组上的碱基数目的比值。

  从表9可得知,两个样本的全基因组覆盖度能达到89%。

  3、数据相关性比较

  按照如上方法,分别对低起始量的样本1和样本2(使用肿瘤病人的血液样本,10ng)的甲基化水平进行检测,同时利用全基因组常规建库、测序的方法对高起始量的样本1和样本2(分别使用与上述方法同一肿瘤病人的肿瘤组织样本,1μg)的甲基化水平进行检测,比较通过两种方法所得到的样本的甲基化水平的相关性。其中,全基因组常规建库、测序的方法即我们通常所说的传统的全基因组亚硫酸盐测序(whole genome bisulfitesequencing,WGBS)技术,是一种基于亚硫酸盐转化的DNA甲基化检测技术。这种传统的WGBS技术是对基因组DNA片段化后,末端修复加A,然后加上已知甲基化修饰序列的接头,通过重亚硫酸盐处理,将没有甲基化修饰C脱氨基成为U,再进行PCR扩增后转变为T,甲基化修饰的C则不变。最后将PCR得到产物变性为单链,环化后使用BGISEQ-500测序仪进行测序。具体建库过程可参考文献Nat Protoc.2015Mar;10(3):475-83.doi:10.1038/nprot.2014.114.Epub 2015Feb 18.Urich MA,Nery JR,Lister R,Schmitz RJ,EckerJR4MethylC-seq library preparation for base-resolution whole-genome bisulfitesequencing,其中单链变性,环化步骤可参考BGISEQ-500测序仪对文库构建的说明。

  其中图1和图2分别为对两个样本使用本发明方法得到的测序数据的甲基化相关性分析与使用传统全基因组常规建库得到相应测序数据进行甲基化相关性分析的比较,数据为过滤20×以上的数据的甲基化率分布情况。可以看到无论是样本1还是样本2,相同位点上的甲基化率基本一致,样品1的相关系数是0.89(Pearson相关系数),样品2的相关系数为0.88。

  通过10ng起始的样本1和样本2进行ctDNA全基因组建库甲基化分析,得到测序数据与常规文库测序相应数据进行信息分析比较结果来看,从比对效率、覆盖度及相关性来看,各方面数据覆盖率都不错,甲基化率也有比较好的一致性,而且此项技术可以对ctDNA这种量比较少,而且片段化的DNA提供全基因组甲基化图谱分析的手段。这些都说明了ctDNA甲基化高通量测序研究是切实可行的,且本发明方法建库难度低,增加简便及应用的可行性,使得对ctDNA全基因组范围内进行高通量高精度的甲基化检测成为现实,为肿瘤检测筛选甲基化生物标志物提供可靠的数据。

  此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

  在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

  尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

  SEQUENCE LISTING

  <110> 深圳华大生命科学研究院

  <120> 构建DNA甲基化文库的方法及其应用

  <130> PIDC3182743

  <160> 5

  <170> PatentIn version 3.5

  <210> 1

  <211> 33

  <212> DNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (26)..(33)

  <223> n is a, c, g, or t

  <400> 1

  gaacgacatg gctacgatcc gacttnnnnn nnn 33

  <210> 2

  <211> 67

  <212> DNA

  <213> 人工序列

  <220>

  <221> misc_feature

  <222> (60)..(67)

  <223> n is a, c, g, or t

  <400> 2

  tgtgagccaa ggagttgttc gagtttattg tcttcctaag accgcttggc ctccgacttn 60

  nnnnnnn 67

  <210> 3

  <211> 17

  <212> DNA

  <213> 人工序列

  <400> 3

  gaacgacatg gctacga 17

  <210> 4

  <211> 17

  <212> DNA

  <213> 人工序列

  <400> 4

  tgtgagccaa ggagttg 17

  <210> 5

  <211> 24

  <212> DNA

  <213> 人工序列

  <400> 5

  gccatgtcgt tctgtgagcc aagg 24

《构建DNA甲基化文库的方法及其应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)