欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 全基因组甲基化文库单链建库方法和得到的全基因组甲基化文库独创技术22218字

全基因组甲基化文库单链建库方法和得到的全基因组甲基化文库

2021-04-05 13:54:09

全基因组甲基化文库单链建库方法和得到的全基因组甲基化文库

  技术领域

  本发明涉及基因组甲基化研究技术领域,具体涉及一种全基因组甲基化文库单链建库方法和得到的全基因组甲基化文库。

  背景技术

  表观遗传学修饰种类丰富,主要包含5-甲基胞嘧啶(5mC)、5-羟甲基胞嘧啶(5hmC)和N6-甲基腺嘌呤(6mA)修饰。全基因组甲基化修饰在不同精度层面上影响基因组印记、基因的表达、RNA选择性剪接、核小体定位和转录因子的动态结合,从而是生物性状的重要调控因素。全基因组甲基化建库测序(WGBS)是表观遗传组学研究中基础和重要的研究手段。在全基因组水平,单碱基分辨率检出甲基化位点,不仅能够高精度发现CpG岛等常见区域的甲基化水平的变化,还能够分析基因体(gene body)区、基因间区等区域的甲基化水平的差异,分析甲基化对染色体的状态以及基因结构变化的影响,从多维度分析解决生物学问题。

  目前高通量的全基因组甲基化检测技术主要包括:以Illumina TruSeq、NEB NextUltra、Swift Bioscience Accel-NGS、QIAGEN EpiTect和BGI MGIEasy为主流的全基因甲基化建库和二代测序技术,Illumina Human Methylation850Bead Chip等基于芯片的甲基化图谱分析,Sequenom Mass ARRAY平台的飞行质谱检测;Pacific Biosciences公司开发的甲基化三代测序技术。除飞行质谱检测之外的测序分析方法都可以分辨样本在每个碱基位点的甲基化与非甲基化占比。

  第二代测序技术(Next Generation Sequencing)通量高、成本低,在DNA、RNA和表观等各个领域的应用中彰显出独特魅力。在2015年10月24日的第十届国际基因组学大会(ICG-10)和2017年10月26日的ICG-12大会上,华大基因先后发布了其自主研发的新型桌面化测序系统BGISEQ-500以及速度更快、通量更大、更高测序质量的MGISEQ-2000。2018年7月,华大智造发布了适用于华大自主测序仪BGISEQ-500和MGISEQ-2000的建库产品:MGIEasy全基因组甲基化测序文库制备试剂盒V1.0,该试剂盒采用pre-BS-WGBS建库流程,即样本DNA经过加接头、进行重亚硫酸盐(Bisulfite)处理和扩增,完成建库。

  目前主流的全基因组甲基化建库测序技术包括:pre-BS-WGBS建库方法、常规POST-BS-WGBS法和POST-BS-WGBS-SPLAT方法。其中,pre-BS-WGBS建库方法先在打断的双链DNA两端加接头,再进行重亚硫酸盐转化处理后,用可以扩增尿嘧啶的PCR聚合酶扩增,为双链建库方法。重亚硫酸盐转化处理造成DNA单链化、片段化,并在DNA上产生很多AP位点(apurinic/apyrimidinic site,无碱基位点),这些AP位点是从A、T、C、G任何碱基随机产生的,pre-BS-WGBS建库方法在加完接头后进行重亚硫酸盐转化处理,有效模板降低至1/10左右。

  常规POST-BS-WGBS建库方法先重亚硫酸盐转化再加接头,为单链建库方法,通常合成新链被测序。该建库方法未对重亚硫酸盐转化处理产生的无碱基位点进行修复处理,这会降低建库的有效性。单链建库二链合成方法通常会选用随机引物,常用的引物碱基组成为N(A、G、C、T),而经过重亚硫酸盐转化处理的DNA中通常C的比例很低,随机引物的碱基组成为N则不适合于大多数模板的二链合成。

  POST-BS-WGBS-SPLAT方法先重亚硫酸盐转化再加接头,为双链建库方法,基因组每条链和合成的二链均被测序。该建库方法3’末端和5’末端的连接依次采用单链DNA加双链的接头,效率比较低。该方法重亚硫酸盐转化处理的原始链和新合成的互补链都会被测序,意味着同一段DNA原始模板被测序两次,虽然起到一定的数据间互相验证准确性的作用,但造成测序数据多一倍的浪费。

  发明内容

  本发明提供一种全基因组甲基化文库单链建库方法和得到的全基因组甲基化文库,该方法对重亚硫酸盐处理后的基因组DNA进行5’端去磷酸化处理,可以使原始链加接头时3’末端与接头之间形成缺口,不会被有效扩增,而合成的二链可以被有效扩增,因此建库接头可以采用无需甲基化等特殊修饰的接头,且PCR聚合酶无需采用能扩增U碱基的特殊PCR酶,极大地降低了建库成本。

  根据第一方面,一种实施例中提供一种全基因组甲基化文库单链建库方法,包括如下步骤:

  (a)对打断或未打断的基因组DNA进行重亚硫酸盐处理,使非甲基化的C碱基转化为U碱基,并在DNA上形成随机的AP位点;

  (b)采用去磷酸化酶对上一步反应产物进行5’端去磷酸化处理以去除5’末端的磷酸基团;

  (c)在DNA聚合酶和随机引物作用下对上一步反应产物的变性单链进行扩增,以合成第二链;以及

  (d)采用具有AP位点去除作用的核酸内切酶去除上述AP位点;

  其中上述步骤(d)在上述步骤(a)之后任意阶段进行。

  进一步地,上述随机引物的每一个碱基位点各自独立地选自A、T、C碱基中的一种。

  进一步地,上述随机引物的长度是4-20个碱基,优选8个碱基。

  进一步地,上述DNA聚合酶选自具有链置换功能的Klenow exo-、Klenow片段(3'-5'exo-)、Bst DNA聚合酶、Vent DNA聚合酶(3'-5'exo-)、Vent DNA聚合酶、Phi29DNA聚合酶、Deep Vent DNA聚合酶(3'-5'exo-)、Deep Vent DNA聚合酶以及具有切口平移功能的DNA聚合酶I中的一种或多种。

  进一步地,上述具有AP位点去除作用的核酸内切酶是FPG酶。

  进一步地,上述FPG酶在反应体系中的终浓度为0.8U/μL。

  进一步地,上述基因组DNA是主带大于300bp的打断的基因组DNA。

  进一步地,上述全基因组甲基化文库用于BGI测序平台测序。

  进一步地,上述方法还包括如下步骤中的一个或多个步骤:末端修复,接头连接,PCR扩增,单链环化以及DNA纳米球的制备。

  根据第二方面,一种实施例中提供一种根据第一方面的方法得到的全基因组甲基化文库。

  本发明的方法,对重亚硫酸盐处理后的基因组DNA进行5’端去磷酸化处理,可以使原始链加接头时3’末端与接头之间形成缺口,不会被有效扩增,而合成的二链可以被有效扩增,因此建库接头可以采用无需甲基化等特殊修饰的接头,且PCR聚合酶无需采用能扩增U碱基的特殊PCR酶,极大地降低了建库成本。同时,采用具有AP位点去除作用的核酸内切酶去除AP位点,使单链或双链DNA在AP位点处断开,形成更多有效加接头、可进行PCR的模板,提高全基因组覆盖度。

  此外,在进一步改进的方案中,随机引物采用简并引物方式,随机引物的每个位点采用选自A、T、C碱基替代常规A、T、C、G碱基,可更高效地与重亚硫酸盐处理过的模板退火,从而更有效地进行二链延伸。

  附图说明

  图1为本发明一个实施例的全基因组甲基化文库单链建库方法全流程图;

  图2为本发明一个实施例中AP位点的修复机理示意图,其中左图表示单链修复机理,右图表示单双链嵌合体修复机理。

  具体实施方式

  下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。

  另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。

  本发明的一种实施例中提供一种全基因组甲基化文库单链建库方法,如图1所示,包括如下步骤:

  (a)对打断或未打断的基因组DNA进行重亚硫酸盐处理,使非甲基化的C碱基转化为U碱基,并在DNA上形成随机的AP位点;

  (b)采用去磷酸化酶对上一步反应产物进行5’端去磷酸化处理以去除5’末端的磷酸基团;

  (c)在DNA聚合酶和随机引物作用下对上一步反应产物的变性单链进行扩增,以合成第二链;以及

  (d)采用具有AP位点去除作用的核酸内切酶去除上述AP位点;

  其中上述步骤(d)在上述步骤(a)之后任意阶段进行。

  需要说明的是,图1显示的是一个实施例的全基因组甲基化文库单链建库方法全流程图。而在本发明中,只有上述步骤(a)至(d)属于必需步骤,即图1中步骤1至4,其他后续步骤属于可选步骤,即在优选实施例中,还包括如下步骤中的一个或多个步骤:末端修复,接头连接,PCR扩增,单链环化以及DNA纳米球的制备。

  本发明的全基因组甲基化文库单链建库方法可以适用于任何测序平台,尤其是各种第二代高通量测序平台。在本发明的优选实施例中,全基因组甲基化文库用于BGI测序平台测序。

  本发明实施例中,建库起始材料是“打断或未打断的基因组DNA”,其中未打断的基因组DNA可以是通过任何提取方法从样本材料中提取的基因组DNA。打断的基因组DNA可以是通过任何打断方法得到的片段化DNA,包括物理打断的DNA和酶打断的DNA,其中酶打断的DNA需要经过纯化再进行重亚硫酸盐处理。打断的基因组DNA一般要求主带大于300bp,过短不利于产生有效的文库片段。然而,在改变本发明实施例中二链合成方式为固定序列反向延伸方法的情况下,本发明的方法可应用于各种片段长度的DNA片段,能够兼容300bp以下DNA的文库的构建。

  本发明实施例中,基因组DNA经过重亚硫酸盐(Bisulfite)处理,非甲基化的C碱基经过脱氨作用转化为U碱基,甲基化的C碱基不发生结构改变。重亚硫酸盐处理后的DNA,95%以上成为片段化的单链DNA结构,并在DNA上形成随机的AP位点(apurinic/apyrimidinic site,无碱基位点),这些AP位点是从A、T、C、G任何碱基随机产生的。

  然后,采用去磷酸化酶,例如Thermo ScientificTMFastAPTMThermosensitiveAlkaline Phosphatase(温敏碱性磷酸酶)处理,以去除单链、双链DNA的5’末端的磷酸基团,例如可以在37℃孵育10min实现5’端去磷酸化。该去磷酸化步骤能够确保重亚硫酸盐处理后的原始链5’端在接头连接步骤中不会加上接头,因为加接头时原始链5’末端缺少磷酸基团,因此与接头之间形成缺口(nick),进而在后续PCR扩增过程中原始链不会被有效扩增,而合成的二链能够被有效扩增,故此建库的接头为无需甲基化等特殊修饰的接头,并且PCR聚合酶为无需能扩增U碱基的特殊PCR酶,极大地降低了建库成本。去磷酸化处理后直接热灭活去磷酸化酶,例如在95℃进行5min热灭活反应,去磷酸化酶失活同时实现重亚硫酸盐反应产物完全解链,这样能够提高二链合成的有效模板量。

  经过重亚硫酸盐处理、去磷酸化处理和高温变性的产物,可以进行二链合成反应。本发明的优选实施例中,在步骤(c)中,随机引物的每一个碱基位点各自独立地选自A、T、C碱基中的一种,即如图1所示H碱基表示A、T、C碱基中的一种。由于重亚硫酸盐(Bisulfite)处理后的DNA,99.5%以上的非甲基化C碱基转换为U碱基,甲基化的C碱基通常在模板中比例不高(具体由样本甲基化率决定),因此本发明实施例创新性地采用H碱基替代N(A、T、C或G)碱基作为随机引物进行二链合成,能够更高效地与重亚硫酸盐处理过的模板退火,从而更有效地进行二链延伸。

  本发明实施例中,随机引物的长度可以是4-20个碱基,然而当引物过长时,特异性过高,难以与模板有效匹配;而当引物过短时,退火温度较低,在酶最适温度难以退火与模板结合,经过测试8个碱基(8nt)的随机引物(H8引物)更加适用于二链合成。

  在二链合成过程中,DNA聚合酶可以选自具有链置换功能的Klenow exo-、Klenow片段(3'-5'exo-)、Bst DNA聚合酶、Vent DNA聚合酶(3'-5'exo-)、Vent DNA聚合酶、Phi29DNA聚合酶、Deep Vent DNA聚合酶(3'-5'exo-)、Deep Vent DNA聚合酶以及具有切口平移功能的DNA聚合酶I中的一种或多种。在本发明的优选实施例中,采用具有切口平移功能的DNA聚合酶I(PolI酶),其最适温度为37℃。

  本发明实施例中,步骤(d)采用具有AP位点去除作用的核酸内切酶去除AP位点,该步骤(d)可以在步骤(a)之后任意阶段进行。本发明实施例中,所谓“步骤(d)在步骤(a)之后任意阶段进行”是指步骤(d)除了在步骤(a)之后进行以外,没有其他限制,例如步骤(d)可以在步骤(a)和步骤(b)之间、步骤(b)和步骤(c)之间或步骤(c)之后等,以及在不产生互相影响的情况下,步骤(d)可以与步骤(b)或步骤(c)同步进行等。

  去除AP位点也被称为“AP位点修复”,如图2中左图所示,如果在二链合成之前进行AP位点修复,那么在具有AP位点去除作用的核酸内切酶(即修复酶)作用下,单链DNA在AP位点处断开,断开的单链DNA在后续扩增中各自合成二链。如图2中右图所示,如果在二链合成之后进行AP位点修复,二链合成时,当延伸反应进行到AP位点时,由于缺乏作为模板的碱基,延伸反应无法进行下去,在具有AP位点去除作用的核酸内切酶(即修复酶)作用下,单双链嵌合体在嵌合位点处断开。

  在本发明的优选实施例中,具有AP位点去除作用的核酸内切酶是FPG酶(formamidopyrimidine[fapy]-DNA glycosylase,甲酰嘧啶DNA糖苷酶),该酶是一个碱基剪切修复酶(base excision repair enzyme),具备N端糖苷酶活性和AP位点裂解酶活性,主要作用于各种氧化的碱基,例如7,8-二氢-氧桥鸟嘌呤(7,8-dihydro-8-oxoguanine)、氧桥鸟嘌呤(8-oxoadenine)、2,6-二氨基-4-羟基-5-甲酰胺嘧啶(fapy-guanine)、甲基化-2,6-二氨基-4-羟基-5-甲酰胺嘧啶(methy-fapy-guanine)、甲酰胺腺嘌呤(fapy-adenine)、黄曲霉素B1-甲酰胺嘧啶(aflatoxin B1-fapy-guanine)、5-羟基胞嘧啶(5-hydroxy-cytosine)和5-羟基尿嘧啶(5-hydroxyuracil)。其N端糖苷酶可以将损伤的嘌呤从双链中切除,产生一个无嘌呤位点;而其AP位点裂解酶活性可以将AP位点处脱氧核糖和磷酸基团(dR5P)切除,留下一个5’端核酸基团和一个3’端羟基,造成链中的断裂。

  FPG酶在反应体系中的浓度可以根据需要调整,在本发明的优选实施例中,测试到终浓度0.8U/μL的FPG酶,在二链合成后可以有效修复重亚硫酸盐处理后样本中AP位点,使单双链嵌合体在单双链连接处断开,形成更多有效加接头、PCR的模板。在其它实施例中,例如在二链合成之前去除AP位点的实施例中,可以根据需要调整FPG酶的工作浓度。

  综上所述,本发明实施例提供了一种低起始量、高文库质量、高数据利用率和数据可靠性的全基因组甲基化文库制备方法。其有益效果体现在:提高有效模板数,降低建库起始量。重亚硫酸盐处理之后进行去磷酸化处理,实现单链建库,免除了需要能扩增尿嘧啶的PCR酶的使用从而降低了成本;免除了原始链和合成的二链的同时测序,提高了数据利用率。二链合成的引物,创新性地采用H(A、T、C)碱基代替常规N(A、T、C、G)碱基,提高退火到重亚硫酸盐处理之后以A、T、G为主的模板的概率,有效提升建库产量。AP位点修复过程,创新性地有效去除二链合成后由AP位点造成的单双链嵌合体,提高了文库的质量和PCR扩增效率。

  如图1所示,在优选实施例中,本发明的建库方法基于BGI测序平台,因此,还包括如下步骤:末端修复和3’末端加A处理;接头连接;聚合酶链式反应(PCR);PCR产物高温变性和单链环化;以及单链环进行滚环复制形成DNA纳米球(DNA nanoball,DNB)。最后,文库通过cPAS原理固定在阵列化的硅芯片上通过相机采集信号进行测序。这些步骤按照目前BGI测序平台常规操作进行即可。

  需要特别强调的是,如图1所示,由于以上建库步骤中在重亚硫酸盐处理之后进行去磷酸化处理,因此在接头连接时,原始链与接头之间形成缺口(nick),同时由于该原始链模板含大量U碱基,本发明实施例使用的PCR聚合酶不能扩增U碱基,因而不会成为PCR的模板。

  在基于BGI建库测序平台的建库方案中,实现单一接头(可带不同标签序列)建库,单管进行末端修复到加接头反应,操作方便。测序中采用DNA纳米球(DNB)方法以及矩阵式芯片,可大大提高与模板的保真性,降低错误率,降低数据重复率。

  以下通过实施例详细说明本发明的技术方案,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。

  实施例

  本实施例的样本为未打断的基因组DNA。

  (1)DNA的重亚硫酸盐处理:

  配制如下表1所示的反应混合液:

  表1

  

  

  反应条件如下表2所示:

  表2

  反应结束后,用纯化柱进行纯化,回溶于10μL。

  (2)5’端去磷酸化处理:

  配制如下表3所示的反应混合液:

  表3

  

  反应条件如下表4所示:

  表4

  

  

  反应完冰上放置3-5min。

  (3)二链合成反应:

  配制如下表5所示的反应混合液:

  表5

  立即加入10μL二链合成反应液到步骤(2)的反应产物,并进行二链合成反应。

  反应条件如下表6所示:

  表6

  反应结束采用1X磁珠纯化,最终回溶于20μL TE溶液中。

  (4)FPG酶处理

  配制如下表7所示的反应混合液:

  表7

  立即加入10μL FPG酶修复反应液到步骤(3)纯化后回溶的产物,并进行以下反应。

  反应条件如下表8所示:

  表8

  反应结束采用1X磁珠纯化,最终回溶于40μL TE溶液中。

  (5)末端修复:

  配制如下表9所示的反应混合液:

  表9

  立即加入10μL末端修复反应液到步骤(4)纯化后回溶的产物,并进行以下反应。

  反应条件如下表10所示:

  表10

  (6)接头连接

  反应结束,立即加入5μL Ad153接头,该接头浓度根据步骤(1)建库起始量而定。

  推荐投入量和接头稀释浓度关系如下表11(接头原液为10μM):

  表11

  配制接头连接混合液,如下表12:

  表12

  

  

  向末端修复产物加入适量接头之后,加入25μL接头连接混合液并进行以下反应。

  反应条件如下表13所示:

  表13

  反应结束采用1X磁珠纯化,最终回溶于20μL TE溶液中。

  (7)PCR扩增:

  在冰上配制PCR反应液,如下表14:

  表14

  立即加入30μL反应液到步骤(6)纯化后回溶的产物,并进行以下表15的反应:

  表15

  

  

  循环数经过下表16推算得到:

  表16

  

  (8)变性

  根据PCR产物的主片段分布,取1pmol PCR产物至新的0.2mL PCR管中,用TE缓冲液补充至总体积48μL。

  将0.2mL PCR管置于PCR仪上,按照变性反应条件进行如下表17反应:

  表17

  

  

  反应结束后,立即将0.2mL PCR管转移到冰上,静置2min后瞬时离心。

  (9)单链环化

  在冰上配制单链环化反应液,如下表18所示:

  表18

  用移液器吸取12.1μL配制好的单链环化反应液加入步骤(8)的产物,涡旋震荡3次,每次3s,瞬时离心将反应液收集至管底。

  将0.2mL PCR管置于PCR仪上,按照以下表19的单链环化反应条件进行反应:

  表19

  反应结束后,瞬时离心,将0.2mL PCR管转移到冰上,立即进入下步反应。

  (10)酶切消化

  提前在冰上配制酶切消化反应液,如下表20所示:

  表20

  

  

  吸取4μL配制好的酶切消化反应液加入步骤(9)PCR管中,涡旋震荡3次,每次3s,瞬时离心将反应液收集至管底。

  按照以下表21的酶切消化条件进行反应:

  表21

  瞬时离心将反应液收集至管底。向0.2mL PCR管中加入7.5μL 0.2M EDTA溶液,涡旋震荡3次,每次3s,瞬时离心将反应液收集至管底,吸取全部反应液转移到新的1.5mL EP管中。完成文库的构建。

  (11)DNB的制备和测序:

  具体的操作步骤可以参考MGI测序试剂盒说明书。

  以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

《全基因组甲基化文库单链建库方法和得到的全基因组甲基化文库.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)