欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种简便、快速、低成本的Hi-C文库构建方法独创技术23418字

一种简便、快速、低成本的Hi-C文库构建方法

2021-04-25 01:33:09

一种简便、快速、低成本的Hi-C文库构建方法

  技术领域

  本发明涉及一种可在全基因组范围内对染色质三维构象进行捕获的文库构建方法,属于基因测序技术领域

  背景技术

  DNA是细胞遗传信息的载体,在生物体内以染色质的形式存在于每个细胞中,并控制着整个生命活动的进程。目前绝大多数对于DNA信息的研究是以研究DNA分子内碱基的序列(DNA的一维信息)来进行,通过分析碱基排列信息来探究生命活动的规律。

  真实状态中的细胞核是一个狭小的三维立体空间,直链分子结构的DNA会以复杂的卷曲方式位于细胞核内,原一维DNA序列被赋予三维空间构象,并导致了大量复杂的基因调控作用方式。对此,简单的一维DNA序列信息由于不能提供真实DNA空间分布相关的信息,因此也无法解释由于空间构象导致的一系列基因调控现象。

  为解决这一问题,目前已有一系列的检测方法。如3c(染色体结构捕获)方法及衍生的4c、5c方法。这些方法均以测序为基本检测手段,利用细胞核内蛋白形成DNA结构固定因子,之后通过对DNA的片段重联等构建带有空间结构信息的DNA序列,最后使用测序技术来检测染色质DNA信息,并计算其在空间中分布和相互作用。尽管此类方法在一定程度上能够提供部分染色质相互作用信息。但由于其方法与技术限制,这一类的检测仅能检测定点或部分的DNA相互作用位点,无法探究全细胞核水平上的立体互作信息。因此不可避免地大量信息将会遗漏。在对于未知相互作用信息的发现上,这一点尤为重要。

  近年来随着高通量测序技术的出现,大规模基因组信息的获得变得更加容易。Hi-C技术便是结合高通量测序的方法,对整个细胞核内染色质的信息进行检测的技术。Hi-C技术是染色体构象捕获(Chromosome%20conformation%20capture,简称为3C)的一种衍生技术,是指基于高通量进行染色体构象的捕获,它能够在全基因组范围内捕捉不同基因座位之间的空间交互,研究三维空间中调控基因的DNA元件。

  例如,专利文献1和非专利文献1报道了一种Hi-C方法,该方法利用甲醛固定染色质结构,然后通过限制性内切酶打断原基因组序列,并进行生物素标记后,再重新连接形成带有结构信息的新DNA分子。在这一过程中,如果两个不同基因组位置的DNA分子片段连接形成一个杂合分子,这将被认为是这两个DNA分子在空间上相互临近的证据。然后对DNA进行纯化并打碎,再针对标记的生物素分子进行钓取,富集获得所需的空间上相互作用的DNA杂合分子。最后构建高通量测序的文库及双端测序检测,获得全染色质在空间上的相互作用信息。该方法主要包括下述步骤:1)首先对样本细胞进行甲醛交联固定,使其内部空间距离较近的DNA通过蛋白交联在一起,并收集细胞;2)使用裂解体系并配合研磨进行细胞裂解,获得分离的细胞核;3)使用限制型内切酶(如EcoRⅠ)对交联后细胞的染色质进行酶切;4)对酶切末端进行生物素标记,同时补平形成平末端;5)使用DNA连接酶对平末端进行连接,处于同一个交联分子上的DNA片段间将有较大的概率连接形成新的分子;6)高温(65℃)处理逆转交联,提取重连的DNA分子;7)去除未连接的末端生物素标记;8)对DNA进行片段化,并进行生物素特异性调取,富集杂合分子连接位点区域;以及9)构建二代测序文库,进行双端测序,获得数据。

  但是,该Hi-C方法的建库成本高。由于需要使用生物素标记的碱基以及用于亲和纯化的大量链霉亲和素磁珠,使得该方法的建库成本几十倍于基因组建库、表达谱建库、表观组建库等常见的高通量测序文库的建库成本。

  此外,该Hi-C方法的操作复杂、操作时间长。由于需要对酶切片段进行生物素标记和末端修复补平、平末端连接、去除未连接末端的生物素标记、链霉亲和素磁珠钓取等多个繁琐的操作步骤,使得该方法十分耗费时间。

  再者,该Hi-C建库方法仅能使用酶切后会形成5’端突出粘末端的Ⅱ型限制性内切酶进行染色质消化,使得其染色质消化模式较为单一,无法使用一些特殊的内切酶如形成平末端的内切酶或形成3无端突出粘末端的限制性内切酶。

  因此,需要一种简便、快速、低成本的Hi-C文库构建方法。

  专利文献1

  国际公开号WO2010036323A1

  非专利文献1

  Lieberman-Aiden%20E%20et%20al.Comprehensive%20mapping%20of%20long-range%20interactions%20reveals%20folding%20principles%20of%20the%20human%20genome.Science%20326,289-293(2009)%20

  发明内容

  鉴于上述现有技术中存在的不足,本发明的目的在于:提供一种简便、快速、低成本的Hi-C文库构建方法。

  本发明人为解决上述技术问题进行了深入研究,在传统的构建Hi-C文库的方法的基础上进行了巧妙的改进,使得其操作简便、耗时少且成本低,从而完成了本发明。

  即,本发明包括:

  1.一种构建Hi-C文库的方法,该方法包括下述步骤:

  步骤B:获得被固定化的染色质;

  步骤C:对所述步骤B中获得的被固定化的染色质进行消化,得到被固定化的染色质片段;

  步骤D:将所述步骤C中得到的被固定化的染色质片段直接进行重新连接,得到重新连接的被固定化的染色质片段;

  步骤E:使所述步骤D中得到的重新连接的被固定化的染色质片段解除固定化,释放DNA片段;以及

  步骤G:以所述步骤E中释放的DNA片段作为待测序DNA片段,构建测序用DNA文库。

  2.根据项1所述的构建Hi-C文库的方法,其还包括:

  在所述步骤E之后进行的步骤F:对所述步骤E中释放的DNA片段进行片段化,得到更小的DNA片段;

  且在所述步骤G中以所述更小的DNA片段作为待测序DNA片段,构建测序用DNA文库。

  3.根据项1或2所述的方法,其中,所述步骤C中使用脱氧核糖核酸酶对所述被固定化的染色质进行消化。

  4.根据项3所述的方法,其中,所述脱氧核糖核酸酶是Ⅰ型限制性内切酶、Ⅱ型限制性内切酶或Ⅲ型限制性内切酶。

  5.根据项1-4中任一项所述的方法,其中,所述步骤D中采用粘末端连接或平末端连接方法将所述步骤C中得到的被固定化的染色质片段进行重新连接。

  6.根据项2所述的方法,其中,所述步骤F中采用超声打断法、转座酶法、内切酶酶切法或液压剪切法将所述步骤E中释放的DNA片段片段化。

  7.根据项2所述的方法,其中,所述步骤F中得到的更小的DNA片段的大小为20~50000bp,优选50~1000bp。

  8.根据项1-7中任一项所述的方法,其还包括:

  步骤A:获取染色质被固定化的细胞;且

  在所述步骤B中,裂解所述步骤A中获取的细胞,获得被固定化的染色质。

  9.根据项8所述的方法,其中,所述染色质被固定化的细胞是1万~10亿个细胞,优选2500万~1亿个细胞。

  10.一种测定可能在空间上相互作用的染色质区域的方法,该方法包括:

  采用项1~9中任一项所述的方法构建Hi-C文库;以及

  对所述Hi-C文库进行测序,并将所获得信息与染色质DNA一级序列信息进行比对。

  发明效果

  根据本发明,提供了一种简便、快速、低成本的Hi-C文库构建方法。相比于现有技术,本发明的优势至少在于:

  1.建库成本低。不使用生物素标记及链霉亲和素磁珠钓取,相比于传统方法,以相同量的细胞量构建Hi-C文库,可以节约成本60%以上。

  2.操作简便、耗时少。简化了操作步骤,相比于传统方法,建库的操作时间减少了9个小时以上。

  3.丰富了染色质消化模式,有利于提高Hi-C方法的分辨率,或是可扩大应用到以特殊酶切为背景的染色质三维结构相关研究和分析。

  发明的具体实施方式

  本说明书中提及的科技术语具有与本领域技术人员通常理解的含义相同的含义,如有冲突以本说明书中的定义为准。

  在一个方面中,本发明提供一种构建Hi-C文库的方法(本发明的Hi-C文库构建方法),该方法包括下述步骤:

  步骤B:获得被固定化的染色质;

  步骤C:对所述步骤B中获得的被固定化的染色质进行消化,得到被固定化的染色质片段;

  步骤D:将所述步骤C中得到的被固定化的染色质片段直接进行重新连接,得到重新连接的被固定化的染色质片段;

  步骤E:使所述步骤D中得到的重新连接的被固定化的染色质片段解除固定化,释放DNA片段;以及

  步骤G:以所述步骤E中释放的DNA片段作为待测序DNA片段,构建测序用DNA文库。

  优选地,本发明的Hi-C文库构建方法还可以包括:

  在所述步骤E之后进行的步骤F:对所述步骤E中释放的DNA片段进一步片段化,得到更小的DNA片段,且在所述步骤G中以所述更小的DNA片段作为待测序DNA片段,构建测序用DNA文库。

  优选地,本发明的Hi-C文库构建方法还可以包括:

  步骤A:获取染色质被固定化的细胞;且在所述步骤B中,裂解所述步骤A中获取的细胞,获得被固定化的染色质。

  在本说明书中,Hi-C是指染色质三维空间互作组,它是一种可以在全基因组范围内进行染色质空间构象捕获,研究染色质的三维结构和不同DNA区域在空间上相互关系的方法。Hi-C文库是指:Hi-C方法中通过高通量测序来获取可能的染色质相互作用信息,用于这种高通量测序的DNA文库即为Hi-C文库。

  在本说明书中,对于被固定化的染色质的量没有特殊限制,从便于操作的角度考虑,可以是1万~10亿个细胞的染色质,优选2500万~1亿个细胞的染色质,更优选5000万~1亿个细胞的染色质。如果以质量计,被固定化的染色质的量可以是约1ng~1,000,000ng,以裸DNA计。

  在本说明书中,对于染色质被固定化的细胞的量没有特殊限制,从便于操作的角度考虑,可以是1万~10亿个细胞,优选2500万~1亿个细胞,更优选5000万~1亿个细胞。

  在本说明书中,“固定化”是指:细胞中,染色质在三维空间上相互接近的部分被以接近天然构象的状态被固定。在本说明书中,染色质也包括染色体形态。所述固定化通常可以通过将染色质上的蛋白质交联来进行。染色质上的蛋白质的交联方法是本领域技术人员已知的,例如,可以单独使用紫外线,或者可以单独使用四硝基甲烷、碳二酰亚胺类、甲醛、甲醇、乙醇、戊醛、氮芥、二甲基硫酸、甲醛释放剂、酰亚胺酯类、有丝裂酶素C、芥子气和扫若仑等化学试剂,还可以采用以上化学试剂结合紫外线照射的方法进行交联。例如,在通过甲醛交联来进行所述固定化的情况下,可以将细胞置于适当量(例如1~10000000μL)的水、TE缓冲液、生理盐水、PBS或细胞培养基中制成细胞悬浮液滴,再加入适当量(例如1-10000000μL)的甲醛溶液(对其浓度没有限制,例如%20可以是1~20重量%),室温静置一定时间(例如1-100min),进行交联。然后,向上述反应液滴中加入一定量的氨基酸(一种氨基酸或多种氨基酸的混合物)或蛋白质(例如BSA等)来终止交联反应。

  在所述步骤B中,对所述步骤A中获取的细胞进行裂解,从而得到被固定化的染色质。细胞裂解通常可以通过将所述细胞置于适当的细胞裂解液中来进行。所述细胞裂解液的配方及用量可由本领域技术人员根据所述细胞的种类及量适宜确定。

  在所述步骤C中,对所述步骤B中获得的被固定化的染色质进行消化,得到被固定化的染色质片段。所述消化可以使用脱氧核糖核酸酶来进行。作为所述脱氧核糖核酸酶优选Ⅰ型限制性内切酶、Ⅱ型限制性内切酶或Ⅲ型限制性内切酶。在传统的Hi-C文库构建方法中,只能使用酶切后会形成5’端突出粘末端的Ⅱ型限制性内切酶进行染色质消化,这造成了其染色质消化模式较为单一,但本发明的Hi-C文库构建方法可以不局限于此。在本发明的Hi-C文库构建方法中,可以使用脱氧核糖核酸酶来消化染色质,丰富了染色质消化模式,有利于提高Hi-C方法的分辨率。当然,本方法的被固定化的染色质消化也可以采用脱氧核糖核酸酶以外的其他酶进行,例如,非特异性核酸酶(如广谱核酸酶)等。

  在所述步骤D中,将所述步骤C中得到的被固定化的染色质片段直接进行重新连接,得到重新连接的被固定化的染色质片段。在这里,“直接进行重新连接”是指:不对所述被固定化的染色质片段进行生物素标记,而将这些片段重新连接起来。此外,在所述步骤C中使用产生粘性末端的限制性内切酶进行染色质消化时,得到的被固定化的染色质片段具有粘性末端,优选地,本发明的Hi-C文库构建方法中不像现有技术那样对这些粘性末端进行末端修复使之成为平末端,而是采用粘性末端连接方式将这些染色质片段重新连接起来,这样效率要高于平末端连接。当然,本方法也可以采用修复后进行平末端连接(但不进行连接点标记如加入带生物素标记的核苷酸修复粘末端)或者采用产生平末端的限制性内切酶酶切,然后进行平末端连接。末端连接可以例如通过使用具有末端连接活性的DNA连接酶来进行,所述具有粘性末端连接活性的DNA连接酶例如T4DNA连接酶、T3DNA连接酶、大肠杆菌DNA连接酶、热稳定DNA连接酶等。连接反应中使用的酶和底物的量、以及反应条件可由本领域技术人员视需要适宜选择。例如,通常可以在0.1~10×连接酶缓冲液中于0~80℃(优选10~40℃)进行约1分钟~200小时(优选1~30小时)。

  在所述步骤E中,使所述步骤D中得到的重新连接的被固定化的染色质片段解除固定化,释放DNA片段。在本说明书中,“解除固定化”是指:解除所述被固定化的染色%20质片段中、在三维空间上相互接近的部分的被固定状态。例如,在所述固定化是通过将染色质上的蛋白质交联而实现的情况下,所述“解除固定化”是指蛋白质去交联。蛋白质去交联的方法是本领域技术人员已知的,通常可以采用生物、化学处理进行解交联的方法和/或高温处理解交联的方法,从而释放DNA片段。例如,作为高温处理解交联的方法,可以通过将上述连接反应后的体系置于50~100℃(优选60~80℃)、1分钟~200小时(优选1~30小时)来进行蛋白质解交联。作为生物、化学处理解交联的方法,可以通过向所述体系中加入内肽酶、丝氨酸蛋白酶、巯基蛋白酶、金属蛋白酶、天冬氨酸蛋白酶、胃蛋白酶、胰蛋白酶、组织蛋白酶、木瓜蛋白酶、枯草杆菌蛋白酶、蛋白酶K、DTT、NaCl、KCl或它们的组合来进行。当然,也可以通过组合使用生物、化学处理解交联的方法和高温处理解交联的方法来进行蛋白质解交联。

  在所述步骤F中,将所述步骤E中释放的DNA片段进一步片段化,得到更小的DNA片段。在本说明书中,“更小的DNA片段”是指其大小适于构建测序(例如二代测序、三代测序或四代测序)用DNA文库,例如Illumina%20DNA测序文库。“更小的DNA片段”的具体大小可以是例如10~50000bp、优选50~1000bp。在本发明的Hi-C文库构建方法中,对片段化的方法没有特殊限制,例如可以采用超声打断法、转座酶法、液压剪切法、酶切法等将所述扩增产物片段化。采用上述方法将扩增产物片段化的技术是本领域技术人员已知的,可视需要选择适宜条件来进行。

  在所述步骤G中,以所述步骤E或步骤F的产物作为待测序DNA片段,构建测序用DNA文库。构建测序用DNA文库一般需要0.001~1000ng的DNA。可以采用例如标准Illumina%20DNA小片段建库方法、PCR%20free方法、一步法等DNA小片段建库方法来构建所述测序用DNA文库。各种构建测序用DNA文库的方法是本领域技术人员已知的,可以由本领域技术人员按照常规操作来进行。例如,标准Illumina%20DNA小片段建库方法通常包括末端修复、末端加A、Adapter连接、扩增、扩增产物纯化等步骤,可以按照Illumina公司推荐的方法来进行。

  需要说明的是,在上述步骤C~F中均可以视需要取一部分产物进行下一步骤。

  通过采用本发明的Hi-C文库构建方法构建的测序用DNA文库进行测序,再与染色质DNA一级序列信息进行比对,即可获得可能在空间上相互作用的染色质区域的信息。与传统方法不同,本发明的Hi-C文库构建方法不使用生物素钓取重连位点DNA片段,而可以是利用信息学分析过滤掉非重连位点所处的片段。由于标准的Hi-C测序数据分析方法中即有对这种片段的过滤,所以本发明的Hi-C文库构建方法构建的文库无需额外的过滤条件即可进行生物信息学分析,并获得染色体在三维空间上的互作信息。

  实施例

  以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例是用于解释本发明,并非对本发明的限定。

  实施例1

  1.以25×106个细胞起始,获取染色质被固定化的细胞。固定化采用终浓度为2%的甲醛溶液室温交联1min-4h。

  2.细胞裂解。每份细胞(25×106个)加入1ml冰镇的裂解液(10mM%20Tris-HCl,30mM%20NaCl,0.2%NP-40,10%蛋白酶抑制剂,pH7.4),置于冰上15min。在冰上用组织匀浆器研磨细胞4组,每组30次。将裂解液室温2,000×g离心5min。使用预冷的限制性内切酶对应的酶切缓冲液(1×NE%20Buffer%20Cutsmart)清洗样品两次并2000×g离心5min收集。使用260μL该酶切缓冲液重悬样品。

  3.消化染色质消化。上一步处理后的样品中加入1560μL限制性内切酶对应的酶切缓冲液(1×NEBuffer%20Cutsmart)和190μL%202%SDS,轻柔的上下颠倒混匀,37℃孵育60min;加入220μL%2020%Triton%20X-100,37℃孵育60min;向每管中加入2000U限制性内切酶NlaⅢ,37℃消化过夜。65℃温浴20min,失活内切酶。

  4.使用DNA连接酶对连接相邻的DNA片段。加入终浓度为1×的T4ligation%20buffer和200U的T4DNA连接酶,16℃过夜。

  5.去交联及DNA提取。加入200μL%2010mg/ml的proteinase%20K并于65℃中孵育约4h以去除交联。使用酚-氯仿法提取重连后的DNA片段(使用2体积的水饱和酚—氯仿抽提DNA两次,然后用1倍体积的异丙醇将DNA沉淀下来,4℃12,000xg离心30min收集),溶解于100μL%201×TE%20buffer,pH%208.0。加入2μL%20RNAase%20A(1mg/ml),37℃温浴30min。

  6.对DNA进行片段化,使用Diagenod%20Bioruptor%20UCD-600(NGS)对扩增产物进行超声打断,打断程序为:30秒超声,30秒休息,22个循环。将前面扩增的DNA片段化成目标片段在100-700bp之间的DNA片段。

  7.小片段文库构建

  7.1末端修复

  根据下表向上步产物中加入加末端修复反应体系:

  

  将样本置于Thermomixer中20℃温浴30min。反应结束后使用Beckman Agencourt AMPure XP核酸纯化试剂盒回收纯化反应体系中的DNA,溶于32μL的水中。

  7.2末端加“A”

  根据下表向上步产物中加入加“A”反应体系:

  

  将样本置于Thermomixer中37℃温浴30min。使用Agencourt AMPure XP核酸纯化试剂盒回收纯化反应体系中的DNA,溶于18μL的水中。

  7.3“Adapter”连接:

  根据下表向上步产物中加入“Adapter”反应体系:

  

  

  将样本置于Thermomixer中20℃温浴15min。使用Agencourt AMPure XP核酸纯化试剂盒回收纯化反应体系中的DNA,溶于30μL的水中

  7.4文库扩增

  根据下表向上步产物中加入以下反应体系:

  

  PCR反应的程序设定如下:

  

  用Agencourt AMPure XP核酸纯化试剂盒进行纯化;溶于15μL水中;纯化后浓度测定。

  7.5文库质检,上机进行双端测序,获得数据。

  8.数据分析

  与非专利文献1不同,本发明不使用生物素钓取重连位点DNA片段,而是利用信息学分析过滤掉非重连位点所处的片段。由于标准的Hi-C测序数据分析方法中即有对这种片段的过滤(该过滤条件在非专利文献1中是为了去除文库中残余的被生物素标记的未重连片段),所以本发明构建的文库无需额外的过滤条件即可进行生物信息学分析并获得染色体在三维空间上的互作信息。本发明的方法与非专利文献1的方法的优缺点对比如下。

  建库成本和所需时间对比

  

  还需要说明的是,在可实施且不明显违背本发明的主旨的前提下,在本说明书中作为某一技术方案的构成部分所描述的任一技术特征或技术特征的组合同样也可以适用于其它技术方案;并且,在可实施且不明显违背本发明的主旨的前提下,作为不同技术方案的构成部分所描述的技术特征之间也可以以任意方式进行组合,来构成其它技术方案。本发明也包含在上述情况下通过组合而得到的技术方案,并且这些技术方案相当于记载在本说明书中。

  上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域技术人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

  工业实用性

  根据本发明,提供了一种简便、快速、低成本的Hi-C文库构建方法。

《一种简便、快速、低成本的Hi-C文库构建方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)