欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种微量细胞基因组测序文库构建方法独创技术20000字

一种微量细胞基因组测序文库构建方法

2020-11-08 14:40:17

  一种微量细胞基因组测序文库构建方法

  技术领域

  本发明涉及分子生物学实验技术领域,具体而言,涉及一种微量细胞基因组测序文库构建方法。

  背景技术

  微量细胞测序,尤其是单细胞全基因组测序(Single-cell whole-genomesequencing,scWGS)是现代分子生物学研究的一种前沿工具,能很好地揭示肿瘤等样品中的细胞异质性,发现各种突变,评估基因组不稳定性,尤其是在癌症发展过程中能够更加精确地挖掘出混合样本中的隐藏信息,具有很好的应用前景。目前已有的几种单细胞基因组技术包括DOP-PCR技术,多重置换扩增(MDA)技术,多重退火和基于环的扩增循环(MALBAC)技术,通过转座子插入进行线性扩增的LIANTI技术等。这些单细胞基因组测序方法可产生高度精确的短读长基因组测序数据,非常适用于发现拷贝数变异(CNV),小片段插入或缺失,以及单核苷酸变异(SNV),然而由于二代测序短读长的缺陷,基于单细胞基因组测序检测结构变异(SV)依然存在很大的挑战,目前也很少有相关报道。

  现有的单细胞基因组测序方法由于受到传统二代测序(NGS)技术测序短读长的限制,难以有效发现大片段或多重复序列的复杂染色体结构变异。染色体结构变异包括缺失、插入重复、倒位和易位,它们是体细胞遗传变异的主要来源,并且能够促进肿瘤的发生和转移。除SV以外,最近在人类细胞中发现了染色体外环状DNA(ecDNA)。目前研究发现ecDNA主要存在于肿瘤组织和肿瘤细胞系中,许多研究结果表明ecDNA在癌症中发挥调节作用,尤其是数百到数千kb的大分子ecDNA,可以在细胞中产生多个拷贝从而促进原癌基因表达,驱动肿瘤异质性发生以及可能参与了肿瘤的耐药性调控。这些基因组结构的异常变化对于我们揭开癌症的未知真相和复杂调控很重要,但目前尚无有效的方法实现单细胞分辨率对SV和ecDNA的检测。

  单分子实时(SMRT)测序技术在全基因组SV检测中具有独特的优势,采用连续滚环一致序列测序(CCS)模式生成DNA模板的高保真测序reads,能够实现高精度(99.8%)的长读长测序,从而提高了直接跨越SV连接点以及跨越包含重复序列复杂区域的阅读可能性。此外,长读长测序的高保真度比其他测序平台技术提高了SV检测的灵敏度和可靠性。但是,由于SMRT DNA测序需要大量的长DNA片段,单细胞来源的基因组DNA无法满足正常的建库要求,这给成功实现单细胞尺度的基因组检测带来了挑战。

  有鉴于此,特提出本发明。

  发明内容

  本发明涉及一种微量细胞测序文库构建方法,包括:

  a)获取待检测的DNA混合物;

  b)使用转座酶将所述DNA混合物片段化为核酸片段,并在所述核酸片段的两端加上相同转座接头;

  通过调整转座酶的工作浓度,将所述核酸片段的平均长度控制在5kb~20kb;

  c)利用扩增引物对所述核酸片段进行扩增。

  根据本发明的再一方面,本发明涉及如上所述的方法在微量细胞基因组测序中应用。

  本发明还涉及用于微量细胞基因组测序文库构建的试剂盒,其特征在于,包含包装浓度为0.01ng/μL~0.05ng/μL的Tn5转座酶以及片段化缓冲液。

  与现有技术相比,本发明的有益效果为:

  1)本发明所提供的方法在染色体结构变异(SV)检测中表现突出,长读长的测序数据大大增加了直接捕获完整变体结构的可能,我们能在一条完整的测序数据中直接读取到结构变异后的结果。

  2)在微量细胞特别是单细胞层面上,长读长测序数据增强了对包含大量重复序列的复杂区域的解析能力,为基因组的组装和序列结构的精准定位提供新的前景。

  3)本发明所提供的方法提供了一种在单细胞水平上研究染色体外环状DNA(ecDNA)的方法。

  附图说明

  为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

  图1为本发明Smile-seq方法技术流程示意图;

  图2为本发明一个实施例中单细胞gDNA扩增产物长度分布图,可见大部分扩增产物长度在6kb左右;

  图3为本发明一个实施例中通过PB测序后分析得到的CCS reads的读长分布,与建库前的扩增产物一致;

  图4为本发明一个实施例中使用Smile-seq检测SV结果示例;a图展示了本次实验中检测到的所有缺失,插入,重复,倒置等SV突变类型的结果统计;b图展示了用Smile-seq检测到的其中两个在k562细胞系中常见的易位突变:9号与22号染色体易位产生BCR-ABL1融合基因及NUP214-XKR3融合基因示例;

  图5为本发明一个实施例中用Smile-seq技术检测和鉴定K562中的ecDNA结果示例,a图为筛选K562细胞中ecDNA的流程示意图;b图所示实验中检测到的候选ecDNA及其长度分布统计;图c和d通过PCR和Sanger测序对部分ecDNA验证结果示例。

  具体实施方式

  现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。

  因此,旨在本发明覆盖落入所附权利要求的范围及其等同范围中的此类修改和变化。本发明的其它对象、特征和方面公开于以下详细描述中或从中是显而易见的。本领域普通技术人员应理解本讨论仅是示例性实施方式的描述,而非意在限制本发明更广阔的方面。

  本发明涉及一种微量细胞测序文库构建方法,包括:

  a)获取待检测的DNA混合物;

  b)使用转座酶将所述DNA混合物片段化为核酸片段,并在所述核酸片段的两端加上相同转座接头;

  通过调整转座酶的工作浓度,将所述核酸片段的平均长度控制在5kb~20kb;

  c)利用扩增引物对所述核酸片段进行扩增。

  为了实现在微量细胞中得到长DNA片段文库,我们开发了一种新的微量细胞测序方法并取名Smile-seq,该方法通过转座子插入扩增单细胞基因组DNA进行长片段扩增。与常用的设计不同,我们将两分子相同序列的接头嵌入到转座酶上,理论上可以通过转座PCR实现原始DNA片段的100%回收(传统转座酶采用不同的两种接头只有50%效率)。此外,通过调整转座酶的工作浓度控制核酸片段的长度,本发明也克服了相同序列的接头容易发生环化的问题。这些扩增的长片段DNA用于在SMRT DNA测序平台等第三代测序(TGS)平台上直接测序得到高质量单细胞基因组序列信息。对SV和/或ecDNA的检测具有独特的优势。

  本发明中的DNA混合物可以来源于任何样品,其中术语“样品”以其最广泛的含义使用。在一种含义中,其意指包括细胞(例如,人、细菌、酵母和真菌)、组织或活体、或获自任何来源的样本或培养物、以及生物样品。生物样品可以获自动物(包括人)、并且指其中发现的生物材料或组合物,包括但不限于骨髓、血液、血清、血小板、血浆、间隙液、尿液、脑脊液、核酸、DNA、组织、及其纯化或过滤形式。样品可以来源于健康样品或病态样品,例如肿瘤组织/细胞。然而,这些实例不应解释为限定可用于本发明的样品类型。

  术语“扩增(ampIifying或amplification)”在“核酸”或“核酸片段”此用语的上下文中共同出现时,指产生多个拷贝的多核苷酸、或多核苷酸的部分,通常从少量的多核苷酸开始(例如,少至单个多核苷酸分子),其中扩增产物或扩增子通常是可检测的。多核苷酸的扩增包括多种化学和酶促方法。在聚合酶链反应(PCR)、滚环扩增(RCA)或连接酶链反应(LCR)过程中从一个或几个拷贝的靶DNA或模板DNA分子产生多个DNA拷贝是扩增的形式。扩增不限于起始分子的严格复制。例如,使用逆转录RT-PCR从样品中有限量的RNA产生多个cDNA分子是扩增的形式。此外,在转录过程期间从单一DNA分子产生多个RNA分子也是扩增的形式。

  在一些实施方式中,所述核酸片段为平均长度控制在5kb~15kb;

  在一些实施方式中,所述核酸片段为平均长度控制在5kb~10kb;

  在一些实施方式中,所述核酸片段为平均长度控制在5.5kb~7kb;

  在一些实施方式中,所述核酸片段为平均长度控制在5.9kb~6.1kb;

  在一些实施方式中,所述核酸片段为平均长度控制在6kb。

  在一些实施方式中,所述转座酶是高活性的。

  在一些实施方式中,所述转座酶选自Tn1、Tn2、Tn3、Tn4、Tn5、Tn6、Tn7、Tn9、Tn10、Tn551、Tn971、Tn916、Tn1545、Tn1681、Tgf2、Tol2、Himar1以及HARBI1中的一种或任意多种的组合。

  Tgf2和Tol2来自于hAT家族,Himar1来自于Tcl/Mariner家族,HARBI1来自于PIF/Harbinger家族。

  优选的转座酶为Tn5。

  在一些实施方式中,所述转座酶为Tn5的工作浓度为0.01ng/μL~0.05ng/μL,还可以选择0.015ng/μL~0.025ng/μL,或为0.017ng/μL、0.020ng/μL或0.023ng/μL。

  在本发明中,Tn5酶控制在适当范围内,可确保将单细胞基因组DNA切割成合适的长片段(片段富集在5kb~20kb长度)。

  在一些实施方式中,在步骤b)中,所用片段化缓冲液的主要活性成分包括40mM~60mM TAPS-NaOH或TAPS-KOH,20mM~30mM Mg2+,35g/100ml~45g/100ml的PEG 8000,pH=8.0~8.6。

  在一些实施方式中,在步骤b)中,所用片段化缓冲液的主要活性成分包括45mM~55mM TAPS-NaOH或TAPS-KOH,22mM~28mM Mg2+,37g/100ml~43g/100ml的PEG 8000,pH=8.1~8.5。

  在一些实施方式中,在步骤b)中,所用片段化缓冲液的主要活性成分包括47mM~53mM TAPS-NaOH或TAPS-KOH,22mM~27mM Mg2+,38g/100ml~42g/100ml的PEG 8000,pH=8.2~8.4。

  在一些实施方式中,在步骤b)中,所用片段化缓冲液的主要活性成分包括50mMTAPS-NaOH或TAPS-KOH,25mM Mg2+,40g/100ml的PEG 8000,pH=8.3。

  在本发明中,Tn5转座酶商业化试剂盒中提供的缓冲液不适合皮克级的核酸片段转座反应。调整缓冲液配方后5×TAPS_PEG 8000在单细胞反应中表现稳定。

  该本发明中,需要对核酸片段进行扩增,以得到足够量的文库起始DNA量。PCR反应的循环数不能超过22个,否则将扩增过度,导致较短片段的偏倚。在一些实施方式中,所述扩增的循环数为15~22,还可以选择18~20,优选20。

  在一些实施方式中,所述接头的长度为9bp~18bp,例如10bp、11bp、12bp、13bp、14bp、15bp、16bp、17bp。

  在一些实施方式中,所述扩增引物包括测序接头,细胞识别条码以及用于与所述转座接头结合并进行PCR延伸扩增的锚定序列。

  其中细胞识别条码用于识别并区分来自不同的细胞,或来自同一组内的微量细胞的样品。

  在一些实施方式中,所述DNA混合物为基因组DNA。

  在一些实施方式中,所述微量细胞的细胞数目≤10000个细胞;

  在一些实施方式中,所述微量细胞的细胞数目≤1000个细胞;

  在一些实施方式中,所述微量细胞的细胞数目为单细胞。

  在一些实施方式中,所述微量细胞为单克隆系。

  在一些实施方式中,所述识别标签及所述随机细胞条码的长度可以独立的选自10bp~35bp,例如11bp、12bp、13bp、14bp、15bp、16bp、17bp、18bp、19bp、18bp、19bp、20bp、21bp、22bp、23bp、24bp、25bp、26bp、27bp、28bp、29bp、30bp、31bp、32bp、33bp、34bp。

  在一些实施方式中,所得的扩增产物还经过至少一次纯化。可使用多种纯化方法,如使用XP磁珠纯化筛选,磁珠使用比例0.3~0.6倍体积,更优为0.4倍体积,纯化次数为2次。

  根据本发明的再一方面,本发明涉及如上所述的方法在微量细胞基因组测序中应用。

  在一些实施方式中,所述微量细胞基因组测序基于三代测序平台,例如PacificBiosciences测序平台。

  在一些实施方式中,所述应用中包括对扩增后的不同细胞条码的扩增产物进行混合建库的步骤。

  当每组微量细胞中的细胞数目为单细胞时,利用本方法将不同细胞条码的扩增产物混合之后纯化得到的DNA总量可以达到微克级别。

  在一些实施方式中,所述微量细胞基因组测序用于发现包括拷贝数变异、小片段插入或缺失、单核苷酸变异、染色体结构变异、染色体外环状DNA中的一种或多种,优选包括基因组单碱基突变、染色体结构变异、染色体外环状DNA中的至少一种。

  本发明还涉及一种用于微量细胞基因组测序文库构建的试剂盒,其包含包装浓度为0.01ng/μL~0.05ng/μL的Tn5转座酶以及片段化缓冲液。

  在一些实施方式中,所述片段化缓冲液的主要成分包括40mM~60mM TAPS-NaOH或TAPS-KOH,20mM~30mM Mg2+,35g/100ml~45g/100ml的PEG8000,pH=8.0~8.6。

  在一些实施方式中,所述试剂盒还包含转座接头、如上所述的扩增引物、dNTP、DNA聚合酶、扩增缓冲液、DNA纯化试剂以及水中的一种或多种。

  在一些实施方式中,所述DNA聚合酶是高保真的。

  下面将结合实施例对本发明的实施方案进行详细描述。

  实施例

  以人的K562细胞系为例,对照组采用标准的大量细胞基因组DNA提取和NGS文库构建及测序:基因组DNA利用DNeasy Blood and Tissue Kit(QIAGEN,69504)进行提取,用Qubit dsDNA HS Assay Kit(Invitrogen,Q32851)进行定量,约500ng基因组DNA使用Covaris S220进行片段化后利用KAPA Hyper Prep Kit(Roche,KR0961)进行文库构建。最终得到的测序文库使用NGS平台XTEN进行测序。

  本实施例对最佳反应条件进行了反复修改验证,包括转座反应中酶量的控制(即片段长度控制),转座缓冲液配方和DNA聚合酶的筛选,以实现单细胞基因组长片段捕获和扩增。

  Smile-seq具体实施过程如下

  单细胞裂解

  细胞裂解液配方如下:

  分离得到单细胞,将每个细胞移入独立的反应管中,每管中加入2.5μL细胞裂解液,震荡混合后,50℃孵育3小时,然后70℃孵育30分钟使蛋白酶充分失活,样品可直接进行后续处理或冻存于-80℃。

  2.转座酶接头处理(TTE Mix)

  拿到Adapter引物后稀释成100μM,1∶1退火反应得到接头混合液(Adapter Mix),梯度退火反应在PCR仪中进行:75℃,15分钟,60℃,10分钟,50℃,10分钟,40℃,10分钟,25℃,30分钟。

  Tn5与接头包埋

  充分吹打混匀,30℃孵育1小时,得到的Tn5转座酶复合物(TTE Mix),储液浓度40ng/μL,-20℃保存。

  Adapter引物序列如下:

  Adapter primer1 5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’

  Adapter primer2 5’-phos-CTGTCTCTTATACACATCT-NH3-3’

  Coupling Buffer包含在Vazyme商品化试剂盒S111-01中。

  3.转座子介导的DNA片段化

  片段化反应液配方如下:

  向2.5μL细胞裂解产物中加入7.5μL片段化反应液,温和吹打几次使混匀。在温控循环PCR仪上进行如下反应:55℃ 10分钟,然后于4℃持温。

  加入2.5μL 0.2%SDS终止反应,混匀后室温放置5分钟完成DNA片段化。

  5×TAPS_PEG 8000成分如下:50mM TAPS-NaOH(or KOH),pH 8.3(RT),25mMMgCl2,40%PEG 8000。

  4.PCR扩增反应

  PCR扩增反应液配方如下:

  向上一步反应产物中加入37.5μL PCR扩增反应液使最终反应体系为50μL,进行如下PCR扩增程序:

  *PCR引物I5-PB包含了16bp的随机条码序列和14bp与模板DNA末端接头互补的锚定序列:5′AATGATACGGCGACCACCGAGATCTNNNNNNNNNNNNNNNNTCGTCGGCAGCGTC3′。其中N代表ATCG中的任意一种。

  5.样品混合及纯化

  将连接上不同细胞条码的gDNA扩增样品混合在一起,用0.4×AMPure PB磁珠纯化,先将0.4倍体积的磁珠与产物混合,室温孵育5分钟,然后置于磁力架上,待磁珠吸附到侧壁,去除上清。磁珠用80%乙醇洗涤2次,晾干,用适量体积的水溶液重悬磁珠,室温静置2分钟后,置于磁力架上,上清产物转移到新的样品管中。重复纯化步骤一次,纯化产物溶解在适量PB缓冲液中使终浓度大于50ng/μL以满足后续三代测序文库构建的起始要求。

  6.PB文库构建和测序

  按照Pacific Biosciences测序平台要求对扩增产物进行文库构建和测序,使用SMRTbell Template Prep Kit v.1.0-SPv3(Pacific Biosciences,Ref.No.100-991-900),按照说明书进行PB测序文库构建。

  本发明实施例中用到的引物序列:

  Adapter primer1 5'-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3';Adapterprimer2 5'-phos-CTGTCTCTTATACACATCT-NH3-3'。即为Adapter引物,通过退火处理后形成的引物二聚体包含19bp双链的转座酶结合位点和一段单链Adapter序列。

  I5-PB引物:5′AATGATACGGCGACCACCGAGATCTNNNNNNNNNNNNNNNNTCGTCGGCAGCGTC3′,为gDNA模板PCR扩增引物,包含了一段条码定位标签,16bp的随机条码序列和14bp与模板DNA末端接头互补的锚定序列。

  其它试剂信息:Tris-EDTA(Santa Cruz,sc-296654);10%Triton X-100(Sigma-Aldrich,T9284);Qiagen protease(Qiagen,1020952);1M KCL(Sigma-Aldrich,58221-500ML-F);TAPS(Sigma-Aldrich,T51301000);KOH(Sigma-Aldrich,P1767-250G);MgCl2(Sigma-Aldrich,20-303);PEG 8000(Sigma-Aldrich,V3011);Tn5(Vazyme,S111-01);0.2%SDS(Psaitong,PS0062-100mL);2×G flex PCR Buffer&Tks Gflex DNA Polymerase(Takara,R060B);Ampure PB beads(Pacific Biosciences,100-265-900);SMRTbellTemplate Prep Kit(Pacific Biosciences,100-991-900)。

  以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

  以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

《一种微量细胞基因组测序文库构建方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)