欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种简化代表性单细胞全基因组建库方法及其应用独创技术30836字

一种简化代表性单细胞全基因组建库方法及其应用

2021-02-07 17:00:57

一种简化代表性单细胞全基因组建库方法及其应用

  技术领域

  本专利涉及生物学以及简化基因组领域,尤其涉及一种简化代表性单细胞全基因组建库方法及其应用。

  背景技术

  简化基因组测序(reduced-representation genome sequencing,RRGS)是指利用生物信息学方法,设计标记开发方案,富集特异性长度片段,并应用高通量测序技术获得海量标签序列来对部分基因组进行序列测定,代表目标物种全基因组信息的测序方法。简化基因组常常应用于无参考基因组序列的样本分析中,群体进化研究涉及较大的样本量,简化基因组可以大幅减少测序成本的支出。另外,用简化基因组测序策略研究群体进化可以不受参考基因组限制,研究物种范围更广泛,因此简化基因组具有广泛的应用前景。

  常见的简化基因组技术主要有RAD(Restriction site Associated DNA)、GBS(Genotyping By Sequencing)。目前针对简化基因组的建库方案基本是以微克级别的全基因组进行酶切后进行的,以人基因组大小为例,需要的细胞个数为15万个,通过酶切基因组产生的等长片段进行高通量测序,可以大幅降低基因组的复杂度,快速进行全基因组范围内大规模SNP标记的开发与分型。可用于种质资源鉴定、群体进化、GWAS、图谱构建、BSA定位等,为功能基因的挖掘及标记辅助育种提供理论基础。对于大量群组样本或可进行培养的微生物样本可通过DNA抽提的方式获得基因组DNA,但微量样本或细胞数较少时检测就显得尤为困难,特别是一些难以人工培养的细胞或微生物,对其进行简化基因组的研究以现有方案来讲是不可能的,常规建库流程需要DNA起始量在ng级以上,所用接头及其浓度达不到单细胞文库构建要求。如何针对微量样本或细胞数较少样本进行简化基因组的研究已成为现有技术中尚待解决的难题之一。

  因此为解决如何针对微量样本或细胞数较少样本进行简化基因组的研究问题,本专利创造性地提供了一种较佳的简化代表性单细胞全基因组文库构建试剂盒,在样本裂解过程中通过调整试剂成分、特殊引物设计、调整限制性内切酶酶切后接头修饰及浓度等方式进行优化,可适用于单细胞样本的简化基因组文库扩增。具体而言,通过本专利提供的试剂盒可以实现一步法文库构建,从而将简化基因组的起始量低至单细胞水平,适用于各种常规分离方式无法获得或培养的样品扩增;通过调整引物结构及浓度、试剂成分等,适宜单细胞水平建库。总之本发明专利中的接头经过修饰和浓度调整,可以适用于单细胞pg级别起始量的DNA接头连接,可以达到较好的接头连接效率,从而使得本专利提供的方法适用于单细胞级别基因组起始量样品的简化基因组文库构建,所得文库可较好地反应出样本物种全基因组信息。

  同时碱基错误也是现有技术单细胞扩增过程中面临的主要难题之一,简化代表性单细胞全基因组文库中也存在碱基错误的问题。大量研究指出,SNV的假阳性主要是胞嘧啶突变成胸腺嘧啶(C→T),如果能够减少C→T突变的量,就可以大幅度降低单细胞扩增过程中的碱基错误率,减少SNV的假阳性。现有技术在扩增过程中,为获得高保真、高覆盖度基因组信息难度较大,除了改进扩增方法和分析手段以外,样品的裂解往往会被忽视。在裂解过程中,基因组DNA解螺旋成线状DNA双链,与此同时,部分胞嘧啶会脱氨基成为尿嘧啶。虽然这一过程在细胞内也会偶尔发生,但在体外裂解时,突变的频率则大大提高。这些突变的尿嘧啶如果不经过修复,会在指数扩增中被放大,最终导致SNV假阳性。实际操作中,裂解方法、DNA聚合酶的保真性、扩增区域的GC含量等都会导致碱基错误,从而产生非真实的单核苷酸变异,即SNV假阳性问题。

  因此为进一步解决简化代表性单细胞全基因组文库中碱基错误率、扩增偏倚量大、扩增质量不好、假阳性等问题,本发明同时创造性地设计并加入酶处理步骤,意想不到的将一种可以特异性切除尿嘧啶核苷酸的酶应用于简化代表性单细胞全基因组样品扩增中,可以显著降低扩增的错误率,降低了了非真实的单核苷酸变异产生,同时利用平行样本分析方案,解决可能存在的等位基因缺失问题。

  发明内容

  鉴于现有技术的不足,本专利旨在提供一种更佳的适用于简化代表性单细胞全基因组文库构建试剂盒,一方面旨在通过调整引物结构及浓度、试剂成分等,适宜单细胞水平建库;另一方面通过一步法文库构建,从而将简化基因组的起始量低至单细胞水平,适用于各种常规分离方式无法获得或培养的样品扩增;同时创造性地设计并加入酶处理步骤,意想不到的将一种可以特异性切除尿嘧啶核苷酸的酶应用于单细胞样品扩增中,可以显著降低扩增的错误率。

  为实现上述目的及其他相关目的,第一方面,本发明提供了一种简化代表性单细胞全基因组建库方法,所述方法包括如下步骤:

  (1)获取样本基因组DNA

  (2)将步骤(1)所述样本基因组DNA中加入校正酶,对所述基因组DNA进行酶处理;

  (3)将经过步骤(2)处理后获得的基因组DNA用于构建基因组DNA测序文库;其中,步骤(3)中的构建所述基因组DNA测序文库包括以下步骤:

  (3-1)对所述基因组DNA进行酶切处理;

  (3-2)对经过步骤(3-1)处理后的所述基因组DNA进行加接头处理;

  (3-3)对经过步骤(3-2)处理后的所述基因组DNA进行指数扩增,所述指数扩增的扩增子用作测序文库。

  进一步地,所述样本基因组DNA由单细胞样本裂解获得或由多细胞样本抽提获得。

  此外,可以是在进行步骤(1)之前,先对单细胞样本裂解或对多细胞样本抽提,从而获得所述样本基因组DNA。也可以采用由他人利用本领域所熟知的技术已经由单细胞样本裂解获得或由多细胞样本抽提获得的样本基因组DNA。

  进一步地,所述细胞可以是原核细胞或真核细胞。所述真核细胞可以是植物细胞或动物细胞及微生物。所述动物细胞具体选自组织消化的细胞、培养所得的细胞、胚胎发育早期的细胞、癌症早期的细胞、未经富集培养的微生物细胞、流式分选获得的细胞、有限稀释获得的细胞、激光捕获等方法获得的细胞中的任一种。

  进一步地,步骤(2)中,所述校正酶为具有DNA糖基化酶活性的酶,包括但不限于以下一种或几种:UDG酶、核酸外切酶Ⅷ的混合物,也可以单独使用UDG酶,或者其它具有此活性的DNA糖基化酶(包括(单链选择性尿嘧啶-DNA糖基化酶,TU错配DNA糖基化酶,具有甲基结合域的尿嘧啶-DNA糖基化酶)。

  需要说明,UDG酶(Uracil-DNA Glycocasylase,尿嘧啶-DNA糖基化酶,又称为尿嘧啶-N-糖基化酶,UNG)能特异性识别DNA单链或双链中的尿嘧啶残基,并从DNA上水解去除尿嘧啶残基,是碱基切除修复过程中的重要组分。

  大肠杆菌核酸内切酶Ⅷ(EndonucleaseⅧ)既有N-糖基化酶活性也有AP-裂解酶活性。N-糖基化酶活性可释放双链DNA上受损的嘧啶碱基,产生一个脱嘧啶(AP)位点。AP-裂解酶活性则分别在AP位点的3’和5’端切割磷酸二酯键,产生5’磷酸和3’磷酸末端。可以有效修复扩增中导致的胞嘧啶脱氨基形成尿嘧啶的错误。

  本发明的技术方案创造性地通过在细胞裂解步骤之后对DNA进行酶处理,切除基因组DNA中的脱氧尿嘧啶核苷酸,降低扩增后错误率和SNV检测的假阳性。

  进一步地,步骤(3-1)中,所述酶切处理酶为限制性内切酶,所述限制性内切酶可采用AarI、AatII、AccI、AceIII、AfeI、AflII,AgeI、AleI、AlwI、ApaIApaLI、ApoI、AseI、AvaI、AvaII、AvrII、BaeI、BanII、BbeI、Bbr7I、BbsI、BbvCI、BbvI、BccI、BceAI、BcefIBcgI、BciVI、BclI、BfaI、BglBsrDI、BsrFI、BsrGI、BsrI、BssHII、BssSI、BtsI、Cac8I、CdiI、ChaI、DraIII、EcoRI、EcoRV、Fnu4HI、FokI、FseI、FspAI、FspI、HhaIHincII、HindIII、HpaII、HphI、KasI、KpnI、LpnI、MaeIII、MboI、MluI、MlyI、MmeI、MnlI、MscI、MseI、MslI、NaeI、NarI、NcoI、NdeI、NheI、NlaIII、NlaIV、NruI、PciI、PfoI、PleI、PpiI、PsiI、PsrIPssI、PstI、PvuI、PvuII、RleAI、RsaI、RsrII、SacI、SacII、SapI、SbfI、ScaI、SciI、ScrFI、SelI、SexAI、SfiI、SfoI、SgrAI、SimI、SmaI、SmlI、SnaBI、SpeI、SphISrfI、SspI、StsI、StuI、StyISwaI、TaiI、TaqI、TaqII、TatI、TauI、TfiI、TseI、TspGWI、TspRI、Tth111I、UnbI、UthSI、XbaI、XcmIXhoI、XmaI、XmnI、ZraI等一种或多种的混合物。限制性内切酶缓冲液为酶推荐的反应缓冲液,优选的为fast digest buffer。

  进一步地,步骤(3-2)中,所述加接头处理中的连接接头包括接头引物,所述接头引物包括第一接头引物、第二接头引物;

  进一步地,所述第一接头引物序列如SEQ ID NO:1所示,具体为:

  5‘-AGATCGGAAGAGCACACGTCT-3’,优选的5‘端进行磷酸化修饰,更优选的5‘端进行磷酸化修饰同时3‘端进行去磷酸化修饰;

  进一步地,所述第二接头引物序列为如SEQ ID NO:2所示,具体为:

  5‘-NNAGACGTGTG-3’,优选地3‘端进行磷酸化修饰,更优选的3‘端进行双脱氧修饰。其中NN的序列根据所选的限制性内切酶酶切位点粘性末端的不同进行个数和序列的调整,举例如下表:

  进一步地,所述连接接头配制方法包括如下步骤:

  1.接头退火:按下表配置试剂

  

  2.95℃5min,1%的降温速率至15℃(约50s/℃),并保持15℃。反应结束后于-20℃

  冰箱保存。

  进一步地,所述退火缓冲液可以是TE buffer、tris-hcl(0.05mM,PH7.0-8.0)、1xThermo pol buffer、30mM HEPES(pH7.4)、10mM Tris-HCl(pH 7.5),10mM EDTA,0.1mM NaCl等具有相似功能的缓冲液所替代。

  进一步地,所述连接接头浓度为10-100μM,优选地为25-75μM,更优选的为75μM。若酶切反应时加入多种限制性内切酶,则接头种类需和内切酶种类对应,不同接头加入反应液中的浓度相同且总浓度为10-100μM。其中ATP浓度为1-5mM,优选地为2-4mM,更优选的为3mM。

  进一步地,步骤(3-3)中,所述指数扩增的扩增缓冲液配置如下:

  进一步地,所述扩增酶包括Kapa Hifi Mix(2X),也可以使用其他扩增酶及buffer进行替代,包括:vent DNA聚合酶、T7 DNA聚合酶、Bsu DNA聚合酶,大片段、T4 DNA聚合酶、DNA聚合酶I,(Klenow)大片段、DNA聚合酶I(E.coli)、TherminatorTMDNA聚合酶、Sulfolobus DNA聚合酶IV、phi29 DNA聚合酶、Bst2.0DNA聚合酶、Bst 2.0 DNA聚合酶、Bst DNA聚合酶,全长、Bst DNA聚合酶、Deep VentRTMDNA聚合酶、VentR(exo–)DNA聚合酶、DNA聚合酶、热启动Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶(提供不含镁离子的ThermoPol II缓冲液)、Taq DNA聚合酶(提供缓冲液)、热启动DNA聚合酶、DNA聚合酶、热启动Flex DNA聚合酶、超保真DNA聚合酶、热启动超保真DNA聚合酶、超保真DNA聚合酶、KAPA HiFi Uracil+ReadyMix(2x)、PfuTurbo Cx热启动DNA聚合酶等一种或几种酶的组合。

  第二方面,本发明还提供了一种如第一方面所述的文库建立方法用于单细胞样本或多细胞样本简化代表性单细胞全基因组测序中的用途。

  第三方面,本发明还提供了一种单细胞样本或多细胞样本简化代表性单细胞全基因组测序方法,包括如下步骤:采用如第一方面所述文库建立方法获得简化基因组DNA测序文库后,进行测序,对所述测序结果进行分析。

  第四方面,本发明提供了一种简化代表性单细胞全基因组文库构建试剂盒,所述试剂盒包括:细胞裂解液、细胞裂解酶、校正酶、反应终止液、第一接头引物、第二接头引物、接头缓冲液、扩增缓冲液;

  进一步地,还包括说明书,说明书上记载着如上所述任一用于一种简化代表性单细胞全基因组文库建立方法。

  进一步地,所述细胞裂解液为pH=14的缓冲液

  进一步地,所述细胞裂解液成分包括:50mM KAc,20mM Tris-Ac,10mM MgAc,0.2%Trition X-100;也可以是其他pH=14的缓冲液,如0.2M NaOH+1%SDS、0.4M KOH+80mM DTT、400mM KOH+30mM EDTA+10mM DTT、300mM KOH+10mM EDTA等,最优的为300mM KOH+10mM EDTA;

  进一步地,所述细胞裂解酶包括:蛋白酶、蛋白酶K、溶菌酶;

  进一步地,所述校正酶为具有DNA糖基化酶活性的酶,包括但不限于以下一种或几种:UDG酶、核酸外切酶Ⅷ的混合物,也可以单独使用UDG酶,或者其它具有此活性的DNA糖基化酶(包括(单链选择性尿嘧啶-DNA糖基化酶,TU错配DNA糖基化酶,具有甲基结合域的尿嘧啶-DNA糖基化酶);

  需要说明,UDG酶(Uracil-DNA Glycocasylase,尿嘧啶-DNA糖基化酶,又称为尿嘧啶-N-糖基化酶,UNG)能特异性识别DNA单链或双链中的尿嘧啶残基,并从DNA上水解去除尿嘧啶残基,是碱基切除修复过程中的重要组分。

  大肠杆菌核酸内切酶Ⅷ(EndonucleaseⅧ)既有N-糖基化酶活性也有AP-裂解酶活性。N-糖基化酶活性可释放双链DNA上受损的嘧啶碱基,产生一个脱嘧啶(AP)位点。AP-裂解酶活性则分别在AP位点的3’和5’端切割磷酸二酯键,产生5’磷酸和3’磷酸末端。可以有效修复扩增中导致的胞嘧啶脱氨基形成尿嘧啶的错误。

  本发明的技术方案创造性地通过在细胞裂解步骤之后对DNA进行酶处理,切除基因组DNA中的脱氧尿嘧啶核苷酸,降低扩增后错误率和SNV检测的假阳性。

  进一步地,所述反应终止液包括:尿嘧啶-糖基化酶抑制剂;

  进一步地,所述第一接头引物序列如SEQ ID NO:1所示,具体为:

  5‘-AGATCGGAAGAGCACACGTCT-3’,优选的5‘端进行磷酸化修饰,更优选的5‘端进行磷酸化修饰同时3‘端进行去磷酸化修饰;

  进一步地,所述第二接头引物序列为如SEQ ID NO:2所示,具体为:

  5‘-NNAGACGTGTG-3’,优选地3‘端进行磷酸化修饰,更优选的3‘端进行双脱氧修饰。其中NN的序列根据所选的限制性内切酶酶切位点粘性末端的不同进行个数和序列的调整;

  进一步地,所述接头缓冲液包括连接接头、ATP(10mM)、T4 DNA连接酶10X CutSmart Buffer、无核酸水;

  进一步地,所述所述接头缓冲液按照如下配比:

  进一步地,所述连接接头按照如下配制:

  a.接头退火:按下表配置试剂

  b.95℃5min,1%的降温速率至15℃(约50s/℃),并保持15℃。反应结束后于-20℃冰箱保存。

  进一步地,所述退火缓冲液可以是TE buffer、tris-hcl(0.05mM,PH7.0-8.0)、1xThermo pol buffer、30mM HEPES(pH7.4)、10mM Tris-HCl(pH 7.5),10mM EDTA,0.1mM NaCl等具有相似功能的缓冲液所替代。

  进一步地,所述连接接头浓度为10-100μM,优选地为25-75μM,更优选的为75μM。若酶切反应时加入多种限制性内切酶,则接头种类需和内切酶种类对应,不同接头加入反应液中的浓度相同且总浓度为10-100μM。

  需要说明的是,使用该方法或试剂盒,样本进行实验操作时最好采用一式2~5的平行对照体系,较优地采用3次,可根据实验结果进行调整和补充重复实验。

  需要指出,上述试剂盒可适用于固定样本、活细胞样本、珍贵样本、混合样本、降解样本。

  本专利旨在提供一种更佳的适用于简化代表性单细胞全基因组文库方法及其应用,一方面旨在通过优化引物和扩增步骤,可有效应用于微量样本或细胞数较少样本进行简化基因组的建库;同时通过酶校正处理,将一种可以特异性切除尿嘧啶核苷酸的酶处理步骤应用于简化基因组单细胞样品扩增方法中,可以显著降低扩增的错误率。与现有技术相比,本专利所提供的试剂盒具有显著优点。

  附图说明

  图1是一个较佳实施例1的样本假阳性SNV比例图

  图2是一个较佳实施例1的样本A组SNV假阳性中不同碱基突变比例图

  图3是一个较佳实施例1的样本B组SNV假阳性中不同碱基突变比例图

  图4是一个较佳实施例2的样本群体遗传参数在基因组上的FST分布图

  图5是一个较佳实施例2的样本群体遗传参数PCA主成分分析图

  具体实施方式

  下面结合具体实施例,进一步阐述本发明。应理解,实施方式只是为了举例说明本发明,而非以任何方式限制发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件或按照制造厂商所建议的条件。

  除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明方法中。文中所述的较佳实施方法与材料仅作示范之用。

  实验方案

  一、样品收集

  对分离得到的单细胞样品使用无钙镁的1xPBS洗涤3遍,收集于不超过2μl不含钙镁的1xPBS中,置于200μl PCR薄壁管中保存备用。若不能及时进行处理,于-20℃、-80℃或液氮中保存。

  本试剂盒中的细胞收集过程中的体系以2μl为佳,但也可以按倍数增加以适应不同单细胞分选体系,最大不超过10μl。后续步骤中的所有试剂也按相应比例增加即可。

  二、细胞裂解

  以下操作于冰盒上进行:

  1.将10μL细胞裂解液和0.5μL裂解酶混和均匀,用于准备细胞裂解混合液。

  2.在每个单细胞样品中加入10μL细胞裂解液(固定的单细胞样品用PBS缓冲液重悬,体积不大于2μL)。

  3.混合均匀后离心,置于PCR仪上,50℃孵育2小时裂解细胞,80℃孵育10min使酶变性。

  本试剂盒中的细胞收集过程中的体系以2μl为佳,但也可以按倍数增加以适应不同单细胞分选体系,最大不超过10μl。后续步骤中的所有试剂也按相应比例增加即可。

  所述样本基因组DNA由单细胞样本裂解获得或由多细胞样本抽提获得。

  需要指出,可以通过对单细胞样本裂解或对多细胞样本抽提,从而获得所述样本基因组DNA。也可以采用由他人利用本领域所熟知的技术已经由单细胞样本裂解获得或由多细胞样本抽提获得的样本基因组DNA。

  三、酶处理

  1.裂解完成后,在每个样品中加入1μL校正酶,混合均匀后置于PCR仪上,37℃孵育30min。

  2.在每个样品中加入3μL反应终止液,37℃孵育10min。加入无核酸水补齐至20μl。

  本试剂盒中的酶处理中所使用的校正酶可以是UDG酶和核酸外切酶Ⅷ的混合物,也可以单独使用UDG酶,或者其它具有此活性的DNA糖基化酶(包括(单链选择性尿嘧啶-DNA糖基化酶,TU错配DNA糖基化酶,具有甲基结合域的尿嘧啶-DNA糖基化酶)。

  四、酶切处理

  1.加入1-3μl限制性内切酶,3μl限制性内切酶缓冲液,加入无核酸水补齐至30μl。

  2.37℃孵育30min,80℃10min使限制性内切酶失活。

  限制性内切酶可采用AarI、AatII、AccI、AceIII、AfeI、AflII,AgeI、AleI、AlwI、ApaIApaLI、ApoI、AseI、AvaI、AvaII、AvrII、BaeI、BanII、BbeI、Bbr7I、BbsI、BbvCI、BbvI、BccI、BceAI、BcefIBcgI、BciVI、BclI、BfaI、BglBsrDI、BsrFI、BsrGI、BsrI、BssHII、BssSI、BtsI、Cac8I、CdiI、ChaI、DraIII、EcoRI、EcoRV、Fnu4HI、FokI、FseI、FspAI、FspI、HhaIHincII、HindIII、HpaII、HphI、KasI、KpnI、LpnI、MaeIII、MboI、MluI、MlyI、MmeI、MnlI、MscI、MseI、MslI、NaeI、NarI、NcoI、NdeI、NheI、NlaIII、NlaIV、NruI、PciI、PfoI、PleI、PpiI、PsiI、PsrIPssI、PstI、PvuI、PvuII、RleAI、RsaI、RsrII、SacI、SacII、SapI、SbfI、ScaI、SciI、ScrFI、SelI、SexAI、SfiI、SfoI、SgrAI、SimI、SmaI、SmlI、SnaBI、SpeI、SphISrfI、SspI、StsI、StuI、StyISwaI、TaiI、TaqI、TaqII、TatI、TauI、TfiI、TseI、TspGWI、TspRI、Tth111I、UnbI、UthSI、XbaI、XcmIXhoI、XmaI、XmnI、ZraI等一种或多种的混合物。限制性内切酶缓冲液为酶推荐的反应缓冲液,优选的为fast digest buffer。

  五、加接头

  1.将3μl接头缓冲液加入步骤四获得的酶切产物中,接头缓冲液按照如下表1配置。

  2.反应条件:15℃2h后4℃暂存。

  表1

  其中连接接头配制方法:

  a.按如下表2配置连接接头试剂

  表2

  

  b.95℃5min,1%的降温速率至15℃(约50s/℃),并保持15℃。反应结束后于-20℃冰箱保存。

  其中第一接头引物序列为5‘-AGATCGGAAGAGCACACGTCT-3’,优选的5‘端进行磷酸化修饰,更优选的5‘端进行磷酸化修饰同时3‘端进行去磷酸化修饰;

  第二接头引物序列为5‘-NNAGACGTGTG-3’,优选地3‘端进行磷酸化修饰,更优选的3‘端进行双脱氧修饰。其中NN的序列根据所选的限制性内切酶酶切位点粘性末端的不同进行个数和序列的调整,

  退火缓冲液可以是TE buffer、tris-hcl(0.05mM,PH7.0-8.0)、1xThermo pol buffer、30mM HEPES(pH7.4)、10mM Tris-HCl(pH 7.5),10mM EDTA,0.1mM NaCl等具有相似功能的缓冲液所替代。

  连接接头浓度为10-100μM,优选地为25-75μM,更优选的为75μM。若酶切反应时加入多种限制性内切酶,则接头种类需和内切酶种类对应,不同接头加入反应液中的浓度相同且总浓度为10-100μM。

  ATP浓度为1-5mM,优选地为2-4mM,更优选的为3mM。

  本发明专利中的接头经过修饰和浓度调整,可以适用于单细胞pg级别起始量的DNA接头连接,可以达到较好的接头连接效率。常规建库流程需要DNA起始量在ng级以上,所用接头浓度达不到单细胞文库构建要求。

  六、扩增

  1.按照如下表3配置扩增缓冲液

  2.

  表3

  

  其中,Kapa Hifi Mix(2X)可以使用其他扩增酶及buffer进行替代。其中,聚合酶替代如vent DNA聚合酶、T7DNA聚合酶、Bsu DNA聚合酶,大片段、T4 DNA聚合酶、DNA聚合酶I,(Klenow)大片段、DNA聚合酶I(E.coli)、TherminatorTMDNA聚合酶、Sulfolobus DNA聚合酶IV、phi29 DNA聚合酶、Bst2.0DNA聚合酶、Bst 2.0 DNA聚合酶、Bst DNA聚合酶,全长、Bst DNA聚合酶、Deep VentRTMDNA聚合酶、VentR(exo–)DNA聚合酶、DNA聚合酶、热启动Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶、热启动Taq DNA聚合酶、Taq DNA聚合酶大片段、Taq DNA聚合酶(提供不含镁离子的ThermoPol II缓冲液)、Taq DNA聚合酶(提供缓冲液)、热启动DNA聚合酶、DNA聚合酶、热启动Flex DNA聚合酶、超保真DNA聚合酶、热启动超保真DNA聚合酶、超保真DNA聚合酶、KAPA HiFi Uracil+ReadyMix(2x)、PfuTurbo Cx热启动DNA聚合酶等一种或几种酶的组合。

  反应条件按照如下表4:

  表4

  其中,PCR循环数为15-25cycles,优选的为20-25cycles,最优的为22-24cycles;相应的扩增缓冲液10×Phi29 buffer也可以是上述酶对应的任一种或多种buffer。优化的PCR扩增条件,加入touch down步骤可平衡不同接头扩增时Tm值的微小差异,保证不同DNA片段的扩增效率。

  七、文库筛选及测序

  1.使用胶回收或磁珠片段筛选方式对目的片段范围进行筛选及纯化。

  2.选择合适的测序平台进行测序。

  实施例1

  人外周血样本简化基因组文库构建

  1.取外周血样品,将分离得到的白细胞分为6管,每管1个细胞,以保证获得同一人单细胞样品。分为A、B两组,分别命名为A1/A2/A3、B1/B2/B3。A组除不加入步骤2的酶处理步骤外,其余按照上述技术方案进行扩增,B组则完全按照上述技术方案进行扩增及建库。同管血液取500微升进行全血DNA抽提,命名为bulk,用作后续假阳性对比。

  2.将上述扩增产物磁珠纯化后,测序深度100乘。bulk样本同时进行建库测序。

  3.数据分析:统计各个样品和Bulk样品之间的碱基突变类型及比例,以及扩增的错误率。

  4.结果分析:

  (1)常规建库流程需要DNA起始量在ng级以上,所用接头浓度达不到单细胞(pg级别)文库构建要求,因此常规流程的引物及其浓度无法实现单细胞文库构建,无法开展针对微量样本或细胞数较少样本进行简化基因组的研究。

  本实施例中选用人体外周血单细胞样本作为实验对象,创造性地通过接头引物修饰和浓度调整,适用于单细胞pg级别起始量的DNA接头连接,同时达到较好的接头连接效率,实现了简化基因组单细胞文库构建,从而使得针对微量样本或细胞数较少样本进行简化基因组的研究成为可能。

  (2)使用GATK获得的扩增测序数据的SNV数量

  ①A组为常规扩增组,B组为使用UDG酶优化的扩增组。具体扩增数据,请见如下表5:

  表5

  相同来源和处理方式的单细胞样品分为两组,A组为常规扩增组,B组为使用UDG酶优化的扩增组。分析结果显示,A组的假阳性SNV占总SNV的比例明显高于B组(0.30%vs 0.12%),具体样本假阳性SNV比例图请见图1。

  ②分析SNV假阳性中不同碱基突变所占的比例

  结果显示本次实验B组(在细胞裂解步骤后使用UDG酶处理样品)C→T的碱基突变数量明显减少,整体的假阳性SNV数量也明显降低。S组假阳性统计结果请见图2,US组假阳性统计结果请见图3。

  由上述结果以及数据可看出,常规流程的引物及其浓度无法实现单细胞文库构建,无法开展针对微量样本或细胞数较少样本进行简化基因组的研究,本实施例中选用人体外周血单细胞样本作为实验对象,创造性地通过接头引物修饰和浓度调整,适用于单细胞pg级别起始量的DNA接头连接实现了简化基因组单细胞文库构建,从而使得针对微量样本或细胞数较少样本进行简化基因组的研究成为可能。

  同时所得文库在假阳性率统计上普遍低于未使用UDG酶处理样本。表明本专利方案的实施步骤可有效降低假阳性率。本发明的设计方案可有效针对微量样本或细胞数较少样本进行简化基因组的单细胞样本扩增以及建库,极大地拓展了简化基因组的应用范围;分析数据结果显示假阳性有了显著下降,对后续分析有着极大的帮助。

  实施例2

  研究两个不同地区(地区A、地区B)鲶鱼单个受精卵样本种群间基因组差异性,按照技术方案中流程进行单个受精卵样本的扩增及文库构建,同时采用地区C鲈鱼单个受精卵样本进行常规基因组文库构建,以此作为对照分析样本。进行关联分析结果如下,针对各群体遗传参数在基因组上的分布进行FST分析具体请见图4所示,对其进行PCA分析具体请见图5所示。

  根据图4、5具体分析如下:FST在遗传学分析中的意思是F-statistics(F分析)。Fst是表征亚群体间的遗传分化尺度。可以对不同人群之间遗传关系的远近进行量化。FST分析发现:虽然两个区域鲶鱼单个受精卵样本间的基因组差异性较小(FST=0.028),但基因组上的一些区域却表现出了较大的差异(图4)。主成分分析(PCA)是一种纯数学的运算方法,可以将多个相关变量经过线形转换选出较少个数的重要变量。基于SNP,通过PLINK软件进行主成分分析(Principal components analysis,PCA)分析,得到两类样品的主成分聚类情况。通过PCA分析结果(图5),能够看出两个不同地区的鲶鱼虽然同属一个物种,但相关性较差并与鲈鱼有较好的区分。通过比较不同模型单个受精卵的联合等位基因频谱,可以发现种群存在不均匀的基因渗透现象,导致了其种群的分化。由上述实施例可知,本发明方法可以应用于单细胞样本,可以进行细胞群体中单个细胞的区分。

  以上详细描述了本专利的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本专利的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

  序列表

  <110> 上海美吉生物医药科技有限公司

  <120> 一种简化代表性单细胞全基因组建库方法及其应用

  <160> 2

  <170> SIPOSequenceListing 1.0

  <210> 1

  <211> 21

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 1

  agatcggaag agcacacgtc t 21

  <210> 2

  <211> 11

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 2

  nnagacgtgt g 11

《一种简化代表性单细胞全基因组建库方法及其应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)