单细胞高通量测序文库构建方法及其试剂盒
技术领域
本发明涉及高通量基因测序技术领域,特别是涉及一种单细胞高通量测序文库构建方法及其试剂盒。
背景技术
新一代高通量测序技术以其低成本、高通量的优势逐渐成为分子检测技术的主流,被成功应用到各种领域。目前很多科学研究和临床检测需要在单细胞或微量基因组水平进行,构建单细胞水平高通量测序文库是进行单细胞高通量测序的前提。目前通用的单细胞高通量测序文库的构建方法是在传统高通量测序文库构建前,首先使用全基因组扩增(whole genome amplification,WGA)技术进行单细胞基因组放大,以满足建库样本量需求,然后再进行传统高通量测序文库构建。传统高通量测序文库构建主要包括超声破碎或酶切法对靶基因组进行片段化,然后通过末端修复、加接头、PCR扩增及磁珠纯化等一系列过程。故整个单细胞高通量测序文库构建流程耗时极长且操作复杂,难以达到某些检测的时效性要求;另外因为单细胞全基因组扩增和建库中存在多次PCR扩增步骤,带来的扩增偏倚严重影响检测结果的真实性。因此,研发单细胞水平的新一代快速高通量测序文库构建和试剂盒进行高通量测序,已成为分子生物学研究中的迫切需求。
发明内容
基于此,有必要针对传统单细胞高通量测序文库构建流程操作复杂、耗时长,文库构建质量低的问题,提供一种单细胞高通量测序文库的构建方法及其试剂盒。
本发明提供一种单细胞高通量测序文库的构建方法,包括如下步骤:
取单细胞样本,加入单细胞裂解试剂以释放单细胞中的基因组DNA,得到含有单细胞基因组DNA的混合液,所述单细胞裂解试剂包括细胞裂解液和蛋白酶;
将所述含有单细胞基因组DNA的混合液加入到转座片段化反应体系溶液中孵育,得到连接有转座子DNA序列的单细胞基因组DNA片段,其中,所述转座片段化反应体系溶液中包括转座酶复合物,所述转座酶复合物包括转座酶以及与所述转座酶连接的两条转座子;
将连接有转座子DNA序列的单细胞基因组DNA片段置入PCR反应体系中进行PCR扩增,得到带有测序接头的DNA片段,所述PCR反应体系中含有两条具有特异性识别标签的测序接头引物;
将所述带有测序接头的DNA片段纯化、筛选,得到文库产物。
上述单细胞高通量测序文库的构建方法较常规文库构建方法而言大大节约时间,并且操作更简单,实现了直接以单细胞样本为材料的快速建库,且具有很高的扩增均一性、覆盖度和拷贝数变异分辨率。此外,单细胞高通量测序文库的构建方法中所采用的单细胞裂解试剂优能够将细胞完全裂解,进而将DNA的充分释放。从而能够在单细胞水平上构建高水平文库。
具体而言,将经组装的携带有转座酶的转座子的序列(两条DNA)插入单细胞基因组DNA中,酶切DNA的同时,使片段化DNA两端带有相同序列的转座子DNA序列,然后再放入PCR反应溶液(包括测序P接头引物、测序A接头引物)中经PCR扩增使片段化DNA加上测序特异性接头(A接头和P接头),进而省去了常规建库过程中需要对裂解后的单细胞基因组DNA进行全基因组扩增以及磁珠纯化等一系列繁琐的过程,以使文库可在90分钟内完成构建。
综上所述,本发明单细胞高通量测序文库的构建方法具有如下优点:1、操作简单,直接以单细胞样本为材料进行快速建库,省去了常规单细胞高通量测序文库构建需要单细胞全基因组扩增、传统酶切、反复纯化等复杂操作。2、单细胞高通量测序文库构建耗时短,90分钟内即可完成。3、只有一次PCR扩增,避免了反复扩增偏倚对检测结果真实性的负面影响,具有很高的扩增均一性、覆盖度和拷贝数变异分辨率。
在其中一个实施例中,所述单细胞样本选自极体细胞、卵裂球细胞、滋养外胚层细胞、肿瘤细胞、外周血白细胞、血浆细胞和羊水细胞中的任意一种。
在其中一个实施例中,细胞裂解液释放单细胞中基因组DNA的反应条件为:75℃,5~60min,热盖105℃;然后加入0.5-5μL浓度为25mg/ml的蛋白酶,55℃,10~300min,热盖70℃;最后75℃,5~30min,热盖105℃。
在其中一个实施例中,所述含有单细胞基因组DNA的混合液在转座片段化反应体系溶液中的反应条件为:30℃孵育5min,再66℃反应3min。
本发明还提供了一种用于单细胞高通量测序文库构建的试剂盒。
一种用于单细胞高通量测序文库构建的试剂盒,包括单细胞裂解试剂、转座片段化试剂以及PCR反应试剂,所述单细胞裂解试剂中包括细胞裂解液和蛋白酶,转座片段化试剂包括转座酶混合液、转座反应缓冲液、MgCl2、高保真DNA聚合酶,所述转座酶混合液含有转座酶复合物,所述转座酶复合物包括转座酶以及与所述转座酶连接的两条转座子,所述PCR反应试剂中包括引物Mix溶液,所述引物Mix溶液中含有两条具有特异性识别标签的测序接头引物。
上述试剂盒在用于单细胞高通量测序文库构建时,能够简化操作、节约时间,实现直接以单细胞样本为材料的快速建库,且具有很高的扩增均一性、覆盖度和拷贝数变异分辨率。
在其中一个实施例中,与所述转座酶连接的两条转座子的序列分别如SEQ ID NO:1和SEQ ID NO:2所示。
在其中一个实施例中,所述两个具有特异性识别标签的测序接头引物分别为测序A接头引物和测序P接头引物,测序A接头引物和P接头引物的序列分别如SEQ ID NO:3和SEQ ID NO:5所示。
在其中一个实施例中,所述转座酶为MuA转座酶。
在其中一个实施例中,所述细胞裂解液含有终浓度为10~100mM的Tris-HCl、终浓度为0.2~5mM的EDTA、以及终浓度为5~30mM的DTT,且细胞裂解液的pH为8.0。
在其中一个实施例中,所述转座片段化试剂中的转座反应缓冲液为4×,MgCl2溶液浓度为44mM,高保真DNA聚合酶为1U/μL的Phusion高保真DNA聚合酶。
附图说明
图1为本发明的单细胞高通量测序文库的构建方法与传统单细胞高通量文库构建方法的流程对比图;
图2为本发明的单细胞高通量测序文库的构建方法示意图;
图3为本发明的单细胞高通量测序文库的构建方法与其他单细胞建库方法的均一性对比图;
图4a为使用本发明的单细胞高通量测序文库的构建方法,对起始量100ng DNA的人变异细胞株(del(4)-13.4M)为模板的检测结果峰图;
图4b为使用本发明的单细胞高通量测序文库的构建方法,对起始量1ng DNA的人变异细胞株(del(4)-13.4M)为模板的检测结果峰图;
图4c为使用本发明的单细胞高通量测序文库的构建方法,对起始量500pg DNA的人变异细胞株(del(4)-13.4M)为模板的检测结果峰图;
图4d为使用本发明的单细胞高通量测序文库的构建方法,对起始量100pg DNA的人变异细胞株(del(4)-13.4M)为模板的检测结果峰图;
图4e为使用本发明的单细胞高通量测序文库的构建方法,对起始量15pg DNA的人变异细胞株(del(4)-13.4M)为模板的检测结果峰图;
图4f为使用本发明的单细胞高通量测序文库的构建方法,对起始量6pg DNA的人变异细胞株(del(4)-13.4M)为模板的检测结果峰图;
图5a为使用本发明的单细胞高通量测序文库的构建方法完成的人变异单细胞样本(del(2)-19.4M)检测情况图;
图5b为使用本发明的单细胞高通量测序文库的构建方法完成的人变异单细胞样本(del(2)-34.6M)检测情况图;
图5c为使用本发明的单细胞高通量测序文库的构建方法完成的人变异单细胞样本(del(2)-13.4M)检测情况图;
图5d为使用本发明的单细胞高通量测序文库的构建方法完成的人变异单细胞样本(del(2)-4.9M)检测情况图;
图5e为使用本发明的单细胞高通量测序文库的构建方法完成的人变异单细胞样本(del(2)-6.5M)检测情况图;
注:图1中左侧为传统单细胞高通量文库构建方法流程图,图1中右侧本发明的单细胞高通量测序文库的构建方法的流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。
本发明提供一种单细胞高通量测序文库的构建方法,包括如下步骤:
单细胞裂解:取单细胞样本,分别加入细胞裂解液和蛋白酶反应以释放单细胞中的基因组DNA,得到含有单细胞基因组DNA的混合液。
细胞裂解液的主要作用是裂解细胞结构使基因组DNA游离出来。蛋白酶的主要作用是将蛋白质水解促进基因组DNA与蛋白质分离开。
核酸片段化并插入转座子DNA:将所述含有单细胞基因组DNA的混合液加入到转座片段化反应体系溶液中孵育,得到连接有转座子DNA序列的单细胞基因组DNA片段。其中,所述转座片段化反应体系溶液中包括转座酶复合物,所述转座酶复合物包括转座酶以及与所述转座酶连接的两条转座子。
PCR扩增并加入测序接头:将连接有转座子DNA序列的单细胞基因组DNA片段置入PCR反应体系中进行PCR扩增,得到带有测序接头的DNA片段,所述PCR反应体系中包含两条测序接头引物,分别是具有特异性识别标签的测序A接头引物、测序P接头引物。
文库纯化和筛选:将所述带有测序接头的DNA片段纯化、筛选,得到文库产物。
通过上述构建方法,可实现一步法构建单细胞高通量高通量测序文库。通过利用转座酶复合物实现快速一步法打断DNA并同时添加标签接头,完成文库构建。
然后,经上述构建好的文库产物进行上机测序。
在其中一种实施方式中,上述单细胞样本选自极体细胞、卵裂球细胞、滋养外胚层细胞、肿瘤细胞、外周血白细胞、血浆细胞和羊水细胞中的任意一种。当然可以理解的是,单细胞样本还可以是本领域技术人员认为合适的其他样本细胞。
本发明所用的MuA转座酶是一种来源于噬菌体Mu的75KDa大小的蛋白质,转座酶会形成一个同源四聚体。转座酶复合物的构建是将转座酶以及转座酶的两条转座子组装连接获得。
本发明所用的转座酶的转座子两条链的序列分别如SEQ ID NO:1(5’-GTT TTCGCATTTATCGTGAAACGCTTTCGCGTTTTTCGTGCGTCAGTTCA-3’)和S EQ ID NO:2(3’-CAAAAGCGTAAATAGCACTTTGCGAAAGCGCAAAAAGCA CGCAGTCAAGTCGT-5’)所示。
转座酶复合物制备的过程如下:
首先进行双链转座子的制备。将上述转座酶的转座子两条单链oligo用溶解缓冲液稀释至60μM,其中溶解缓冲液组分为:10mM Tris-HCl pH8.0,1mM EDTA,50mM NaCl,溶解稀释好的oligo各取50μL等体积混合至200μL PCR管中,震荡混匀;将震荡混匀好的单链oligo进行退火,使其成为双链,退火反应程序和条件如下:95℃,5min,每40s一个循环,每个循环温度下降1℃,共70个循环,直至温度降为10℃,在进行转座子组装前,保持温度在10℃。
然后进行转座复合物的组装制得转座酶复合物。将上一步中制备好的双链转座子用oligo溶解缓冲液稀释至6μM,取0.8μL,加入5μL转座酶(0.22g/L),12.2μL组装缓冲液及2μL46%的DMSO至总体系20μL。轻柔吹匀反应体系后在PCR仪中于30℃温度下孵育1小时。此步骤中组装缓冲液的组分为:150mM Tris-HCL(pH 6.0),体积分数为50%甘油,质量浓度为2.5g/L的Triton X-100、150mMNaCl、0.1mM EDTA。
本发明所称的转座酶优选是MuA转座酶。这种酶对不同GC含量样本不具有或仅具有极低的偏好性,利于扩增均一性。
再将制备好的转座酶复合物(携带有转座酶的转座子的DNA序列)插入单细胞基因组DNA中(即1条转座子DNA序列的3’端与单细胞基因组DNA1条链的5’端相连,另1条转座子DNA序列的5’端与单细胞基因组DNA互补链的3’端相连),酶切DNA的同时,使片段化DNA两端带有相同序列的转座子DNA序列,然后再放入PCR反应溶液(包括两条测序接头引物)中经PCR扩增使片段化DNA加上测序特异性接头(A接头和P接头),进而省去了常规建库过程中需要对裂解后的单细胞基因组DNA进行全基因组扩增以及磁珠纯化等一系列繁琐的过程,以使文库可在90分钟内构建完成。
其中,本发明所用的测序A接头引物的序列如SEQ ID NO:3(5’-CCATCT CATCCCTGCGTGTCTTCGTGCGTCAGTTCA-3’)所示。当然,也可以根据需要构建文库的样本数采用带标签的测序A接头引物,其序列如SEQ ID NO:4(5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-[barcode]-TTCGTGCGTCAGTT CA-3’)所示。
本发明所用测序P接头引物的序列如SEQ ID NO:5(5’-CCACTACGCCTC CGCTTTCCTCTCTATGGGCAGTCGGTGATTTCGTGCGTCAGTTCA-3’)所示。
相应地,最终所形成的文库片段序列结构可以为无标签序列结构或有标签序列结构。无标签(barcoded)序列结构如SEQ ID NO:6(5’-CCATCTCATCC CTGCGTGTCTTCGTGCGTCAGTTCA-[靶DNA]-TGAACTGACGCACGAAATC ACCGACTGCCCATAGAGAGGAAAGCGGAGGCGTAGTGG-3’)所示。
有标签(barcoded)序列结构如SEQ ID NO:7(5’-CCATCTCATCCCTGCGTGT CTCCGACTCAG-[barcode]-TTCGTGCGTCAGTTCA-[靶DNA]-TGAACTGACG CACGAAATCACCGACTGCCCATAGAGAGGAAAGCGGAGGCGTAGTGG-3’)所示。
上述[靶DNA]是指单细胞中裂解出的基因组DNA的插入位置。
优选地,所述文库纯化和筛选具体为:将所述PCR产物转移至含有AMPure XP磁珠的EP管中振荡混匀,室温孵育后离心,将EP管放入磁力架中待溶液变清,吸取上清液并转移至新的EP管中,加入AMPure XP磁珠振荡混匀,室温孵育后离心,将EP管放入磁力架中待溶液变清,吸去上清液,保留磁珠,EP管依然放置在磁力架上,加75%乙醇,取下EP管,旋转180°重新插入磁力架,使磁珠在乙醇中洗涤一遍,重复旋转一次,等溶液澄清后,吸去溶液,重复乙醇洗涤步骤,离心,重新将EP管插入磁力架,吸掉残余液体,将EP管从磁力架上移开,加入Low TE振荡混匀,离心后室温孵育,EP管放置于磁力架上,静置待溶液变清后吸取上清并转移至新的EP管中。
上述单细胞高通量测序文库的构建方法较常规文库构建方法而言大大节约时间,并且操作更简单,实现了直接以单细胞样本为材料的快速建库,且具有很高的扩增均一性、覆盖度和拷贝数变异分辨率。具体而言,将经组装的携带有转座酶的转座子的序列(两条DNA)插入单细胞基因组DNA中,酶切DNA的同时,使片段化DNA两端带有相同序列的转座子DNA序列,然后再放入PCR反应溶液(包括两条测序接头引物)中经PCR扩增使片段化DNA复制并加上测序特异性接头(A接头和P接头),进而省去了常规建库过程中需要对裂解后的单细胞基因组DNA进行全基因组扩增以及磁珠纯化等一系列繁琐的过程,使文库可在90分钟内构建完成。
本发明还提供了一种用于单细胞高通量测序文库构建的试剂盒。
一种用于单细胞高通量测序文库构建的试剂盒,包括单细胞裂解试剂、转座片段化试剂以及PCR反应试剂,所述单细胞裂解试剂中包括细胞裂解液和蛋白酶,转座片段化试剂包括转座酶混合液、转座反应缓冲液、MgCl2、高保真DNA聚合酶,所述转座酶混合液含有转座酶复合物,所述转座酶复合物包括转座酶以及与所述转座酶连接的两条转座子,所述PCR反应试剂中包括引物Mix溶液,所述引物Mix溶液中含有两条具有特异性识别标签的测序接头引物。
在其中一种实施方式中,所述细胞裂解液含有终浓度为10~100mM的Tris-HCl、终浓度为0.2~5mM的EDTA、以及终浓度为5~30mM的DTT,且细胞裂解液的pH为8.0。进而可以使单细胞裂解更加充分,进而利于将单细胞基因组DNA释放。
优选地,细胞裂解液还含有NaCl、KCl、MgCl2、TritonX-100、DMSO和甘油中的任意一种或几种。更利于将单细胞基因组DNA充分释放。
本发明的细胞裂解液可在含有终浓度为10~100mM的Tris-HCl,终浓度为0.2~5mM的EDTA,以及终浓度为5~30mM的DTT这一基本组成的基础上增加适当数量的其他组分,包括且不限于NaCl、KCl、MgCl2、TritonX-100、DMSO和甘油等。本发明的细胞裂解液裂解中的部分基本组分也可用其他试剂替换。
其他一些可供选择的具体细胞裂解液组成如下:
组成1:60mM Tris-HCl;2mM EDTA;15mM DTT;0.5uM载体ssDNA;pH 8.0。
组成2:40mM Tris-HCl;0.33mM EDTA;100mM NaCl;0.05%TritonX-100;10%甘油;3.3%DMSO;pH 8.0。
优选地,细胞裂解液释放单细胞中基因组DNA的反应条件为:75℃,5~60min,热盖105℃;然后加入0.5-5μL浓度为25mg/ml的蛋白酶,55℃,10~300min,热盖70℃;最后75℃,5~30min,热盖105℃。
更为优选地,细胞裂解液释放单细胞中的核酸片段的反应条件为:75℃,10min,热盖105℃;然后加入1.5μL浓度为25mg/ml的蛋白酶,55℃,20min,热盖70℃;最后75℃,10min,热盖105℃。
本发明的细胞裂解条件也可以用下述条件替换:
条件1:75℃30min,然后加入浓度为4mg/ml蛋白酶K,55℃4h。
条件2:75℃10min,50℃20min;80℃10min;4℃保温。
通过使用特定组成的细胞裂解液充分释放单细胞中的基因组DNA。
在其中一个实施例中,所述转座片段化试剂还包括4×转座反应缓冲液、浓度为44mM的MgCl2溶液和浓度为1U/μL的Phusion高保真DNA聚合酶。
优选地,所述反应体系溶液是将4×转座反应缓冲液、浓度为44mM的MgCl2溶液、浓度为1U/μL的Phusion高保真DNA聚合酶与浓度为10U/μL的酶混合液按照体积比12.5:3:10:1.5混合而成。
优选地,所述反应体系的反应条件为:30℃孵育5min,再66℃反应3min。
优选地,所述PCR扩增条件为:
98℃30s;
98℃10s,60℃50s,72℃10s,共10~25个循环;
72℃60s;
4℃保温。
更为优选地,所述PCR扩增条件为:
98℃30s;
98℃10s,60℃50s,72℃10s,共18个循环;
72℃60s;
4℃保温。
上述试剂盒在用于单细胞高通量测序文库构建时,能够简化操作、节约时间,实现直接以单细胞样本为材料的快速建库,且具有很高的扩增均一性、覆盖度和拷贝数变异分辨率。
本发明单细胞测序方法具体操作流程为:
1.单细胞样本准备
单细胞样本类型可以是极体细胞、卵裂球细胞、滋养外胚层细胞、肿瘤细胞、外周血白细胞、血浆细胞和羊水细胞等。每例单细胞样本直接作为起始材料,进行本发明的快速转座酶建库。
2.单细胞裂解
在1μL的含有单细胞的溶液中加入9μL的细胞裂解液,细胞裂解液的组成为:终浓度为60mM的Tris-HCl,终浓度为2mM的EDTA,终浓度为15mM的DTT,细胞裂解液pH为8.0,75℃,10min(热盖105℃);然后加入1.5μL25mg/ml蛋白酶,55℃20min(热盖70℃);最后75℃10min(热盖105℃)。
反应产物补充6.5μL无核酸酶水,至总体系为18μL,直接进行后续文库制备。
3.核酸片段化并插入转座子DNA
室温解冻转座反应缓冲液,颠倒混匀,短暂离心后备用。配制如表1的反应体系:
表1
注:转座酶为Thermo公司生产的MuA酶,规格为10U/μL,MuA反应缓冲液(4×)为转座酶配套试剂,同为Thermo公司生产,Phusion高保真DNA聚合酶为1U/μL。
用移液器轻轻吹打至少15次充分混匀,将混好的反应体系放置于PCR仪上30℃孵育5min,再66℃反应3min。
4.PCR扩增并加入测序接头
在上述片段化产物中加入5μL引物mix溶液(引物mix序列中包含具有特异序列标签转座酶测序A接头引物SEQ ID NO:4和测序P接头引物SEQ ID NO:5),总体积为50μL。轻轻吹打混匀并离心,PCR程序如表2:
表2
5.文库纯化和大小筛选
加入45μL(0.9×)的AMPure XP磁珠至1.5ml的EP管中;转移上述50μL的PCR产物至含有AMPure XP磁珠的EP管,振荡混匀5s;室温孵育5min;轻度离心,将EP管放入磁力架中大约3min,溶液变清;小心吸取上清液并转移至新的EP管;加入50μL(1×)AMPure XP磁珠至上清液中,振荡混匀5s;室温孵育5min;轻度离心,将EP管放入磁力架中大约3min,溶液变清;小心吸取上清,保留磁珠;EP管依然放置在磁力架上,加入400μL的75%乙醇,取下EP管,旋转180°重新插入磁力架,使磁珠在乙醇中洗涤一遍,重复旋转一次,等溶液澄清后,吸去溶液;重复乙醇洗涤步骤;瞬时离心,重新将EP管插入磁力架,尽量吸掉残余液体;将EP管从磁力架上移开,加入20μL Low TE,振荡混匀,并轻度离心;室温孵育5min;EP管放置于磁力架上,直至溶液变清;吸取上清并转移至新的EP管中。
第1次加入磁珠的比例还可以为:0.5×,0.6×,0.7×,0.8×,1.0×,1.1×;1.2×;1.3×;1.4×;1.5×。
第2次加入磁珠的比例还可以为:0.5×,0.6×,0.7×,0.8×,0.9×,1.1×;1.2×;1.3×;1.4×;1.5×;1.6×;1.7×;1.8×;1.9×;2.0×。
该上清液中包含了筛选到的DNA文库。
6.上机测序
文库产物经检测合格后,使用IonTorrent ProtonTM测序平台进行上机测序,上机数据量3-5M reads/样本。
7.测序后信息分析
将所有样本上述流程得到的数据,同时按照统一生物信息学分析流程进行分析,主要步骤包括提取有效数据、序列比对、Y染色体判断、窗口划分、GC含量校正、断点筛查、数据过滤及可视化。
本发明的单细胞高通量测序文库的构建方法实现了直接以单细胞样本为起始材料的建库策略,跳过了单细胞的全基因组扩增步骤,减少因WGA造成的扩增偏好和等位基因脱扣(allele drop out,ADO)发生率,有助于保护文库的多样性和复杂性。
本发明的单细胞高通量测序文库的构建方法经过多例DNA水平和单细胞水平的测试和验证,显示该技术在均一性、GC比例以及数据再现性方面都有着卓越的表现。
表3
表3为多种单细胞高通量测序文库构建方法的性能对比数据。由表3可知,在均一性上,MAPD值越低,说明细胞扩增均一性越好,Bulk Date是多细胞水平的扩增,可见本发明的单细胞高通量测序文库的构建方法仅次于PicoPlex方法;在GC含量上,GC含量也是评估扩增均一性的重要指标,WES代表全基因组测序水平的GC含量,理论上GC含量越接近WES,意味着扩增均一性越好,本发明的单细胞高通量测序文库的构建方法GC含量最接近全基因组测序水平;在再现性上,数据再现性主要体现在对同一个样本的多次重复检测,数据的一致性,偏差值越低说明数据的再现性越好,可见本发明的单细胞高通量测序文库的构建方法数据再现性最佳。
以下结合具体实施例对本发明作进一步阐述。
实施例1:已知变异细胞系微量基因组DNA转座酶建库测序
1.样本准备
选择已知核型的人类淋巴细胞系样本9例,包括非整倍体,片段缺失/重复大小不同的样本(其中最小为1.5Mb左右),以及正常对照样本。将其复苏活化扩大培养,提取足量细胞系基因组DNA作为试验样本。
每例样本取100ng的DNA进行本发明快速转座酶文库构建。
每例样本取100ng的DNA用Thermo Fisher公司官方网站公布的标准文库构建方法(传统文库构建方法)完成,作为对照。具体方法步骤参见Thermo Fisher公司官方网站(http://www.thermofisher.com)。
分别取同一细胞系不同数量DNA模板进行本发明快速转座酶文库构建,具体分别取100ng、1ng、500pg、100pg、15pg、6pg的DNA,每一数量均做3个平行重复。
2.单细胞裂解
同前。
3.核酸片段化并插入转座子DNA
室温解冻转座反应缓冲液,颠倒混匀,短暂离心后备用。配制如表4的反应体系:
表4
用移液器轻轻吹打至少15次充分混匀,将混好的反应体系放置于PCR仪上30℃孵育5min,再66℃3min。
4.PCR扩增并加入测序接头
同前。
5.文库纯化和大小筛选
同前。
6.上机测序
同前。
7.测序后信息分析
同前。
8.结果分析
将所有试验样本经过上述生物信息学分析后获得结果如表5所示。由表5可知,9例细胞株100ng起始量检测,本发明的单细胞高通量测序文库的构建方法检测的结果与已知结果和常规建库得到的结果完全一致。而对同一细胞株,100ng起始量逐渐降低至6pg(单细胞基因组水平),本发明的单细胞高通量测序文库的构建方法检测结果和已知结果完全一致,即本发明方法最低可检测6pg基因组DNA。
表5
注:常规建库不支持起始量≤1ng的微量DNA为模板进行试验。
本发明的单细胞高通量测序文库的构建方法的测序情况如表6所示。
表6
图4a至图4f显示了使用本发明的单细胞高通量测序文库的构建方法,对同一已知变异细胞株(del(4)-13.4M)分别使用不同起始量DNA为模板的检测结果峰图比较。可见,参阅表5和表6,本发明的单细胞高通量测序文库的构建方法对最低起始量6pg DNA进行检测可获得和100ng DNA完全一致的结果。而常规的建库方法无法对起始量≤1ng的微量DNA为模板进行试验。需要先进行全基因组扩增。使DNA的含量累积达到一定含量时,才可进行后续操作,这样势必会大大延长文库的构建时间。
实施例2:已知变异细胞系单细胞样本转座酶建库测序
1.样本准备
选择已知核型的人类淋巴细胞系样本10例,包括非整倍体,片段缺失/重复大小不同的样本(其中最小为1.5Mb左右),以及正常对照样本。将其复苏活化培养至最佳状态时,挑取单个细胞作为单细胞检测样本。
每例细胞系单细胞样本直接作为起始材料,进行本发明的快速转座酶建库。
同时作为对照,单细胞样本先用PicoPlex法进行全基因组扩增,然后以扩增产物进行常规高通量建库测序。具体PicoPlex方法步骤参见Rubicon Genomics公司官方网站(http://rubicongenomics.com)。
2.单细胞裂解
同实施例1。
3、核酸片段化并插入转座子DNA
同实施例1。
4.PCR扩增并加入测序接头
同实施例1。
5.文库纯化和大小筛选
同实施例1。
6.上机测序
同实施例1。
7.测序后信息分析
同实施例1。
8.结果分析
对10例单细胞进行本发明的快速转座酶建库验证。表7和表8的结果表明,使用本发明的单细胞高通量测序文库的构建方法对大于等于4Mb CNV正确检出率为100%,而小于4Mb的CNV检出存在假阳性和假阴性的可能性。本发明的单细胞高通量测序文库的构建方法dup指标最低可达10.21%,最高23.74%,平均值为16.4%。该技术和基于PicoPlexWGAKit的传统高通量测序技术(dup约为15%)相比,dup率相差不大。
表7
表8
图5为使用本发明的单细胞高通量测序文库的构建方法完成的部分已知变异单细胞样本检测情况,大于等于4Mb CNV变异检测结果和已知情况完全一致。说明本发明方法具有很高的扩增均一性、覆盖度和拷贝数变异分辨率。能够在保证结果真实性的前提下,大大简化建库流程,缩短文库构建时长。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 苏州贝康医疗器械有限公司
<120> 单细胞高通量测序文库构建方法及其试剂盒
<160> 7
<170> SIPOSequenceListing 1.0
<210> 1
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gttttcgcat ttatcgtgaa acgctttcgc gtttttcgtg cgtcagttca 50
<210> 2
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
caaaagcgta aatagcactt tgcgaaagcg caaaaagcac gcagtcaagt cgt 53
<210> 3
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ccatctcatc cctgcgtgtc ttcgtgcgtc agttca 36
<210> 5
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ccatctcatc cctgcgtgtc tccgactcag ttcgtgcgtc agttca 46
<210> 6
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ccactacgcc tccgctttcc tctctatggg cagtcggtga tttcgtgcgt cagttca 57
<210> 7
<211> 93
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ccatctcatc cctgcgtgtc ttcgtgcgtc agttcatgaa ctgacgcacg aaatcaccga 60
ctgcccatag agaggaaagc ggaggcgtag tgg 93
<210> 8
<211> 103
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ccatctcatc cctgcgtgtc tccgactcag ttcgtgcgtc agttcatgaa ctgacgcacg 60
aaatcaccga ctgcccatag agaggaaagc ggaggcgtag tgg 103