ctDNA甲基化建库的标签接头、引物组、试剂盒和建库方法
技术领域
本发明涉及分子基因组学技术领域,具体地,涉及一种用于ctDNA甲基化建库的标签接头、引物组、试剂盒和建库方法。
背景技术
近十年来,血液循环肿瘤细胞(circulating tumour cell,CTCs)和循环肿瘤DNA(circulating tumour DNA,ctDNA)因具有无创、实时检测和早于影像学检查结果等优点,被称为“液体活检”,它们能够为肿瘤的早期诊断、放化疗药物的疗效评估、肿瘤负荷和进展监测提供可靠的信息,在肿瘤诊断、疗效监测和预后评估方面具有重要价值。通常来说,对于极晚期癌症患者,ctDNA的主要来源是其肿瘤组织,可以通过基因测序技术检测到肿瘤的体细胞突变位点,用于癌症的诊断,但是一些前期的肿瘤本身由于ctDNA在血液中含量较低,并不容易检测突变频率较低的位点,需要极深的测序深度才可能预测肿瘤发展。ctDNA甲基化对比ctDNA肿瘤体细胞突变,可以作为更早的肿瘤标志物被检测到,基因的异常甲基化在鼻咽癌、头颈癌、乳腺癌、食管癌、胃癌和大肠癌患者的血浆中均被检测到。DNA甲基化具有时空特异性,组织和不同类型的细胞间存在特殊的差异甲基化模式,通过对比已知的甲基化图谱,可以辨别ctDNA的组成成分,提供血浆的全景图,从而指出ctDNA的来源。越来越多的研究表明,基因的异常甲基化在肿瘤发生的早期就可出现,并且在肿瘤逐步发展的过程中,基因异常甲基化的程度增加,因此ctDNA甲基化在肿瘤诊断、疗效监测,预后评估和生存率评价等方面将具有更广泛的价值。但是,血浆中ctDNA含量很低,一般每毫升仅有十几纳克,这需要对核酸提取方法中的各步骤进行全面的考虑。
目前研究DNA甲基化主要有三种方法:(1)甲基化敏感性限制核酸内切酶(MSRE)法,该法是基于甲基化敏感Ⅱ型限制性内切酶不能切割含有一个或多个甲基化切点序列的基本原理。(2)用甲基化CpG结合蛋白分离甲基化DNA的方法,利用甲基CpG结合蛋白MeCP可以结合DNA中的甲基CpG的性质,以MeCP为填充物开发的MBD柱层析法可以将基因组范围内的甲基化DNA片段分离出来。(3)对DNA中的胞嘧啶进化化学修饰的重亚硫酸盐转化法,未甲基化的胞嘧啶C在高浓度的亚硫酸盐作用下,转换成尿嘧啶U,而5-甲基胞嘧啶(5mC)则保持不变。经研究发现有些甲基化在CpG岛外,前两种研究方法存在着信息不全的缺点,因此目前甲基化分析方法常用的是重亚硫酸盐转化法。但是,目前常用的重亚硫酸盐转化法一般只针对于基因组DNA处理,对于含量极微的游离DNA,操作参数仍不清楚。
Ion Torrent高通量测序平台,至今仍是世界上测序时间最快的测序平台,在较低的通量下,也能测到较高的深度,适用于量较少的循环肿瘤游离DNA的测序。由于一个实验操作流水线上需百个样品同时操作,多个文库样品同时上机,但现有的文库标签接头仅有96个,且价格昂贵,不能满足实际实验生产需求。此外,循环肿瘤DNA经重亚硫酸盐转化后,AT含量偏高,常规的建库试剂盒难以处理这种高AT含量的片段,往往会导致文库的质量下降。因此,急需研究出一种专门针对于微量循环肿瘤DNA甲基化文库的建库方法,以有利于循环肿瘤DNA甲基化的测序检测。
发明内容
本发明为了克服现有技术的上述不足,提供一种用于ctDNA甲基化建库的标签接头,可满足一次实验中同时操作上百个样品的需求,为批量建库提供充足的标签接头。
本发明的另一目的在于提供一种用于ctDNA甲基化建库的引物组。
本发明的另一目的在于提供一种ctDNA甲基化建库试剂盒。
本发明的另一目的在于提供一种构建ctDNA甲基化文库的方法。
为了实现上述目的,本发明是通过以下方案予以实现的:
一种用于ctDNA甲基化建库的标签接头,包括由单链正向序列A-BN-Forward和单链反向序列A-BN-Reverse组成的上游双链标签接头A以及由单链正向序列P1-Forward和单链反向序列P1-Reverse组成的下游双链标签接头P1,其核苷酸序列依次如SEQ ID NO:1~SEQ ID NO:4所示;
所述单链正向序列A-BN-Forward和单链反向序列A-BN-Reverse为互补序列;
所述单链正向序列P1-Forward和单链反向序列P1-Reverse为互补序列;
所述上游双链标签接头A中的M和V代表由10~12个碱基组成的标签序列Barcode;其中,M的核苷酸序列选自SEQ ID NO:5~SEQ ID NO:148中的任意一条,V为M的互补序列。
本发明文库标签接头分为测序方向的上游A端接头和下游P1端接头,如图1所示。双端接头在建库时以双链形式,与双链的DNA连接,在测序的聚合酶反应时,以单链形式存在。由于Ion Torrent测序平台为单向测序,测序时先对含有标签序列的上游A端接头进行测序,以区分各标签文库,在插入片段测序完成后,再读取通用序列的下游P1端接头。所述上游双链标签接头A按照5’端至3’端的顺序包括接头序列A-Adapter、标签序列Barcode和测序信号序列KEY;其中,所述测序信号序列KEY为DNA文库固定序列,在测序开始前20个循环,如能读到KEY序列信号,则表示该序列存在,否则当成非文库序列进行过滤。
所述标签序列Barcode可以根据测序仪器要求进行自定义设计合成,且所有标签序列的正向序列的最后一个碱基为胞嘧啶C,在合成时,与测序信号正向序列KEY-Forward的第一个碱基鸟嘌呤G,构成CG稳定碱基对;自定义的标签序列的碱基组成GC含量不得高于65%;整一套自定义的标签序列不得超过连续4个碱基相同。
优选地,所述单链反向序列A-BN-Reverse、P1-Reverse的3’端含有硫代修饰(*T*T),其功能是在聚合酶反应时,防止外切酶酶切,防止接头自连。
本发明还请求保护一种用于ctDNA甲基化建库的引物组,由上游扩增引物WK-PCR-Forward和下游扩增引物WK-PCR-Reverse组成,其核苷酸序列分别依次如SEQ ID NO:149~SEQ ID NO:150所示。
其中,所述WK-PCR-Forward与单链正向序列A-BN-Forward匹配,从5’端匹配20个碱基;所述WK-PCR-Reverse与单链正向序列P1-Forward匹配,从5’端匹配28个碱基,引物序列合成要求的纯化级别为HPLC,确保所有碱基的准确性。
本发明还请求保护一种ctDNA甲基化建库试剂盒,包括上述标签接头和引物组。
优选地,所述试剂盒还包括T4DNA聚合酶、klenow片段、T4多聚核苷酸激酶、TaKaRa EpiTaq HS酶和磁珠。
优选地,所述试剂盒还包括Carrier RNA。在DNA重亚硫酸盐转化时,考虑到吸附柱对微量核酸、短片段的吸附能力减弱,加入浓度为2μg/mL的Carrier RNA可以辅助吸附膜对ctDNA的吸附,避免核酸的损失。
本发明还请求保护一种构建ctDNA甲基化文库的方法,包括以下步骤:
S1.采用磁珠捕获法提取ctDNA,检测样品浓度和片段分布;
S2. ctDNA重亚硫酸盐转化及纯化;
S3.使用T4 DNA聚合酶、klenow片段、T4多聚核苷酸激酶对ctDNA进行末端修复;
S4.采用上述标签接头进行接头连接,采用0.8倍样品体积的磁珠对连接产物进行纯化与片段选择;
S5.使用TaKaRa EpiTaq HS酶和上述引物组进行文库扩增,对扩增文库进行纯化和片段选择、文库质量控制;
S6.Proton上机测序。
本发明所提供的构建ctDNA甲基化文库的方法,步骤S1中通过磁珠捕获试剂盒来提取游离DNA核酸,经过独特包埋的磁珠,在一定条件下对核酸具有很强的亲和力,而当条件改变时,磁珠释放吸附的核酸,能够达到快速分离纯化核酸的目的;步骤S2中通过采用柱上去亚硫酸基团的纯化方法,使得整个操作流程更为简便,可以在2h内完成对DNA样品的处理,其中未甲基化胞嘧啶转化为尿嘧啶的转化率高达99%以上。
优选地,S2中所述ctDNA重亚硫酸盐转化的反应条件为95℃,10min;64℃,20min;4℃,保存。
优选地,S3中所述末端修复的反应条件为20℃,15min,65℃10min;S4中所述接头连接的反应条件为20℃,15min。
优选地,S5中所述文库扩增的反应条件为98℃,10s;55℃,30s;72℃,30s;18个循环。
与现有技术相比,本发明具有以下有益效果:
(1)本发明设计了144种标签序列,可满足同时操作上百个样品的需求,为批量建库提供充足的标签接头。
(2)本发明所提供的建库方法在文库扩增时,采用了对微量、AT含量偏高的甲基化文库具有高效扩增和兼容性的TaKaRa EpiTaq HS酶,该酶是用于经亚硫酸氢盐修饰后含有尿嘧啶的模板DNA进行PCR扩增时所需的最佳DNA聚合酶。
(3)本发明所提供的建库方法有较好的兼容性,适用于常见的二代测序平台(如Ion Torrent PGM和Proton平台);其操作灵活简便,具有检测灵敏度高、高效快捷、节约成本的优点,从肿瘤游离DNA到甲基化文库构建,可缩短至两天时间内完成,有较好的应用推广前景。
附图说明
图1为本发明ctDNA甲基化文库构建流程图。
图2为实施例3中循环肿瘤游离DNA核酸片段分布图。
图3为实施例3中测序数据质量分布结果图。
图4为实施例3中测序数据片段分布结果图。
图5为实施例3中测序数据对比结果图。
图6为实施例3中测序数据错误率分布图。
具体实施方式
下面结合说明书附图及具体实施例对本发明作出进一步地详细阐述,所述实施例只用于解释本发明,并非用于限定本发明的范围。下述实施例中所使用的试验方法如无特殊说明,均为常规方法;所使用的材料、试剂等,如无特殊说明,为可从商业途径得到的试剂和材料。
实施例1一种用于ctDNA甲基化建库的标签接头
本发明的标签接头严格遵循Ion Torrent高通量测序平台DNA文库接头的序列规则进行设计合成,并通过退火处理将单链接头变成特异性的双链文库接头,适用于Ion Torrent PGM和Ion Torrent Proton测序仪上机测序。
1、标签接头设计要求与结构
本发明所提供的用于ctDNA甲基化建库的标签接头分为测序方向的上游双链标签接头A和下游双链标签接头P1,如图1所示。双端接头在建库时以双链形式,与双链的DNA连接;在测序中与聚合酶反应时,以单链形式存在。由于Ion Torrent测序平台为单向测序,测序时先对含有标签序列的上游双链标签接头A进行测序,以区分各标签文库,在插入片段测序完成后,再读取通用序列的下游双链标签接头P1。
(1)标签接头的设计要求
①上游双链标签接头A的最外端A-Adapter与测序引物匹配,为固定序列,严格遵守。
②下游双链标签接头P1的最外端P1-Adapter与测序引物匹配,为固定序列,严格遵守。
③上游双链标签接头A和下游双链标签接头P1的最外延含有双硫代修饰(*T*T),其功能是在聚合酶反应时,防止外切酶酶切,防止接头自连。双硫代修饰(*T*T)具体位置为单链A-BN-Reverse的3’端,和单链P1-Reverse的3’端。
④标签序列Barcode可以根据测序仪器要求进行自定义设计合成。
⑤测序信号序列KEY为DNA文库固定序列,在测序开始前20个循环,如能读到KEY序列信号,则表示该序列存在,否则当成非文库序列进行过滤,同时用于后续测序碱基ATCG的信号强弱矫正。
(2)标签接头的序列结构和序列
如下表1~4所示,表1为上游双链标签接头A的序列结构,表2为上游双链标签接头A的序列;表3为下游双链标签接头P1的序列结构,表4为下游双链标签接头P1的序列。
表1上游双链标签接头A的序列结构
表2上游双链标签接头A的序列
表3下游双链标签接头P1的序列结构
表4下游双链标签接头P1的序列
(3)标签序列Barcode设计与合成
自定义标签序列Barcode的设计原则如下:
①自定义的标签序列Barcode为10~12个碱基,且所有标签序列的正向序列BN-Forward最后一个碱基为胞嘧啶C,在合成时,与测序信号正向序列KEY-Forward的第一个碱基鸟嘌呤G,构成CG稳定碱基对;
②自定义的标签序列的碱基组成GC含量不得高于65%;
③整一套自定义的标签序列不得超过连续4个碱基相同。
根据设计原则,所述标签序列Barcode中的正向标签序列BN-Forward的核苷酸序列选自SEQ ID NO:5~SEQ ID NO:148中的任意一条,共144种。
2、上游双链标签接头A的组装
根据表1中上游双链标签接头A的序列结构、表2中上游双链标签接头A的序列和自定义标签序列Barcode组装成完整的上游双链标签接头A。以标签接头A-B01的完整序列举例说明,如表5所示:
表5上游双链标签接头A的完整序列
3、单链标签接头的双链化
合成的A-BN-Forward、A-BN-Reverse、P1-Forward、P1-Reverse均为带羟基的单链核苷酸序列,需要双链化成双链的接头方可使用。
将标签接头用1×TE稀释成100μM单位浓度,以A-B01-Forward、A-B01-Reverse举例说明标签接头双链化反应,反应体系如表6所示。将反应体系加入PCR仪中,经退火合成双链接头,反应条件如下:95℃,5min;72℃,5min;60℃,5min;50℃,3min;40℃,3min;30℃,3min;20℃,3min;10℃,3min;4℃,保存。最终得到A-B01双链接头,于-20℃保存。
表6单链标签接头反应体系
本发明通过将单链标签接头反应体系经T4 DNA Ligase Buffer和ddH2O稀释至浓度为2μM。利用在梯度降温条件下A-B01-Forward、A-B01-Reverse碱基互补配对原理,将单链引物进行双链化。
实施例2一种用于ctDNA甲基化建库的引物组
本发明所述用于ctDNA甲基化建库的引物组的设计原则如下:
1、上游扩增引物WK-PCR-Forward与单链正向序列A-BN-Forward匹配,与A-BN-Forward的5’端前20个碱基相同。
2、下游扩增引物WK-PCR-Reverse与单链正向序列P1-Forward匹配,与P1-Forward的5’端前28个碱基相同。
3、引物序列合成要求的纯化级别为HPLC,确保所有碱基的准确性。
所述引物组的核苷酸序列如表7所示:
表7文库扩增引物序列表
实施例3一种构建ctDNA甲基化文库的方法
一、循环肿瘤DNA提取
1、循环肿瘤DNA提取
(1)以南方医科大学南方医院提供的82例鼻咽癌患者血浆样本为样本材料,吸取各样品血浆600μL至于2mL EppendorfTubes低吸附管中,加入2倍样品体积的裂解液CFL(1.2mL)、0.2倍样品体积的蛋白酶K(120μL)、0.15倍样品体积磁珠(90μL)。
(2)涡旋振荡混匀后室温孵育30min,期间置于垂直旋转混合仪中,调为低频上下旋转,使磁珠和核酸充分结合。孵育结束后短暂离心,以甩下管盖内壁的磁珠;将低吸附管至于磁力架上2min,待磁珠完全吸附贴壁后,使用吸头小心去除上清,勿触动磁珠,取下低吸附管。
(3)加入750μL蛋白液PD,上下颠倒混匀30s,使磁珠充分悬浮,短暂离心,以甩下管盖内壁的磁珠;将低吸附管至于磁力架上2min,待磁珠完全吸附贴壁后,使用吸头小心去除上清,勿触动磁珠,取下低吸附管。
(4)加入750μL去蛋白液PW,上下颠倒混匀30s,使磁珠充分悬浮,短暂离心,以甩下管盖内壁的磁珠;将低吸附管至于磁力架上2min,待磁珠完全吸附贴壁后,使用吸头小心去除上清,勿触动磁珠,取下低吸附管。重复本步骤1次。
(5)将低吸附管至于磁力架上,使用10μL吸头将残留的液吸干,并在洁净通风橱下,晾干3min,确保去除残留的乙醇。
(6)加入25μL洗脱缓冲液TBC,用吹吸充分重悬磁珠,56℃孵育5min,期间每隔2min,轻轻晃动,使核酸充分洗脱;将低吸附管至于磁力架上静置2min,待磁珠完全吸附贴壁时,将核酸溶液转移至新的低吸附管中,接着下一步实验反应或者置于-20℃保存。
本发明所述一种构建ctDNA甲基化文库的方法中,通过优选磁珠捕获试剂盒来提取游离DNA核酸,经过独特包埋的磁珠,在一定条件下对核酸具有很强的亲和力,而当条件改变时,磁珠释放吸附的核酸,能够达到快速分离纯化核酸的目的。选择600μL血浆作为起始体积,该体积为最大量程2mL操作管体积中可以加进去的最大起始量。优选为2倍样品体积的裂解液、0.2倍样品体积的蛋白酶K可以促进血浆中外泌体破碎,释放出内含的游离DNA,对生理状态的反应更加真实全面。将磁珠反应体积调整为0.15倍样品体积磁珠、垂直旋转混合仪混匀,并将孵育时间延长至30min,可增加磁珠的吸附能力,将有限的游离DNA短时间内捕获完全。本发明方法要求整套提取操作流程及样品储存,使用EppendorfTubes低吸附管,可以避免管壁微量游离DNA的吸附而导致总量损失。
2、循环肿瘤游离DNA质量控制
(1)Qubit检测浓度
取2μL DNA样品,通过Qubit 2.0HS DNA荧光检测试剂进行浓度检测。检测结果:各样品浓度均在1~5ng/μL,当体积为20μL时总量为20~100ng,符合预期要求,达到下游实验用量。
(2)安捷伦2100检测片段分布
根据Qubit检测浓度将待测样品稀释至1ng/μL,通过High Sensitivity DNA Assay试剂盒芯片检测。检测结果如图2所示,循环肿瘤游离DNA核酸片段在约168bp处分布有单一高主峰,在约320bp处分布有小峰。由于游离DNA来源于染色体断裂的核小体DNA,约160bp为一个单位,一般断裂成一个约160bp单位的主体,因此,本发明所提供的方法核酸提取结果符合标准游离DNA片段分布要求。
二、循环肿瘤DNA重亚硫酸盐转化
经过重亚硫酸盐处理后的基因组DNA,由于其中非甲基化的“C”会转化为“U”,甲基化的“C”不改变,所以回收后的DNA会是一种“A”、“T”、“U”占大部分的核酸分子,而且当初的碱基配对形式也不复存在,取而代之的是主要以非特异性配对形式存在的特殊核酸形态。
1、DNA重亚硫酸盐转化
(1)将待处理的基因组DNA在冰上解冻,直到完全溶解。
(2)新鲜配制重亚硫酸盐混合液(BM),对每管干粉中加入850μL缓冲液,震荡混匀直至干粉完全溶解,整个过程约耗时5min。
(3)在200μL离心管中配制重亚硫酸盐反应体系:按顺序加入,20μL DNA样品,10μL缓冲液DP、90μL BM,共120μL反应体系。
(4)反应体系配制好以后,在PCR仪等可设置温度变化程序的仪器上进行重亚硫酸盐转化,整个过程约耗时1h,具体反应条件为:95℃,10min;64℃,20min;4℃,保存。
2、重亚硫酸盐处理后的DNA纯化
(1)柱平衡步骤:向吸附柱CB1中加入500μL的平衡液BL,于12000rpm条件下离心1min,倒掉收集管中的废液,将吸附柱重新放回收集管中。
(2)将经DNA重亚硫酸盐转化处理后的反应体系,简短离心后转移至干净的1.5ml低吸附管中,再加入1.2μL Carrier RNA(0.5~3μg/mL)和5倍体积(600μL)的结合液PB到低吸附管中,充分混匀。
(3)将上一步所得溶液加入吸附柱CB1中,室温放置2min,于12000rpm条件下离心1min,倒掉收集管中的废液,将吸附柱CB1放入收集管中。
(4)向吸附柱CB1中加入600μL漂洗液PW,于12000rpm条件下离心1min,倒掉收集管中的废液,将吸附柱CB1放入收集管中。
(5)向吸附柱CB1中加入600μL溶液DB,室温放置15min,于12000rpm条件下离心1min,倒掉收集管中的废液,将吸附柱CB1放入收集管中。
(6)向吸附柱CB1中加入600μL漂洗液PW,于12000rpm(13400×g)条件下离心30~60s,倒掉收集管中的废液;重复该操作一遍。
(7)将吸附柱CB1放入收集管中,于12000rpm条件下离心2min,尽量除去漂洗液。将吸附柱置于室温放置数分钟,彻底地晾干,以防止残留的漂洗液影响下一步的实验。
(8)取出吸附柱CB1,放入一个干净的离心管中,向吸附膜中间位置悬空滴加20μL洗脱缓冲液EB,室温放置2min。于12000rpm条件下离心2min,收集DNA溶液。
本发明采用柱上去亚硫酸基团的方法,使得整个操作流程更为简便,可以在2h内完成对DNA样品的处理,其中未甲基化胞嘧啶转化为尿嘧啶的转化率高达99%以上。本发明方法根据游离DNA的微量性,将重亚硫酸盐处理的时间优选为95℃,10min;64℃,20min,可以更好的保护DNA,不过度转化。考虑到吸附柱对微量核酸、短片段的吸附能力减弱,优选加入2μg/mL的Carrier RNA(共沉淀剂),可以辅助吸附循环肿瘤DNA对吸附膜的吸附,避免核酸的损失。
三、末端修复
针对于转化后的微量甲基化游离DNA片段,优选反应试剂和参数进行末端修复,如表8所示。将装有末端修复反应体系的PCR管置于PCR仪中,反应参数:20℃,15min,65℃,10min。
表8末端修复反应体系
本发明方法中的末端修复酶试剂包含多种组合酶,其中T4 DNA polymerase、klenow Fragment(exo-)依赖DNA模板进行DNA 5’或3’突出末端的平滑化、缺口补平作用;T4PNK(T4多聚核苷酸激酶)催化片段两端5’-OH磷酸化,用于与文库接头连接。
四、接头连接
1、接头连接
针对经转化后的甲基化游离DNA片段的短主峰、微量的特点,优选反应试剂和参数,A端标签接头以A-B01接头为示例,如表9所示。将装有连接反应体系的PCR管置于PCR仪中进行反应,设置反应参数:20℃,15min。
表9连接反应体系
本发明方法,针对于循环肿瘤DNA甲基化文库,接头连接时DNA含量远低于接头含量,为避免接头二聚体污染序列的过度生成,优选接头工作浓度为2μM。
2、连接产物纯化与片段选择
采用0.8倍样品体积的VAHTS DNA Clean Beads磁珠纯化和片段选择,27μL ddH2O洗脱DNA。优选0.8倍样品体积的磁珠来纯化连接产物,可有效将200bp以下的片段、90bp的接头二聚体、45bp的接头引物去除,得到主峰为250bp主峰的文库(160bp目的片段+90bp两端接头)。
五、文库扩增
1、文库扩增
针对经转化后的甲基化游离DNA片段的短主峰、微量的特点,优选文库扩增反应试剂和参数,如表11所示。将反应体系置于PCR管中,在PCR仪上进行反应,反应参数设置为:98℃,10s;55℃,30s;72℃,30s;18个循环。
优选TaKaRa EpiTaq HS(for bisulfite-treated DNA)为文库扩增酶,该酶是用于亚硫酸氢盐修饰后含有尿嘧啶的模板DNA进行PCR扩增时所需的最佳DNA聚合酶。经亚硫酸氢盐修饰后的DNA有时会影响PCR反应性能,该buffer溶液中的镁离子及dNTP浓度经调整后可调节扩增效率和反应特异性,能够很好地扩增难扩增的目的片段。该扩增酶为Hot Start PCR,高温加热前,抗Taq单克隆抗体与Taq酶结合,抑制聚合酶的活性,从而抑制低温条件下由引物的非特异性退火或引物二聚体引起的非特异性扩增。
表10文库扩增反应体系
2、扩增文库纯化与片段选择
采用0.8倍样品体积的VAHTS DNA Clean Beads磁珠纯化和片段选择,用50μL ddH2O洗脱DNA。优选0.8倍样品体积的磁珠来纯化文库扩增产物,彻底将200bp以下的文库片段、90bp的接头二聚体去除,得到主峰为250bp主峰的文库(160bp目的片段+90bp两端接头)。
3、文库质量控制
(1)文库浓度测定:取1μL DNA文库,使用Qubit dsDNA HS Assay Kit荧光测定大致的浓度范围;
(2)文库长度分布检测:取1μL文库(根据上一步检测到的浓度,将其稀释至1ng/μL),使用High Sensitivity DNA Kit检测文库的片段大小和浓度。
(3)摩尔浓度计算:文库摩尔浓度(pM)=文库浓度(ng/μL)*1.515*1000/文库长度(kb)。
整批文库经浓度检测,均在1~5ng/μL,50μL,符合预期要求,又没有过度扩增,同时,反映出该TaKaRa EpiTaq HS扩增酶具有较高的扩增效率。经2100仪器片段分布检测,在250bp处均有单一正态峰,两端无杂峰,说明片段选择有效去除杂峰片段。摩尔浓度计算后,样品均在20μL,500~1000nM之间,符合Ion Torrent PGM和Proton上机浓度要求(标准摩尔浓度要求为每个文库至少在5μL,100nM以上)。
六、Proton上机测序
文库构建完成后,经文库定量,将多个文库混合成一个pool用于测序上机。测序上机包括:模板制备(油包水PCR)、文库ISP富集(链霉亲和素磁珠富集)、Proton高通量测序仪器上机环境。测序运行时间约为3h,测序完成后,通过测序服务器插件生成测序数据质检报告,结果如图3~6所示。图3为测序数据质量分布图,本次上机测序数据,其中因文库多克隆(Polyclonal)弃去了42%,内参序列Test Fragments弃去1%,低质量弃去12%,最终得到4,112,344条reads;图4为测序数据片段分布图,可以看出,本次测序的插入片段主要为160bp左右,且正态分布,推测可能因为部分序列因截取低质量部分、长度变小,在0~100bp具有少量分布;图5为测序数据比对结果,利用Ion Torrent服务器官方的比对插件,将测序数据与人基因组比对,匹配度达到97%,测序深度达到98×;图6为测序数据错误率分布,横坐标测序质量分值,质量值为Q10、Q20、Q30、Q40时,分别代表错误的碱基识别的概率为1/10、1/100、1/1000、1/10000,纵坐标为序列条数,通过计算峰图面积可以得到对应质量值得总数据量。从本次测序结果可以看出,测序数据过滤后,150~200bp主峰的每个bp位点,AQ10约为50000reads条,AQ17约为40000reads条,AQ20约为35000reads条,AQ47约为25000reads条。其中AQ17占过滤后的总数(AQ10)的比例为80%左右,此质量值符合AT含量偏高的甲基化序列测序质量特征,达到数据分析要求(Ion Torrent PGM官方的DNA测序质量参考值为75~85%)。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,对于本领域的普通技术人员来说,在上述说明及思路的基础上还可以做出其它不同形式的变化或变动,这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
序列表
<110>广州赛哲生物科技股份有限公司
<120>ctDNA甲基化建库的标签接头、引物组、试剂盒和建库方法
<160>150
<170>SIPOSequenceListing 1.0
<210>1
<211>34
<212>DNA
<213>人(human)
<400>1
ccatctcatc cctgcgtgtc tccgactcag mgat34
<210>2
<211>34
<212>DNA
<213>人(human)
<400>2
ctavctgagt cggagacacg cagggatgag atgg34
<210>3
<211>41
<212>DNA
<213>人(human)
<400>3
ccactacgcc tccgctttcc tctctatggg cagtcggtga t41
<210>4
<211>41
<212>DNA
<213>人(human)
<400>4
atcaccgact gcccatagag aggaaagcgg aggcgtagtg g41
<210>5
<211>12
<212>DNA
<213>人(human)
<400>5
ttggccaatt gc12
<210>6
<211>12
<212>DNA
<213>人(human)
<400>6
tgagaagaat tc12
<210>7
<211>12
<212>DNA
<213>人(human)
<400>7
cctgctggat tc12
<210>8
<211>12
<212>DNA
<213>人(human)
<400>8
tggcaggaat tc12
<210>9
<211>12
<212>DNA
<213>人(human)
<400>9
tccggagtct tc12
<210>10
<211>12
<212>DNA
<213>人(human)
<400>10
taagcaattc tc12
<210>11
<211>12
<212>DNA
<213>人(human)
<400>11
ccggaggtaa tc12
<210>12
<211>12
<212>DNA
<213>人(human)
<400>12
ttcaggacct tc12
<210>13
<211>12
<212>DNA
<213>人(human)
<400>13
tctaaccaat gc12
<210>14
<211>12
<212>DNA
<213>人(human)
<400>14
tccgagctga tc12
<210>15
<211>12
<212>DNA
<213>人(human)
<400>15
ctcattccgg tc12
<210>16
<211>12
<212>DNA
<213>人(human)
<400>16
tcgaggcctg gc12
<210>17
<211>12
<212>DNA
<213>人(human)
<400>17
taggattccg ac12
<210>18
<211>12
<212>DNA
<213>人(human)
<400>18
ttgaagctcc gc12
<210>19
<211>12
<212>DNA
<213>人(human)
<400>19
ttcaacttct tc12
<210>20
<211>12
<212>DNA
<213>人(human)
<400>20
ccaaggcgaa tc12
<210>21
<211>12
<212>DNA
<213>人(human)
<400>21
cttagatcgg tc12
<210>22
<211>12
<212>DNA
<213>人(human)
<400>22
ccggtccgat tc12
<210>23
<211>12
<212>DNA
<213>人(human)
<400>23
tccggcaaga tc12
<210>24
<211>12
<212>DNA
<213>人(human)
<400>24
ttcctatccg ac12
<210>25
<211>12
<212>DNA
<213>人(human)
<400>25
taacaataat tc12
<210>26
<211>12
<212>DNA
<213>人(human)
<400>26
ctgaagtcgg ac12
<210>27
<211>12
<212>DNA
<213>人(human)
<400>27
aaggaatgga ac12
<210>28
<211>12
<212>DNA
<213>人(human)
<400>28
ttccgaaccg ac12
<210>29
<211>12
<212>DNA
<213>人(human)
<400>29
ttcaccagga tc12
<210>30
<211>12
<212>DNA
<213>人(human)
<400>30
ctgaggcatc ac12
<210>31
<211>12
<212>DNA
<213>人(human)
<400>31
ccagcatcat tc12
<210>32
<211>12
<212>DNA
<213>人(human)
<400>32
tcaggcagat tc12
<210>33
<211>12
<212>DNA
<213>人(human)
<400>33
ttctgcacga tc12
<210>34
<211>12
<212>DNA
<213>人(human)
<400>34
tccgaagata ac12
<210>35
<211>12
<212>DNA
<213>人(human)
<400>35
cggaatccgg tc12
<210>36
<211>12
<212>DNA
<213>人(human)
<400>36
tcttgaggaa gc12
<210>37
<211>12
<212>DNA
<213>人(human)
<400>37
ccgccaccaa tc12
<210>38
<211>12
<212>DNA
<213>人(human)
<400>38
tggagattgg tc12
<210>39
<211>12
<212>DNA
<213>人(human)
<400>39
tctccatcaa tc12
<210>40
<211>12
<212>DNA
<213>人(human)
<400>40
tggagccaac ac12
<210>41
<211>12
<212>DNA
<213>人(human)
<400>41
tctaatcgat tc12
<210>42
<211>12
<212>DNA
<213>人(human)
<400>42
acaatccggt tc12
<210>43
<211>12
<212>DNA
<213>人(human)
<400>43
tccttacaga ac12
<210>44
<211>12
<212>DNA
<213>人(human)
<400>44
cttgaagccg tc12
<210>45
<211>12
<212>DNA
<213>人(human)
<400>45
ttgagatcaa tc12
<210>46
<211>12
<212>DNA
<213>人(human)
<400>46
cagcaattcg ac12
<210>47
<211>12
<212>DNA
<213>人(human)
<400>47
cttaaggctg ac12
<210>48
<211>12
<212>DNA
<213>人(human)
<400>48
ctggagaacc ac12
<210>49
<211>12
<212>DNA
<213>人(human)
<400>49
ctaggcctcc tc12
<210>50
<211>12
<212>DNA
<213>人(human)
<400>50
cgaacaattg tc12
<210>51
<211>12
<212>DNA
<213>人(human)
<400>51
ttcaaggtgt tc12
<210>52
<211>12
<212>DNA
<213>人(human)
<400>52
cttaaccacc ac12
<210>53
<211>12
<212>DNA
<213>人(human)
<400>53
tccggaccgt tc12
<210>54
<211>12
<212>DNA
<213>人(human)
<400>54
ccttgagcat gc12
<210>55
<211>12
<212>DNA
<213>人(human)
<400>55
tcttagatat tc12
<210>56
<211>12
<212>DNA
<213>人(human)
<400>56
aagccaacca ac12
<210>57
<211>12
<212>DNA
<213>人(human)
<400>57
ttaggctgat tc12
<210>58
<211>12
<212>DNA
<213>人(human)
<400>58
tggaaccacg tc12
<210>59
<211>12
<212>DNA
<213>人(human)
<400>59
aggcaacgga ac12
<210>60
<211>12
<212>DNA
<213>人(human)
<400>60
tctcattcat tc12
<210>61
<211>12
<212>DNA
<213>人(human)
<400>61
ttcggaacgt tc12
<210>62
<211>12
<212>DNA
<213>人(human)
<400>62
ccttatggat tc12
<210>63
<211>12
<212>DNA
<213>人(human)
<400>63
cttgaacagg tc12
<210>64
<211>12
<212>DNA
<213>人(human)
<400>64
ctagccaatg ac12
<210>65
<211>12
<212>DNA
<213>人(human)
<400>65
cctggctcaa tc12
<210>66
<211>12
<212>DNA
<213>人(human)
<400>66
ctgaggcttg tc12
<210>67
<211>12
<212>DNA
<213>人(human)
<400>67
caagaataat tc12
<210>68
<211>12
<212>DNA
<213>人(human)
<400>68
ccgaaccaac gc12
<210>69
<211>12
<212>DNA
<213>人(human)
<400>69
cctagattaa tc12
<210>70
<211>12
<212>DNA
<213>人(human)
<400>70
aggccattga tc12
<210>71
<211>12
<212>DNA
<213>人(human)
<400>71
tcgagaatcg gc12
<210>72
<211>12
<212>DNA
<213>人(human)
<400>72
ttctgccact tc12
<210>73
<211>12
<212>DNA
<213>人(human)
<400>73
ctaagccatc tc12
<210>74
<211>12
<212>DNA
<213>人(human)
<400>74
ccttagctcg gc12
<210>75
<211>12
<212>DNA
<213>人(human)
<400>75
tcttaggacg gc12
<210>76
<211>12
<212>DNA
<213>人(human)
<400>76
cttgcaatgg ac12
<210>77
<211>12
<212>DNA
<213>人(human)
<400>77
cctaaggcag gc12
<210>78
<211>12
<212>DNA
<213>人(human)
<400>78
tctggaagtc gc12
<210>79
<211>12
<212>DNA
<213>人(human)
<400>79
tcttaggtaa tc12
<210>80
<211>12
<212>DNA
<213>人(human)
<400>80
tccaggctta tc12
<210>81
<211>12
<212>DNA
<213>人(human)
<400>81
cttgagaatt ac12
<210>82
<211>12
<212>DNA
<213>人(human)
<400>82
aaggcctcga ac12
<210>83
<211>12
<212>DNA
<213>人(human)
<400>83
ttccttcaac ac12
<210>84
<211>12
<212>DNA
<213>人(human)
<400>84
tgcattccgg tc12
<210>85
<211>12
<212>DNA
<213>人(human)
<400>85
cggaagcatc ac12
<210>86
<211>12
<212>DNA
<213>人(human)
<400>86
cttggagtcc tc12
<210>87
<211>12
<212>DNA
<213>人(human)
<400>87
cggaccacgg ac12
<210>88
<211>12
<212>DNA
<213>人(human)
<400>88
ttgccaaccg gc12
<210>89
<211>12
<212>DNA
<213>人(human)
<400>89
caaggcttcc ac12
<210>90
<211>12
<212>DNA
<213>人(human)
<400>90
tcttcatgaa tc12
<210>91
<211>12
<212>DNA
<213>人(human)
<400>91
ttgacattaa tc12
<210>92
<211>12
<212>DNA
<213>人(human)
<400>92
ttccgcattg ac12
<210>93
<211>12
<212>DNA
<213>人(human)
<400>93
tggaaggtcc ac12
<210>94
<211>12
<212>DNA
<213>人(human)
<400>94
ttagcaacat tc12
<210>95
<211>12
<212>DNA
<213>人(human)
<400>95
aagcaatcca tc12
<210>96
<211>12
<212>DNA
<213>人(human)
<400>96
tggactcaat tc12
<210>97
<211>12
<212>DNA
<213>人(human)
<400>97
ttgaaggatc gc12
<210>98
<211>12
<212>DNA
<213>人(human)
<400>98
tggaagaagg ac12
<210>99
<211>12
<212>DNA
<213>人(human)
<400>99
caccatccgg tc12
<210>100
<211>12
<212>DNA
<213>人(human)
<400>100
cctgccggaa tc12
<210>101
<211>12
<212>DNA
<213>人(human)
<400>101
cggccttcgg tc12
<210>102
<211>12
<212>DNA
<213>人(human)
<400>102
ccttggcctg gc12
<210>103
<211>12
<212>DNA
<213>人(human)
<400>103
ctagtcgaat tc12
<210>104
<211>12
<212>DNA
<213>人(human)
<400>104
tagacggaat tc12
<210>105
<211>12
<212>DNA
<213>人(human)
<400>105
tcctccaagt tc12
<210>106
<211>12
<212>DNA
<213>人(human)
<400>106
tcttccttcc gc12
<210>107
<211>12
<212>DNA
<213>人(human)
<400>107
tggacaattg ac12
<210>108
<211>12
<212>DNA
<213>人(human)
<400>108
tctgacattc gc12
<210>109
<211>12
<212>DNA
<213>人(human)
<400>109
ttcttgatca tc12
<210>110
<211>12
<212>DNA
<213>人(human)
<400>110
ttccgaagtc ac12
<210>111
<211>12
<212>DNA
<213>人(human)
<400>111
tcctggagta ac12
<210>112
<211>12
<212>DNA
<213>人(human)
<400>112
tgaccaatcc ac12
<210>113
<211>12
<212>DNA
<213>人(human)
<400>113
tggaggccgg tc12
<210>114
<211>12
<212>DNA
<213>人(human)
<400>114
ttccaatccg tc12
<210>115
<211>12
<212>DNA
<213>人(human)
<400>115
cttgaagacg ac12
<210>116
<211>12
<212>DNA
<213>人(human)
<400>116
tagaattccg tc12
<210>117
<211>12
<212>DNA
<213>人(human)
<400>117
ttctacaata tc12
<210>118
<211>12
<212>DNA
<213>人(human)
<400>118
ttctgagcgt tc12
<210>119
<211>12
<212>DNA
<213>人(human)
<400>119
ccaagcaacg gc12
<210>120
<211>12
<212>DNA
<213>人(human)
<400>120
ttcttaagta tc12
<210>121
<211>12
<212>DNA
<213>人(human)
<400>121
cggcctcaat tc12
<210>122
<211>12
<212>DNA
<213>人(human)
<400>122
cagcctccgg ac12
<210>123
<211>12
<212>DNA
<213>人(human)
<400>123
tctgacggaa tc12
<210>124
<211>12
<212>DNA
<213>人(human)
<400>124
ttctccatta tc12
<210>125
<211>12
<212>DNA
<213>人(human)
<400>125
aacttccgga tc12
<210>126
<211>12
<212>DNA
<213>人(human)
<400>126
tccacaatta ac12
<210>127
<211>12
<212>DNA
<213>人(human)
<400>127
aaggctcggt tc12
<210>128
<211>12
<212>DNA
<213>人(human)
<400>128
ccgagtcgat tc12
<210>129
<211>12
<212>DNA
<213>人(human)
<400>129
ttcttcacca ac12
<210>130
<211>12
<212>DNA
<213>人(human)
<400>130
ctaggccagg ac12
<210>131
<211>12
<212>DNA
<213>人(human)
<400>131
cctgaaggct gc12
<210>132
<211>12
<212>DNA
<213>人(human)
<400>132
cttgaaggtc tc12
<210>133
<211>12
<212>DNA
<213>人(human)
<400>133
cttaacatcc tc12
<210>134
<211>12
<212>DNA
<213>人(human)
<400>134
tgaggaattc ac12
<210>135
<211>12
<212>DNA
<213>人(human)
<400>135
tggaagcaag tc12
<210>136
<211>12
<212>DNA
<213>人(human)
<400>136
ctgagcaatc tc12
<210>137
<211>12
<212>DNA
<213>人(human)
<400>137
tccagccata tc12
<210>138
<211>12
<212>DNA
<213>人(human)
<400>138
tccttccact tc12
<210>139
<211>12
<212>DNA
<213>人(human)
<400>139
tgaaccattg ac12
<210>140
<211>12
<212>DNA
<213>人(human)
<400>140
ttaggatcat tc12
<210>141
<211>12
<212>DNA
<213>人(human)
<400>141
ttccaattcc ac12
<210>142
<211>12
<212>DNA
<213>人(human)
<400>142
ttctggttct tc12
<210>143
<211>12
<212>DNA
<213>人(human)
<400>143
tccgaagaga tc12
<210>144
<211>12
<212>DNA
<213>人(human)
<400>144
taagtccaat tc12
<210>145
<211>12
<212>DNA
<213>人(human)
<400>145
tcttcaggat tc12
<210>146
<211>12
<212>DNA
<213>人(human)
<400>146
ttccttggtc ac12
<210>147
<211>12
<212>DNA
<213>人(human)
<400>147
ttccttgccg tc12
<210>148
<211>12
<212>DNA
<213>人(human)
<400>148
cttaggcaag tc12
<210>149
<211>20
<212>DNA
<213>人(human)
<400>149
ccatctcatc cctgcgtgtc20
<210>150
<211>28
<212>DNA
<213>人(human)
<400>150
ccactacgcc tccgctttcc tctctatg 28