欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 基于BGISEQ-500的微量血小板RNA测序检测试剂盒独创技术23258字

基于BGISEQ-500的微量血小板RNA测序检测试剂盒

2021-02-01 09:50:55

基于BGISEQ-500的微量血小板RNA测序检测试剂盒

  技术领域

  本发明属于生物技术领域,尤其涉及一种基于BGISEQ-500的微量血小板RNA测序试剂盒。

  背景技术

  癌症是全球发病和死亡的主要原因,2012年全球约有1400万新发癌症病例和820万例癌症相关死亡病例。2012年中国癌症发病人数为306.5万,约占全球癌症发病人数的20%,居世界首位;癌症死亡人数为220.5万,约占全球癌症死亡人数的1/4。在未来20年中,估计全球每年癌症病例将由2012年的1400万上升到2200万。恶性肿瘤治疗困难,医疗费用高。很多患者在发现癌症之时已经到了晚期,失去了治疗的最佳时机。因此,肿瘤早期诊断对于癌症预防及治疗具有极其重要的作用。

  目前,传统的肿瘤诊断方法主要包括有影像学、内窥镜技术及组织病理学,并且一直构成了国际癌症诊断领域的主要部分,也是肿瘤确诊的主要诊断方法。但是这些诊断方法具有早期肿瘤检测灵敏度低、耗时长及对病人损害较大,从而使许多病人错过了癌症的最佳治疗时机。发展低成本、易操作、便携式、低损伤、高准确性和快速的肿瘤早期检测方法是当前所急需。

  “液体活检”具有其他筛查方法不具有的低侵入性、覆盖所有肿瘤类型、能够随时检测肿瘤变化,在肿瘤的早期筛查、动态检测及治疗中被寄予厚望。“液体活检”在肿瘤的早期检测、动态监测及治疗中应用解决了部分肿瘤筛查的问题。目前有多种非侵入性血液标记应用于肿瘤的检测,例如血浆游离循环肿瘤DNA、循环肿瘤细胞,外泌体和循环蛋白质。在肿瘤中血浆游离DNA突变的检测一直都是研究的重点,主要利用高通量测序技术,对于血浆游离DNA进行测序,通过游离DNA中肿瘤DNA的突变信息进行极其高的测序深度才能完成检测,同时要求样本量较高,目前无法应用于普通人群筛查。

  血小板是血液中含量第二的细胞,是由骨髓中成熟的巨噬细胞的细胞质脱落而成的。血小板不仅在止血、伤口愈合、炎症反应、血栓形成及器官移植排斥等生理和病理过程中发挥着重要作用,而且对癌症的发展及转移也起着重要作用。近年来的研究显示,肿瘤血小板检测可能会使基于肿瘤血液的癌症诊断变得更有效。但现有技术中,还没有对应成熟的技术利用肿瘤血小板对肿瘤进行较为准确的诊断。

  目前血小板应用于癌症诊断的技术有多种,包括血小板蛋白检测,血小板RNA定量PCR检测。血小板蛋白检测的不足点为:取样量多,检测准确性低;血小板RNA定量PCR检测的不足点为:检测基因数有限、检测准确性低。

  发明内容

  本发明一个目的是提供一种基于BGISEQ-500的血小板RNA测序文库构建方法。

  本发明提供的方法,包括如下步骤:

  1)提取待测样本的血小板RNA,反转录得到dscDNA;

  2)用包埋接头的Tn5转座酶片段化所述dscDNA,得到片段化产物;

  所述包埋接头的Tn5转座酶中的接头为接头1和接头2;

  所述接头1由引物A和引物B退火得到;

  所述接头2由引物A和引物C退火得到;

  所述引物A的核苷酸序列为序列1;

  所述引物B的核苷酸序列为序列2;

  所述引物C的核苷酸序列为序列3;

  3)对所述片段化产物进行PCR扩增,得到扩增产物;

  所述PCR扩增的引物为引物F、引物R、Tn5-zebra F和Tn5-zebra R;

  所述引物F的核苷酸序列为序列4;

  所述引物R的核苷酸序列为序列5;

  所述Tn5-zebra F的核苷酸序列为序列6;

  所述Tn5-zebra R由序列甲、barcode序列和序列乙组成;所述序列甲的核苷酸序列为序列7,所述序列乙的核苷酸序列为序列8;

  4)环化所述扩增产物,得到血小板RNA测序文库。

  上述方法中,

  所述引物A的5'末端磷酸化修饰;

  或,在步骤1)前,还包括去除血小板RNA中的用于保存的RNAlater的步骤;

  或,在步骤3)和4)之间,还包括从所述扩增产物中选取大小为150-500bp片段的步骤;

  或所述选取方法具体采用磁珠纯化。

  上述方法中,

  所述环化采用的寡核苷酸的核苷酸序列为序列9。

  本发明另一个目的是提供一种基于BGISEQ-500的血小板RNA测序方法。

  本发明提供的方法,包括如下步骤:

  1)按照上述方法构建基于BGISEQ-500的血小板RNA测序文库;

  2)BGISEQ-500测序仪对所述文库进行测序。

  本发明第3个目的是提供一种试剂盒。

  本发明提供的试剂盒,其包括上述方法中的所述引物A、所述引物B、所述引物C、所述引物F、所述引物R、所述Tn5-zebra F和所述Tn5-zebra R。

  上述试剂盒还包括Tn5转座酶。

  上述试剂盒具有如下1)-6)中至少一种功能:

  1)筛选或辅助筛选正常样本和癌症样本差异基因;

  2)制备筛选或辅助筛选正常样本和癌症样本差异基因产品;

  3)检测或辅助检测正常样本和癌症样本差异基因;

  4)制备检测或辅助检测正常样本和癌症样本差异基因产品;

  5)评估或辅助评估待测样本癌症风险;

  6)制备评估或辅助评估待测样本癌症风险产品。

  上述方法或上述的试剂盒在如下1)-6)中至少一种应用也是本发明保护的范围:

  1)筛选或辅助筛选正常样本和癌症样本差异基因;

  2)制备筛选或辅助筛选正常样本和癌症样本差异基因产品;

  3)检测或辅助检测正常样本和癌症样本差异基因;

  4)制备检测或辅助检测正常样本和癌症样本差异基因产品;

  5)评估或辅助评估待测样本癌症风险;

  6)制备评估或辅助评估待测样本癌症风险产品。

  上述中,所述待测样本为离体外周血。

  上述中,所述待测样本为离体外周血,所述离体外周血的体积小于等于1ml。

  本发明通过摸索血小板RNA提取方法、基于BGISEQ-500的血小板RNA建库,建立一套适用于肿瘤早期检测的血小板RNA高通量测序的完整体系;初步采集癌症和正常样本评估血小板RNA测序用于肿瘤早期检测的准确性、灵敏性和特异性;实验证明,本发明采用低于1ml的全血,进行微量血小板mRNA文库构建,通过自主搭建的血小板分析流程,进行高灵敏性和高特异性的肿瘤早期筛查。

  附图说明

  图1为本发明的技术路线。

  图2为差异基因聚类分析热图。

  图3为SVM-LOOCV评估癌症风险。

  具体实施方式

  下述实施例中所使用的实验方法如无特殊说明,均为常规方法。

  下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

  图1为本发明的技术路线。

  实施例1、基于BGISEQ-500的微量血小板RNA测序方法及应用

  本发明主要基于BGISEQ-500测序仪对8例正常样本和15例癌症样本的血小板RNA进行测序分析,具体步骤如下:

  (一)微量血小板RNA文库构建

  1、血小板分离

  采集2ml待测样本外周血于EDTA抗凝管中,充分混匀进行以下操作,所有离心过程都在4℃进行:

  (1)将采血管置于离心机中120g离心20min,离心后立即将上清(含血小板)分装到多个1.5ml的离心管中;

  (2)将(1)得到的装有上清的离心管置于离心机中360g离心20min,离心后,管中沉淀即为血小板,向沉淀中加入30ul RNAlater(Sigma),然后于4℃过夜放置,然后转至-80℃保存;

  2、血小板RNA提取(前处理为创新步骤,样本冻存后进行RNAlater离心去除,既可以不影响RNA提取还可以去除血浆中的干扰物质)

  1)、前处理

  将1得到的装有RNAlater的血小板样本管取出,4℃解冻后,放于冰盒内;向装有RNAlater的血小板中加入含0.8%EDTA的PBS,用移液枪缓慢混匀,4℃,3000g离心10min,去除上清液(去除RNAlater),获得的血小板沉淀可直接用于RNA提取。

  2)、RNA提取

  采用NucleoSpin RNA Set for NucleoZOL(Macherey-Nagel)试剂盒提取,具体如下:

  (1)向上述1中装有血小板的离心管(不含RNAlater)中加入500ul NucloZOL,漩涡混匀1min,短暂离心,得到裂解液。

  (2)向(1)得到的裂解液中加入200ul RNase-free water,漩涡混匀30s,室温静置5-15min。

  (3)将(2)处理后的离心管放于离心机中,4℃,12000g离心15min(离心后,将离心机温度调回室温)。

  (4)离心后,将500ul上清液转移至新的1.5ml离心管(需自己准备)中。

  (5)向上清液中加入500ul Buffer MX,漩涡混匀,短暂离心。

  (6)取出RNA收集柱,并放于收集管上;将上述离心管中液体转移500ul至收集柱中,8000g离心30s。

  (7)弃除收集管中液体,再将离心管剩余液体全部转移至收集柱,8000g离心30s。

  (8)将含有废液的收集管丢弃,将收集柱放在一个新的收集管上。

  (9)加入700ul Buffer RA3至收集柱中,8000g离心30s,弃除废液。

  (10)加入350ul Buffer RA3至收集柱中,8000g离心30s,弃除废液;将收集柱重新放回收集管上,12000g离心2min。

  (11)将收集柱放于一个干净的1.5ml离心管(试剂盒已提供)上,打开收集柱盖子,室温放置3min。

  (12)将60ul RNase-free water加到收集柱的膜上方,盖上管盖,室温孵育3min。

  (13)12000g离心2min,丢弃收集柱,在离心管盖上标记样本编号,并立即将样本放于-80℃保存。

  (14)用Agilent RNA 6000Pico kit对RNA的提取质量进行评估,所有样本的完整性均满足要求(RIN>8),得到血小板总RNA。

  3、微量血小板RNA文库构建

  1)反转录得到dscDNA

  a、cDNA第一链合成

  取500pg-1ng上述2获得的血小板总RNA进行cDNA第一链合成,分为两步:首先进行RNA变性,各成分为2.5uM Oligo-dT primer、2.5mM dNTP Mix、4U RNase Inhibitor(NEB,cat.no.M0314L)总体积4ul,漩涡混匀,PCR仪72℃孵育3min,反应结束后置于冰上冷却2min;然后向以上反应体系中加入100U SuperScript II reverse transcriptase(INVITROGEN,cat.no.18064-014)、10U RNase Inhibitor(NEB,cat.no.M0314L)、5×Superscript II first-strand buffer(INVITROGEN,cat.no.18064-014)、2.5mM DTT、1MBetaine(SIGMA,cat.no.B0300-1VL)、9mM MgCl2、1uM TSO、补充Nuclease-free water至总体积为10ul。涡旋混匀后,按如下反应条件进行逆转录反应(75℃热盖):42℃ 90min;50℃2min,42℃ 2min(10cycles);70℃ 15min;4℃ hold,得到cDNA第一链。

  Oligo-dT primer序列为5’-AAGCAGTGGTATCAACGCAGAGTACT30VN(N=A,C,G,orT;V=A,G,orC)-3’;

  TSO序列为5’-AAGCAGTGGTATCAACGCAGAGTACrGrG+G-3’。

  b、cDNA第二链合成

  向上述a得到的cDNA第一链反应产物中继续加入2×KAPA HiFiHotStart ReadMix(KAPA BIOSYSTEMS,cat.no.KK2601)、0.1mM IS PCR primers(生工生物工程),补充Nuclease-free water至总反应体积为25ul。反应程序为:98℃ 3min;98℃ 15s,67℃ 20s,72℃ 6min(15cycle);72℃ 5min;4℃ hold,得到cDNA第二链。

  c、磁珠纯化

  使用1×AmPure XP Beads对上述(2)得到的cDNA第二链进行纯化,得到纯化后dscDNA。

  纯化后dscDNA用Agilent DNA 2100High Sensitivity DNA kit检测片段大小分布。结果显示所有样本的产物条带范围均在300~2.2kb,且主要集中在1500-2000bp附近。

  2)包埋2个接头的Tn5转座酶的构建

  本流程采用基于BGISEQ-500平台自主研发设计的接头和引物序列,并且采用华大自主生产的Tn5转座酶和buffer(50mM TAPS-NaOH,pH8.5,25mM MgCl2,50%DMF)对cDNA样品进行文库制备,具体如下:

  (1)包埋2个接头的Tn5转座酶

  A、接头(Adapter Mix)制备

  a.引物名称及序列:

  PrimerA:5’-[磷酸化]CTGTCTCTTATACACATCT-3’(序列1)

  PrimerB:5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’(序列2)

  PrimerC:5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’(序列3)

  b.使用Annealing Buffer(10mM Tris-HCl PH7.8,1mM EDTA PH8.0,50mM NaCl)溶解PrimerA、PrimerB、PrimerC至100μM。

  c.分别配制如下表1所示的反应体系:

  表1为反应体系

  

  d.分别将反应1和反应2涡旋震荡充分混匀,并短暂离心使溶液回到管底。置于PCR仪内,进行如下反应程序(热盖温度105℃):

  75℃,15min;60℃,10min;50℃,10min;40℃,10min;25℃,30min

  实现将PrimerA和PrimerB退火得到接头1,PrimerA和PrimerC退火得到接头2。

  e.反应结束后,将反应1(含有接头1)和反应2(含有接头2)等体积混合,命名为Adapter Mix,-20℃保存。

  B、接头(Adapter Mix)包埋:

  a.在灭菌PCR管中依次添加表2所示的各反应组分:

  表2为接头(Adapter Mix)包埋组分

  

  

  b.使用移液器轻轻吹打20次充分混匀。(重要!一定要轻轻吹打混匀,不宜震荡混匀)

  c.将反应置于25℃反应1h。反应产物命名为Tagment Enzyme Advanced Mix V5S,置于-20℃储存,即为包埋2个接头的Tn5转座酶。

  3)利用包埋2个接头的Tn5转座酶片段化cDNA

  a.于室温解冻5×TAG Buffer(BGI,BGE005BO1),上下颠倒混匀后备用;确认0.1%SDS处于室温,并轻弹管壁确认有无沉淀。如有沉淀,可于37℃加热并剧烈震荡充分混匀沉淀即会溶解;

  b.在灭菌PCR管中依次添加5ng 1)得到的dscDNA产物、0.6ul 2)得到的TagmentEnzyme Advanced Mix V5S、5×TAG Buffer,补充水至20ul。将反应体系置于55℃温浴7min后,添加5μL 0.1%SDS室温5min终止反应,得到Tn5转座酶片段化产物。

  4)片段化产物的PCR扩增

  a.取5ul 3)得到的Tn5转座酶片段化产物,并向其中加入5×KAPA FidelityBuffer(KAPA BIOSYSTEMS,cat.no.KK2101)、3mM each dNTP、0.02U KAPA HiFi DNApolymerase(KAPA BIOSYSTEMS,cat.no.KK2101)、0.2μM Primer F、0.2μM Primer R、0.01μM Tn5-zebra F、0.01uM Tn5-zebra barcode R,其余用Nuclease-free water补齐,得到总体积为50ul的PCR扩增体系;

  Primer F(该引物序列是Tn5-zebra F的一部分)序列为:

  5’-[Phos]GAACGACATGGCTACGATCCGACTT-3’(序列4);

  Primer R(该引物序列是Tn5-zebra barcode R的一部分)序列为:

  5’-TGTGAGCCAAGGAGTTGTTGTCTTC-3’(序列5);

  Tn5-zebra F(该引物序列一部分包含PrimerB序列)序列为:

  (加粗部分是完整的Primer F;斜体部分是Primer B的5‘端前14nt序列;)(序列6);

  Tn5-zebra barcode R(该引物序列一部分包含PrimerC序列)序列为:

  (加粗部分是完整的Primer R;斜体部分是Primer C的5‘端前14nt序列)(序列8)(注:barcode取Zebra barcode1-96号反向互补序列);

  b.使用移液器轻轻吹打上述a得到的PCR扩增体系10次充分混匀后,置于PCR仪中,设置如下反应程序:72℃,5min;95℃,3min;98℃20s,60℃15s,72℃25s(15Cycles);72℃5min;4℃,forever;进行PCR扩增,得到Tn5转座酶片段化产物的扩增产物。

  5)文库片段选择及纯化

  采用0.8×AMPure XP beads+0.2×AMPure XP beads(Backman

  coulter,cat.no.A63881)进行选择性纯化。

  (a)向50ul片段化扩增产物中加入40ul XP beads,移液器吹打混匀,室温孵育10min后,置于磁力架上静置5min.

  (b)吸取上清至一新的1.5mlEP管,丢弃磁珠。向上清液中加入10ul XP beads,用移液器吹混匀,室温孵育5分钟后,置于磁力架上静置5min。

  (c)去除上清,加入200ul新鲜配制的80%乙醇漂洗磁珠。室温孵育30秒后小心移除上清。重复该步骤一次,总计漂洗两次。

  (d)保持EP管始终处于磁力架中,开盖空气干燥磁珠3分钟。

  (e)将EP管从磁力架中取出,加入25ul灭菌超纯水洗脱。

  纯化的文库片段用Agilent 2100DNA 1000Reagent检测产物片段大小。结果表明,所有纯化的文库片段的条带范围均在150-500bp,且在300bp附近有一个主峰。

  6)文库热变性及环化

  每8个样品进行pooling,每个样品取20ng至一200ul EP管,并补充水至总体积为40ul。将Pooling文库放置于PCR仪上进行变性,反应条件94℃3min;反应结束后,迅速将样品转移至冰上冷却2min。

  继续向变性后的pooling文库中加入10×TA buffer(Epicentre,Cat.No.TA6115)、1mM ATP、2U T4DNA ligase(ENZYMATICS,cat.no.L6030)、16.7uM SplintOligo进行环化,总体系60ul。将反应体系置于PCR仪上37℃孵育30min,得到环化后文库,即为微量血小板RNA文库。

  上述Splint Oligo序列为5’-GCCATGTCGTTCTGTGAGCCAAGG-3’(序列9)。

  (二)微量血小板RNA文库测序

  上述(一)得到的环化后文库(微量血小板RNA文库)用BGISEQ-500测序仪,SE100测序策略进行测序。

  环化文库通过测序方法得到fastq文件,再将fastq文件用soap过滤质量值<10的碱基占50%以上的reads,过滤N的比例大于10%的reads,得到去除低质量的初过滤reads;再将初过滤reads进行rRNA序列的过滤,得到过滤后的reads;再将过滤后的reads采用STAR进行全基因组比对(参考基因组为hg19)得到唯一比对的reads;再将唯一比对的reads通过bam的CIGAR字串特征筛选跨越内含子的剪接reads(IS reads),并用htseq对原始bam和ISbam进行reads计数,得到IS reads数。以每Mb数据量的reads数(CPM)的log2对数值(logCPM)作为基因表达量定量值。

  对下机后的测序数据进行分析,平均每个样本获得大约78M的raw reads,平均每个样本的唯一比对率为73.35%。采用soap对原始reads进行过滤,并用STAR将过滤后reads比对到hg19参考基因组,得到8例正常样本的血小板RNA测序结果和15例癌症样本的血小板RNA测序结果。

  平均每个样本得到8M的IS reads用于后续的分析。

  (三)、基于BGISEQ-500的微量血小板RNA测序的应用

  一、差异基因筛选

  将(二)获得的8例正常样本的血小板RNA测序结果和15例癌症样本的血小板RNA测序结果,采用trimmed mean of M-values(TMM)方法进行标准化系数的计算,为了排除不同基因之间长度差异带来的影响。得到8例正常样本的血小板RNA的标准化后基因和15例正常样本的血小板RNA的标准化后基因。

  分别从8例正常样本的血小板RNA的标准化后基因和15例正常样本的血小板RNA的标准化后基因中筛选logCPM>3且覆盖25%以上样本的基因,按照训练集样本的分组情况,进行方差分析(ANOVA),以FDR<0.001为筛选限,共筛选出1063个差异基因。

  癌症样本与正常样本相比,523个为上调基因,540个为下调基因。依据1063个差异基因对各样本进行无监管分层集群(Unsupervised hierarchical clustering)分析,结果显示癌症样本和正常样本明显分为两支(如图2)。

  经过分析1063个差异基因得确为现有技术公知的癌症和正常样本的差异基因。证明,本发明的方法正确,能够对癌症样本和正常样本的血小板RNA准确测序。

  二、预测模型构建与留一验证

  以上述数据作为训练集,在筛选的差异基因范围内构建SVM预测模型,分类方法为“C-classification”。对该预测模型进行留一交叉验证(LOOCV),即对训练集中每一例样本,以剩余样本做训练集构建SVM预测模型来对其进行类型预测,从而评估该预测模型的准确性。确定好稳定可靠的训练集后,即可用该预测模型对待测样本进行SVM分类,从而判断癌症风险。

  依据一得到的1063个差异表达基因,采用SVM-LOOCV方法(即对训练集中每一例样本,以剩余样本做训练集构建SVM预测模型)对23例样本根据其类型相似度定义癌症风险评估值,结果如图3所示。由图可知,肿瘤样本的癌症风险评估值均在80%以上,正常样本的癌症风险评估值均在20%以下;23例所有正常样本均被预测为正常,所有癌症样本均被预测为癌症,即灵敏性、特异性和准确性均为100%。

  从以上结果表明,本专利发明的基于BGISEQ-500的微量血小板RNA肿瘤早期检测试剂盒,在用于肿瘤筛查上具有较高的准确性和可行性。后期需要采用大量的癌症样本和正常样本进行验证。

  序列表

  <110>深圳华大生命科学研究院

  <120>基于BGISEQ-500的微量血小板RNA测序检测试剂盒

  <160> 9

  <170> PatentIn version 3.5

  <210> 1

  <211> 19

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 1

  ctgtctctta tacacatct 19

  <210> 2

  <211> 33

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 2

  tcgtcggcag cgtcagatgt gtataagaga cag 33

  <210> 3

  <211> 34

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 3

  gtctcgtggg ctcggagatg tgtataagag acag 34

  <210> 4

  <211> 25

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 4

  gaacgacatg gctacgatcc gactt 25

  <210> 5

  <211> 25

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 5

  tgtgagccaa ggagttgttg tcttc 25

  <210> 6

  <211> 39

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 6

  gaacgacatg gctacgatcc gactttcgtc ggcagcgtc 39

  <210> 7

  <211> 25

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 7

  tgtgagccaa ggagttgttg tcttc 25

  <210> 8

  <211> 14

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 8

  gtctcgtggg ctcg 14

  <210> 9

  <211> 24

  <212> DNA

  <213> 人工序列

  <220>

  <223>

  <400> 9

  gccatgtcgt tctgtgagcc aagg 24

《基于BGISEQ-500的微量血小板RNA测序检测试剂盒.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)