欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 恶性淋巴瘤标志物及其应用独创技术34032字

恶性淋巴瘤标志物及其应用

2021-04-24 01:33:12

恶性淋巴瘤标志物及其应用

技术领域

  本发明涉及基因测序以及医学检测领域,具体涉及一种恶性淋巴瘤标志物及其应用,尤其涉及一种恶性淋巴瘤标志物及检测该标志物的探针和芯片,以及构建待测样品的恶性淋巴瘤检测测序文库的方法,确定待测样品中恶性淋巴瘤的基因突变的方法以及系统。

背景技术

  恶性淋巴瘤是一类全身性疾病,与机体免疫系统功能状态密切相关,既不同于其他实体恶性肿瘤,也有别于血液肿瘤。它包括了霍奇金淋巴瘤一种疾病和非霍奇金淋巴瘤一组疾病,临床表现因病理类型、分期及侵犯部位不同而错综复杂。目前,多个FDA批准的分子靶向药物适用于恶性淋巴瘤,例如Ibrutinib(BTK)和Idelalisib(PI3K delta),因此对恶性淋巴瘤基因突变进行准确及时的检测对于其临床诊断及治疗有着很大的意义。

  然而对于与恶性淋巴瘤相关的基因突变的检测和确定还需要改进。

  发明内容

  本发明旨在至少在一定程度上解决相关技术中的技术问题之一,提高对于恶性淋巴瘤基因突变的检测的高效性和灵敏度。为此,本发明的一个目的在于提出一种恶性淋巴瘤标志物及检测该标志物的探针和芯片,以及构建待测样品的恶性淋巴瘤检测测序文库的方法,确定待测样品中恶性淋巴瘤的基因突变的方法和系统。

  根据本发明的一方面,本发明提供了一种恶性淋巴瘤标志物,包括下表中的基因:

  

  

  本发明通过选取与恶性淋巴瘤相关性强的212个基因作为与恶性淋巴瘤相关的标志物,其相对于基于一次性对多种癌症相关的所有基因进行检测的技术,本发明具有更强的针对性,而且检测范围更小,检测成本更低,而且在保证灵敏度的同时可以显著提高效率。

  根据本发明的实施例,所述恶性淋巴瘤为弥漫性大B细胞淋巴瘤。

  根据本发明的另一方面,本发明提供了一种用于恶性淋巴瘤的探针。根据本发明的实施例,所述探针针对以上表格中所述的标志物中的所有外显子区域以及外显子与内含子的连接区域设计而成,所述探针特异性识别以上所述的恶性淋巴瘤标志物编码区的至少一部分,且所述探针满足选自下列条件的至少之一:

  (1)所述探针的长度为75-85bp,优选为81bp;

  (2)所述探针特异性识别以上实施例所述的标志物编码区上游10bp至下游10bp之间的序列;

  (3)特异性识别GC含量高于0.6及低于0.3的区域的探针,乘数大于2;

  (4)所述探针与目标序列的熔解温度为60-10摄氏度,优选80摄氏度;

  (5)所述探针不包含发夹结构;

  (6)所述探针与参考基因组上的至多2个位点匹配;

  (7)所述探针选择时的窗口滑动大小为10bp。

  根据本发明的又一方面,本发明提供了一种基因芯片。根据本发明的实施例,所述基因芯片包括探针和支持物,所述探针位于所述支持物表面,所述探针为以上实施例所述的探针。

  根据本发明的实施例,所述基因芯片可以进一步附加如下技术特征:

  根据本发明的实施例,所述基因芯片为液相芯片,所述支持物为含有不同荧光标记的微球。

  根据本发明的另一方面,本发明提供了一种构建待测样品的恶性淋巴瘤检测测序文库的方法,包括:对待测样品的目标序列进行富集,所述目标序列为上表中所述的恶性淋巴瘤标志物,且富集获得的目标序列构成所述用于恶性淋巴瘤检测的测序文库。

  根据本发明的实施例,所述方法可以进一步附加如下技术特征:

  根据本发明的实施例,所述方法中,利用以上实施例所述的探针或者以上实施例所述的基因芯片对待测样品的目标序列进行杂交捕获,从而实现所述富集。

  根据本发明的实施例,所述方法中,进一步包括:对所述用于恶性淋巴瘤检测的测序文库进行测序,以便获得测序序列。

  根据本发明的实施例,所述方法中,采用BGISeq-500测序平台对所述用于恶性淋巴瘤检测的测序文库进行测序。

  根据本发明的实施例,所述方法中,所述测序序列的测序深度达到400×以上,所述测序序列的覆盖度达到99%以上。

  根据本发明的实施例,所述方法中,所述测序序列的原始数据量在3Gb以上。

  根据本发明的另一方面,本发明提供了一种确定待测样品中恶性淋巴瘤的基因突变的方法。根据本发明的实施例,所述方法包括:

  按照以上实施例所述的构建方法构建所述待测样品的恶性淋巴瘤检测测序文库;

  对所述恶性淋巴瘤检测的测序文库进行测序,以便获得测序序列;

  将所述测序序列比对到参考基因组上,进行突变检测,得到候选突变数据;

  对所述候选突变数据进行筛选,获得潜在突变数据;

  对所述潜在突变数据进行注释,从而获得目标突变数据。

  根据本发明的实施例,以上用于恶性淋巴瘤的基因突变的确定方法可以进一步附加如下 技术特征:

  根据本发明的实施例,所述方法中,所述参考基因组为人类参考基因组hg19。

  根据本发明的实施例,所述方法中,利用VarScan软件进行所述突变检测。

  根据本发明的实施例,所述方法中,对所述候选突变数据进行筛选包括:过滤掉低质量、低覆盖度、位于重复区及序列两端的以及具有链偏向性的候选突变,其中所述低质量的候选突变是指碱基质量值小于20或比对质量值小于30的候选突变,所述低覆盖度的候选突变是指最小支持数小于3的候选突变。

  根据本发明的实施例,所述方法中,利用ANNOVA软件进行所述注释,利用人群突变数据库过滤掉多态性位点,利用致病突变数据库过滤掉良性突变。

  根据本发明的实施例,所述方法中,所述人群突变数据库选自千人基因组数据库、ExAc数据库和Esp6500数据库中的至少一种。

  根据本发明的实施例,所述方法中,所述致病突变数据库为ClinVar。

  根据本发明的实施例,所述方法进一步包括:

  在所述突变检测之前,对所述测序序列进行质量控制,从而过滤掉低质量及接头污染序列,然后将过滤后的序列比对到所述参考基因组上。

  根据本发明的又一方面,本发明提供了一种确定待测样品中恶性淋巴瘤的基因突变的系统。根据本发明的实施例,所述系统包括:

  目标区域文库构建单元,所述目标区域文库构建单元基于以上实施例所述的标志物作为目标区域,从而构建目标区域文库;

  测序单元,所述测序单元与所述目标区域文库构建单元相连,所述测序单元对所述目标区域文库进行检测,以便获得测序序列;

  候选突变确定单元,所述候选突变确定单元与所述测序单元相连,所述候选突变确定单元用于将目标区域文库中的测序序列比对到参考基因组上,进行突变检测,得到候选突变数据;

  潜在突变确定单元,所述潜在突变确定单元与所述候选突变确定单元相连,所述潜在突变确定单元用于对所述候选突变数据进行筛选,以便获得潜在突变数据;

  目标突变确定单元,所述目标突变确定单元与所述潜在突变确定单元相连,所述目标突变确定单元用于对所述潜在突变数据进行注释,从而获得目标突变数据。

  根据本发明的实施例,所述用于恶性淋巴瘤的确定基因突变的系统可以进一步附加如下技术特征:

  根据本发明的实施例,所述系统中,所述参考基因组为人类参考基因组hg。

  根据本发明的实施例,所述系统中,利用VarScan软件进行所述突变检测。

  根据本发明的实施例,所述系统中,对所述候选突变数据进行筛选包括:过滤掉低质量的候选突变、低覆盖度的候选突变、位于重复区及序列两端的候选突变以及具有链偏向性的候选突变,其中所述低质量的候选突变是指碱基质量值小于20或比对质量值小于30的候选突变,所述低覆盖度的候选突变是指最小支持数小于3的候选突变。

  根据本发明的实施例,所述系统中,所述利用ANNOVA软件进行所述注释,利用人群突变数据库过滤掉多态性位点,利用致病突变数据库过滤掉良性突变。

  根据本发明的实施例,所述系统中,所述人群突变数据库选自千人基因组数据库、ExAc数据库和Esp6500数据库中的至少一种。

  根据本发明的实施例,所述系统中,所述致病突变数据库为ClinVar。

  根据本发明的实施例,所述系统进一步包括:

  质量控制单元,所述质量控制单元与所述测序单元相连,所述质量控制单元用于在所述突变检测之前,对所述测序序列进行质量控制,从而过滤掉低质量及接头污染序列,然后将过滤后的序列比对到所述参考基因组上。

  根据本发明的另一方面,本发明提供了以上表格中212个标志物组合在制备恶性淋巴瘤基因突变的检测和/或确定的试剂中的用途。

  根据本发明的又一方面,本发明提供了以上表格中212个标志物组合在恶性淋巴瘤的基因突变的检测和/或确定领域中的用途。

  本发明所取得的有益效果是:本发明通过对212个恶性淋巴瘤特定目标基因DNA进行富集,然后借助于高通量测序手段,用于与恶性淋巴瘤相关的突变基因的检测和确定,可以快速有效用于检测目标序列中的单碱基替换、单碱基/多碱基插入或缺失,以及大片段缺失/扩增等突变类型,能够满足常见恶性淋巴瘤基因突变的高效、全面检测。尤其是借助于BGISEQ-500二代测序平台进行检测的方法,具有适用范围广、高效、全面、易操作的优势,实现恶性淋巴瘤相关的基因的快速高效测定。

附图说明

  图1为根据本发明的实施例提供的一种用于恶性淋巴瘤的确定基因突变的系统示意图。

  图2为根据本发明的实施例提供的一种用于恶性淋巴瘤的确定基因突变的系统示意图。

  图3为根据本发明的实施例提供的一种对测序序列分析获得目标突变的示意图。

  图4为根据本发明的实施例提供的利用两种检测方法获得的突变频率的一致性示意图,其中横坐标代表的利用全基因组测序获得的最小等位基因频率(MAF in WGS),纵坐标代表的是利用目标基因捕获测序获得的最小等位基因频率(MAF in LC)。

具体实施方式

  下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

  本发明所阐述的用于恶性淋巴瘤基因目标序列捕获联合高通量测序的方法是基于恶性淋巴瘤基因突变检测技术的需求而设计。本发明以常见恶性淋巴瘤基因(表1所示的212种基因)的所有外显子区域和外显子与内含子连接区域为目标捕获区域,设计能够同时捕获所有目标序列区域的探针组合,然后定制液相芯片(由华大基因生产),并联合华大基因BGISEQ-第二代高通量测序技术和信息分析技术,对所有捕获到的目标序列进行测序及不同类型的突变信息分析,以解读目标样本中是否存在恶性淋巴瘤癌症驱动基因及靶向用药基因突变,并根据突变性质指导恶性淋巴瘤的分型及用药,同时可迅速积累恶性淋巴瘤基因突变数据,为产业化提供有力数据支持。该发明具有适用范围广、高效、全面、易操作等优势,同时检测目标序列中的单碱基替换、单碱基/多碱基插入或缺失以及大片段缺失/扩增等突变类型,满足恶性淋巴瘤基因突变的高效、全面检测。

  恶性淋巴瘤标志物

  本发明的发明人通过进行调研分析,收集和分析了多个与恶性淋巴瘤相关的基因,然后根据其相关性以及致病性,最终确定了212个与恶性淋巴瘤相关的基因组合(如表1所示),作为用来确定恶性淋巴瘤的标志物,同时可以利用这些标志物作为目标区域,对其进行富集,可以有效的检测和/或确定与恶性淋巴瘤相关的基因突变,包括但是不限于单碱基替换、单碱基/多碱基插入或缺失以及大片段缺失/扩增等突变类型,从而可以满足恶性淋巴瘤基因突变的高效、全面检测,经过实验证实检测快速,其灵敏度达到93%以上。

  表1 目标基因组合

  

  

  表2和表3分别列出了各恶性淋巴瘤癌症基因的名称和其所对应的恶性淋巴瘤名称。发明人基于一系列的理论研究和实验验证工作,发现并论证了上表中的212个基因与之间的相关性,认为采用这组基因即可实现对恶性淋巴瘤的有效检出,并且相对于以其中的某单个基因或其他基因组合作为标志物来说,检测结果更准确、真实可靠,可重复性好。

  需要说明的是,这组基因囊括于淋巴瘤的重要致病信号通路,例如,BCR、染色质修饰、细胞凋亡和细胞周期调控、免疫抑制以及Notch。这组基因在淋巴瘤癌症基因检测领域具有广泛、全面的优势。并且,这些基因在影响因子较高的文献中也有分别列出,而且,至今未有任何报道是将这212个基因的组合用作一个恶性淋巴瘤的标志物的。此外,其中的KLF2基因,ZFP36L1基因,TMSB4X基因(KLF2和ZFP36L1是NOTCH信号通路的重要调节 因子)是发明人首次发现在亚洲人种中突变频率显著高于高加索人种的恶性淋巴瘤致病相关基因。

  这些与恶性淋巴瘤相关的基因与弥漫性大B细胞淋巴瘤、套细胞淋巴瘤、滤泡型淋巴瘤、伯基特淋巴瘤相关,尤其与弥漫性大B细胞淋巴瘤相关。

  表2 检测基因列表

  

  

  

  

  备注:表1中的“Important”是指:存在于淋巴瘤的重要的致病信号通路。

  表3 对应恶性淋巴瘤及参考文献列表

  

  

  发明人基于发现的这212个与恶性淋巴瘤相关的标志物组合,设计了一种可以用于恶性淋巴瘤的探针以及基因芯片。所述探针以这212个目标癌症基因的所有外显子区和外显子与内含子连接区域为总目标区域设计而成,且这组探针特异性识别以上212个所述的标志物编码区的至少一部分,且所述探针满足选自下列条件的至少之一:(1)所述探针的长度为75-85bp,优选81bp;(2)所述探针特异性识别这212个所述的标志物编码区上游10bp至下游10bp之间的序列;(3)特异性识别GC含量高于0.6及低于0.3的区域的探针,乘数大于2;(4)所述探针与目标序列的熔解温度为60-10摄氏度,优选80摄氏度;(5)所述探针不包含发夹结构;(6)所述探针与参考基因组上的至多2个位点匹配;(7)所述探针选择时的窗口滑动大小为10bp。

  根据以上原则设计的用于恶性淋巴瘤的探针,共计包含32779条探针,每条探针序列的长度为81bp,序列前后各包含16bp和15bp的标签序列,前后两个标签序列的序列组成分别是GAAGCGAGGATCAACT(SEQ ID NO:1)和CATTGCGTGAACCGA(SEQ ID NO:2)这两个标签序列分别为酶切位点和转录位点,两端均是用来设计PCR引物的, 同时转录位点用来做转录,起到转录为RNA探针的作用。

  在此基础上,发明人又设计了一种基因芯片,所述基因芯片包括探针和支持物,所述探针位于所述支持物表面。根据本发明的一种具体实施方式,所述基因芯片可以设计为液相芯片,所述支持物为含有不同荧光标记的微球。

  确定待测样品中恶性淋巴瘤的基因突变的方法

  本发明的发明人发现:通过这212个与恶性淋巴瘤相关的标志物组合作为目标区域,对其进行富集,可以构建得到用于恶性淋巴瘤的测序文库,在此基础上,对该测序文库进行生物信息学分析,可以有效的检测和/或确定与恶性淋巴瘤相关的基因突变,包括但是不限于单碱基替换、单碱基/多碱基插入或缺失以及大片段缺失/扩增等突变类型,从而可以满足恶性淋巴瘤基因突变的高效、全面检测,经过实验证实检测快速,其灵敏度达到93%以上。从而可以实现恶性淋巴瘤癌症基因突变位点的全面检测,具有检测通量高、灵敏度高、特异性强、准确性高、覆盖度广等技术优势,有效解决恶性淋巴瘤癌症基因突变区域广、突变位点不确定等问题。

  根据本发明的实施例,所述确定待测样品中恶性淋巴瘤的基因突变的方法包括:对待测样品的目标序列进行富集,所述目标序列为212个恶性淋巴瘤标志物组合,通过富集获得的目标序列构成所述用于恶性淋巴瘤检测的测序文库;对所述恶性淋巴瘤检测的测序文库进行测序,以便获得测序序列;将所述测序序列比对到参考基因组上,进行突变检测,得到候选突变数据;对所述候选突变数据进行筛选,获得潜在突变数据;对所述潜在突变数据进行注释,从而获得目标突变数据。本发明中待测样品可以来自于组织样品。

  需要说明的是,本发明的确定待测样品中恶性淋巴瘤的基因突变的方法,也可以表述为用于恶性淋巴瘤的基因突变的检测和/或确定方法,该方法并非疾病的诊断方法,适用本发明检测到的突变结果只能说明相关个体的癌症组织携带一致的癌症驱动基因突变情况,实践中还需要结合临床结果才能确认个体患病情况。

  本领域技术人员可以根据实际需要,借助于不同的技术对于目标区域的DNA序列进行富集,包括但是不限于基于多重PCR技术的目标区域DNA富集方法(如Thermo Fisher Scientific公司的AmpliSeq技术)和基于探针杂交技术的目标区域DNA富集方法(如Agilent公司的SureSelect技术,及Nimble公司的SeqCap EZ技术)。

  在借助于高通量测序技术对目标DNA进行测序的过程中,可以利用Illumina公司的Hiseq/Miseq/NextSeq,Thermo Fisher Scientific公司的Ion Proton/Ion PGM,以及华大基因的BGISEQ-500等二代测序平台,以及PacBio等三代测序平台。根据本发明的一种具体实施方式,利用BGISeq-500测序平台进行测序获得所述测序序列。采用华大自主研发的测序仪进行高通量测序,具有更强的兼容性,测序效果更好。

  根据本发明的一种具体实施方式,所构建的测序文库的原始数据量达到3Gb以上,目标区域测序深度达到400×以上,目标区域覆盖度达到99%以上。其中测序深度指的是测序得到的碱基总量(bp)与基因组大小(Genome)的比值,反映被测基因组上单个碱基被测序的平均次数。测序覆盖度是指测序获得序列占整个基因组的比例。

  根据本发明的一种具体实施方式,对所述候选突变数据进行筛选,包括通过筛选去除掉低质量、低覆盖度、位于重复区及序列两端的以及具有链偏向性的候选突变数据。所述低质量的候选突变是指碱基质量值小于20(base quality<20)或比对质量值(mapping quality<30)的序列、低覆盖度的候选突变指的是最小支持数小于3(minimal support depth<3)的候选突变。具有链偏向性的候选突变是指只发生在一条链上的候选突变。

  确定待测样品中的恶性淋巴瘤的基因突变的系统

  本发明基于发明人发现的同恶淋巴瘤相关的212个基因的组合,以这212个特定基因的组合作为目标基因,设计了一种确定待测样品中的恶性淋巴瘤的基因突变的系统。本发明所述确定待测样品中的恶性淋巴瘤的基因突变的系统,也可以理解为检测待测样品中的恶性淋巴瘤的基因突变的系统,是用来检测和确定待测样品中与恶性淋巴瘤相关的基因是否发生突变的系统。利用该系统可以检测目标序列中的单碱基替换、单碱基/多碱基插入或缺失,以及大片段缺失/扩增等突变类型,能够满足常见恶性淋巴瘤基因突变的高效、全面的检测和确定。

  根据本发明的实施例,本发明提供了一种确定待测样品中恶性淋巴瘤的基因突变的系统,如图1所示,所述系统包括:目标区域文库构建单元,所述目标区域文库构建单元基于本发明212中标志物组合作为目标区域,来构建目标区域文库;测序单元,所述测序单元与所述目标区域文库构建单元相连,所述测序单元对所述目标区域文库进行检测,以便获得测序序列;候选突变确定单元,所述候选突变确定单元与所述测序单元相连,所述候选突变确定单元用于将目标区域文库中的测序序列比对到参考基因组上,进行突变检测,得到候选突变数据;潜在突变确定单元,所述潜在突变确定单元与所述候选突变确定单元相连,所述潜在突变确定单元用于对所述候选突变数据进行筛选,以便获得潜在突变数据;目标突变确定单元,所述目标突变确定单元与所述潜在突变确定单元相连,所述目标突变确定单元用于对所述潜在突变数据进行注释,从而获得目标突变数据。

  根据本发明的实施例,所述确定待测样品中恶性淋巴瘤的基因突变的系统还可以如图2所示,所述系统包括:目标区域文库构建单元,所述目标区域文库构建单元基于本发明212中标志物组合作为目标区域,来构建目标区域文库;测序单元,所述测序单元与所述目标区域文库构建单元相连,所述测序单元对所述目标区域文库进行检测;质量控制单元,所述质量控制单元与所述测序单元相连,所述质量控制单元用于在所述突变检测之前,对所 述测序序列进行质量控制,从而过滤掉低质量及接头污染序列,然后将过滤后的序列比对到所述参考基因组上;候选突变确定单元,所述候选突变确定单元与质量控制单元相连,所述候选突变确定单元用于将所述过滤后的序列比对到所述参考基因组上,进行突变检测,得到候选突变数据;潜在突变确定单元,所述潜在突变确定单元与所述候选突变确定单元相连,所述潜在突变确定单元用于对所述候选突变数据进行筛选,以便获得潜在突变数据;目标突变确定单元,所述目标突变确定单元与所述潜在突变确定单元相连,所述目标突变确定单元用于对所述潜在突变数据进行注释,从而获得目标突变数据。

  下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。

  实施例一制备探针和芯片

  以表1中的恶性淋巴瘤标志物,即212个目的基因的所有外显子区和外显子与内含子连接区域为总目标区域(总共约500kb),按照以下探针设计原则制备探针:

  (1)所述探针的长度为81bp;

  (2)所述探针特异性识别表1中的212个所述的标志物编码区上游10bp至下游10bp之间的序列;

  (3)特异性识别GC含量高于0.6及低于0.3的区域的探针,乘数大于2;

  (4)所述探针与目标序列的熔解温度为60-10摄氏度,优选80摄氏度;

  (5)所述探针不包含发夹结构;

  (6)所述探针与参考基因组上的至多2个位点匹配;

  (7)所述探针选择时的窗口滑动大小为10bp。

  由此,获得212个目的基因的探针,这组探针特异性识别这212个所述的标志物的编码区的至少一部分。最终获得的目标区域探针序列包含32779条探针,每条探针序列的长度为81bp,序列前后各包含16bp和15bp的标签序列,前后两个标签序列的序列组成分别为GAAGCGAGGATCAACT(SEQ ID NO:1)和CATTGCGTGAACCGA(SEQ ID NO:2)。其中,这两个标签序列分别为酶切位点和转录位点,两端均是用来设计PCR引物的,同时转录位点用来做转录,起到转录为RNA探针的作用。

  由于探针数量巨大,此处仅给出其中个别基因的几条探针序列作为示例,具体如下:

  KLF2基因探针序列(SEQ ID NO:3)

  

  KLF2基因探针序列(SEQ ID NO:4)

  

  KLF2基因探针序列(SEQ ID NO:5)

  

  KLF2基因探针序列(SEQ ID NO:6)

  

  KLF2基因探针序列(SEQ ID NO:7)

  

  ZFP36L1基因探针序列(SEQ ID NO:8)

  

  ZFP36L1基因探针序列(SEQ ID NO:9)

  

  ZFP36L1基因探针序列(SEQ ID NO:10)

  

  ZFP36L1基因探针序列(SEQ ID NO:11)

  

  ZFP36L1基因探针序列(SEQ ID NO:12)

  

  TMSB4X基因探针序列(SEQ ID NO:13)

  

  TMSB4X基因探针序列(SEQ ID NO:14)

  

  TMSB4X基因探针序列(SEQ ID NO:15)

  

  TMSB4X基因探针序列(SEQ ID NO:16)

  

  TMSB4X基因探针序列(SEQ ID NO:17)

  

  进一步,利用上述得到的212个目的基因的探针,制备液相捕获芯片,备用。其中,液相芯片利用聚苯乙烯微球(Microspheres)制备而成,聚苯乙烯微球直径约为5.6μm,表面带有羧基基团,内部含有红色和橙色两种染料,根据两种染料比例的不同可以将微球分为100种,每一个拥有一个编号。每种微球因为内部荧光比例的不同,具有特定的光谱特征,可被激光特异的识别。利用不同编号的微球包被不同的探针分子,从而实现检测样品中的目的分子,目的分子再与带有荧光的报告分子结合。然后通过荧光检测,实现目的分子的检测。

  实施例二

  本实施例基于16例弥漫性大B细胞淋巴瘤癌症样品,利用芯片捕获联合高通量测序技术,检测分析16例弥漫性大B细胞淋巴瘤癌症基因的SNP和Indel突变情况,从而用来确认该批样本中的癌症基因驱动突变。

  其中,所用到的实验样本为16例临床上确诊为弥漫性大B细胞淋巴瘤的组织样品。具体实验方法如下:

  1、癌症组织基因组DNA提取

  使用QIAGEN组织和血液DNA提取试剂盒(QIAGEN DNA Tissue and Blood mini kit),并按照该试剂盒的提取说明书中的记载,从弥漫性大B细胞淋巴瘤组织样本中提取基因组DNA,使用Qubit3.0荧光分析计检测DNA浓度,要求浓度大于5ng/μL,体积大于30μL,而且原则上每份样本的DNA获得量≥2μg,然后电泳检测DNA是否完整及其降解程度,对于严重降解的样品不适合建库,其中电泳条件为:1%的琼脂糖凝胶,电泳电压4V/cm,电泳时间45min。琼脂糖凝胶电泳的结果显示所有样本的DNA完整,基本没有降解。

  2、测序前的文库构建

  取100ng基因组DNA,利用DNA打断仪使用酶切法随机进行打断,同步进行末端修复及加A;紧接着进行接头连接及纯化、PCR扩增,获得杂交前文库,并利用Agient2100生物分析仪进行二次片段筛选,获得150-500bp的长度片段;然后使用液相捕获芯片对PCR产物进行目标区域杂交捕获,再通过洗脱试剂将目标DNA从探针上洗脱下来,获得需要的目标DNA;其后,再进行PCR扩增。所得产物进行环化,即构建成目标区域捕获的文库,其中所获得的杂交文库的产量大于160ng。

  其中,所使用的液相捕获芯片为实施例一制备获得的。

  3、高通量测序

  对质控合格后的文库DNA,按照BGISeq-500测序的操作说明进行上机测序。获得的每个样本的测序原始数据量达到3Gb以上,目标区域的平均测序深度达到400×,目标区域覆盖度为99%以上。16例样本的测序数据质量情况如下表4所示。

  表4 测序样本的基本信息

  

  

  4、测序数据过滤、比对、突变分析

  测序完成后,对下机数据进行生物信息分析,流程如下(如图3所示):

  首先,对测序得到的reads进行质量控制(QC),从而去除测序质量不符合要求及测序接头污染的序列,获得干净序列(即过滤后的序列)。然后使用bwa(Burrows-Wheeler Aligner)软件将过滤后的序列比对到人类的参考基因组Hg19(http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/)上,获得比对结果,然后利用VarScan软件进行突变检测,获得候选突变,并对候选突变结果进行初始过滤,过滤掉低质量(base quality<20或mapping quality<30)、低覆盖度(minimal support depth<3)、位于重复区及reads两端、具有链偏向性的突变位点,最终得到潜在的突变列表。

  对得到的潜在突变列表通过ANNOVA软件进行注释,排除其中同义突变。然后使用人群突变数据库(如千人基因组数据库(http://www.1000genomes.org),ExAC数据库和Esp6500数据库),过滤人群中常见的多态性位点。使用致病突变数据库(如ClinVar),过滤掉良性突变,并得到最终突变结果,即获得目标突变数据。其中,同义突变是一种中性突变,由于生物的遗传密码子存在简并现象,当发生同义突变后,碱基虽然被替换,产生了新的密码子,但是新旧密码子所编码的氨基酸种类保持不变,因此,这部分突变并不会对致病情况带来任何影响。

  实验结果表明:通过对16例样本的测序数据进行分析及过滤,共检测到163个癌症突变位点。

  实施例三

  本实施例利用与实施例二同样的样品,利用hiseq2000测序平台,根据其全基因组测序的方法,按照其操作指南构建每个样本对应的测序文库,同时按照与实施例二中步骤4相同的方法,确定癌症突变。实验结果表明,利用全基因组测序的方法,对这16例弥漫性大B细胞淋巴癌患者进行检测,相比较于正常样品,共检测到174个癌症突变位点。

  对比实施例二和实施例三的实验结果可以看出,利用全基因组测序的方式,在所有16例弥漫性大B细胞淋巴癌患者中共计检测出174个癌症突变,而利用与恶性淋巴瘤相关的212个目的基因捕获的方式,在这174个癌症突变中,共计检测到163个癌症突变,对比两个检测结果可以看出,采用与恶性淋巴瘤相关的212个目的基因捕获的方式进行突变检测, 相比较于全基因组进行测序来进行突变检测,其整体灵敏度达到93.7%。每个样品的详细检测情况如下表5所示,其中包括SNP突变位点以及插入缺失变异(Indel变异):

  表5 每个样本的详细检测情况

  

  同时,通过目的基因捕获的方式检测到的最小等位基因频率与通过全基因组测序检测到的最小等位基因频率的相关性高达0.8186(r2,皮尔森相关性系数)如图4所示。其中,图4中横坐标代表的利用全基因组测序获得的最小等位基因频率(MAF in WGS,Minor allele frequency in Whole-genome-sequencing),纵坐标代表的是利用目标基因捕获测序获得的最小等位基因频率(MAF in LC,Minor allele frequency in Low-coverage whole-genome-sequencing)。由此可见,通过目的基因捕获的方式检测到的最小等位基因频率与通过全基因组测序检测到的最小等位基因频率的相关性高达80%以上,表现出良好的相关性。

  在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机 械连接,也可以是电连接或彼此可通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

  在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

  尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

《恶性淋巴瘤标志物及其应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)