欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一组用于肺癌分子分型的基因及其应用独创技术22975字

一组用于肺癌分子分型的基因及其应用

2021-02-04 21:38:17

一组用于肺癌分子分型的基因及其应用

  技术领域tt

  本发明涉及癌症诊断和分子生物学领域,以及诊断技术在临床上的应用。具体地,本发明涉及一组用tt于肺癌分子分型的基因,通过肺癌分子分型方法的建立和通过检测肺癌组织中的特异性基因的表达,鉴别tt肺癌最主要的亚型:肺腺癌和肺鳞癌。本发明还涉及完成所述肺癌分子分型方法的试剂盒。tt

  背景技术tt

  肺癌是世界范围内对人群健康和生命威胁最大的恶性肿瘤之一。男性肺癌发病率和死亡率均占恶性肿tt瘤的第一位,女性肺癌发病率占恶性肿瘤的第二位,仅次于乳腺癌,死亡率占第一位。根据《2012肿瘤登tt记年报》,全国肿瘤登记地区肺癌的发病率为53.57/10万,中国人口标化率为25.34/10万,男性为女性tt的1.94倍;肺癌的死亡率为45.57/10万,男性为女性的2.05倍。tt

  肺癌可分为非小细胞肺癌和小细胞肺癌。其中,非小细胞肺癌占80%以上,主要由腺癌(又称肺腺tt癌)和鳞癌(又称鳞状细胞癌或肺鳞癌)组成。在目前临床实际工作中,组织病理学检查是肺癌诊断和分tt类的金标准,传统的病理组织学方法是将获取的病变组织通过固定、脱蜡、染色等步骤,制成切片在显微tt镜下观察其形态学特征。检测方法步骤繁多,等待时间较长,检测结果具有一定的主观性。特别是当肿瘤tt分化较差,缺少肺腺癌和肺鳞癌的形态学特征,分型就比较困难。因此出现了组织学类型不明确型非小细tt胞肺癌这一概念。2009年一项研究发现在活检样本中,组织学类型不明确型非小细胞肺癌占25%,在细胞tt学标本中占40%。因此,需要一种比较客观的能够有效区分肺腺癌和肺鳞癌的方法。tt

  另外,肺癌是一类分子水平上高度异质性的疾病,组织学形态相同的肿瘤,其分子遗传学改变不尽一tt致,从而导致了肺癌治疗反应和预后的差别。越来越多的新的放化疗药物和靶向药物的出现要求严格区分tt肺腺癌和肺鳞癌。如肺腺癌使用培美曲塞后生存期显著增长,肺鳞癌患者使用贝伐单抗存在大出血的风险,tt白蛋白紫杉醇联合顺铂治疗晚期肺鳞癌疗效较好,因此对其进行精准分型是肺癌个体化治疗的必然要求。tt

  近年来,肿瘤标志物的研究大大加深了对肺癌的认识,使得对其进一步分类、诊断及预后判断成为可tt能。如癌胚抗原(CEA)用于肺腺癌的检测,细胞角蛋白19片段21-1(CYFR21-1)用于肺鳞癌的检测,神tt经特异性烯醇化酶(NSE)用于小细胞肺腺癌的诊断等,但是因为敏感性和特异性的问题,存在较高的假tt阳性和假阴性,诊断效率低。基因分子诊断具有灵敏度高、特异性强、背景机理明确的优点,近年来被越tt来越多地运用于各种肿瘤。因此,利用基因分子诊断,找到一种区分肺腺癌和肺鳞癌的方法,有助于实现tt个性化用药,对患者进行精准治疗具有重要的临床意义。tt

  发明内容tt

  本发明要解决的技术问题之一是提供一组用于肺癌分子分型的基因,建立肺癌统计分析模型,有助于tt实现个体化治疗。tt

  本发明要解决的技术问题之二是提供一组用于肺癌分子分型的基因的用途。tt

  本发明要解决的技术问题之三是提供一种用于肺癌分子分型的试剂盒及其用途。tt

  本发明要解决的技术问题之四是提供一组用于肺癌分子分型的基因在制备用于判断肺癌亚型的基因tt芯片中的应用。tt

  为解决上述技术问题,本发明采用如下技术方案:tt

  在本发明的一方面,提供一组用于肺癌分子分型的基因,包括如下13个基因:COMP基因、FXYD3基tt因、GABRP基因、HLA-DQA1基因、MMP10基因、NMU基因、NTS基因、RPS4Y1基因、SERPINB4基因、SERPINB5tt基因、SPRR2A基因、SPRR3基因、UPK1B基因。tt

  作为本发明优选的技术方案,该组用于肿瘤分子分型的基因,还包括如下17个基因(即包括30个基tt因):CLCA2基因、DSG3基因、FGB基因、HSD17B2基因、KRT14基因、KRT17基因、KRT5基因、KRT6A基tt因、KRT6B基因、MIR205HG基因、MMP12基因、S100A2基因、SERPINB3基因、SPINK1基因、SPRR1B基因、ttTFPI2基因、TRIM29基因。tt

  本发明通过基因检测、标志物组合及数据挖掘算法的联合应用来建立基因标志物组合模型,利用多基tt因预测模型区分肺癌的最主要亚型,即肺腺癌和肺鳞癌,主要包括以下步骤:tt

  (1)收集肺癌的临床诊断数据和基因表达谱数据,构建包含人类已知2万多个基因、2000例样品的肺癌tt基因表达谱数据库;tt

  (2)对基因表达模式进行统计分析,筛选出30个与肺癌亚型密切相关的基因,分别为:CLCA2基因、COMPtt基因、DSG3基因、FGB基因、FXYD3基因、GABRP基因、HLA-DQA1基因、HSD17B2基因、KRT14基因、KRT17tt基因、KRT5基因、KRT6A基因、KRT6B基因、MIR205HG基因、MMP10基因、MMP12基因、NMU基因、NTS基tt因、RPS4Y1基因、S100A2基因、SERPINB3基因、SERPINB4基因、SERPINB5基因、SPINK1基因、SPRR1Btt基因、SPRR2A基因、SPRR3基因、TFPI2基因、TRIM29基因、UPK1B基因。tt

  (3)计算上述30个基因表达模式,通过统计分析模型对肺癌亚型进行评价,计算生物学样品与肺癌亚型tt的相似度分数(SimilarityScore)。根据相似度分数最高的判定规则,判定亚型。tt

  本发明提供了一种用于判断肺癌亚型的检测方法,包括以下步骤:tt

  (1)将取自肺癌患者的生物学样品与生物标志物接触,所述生物标志物包括上述30个基因;所述生物学tt样品是取自所述对象的离体肿瘤组织,可以是新鲜样本或者福尔马林固定的石蜡包埋(FFPE)样本;tt

  在此基础上,进一步进行肺癌亚型判断:tt

  (2)检测该生物学样品中30个基因的表达模式和表达水平,基于30个基因的表达水平来判断该生物学tt样品的亚型类别。采用数据分析方法,计算该生物学样品与肺癌亚型的相似度分数(SimilarityScore)。tt根据相似度分数最高的判定规则,判定亚型。所述检测包括从所述样品制备RNA,所述RNA用于聚合酶链tt式反应(PCR),所述PCR是逆转录PCR(RT-PCR),可选实时RT-PCR或者基因芯片或者高通量测序技术。tt

  在本发明的另一方面,提供一组用于判断肺癌亚型的基因在制备用于判断肺癌亚型的试剂盒中的应tt用。tt

  在本发明的另一方面,提供一种用于判断肺癌亚型的试剂盒,该试剂盒包含如下生物标志物,所述生tt物标志物选自上述一组用于肺癌分子分型的基因中的任意一种或多种。tt

  作为本发明优选的技术方案,所述生物标志物是核酸、寡核酸链、或PCR引物组。tt

  作为本发明优选的技术方案,所述PCR引物组包括:tt

  COMP基因:正向引物如SEQIDNO.1所示,反向引物如SEQIDNO.2所示;tt

  FXYD3基因:正向引物如SEQIDNO.3所示,反向引物如SEQIDNO.4所示;tt

  GABRP基因:正向引物如SEQIDNO.5所示,反向引物如SEQIDNO.6所示;tt

  HLA-DQA1基因:正向引物如SEQIDNO.7所示,反向引物如SEQIDNO.8所示;tt

  MMP10基因:正向引物如SEQIDNO.9所示,反向引物如SEQIDNO.10所示;tt

  NMU基因:正向引物如SEQIDNO.11所示,反向引物如SEQIDNO.12所示;tt

  NTS基因:正向引物如SEQIDNO.13所示,反向引物如SEQIDNO.14所示;tt

  RPS4Y1基因:正向引物如SEQIDNO.15所示,反向引物如SEQIDNO.16所示;tt

  SERPINB4基因:正向引物如SEQIDNO.17所示,反向引物如SEQIDNO.18所示;tt

  SERPINB5基因:正向引物如SEQIDNO.19所示,反向引物如SEQIDNO.20所示;tt

  SPRR2A基因:正向引物如SEQIDNO.21所示,反向引物如SEQIDNO.22所示;tt

  SPRR3基因:正向引物如SEQIDNO.23所示,反向引物如SEQIDNO.24所示;tt

  UPK1B基因:正向引物如SEQIDNO.25所示,反向引物如SEQIDNO.26所示。tt

  作为本发明优选的技术方案,所述PCR引物组还包括:tt

  CLCA2基因:正向引物如SEQIDNO.27所示,反向引物如SEQIDNO.28所示;tt

  DSG3基因:正向引物如SEQIDNO.29所示,反向引物如SEQIDNO.30所示;tt

  FGB基因:正向引物如SEQIDNO.31所示,反向引物如SEQIDNO.32所示;tt

  HSD17B2基因:正向引物如SEQIDNO.33所示,反向引物如SEQIDNO.34所示;tt

  KRT14基因:正向引物如SEQIDNO.35所示,反向引物如SEQIDNO.36所示;tt

  KRT17基因:正向引物如SEQIDNO.37所示,反向引物如SEQIDNO.38所示;tt

  KRT5基因:正向引物如SEQIDNO.39所示,反向引物如SEQIDNO.40所示;tt

  KRT6A基因:正向引物如SEQIDNO.41所示,反向引物如SEQIDNO.42所示;tt

  KRT6B基因:正向引物如SEQIDNO.43所示,反向引物如SEQIDNO.44所示;tt

  MIR205HG基因:正向引物如SEQIDNO.45所示,反向引物如SEQIDNO.46所示;tt

  MMP12基因:正向引物如SEQIDNO.47所示,反向引物如SEQIDNO.48所示;tt

  S100A2基因:正向引物如SEQIDNO.49所示,反向引物如SEQIDNO.50所示;tt

  SERPINB3基因:正向引物如SEQIDNO.51所示,反向引物如SEQIDNO.52所示;tt

  SPINK1基因:正向引物如SEQIDNO.53所示,反向引物如SEQIDNO.54所示;tt

  SPRR1B基因:正向引物如SEQIDNO.55所示,反向引物如SEQIDNO.56所示;tt

  TFPI2基因:正向引物如SEQIDNO.57所示,反向引物如SEQIDNO.58所示;tt

  TRIM29基因:正向引物如SEQIDNO.59所示,反向引物如SEQIDNO.60所示。tt

  上述试剂盒的使用方法包括以下步骤:tt

  (1)将包含肿瘤组织的生物学样品与生物标志物接触;tt

  (2)测定所述标志物在该生物学样品中的表达水平;tt

  (3)检测生物学样品中基因的表达模式,并将其与肺癌基因表达谱数据库进行比对。tt

  所述试剂盒检测的表达可以通过实时定量逆转录聚合酶链式反应(RT-PCR),或者基因芯片,或者高tt通量测序技术。tt

  所述试剂盒检测的表达水平是mRNA表达水平。tt

  仅作为本发明上述补助的例子,针对石蜡包埋肿瘤组织,利用实时定量逆转录聚合酶链式反应tt(RT-PCR),区分肺癌亚型的方法,包含以下步骤:tt

  (1)获取肿瘤组织的石蜡包埋组织;tt

  (2)以实时定量逆转录聚合酶链式反应检测该样品中30个基因的表达;tt

  (3)检测该样品中30个基因的表达模式,并将其与肺癌基因表达谱数据库进行比对,区分肺癌亚型。tt

  在本发明的另一方面,提供所述的试剂盒在制备判断肺癌亚型的制剂中的用途。tt

  在本发明的另一方面,提供一组用于肺癌分子分型的基因在制备用于判断肺癌亚型的基因芯片中的应tt用,所述基因芯片包括固相载体和探针,所述探针与待测13个基因序列和/或其互补序列进行杂交,待测tt13个基因为:COMP基因、FXYD3基因、GABRP基因、HLA-DQA1基因、MMP10基因、NMU基因、NTS基因、ttRPS4Y1基因、SERPINB4基因、SERPINB5基因、SPRR2A基因、SPRR3基因、UPK1B基因;所述探针分别是ttSEQIDNo.61~SEQIDNo.73所示序列。tt

  在本发明的另一方面,提供一组用于肺癌分子分型的基因在制备用于判断肺癌亚型的基因芯片中的应tt用,所述基因芯片包括固相载体和探针,所述探针与上述待测30个基因序列和/或其互补序列进行杂交,tt所述探针分别是SEQIDNo.61~SEQIDNo.90所示序列。tt

  本发明通过检测30个与肺癌亚型相关的基因,构建统计分析模型用于区分肺腺癌和肺鳞癌,从而帮tt助医生进行用药指导,实现精准医疗,以提高肺癌患者的生存率,改善患者生存状况。经试验验证,本发tt明试剂盒能准确区分肺腺癌和肺鳞癌,其适用范围广、准确率高,有助于实现个性化用药,对患者进行精tt准治疗具有重要的临床意义。tt

  附图说明tt

  图1是本发明实施例5中30基因肺癌诊断的判别结果示意图。tt

  具体实施方式tt

  以下实施例仅用于说明本发明,而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,tt按照制造试剂盒生产公司所建议的条件或按照常规实验条件,例如Sambrook等人,分子克隆:实验室手tt册(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的条件。除非另行定义,文中所使tt用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方tt法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。tt

  实施例1.tt

  训练集样本收集及处理:

  本发明分析了大样本量的肺癌患者临床数据及其生物学样品数据,其中包括391例肺腺、237例肺鳞tt癌,总计628例患者的相关临床资料和基因表达数据,构建肺癌基因表达谱数据库。tt

  13个特异性基因的筛选:

  根据基因表达丰度的测量值,发明人采用统计分析方法T检验从2万多个基因中筛选出13个与肿瘤tt原发部位密切相关的基因。这些基因在肺癌亚型中存在差异性表达,具有统计学意义,见表1。tt

  表1:13基因集合tt

  

  13基因统计分析模型的构建:

  基于13个特异基因在628例肺癌样本中的表达模式,发明人采用支持向量机(SupportVectorttMachines)算法,建立统计分析模型用于判别肺癌亚型。对于每一例待测样品,模型计算该样品的基因表tt达模式与数据库中腺癌和鳞癌样品的相似度分数,并根据相似度分数最大原则判别该样品的亚型类别。自tt1992年发明以来,支持向量机算法已被广泛地应用于解决各类模式识别问题,包括金融数据分析、语音识tt别和生物数据分析。本领域的技术人员可通过开源免费的分析软件,例如:R、Rapidminer和WEKA使用支tt持向量机算法。不仅仅局限于支持向量机算法,其他公知的数据挖掘方法都可采用,例如加权投票tt(WeightedVoting)、K-最邻近值(K-nearestNeighbors)、随机森林(RandomForest)、相关性系数tt(CorrelationCoefficients)等。tt

  实施例2.tt

  验证集测试:

  本实施例中,发明人分析了包含1130例肺癌的高通量测序数据,其中有肺腺癌576,肺鳞癌554例。tt通过13基因统计分析模型对每个样品进行亚型的判别,并与临床病理诊断结果相比较,准确率为82.7%。tt以肺腺癌为参照,预测的敏感度为93.0%,特异度为72.0%,见表2。tt

  表2:13基因模型在1130例验证集中的判别结果tt

  实施例3.tt

  30个特异性基因的筛选:

  发明人将T检验的筛选标准放宽至P值小于0.01,进一步得到额外的17个基因。这些基因在肺腺癌tt和肺鳞癌中存在差异性表达,差异具有统计学意义。将17个基因与实施例1中的13个基因合并,组成30tt基因集合,见表3。tt

  表3:17基因集合tt

  

  30基因统计分析模型的构建:

  基于30个特异基因在628例肺癌样本中的表达模式,发明人采用支持向量机算法,建立统计分析模tt型用于判别肺癌亚型。对于每一例待测样品,模型计算该样品的基因表达模式与数据库中腺癌和鳞癌样品tt的相似度分数,并根据相似度分数最大原则判别该样品的亚型类别。tt

  实施例4.tt

  验证集测试:

  本实施例中,发明人分析了包含1130例肺癌的高通量测序数据,其中腺癌576例,鳞癌554例。通tt过30基因统计分析模型对每个样品进行亚型的判别,并与临床病理诊断结果相比较,准确率为91.5%。以tt肺腺癌为参照,预测的敏感度为95.1%,特异度为87.7%,见表4。tt

  表4:30基因模型在1130例验证集中的判别结果tt

  实施例5.tt

  本实施例中,收集手术切除后的肺癌组织的石蜡包埋样品,该生物学样品经病理诊断确认为肺癌,且tt已知为肺腺癌。实验人员用手工刮片的方式从福尔马林固定石蜡包埋的组织块上肺癌细胞富集区收集并提tt取总RNA;用DNase处理以确保完全去除基因组DNA的污染;经逆转录后获得cDNA,进行30个基因的实tt时定量PCR。实时定量PCR反应在ABI公司的7500型仪器上应用TaqmanTM技术完成。PCR反应结束后,根tt据该样品30个基因的表达模式,统计分析模型计算该样品与肺癌亚型的相似度分数。tt

  设计30个基因的PCR引物组分别如下:tt

  COMP基因:正向引物如SEQIDNO.1所示,反向引物如SEQIDNO.2所示;tt

  FXYD3基因:正向引物如SEQIDNO.3所示,反向引物如SEQIDNO.4所示;tt

  GABRP基因:正向引物如SEQIDNO.5所示,反向引物如SEQIDNO.6所示;tt

  HLA-DQA1基因:正向引物如SEQIDNO.7所示,反向引物如SEQIDNO.8所示;tt

  MMP10基因:正向引物如SEQIDNO.9所示,反向引物如SEQIDNO.10所示;tt

  NMU基因:正向引物如SEQIDNO.11所示,反向引物如SEQIDNO.12所示;tt

  NTS基因:正向引物如SEQIDNO.13所示,反向引物如SEQIDNO.14所示;tt

  RPS4Y1基因:正向引物如SEQIDNO.15所示,反向引物如SEQIDNO.16所示;tt

  SERPINB4基因:正向引物如SEQIDNO.17所示,反向引物如SEQIDNO.18所示;tt

  SERPINB5基因:正向引物如SEQIDNO.19所示,反向引物如SEQIDNO.20所示;tt

  SPRR2A基因:正向引物如SEQIDNO.21所示,反向引物如SEQIDNO.22所示;tt

  SPRR3基因:正向引物如SEQIDNO.23所示,反向引物如SEQIDNO.24所示;tt

  UPK1B基因:正向引物如SEQIDNO.25所示,反向引物如SEQIDNO.26所示。tt

  CLCA2基因:正向引物如SEQIDNO.27所示,反向引物如SEQIDNO.28所示;tt

  DSG3基因:正向引物如SEQIDNO.29所示,反向引物如SEQIDNO.30所示;tt

  FGB基因:正向引物如SEQIDNO.31所示,反向引物如SEQIDNO.32所示;tt

  HSD17B2基因:正向引物如SEQIDNO.33所示,反向引物如SEQIDNO.34所示;tt

  KRT14基因:正向引物如SEQIDNO.35所示,反向引物如SEQIDNO.36所示;tt

  KRT17基因:正向引物如SEQIDNO.37所示,反向引物如SEQIDNO.38所示;tt

  KRT5基因:正向引物如SEQIDNO.39所示,反向引物如SEQIDNO.40所示;tt

  KRT6A基因:正向引物如SEQIDNO.41所示,反向引物如SEQIDNO.42所示;tt

  KRT6B基因:正向引物如SEQIDNO.43所示,反向引物如SEQIDNO.44所示;tt

  MIR205HG基因:正向引物如SEQIDNO.45所示,反向引物如SEQIDNO.46所示;tt

  MMP12基因:正向引物如SEQIDNO.47所示,反向引物如SEQIDNO.48所示;tt

  S100A2基因:正向引物如SEQIDNO.49所示,反向引物如SEQIDNO.50所示;tt

  SERPINB3基因:正向引物如SEQIDNO.51所示,反向引物如SEQIDNO.52所示;tt

  SPINK1基因:正向引物如SEQIDNO.53所示,反向引物如SEQIDNO.54所示;tt

  SPRR1B基因:正向引物如SEQIDNO.55所示,反向引物如SEQIDNO.56所示;tt

  TFPI2基因:正向引物如SEQIDNO.57所示,反向引物如SEQIDNO.58所示;tt

  TRIM29基因:正向引物如SEQIDNO.59所示,反向引物如SEQIDNO.60所示。tt

  结果如图1所示,腺癌和鳞癌的相似度分数分别为91.7%和8.3%。由于腺癌的相似度分数高于鳞癌,tt因此该样品被判定为肺腺癌,与临床病理诊断结果相符。tt

  实施例6.tt

  本实施例中,发明人对205例肺癌样品进行基因芯片实验,其中腺癌125例,鳞癌80例。基因芯片tt是通过微电子技术和微加工技术将大量特定序列的DNA片段或寡核昔酸片段按矩阵高密度固定于玻璃、硅tt片等载体上,待测样品用荧光分子标记后,与芯片上大DNA或寡核昔酸片段杂交,通过荧光扫描及计算机tt分析后获得大量基因信息的一种检测方法。其突出特点在于能够对微量样品中的核酸序列信息进行快速、tt准确、高通量的检测和分析,可以同时获得成千上万个基因的表达丰度和表达模式关联图谱。tt

  实验人员用手工刮片的方式从福尔马林固定石蜡包埋的组织块上肺癌细胞富集区收集并提取总RNA;tt用DNase处理以确保完全去除基因组DNA的污染;经逆转录后获得cDNA;将cDNA与基因芯片混合、杂交tt反应;通过扫描荧光信号检测基因的表达丰度。基因芯片反应结束后,提取该样品30个基因的表达模式,tt统计分析模型计算该样品与肿瘤亚型的相似度分数。tt

  通过30基因统计分析模型对每个样品进行亚型的判别,并与临床病理诊断结果相比较,准确率为tt95.6%。以肺腺癌为参照,预测的敏感度为94.4%,特异度为97.5%,见表5。tt

  表5:30基因模型在205例验证集中的判别结果tt

  基因芯片中30个基因的探针序列分别如下表6所示:tt

  表6tt

  

  

  以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发tt明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还tt可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要tt求为准。tt

《一组用于肺癌分子分型的基因及其应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)