欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种用于胃腺癌诊断的生物标志物独创技术37477字

一种用于胃腺癌诊断的生物标志物

2021-03-22 04:27:47

一种用于胃腺癌诊断的生物标志物

  技术领域

  本发明属于生物医药领域,涉及一种用于胃腺癌诊断的生物标志物,具体的所述生物标志物为LINC01234。

  背景技术

  胃癌作为世界上具有较高发病率的一种肿瘤,对人类健康和生存产造成严重的威胁,在全球范围内胃癌的发病率和死亡率都排在恶性肿瘤的前列。胃癌在我国各种恶性肿瘤中居首位,胃癌发病有明显的地域性差别,在我国的西北与东部沿海地区胃癌发病率比南方地区明显为高。好发年龄在50岁以上,男女发病率之比为2:1。胃癌的癌变是一个多因素、多步骤、多阶段发展过程,世界范围内的统计学数据显示胃癌区域化差异也非常明显,这可能与不同地域的环境和饮食文化差异有一定关系。

  胃癌从组织病理学的角度可以分为两大类型:一种是普通类型的胃癌,也就是我们最常见的腺癌,腺癌根据分化程度的不同又有高、中、低等不同的分化类型,也有一些特殊分化类型的腺癌比如印戒细胞癌、粘液腺癌等。另外一种则是一些较为少见类型的胃癌,比如胃的腺鳞癌、胃的鳞状细胞癌、类癌以及未分化癌等。早期的胃癌常常没有明显的临床症状,而部分患者表现出来的反酸、恶心等不适也常常会与胃炎、胃溃疡相混淆,所以对于大多数胃癌患者而言即使肿瘤发展至局部进展期或者晚期,也没有特异性临床症状出现。

  在我国早期胃癌的诊断率非常低,临床常用的诊断技术如胃镜、上消化道造影、CT等由于较高的检查费用以及要承担一定的痛苦和风险很难普及,常规的血清学检查中肿瘤标记物如CEA,CA199,CA724等不论是敏感性特异性都表现的不尽人意,寻找新型肿瘤标志物一直是肿瘤研究领域的重要课题。

  长链非编码RNA(long non-coding RNA,简称lncRNA)是最近备受瞩目的哺乳动物转录组重要成员。随着关于lncRNA的研究日渐深入,人们逐渐发现了lncRNA的多种重要的细胞调控功能,并参与到细胞代谢、发育等多种生命过程中,包括基因印记、染色体重塑、细胞周期调控、剪接调控、mRNA降解和反义调控等。近年来,在肿瘤组织中陆续发现了一些异常表达的lncRNA,其作为肿瘤标志物、肿瘤治疗靶点的潜力更是日渐显现。探索lncRNA在胃癌中的作用为胃癌的诊断和治疗以及机制研究提供了新策略。

  发明内容

  为了弥补现有技术的不足,本发明提供了一种与胃腺癌发生发展相关的生物标志物,通过检测分子标志物的表达水平来判断患者是否患有胃腺癌或者患胃腺癌的风险,从而指导临床医生进行早期干预和治疗,提高患者的生存率和生存质量。

  为了实现上述目的,本发明采用如下技术方案:

  本发明提供了检测lncRNA的试剂在制备诊断胃腺癌的产品中的应用,所述lncRNA为LINC01234。

  进一步,所述lncRNA在胃腺癌患者样本中表达上调。

  进一步,所述产品通过测序技术、核酸杂交技术、核酸扩增技术的方法检测LINC01234基因的表达水平。

  进一步,所述核酸扩增技术选自聚合酶链式反应(PCR)、逆转录聚合酶链式反应(RT-PCR)、转录介导的扩增(TMA)、连接酶链式反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。其中,PCR需要在扩增前将RNA逆转录成DNA(RT-PCR),TMA和NASBA直接扩增RNA。

  进一步,所述LINC01234包括如序列SEQ ID NO.1所示核苷酸序列的多核苷酸或其片段、同系物、变体或衍生物。

  本发明提供了一种体外检测样本中LINC01234表达水平的产品,所述产品包括制剂、芯片或试剂盒。

  进一步,所述产品包括特异性识别LINC01234的探针;或

  特异性扩增LINC01234的引物。

  本发明提供了体外检测样本中LINC01234表达水平的产品在制备诊断早期胃腺癌工具中的应用。

  本发明提供了一种诊断胃腺癌的芯片,所述产品包括固相载体,以及固定在固相载体上的寡核苷酸探针,所述寡核苷酸探针特异性识别LINC01234。

  所述固相载体包括无机载体和有机载体,所述无机载体包括但不限于有硅载体、玻璃载体、陶瓷载体等;所述有机载体包括聚丙烯薄膜、尼龙膜等。

  本发明提供了一种诊断胃腺癌的试剂盒,所述试剂盒包括所述试剂盒包括检测LINC01234的一种或多种试剂;和

  选自下组的一种或多种物质:容器、使用说明书、阳性对照物、阴性对照物、缓冲剂、助剂或溶剂。

  进一步,所述试剂盒包括通过RT-PCR、实时定量PCR、原位杂交、芯片、高通量测序方法检测LINC01234的表达水平用试剂。

  本发明还提供了LINC01234的抑制剂在制备治疗胃腺癌的药物组合物中的应用。

  进一步,所述LINC01234的抑制剂包括:以LINC01234或其转录本为靶序列、且能够抑制LINC01234基因表达或基因转录的干扰分子,包括:shRNA(小发夹RNA)、小干扰RNA(siRNA)、dsRNA、微小RNA、反义核酸,或能表达或形成所述shRNA、小干扰RNA、dsRNA、微小RNA、反义核酸的构建物。

  附图说明

  图1是利用QPCR检测LINC01234在胃腺癌患者中的表达情况图;

  图2是利用TCGA数据库交叉验证LINC01234在胃腺癌患者中的差异表达图;

  图3是LINC01234在胃腺癌组织和癌旁组织中的ROC曲线图。

  具体的实施方式

  本发明经过广泛而深入的研究,通过高通量测序方法,检测胃腺癌标本中lncRNA在肿瘤组织和癌旁组织的表达,发现其中具有明显表达差异的lncRNA片段,探讨其与胃腺癌的发生之间的关系,从而为胃腺癌的早期检测及靶向治疗寻找更好的途径和方法。通过筛选,本发明发现了LINC01234在胃腺癌组织样本中显著性上调,使用生物信息学方法证明,LINC01234作为分子标志物应用于胃腺癌的早期诊断具有较高的准确性。

  生物标志物

  “生物标志物”是其在组织或细胞中的表达水平与正常或健康细胞或组织的表达水平相比发生改变的任何基因。

  “差异表达基因”或“基因差异表达”是指,与正常或对照用靶的表达相比,在患有胃腺癌的患者体内得到更高或更低水平的活化的基因。此外,“差异表达基因”或“差异基因表达”包括相同疾病的不同分期内得到更高或更低水平的活化的基因。这种差异可通过如多肽的mRNA水平、表面显示、分泌或其他分配上的变化而得以证明。从本发明的目的出发,将“差异基因表达”视为从正常的或患有疾病的受试者中,或从患有疾病的受试者的各分期中的取得的基因的表达之间存在1.5倍或以上、约4倍或以上、约6倍或以上、约10倍或以上的差异时存在的现象。

  本领域技术人员将认识到,本发明的实用性并不局限于对本发明的标志物基因的任何特定变体的基因表达进行定量。作为非限制性的实例,标志物基因LINC01234基因可具有SEQ ID NO.1所示的核苷酸序列。在一些实施方案中,其具有与所列的序列至少70%相同或相似的cDNA序列,诸如上述所列的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%相同或相似的cDNA序列。

  LINC01234基因

  LINC01234基因位于12号染色体长臂2区4带上,该基因目前存在5个转录本,一种代表性的人LINC01234基因的核苷酸序列如SEQ ID NO.1所示。本发明中的lncRNA包括如序列SEQ ID NO.1所示核苷酸序列的多核苷酸或其片段、同系物、变体或衍生物。

  本领域技术人员将认识到,本发明的实用性并不局限于对本发明的靶标基因的任何特定变体的基因表达进行定量。如果当核酸或其片段与其它核酸(或其互补链)最佳比对时(具有适当的核苷酸插入或缺失),在至少大约60%的核苷酸碱基、通常至少大约70%、更通常至少大约80%、优选至少大约90%、及更优选至少大约95-98%核苷酸碱基中存在核苷酸序列相同性,则这两个序列是“基本同源的”(或者基本相似的)。

  或者,当核酸或其片段与另一核酸(或其互补链)、一条链或其互补序列在选择性杂交条件下杂交时,则其间存在基本同源或(相同性)。当杂交比特异性整体丧失发生更具选择性时,存在杂交选择性。典型地,当在至少大约14个核苷酸的一段序列存在至少大约55%相同性、优选至少大约65%、更优选至少大约75%及最优选至少大约90%相同性时,发生选择性杂交。如本文所述,同源对比的长度可以是较长的序列节段,在某些实施方案中通常为至少大约20个核苷酸,更通常为至少大约24个核苷酸,典型为至少大约28个核苷酸,更典型为至少大约32个核苷酸,及优选至少大约36或更多个核苷酸。

  因此,本发明的多核苷酸与lncRNA的代表性核苷酸序列优选具有至少75%、更优选至少85%、更优选至少90%同源性。更优选地,存在至少95%、更优选至少98%同源性。

  本发明可以利用本领域内已知的任何方法测定基因表达。本领域技术人员应当理解,测定基因表达的手段不是本发明的重要方面。可以在转录水平上检测生物标志物的表达水平。

  检测方法

  本发明的lncRNA使用本领域普通技术人员已知的多种核酸技术进行检测,这些技术包括但不限于核酸测序、核酸杂交和核酸扩增技术。

  核酸测序技术的示例性非限制性实例包括但不限于链终止子(Sanger)测序和染料终止子测序。本领域的普通技术人员将认识到,由于RNA在细胞中不太稳定并且在实验中更易受到核酸酶攻击,因此在测序前通常将RNA逆转录成DNA。

  本发明可在检测前或与检测同时地对核酸(例如,ncRNA)进行扩增。核酸扩增技术的示例性非限制性实例包括但不限于:聚合酶链式反应(PCR)、逆转录聚合酶链式反应(RT-PCR)、转录介导的扩增(TMA)、连接酶链式反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。本领域的普通技术人员将认识到,某些扩增技术(例如,PCR)需要在扩增前将RNA逆转录成DNA(例如,RT-PCR),而其他扩增技术则直接扩增RNA(例如,TMA和NASBA)。

  通常称为PCR的聚合酶链式反应使用变性、引物对与相反链的退火以及引物延伸的多个循环,以指数方式增加靶核酸序列的拷贝数;TMA的转录介导的扩增(在基本上恒定的温度、离子强度和pH的条件下自身催化地合成靶核酸序列的多个拷贝,其中靶序列的多个RNA拷贝自身催化地生成另外的拷贝;LCR的连接酶链式反应使用与靶核酸的相邻区域杂交的两组互补DNA寡核苷酸;其他扩增方法包括例如:通常称为NASBA的基于核酸序列的扩增;使用RNA复制酶(通常称为Qβ复制酶)扩增探针分子本身的扩增;基于转录的扩增方法;以及自我维持的序列扩增。

  本发明中非扩增或扩增的核酸可通过任何常规的手段检测。

  本发明中的核酸杂交技术包括但不限于原位杂交(ISH)、微阵列和Southern或Northern印迹。原位杂交(ISH)是一种使用标记的互补DNA或RNA链作为探针以定位组织一部分或切片(原位)或者如果组织足够小则为整个组织(全组织包埋ISH)中的特异性DNA或RNA序列的杂交。DNA ISH可用于确定染色体的结构。RNA ISH用于测量和定位组织切片或全组织包埋内的mRNA和其他转录本(例如,ncRNA)。通常对样本细胞和组织进行处理以原位固定靶转录本,并增加探针的进入。探针在高温下与靶序列杂交,然后将多余的探针洗掉。分别使用放射自显影、荧光显微术或免疫组织化学,对组织中用放射、荧光或抗原标记的碱基标记的探针进行定位和定量。ISH也可使用两种或更多种通过放射性或其他非放射性标记物标记的探针,以同时检测两种或更多种转录本。

  将Southern和Northern印迹分别用于检测特异性DNA或RNA序列。使从样本中提取的DNA或RNA断裂,在基质凝胶上通过电泳分离,然后转移到膜滤器上。使滤器结合的DNA或RNA与和所关注的序列互补的标记探针杂交。检测结合到滤器的杂交探针。该程序的一种变化形式是反向Northern印迹,其中固定到膜的底物核酸为分离的DNA片段的集合,而探针是从组织提取并进行了标记的RNA。

  在本发明的某些实施方式中,基因表达产物标志物和可选择剪接标志物可通过微阵列分析确定,例如使用Affymetrix阵列、cDNA微阵列、寡核苷酸微阵列、点样微阵列或来自Biorad、Agilent或Eppendorf的其他微阵列产品。微阵列提供特别的优势,因为它们可包括可在单个试验中分析的大量基因或可选择剪接变异体。在某些情况下,微阵列装置可包括整个人基因组或转录物组或它们的大部分,从而允许全面评价基因表达模式、基因组序列或可选择剪接。

  微阵列分析开始于使用本领域已知的方法从生物样品(如活组织检查或细针吸取物)提取和纯化核酸。对于表达和可选择剪接分析,从DNA提取和/或纯化RNA可能是有利的。从其他形式的RNA如tRNA和rRNA提取和/或纯化mRNA可能是更有利的。

  还可以用荧光、放射性核素或化学标记(如生物素或地高辛)通过例如逆转录、PCR、接合、化学反应或其他技术来标记纯化的核酸。标记可以是直接或间接的,其可能进一步需要偶联阶段。偶联阶段可发生在杂交前,例如使用氨基烯丙基-UTP和NHS氨基反应性染料(如氰蓝染料),或在杂交后,例如使用生物素和标记的抗生蛋白链菌素。修饰的核苷酸以与常规核苷酸相比较低的比率(如以1aaUTP∶4TTP的比例)酶促加入,通常得到每60个碱基1个的结果(用分光光度计测量)。然后可用例如柱或透析过滤装置纯化DNA。氨基烯丙基基团是连接到核苷碱基的长连接体上的氨基,其与反应性标记(如荧光染料)反应。

  杂交探针是不同长度的DNA或RNA的片段,其用于检测DNA或RNA样品中与探针序列互补的核苷酸序列的存在。因此,探针与其碱基序列允许由于探针与靶之间的互补性而使得探针-靶碱基配对的单链核苷酸(DNA或RNA)杂交。

  除非另有指出,术语“探针”通常指能通过互补碱基配对与另一多核苷酸(往往称为“靶多核苷酸”)结合的多核苷酸探针。根据杂交条件的严谨性,探针能和与该探针缺乏完全序列互补性的靶多核苷酸结合。探针可作直接或间接的标记,其范围包括引物。杂交方式,包括,但不限于:溶液相、固相、混合相或原位杂交测定法。

  本发明中的示例性探针包括PCR引物以及基因特异性DNA寡核苷酸探针,例如固定于微阵列基底上的微阵列探针、定量核酸酶保护检验探针、与分子条形码连接的探针、以及固定于珠上的探针。

  所述探针具有与靶点基因的特定的碱基序列互补的碱基序列。这里,所谓“互补”,只要是杂交即可,可以不是完全互补。这些多核苷酸通常相对于该特定的碱基序列具有80%以上、优选90%以上、更优选95%以上、特别优选100%的同源性。这些探针可以是DNA,也可以是RNA,另外,可以为在其一部分或全部中核苷酸通过PNA(Polyamide nucleicacid,肽核酸)、LNA(注册商标,locked nucleic acid,Bridged Nucleic Acid,交联化核酸)、ENA(注册商标,2′-O,4′-C-Ethylene-bridged nucleic acids)、GNA(Glycerolnucleic acid,甘油核酸)、TNA(Threose nucleic acid,苏糖核酸)等人工核酸置换得到的多核苷酸。

  芯片、试剂盒

  本发明所述的芯片包括:固相载体;以及有序固定在所述固相载体上的寡核苷酸探针,所述的寡核苷酸探针特异性地对应于LINC01234所示的部分或全部序列。

  具体地,可根据本发明所述的lncRNA,设计出适合的探针,固定在固相载体上,形成“寡核苷酸阵列”。所述的“寡核苷酸阵列”是指具有可寻址位置(即以区别性的,可访问的地址为特征的位置)的阵列,每个可寻址位置均含有一个与其相连的特征性寡核苷酸。根据需要,可将寡核苷酸阵列分成多个亚阵。

  在本发明中,所述固相载体包括塑料制品、微颗粒、膜载体等。所述塑料制品可通过非共价或物理吸附机制与抗体或蛋白抗原相结合,最常用的塑料制品为聚苯乙烯制成的小试管、小珠和微量反应板;所述微颗粒是由高分子单体聚合成的微球或颗粒,其直径多为微米,由于带有能与蛋白质结合的功能团,易与抗体(抗原)形成化学偶联,结合容量大;所述膜载体包括硝酸纤维素膜、玻璃纤维素膜及尼龙膜等微孔滤膜。

  本发明针对LINC01234基因的寡核苷酸探针可以是DNA、RNA、DNA-RNA嵌合体、PNA或其它衍生物。所述探针的长度没有限制,只要完成特异性杂交、与目的核苷酸序列特异性结合,任何长度都可以。所述探针的长度可短至25、20、15、13或10个碱基长度。同样,所述探针的长度可长至60、80、100、150、300个碱基对或更长,甚至整个基因。由于不同的探针长度对杂交效率、信号特异性有不同的影响,所述探针的长度通常至少是14个碱基对,最长一般不超过30个碱基对,与目的核苷酸序列互补的长度以15-25个碱基对最佳。所述探针自身互补序列最好少于4个碱基对,以免影响杂交效率。

  本发明的试剂盒包括检测有效量的检测LINC01234基因的试剂,选自下组的一种或多种物质:容器、使用说明书、阳性对照物、阴性对照物、缓冲剂、助剂或溶剂。例如用于混悬或固定细胞的溶液,可检测的标签或标记,使核酸易于杂交的溶液,用于裂解细胞的溶液,或用于核酸纯化的溶液。

  本发明的试剂盒中还可附有试剂盒的使用说明书,其中记载了如何采用试剂盒进行检测,和如何利用检测结果对疾病发展进行判断。

  采用本发明的试剂盒,可通过选自下组的各种方法(包括但不限于)检测LINC01234:实时定量反转录PCR、生物芯片检测法、DNA印迹法、或RNA印迹法或原位杂交法、高通量测序法。本领域普通技术人员可根据实际条件和需要对检测方式进行调整和改变。

  本发明的芯片或试剂盒可用于检测包括LINC01234基因在内的多个基因(例如与胃腺癌相关的多个基因)的表达水平。

  生物学分析

  样品与正常的比较

  可将在个体提供的样品(测度样品)上进行的分子表达谱的结果与已知或怀疑为正常的生物样品相比较。正常样品是没有或预期没有任何癌症、疾病或状况的样品或在分子表达谱分析中对于任何癌症疾病或状况测试为阴性的样品。正常样品可来自与被测试个体不同的个体或来自相同个体。正常样品可与测试样品在同一时间或不同时间进行分析。

  可将测试样品的分析结果与在正常样品上进行的相同分析的结果相比较。在某些情况下,在正常样品上的分析结果来自于数据库或基准。在某些情况下,在正常样品上的分析结果是已知的或通常被本领域普通技术人员所接受的值。在某些情况下,比较是定性的。在其他情况下,比较是定量的。在一些情况下,定性或定量比较可包括但不限于以下一种或多种:比较荧光值、点强度、吸光度值、化学发光信号、柱状图、关键阈值、统计学显著性值、基因产物表达水平、基因产物表达水平的改变、可选择外显子使用、可选择外显子使用的改变、蛋白质水平、DNA多态性、拷贝(coy)数变异、一种或多种DNA标志物或区域存在或不存在的指示或核酸序列。

  结果评估

  在某些实施方式中,使用本领域已知的方法评估分子表达谱结果以将基因产物表达水平或可选择外显子使用与特定表型如恶性、恶性类型(如滤泡状癌)、良性或正常性(如不具有疾病或状况)相关联。在某些情况下,可以确定指定的统计学置信度水平以提供诊断置信水平。例如,可以确定,大于90%的置信度水平可以是恶性、恶性类型或良性的可用预测值。在其他实施方式中,可以选择更高或更低严格性的置信度水平。例如,可以选择大约70%、75%、80%、85%、90%、95%、97.5%、99%、99.5%或99.9%的置信度水平作为有用的表型预测值。在某些情况下,所提供的置信度水平可与样品的质量、数据的质量、分析的质量、所使用的特定方法和所分析的基因表达产物的数量相关。用于提供诊断的指定置信度水平可基于预期的假阳性或假阴性的数目和/或费用进行选择。选择用于实现指定的置信度水平或用于识别具有诊断能力的标志物的参数的方法包括但不限于:受试者工作特征曲线分析(Receiver Operator Curve analysis,ROC)、副法线ROC、主成分分析、部分最小平方分析、奇异值分解、最小绝对收缩和选择操作器(least absolute shrinkage andselection operator)分析、最小角回归和阈值梯度导向规则化(threshold gradientdirected regularization)方法。

  数据分析

  在某些情况下,原始基因表达水平和可选择剪接数据可通过应用设计用于归一化和/或提高数据的可信度的算法来改进。在本发明的某些实施方式中,由于处理的单个数据点的巨大数量,数据分析要求计算机或其他装置、机器或设备来应用本文所述的各种不同算法。“机器学习算法”是指用于表征基因表达谱的基于计算机的预测方法,本领域普通技术人员也称其为“分类器”。对应于特定表达水平的信号(其通过例如基于微阵列杂交分析获得)通常经过算法处理以分类表达谱。监管的学习通常包括“训练”分类器以识别类之间的区别,然后“测试”分类器在独立测试集上的准确性。对于新的未知样品,可使用分类器来预测该样品所属的类。

  在某些情况下,稳定多阵列平均(RMA)方法可用于归一化原始数据。RMA方法通过计算许多微阵列上各匹配细胞的背景校正强度开始。背景校正的值限于阳性值。在背景校正后,随后获得各个背景校正的匹配细胞强度的基础-2算法。然后使用分位数归一化方法使各微阵列上背景校正的、对数转化的、匹配的强度归一化,其中对于各输入阵列和各探针表达值,阵列百分位探针值被所有阵列百分位点的平均值取代。分位数归一化后,随后可将归一化的数据拟合到线性模型中,以获得各个微阵列上各个探针的表达测量值。然后可使用Tukey中位数平滑算法来确定归一化的探针组数据的对数标度表达水平。

  还可进一步过滤数据以除去可以被认为可疑的数据。在某些实施方案中,从具有小于约4、5、6、7或8个鸟苷+胞嘧啶核苷酸的微阵列探针获得的数据可被认为是不可靠的,因为它们的异常杂交倾向或二级结构问题。类似地,从具有大于约12、13、14、15、16、17、18、19、20、21或22个鸟苷+胞嘧啶核苷酸的微阵列探针获得的数据可以被认为是不可靠的,因为它们的异常杂交倾向或二级结构问题。

  在某些实施方案中,可以通过针对一系列参照数据集对探针组的可靠性分级选择不可靠的探针组以从数据分析中排除。。例如,RefSeq或Ensembl(EMBL)被认为是非常高质量的参照数据集。在某些情况下,匹配RefSeq或Ensembl序列的探针组的数据由于它们预期的高可靠性可特别地包括在微阵列分析实验中。类似地,来自匹配较低可靠性的参照数据集的探针组的数据可从进一步分析中排除,或在各案基础上考虑包括在内。在某些情况下,Ensembl高通量cDNA(HTC)和/或mRNA参照数据集可单独地或一起用于确定探针组的可靠性。在其他情况下,探针组的可靠性可被分级。可以理解存在于现有技术中的任何可用于评估分子表达谱的给定探针和/或探针组的可靠性的方法以及不同方法之间的组合,都包括在本发明中。

  在本发明的具体实施例中,实验都是按照重复3次来完成的,结果数据都是以平均值±标准差的方式来表示,采用SPSS18.0统计软件来进行统计分析的,基因在实验组与对照组之间的差异采用t检验,认为当P<0.05时具有统计学意义。

  样本

  本发明中,术语“样本”包括细胞、组织、脏器、体液(血液、淋巴液等)、消化液、咳痰、胃胞支气管清洗液、尿、粪便等。优选的,所述样本为组织、血液。在本发明的具体实施例中,所述样本为组织。

  下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。

  实施例1筛选与胃腺癌相关的基因标志物

  1、样品收集

  收集3例进行了根治性切除手术的胃腺癌患者的癌旁组织和癌组织样本,患者在进行胃切除术前未接受任何化疗或放疗,纳入的患者的信息包括性别、年龄、lauren类型、组织学分型、以及肿瘤分期,上述所有标本的取得均通过组织伦理委员会的同意,且患者签订了知情同意书。

  2、RNA样品的制备

  利用QIAGEN的组织RNA提取试剂盒进行组织RNA的提取,按说明书的具体步骤进行操作。

  利用Nanodrop2000对所提取的RNA浓度和纯度进行检测,琼脂糖凝胶电泳检测RNA完整性,Agilent2100测定RIN值。浓度≥200ng/μL,OD260/280介于1.8~2.2之间。

  3、去除rRNA

  使用Ribo-Zero试剂盒除去总RNA中的核糖体RNA。

  4、构建cDNA文库

  利用利用Illumina的Truseq RNA sample Prep Kit进行cDNA文库的构建,具体操作按说明书进行。

  5、高通量测序

  (1)文库富集,PCR扩增15个循环;

  (2)使用2%琼脂糖凝胶回收目的条带;

  (3)TBS380(Picogreen)定量,按数据比例混合上机;

  (4)cBot上进行桥式PCR扩增,生成数据集;

  (5)Hiseq4000测序平台,进行2*150bp测序。

  6、高通量转录组测序数据分析

  1)RNA-seq读段定位

  首先将低质量的读段去除得到清洁读段,然后利用TopHat v1.3.1将清洁片段与UCSC H.sapiens参考基因组(hg19)进行匹配,H.sapiens UCSC hg19版的预先构建的索引从TopHat主页下载,并作为参考基因组,利用TopHat与基因组匹配时,允许每个读段(默认到20)有多个匹配位点,最多2次错配。TopHat根据外显子区域和GT-AG剪切信号建立可能的剪切位点库,根据这些剪切位点库将没有定位到基因组的读段定位到基因组上。我们使用TopHat方法的系统默认参数。

  2)转录丰度评估

  匹配上的读段文件通过Cufflinks v1.0.3处理,Cufflinks v1.0.3将RNA-seq片段数目进行标准化计算转录本的相对丰度。FPKM值指的是每一百万测序片段中匹配到特定基因1kb长的外显子区域的片段数目。通过贝叶斯推理方法计算FPKM估计值的置信区间。Cufflinks使用的参考的GTF注释文件从Ensembl数据库下载(Homo_sapiens.GRCh37.63.gtf)。

  3)差异表达基因的检测

  将下载的Ensembl GTF文件和通过TopHat匹配的原始文件传输到Cuffdiff,Cuffdiff使用原始的匹配文件重新估算GTF文件中列出的转录本的表达丰度,检测差异表达。当FDR<0.05以及|log2FC>1|,测试显示成功的比较才被认为是差异表达。

  7、结果

  RNA-seq结果显示,与癌旁组织相比,共有74个显著差异表达的基因,其中43个lncRNA表达上调,31个表达下调;其中LINC01234在胃腺癌组织中表达显著上调。

  实施例2 QPCR测序验证相关基因的差异表达

  1、对LINC00511基因差异表达进行大样本QPCR验证。按照实施例1中的样本收集方式收集胃腺癌组织和癌旁组织样本各10例。

  2、RNA提取步骤同实施例1。

  3、逆转录:

  (1)逆转录体系的配置

  采用25μl反应体系,每个样品取1μg总RNA作为模板RNA,在PCR管中分别加入以下组分:DEPC水,5×逆转录缓冲液,10mM dNTP,0.1mM DTT,30μM Oligo dT,200U/μl M-MLV,模板RNA。42℃孵育1h,72℃10min,短暂离心。

  (2)QPCR扩增检验

  引物设计

  LINC01234基因的引物序列为:

  正向引物:5’-CGTGAAGAGTAGATGTAGA-3’(SEQ ID NO.2)

  反向引物:5’-TGTATCATAGGTGCTGTAA-3’(SEQ ID NO.3)

  管家基因β-actin的引物序列为:

  正向引物:5’-AGCGAGCATCCCCCAAAGTT-3’(SEQ ID NO.4)

  反向引物:5’-GGGCACGAAGGCTCATCATT-3’(SEQ ID NO.5)

  配制25μl反应体系

  加入SYBR Green聚合酶链式反应体系 12.5μl,正反向引物(5μM)各1μl,模板cDNA2.0μl,无酶水8.5μl。各项操作均于冰上进行,每个样本设置3个平行管,所有扩增反应均重复三次以上以保证结果的可靠性。

  扩增

  设置程序为:95℃60s,(95℃15s,60℃15s,72℃45s)×35个循环。

  以SYBR Green作为荧光标记物,在Light Cycler荧光实时定量PCR仪上进行PCR反应,通过融解曲线分析和电泳确定目的条带,ΔΔCT法进行相对定量。

  4、结果

  结果如图1所示,与癌旁组织相比,LINC01234在胃腺癌组织中表达上调;差异具有统计学意义(P<0.01),同RNA-sep结果一致。

  实施例3分析LINC01234在TCGA数据库中的表达情况

  1、数据收集

  从TCGA数据库中收集285例胃腺癌组织和30例癌旁组织的lncRNA表达谱数据,分析lncRNA LINC01234在胃腺癌组织和癌旁组织中的表达水平;绘制箱形图。

  2、ROC曲线分析

  使用R语言中的pROC包分析lncRNALINC01234的受试者工作特征,计算二项精确置信空间,绘制ROC曲线。

  3、结果

  LINC01234的表达水平如图2所示,相比对照组,LLINC01234(P=6.78e-16)在胃腺癌组织中表达显著上调。

  LINC01234的ROC曲线如图3所示,LINC01234的AUC值高为0.894,且具有较高的特异性和敏感性,说明FLINC01234应用于胃腺癌的诊断具有较高的准确性。

  实施例4一种胃腺癌的诊断试剂盒

  根据LINC01234基因与胃腺癌的相关性,可以通过检测LINC01234基因的表达情况来诊断胃腺癌是否发生,据此本发明提供了一种基于检测LINC01234基因表达来诊断胃腺癌的试剂盒,试剂盒组分如下:SYBR Green聚合酶链式反应体系、扩增LINC01234基因和β-actin基因的引物对、M-MLV逆转录体系、RNA提取试剂。扩增LINC01234基因的正向引物序列为5’-CGTGAAGAGTAGATGTAGA-3’,反向引物序列为5’-TGTATCATAGGTGCTGTAA-3’;扩增β-actin的正向引物序列为5’-AGCGAGCATCCCCCAAAGTT-3’,反向引物序列为5’-GGGCACGAAGGCTCATCATT-3’。SYBR Green聚合酶链式反应体系包含PCR缓冲液、dNTPs、SYBRGreen荧光染料。PCR缓冲液组分为:25mM KCl、2.5mM MgCl2、200mM(NH4)2SO4。M-MLV逆转录体系组分为:T重复寡核苷酸Oligo(dT)、逆转录反应液、M-MLV逆转录酶、RNA酶抑制剂、dNTPs。逆转录反应液组分为:250mM的Tris-HCl(PH8.3)、375mM的KCl、15mM的MgCl2,50mM的DTT。RNA酶抑制剂为大肠杆菌表达的非竞争性抑制RNA酶的重组蛋白酶。RNA提取试剂包含Trizol、氯仿、异丙醇、75%乙醇。

  上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。

  SEQUENCE LISTING

  <110> 北京泱深生物信息技术有限公司

  <120> 一种用于胃腺癌诊断的生物标志物

  <160> 5

  <170> PatentIn version 3.5

  <210> 1

  <211> 2088

  <212> DNA

  <213> 人源

  <400> 1

  acattttcct ggagcggctg ggaaagagga gtctctcgaa attcagcaac tgctaacagc 60

  gaggaggggg tgctagccag gatcactccc tccgaagtca caccagaggg agggctggag 120

  ggagaatcaa atgaaagaga gagggagaga aaggaaggaa gagaaggagg gagaatggaa 180

  ggatgtatgg atttggatgt atgggttcca ttccttctac cctggcaaaa gcttactcat 240

  ccttcagtgt ccatccaaaa tggcatctct tcttgggcac catctccaga gtctcctgca 300

  agcaggtagc tacatcccac aaaacaacca cccatctgac catgcaagtg tgtgggggaa 360

  tgaagaccag cccaggaatc tgagatgaat gttttgcttc ttgctctgcc actgactcac 420

  agggtacccc aagcaagtcc cttcacctcc tcggtctcag tttctccatt tatactacta 480

  aggcagtgga catgatggcc tcaagtctca acatttttat tccctgaaaa gaaactcttg 540

  gtgctgagtg gtcttcttct gccctgacat ctcacctttc aaacgcttgt ctcttctcac 600

  cccacccacc acttagcatg tgctcttgga gaacacccag gactcagggt ctctgcacac 660

  atcatgagtc cagctcagca tttgaggtgg aatcagagga aaggaaggag agtggggaga 720

  atagtcagta ttttggcaag ctcatcatac cttccccctt tgtatagaaa cttcaaacca 780

  tttccctttg aaggcactac ctccttcccc cagttataaa tgagtgaagg tctcaagcct 840

  ggacaaccaa atgcacagtg attggttcaa ctctggacct gtgactcaag ccagaccaag 900

  ggagtgacat gcagggcttt gcctggaact attctgaaag gggcactctc tttctgctgg 960

  gctactgata atatgtgcat ccgtgataga agagcctgcc tgataataaa gccaataagg 1020

  gaagagcaga gccaagagat ggtgggagag cagatgcctg aaaatatcat ttgagcccct 1080

  gggtccagct gcacctgaag ccaccacgat ctcctggact ttgcagttac ttgagttcat 1140

  aaataccctt tggcattaag ccagattgag tcttaatgca tatagaaata agagaaatga 1200

  gaaaagaaat tgaaaagaga gacagcagag aactgattct ctactagagc ctccagaagg 1260

  aatcaactct gccaacacct tgattttgga cttgtggcct tcagaacagt gaaatgataa 1320

  acatctgtta ttttaaggta cctagtgtgt aacattccgt catgacagcc ctaggaaatg 1380

  aatacagcga ggaaaatcct accagcacaa aggcatggag gtgccaggat gtctcctctg 1440

  cgtgaagagt agatgtagat gaggctggaa ttatctatcc tagctgccca gacccatgtg 1500

  cctttgtttt atgtagttac agcacctatg atacatattt gttaccatgt atgtcactat 1560

  gaacctcctc tggaggacgg agaagtcaaa taccttaatt attccaacac aagcttgcgt 1620

  gaacagataa tcatcactac gagtatattg tgtgcctgct aagcaccaca cctgagataa 1680

  gcatttgctg tggtttgaat gtcccctcca aagctcatgc taaaatttaa ttgccattgc 1740

  aacagtgttg caaggtgaga actttaagag atgatcaggt catgagaact ctgccctcgt 1800

  gaatggatta atacccttat cgcagtagtg gacccccctt ttctcttgct gtctgtctct 1860

  catgttagct tgtgcttcct cctttcacca tgggataaca cagcaagaag cccctcacca 1920

  gatgctggca ccttgctatt ggacttccgg cctccagaac tgagaaatac atgtcttttc 1980

  cttataaatt acccagtctg tggtattctg ttatagcggc agaaaatgga ctaagacggc 2040

  attttgcata cattatctgt cttattaaaa ataatgtttt tgcccagg 2088

  <210> 2

  <211> 19

  <212> DNA

  <213> 人工序列

  <400> 2

  cgtgaagagt agatgtaga 19

  <210> 3

  <211> 19

  <212> DNA

  <213> 人工序列

  <400> 3

  tgtatcatag gtgctgtaa 19

  <210> 4

  <211> 20

  <212> DNA

  <213> 人工序列

  <400> 4

  agcgagcatc ccccaaagtt 20

  <210> 5

  <211> 20

  <212> DNA

  <213> 人工序列

  <400> 5

  gggcacgaag gctcatcatt 20

《一种用于胃腺癌诊断的生物标志物.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)