欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> CFAP20基因在骨质疏松症诊断中的应用独创技术21879字

CFAP20基因在骨质疏松症诊断中的应用

2021-04-23 11:14:24

CFAP20基因在骨质疏松症诊断中的应用

  技术领域

  本发明属于分子诊断领域,涉及一种用于骨质疏松症诊断的分子标志物,具体涉及血液中的分子标志物-CFAP20基因在制备诊断骨质疏松症的产品中的应用。

  背景技术

  骨质疏松症是一种以骨量减少、骨微结构破坏、骨脆性增加、易于骨折为特征的一种常见的代谢性骨病。它是由于破骨细胞增多/过度活化导致的骨吸收过多,或成骨细胞减少/功能缺陷导致的骨形成减少,从而骨丢失过多所致,是危害中老年人最主要的疾病之一。

  骨质疏松症的检测包括实验室检查指标的检测和辅助检测。

  实验室检查指标:

  骨质疏松症患者部分血清学生化指标可以反应骨转换(包括骨形成和骨吸收)状态,在骨的高转换状态(例如Ⅰ型骨质疏松症)下,这些指标可以升高,也可用于监测治疗的早期反应。但其在骨质疏松症中的临床意义仍有待于进一步研究。这些生化测量指标包括:骨特异的碱性磷酸酶(Bone-specific alkaline phosphatase,反应骨形成)、抗酒石酸酸性磷酸酶(tartrated resistant acid phosphatse,反应骨吸收)、骨钙素(Osteocalcin,反应骨形成)、Ⅰ型原胶原肽(Type I procollagenpeptidase,反应骨形成)、尿吡啶啉(Urinary pyridinoline)和脱氧吡啶啉(Urinary deoxypyridinoline,反应骨吸收)、Ⅰ型胶原的N-C-末端交联肽(cross-linked N-and C-telopeptide of type I collagen,反应骨吸收)。正如前面所提到的,使用生化指标检测骨质疏松症的精确度不够。

  辅助检查:包括骨影像学检查和骨密度检测。辅助检查的对象一般都是骨质疏松症的晚期患者,不能用于早期骨质疏松症患者的筛查。

  基于现有技术中检测骨质疏松症的手段的局限性,寻找骨质疏松早期诊断及预后相关的特异性分子标志物对实现骨质疏松的早期诊断及个体化治疗具有深远意义。

  发明内容

  为了弥补现有技术的不足,本发明的目的在于提供一种可用于骨质疏松症(Osterarthritis,OA)早期诊断的分子标志物。本发明通过实验证明,在正常人和骨质疏松症患者的血液中中,CFAP20基因表达存在差异,据此认为CFAP20可以作为诊断骨关节炎的marker。

  为了实现上述目的,本发明采用如下技术方案:

  本发明提供了检测CFAP20基因表达的产品在制备诊断骨质疏松症的工具中的应用。

  进一步,上面所提到的检测CFAP20基因表达的产品包括:通过RT-PCR、实时定量PCR、免疫检测、原位杂交、芯片或高通量测序平台检测CFAP20基因表达以诊断骨质疏松症的产品。

  进一步,所述用RT-PCR诊断骨质疏松症的产品至少包括一对特异扩增CFAP20基因的引物;所述用实时定量PCR诊断骨质疏松症的产品至少包括一对特异扩增CFAP20基因的引物;所述用免疫检测诊断骨质疏松症的产品包括:与CFAP20蛋白特异性结合的抗体;所述用原位杂交诊断骨质疏松症的产品包括:与CFAP20基因的核酸序列杂交的探针;所述用芯片诊断骨质疏松症的产品包括:蛋白芯片和基因芯片;其中,蛋白芯片包括与CFAP20蛋白特异性结合的抗体,基因芯片包括与CFAP20基因的核酸序列杂交的探针。

  在本发明的具体实施方案中,所述用实时定量PCR诊断骨质疏松症的产品至少包括一对特异扩增CFAP20基因的引物的序列如SEQ ID NO.3和SEQ ID NO.4所示。

  优选地,所述诊断工具包括芯片、试剂盒、试纸或高通量测序平台。其中,高通量测序平台是一种特殊的诊断工具,检测CFAP20基因表达的产品可以应用于该平台实现对CFAP20基因的表达情况的检测。随着高通量测序技术的发展,对一个人的基因表达谱的构建将成为十分便捷的工作。通过对比疾病患者和正常人群的基因表达谱,容易分析出哪个基因的异常与疾病相关。因此,在高通量测序中获知CFAP20基因的异常与骨质疏松症相关也属于CFAP20基因的用途,同样在本发明的保护范围之内。

  本发明还提供了一种诊断骨质疏松症的工具,所述诊断工具包括芯片、试剂盒、试纸、或高通量测序平台。

  其中,所述芯片包括基因芯片、蛋白质芯片;所述基因芯片包括固相载体以及固定在固相载体的寡核苷酸探针,所述寡核苷酸探针包括用于检测CFAP20基因转录水平的针对CFAP20基因的寡核苷酸探针;所述蛋白质芯片包括固相载体以及固定在固相载体的CFAP20蛋白的特异性抗体;所述基因芯片可用于检测包括CFAP20基因在内的多个基因(例如,与骨质疏松症相关的多个基因)的表达水平。所述蛋白质芯片可用于检测包括CFAP20蛋白在内的多个蛋白质(例如与骨质疏松症相关的多个蛋白质)的表达水平。通过将多个与骨质疏松症的标志物同时检测,可大大提高骨质疏松症诊断的准确率。

  其中,所述试剂盒包括基因检测试剂盒和蛋白免疫检测试剂盒;所述基因检测试剂盒包括用于检测CFAP20基因转录水平的试剂;所述蛋白免疫检测试剂盒包括CFAP20蛋白的特异性抗体。进一步,所述试剂包括使用RT-PCR、实时定量PCR、免疫检测、原位杂交或芯片方法检测CFAP20基因表达水平过程中所需的试剂。优选度,所述试剂包括针对CFAP20基因的引物和/或探针。根据CFAP20基因的核苷酸序列信息容易设计出可以用于检测CFAP20基因表达水平的引物和探针。

  与CFAP20基因的核酸序列杂交的探针可以是DNA、RNA、DNA-RNA嵌合体、PNA或其它衍生物。所述探针的长度没有限制,只要完成特异性杂交、与目的核苷酸序列特异性结合,任何长度都可以。所述探针的长度可短至25、20、15、13或10个碱基长度。同样,所述探针的长度可长至60、80、100、150、300个碱基对或更长,甚至整个基因。由于不同的探针长度对杂交效率、信号特异性有不同的影响,所述探针的长度通常至少是14个碱基对,最长一般不超过30个碱基对,与目的核苷酸序列互补的长度以15-25个碱基对最佳。所述探针自身互补序列最好少于4个碱基对,以免影响杂交效率。

  所述高通量测序平台包括检测CFAP20基因表达水平的试剂。

  所述试纸包括试纸载体和固定在试纸载体上的寡核苷酸,所述寡核苷酸能够检测CFAP20基因的转录水平。

  进一步,所述CFAP20蛋白的特异性抗体包括单克隆抗体、多克隆抗体。所述CFAP20蛋白的特异性抗体包括完整的抗体分子、抗体的任何片段或修饰(例如,,嵌合抗体、scFv、Fab、F(ab’)2、Fv等。只要所述片段能够保留与CFAP20蛋白的结合能力即可。用于蛋白质水平的抗体的制备时本领域技术人员公知的,并且本发明可以使用任何方法来制备所述抗体。

  在本发明的具体实施方案中,所述针对CFAP20基因的引物序列如下:正向引物序列如SEQ ID NO.3所示,反向引物如SEQ ID NO.4所示。

  用于诊断骨质疏松症的CFAP20基因及其表达产物的来源包括但不限于血液、组织液、尿液、唾液、脊髓液等可以获得基因组DNA的体液。在本发明的具体实施方案中,用于诊断骨质疏松症的CFAP20基因及其表达产物的来源是血液。

  在本发明的上下文中,“CFAP20基因”包括CFAP20基因以及CFAP20基因的任何功能等同物的多核苷酸。CFAP20基因包括与目前国际公共核酸序列数据库GeneBank中CFAP20基因(NC_000016.10)DNA序列具有70%以上同源性,且编码相同功能蛋白质的DNA序列;

  优选地,CFAP20基因的编码序列包括以下任一一种DNA分子:

  (1)序列表中SEQ ID NO.1所示的DNA序列;

  (2)在严格条件下与1)限定的DNA序列杂交且编码相同功能蛋白质的DNA序列;

  (3)与(1)或(2)限定的DNA序列具有70%、优选地,90%以上同源性,且编码相同功能蛋白质的DNA分子。

  在本发明的具体实施方案中,所述CFAP20基因的编码序列是SEQ ID NO.1所示的DNA序列。

  在本发明的上下文中,CFAP20基因表达产物包括CFAP20蛋白以及CFAP20蛋白的部分肽。所述CFAP20蛋白的部分肽含有与骨质疏松症相关的功能域。

  “CFAP20蛋白”包括CFAP20蛋白以及CFAP20蛋白的任何功能等同物。所述功能等同物包括CFAP20蛋白保守性变异蛋白质、或其活性片段,或其活性衍生物,等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与CFAP20的DNA杂交的DNA所编码的蛋白质。

  优选地,CFAP20蛋白是具有下列氨基酸序列的蛋白质:

  (1)由序列表中SEQ ID NO.2所示的氨基酸序列组成的蛋白质;

  (2)将SEQ ID NO.2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与SEQ ID NO.2所示的氨基酸序列具有相同功能的由SEQ ID NO.2所示的氨基酸序列衍生的蛋白质。取代、缺失或者添加的氨基酸的个数通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个。

  (3)与SEQ ID NO.2所示的氨基酸序列具有至少80%同源性(又称为序列同一性),更优选地,与SEQ ID NO.2所示的氨基酸序列至少约90%至95%的同源性,常为96%、97%、98%、99%同源性的氨基酸序列构成的多肽。

  在本发明的具体实施方案中,所述CFAP20蛋白是具有SEQ ID NO.2所示的氨基酸序列的蛋白质。

  通常,已知的是,一个蛋白质中一个或多个氨基酸的修饰不会影响蛋白质的功能。本领域技术人员会认可改变单个氨基酸或小百分比的氨基酸或对氨基酸序列的个别添加、缺失、插入、替换是保守修饰,其中蛋白质的改变产生具有相似功能的蛋白质。提供功能相似的氨基酸的保守替换表是本领域公知的。

  通过添加一个氨基酸或多个氨基酸残基修饰的蛋白质的例子是CFAP20蛋白的融合蛋白。对于与CFAP20蛋白融合的肽或者蛋白质没有限制,只要所得的融合蛋白保留CFAP20蛋白的生物学活性即可。

  本发明的CFAP20蛋白也包括对SEQ ID NO.2所示的氨基酸序列的非保守修饰,只要经过修饰的蛋白质仍然能够保留CFAP20蛋白的生物学活性即可。在此类修饰蛋白质中突变的氨基酸数目通常是10个或者更少,例如6个或者更少,例如3个或者更少。

  本发明还提供了一种诊断骨质疏松症的方法,所述方法包括如下步骤:

  (1)获取受试者的样品;

  (2)检测受试者样品中CFAP20基因或蛋白的表达水平;

  (3)将测得的CFAP20基因或蛋白的表达水平与受试者的患病与否关联起来。

  (4)与正常人相比,CFAP20基因或蛋白的表达水平升高,则该受试者被判断具有患有骨质疏松症的倾向、或者已经患有骨质疏松症。

  在本发明的上下文中,“诊断骨质疏松症”既包括判断受试者是否已经患有骨质疏松症、也包括判断受试者是否存在患有骨质疏松症的风险。

  本发明的优点和有益效果:

  本发明首次发现了CFAP20基因表达与骨质疏松症相关,通过检测受试者中CFAP20的表达,可以判断受试者是否患有骨质疏松症、或者判断受试者是否存在患有骨质疏松症的风险,从而指导临床医师给受试者提供预防方案或者治疗方案。

  本发明发现了一种新的分子标记物-CFAP20基因,相比传统的检测手段,基因诊断更及时、更特异、更灵敏,能够实现骨质疏松症的早期诊断,从而降低骨质疏松症的死亡率。

  附图说明

  图1显示利用高通量测序检测CFAP20基因在骨质疏松症患者和正常人中的表达差异;

  图2显示利用QPCR检测CFAP20基因在骨质疏松症患者和正常人中的表达差异。

  具体的实施方式

  下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:ColdSpring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。

  实施例1筛选骨质疏松症患者和正常人中差异表达的基因

  1、研究对象:

  骨质疏松组:随机抽取医院骨科10例原发性骨质疏松症患者,年龄50-75岁。

  纳入标准:符合《中国人骨质疏松症建议诊断标准》(第二稿)。无明显心、肝、肾、肺功能不全、无引起继发性骨质疏松症的各种内分泌疾病、排除肿瘤、糖尿病等其他严重疾病干扰骨代谢者。

  正常组:选取年龄50-75岁的健康志愿者10例。

  两组之间年龄、性别差异无统计学意义(P>0.10),具有可比性。

  所有研究对象对本研究均知情并签署了知情同意书。

  2、血液中总RNA的提取

  按照常规方法使用TRIzol提取血液白细胞中的总RNA。

  3、RNA浓度和纯度测定

  NanoDrop1000分光光度计检测RNA样品,RNA-seq测序的样品要求:OD260/OD280为1.8-2.2。

  4、RNA样品的质量分析(Agilent Technologies 2100Bioanalyzer)

  Agilent Technologies 2100Bioanalyzer检测RNA样品质量,观察28S rRNA和18S rRNA主带明显、无降解、RNA完整性指数合格、浓度达到要求的符合测序cDNA文库构建的要求,可以用于文库构建及测序。

  5、高通量转录组测序

  (1)RNA-seq读段定位

  首先将低质量的读段去除得到清洁读段,然后利用TopHat v1.3.1将清洁片段与UCSC H.sapiens参考基因组(hg19)进行匹配,H.sapiens UCSC hg19版的预先构建的索引从TopHat主页下载,并作为参考基因组,利用TopHat与基因组匹配时,允许每个读段(默认到20)有多个匹配位点,最多2次错配。TopHat根据外显子区域和GT-AG剪切信号建立可能的剪切位点库,根据这些剪切位点库将没有定位到基因组的读段定位到基因组上。我们使用TopHat方法的系统默认参数。

  (2)转录丰度评估

  匹配上的读段文件通过Cufflinks v1.0.3处理,Cufflinks v1.0.3将RNA-seq片段数目进行标准化计算转录本的相对丰度。FPKM值指的是每一百万测序片段中匹配到特定基因1kb长的外显子区域的片段数目。通过贝叶斯推理方法计算FPKM估计值的置信区间。Cufflinks使用的参考的GTF注释文件从Ensembl数据库下载(Homo_sapiens.GRCh37.63.gtf)。

  (3)差异表达基因的检测

  将下载的Ensembl GTF文件和通过TopHat匹配的原始文件传输到Cuffdiff,Cuffdiff使用原始的匹配文件重新估算GTF文件中列出的转录本的表达丰度,检测差异表达。在Cuffidff输出中只有q值<0.01,测试显示成功的比较才被认为是差异表达。

  6、结果

  RNA-seq结果显示(如图1所示),与正常人相比,骨质疏松症患者血液中CFAP20基因的mRNA水平显著增加,差异具有统计学意义(P<0.05)。

  实施例2 QPCR实验验证骨质疏松症患者和正常人中差异表达的基因

  1、研究对象:

  按照实施例1的方法收集骨质疏松症患者和正常人各50例。

  2、血液中总RNA的提取

  方法同实施例1。

  3、逆转录

  用逆转录缓冲液对lμg总RNA进行逆转录合成cDNA。采用25μl反应体系,每个样品取1μg总RNA作为模板RNA,在PCR管中分别加入以下组分:DEPC水,5×逆转录缓冲液,10mmol/L dNTP,0.1mmol/l DTT,30μmmol/l Oligo dT,200U/μl M-MLV,模板RNA。42℃孵育1h,72℃10min,短暂离心。

  4、QPCR

  (1)引物设计

  根据Genbank中CFAP20基因和GAPDH基因的编码序列设计QPCR扩增引物,由上海生工生物工程技术服务有限公司合成。具体引物序列如下:

  CFAP20基因:

  正向引物为5’-ATACGGCACCAATTACAT-3’(SEQ ID NO.3);

  反向引物为5’-TAGAGTCTGTCTGAGAAGTA-3’(SEQ ID NO.4),

  GAPDH基因:

  正向引物为5’-TTTAACTCTGGTAAAGTGGATAT-3’(SEQ ID NO.5);

  反向引物为5’-GGTGGAATCATATTGGAACA-3’(SEQ ID NO.6)。

  (2)按照表1配制PCR反应体系:

  其中,SYBR Green聚合酶链式反应体系购自Invitrogen公司。

  表1 PCR反应体系

  

  (3)PCR反应条件:95℃10min,(95℃15s,60℃50s)*45个循环。以SYBR Green作为荧光标记物,在Light Cycler荧光定量PCR仪上进行PCR反应,通过融解曲线分析和电泳确定目的条带,ΔΔCT法进行相对定量。

  5、统计学方法

  结果数据都是以平均值±标准差的方式来表示,采用SPSS13.0统计软件来进行统计分析的,两者之间的差异采用t检验,认为当P<0.05时具有统计学意义。

  6、结果

  结果如图2所示,与正常人相比,骨质疏松症患者血液中CFAP20基因的mRNA水平显著增加,差异具有统计学意义(P<0.05),结果同RNA-seq实验。

  实施例3骨质疏松症诊断试剂盒的制备

  根据CFAP20基因与骨质疏松症的相关性,可以通过检测CFAP20基因的表达情况来诊断骨质疏松症,据此本发明提供了一种基于检测CFAP20基因表达来诊断骨质疏松症的试剂盒,该诊断试剂盒中的组分如下:SYBR Green聚合酶链式反应体系;扩增CFAP20基因和GAPDH基因的引物对。扩增CFAP20基因的正向引物序列为5’-ATACGGCACCAATTACAT-3’,反向引物序列为5’-TAGAGTCTGTCTGAGAAGTA-3’;扩增GAPDH的正向引物序列为5’-TTTAACTCTGGTAAAGTGGATAT-3’,反向引物序列为5’-GGTGGAATCATATTGGAACA-3’。SYBR Green聚合酶链式反应体系包含PCR缓冲液、dNTPs、SYBR Green荧光染料。PCR缓冲液成分为:25mM KCl,2.5mMMgCl2、200mM(NH4)2SO4。

  上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。

  SEQUENCE LISTING

  <110> 泰山医学院

  <120> CFAP20基因在骨质疏松症诊断中的应用

  <160> 6

  <170> PatentIn version 3.5

  <210> 1

  <211> 582

  <212> DNA

  <213> 人源

  <400> 1

  atgttcaaaa acacgttcca gagcggcttc ctctccatcc tctacagcat cggcagcaag 60

  cctctgcaaa tctgggacaa aaaggtacgg aatggccaca tcaaaagaat cactgataat 120

  gacatccagt ccctggtgct agagattgaa gggacaaatg taagcaccac atatatcaca 180

  tgccctgcag accccaagaa gacgctggga attaaacttc ctttccttgt catgattatc 240

  aaaaacctga agaagtattt taccttcgaa gtgcaggtac tagatgacaa gaatgtgcgt 300

  cgtcgctttc gggcaagtaa ctaccagagc accacccggg tcaaaccctt catctgcacc 360

  atgcccatgc ggctggatga cggctggaac cagattcagt tcaacttgct agacttcaca 420

  cggcgagcat acggcaccaa ttacatcgag accctcagag tgcagatcca tgcaaattgt 480

  cgcatccgac gggtttactt ctcagacaga ctctactcag aagatgagct gccggcagag 540

  ttcaaactgt atctcccagt tcagaacaag gcaaagcaat aa 582

  <210> 2

  <211> 193

  <212> PRT

  <213> 人源

  <400> 2

  Met Phe Lys Asn Thr Phe Gln Ser Gly Phe Leu Ser Ile Leu Tyr Ser

  1 5 1015

  Ile Gly Ser Lys Pro Leu Gln Ile Trp Asp Lys Lys Val Arg Asn Gly

  202530

  His Ile Lys Arg Ile Thr Asp Asn Asp Ile Gln Ser Leu Val Leu Glu

  354045

  Ile Glu Gly Thr Asn Val Ser Thr Thr Tyr Ile Thr Cys Pro Ala Asp

  505560

  Pro Lys Lys Thr Leu Gly Ile Lys Leu Pro Phe Leu Val Met Ile Ile

  65707580

  Lys Asn Leu Lys Lys Tyr Phe Thr Phe Glu Val Gln Val Leu Asp Asp

  859095

  Lys Asn Val Arg Arg Arg Phe Arg Ala Ser Asn Tyr Gln Ser Thr Thr

  100 105 110

  Arg Val Lys Pro Phe Ile Cys Thr Met Pro Met Arg Leu Asp Asp Gly

  115 120 125

  Trp Asn Gln Ile Gln Phe Asn Leu Leu Asp Phe Thr Arg Arg Ala Tyr

  130 135 140

  Gly Thr Asn Tyr Ile Glu Thr Leu Arg Val Gln Ile His Ala Asn Cys

  145 150 155 160

  Arg Ile Arg Arg Val Tyr Phe Ser Asp Arg Leu Tyr Ser Glu Asp Glu

  165 170 175

  Leu Pro Ala Glu Phe Lys Leu Tyr Leu Pro Val Gln Asn Lys Ala Lys

  180 185 190

  Gln

  <210> 3

  <211> 18

  <212> DNA

  <213> 人工序列

  <400> 3

  atacggcacc aattacat 18

  <210> 4

  <211> 20

  <212> DNA

  <213> 人工序列

  <400> 4

  tagagtctgt ctgagaagta 20

  <210> 5

  <211> 23

  <212> DNA

  <213> 人工序列

  <400> 5

  tttaactctg gtaaagtgga tat 23

  <210> 6

  <211> 20

  <212> DNA

  <213> 人工序列

  <400> 6

  ggtggaatca tattggaaca 20

《CFAP20基因在骨质疏松症诊断中的应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)