欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 用于提供前列腺癌的临床评估的方法、试剂盒和组合物独创技术153543字

用于提供前列腺癌的临床评估的方法、试剂盒和组合物

2021-03-07 18:53:02

用于提供前列腺癌的临床评估的方法、试剂盒和组合物

  发明领域tt

  本发明涉及前列腺癌。更具体地,本发明涉及用于提供基于来自tt受试者的生物样品的受试者中前列腺癌的临床评估的方法、试剂盒和tt组合物。特别地,本发明涉及用于提供前列腺癌的临床评估、包括至tt少两个前列腺癌标志物的前列腺癌签名。tt

  发明背景tt

  前列腺癌是影响男性的最常见的癌症形式。在美国,每年有超过tt241,000名男性被诊断为患有前列腺癌,每年有近28,000人死于此tt疾病。尽管前列腺癌的终生发病风险估计为16%(该疾病致死风险估tt计为2.9%),尸检显示前列腺癌实际上在大约三分之二的超过80岁的tt男性中存在。这些结果凸显了在前列腺癌诊断领域中的一个重要问tt题,其中许多病例未被检测并且在临床上不明显。因此,能特别地识tt别具有侵袭性局部肿瘤的无症状男性的改进的筛选程序有助于降低tt前列腺癌发病率和死亡率。tt

  前列腺癌存活与多种因素,特别是诊断时的肿瘤范围相关。由于tt目前用于前列腺癌诊断的方法的限制,性质上为进行性的前列腺癌可tt能在检测之前已经转移,而患有转移性前列腺癌的个体的存活率非常tt低。对于患有会转移而尚未转移的前列腺癌患者,手术去除前列腺通tt常是有疗效的。因此,确定肿瘤范围对选择最佳治疗和提高患者生存tt率很重要。tt

  目前,前列腺癌的诊断一般是根据前列腺特异性抗原(PSA)血检tt结果升高,或者较少见地,根据异常直肠指检(DRE)而做出的。PSAtttttt是前列腺上皮细胞生产的糖蛋白,PSA测试测量血样中PSA的量。tt尽管升高的PSA水平不一定指示前列腺癌的存在,但大部分患有前tt列腺癌的男性具有升高的PSA浓度(例如高于4ng/mL),并且不存在tt患有前列腺癌的风险为0的PSA水平。事实上,PSA升高的最常见tt原因是良性前列腺增生(BPH),前列腺的非癌性增大。tt

  有多个独立于前列腺癌,能暂时升高或降低PSA水平的因素,tt其中一些足够显著以至于影响PSA血检的诊断性能。例如,细菌性tt前列腺炎可升高PSA水平,直至6至8周后感染症状消退。射精可tt提高PSA水平(例如高达0.8ng/mL),直至其在48小时内回到正常。tt通常通过前列腺活检诊断的无症状前列腺炎也可升高PSA水平。此tt外,PSA水平趋向于随年龄增加,已建议可通过为老年男性设置较高tt的正常PSA水平改进PSA血检。另一方面,已经显示药物例如5-αtt还原酶抑制剂(例如非那雄胺、度他雄胺)降低PSA水平。tt

  由于以上,只有约30%的具有升高的PSA的男性实际患有前列tt腺癌。上述新诊断的癌症大部分是临床上局部的,这导致根治性前列tt腺切除术和放疗的增加,它们是意欲治愈此类早期癌症的激进治疗。tt尽管多中心研究证明了早期前列腺癌诊断/筛查的效用,其中基于ttPSA的筛查显著降低了前列腺癌特异性死亡率(Schroder等人,ttProstate-cancer mortality at 11 years of follow-up,N Engl J Med 2012;tt366:981-90),这种降低并非没有后果,因为PSA非常高的假阳性率tt导致高达75%的不必要的前列腺活检的数量。这些不必要的活检造成tt发病,特别是介入后的感染,造成在活检后的一个月内高达4%的再tt住院率(Nam等人,Increasing hospital admission rates for urological ttcomplications after transrectal ultrasound guided prostate biopsy,J Urol tt2010;183:963-8)。这一情况造成了另一个困境:具有升高水平的ttPSA但具有阴性前列腺活检结果的患者群体每年增加。由于前列腺活tt检在检测前列腺癌方面不是100%准确—第一次活检可能漏掉多达tt25%的前列腺癌—这一情况对患者造成了大量焦虑,直到最近,除了tt进行跟踪活检,对这一困境没有临床解决方案。tt

  在2012年5月22日,美国预防服务工作组(U.S.Preventive ttServices Task Force)签发了反对PSA筛查前列腺癌的最终建议,进一tt步暴露了PSA血检的不足。根据其研究工作的回顾,美国预防服务tt工作组作出结论,PSA筛查的预期伤害高于可能的益处。该建议基于tt以下事实。一方面,PSA筛查带来的前列腺癌死亡的降低非常小,因tt为最多只有1/1000的男性由于筛查避免了前列腺癌造成的死亡。另tt一方面,大部分由PSA筛查发现的前列腺癌是增殖缓慢、无致命危tt险的,在患者一生中不会造成任何伤害,并且目前无法确定何种癌症tt可能威胁人的健康,何种不能。结果,几乎所有患有PSA检测的前tt列腺癌的男性选择接受治疗,这在一些情况下可能是不必要或不建议tt的。tt

  确定前列腺癌的精确诊断和预后在选择最适合的治疗中是关键tt的。所有可能的治疗疗法都具有固有的严重并发症的风险,只有该治tt疗具有合理的实现显著改善的临床结果,包括例如长期存活和生活质tt量改善的可能性,此类风险才必要。多种形式的疗法可用于治疗前列tt腺癌,包括但不限于:手术例如前列腺切除;肿瘤破坏疗法例如冷冻tt疗法;放疗例如近距放疗;和药物和其他剂疗法例如激素疗法和化疗。tt与现有诊断和预后方法相比,具有改善的准确性或以其他方式增强的tt临床评估将为前列腺癌患者提供更好的疗法选择,并产生改善的临床tt结果。tt

  前列腺癌抗原3(PCA3)是一个非编码RNA,其剪接的同种型对tt于前列腺组织具有特异性,并且在前列腺癌中高度过表达,但在增生tt性(BPH)或正常前列腺组织中不过表达。尽管PCA3被广泛认为是优tt于PSA的前列腺癌标志物,但它目前仅被US FDA(美国食品药品监tt督管理局)批准作为帮助医生确定在具有先前阴性活检的男性中重复tt活检需求的工具(US FDA为PCA3测定签发的安全性tt和有效性数据概要(SSED);http://www.accessdata.fda.gov/cdrh_docs/p ttdf10/P100033b.pdf)。因此,需要比PCA3改进的前列腺癌标志物。tt

  多年以来,以鉴别可超越PCA3用于前列腺癌诊断的性能为目tt标,评估了许多单分子标志物。这些标志物中的一些通过超甲基化检tt测检测基因表达丧失(例如GSTP1)、通过表达基因融合物检测遗传转tt位(例如TMPRSS2和ETS转录因子例如ERG、ETV1或ETV4)或检tt测其他前列腺癌中过表达的基因(例如GOLPH2或SPINK1)。遗憾的tt是,上述通过组织分析鉴别的标志物大部分未随后验证为有效或准确tt的前列腺癌标志物。事实上,上述标志物通常被证明不能用作无创生tt物样品的靶标。例如,Laxman等人(Cancer Res.,2008,68:645-649)tt证明先前被证明是组织中前列腺癌的特异性生物标志物的AMACRtt和TFF3 mRNA在尿样中不是统计上显著的前列腺癌预测物(P分别为tt0.450和0.189)。无论如何,上述分子标志物均未被验证它们在一定tt程度上表现优于PCA3,PCA3是至今唯一可在基于尿的测试中可靠tt地测量的前列腺癌标志物。因此,除了PCA3测定,没有用于用无创tt临床样品例如尿提供前列腺癌临床评估的可靠的方法。此外,先前的tt大部分试图鉴别前列腺癌标志物的研究首先集中在组织样品中的基tt本表达谱分析,而不是尿中的基本表达谱分析。另一个问题是可用于tt标准化和/或验证前列腺癌标志物检测的有效对照标志物的缺乏。tt

  因此,仍然存在对可提供优秀的男性前列腺癌临床评估,包括但tt不限于改进的诊断、预后和/或肿瘤分级/分期的改进的前列腺标志物tt的迫切需求。也仍需要鉴别一个或多个与用于患者样品中前列腺癌临tt床评估的新前列腺癌标志物联合使用的对照标志物。本发明试图解决tt现有技术中前列腺癌标志物的至少一些缺陷。tt

  本说明书提及多个文件,其内容在此通过引用整体并入本文。tt

  发明概述tt

  本发明涉及前列腺癌签名,包括至少两个其在尿中表达模式已在tt本文证实与前列腺癌的临床评估相关(正相关或负相关)的前列腺癌标tt志物的组合。传统上,前列腺癌标志物是通过对癌性和非癌性前列腺tttttt组织样品进行差异表达分析鉴别的。然而,几乎没有用这种方式鉴别tt的前列腺癌标志物被成功转化为基于尿的前列腺癌测试,可能归因于tt与尿的使用相关的多个混合因素(例如酸性环境和/或污染背景尿路细tt胞)。通过对来自前列腺癌和非前列腺癌受试者的尿样进行初始基因tt表达研究,并使用PCA3/PSA前列腺癌测试作为性能基准,本发明人tt出乎意料地发现了多个在基于尿的前列腺癌测试和基于组织的测试tt中极具信息性的前列腺癌签名。更具体地,本发明的前列腺癌标志物tt可与生物信息学方法(例如机器学习)结合使用,以产生与前列腺癌的tt临床评估相关的评分。tt

  因此,本发明大体涉及用于提供基于来自受试者的生物样品的受tt试者中前列腺癌的临床评估的方法、试剂盒和组合物。更具体地,前tt列腺癌的临床评估可包括基于来自受试者的生物样品的诊断、分级、tt分期和预后。tt

  在本发明的一方面,从受试者获得生物样品(例如尿、组织或血tt样),并确定至少两个本发明的前列腺癌签名中的标志物的标准化表tt达水平。然后对该至少两个前列腺癌标志物的标准化表达水平进行数tt学关联以获得一个评分,该评分用于提供受试者中前列腺癌的临床评tt估。tt

  在一个实施方案中,本发明的前列腺癌签名可在提供前列腺癌的tt临床评估方面优于PCA3(或PCA3/PSA比例)。这在前列腺癌领域显tt示了显著的进步,因为PCA3到目前为止被广泛认为是最佳前列腺癌tt标志物。因此,能优于PCA3的前列腺癌签名(特别是在无创样品例tt如尿的背景下)是高度需要的。在一些情况下,使用不依赖PCA3本tt身的前列腺癌诊断工具可能是有用的。例如,如果对受试者用基于ttPCA3的测试进行前列腺癌临床评估,可需要有不依赖PCA3的单独、tt独立的前列腺癌临床评估。这样,本发明的前列腺癌签名可用于独立tt地验证基于PCA3的测试结果,反之亦然。因此,在一个具体实施方tt案中,本发明的前列腺癌签名不包括PCA3。tt

  另一方面,本发明涉及提供受试者中前列腺癌临床评估的方法,tt所述方法包括:tt

  (a)确定来自所述受试者的生物样品中至少两个表5或6A中列tt出的前列腺癌标志物或与其在前列腺癌中共调控的标志物的表达;tt

  (b)用一个或多个对照标志物标准化所述至少两个前列腺癌标志tt物的表达;tt

  (c)对所述至少两个前列腺癌标志物的经标准化的表达水平进行tt数学关联;tt

  (d)从所述数学关联获得评分;和tt

  (e)根据所述获得的评分提供所述前列腺癌的临床评估。tt

  另一方面,本发明涉及提供受试者中前列腺癌临床评估的方法,tt所述方法包括:tt

  (a)选择根据其在已知患有或不患前列腺癌的患者群体的尿中表tt达谱验证的至少两个前列腺癌标志物;tt

  (b)确定所述至少两个前列腺癌标志物在来自所述受试者的生物tt样品中的表达;tt

  (c)用一个或多个对照标志物标准化所述至少两个前列腺癌标志tt物的表达;tt

  (d)对所述至少两个前列腺癌标志物的经标准化的表达进行数学tt关联;tt

  (e)从所述数学关联获得评分;和tt

  (f)根据所述获得的评分提供所述前列腺癌的临床评估。tt

  另一方面,本发明涉及一种前列腺癌诊断组合物,包括:tt

  (a)来自患有或怀疑患有前列腺癌的受试者的尿或其具有前列腺tt源标志物的级分;和tt

  (b)允许检测和/或扩增至少两个表5或6A中列出的前列腺癌标tt志物或与其共调控的标志物的试剂。tt

  另一方面,本发明涉及用于从来自受试者的生物样品提供受试者tt中前列腺癌临床评估的试剂盒,所述试剂盒包括:tt

  (a)允许检测和/或扩增至少两个表5或6A中列出的前列腺癌标tt志物或与其共调控的标志物的试剂;和tt

  (b)适当的容器。tt

  在具体实施方案中,上述至少两个前列腺癌标志物是至少三个前tt列腺癌标志物;至少四个前列腺癌标志物;至少五个前列腺癌标志物;tt至少六个前列腺癌标志物;至少七个前列腺癌标志物;至少八个前列tt腺癌标志物或至少九个前列腺癌标志物。tt

  在另一个实施方案中,上述至少两个前列腺癌标志物选自:tt

  (1)CACNA1D或与其在前列腺癌中共调控的标志物;tt

  (2)ERG或与其在前列腺癌中共调控的标志物;tt

  (3)HOXC4或与其在前列腺癌中共调控的标志物;tt

  (4)ERG-SNAI2前列腺癌标志物对;tt

  (5)ERG-RPL22L1前列腺癌标志物对;tt

  (6)KRT 15或与其在前列腺癌中共调控的标志物;tt

  (7)LAMB3或与其在前列腺癌中共调控的标志物;tt

  (8)HOXC6或与其在前列腺癌中共调控的标志物;tt

  (9)TAGLN或与其在前列腺癌中共调控的标志物;tt

  (10)TDRD1或与其在前列腺癌中共调控的标志物;tt

  (11)SDK1或与其在前列腺癌中共调控的标志物;tt

  (12)EFNA5或与其在前列腺癌中共调控的标志物;tt

  (13)SRD5A2或与其在前列腺癌中共调控的标志物;tt

  (14)maxERG CACNA1D前列腺癌标志物对;tt

  (15)TRIM29或与其在前列腺癌中共调控的标志物;tt

  (16)OR51E1或与其在前列腺癌中共调控的标志物;和tt

  (17)HOXC6或与其在前列腺癌中共调控的标志物。tt

  在另一个实施方案中,上述至少两个前列腺癌标志物包括ttCACNA1D或与其在前列腺癌中共调控的前列腺癌标志物。在另一个tt实施方案中,上述至少两个前列腺癌标志物包括CACNA1D或与其tt在前列腺癌中共调控的前列腺癌标志物,以及ERG或与其在前列腺tt癌中共调控的前列腺癌标志物。在另一个实施方案中,上述至少两个tt前列腺癌标志物按表7-9定义的分类器组合。tt

  在另一个实施方案中,上述与其在前列腺癌中共调控的标志物中tt的一个或多个如表6B中所定义。tt

  在另一个实施方案中,上述一个或多个对照标志物包括内源参比tt基因。在另一个实施方案中,上述一个或多个对照标志物还包括至少tt一个前列腺特异性对照标志物。在另一个实施方案中,上述一个或多tttttt个对照标志物如表2、表7A和/或表7B中所定义。在另一个实施方tt案中,上述前列腺特异性对照标志物包括KLK3、FOLH1、FOLH1B、ttPCGEM1、PMEPA1、OR51E1、OR51E2和PSCA中的一个或多个。tt在另一个实施方案中,上述对照标志物包括KLK3、IPO8和POLR2A。tt在另一个实施方案中,上述一个或多个对照标志物包括IPO8、ttPOLR2A、GUSB、TBP和KLK3。在另一个实施方案中,上述对照tt标志物包括至少一个上述前列腺特异性对照标志物和IPO8和ttPOLR2A。在另一个实施方案中,上述对照标志物包括至少一个上述tt前列腺特异性对照标志物以及IPO8、POLR2A、GUSB和TBP。tt

  在另一个实施方案中,上述前列腺癌临床评估包括:(i)前列腺癌tt的诊断;(ii)前列腺癌的预后;(iii)前列腺癌的分期评估(iv)前列腺癌侵tt袭性分类;(v)治疗有效性评估;(vi)前列腺活检必要性评估;或(vii)(i)tt至(vi)的任意组合。tt

  在另一个实施方案中,上述标志物是基因。在另一个实施方案中,tt上述标志物是蛋白。tt

  在另一个实施方案中,上述确定所述至少两个前列腺癌标志物的tt表达包括确定RNA表达和/或蛋白表达。在另一个实施方案中,上述tt确定RNA表达包括进行杂交和/或扩增反应。在另一个实施方案中,tt上述杂交和/或扩增反应包括:(a)聚合酶链式反应(PCR);(b)基于核酸tt序列的扩增测定(NASBA);(c)转录介导的扩增(TMA);(d)连接酶链tt式反应(LCR);或(e)链取代扩增(SDA)。tt

  在另一个实施方案中,上述确定RNA表达包括至少两个前列腺tt癌标志物的直接测序。tt

  在另一个实施方案中,上述生物样品是尿、前列腺组织切除物、tt前列腺组织活检样品、精液或膀胱洗液。在另一个实施方案中,上述tt生物样品是全尿或粗尿。在另一个实施方案中,上述生物样品是尿级tt分例如尿上清液或尿细胞沉淀(例如尿沉淀物)。在另一个实施方案中,tttttt上述尿在有或没有在先的直肠指检下而获得。tt

  在另一个实施方案中,上述进行的数学关联可以是线性和二次判tt别式分析(LDA和QDA)、支持向量机(SVM)、朴素贝叶斯(Bayes)tt或随机森林(Random Forest)的任何一个。在一个具体实施方案中,用tt于产生将至少两个前列腺癌标志物表达水平与前列腺癌临床评估相tt关的评分的统计方法是朴素贝叶斯。tt

  在阅读下文的仅参考附图作为实施例给出的其示例性实施方案tt的非限制性描述之后,本发明的其他目标、优点和特征将更明显。tt

  附图简述tt

  在附图中:tt

  图1显示对照标志物在患有或不患前列腺癌的受试者之间的平tt均表达稳定性值。tt

  图2A显示用于在患有或不患前列腺癌的受试者之间标准化的对tt照标志物的最佳数量的确定。tt

  图2B显示选择的对照标志物在来自正常个体(n=152)和前列腺癌tt受试者(n=109)的261份全尿样品中mRNA表达水平值(Ct)的分布。tt

  图2C显示与男性泌尿生殖道中其他肿瘤和非肿瘤组织相比,前tt列腺组织样品(正常和肿瘤)中PCA3和五(5)个前列腺特异性标志物标tt准化的基因表达水平。tt

  图3显示根据AUC作为标准化技术函数排序来自表1的候选基tt因(Exo:使用外源对照的表达水平(Ct);平均Endo:使用来自表2的tt5个对照标志物(HPRT1、IPO8、POLR2A、TBP和GUSB)的平均Ct;ttPSA:使用PSA(KLK3)的Ct;Exo+PSA:使用PSA的Ct和外源对照tt的Ct)。tt

  图4(A-F)代表了使用表7A中列出的每个分类器的前列腺癌标志tt物和对照标志物的表达水平(Ct)对安排进行前列腺活检的来自受试者tt的261个全尿样品的ROC曲线分析。tt

  图5显示分类器1的前列腺癌标志物改变的基因表达、其在前列tt腺癌中的相互作用网络和对无疾病存活的效果。A)150个原发性和转tt移性前列腺癌病例中改变的RNA表达总数的OncoPrintTM。B)分类1tt的前列腺癌标志物(用粗边缘表示)与被报道属于共同途径的基因的邻tt近网络的图表视图。C)具有改变与未改变的基因表达值的前列腺癌患tt者的存活分析(Z值≥1.25)。对数秩p值<0.05视作统计学上显著的。tt

  图6显示分类器3的前列腺癌标志物改变的基因表达、其在前列tt腺癌中的相互作用网络和对无疾病存活的效果。A)150个原发性和转tt移性前列腺癌病例中改变的RNA表达总数的OncoPrintTM。B)分类器tt3的前列腺癌标志物(用粗边缘表示)与被报道属于共同途径的基因的tt邻近网络的图表视图。C)具有改变与未改变的基因表达值的前列腺癌tt患者的存活分析(Z值≥3.5)。对数秩p值<0.05视作统计学上显著的。tt

  图7显示分类器4的前列腺癌标志物改变的基因表达、其在前列tt腺癌中的相互作用网络和对无疾病存活的效果。A)150个原发性和转tt移性前列腺癌病例中改变的RNA表达总数的OncoPrintTM。B)分类器tt4的前列腺癌标志物(用粗边缘表示)与被报道属于共同途径的基因的tt邻近网络的图表视图。C)具有改变与未改变的基因表达值的前列腺癌tt患者的存活分析(Z值≥3.5)。对数秩p值<0.05视作统计学上显著的。tt

  图8显示分类器5的前列腺癌标志物改变的基因表达、其在前列tt腺癌中的相互作用网络和对无疾病存活的效果。A)150个原发性和转tt移性前列腺癌病例中改变的RNA表达总数的OncoPrintTM。B)分类器tt5的前列腺癌标志物(用粗边缘表示)与被报道属于共同途径的基因的tt邻近网络的图表视图。C)具有改变与未改变的基因表达值的前列腺癌tt患者的存活分析(Z值≥3.5)。对数秩p值<0.05视作统计学上显著的。tt

  图9显示分类器6的前列腺癌标志物改变的基因表达、其在前列tt腺癌中的相互作用网络和对无疾病存活的效果。A)150个原发性和转tt移性前列腺癌病例中改变的RNA表达总数的OncoPrintTM。B)分类器tt6的前列腺癌标志物(用粗边缘表示)与被报道属于共同途径的基因的tt邻近网络的图表视图。C)具有改变与未改变的基因表达值的前列腺癌tt患者的存活分析(Z值≥3.75)。对数秩p值<0.05视作统计学上显著的。tt

  图10显示A)训练组(n=174;101N/73T)、B验证组(n=87;tt51N/36T)、C)总队列(n=261;152N/109T)和D)具有高Gleason评分(≥7)tt的癌症患者亚组(n=204;152N/52T)的用5个对照标志物标准化的分tt类器3以及PCA3/PSA比例的ROC曲线比较。tt

  图11显示A)总队列(n=261;152N/109T)和B)第一次前列腺活检tt前的患者组(n=220;122N/98T)的用5个对照标志物标准化的分类器3tt的每五分位分层性能分析。在总队列中(图11A),当考虑多基因评分tt低于0.4的所有患者(组1和组2)时,只有17.3%的具有阳性活检男性tt未被分类器3检测到,其转化为对于评分高于0.4的男性组,阴性预tt测值(NPV)为82.7%,阳性活检风险高6.59倍(p<0.0001)。在第一次tt前列腺活检前的患者组中(图11B),当考虑多基因评分低于0.4的所tt有患者(组1和组2)时,只有22.4%的具有阳性活检男性未被分类器3tt检测到,其被转化为对于评分高于0.4的男性组,阴性预测值(NPV)tt为77.6%,阳性活检风险高6.56倍(p<0.0001)。tt

  图12显示A)总队列(n=261;152N/109T)和B)具有高Gleason评tt分(≥7)的癌症患者亚组(n=204;152N/52T)的PCA3/PSA比例、分类器tt3和分类器3加PCA3的ROC曲线比较。在总队列(图12A)和具有高ttGleason评分(≥7)的亚组(图12B)中,单独分类器与包括PCA3标志物tt的分类器的面积之间的差异不是统计学上显著的(p分别为0.3040和tt0.4224)。tt

  图13显示总队列(n=261;152N/109T)的分类器3与PCA3结合tttttt的每五分位分层性能分析。对于分类器3,有或没有PCA3标志物,tt我们观察到了等同的灵敏性、特异性和阴性预测值(NPV)。唯一的差tt别是在评分>0.8的男性组中较高的具有阳性活检的男性比例。tt

  示例性实施方案的描述tt

  定义

  在本说明书中,广泛使用了多个术语。为提供对说明书和权利要tt求书(包括此类术语将被赋予的范围)的清楚和一致的理解,提供了以tt下定义。tt

  在权利要求书和/或说明书中与术语“包括”结合使用的词汇“一tt(a)”或“一(an)”可表示“一个”但也与“一个或多个”、“至少一个”和“一tt个或多于一个”相一致。tt

  如本说明书和权利要求书所用,词汇“包括”(以及包括的任何形tt式,例如“包括”和“包括”)、“具有”(以及具有的任何形式,例如“具有”tt和“具有”)、“包含”(以及包含的任何形式,例如“包含”和“包含”)或“含tt有”(以及含有的任何形式,例如“含有”和“含有”)是包括性的或开放型tt的,并且不排除额外的未提及的要素或方法步骤。tt

  在本申请中,术语“约”用于表示数值包括用于确定该数值的设备tt或方法的误差的标准偏差。通常,术语“约”意欲指定高达10%的可能tt的差异。因此,术语“约”包括一个值的1%、2%、3%、4%、5%、6%、tt7%、8%、9%和10%的差异。tt

  如通常理解和本文中所用的“分离的核酸”指核苷酸的聚合物,包tt括但不限于DNA和RNA。“分离的”核酸分子从其天然体内状态纯化、tt通过克隆获得或化学合成。核酸序列在本文中以单链按5'至3'的方向tt从左到右使用本领域常用并符合IUPAC IUB生物化学命名委员会推tt荐的单字母核苷酸符号表示。tt

  如本文所用,“基因”意欲广泛地包括任何转录为RNA分子的核tt酸序列,无论该RNA是编码的(例如mRNA)还是非编码的(例如ttncRNA)。本文涉及多个基因/蛋白名称和/或登录号。根据该基因/蛋tt白名称和/或登录号,本领域任何普通技术人员可容易地从多个公众tt可用的基因数据库获得相应的序列信息。此外,尽管某些基因/蛋白tt名称用于指本发明的具体标志物,本领域技术人员将理解,也可使用tt与同样的标志物(即,基因和蛋白)相关的其他名称/命名。tt

  如本文所用,术语“标志物”(单独使用或与其他定性术语组合例tt如前列腺癌标志物、前列腺特异性标志物、对照标志物、外源标志物、tt内源标志物等)指可测量、可计算或可以其他方式获得的,与任何分tt子或分子组合相关,可用作生物和/或化学状态的指示物的参数。在tt一个实施方案中,“标志物”指与一个或多个生物分子相关的参数(即tt“生物标志物”)例如天然或人工合成产生的核酸(即个体基因,以及编tt码和非编码DNA和RNA)和蛋白(例如肽、多肽)。在另一个实施方案tt中,“标志物”指可通过考虑来自两个或多个不同标志物(例如其在前tt列腺癌的背景中被共调控,被共同视作如本文定义的“标志物对”)的tt表达数据计算或以其他方式获得的单个参数。如下讨论的,根据探索tt的指标的类型,标志物可进一步分类为具体的组。本领域技术人员将tt理解,这些组可以是但不一定是相互排斥的。例如,前列腺癌标志物tt也可以是前列腺特异性标志物,其中区分癌症的方面是该标志物的表tt达水平。tt

  如本文所用,“靶标”指根据本发明的方法,被靶标用于检测、扩tt增和/或杂交的标志物的具体子区域(例如在RNA标志物的情况下外tt显子-外显子连接处,或者在蛋白标志物的情况下具体表位)。tt

  “前列腺癌标志物”指根据本发明的方法,可用作(单独或与其他tt标志物组合)受试者中前列腺癌指示物的特定类型的标志物。在一个tt具体实施方案中,前列腺癌标志物包括可用于提供(单独或与其他标tt志物组合)受试者中前列腺癌临床评估的标志物。在某些实施方案中,tttttt本发明的前列腺癌标志物包括表5或表6A中列出的标志物及根据本tt发明与其共调控的标志物(如表6B中所示)。尽管在本申请的某些章tt节说明了具体的登录号,但是涵盖与同样的靶标相关的其他登录号。tt

  “前列腺特异性标志物”指可用作(单独或与其他标志物组合)样品tt中前列腺细胞(癌性或非癌性)或来自其的标志物存在或不存在的指示tt物的具体类型的标志物。此类标志物可帮助区分前列腺细胞和非前列tt腺细胞,或帮助评估样品中存在的前列腺细胞的量。在一些实施方案tt中,该前列腺特异性标志物可以是正常存在于前列腺细胞中,正常不tt存在于可能“污染”待分析的具体样品的其他组织中的分子。事实上,tt只在一个器官或组织中表达的标志物非常少见。因此,只要此标志物tt的非前列腺表达发生在通常不存在于待分析的具体样品(例如尿)中的tt细胞或组织/器官中,该前列腺特异性标志物也在非前列腺组织中表tt达不应破坏该标志物的特异性。例如,如果尿是待分析样品,该前列tt腺特异性标志物不应正常表达于预期存在于尿样中的其他类型的细tt胞(例如来自尿道系统的细胞)中。类似地,如果使用另一类型的样品tt(例如精子),该前列腺特异性标志物不应正常表达于预期存在于尿样tt中的其他类型的细胞中。在一个实施方案中,前列腺特异性标志物可tt用作对照标志物(即前列腺特异性对照标志物),例如用于确保样品含tt有足够量的前列腺细胞(例如,为了验证阴性结果)。tt

  “内源标志物”指源自与待分析样品相同的受试者的标志物(例如tt核酸或多肽)。更具体地,“内源对照标志物”指可用作对照标志物(单tt独或与其他对照标志物组合),与待分析样品源自相同受试者的标志tt物。在一个实施方案中,内源对照标志物可包括一个或多个内源基因tt(即“对照基因”或“参比基因”),其表达相对稳定,例如在前列腺癌与tt非前列腺癌样品中,和/或在受试者之间。tt

  “外源标志物”指源自与待分析样品不同的受试者的标志物(例如tt核酸或多肽)。更具体地,“外源对照标志物”指可用作对照标志物(单tt独或与其他对照标志物组合),未源自与待分析样品相同的受试者的tttttt标志物。例如,外源性对照标志物可用于对照方法本身的步骤(例如tt样品中存在的细胞量/起始材料、细胞提取、捕获、杂交/扩增/检测反tt应、其组合或可被监测以阳性地验证信号的缺失不是一个或多个步骤tt的缺陷的结果的任何步骤)。在一个实施方案中,该外源标志物或外tt源对照标志物看从不同的受试者分离,或可合成地生产,可添加至待tt分析的样品。在另一个实施方案中,该外源对照标志物可以是添加或tt加标至待分析样品中用作内部阳性或阴性对照物的分子。外源对照标tt志物可与一个或多个前列腺癌标志物的检测共同使用以区分“真阴tt性”结果(例如非前列腺癌诊断)和“假阴性”或“不提供信息的”结果(例tt如由于扩增反应的问题)。tt

  “对照标志物”或“参比标志物”指用于(单独或与其他对照标志物tt组合)对照可能的干扰因素和/或提供关于样品质量、有效样品制备和/tt或适当的反应组合/进行(例如RT-PCR反应)的一个或更多指标的具体tt类型的标志物。在一些实施方案中,对照标志物可以是如本文中所述tt的内源对照标志物、外源对照标志物和/或前列腺特异性对照标志物。tt对照标志物可与本发明的前列腺癌标志物共检测或分别检测。对照标tt志物可以是一个或多个内源基因,例如管家基因或前列腺特异性对照tt标志物或基因的组合。tt

  在一些实施方案中,单个标志物(例如RNA)可单独检测。在其他tt实施方案中,可在单个扩增反应中使用多个引物组和探针以产生特异tt于不同标志物的具有不同大小的扩增子。在另一个实施方案中,检测tt和测量至少两个本发明的前列腺癌标志物。扩增子通常具有至少50tt个核苷酸至超过200个核苷酸的长度。然而,也可产生1000至2000tt个核苷酸之间的扩增子,或多达10kb或更多的扩增子。如本领域所tt熟知,本发明所属领域的技术人员可改变该扩增反应,以允许更高效tt地产生选定大小的扩增子。tt

  除了单独考虑本发明的标志物,在一些实施方案中,通过考虑来tt自两个或多个不同标志物的表达数据以获得新的参数,该参数本身可tttttt作为新的标志物,可提高诊断或预后性能。如果考虑来自两个不同标tt志物的表达数据,在本文中称为“标志物对”(或者如果该标志物是生tt物分子,称为“生物标志物对”)。更具体地,“前列腺癌标志物对”指通tt过考虑来自两个前列腺癌标志物的表达数据获得,以改进本发明的方tt法的性能(例如诊断/预后性能)的单个参数。在一个实施方案中,该单tt个参数可通过考虑两个不同前列腺癌标志物的标准化表达值(例如ttΔCt),确定该标志物中哪个最过表达,并选择该最过表达的标志物的tt标准化表达值获得。为简便,此类前列腺癌标志物对在本文中通过在tt考虑的两个前列腺癌标志物前插入术语“max”表示(例如“maxERG ttCACNA1D”)。在另一个实施方案中,该单个参数可通过计算被测量tt的数据组中最上调的标志物和最下调的标志物的标准化表达值(例如ttΔCt)之间的差异获得。为简便,此类前列腺癌标志物对在本文中通过tt在考虑的两个前列腺癌标志物的名称之间插入“-”表示。例如,在标tt志物对“ERG-SNAI2”中,该单个参数是通过从队列中最上调的基因ttERG的表达值中减去队列中最下调的基因SNAI2的表达值获得的。tt

  如本文中所用,术语“分类器”或“前列腺癌分类器”包括本发明的tt前列腺癌标志物的子集或全体(优选地组合使用),其允许根据源自有tt或没有前列腺癌的受试者将生物样品分类(例如表7-9中各自所列的tt分类器(“类别1-6”))。在一个实施方案中,包括于该分类器的前列腺tt癌标志物可在进行数学关联以产生与前列腺癌临床评估相关的评分tt前用一个或多个对照标志物(例如前列腺特异性对照标志物、内源对tt照标志物等)标准化或验证。在一个具体实施方案中,该分类器可包tt括用于提供数学关联的方法(例如统计方法或可“训练”的机器学习算tt法),以及该临床评估评分。tt

  如本文所用,“前列腺癌签名”包括本发明的一个分类器的前列腺tt标志物以及一个或多个对照标志物。在一个实施方案中,每个本发明tt的前列腺癌标志物和对照标志物的具体组合(例如表7-9各自列出的tt18个签名)代表不同的前列腺癌签名。如果本发明的前列腺癌签名中tt的一个或多个前列腺癌标志物涉及基因表达值,该前列腺癌签名在本tttttt文中可称为“多基因签名”或“多基因前列腺癌签名”。tt

  “杂交”或“核酸杂交”或“杂交”通常指两个具有互补碱基序列,在tt适当条件下将形成热力学上稳定的双链结构的单链核酸分子的杂交。tt如本文所用的术语“杂交”可指在严格或非严格条件下的杂交。条件的tt设置在本领域技术人员的技术范围内,可根据本领域中说明的实验方tt案确定。术语“杂交序列”优选地指显示至少40%,优选地至少50%,tt更优选地至少60%,更优选地至少70%,特别优选地至少80%,更tt特别优选地至少90%,更特别优选地至少95%,和最优选地至少97%tt同一性的序列同一性的序列。杂交条件的实例在上述两个实验手册中tt(Sambrook等人,2000,同上和Ausubel等人,1994,同上,或者进tt一步在Higgins和Hames(编辑)"Nucleic acid hybridization,a practical ttapproach"IRL Press Oxford,Washington DC,(1985)中)给出,且在本tt领域中众所周知。在杂交到硝化纤维素滤器(或其他此类支撑物例如tt尼龙)的情况下,例如众所周知的Southern印迹过程,硝化纤维素滤tt器可在代表所需严格度条件(高严格度60-65℃,中等严格度50-60℃,tt低严格度40-45℃)的温度下用溶于含高盐(6×SSC或5×SSPE)、tt5×Denhardt溶液、0.5%SDS和100μg/ml变性载体DNA(例如鲑鱼精tt子DNA)温育过夜的溶液中的经标记的探针。非特异性结合的探针可tt通过在0.2×SSC/0.1%SDS中在根据所需严格度选择的温度:室温(低tt严格度)、42℃(中严格度)或65℃(高严格度)下洗涤数次从滤器上洗tt脱。也可调整洗涤溶液的盐和SDS浓度以适应所需严格度。所选的tt温度和盐浓度基于DNA杂交物的熔化温度(Tm)。当然,RNA-DNAtt杂交物也可形成并被检测。在此类情况下,杂交和洗涤的条件可由本tt领域技术人员根据众所周知的方法改变。优选地使用严格条件tt(Sambrook等人,2000,同上)。如本领域所熟知,也可使用利用了不tt同退火和洗涤溶液的其他实验方案或市售可得的杂交试剂盒(例如来tt自BD Biosciences Clonetech的ExpressHybTM)。众所周知,探针的长tt度和要确定的核酸的组成决定杂交条件的其他参数。值得注意的是,tt通过用于抑制杂交实验中背景的备选封闭试剂的加入和/或取代可实tttttt现上述条件的变型。常见的封闭试剂包括Denhardt试剂、BLOTTO、tt肝素、变性鲑鱼精子DNA和市售可得的专有制剂。由于相容性问题,tt加入具体封闭试剂可能需要修改上述杂交条件。杂交核酸分子也包括tt上述分子的片段。此外,与上述核酸分子的任何一个杂交的核酸分子tt也包括这些分子的互补片段、衍生物和等位基因变体。此外,杂交复tt合物指两个核酸序列之间依靠互补的G和C碱基之间和互补的A和ttT碱基之间形成氢键的复合物;这些氢键可通过碱基堆叠相互作用进tt一步稳定。两个互补核酸序列以反向平行的构型形成氢键。杂交复合tt物可在溶液(例如Cot或Rot分析)中,或在一个存在于溶液中的核酸tt序列和另一个固定于固体支撑物(例如,已经例如固定了细胞的膜、tt滤器、芯片、针脚或载玻片)上的核酸序列之间形成。tt

  术语“互补的”或“互补”指多核苷酸在容许的盐和温度条件下通tt过碱基配对天然结合。例如,序列“A-G-T”与互补序列“T-C-A”结合。tt两个单链分子之间的互补可以是“部分的”,其中只有某些核苷酸结tt合,或者如果两个单链分子之间存在完全互补,互补可以是完全的。tt核酸链之间的互补程度对核酸链之间的杂交效率和强度有显著的影tt响。这在依赖核酸链之间结合的扩增反应中特别重要。所谓“充分地tt互补”表示能与另一序列通过在一系列互补碱基之间形成氢键而杂交tt的连续的核酸序列。互补碱基序列可通过使用标准碱基配对(例如G:ttC、A:T或A:U配对)在序列中的每个位点互补,或可含一个或多tt个不使用标准碱基配对互补,但允许整个序列与另一碱基序列在适当tt杂交条件下特异性杂交的残基(包括非碱性残基)。寡聚体的连续碱基tt优选地与该寡聚体特异性杂交的序列至少约80%(81、82、83、84、tt85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、tt100%),更优选地至少约90%互补。tt

  在两个或更多核酸或氨基酸序列的上下文中,如本文所用的术语tt“同一的”或“百分比同一性”指在比较窗口上最大相符比较或比对,或tt在指定的区域用本领域已知的序列比较算法测量,或通过人工比对和tt视觉检查时,相同或具有指定的百分比的相同的氨基酸残基或核苷酸tttttt(例如60%或65%同一性,优选地70-95%同一性,更优选地至少95%tt同一性)的两个或多个序列或子序列。具有例如60%至95%或更高的tt序列同一性的序列被认为是基本同一的。此定义也适用于测试序列的tt补体。优选地,所述同一性在至少约15至25氨基酸或核苷酸长的区tt域上,更优选地在约50至100氨基酸或核苷酸长的区域上存在。本tt领域技术人员知悉如何使用例如算法,例如如本领域已知的基于ttCLUSTALW计算机程序((Thompson Nucl.Acids Res.2(1994),tt4673-4680)或FASTDB(Brutlag Comp.App.Biosci.6(1990),237-245)tt的算法确定序列间的百分比同一性。尽管FASTDB算法在其计算中tt通常不考虑序列中的内部不匹配缺失或增加,即缺口,可人工修正以tt避免同一性%的过高估计。然而,CLUSTALW在其同一性计算中考tt虑缺口。本领域技术人员也可获得BLAST和BLAST 2.0算法(Altschul ttNucl.Acids Res.25(1977),3389-3402)。用于核酸序列的BLASTN程tt序默认字长(W)为11,期望(E)为10,M=5,N=4,并比较两条链。对tt于氨基酸序列,BLASTP程序默认字长(W)为3,期望(E)为10。ttBLOSUM62评分矩阵(Henikoff Proc.Natl.Acad.Sci.,USA,89,tt(1989),10915)使用比对(B)为50,期望(E)为10,M=5,N=4,并比tt较两条链。此外,本发明也涉及其序列与上述杂交分子相比简并的核tt酸分子。根据本发明使用的术语“由于遗传密码简并”表示由于遗传密tt码的冗余,不同的核苷酸序列编码相同的氨基酸。本发明也涉及包括tt一个或多个突变或缺失的核酸分子,以及与本文说明的显示突变或缺tt失的核酸分子杂交的核酸分子。tt

  “探针”意欲包括在促进杂交的条件下与核酸或其补体中的靶标tt序列特异性杂交,从而允许检测靶标序列或其扩增的核酸的核酸寡聚tt体或适体。检测可以是直接(即由直接与靶标或扩增的序列杂交的探tt针产生)或间接(即由与连接探针和靶标或扩增的序列的中间分子结构tt杂交的探针产生)的。探针的“靶标”通常指扩增的核酸序列中与至少tt部分探针序列通过标准氢键或“碱基配对”特异性杂交的序列。“充分tt地互补”的序列允许探针序列与靶标序列稳定杂交,即使该两个序列tttttt不完全互补。探针可被标记或不标记。探针可通过具体DNA序列的tt分子克隆生产,也可被合成。本发明所属领域的技术人员可容易地确tt定可在本发明的背景下设计和使用的多种引物和探针。tt

  基因表达谱分析的方法包括基于寡核苷酸杂交分析的方法、基于tt多核苷酸测序的方法和确定该寡核苷酸的蛋白水平的蛋白组学方法。tt本领域已知的定量样品中RNA表达的示例性方法包括但不限于ttSouthern印迹、Northern印迹、微阵列、聚合酶链式反应(PCR)、NASBAtt和TMA。tt

  核酸序列可通过使用与互补序列(例如寡核苷酸探针)的杂交检测tt(参见美国专利号5,503,980(Cantor)、5,202,231(Drmanac等人)、tt5,149,625(Church等人)、5,112,736(Caldwell等人)、5,068,176(Vijg等tt人)和5,002,867(Macevicz))。杂交检测方法可使用探针阵列(例如在ttDNA芯片上)以提供关于在一个碱基不同的一组四个相关探针中选择tt性杂交于精确地互补的探针序列的靶标核酸的序列信息(参见美国专tt利号5,837,832和5,861,242(Chee等人))。tt

  检测步骤可使用任何已知方法通过与探针寡核苷酸杂交检测核tt酸的存在。检测步骤的一个具体实例使用均质检测方法,例如先前在ttArnold等人,Clinical Chemistry 35:1588-1594(1989)和美国专利号tt5,658,737(Nelson等人)和5,118,801和5,312,728(Lizardi等人)中详细tt说明的。tt

  可使用探针的检测方法的类型包括Southern印迹(DNA检测)、tt点或槽印迹(DNA、RNA)和Northern印迹(RNA检测)。经标记的蛋白tt也可用于检测其结合的特定核酸分子(例如用far western技术检测蛋tt白:Guichet等人,1997,Nature 385(6616):548-552;和Schwartztt等人,2001,EMBO 20(3):510-519)。其他检测方法包括含有在试纸tt(dipstick)装置上的本发明的试剂的试剂盒等。当然,优选地使用适于tt自动化的检测方法。其非限制性实例包括包括一个或多个(例如阵列)tttttt不同的探针的芯片或其他支撑物。tt

  “标记”指可被检测或导致可检测信号的分子部分或化合物。标记tt可直接或间接地与探针/引物或待检测的核酸(例如扩增的序列)结合。tt直接标记可通过连接该标记和该核酸的键或相互作用(例如共价键或tt非共价键)进行,而间接标记可通过使用直接或间接标记的“接头”或tt连接部分,例如额外的寡核苷酸进行。连接部分可放大可检测信号。tt标记可包括任何可检测部分(例如放射性核素、配体例如生物素或亲tt和素、酶或酶底物、反应基团、发色团例如染料或有色分子、发光化tt合物包括生物发光、磷光或化学发光化合物和荧光化合物)。优选地,tt经标记的探针上的标记在均质测定系统中可检测,即在混合物中,结tt合的标记与未结合的标记相比,表现可检测的改变。已知其他标记核tt酸的方法,其中标记作为其片段附着在核酸链上,可用于标记待通过tt与固定化的DNA探针阵列杂交检测的核酸(例如参见PCT No.ttPCT/IB99/02073)。tt

  如本文所用,“寡聚核苷酸”或“寡核苷酸”定义具有两个或多个核tt苷酸(核糖核苷酸或脱氧核糖核苷酸)的分子。寡核苷酸的大小将由具tt体条件决定,最终根据其具体用途,由本领域技术人员相应地改变。tt寡核苷酸可化学地合成或根据众所周知的方法通过克隆获得。尽管它tt们通常为单链的形式,它们可以是双链形式,甚至包括“调控区”。它tt们可含有天然或合成核苷酸。它们可被设计以增强选定的标准,例如tt稳定性。脱氧核苷酸和核糖核苷酸的嵌合物也在本发明的范围内。tt

  术语“微阵列”指附着于固体支撑物的可杂交分子(例如寡核苷酸tt或多肽)的有序排列。使用微阵列技术作为基因表达谱分析工具的主tt要目的是同时研究某些处理、疾病和发育阶段对数以千计的基因的表tt达水平的影响。例如,基于微阵列的基因表达谱分析可用于识别其表tt达与正常个体相比在肿瘤样品中上调或下调的基因。tt

  “固定化探针”或“固定化核酸”指与固体支撑物的捕获寡聚体直tttttt接或间接结合的核酸。固定化探针是与固体支撑物结合,促进样品中tt结合的靶标序列与未结合的材料分离的寡聚体。可使用任何已知的固tt体支撑物,例如用任何已知材料(例如硝化纤维素、尼龙、玻璃、聚tt丙烯酸酯、混合聚合物、聚苯乙烯、聚丙烯硅烷和金属颗粒,优选地tt顺磁性颗粒)制成的基质或溶液中游离的颗粒。优选的支撑物是单分tt散顺磁性球(即大小均一,±约5%),从而提供一致的结果,固定化探tt针稳定地直接(例如通过直接共价连接、螯合或离子相互作用)或间接tt(例如通过一个或多个接头)地与其结合,允许与溶液中的另一核酸杂tt交。tt

  “互补DNA(cDNA)”指通过逆转录RNA(例如mRNA)合成的重组tt核酸分子。tt

  “扩增”或“扩增反应”指任何用于获得靶标核酸序列或其补体或tt者其片段的多个拷贝(“扩增子”)的体外过程。体外扩增指可含有少于tt完整靶标区序列或其补体的扩增的核酸的生产。体外扩增方法包括例tt如转录介导的扩增、复制酶介导的扩增、聚合酶链式反应(PCR)扩增、tt连接酶链式反应(LCR)扩增和链取代扩增(SDA,包括多链取代扩增方tt法(MSDA))。复制酶介导的扩增使用自身复制性RNA分子和复制酶tt例如Qβ-复制酶(例如Kramer等人,美国专利号4,786,600)。PCR扩tt增众所周知,使用DNA聚合酶、引物和热循环合成DNA或cDNAtt的两条互补链的多个拷贝(例如Mullis等人,美国专利号4,683,195、tt4,683,202和4,800,159)。LCR扩增使用至少4个单独的寡核苷酸通过tt使用多个杂交、连接和变性的循环扩增靶标及其互补链(例如EP专利tt申请公开号0 320 308)。SDA是其中引物含有限制性内切酶的识别位tt点,允许限制性内切酶切割半修饰的DNA双链的一条包括靶标序列tt的链,然后在多个引物延伸和链取代步骤中扩增的方法(例如Walkertt等人,美国专利号5,422,252)。其他两个已知的链取代扩增方法不需tt要内切酶切割(Dattagupta等人,美国专利号6,087,133和美国专利号tt6,124,120(MSDA))。本领域技术人员将理解,本发明的寡核苷酸引物tt序列可容易地用于任何基于由聚合酶引起的引物延伸的体外扩增方tttttt法(总体上参见Kwoh等人,1990,Am.Biotechnol.Lab.8:14 25和tt(Kwoh等人,1989,Proc.Natl.Acad.Sci.USA 86,1173 1177;Lizarditt等人,1988,BioTechnology 6:1197 1202;Malek等人,1994,Methods ttMol.Biol.,28:253 260和Sambrook等人,2000,Molecular Cloningtt-A Laboratory Manual,第三版,CSH Laboratories)。如本领域众所周tt知,寡核苷酸被设计以在选择的条件下结合互补序列。tt

  如本文所用,“引物”定义能与靶标序列退火,从而产生可在适当tt条件下作为核酸合成起点的双链区的寡核苷酸。引物可被例如设计为tt特异于某个等位基因以便用于等位基因特异性扩增系统。例如,引物tt可被设计以便于与差异表达的与前列腺的恶性肿瘤状态相关的RNAtt互补,而来自同一基因的另一差异表达的RNA与其非恶性肿瘤状态tt(良性)相关。引物的5'区可与靶标氨基酸序列不互补并包括额外的碱tt基,例如启动子序列(称为“启动子引物”)。本领域技术人员将认识到,tt任何可起到引物功能的寡聚体可被修饰为包括5'启动子序列,因而起tt到启动子引物的功能。类似地,任何启动子引物可独立于其功能启动tt子序列起到引物的作用。当然,从已知核酸序列设计引物是本领域众tt所周知的。寡核苷酸可包括多种类型的不同核苷酸。本领域技术人员tt可通过使用众所周知的数据库(例如GenbankTM)进行计算机比对/搜索tt容易地评估所选引物和探针的特异性。引物和探针可使用公众可获得tt的序列数据库例如NCBI参考序列(RefSeq)数据库根据mRNA转录物tt中存在的外显子或内含子序列设计。必要或希望时,引物和探针被设tt计为检测目的基因的最大转录物数量而不检测具有相似序列的基因tt产物例如同系物。本领域技术人员将认识到,引物和探针设计需要多tt个步骤例如将靶标序列定位到基因组、识别外显子-内含子结合处并tt在每个结合处设计引物、识别可用一组引物同时或分别检测的SNPtt和转录物变体。影响引物设计的其他因素包括但不限于:引物长度、tt熔化温度(Tm)、G/C含量、特异性、互补引物序列、引物二聚体和3tt'序列。对于一般用途,最佳引物和探针可用任何市售或以其他方式可tt公开获得的引物/探针设计软件例如PrimerExpressTM(Applied Biosyst ttttttem)或Primer3TM(http://primer3.sourceforge.net)设计。与本文公开的实tt施例相关的每个测定使用荧光标记的Minor Groove Bindertt(MGB)探针和两个未标记的PCR引物。由于被设计在两步RT-PCRtt的通用热循环条件下工作,本文实施例中使用的引物一般长17-30碱tt基,含约50-60%的G+C碱基,表现50至80℃的Tm。测tt定使用5'核酸酶化学和整合MGB技术的探针。MGB技术通过结合DttNA双螺旋的小沟增强探针Tm。此Tm增强允许使用短达13碱基的tt探针。更短的探针允许更好的特异性和更短的扩增子大小。表1、表tt2和表5提供关于本发明的引物、探针和扩增子序列的更多信息。tt

  术语“扩增对”或“引物对”指本发明的一对寡聚核苷酸(寡核苷tt酸),其被选择以共同用于通过多种扩增过程中的一种扩增选定的核tt酸序列(例如标志物)。tt

  以下技术包括在“扩增和/或杂交反应”的范围内。tt

  聚合酶链式反应(PCR)。聚合酶链式反应可根据已知技术进行。tt参见例如美国专利号4,683,195;4,683,202;4,800,159和4,965,188(以tt上3个美国专利的公开内容通过引用并入本文)。通常PCR涉及在杂tt交条件下用用于待检测的具体序列的每条链的一个寡聚核苷酸引物tt处理核酸样品(例如在热稳定性DNA聚合酶存在下)。合成的每个引tt物的延伸产物与两条核苷酸链的每条互补,其中引物与与其杂交的具tt体序列的每条链充分地互补。从每个引物合成的延伸产物也可作为用tt相同的引物进一步合成延伸产物的模板。在足够轮数的延伸产物的合tt成后,分析样品以评估待检测的序列是否存在。扩增的序列的检测可tt通过在电泳后用溴化乙锭(EtBr)染色对DNA可视化,或使用根据已tt知技术的可检测标记,等等。关于PCR技术的综述(参见PCR ttProtocols,A Guide to Methods and Amplifications,Michael等人,编tt辑,Acad.Press,1990)。tt

  基于核酸序列的扩增(NASBA)。NASBA可根据已知技术进行tttttt(Malek等人,Methods Mol Biol,28:253-260、美国专利号5,399,491tt和5,554,516)。在一个实施方案中,NASBA扩增以反义引物P1(含有ttT7 RNA聚合酶启动子)与mRNA靶标的退火开始。逆转录酶(RTA酶)tt随后合成互补DNA链。双链DNA/RNA杂交物被消化RNA链的RNAtt酶H识别,剩下单链DNA,有义引物P2可与其结合。P2作为合成tt第二条DNA链的RTA酶的锚定点。获得的双链DNA具有被相应的tt酶识别的功能T7 RNA聚合酶启动子。随后该NASBA反应可进入循tt环扩增阶段,包括6个步骤:(1)用T7 RNA聚合酶合成短反义单链ttRNA分子(每个DNA模板101至103个拷贝);(2)引物P2与该RNAtt分子退火;(3)用RTA酶合成互补DNA链;(4)消化DNA/RNA杂交tt物中的RNA链;(5)引物P1与单链DNA退火;和(6)用RTA酶产生tt双链DNA分子。由于NASBA是等温的(41℃),如果在样品制备过tt程中防止了dsDNA的变性,特异性扩增ssRNA是可能的。因此可在ttdsDNA背景中获得RNA而不获得由基因组dsDNA导致的假阳性结tt果。tt

  转录介导的扩增(TMA)。TMA是等温的基于核酸的方法,可在tt数小时内将RNA或DNA靶标扩增十亿倍。TMA技术在Gen-Probe(例tt如参见美国专利号5,399,491、5,480,784、5,824,818和5,888,779),使tt用两个引物和两个酶:RNA聚合酶和逆转录酶。一个引物含有RNAtt聚合酶的启动子序列。在扩增的第一步中,此引物与靶标rRNA在定tt义的位点杂交。逆转录酶通过从该启动子引物的3'末端延伸产生靶标ttrRNA的DNA拷贝。获得的RNA:DNA双链中的RNA被逆转录酶tt的RNA酶活性降解。然后,第二个引物与该DNA拷贝结合。由逆tt转录酶从此引物的末端合成第二DNA链,产生双链DNA分子。RNAtt聚合酶识别该DNA模板中的启动子序列并起始转录。每个新合成的ttRNA复制子重新进入TMA过程并作为新一轮复制的模板。上述反应tt产生的扩增子由特异性基因探针在杂交保护测定(一种化学发光检测tt格式)中或使用其他探针特异性技术(例如分子信标)检测。tt

  有或没有靶标序列扩增的测序技术例如Sanger测序、焦磷酸测tttttt序、连接测序、大量平行测序(又称为“下一代测序(NGS)”)和其他高tt通量测序方法可用于检测和定量样品中靶标核酸的存在。基于测序的tt技术可提供关于先前鉴别的基因的可变剪接和序列变异的更多信息。tt测序技术包括多个步骤,大体上分为模板制备、测序、检测和数据分tt析。现有的模板制备方法涉及将基因组DNA随机打断为较小的大小,tt每个片段固定于支撑物。空间上分开的片段的固定化允许数以千亿计tt的测序反应同时进行。测序步骤可使用本领域众所周知的多种方法中tt的任意一种。测序步骤的一个具体实例使用向互补链添加核苷酸以提tt供DNA序列。检测步骤的范围从测量合成片段的生物发光信号到单tt分子四色成像。NGS技术产生的大量数据需要在数据存储方面大量tt的信息学支持,以能从数以十亿计的测序读数进行基因组比对和组tt装。此组装的验证也需要严苛的跟踪和质量控制。tt

  连接酶链式反应(LCR)可根据已知技术进行(Weiss,1991,Science tt254:1292)。本领域技术人员可进行该实验方案的改变以满足所需需tt求。链取代扩增(SDA)也根据已知技术或其满足特定需求的改变进行tt(Walker等人,1992,Proc.Natl.Acad.Sci.USA 89:392 396和同上,tt1992,Nucleic Acids Res.20:1691 1696)。tt

  靶标捕获。在一个实施方案中,靶标捕获包括于在体外扩增前提tt高靶标核酸的浓度或纯度的方法中。优选地,靶标捕获涉及相对简单tt的杂交和分离靶标核酸的方法,如在其他文献中详细说明的(例如参tt见美国专利号6,110,678、6,280,952和6,534,273)。一般而言,靶标捕tt获可分为两类,序列特异性的和非序列特异性的。在非序列特异性方tt法中,使用试剂(例如二氧化硅微珠)捕获非特异性核酸。在序列特异tt性方法中,附着于固体支撑物的寡核苷酸在适当杂交条件下与含有靶tt标核酸的混合物接触,以允许靶标核酸附着于该固体支撑物,以允许tt从其他样品组分纯化该靶标。靶标捕获可由靶标核酸与附着于固体支tt撑物的寡核苷酸之间的直接杂交产生,但优选地由与形成连接靶标核tt酸和固体支撑物上的寡核苷酸的杂交复合物的寡核苷酸的间接杂交tt产生。该固体支撑物优选地是可从溶液分离的颗粒,更优选地是可通tttttt过向容器施加磁场回收的顺磁性颗粒。在分离后,与该固体支撑物连tt接的靶标核酸被洗涤并扩增,其中该靶标序列与适当的引物、底物和tt酶在体外扩增反应中接触。tt

  通常,如果捕获方法实际上是特异性的,捕获寡聚体序列包括特tt异性结合靶标序列的序列,以及将该复合物与固定化的序列通过杂交tt连接的“尾”序列。即,捕获序列包括特异性结合本发明的标志物、PSAtt或另一前列腺特异性标志物(例如hK2/KLK2、PMSA、转谷氨酰胺酶tt4、酸性磷酸酶、PCGEM1)靶标序列的序列和共价连接的3'尾序列(例tt如与固定化的同聚物序列互补的同聚物)。尾序列例如5至50核苷酸tt长,与固定化的序列杂交以连接含靶标的复合物与固体支撑物,从而tt从其他样品组分纯化杂交的靶标。捕获寡聚体可使用任何骨架连接,tt但一些实施方案包括一个或多个2'-甲氧基连接。当然,本领域熟知tt其他捕获方法。对帽结构的捕获方法(Edery等人,1988,gene 74(2):tt517-525,US 5,219,989)和基于二氧化硅的方法是捕获方法的两个非tt限制性实例。tt

  如本文所用,术语“纯化的”指与其原本存在的组合物的组分分离tt的分子(例如核酸)。因此,例如“纯化的核酸”被纯化到天然不存在的tt水平。“基本纯”的分子是没有大部分其他组分的分子(例如30%、40%、tt50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、tt99%、100%不含污染物)。相反,术语“粗的”表示未与其原本存在的tt组合物的组分分离的分子。为简便,单位(例如66、67…81、82、83、tt84、85…91、92%…)没有具体提及但仍然认为在本发明的范围内。tt

  如本领域所熟知,本文中的术语“Gleason评分”是最常用的腺癌tt评分/分期和预后系统。该系统描述了2和10之间的评分,其中2是tt最无侵袭性的,10是最有侵袭性的。评分是发现的两个肿瘤生长的tt最常见模式(等级1-5)的和。模式(等级)需要占超过5%的活检样品才tt被计数。为准确,评分系统需要活检材料(核心活检或可操作样品);tt不能使用细胞制备物。如果活检确认了癌症的存在,那么确定癌症的tttttt范围和侵袭性(称为Gleason等级)。病理学家通常鉴别两个前列腺癌tt的结构模式,并对每个模式给予Gleason等级:第一等级与细胞外观tt相关,在1至5之间,第二等级与细胞排列相关,也在1至5之间。tt第一等级由活检样品中的癌性细胞的外观决定;如果组织外观与正常tt前列腺组织相似,则给予1的等级。如果组织没有正常特征,并且可tt在整个样品中看到癌细胞,则给予5的等级。对外观介于1和5之间tt的组织给予2至4的等级。第二等级数与细胞的排列相关,也类似地tt给予。tt

  然后将第一和第二等级数组合在一起以形成Gleason评分。ttGleason评分越高,肿瘤表现得越有侵袭性(快速生长)。如果癌组织tt显示第一等级3和第二等级4的肿瘤介入,组合的Gleason评分是“3tt加4”或7。目前,约90%的新诊断为前列腺癌的男性具有6或7的ttGleason评分。小于6的Gleason评分通常称为低等级或良好分化的。tt6和7之间的Gleason评分称为中等等级。8和10之间的Gleason评tt分的肿瘤是高等级或差分化的。tt

  Gleason博士在开发此系统时发现,通过给出他能在任何具体患tt者的样品中看到的两个最常见的模式的等级的组合,他能更好地预测tt具体患者表现好或坏的可能性。因此,尽管看起来令人困惑,医生通tt常向患者给出的Gleason评分实际上是两个数字的组合或加和,它足tt够准确以供广泛使用。这些组合的Gleason加和或评分可确定如下:tt

  ·最低的可能的Gleason评分是2(1+1),其中第一和第二模式都tt具有1的Gleason等级,因此加和时其总和为2。tt

  ·非常典型的Gleason评分可能是5(2+3),其中第一模式具有2tt的Gleason等级并且第二模式具有3的等级,或者一种纯粹模式tt6(3+3)。tt

  ·另一种典型的Gleason评分是7(4+3),其中第一模式具有4的ttGleason等级并且第二模式具有3的等级。tt

  ·最后,最高的可能的Gleason评分是10(5+5),其中第一和第tt二模式都有最不正常的5的Gleason等级。tt

  另一个对前列腺癌分期的方法是使用如美国癌症联合委员会tt(AJCC)在AJCC Seventh Edition Cancer Staging Manual中说明的tt“TNM系统”。它说明了原发肿瘤(T期)、不存在或存在扩散至邻近淋tt巴结(N期)和不存在或存在远距离扩散,或转移(M期)的范围。每个ttTNM分类的种类分为代表其特定状态的亚类。例如,原发肿瘤(T期)tt可分为:tt

  ·T1:肿瘤不能被直肠指检感觉到或被成像研究看到,但活检样tt品中存在癌细胞;tt

  ·T2:肿瘤可在DRE期间感觉到,并且癌局限于前列腺内;tt

  ·T3:肿瘤扩展到前列腺囊(围绕前列腺的纤维组织层)和/或贮精tt囊(前列腺旁两个储存精液的小囊),但没有其他器官受影响;tt

  ·T4:肿瘤扩散或附着到前列腺旁的组织(贮精囊以外的)。tt

  淋巴结涉及被分为以下两类:tt

  ·N0:癌未扩散到任何淋巴结;tt

  ·N1:癌扩散到局部淋巴结(骨盆内)。tt

  转移一般分为以下两类:tt

  ·M0:癌未转移(扩散)超出局部淋巴结;和tt

  ·M1:癌转移到远处淋巴结(骨盆外)、骨或其他远处的器官例如tt肺、肝或脑。tt

  此外,T期进一步分为亚类T1a-c、T2a-c、T3a-b和T4。本领域tt熟知上述各个亚类的特征,可在多个教科书中找到。tt

  对照样品。术语“对照样品”、“正常样品”或“参比样品”在本文中tt指可指示或代表非癌性状态(例如非前列腺癌状态)的样品。对照样品tt可从未罹患前列腺癌的患者/个体获得。也可使用其他类型的对照样tt品。在确定阈值后,也可设计提供预定的阈值的信号特征的对照样品tt并用于本发明的方法。诊断/预后测试特征通常为以下4个性能指标:tt灵敏性(Se)、特异性(Sp)、阳性预测值(PPV)和阴性预测值(NPV)。以tt下表格给出了用于计算上述4个性能指标的数据。tt

  灵敏性指具有阳性诊断结果的受试者中真实地患有该疾病或症tt状的部分(Se=a/a+c)。特异性指具有阴性诊断结果的受试者中不患该tt疾病或症状的部分(Sp=d/b+d)。阳性预测值指诊断测试为阳性时实际tt患有该疾病或症状(例如前列腺癌)可能性(PPV=a/a+b)。最后,阴性预tt测值是诊断测试为阴性时实际不患该疾病/症状可能性的指标tt(NPV=c/c+d)。值通常以%表示。Se和Sp通常涉及测试的精确性,而ttPPV和NPV涉及其临床效用。tt

  当指被测量的标志物时,术语“水平”和“量”在本文中可互换地使tt用。tt

  本领域技术人员应当理解,在本发明的背景下可使用多种统计方tt法确定测试是阳性或阴性或者确定前列腺肿瘤的具体的期、等级、体tt积或其侵袭性。tt

  术语“变体”在本文中指结构和生物活性与本发明的蛋白或核酸tt基本相似,维持至少一个其生物活性的蛋白或核酸分子。因此,只要tt两个分子具有共同的活性且可彼此代替,它们被视作如本文所用的变tt体,即使一个分子的组成或二级、三级或四级结构与另一个中存在的tttttt不同,或者氨基酸序列或核苷酸序列不一致。tt

  如本文所用,术语“受试者”和“患者”指有前列腺的哺乳动物,优tt选人。受试者和患者的具体实例包括但不限于需要医学帮助的个体,tt特别是患有癌症例如前列腺癌的患者、被怀疑患有前列腺的患者或被tt监测以评估其前列腺状态的患者。tt

  如本文所用,术语“上调”或“过表达”指在癌组织(例如在前列腺癌tt组织)中以相对于其他相应的组织(例如正常或非癌性前列腺组织)中tt的水平高的水平表达(例如RNA和/或蛋白表达)的基因。在一些实施tt方案中,在癌中上调的基因以比其他相应的组织(例如正常或非癌性tt前列腺组织)中的表达水平高至少10%,优选地至少25%,更优选地tt至少50%,更优选地至少100%,更优选地至少200%,最优选地至tt少300%的水平表达。在一些实施方案中,在前列腺癌中上调的基因tt是“雄性激素调控的基因”。相反,如本文所用,术语“下调”指在癌组tt织(例如在前列腺癌组织)中以相对于其他相应的组织(例如正常或非tt癌性前列腺组织)中的水平低的水平表达(例如mRNA或蛋白表达)的tt基因。在一些实施方案中,在癌中下调的基因以比其他相应的组织(例tt如正常或非癌性前列腺组织)中的表达水平低至少10%,优选地至少tt25%,更优选地至少50%,更优选地至少100%,更优选地至少200%,tt最优选地至少300%的水平表达。tt

  确定一个或多个基因在癌组织(例如前列腺癌组织)中是上调或下tt调可通过比较该一个或多个基因的表达水平和不患前列腺癌的受试tt者的表达水平完成。在一个实施方案中,这可通过比较该表达水平与tt指示不患癌症(例如不患前列腺癌)的受试者中表达的一个或多个预定tt值完成。如本文所用,短语“确定表达”指测量本发明的任何表达产物tt(例如编码RNA、非编码RNA或表达的多肽)。tt

  基因“共调控”、“共存”或“共存调控”。基因通常共同作用,因此其tt表达可以协调的方式“共调控,”此过程也称为“共表达调控”或“共调tttttt控”。为疾病过程例如癌症(例如前列腺癌)鉴别的“共调控的基因”或“共tt表达的基因”可作为肿瘤状态的生物标志物,因此可代替与其共调控tt的另一标志物或共同使用。如本文所用,术语“共调控的基因”等指在tt多名受试者中以协调的方式被上调或下调,属于相同的生物过程,例tt如癌症的成组的相关基因。例如,共调控的基因可在癌(例如前列腺tt癌)组织中被共同上调或下调。共调控的基因的含义也包括以相反的tt方式共调控的基因。例如,共调控的基因中一个基因可在癌组织中被tt上调,而其他基因可在该癌组织中被相应地下调。共调控也包括相互tt排斥的情况,例如,检测到一个基因与不能检测到另一个基因相关联。tt共调控可用可通过cBio Cancer Genomics Portal(http://cbioportal.org)tt获得的计算所有基因对之间的相互排斥或共存,并且通过对各个基因tt对进行Fisher精确检验而产生所有靶标基因的p值的二元矩阵的算法tt确定。两个基因间共调控的强度可以p值的方式表示。在一个实施方tt案中,“强共调控的基因”可指p值<0.00001的共调控的基因。在另一tt个实施方案中,“中等共调控的基因”可指p值<0.001的共调控的基因。tt在另一个实施方案中,“共调控的基因”可指p值<0.05的共调控的基tt因。在另一个实施方案中,“强相互排斥基因”可指p值<0.005的不共tt调控的基因。在另一个实施方案中,“相互排斥基因”可指p值<0.05的tt不共调控的基因。应当理解,本发明不应限于以上列出p值,可选择tt其他p值以适应本领域技术人员的具体需求。本发明还涵盖此类其他ttp值。tt

  “生物样品”、“患者的样品”或“受试者的样品”意欲包括任何源自tt活或死亡的哺乳动物(优选地活人)的组织或材料,其可包括本发明的tt标志物。tt

  如本文所用的术语“参数”也称为“过程参数”包括用于本发明的tt方法的一个或多个变量以确定以下的一个或多个:样品中检测到的标tt志物/靶标的量;一个或多个标志物/靶标的表达水平;和与一个或多tt个标志物/靶标的表达水平相关的临床评估值。参数包括但不限于:tt引物类型;探针类型;扩增子长度;物质浓度;物质质量或重量;过tttttt程时间;过程温度;过程中的活性,所述过程例如离心、转动、摇动、tt切割、研磨、液化、沉淀、溶解、电修饰、化学修饰、机械修饰、加tt热、冷却、保存(例如数天、数周、数月甚至数年)和维持静止(未搅动)tt状态。参数还可包括用于本发明的方法中的一个或多个数学公式中的tt变量。参数可包括用于确定用于或产生于本发明的方法的随后的步骤tt中的一个或多个参数或输出的值的阈值。在一个优选的实施方案中,tt该阈值是检测的靶标的最小或最大量。当然,此类参数可由本发明所tt属领域的技术人员调整以便于更具体地适于灵敏性、特异性、效率等tt具体需求。tt

  如本文所用的短语“信号检测”指在样品或子样品中检测的一个tt或多个标志物的量,例如重量、体积或浓度(例如从荧光染料发射的tt光的浓度)的量。检测到的靶标的量可以是该靶标的量的间接或替代tt量度,例如来自PCR反应的Ct或拷贝数,或者当与一个或多个参比tt或管家基因或其他已知内部标准物标准化时,ΔCt或Δ拷贝数结果。tt

  如本文所用的短语“表达水平”指用于靶标的确定的表达水平的tt连续或离散值的可能范围。表达水平可以是离散值或相对于正常细胞tt例如前列腺细胞中的水平确定的,例如相对于先前时间点的水平增tt加,或相对于预先确定的阈值水平的水平增加。tt

  如本文所用的术语“列线图(nomogram)”指算法或其他考虑疾病tt因子或临床因子例如年龄;种族;癌症期;PSA水平;活检;病理分tt析;激素治疗的使用;辐射剂量;遗传等的组合获得结果的方法。术tt语“列线图”在涉及前列腺癌时广泛使用。tt

  如本文所用的术语“临床评估”指患者的身体状况的评价和对前tt列腺癌的存在和/或严重程度及其进展的预测,以及根据常规病程预tt计的恢复前景,基于从体检和实验室检查和患者的病史收集到的信tt息。如本文所用的短语“结果的临床评估范围”指用于患者的临床评估tt的连续或离散值的可能范围。tt

  如本文所用的术语“筛查”指一种临床评估,其中首先鉴别癌症的tt存在或癌症的不存在。在早期检测癌症被认为能改善治疗益处和导致tt的临床结果。tt

  如本文所用的术语“诊断”指另一种临床评估,其中确认癌症的存tt在或癌症的不存在。tt

  如本文所用的术语“分期”指另一种临床评估。分期通常是确定肿tt瘤的范围和位置以开发适当的治疗策略并估计预后。分期是预测前列tt腺癌的严重程度及其进展,以及根据常规病程预计恢复前景的一种方tt法。tt

  如本文所用的术语“预后”指另一种临床评估。预后通常涉及确定tt根据常规病程或病例的特性预计的恢复前景,例如确定发生前列腺癌tt的可能性、确定发生侵袭性前列腺癌的可能性、确定发生转移性前列tt腺癌的可能性和/或确定长期存活结果。tt

  如本文所用的术语“确定侵袭性”指另一种临床评估。确定侵袭性tt通常是通过确定前列腺癌的Gleason评分进行的,后者可指导选择适tt当的治疗方法。tt

  如本文所用的术语“治疗计划”指另一种临床评估。治疗计划通常tt指建议或排除一个或多个治疗选择,包括但不限于:观察(观察性等tt待);手术例如根治性前列腺切除术;放疗例如外部光束辐射或近距tt放疗;药物或其他剂治疗例如激素治疗或化疗;睾丸酮降低治疗例如tt通过药物或手术移除睾丸及其组合。tt

  如本文所用的术语“监测治疗响应”指另一种临床评估。监测治疗tt响应通常指直接或间接与现有患者治疗相关的一个或多个患者状况tt监测选择例如常规(例如以计划的频率)诊断和预后过程。可适用的诊tt断程序包括但不限于:对从患者获得的样品常规进行一项或多项测试tt例如血检或尿检;常规成像测试和常规活检。tt

  如本文所用的术语“监控”指另一种临床评估。监控通常指一个或tt多个患者状况监测选择例如常规(例如以计划的频率)诊断和预后过tt程。监控不一定与现有患者治疗相关(例如可在进观察期间内)。可适tt用的诊断程序包括但不限于:对从患者获得的样品常规进行一项或多tt项测试例如血检或尿检;常规成像测试和常规活检。tt

  用于提供前列腺癌的临床评估的方法、试剂盒和组合物

  本发明涉及用于基于来自受试者的生物样品提供受试者中前列tt腺癌的临床评估的方法、试剂盒和组合物。简言之,在一个具体的实tt施方案中,从受试者获得生物样品(例如尿、组织或血样),并确定本tt发明的前列腺癌签名中至少两个前列腺癌标志物的标准化表达水平。tt对该至少两个前列腺癌标志物的标准化表达水平进行数学关联以获tt得一个评分,该评分用于提供受试者中前列腺癌的临床评估。tt

  前列腺癌签名

  本发明的前列腺癌签名涉及至少两个其在尿中表达模式与前列tt腺癌的临床评估相关(正相关或负相关)的前列腺癌标志物的组合。tt

  在一个实施方案中,本发明的前列腺癌签名可包括至少两个选自tt表5或表6A的前列腺癌标志物。在另一个实施方案中,本发明的前tt列腺癌签名可包括至少两个选自以下的前列腺癌标志物:tt(1)CACNA1D或与其在前列腺癌中共调控的标志物;(2)ERG或与其tt在前列腺癌中共调控的标志物;(3)HOXC4或与其在前列腺癌中共调tt控的标志物;(4)ERG-SNAI2前列腺癌标志物对;(5)ERG-RPL22L1tt前列腺癌标志物对;(6)KRT15或与其在前列腺癌中共调控的标志物;tt(7)LAMB3或与其在前列腺癌中共调控的标志物;(8)HOXC6或与其tt在前列腺癌中共调控的标志物;(9)TAGLN或与其在前列腺癌中共调tt控的标志物;(10)TDRD1或与其在前列腺癌中共调控的标志物;tt(11)SDK1或与其在前列腺癌中共调控的标志物;(12)EFNA5或与其tt在前列腺癌中共调控的标志物;(13)SRD5A2或与其在前列腺癌中共tttttt调控的标志物;(14)maxERG CACNA1D前列腺癌标志物对;tt(15)TRIM29或与其在前列腺癌中共调控的标志物;(16)OR51E1或与tt其在前列腺癌中共调控的标志物;和(17)HOXC6或与其在前列腺癌tt中共调控的标志物。tt

  在另一个实施方案中,本发明的前列腺癌签名可包括至少两个前tt列腺癌标志物,其中该标志物之一是CACNA1D或与其在前列腺癌tt中共调控的标志物。在另一个实施方案中,本发明的前列腺癌签名可tt包括至少两个前列腺癌标志物,所述标志物是CACNA1D或与其在tt前列腺癌中共调控的标志物,和ERG或与其在前列腺癌中共调控的tt标志物。tt

  在一个具体实施方案中,与上述前列腺标志物共调控的标志物在tt表6B中列出。在其他具体实施方案中,表6B中列出的共调控的标tt志物显示具有p值<0.05(“共调控”);p值<0.001(“中等共调控”);ptt值<0.05(“强共调控”);p值<0.05(“相互排斥”)或p值<0.005(“强相tt互排斥”)的共调控。tt

  在另一个实施方案中,本发明的前列腺癌签名可包括与一个或多tt个对照标志物组合的至少两个本发明的前列腺癌标志物。在另一个实tt施方案中,该一个或多个对照标志物选自表2或表7-9中列出的那些。tt

  在另一个实施方案中,可综合考虑来自两个或更多个不同的本发tt明标志物的表达数据以获得新参数,该参数本身可作为新标志物(即tt“标志物对”,如上文所述)。在具体实施方案中,该标志物对可以是tt前列腺癌标志物对,例如两个不同的前列腺癌标志物之间的最大表达tt水平(例如“maxERG CACNA1D”)或两个不同的前列腺癌标志物表达tt水平之间的差异(例如"ERG-SNAI2")。为简便,前者在本文中通过在tt考虑的两个前列腺癌标志物前插入术语“max”表示,后者通过在考虑tt的两个前列腺癌标志物的名称之间插入“-”表示。本领域技术人员可tt根据本文披露的前列腺癌标志物和对照标志物得出其他类型的提供tttttt信息的标志物对。tt

  在另一个实施方案中,本发明的前列腺癌签名提供优于(即,能tt更好地区分前列腺癌和非前列腺癌)PCA3(例如PCA3/PSA比例)的前tt列腺癌临床评估。在另一个实施方案中,使用不依赖PCA3本身的前tt列腺癌诊断工具可能是有用的。例如,如果对受试者用基于PCA3的tt测试进行前列腺癌临床评估,可能需要有不依赖PCA3的单独、独立tt的前列腺癌临床评估。这样,本发明的前列腺癌签名可用于独立地验tt证基于PCA3的测试结果,反之亦然。因此,在一个具体实施方案中,tt本发明的前列腺癌签名不包括PCA3。tt

  生物样品

  生物样品一般从患有或怀疑患有前列腺癌的受试者获得。在多个tt实施方案中,受试者可患有或怀疑患有癌症(例如原发前列腺癌);可tt有家族前列腺癌史;可被跟踪前列腺癌发展(例如为监测癌症发展和/tt或癌症疗法的效力);可具有不同于前列腺癌的一种或多种病症,或tt表现与良性前列腺增生(BPH)、高等级前列腺上皮内瘤(HGPIN)或非tt典型小腺泡增殖(ASAP)相关的症状。在其他实施方案中,本发明的tt方法可在先前的诊断测试,例如其中PSA水平高于10ng/mL、4ng/mL、tt2.5ng/mL、2ng/mL或其他诊断上有用的值的PSA测试之后对来自受tt试者的生物样品进行。tt

  在一个实施方案中,样品可以是肿瘤或非肿瘤组织,并且可包括tt例如可含有来自其的与前列腺组织相关的细胞或标志物的任何组织tt或材料,例如:尿;前列腺活检样品;精子/精液;膀胱洗液;血液;tt淋巴结;淋巴组织;淋巴液;前列腺经尿道切除物(TURP);其他体tt液、组织或材料;细胞系;组织切片;保存的组织例如福尔马林固定、tt冷冻或脱水的组织;石蜡包埋的组织;激光捕获显微解剖样品;或其tt任何组合,只要其含有或被认为含有前列腺来源的核酸或多肽。样品tt可用例如用注射器吸取流体或用棉签的方法获得。本领域技术人员将tttttt容易地认识到其他获得样品的方法。tt

  在另一个实施方案中,本发明的样品也可包括多个子样品,其可tt同时或在一段时期获得(例如在不同时间收集的尿或血液,或多个活tt检样品(例如多个个体活检核心))。这些子样品则可同时或一起处理tt(例如“汇集”)。tt

  只要保留检测本发明的标志物的能力,样品可在分析前处理。样tt品处理可包括防腐和储存,以及处理样品以物理破坏组织或细胞结tt构,从而使细胞组分释放到溶液中,该溶液可进一步含有用于准备该tt样品分析的酶、缓冲液、盐、去垢剂等。细胞可从流体样品分离,例tt如通过离心、过滤或沉淀。体液例如尿和血液可需要添加一种或多种tt稳定剂,例如当进一步测试在样品收集后数小时或数天进行时。样品tt的进一步处理可需要逆转一个或多个储存或防腐步骤,例如移除稳定tt剂和防腐剂。组织样品可用众所周知的技术匀浆或以其他方式准备分tt析,包括但不限于:超声;机械破坏;化学溶解例如去垢剂溶解及其tt组合。样品也可物理地分开;暴露于化学反应例如去石蜡和/或沉淀tt过程;暴露于分离过程例如在离心机中分离;暴露于洗涤过程;防腐;tt固定;冷冻等。样品,例如组织可被冷冻、脱水或用化学剂例如福尔tt马林防腐。固定的组织样品可包埋于石蜡中以便储存和运输,以及便tt于制备用于病理学家目测检查和评估样品,或在介质例如或中冷冻的切片。用于手术病理学的组织切片制备物可用标tt准技术冷冻和制备。可对固定的细胞进行对组织切片进行的免疫组化tt和原位杂交结合测定。本领域技术人员将容易地认识到可检查本发明tt的前列腺癌标志物的多种样品,并认识到获得、储存和防腐(如果需tt要)该样品的方法。tt

  根据本发明,RNA可用多种方法从生物样品提取,例如使用有tt机提取或固体表面靶标捕获方法。在一个实施方案中,样品是尿,并tt且RNA是用以下提取试剂盒之一提取的:ZR Urine RNA Isolation ttKitTM(Zymo Research);TrizolTM LS(Invitrogen);Urine(Exfoliated ttttttCell)RNA Purification Kit(Norgen Biotek目录22500);Ribo-Sorb ttRNA/DNA提取试剂盒(Sacace);RNeasyTM迷你试剂盒(Qiagen)。在另tt一个实施方案中,样品是人组织,提取过程使用试剂。tt

  本发明的优选的生物样品是尿,尽管本文已经测试并且也考虑了tt其他样品(例如组织)。尿便于收集并且在本文经验证允许临床评估例tt如诊断、预后、分级等的事实清楚地支持本发明的重要性和能力。尿tt样品可以或可以不在例如直肠指检、射精、前列腺按摩、活检或任何tt其他增加尿中前列腺细胞含量的方法的事件之后收集。本发明也可用tt粗的未处理的全尿进行。如本文所用,“粗尿”指从受试者收集但基本tt上未被进一步处理例如离心、过滤或沉淀的尿。当然,也可根据本发tt明使用尿级分例如尿上清液或尿细胞沉淀(例如尿沉积物)。tt

  对于其中目标前列腺癌标志物包括核酸(RNA或DNA)的基于尿tt的测定,尿可在收集后尽快稳定。然后可从尿分离细胞组分(包括核tt酸),例如通过过滤、离心或沉淀,然后溶解分离的细胞并稳定RNAtt和/或DNA,例如通过使用螯合剂如硫氰酸胍。然后可移除核酸,例tt如通过结合于二氧化硅基质。tt

  在使用血样的测定中,可使用全血或血清,或可从血细胞分离血tt浆。可筛查血浆中本发明的前列腺癌标志物,包括当一个或多个本发tt明的前列腺癌标志物从肿瘤细胞切离或脱落时释放到血液中的截短tt的蛋白。在一个实施方案中,筛查血细胞级分中前列腺肿瘤细胞的存tt在。在另一个实施方案中,可通过溶解细胞并检测本发明标志物(例tt如蛋白或基因转录物)的存在筛查存在于血细胞级分中的淋巴细胞,tt该标志物可由于被白细胞吞噬的前列腺肿瘤细胞而存在。tt

  标志物表达水平检测

  根据本发明,从患有或怀疑患有前列腺癌的受试者获得适当的生tt物样品,并确定至少两个本发明的前列腺癌标志物的表达水平。简言tt之,表达水平可通过检测存在于样品中的指示该前列腺癌标志物的表tttttt达水平的靶标的量,然后处理或转化此原始靶标检测数据(例如数学tt地、统计地或其他方法)以产生样品中该前列腺标志物的表达水平,tt或一些表达相关的评分而获得。tt

  如上所述,“靶标”指本发明的标志物的被靶标用于根据本发明方tt法检测、扩增和/或杂交的具体子区域(其非限制性实例包括在RNAtt标志物的情况下选定的外显子-外显子连接处,或者在蛋白标志物的tt情况下选定的表位)。因此,在一个实施方案中,标志物表达水平的tt确定可从检测生物样品中指示/代表所述标志物存在的靶标的量开tt始。即,检测到的靶标的量可代表寻求其表达水平的相应标志物的量tt的替代。检测到的靶标的量可用以下一个或多个代表:检测到的分子tt/细胞数(例如循环阈值(Ct)或拷贝数);检测到的质量;检测到的浓度,tt例如检测到的质量与样品质量的比例或检测到的质量与患者参数例tt如患者体重或表面积相比的比例;或其任何组合。tt

  靶标的量可通过测量荧光输出确定。检测到的靶标的量也可代表tt检测的相应标志物的量的替代,作为检测到的靶标量的关联,例如来tt自测量荧光输出的测试的Ct(循环阈值)值或拷贝数。tt

  在一个非限制性实施方案中,待检测的本发明的标志物是基因。tt确定本发明的基因靶标的表达水平可通过定量该基因的表达产物(例tt如源自其的RNA或多肽)完成。RNA靶标可用任何本领域知悉的任tt何杂交和/或扩增反应或相关技术定量。在另一个实施方案中,该杂tt交和/或扩增反应(例如测序或扩增(例如PCR))可利用一个或多个与该ttRNA标志物(或从其产生的cDNA)充分地互补以与其特异性结合的寡tt核苷酸。在另一个实施方案中,该寡核苷酸可以是扩增引物或检测探tt针。适当的寡核苷酸(例如扩增引物和探针)和扩增/杂交反应可由本领tt域技术人员使用可获得的序列信息常规地设计。在另一个实施方案tt中,本发明包括经标记的寡核苷酸(例如用放射性标记的核苷酸标记,tt或者可通过可容易获得的非放射性检测系统检测)。tt

  事实上,多种检测和定量技术可用于确定本发明的靶标的表达水tt平,包括但不限于:PCR、RT-PCR;RT-qPCR;NASBA;Northerntt印迹技术;杂交阵列;分支核酸扩增/技术;TMA;LCR;高通量测tt序;原位杂交技术和其后进行HPLC检测或MALDI-TOF质谱的扩增tt过程。在一个具体实施方案中,扩增过程用PCR进行。本文说明的tt标志物检测方法意欲示例本发明如何实施,而不意欲限制本发明的范tt围。考虑可根据本发明使用其他用于检测受试者样品中本发明的标志tt物存在的基于序列的方法。上文意欲包括在“扩增和/或杂交反应”的范tt围内。tt

  在典型的PCR反应中,RNA或cDNA与引物、游离核苷酸和酶tt根据标准PCR实验方案组合,并且该混合物经历一系列温度改变。tt如果存在本发明的标志物或从其产生的cDNA,即如果两个引物都与tt同一分子的靶标序列杂交,包括引物和介于其间的互补序列的分子将tt被指数地扩增。扩增的DNA可用多种众所周知的方法容易地检测。tt如果不存在标志物,没有PCR产物会被指数地扩增。因此,PCR技tt术提供了检测本发明的标志物的可靠的方法。tt

  在一个实施方案中,该PCR反应可被设置或设计为扩增具体的tt外显子-外显子结合处。tt

  在一些情况下,例如当回收不寻常小量RNA并且从其产生仅小tt量cDNA时,可能希望或需要对第一PCR反应产物进行PCR反应。tt即,如果难以检测第一反应产生的扩增的DNA的量,则可进行第二ttPCR以制备第一次扩增的DNA的DNA序列的多个拷贝。第二PCRtt反应中可使用巢式引物组。tt

  本领域技术人员熟知原位杂交技术。简言之,固定细胞,然后将tt含有特异性核苷酸序列的可检测探针添加到该固定的细胞。如果细胞tt含有互补核苷酸序列,则可检测的探针将与其杂交。使用本文提出的tt序列信息,可设计探针以识别表达本发明的标志物的细胞。探针优选tttttt地与对应于此类标志物的核苷酸杂交。杂交条件可被常规地优化以最tt小化非完全互补杂交造成的背景信号。探针优选地与其靶标序列完全tt互补。因为探针不与部分互补序列同样良好地杂交,通常完全互补是tt优选的。对于根据本发明的原位杂交,也优选地,探针用附着于该探tt针的荧光染料标记以可容易地用荧光检测。tt

  在另一个实施方案中,靶标检测可通过检测由本发明的基因或ttRNA标志物编码的蛋白(或其表位)完成。本领域技术人员将认识到,tt蛋白和多肽可用本领域常规可用的方法定量。在另一个实施方案中,tt免疫测定可用于确定本发明的多肽标志物的表达水平。可进行技术例tt如免疫组化测定以确定本发明的标志物是否存在于样品中的细胞中。tt在另一个实施方案中,本发明的蛋白标志物可用标志物特异性抗体检tt测。在具体实施方案中,抗体可以是单克隆抗体、多克隆抗体、人源tt化抗体或抗体片段。针对本发明的多肽标志物的抗体可获得或可由本tt领域普通技术人员容易地生产。tt

  一旦获得本发明的靶标的量,就可确定对应的标志物的表达水tt平,例如产生样品中前列腺癌标志物的表达水平。tt

  在一个实施方案中,确定本发明的标志物的表达水平可仅包括确tt定该标志物的存在(或其不存在)(即,“是”或“否”)。tt

  在另一个实施方案中,确定本发明的标志物的表达水平可包括使tt用考虑受试者数据或其他数据的统计方法(例如逻辑回归)将原始靶标tt检测数据处理或转化(例如数学地、统计地或其他方式)为前列腺癌标tt志物的表达水平(或标准化的表达水平)。受试者数据可包括(但不限tt于):年龄;种族;癌症分期,例如通过组织病理学确定的分期;Gleasontt评分(由活检确定的)或Gleason等级(由病理学家在前列腺切除后确定tt的);PSA水平例如手术前PSA水平;PCA3比例或其他诊断例如ttHGPIN;BPH或ASAP;或此类受试者数据或其他数据的不同组合。tt该算法可以是或包括如上文定义的列线图。该算法也可考虑例如以下tttttt因素:受试者的不同于前列腺癌(或除了前列腺癌以外)的症状的存在、tt诊断和/或预后。在一个具体实施方案中,如果从受试者获得的样品tt是尿,该算法可考虑尿样收集相对于另一事件的时间,所述另一事件tt例如直肠指检查;前列腺按摩;活检;手术前列腺移除;癌症的第一tt次诊断或其任何组合。在另一个实施方案中,该统计方法可处理代表tt以下水平的靶标量:检测到的细胞数量;检测到的分子数量;检测到tt的质量;检测到的浓度,例如与样品或子样品的质量相比的检测到的tt标志物的质量;和这些的组合。在另一个实施方案中,该算法可被配tt置为确定该靶标的浓度(例如与另一参数相比的检测到的靶标的量)。tt本发明所属领域技术人员将清楚,根据上下文,本文包括的算法可使tt用多种数据参数和/或因素的组合以获得所需的输出。tt

  在另一个实施方案中,确定前列腺癌标志物的水平可涉及确定此tt前列腺癌标志物中的一个或多个可变剪接变体的表达水平。在此实施tt方案中,剪接变体的存在或不存在通常由RT-PCR使用特异性结合发tt生可变剪接的区域旁侧的核苷酸序列的引物检测。tt

  在另一个实施方案中,确定本发明的标志物的表达水平可包括与tt一个或多个阈值比较(例如高于或低于该阈值)。在另一个实施方案中,tt该表达水平代表定量量或定量水平或值,例如选自连续值范围的值或tt选自多个离散值范围的值。该表达水平可基于直接测量本发明的标志tt物或基于测量标准化的值。tt

  用对照标志物标准化

  在确定本发明的标志物的表达水平后,该表达水平可用例如标准tt化算法、数学过程或其他数据操作工具或方法使用一个或多个对照标tt志物(例如前列腺特异性标志物、内源对照标志物、外源对照标志物)tt标准化。然后可通过与一个或多个阈值比较,处理该前列腺癌标志物tt的标准化的表达水平,包括:分类到一个或多个离散的水平或组;与tt另一方法或该样品或该受试者的临床参数比较;和/或其他数学或非tttttt数学变换。tt

  通常,如本领域技术人员所熟知,本发明的前列腺癌标志物的表tt达水平标准化到一个或多个对照标志物以产生标准化的表达水平。如tt本文所用和上文所述,“对照标志物”指用于(单独或与一个或多个对tt照标志物组合)对照可能的干扰因素和/或提供关于样品质量、有效样tt品制备和/或适当的反应组合/执行(例如RT-PCR反应)的一个或多个tt指标的具体类型的标志物。tt

  在一个实施方案中,适当的本发明的对照标志物具有不受样品中tt癌细胞存在影响的表达,即与由于长储存期、储藏条件差或其他胁迫tt因素以某种方式降解的样品中前列腺癌标志物类似的行为。用如本文tt所示适当的对照标志物标准化前列腺癌标志物的方法为用于实现前tt列腺癌临床评估的目前方法提供了有用的辅助作用,因为早期检测对tt有效治疗和管理癌症是希望的。tt

  在一个实施方案中,对照标志物可以是如本文所述的内源对照标tt志物、外源对照标志物和/或前列腺特异性标志物(例如PSA)的一个或tt多个。对照标志物可以是一个或多个内源基因例如管家基因或前列腺tt特异性对照标志物或基因的组合。tt

  在一个实施方案中,内源对照标志物可包括一个或多个内源基因tt(即“内源对照基因”或“参比基因”),根据用于确定该标志物表达水平tt的方法,在被测试的具体样品(例如尿)中,以及当该样品/标志物进行tt多种处理步骤时,其表达相对稳定(例如在前列腺癌与非前列腺癌样tt品中,和/或在受试者之间不显著变化)。内源对照基因的表达稳定性tt可用例如软件(例如geNormTM)分析,该软件使用成对模型选择在样品tt间显示最小的表达比例变异的基因对。tt

  在另一个实施方案中,用于标准化的对照标志物可包括一个或多tt个前列腺特异性对照标志物例如PSA,其可用于例如对照或验证被测tt试的样品中前列腺细胞的存在。可包括的前体对照标志物的实例是能tttttt提供关于提供受试者的临床评估的信息的对照标志物,例如一个或多tt个用于确认或排除不同于前列腺癌的疾病/病症(例如非前列腺癌细胞tt增殖障碍)的对照标志物,如表7B所列的。tt

  在一个具体实施方案中,从尿样确定至少两个本发明的前列腺癌tt标志物的表达水平,该表达水平用一个或多个在尿中基本稳定(例如tt在来自患有或不患前列腺癌的受试者的尿液之间)的对照标志物标准tt化。在一个此类实施方案中,一个或多个对照标志物选自表2或表tt7-9中列出的那些。在另一个此类实施方案中,一个或多个对照标志tt物包括IPO8、POLR2A、GUSB、TBP、KLK3或其任何组合。tt

  前列腺癌评分

  在数据标准化后,对至少两个本发明的前列腺癌标志物的标准化tt表达水平进行数学关联以获得“评分”或“前列腺癌评分”,其用于提供tt受试者中前列腺癌的临床评估。在一个实施方案中,可从多个样品或tt子样品获得不同的评分,该样品或子样品可同时或在一段时期获得tt(例如在不同时间收集的尿或血液,或多个活检样品(例如多个个体活tt检核心))。不同评分可随后被比较以提供前列腺癌的临床评估。tt

  根据本发明,进行“数学关联”、“数学变换”、“统计方法”或“临床tt评估算法”指帮助将来自生物样品(例如尿)的至少两个标志物的表达tt水平与前列腺癌的临床评估(例如预测,例如前列腺癌活检的结果或tt评估进行前列腺癌活检的需求)相关联的任何计算方法或机器学习方tt法(或其组合)。本领域普通技术人员将认识到,可选择不同的计算方tt法/工具用于提供本发明的数学关联,例如逻辑回归、最高分值对、tt神经网络、线性和二次判别式分析(LQA和QDA)、朴素贝叶斯、随tt机森林和支持向量机。一些统计方法需要启动最终模型前在训练数据tt上调整的超参数。在贝叶斯统计中,超参数是先验分布的参数(例如tt层数、节点数或SVM中的C参数),其数值留待使用基本过程例如交tt叉验证的网格搜索人工调整。用于本发明的模型的参数,例如标准化tttttt的基因表达值或ΔCt的选择是通过逐渐向交叉验证的训练组添加由tt其区别性p值定义的最高评分基因,并在达到最大基因数或性能tt(AUC)停止提高时停止添加而完成的。tt

  如本文所用,术语“朴素贝叶斯(Naives Bayes)”指假设在基因Att的ΔCt和基因B的ΔCt之间没有协变性的计算方法。给予用于此种tt模型中的基因的不同权重被假设彼此独立且权重相等。参数直接从训tt练组估计,由每个类别所选基因的平均值和方差乘以代表两个类别的tt2组成。样品X属于类别Y的概率用高斯分布根据从训练组估计的tt平均值和方差估计。给定相应函数中的属性值a1;a2;…an,朴素贝tt叶斯方法选择最可能的分类Vnb(例如正常或肿瘤):tt

  Vnb(a1,a2,...,an)=argmaxvjvP(vj)ΠP(ai|vj)

  其中P(ai︱vj)通常用正态分布估计,其每个类别和基因的平均值tt和标准差从训练组估计如下:tt

  P(ai|vj)=12πσvj2e-(ai-μvj)22σvj2

  并且tt

  ai=基因i的ΔCttt

  vj=肿瘤或正常tt

  μvj=类别vj和基因i的平均值tt

  σvj=类别vj和基因i的标准差tt

  如本文所用,“线性判别式分析(LDA)”指计算方法,其是“二次判tt别式分析(QDA)”的子类。可从其推导出线性情况的二次型由2维(2-D)tt曲线组成,其中第一维度代表基因A的ΔCt,第二维度代表基因Btttttt的ΔCt。对于训练组中的全部样品,在该2-D曲线上坐标(基因A的ttΔCt,基因B的ΔCt)处,对于正常样品画“X”,对于肿瘤样品画“O”。tt目标是找到能分开“X”和“O”的二次函数ax2+by+c(其中“+c”只在线性tt型中出现)。此方程通过分别计算两个类别的基因A和基因B的平均ttΔCT以及每个类别的协方差矩阵获得。在线性判别式分析的情况下,tt对全部类别计算一个协方差矩阵而不是两个(例如每个类别一个)。此tt方法没有超参数。tt

  如本文所用的术语“随机森林(Random Forest)”指基于使用多个tt不同的决策树计算总体最多预测的类别(众数)的计算方法。在一个具tt体应用中,根据多少决策树预测该样品为肿瘤或正常,该众数是肿瘤tt或正常。由多数预测的类别(肿瘤或正常)被选作该样品的预测类别。tt用于此算法的不同决策树用随机产生的训练组的子组和随机选择的tt变量组训练。因此此算法依靠两个超参数:使用的随机树数量和用于tt训练不同的树的随机变量的数量。tt

  如本文所用的术语“支持向量机(SVM)”指与其他线性分类方法tt例如LDA不同,具有寻找最佳地区分两个类别(例如肿瘤和正常)的tt线,此线离任何训练点最远(最大边界)的目标的计算方法。该问题的tt定义导致了完全不同的具有有趣的概括性质(对未测试样品同样良好tt的性质)的费用函数。SVM有时与内核函数组合使用,后者以能简化tt样品的区分的方式转化数据(寻找区分样品的线)。如本文所说明,默tt认方案的原样使用数据的线性内核和用径向基高斯函数转化数据的tt高斯径向内核都可使用。在SVM方法中,错误标记的训练数据C和tt径向内核高斯函数的γ是超参数。上述超参数可用2-D网格搜索和交tt叉验证选择。tt

  在一个实施方案中,该数学关联可产生一系列输出临床评估值,tt其包括连续或接近连续的范围的值,例如如上文所说明的关于本发明tt的表达水平算法的。可选地,该临床评估算法可产生一系列的输出临tt床评估值,其包括一系列离散值。在一个具体实施方案中,该系列输tttttt出临床评估值是两个离散值,例如选自或临床上相似于以下的两个临tt床评估值:“是”和“否”;“低”和“高”;“存在”和“不存在”例如涉及癌tt症的存在;“未检测到前列腺癌细胞”和“检测到至少一个前列腺癌细tt胞”;“轻微”和“严重”例如涉及癌症的侵袭性;“可能”和“不可能”例如tt涉及癌症可能的复发或初始发病;以及其他与前列腺癌受试者的临床tt评估相关的两个水平的输出临床评估。当然,应当理解,其他此类两tt个临床评估值可由本领域技术人员使用本发明的方法和试剂盒容易tt地选择。tt

  在一个具体实施方案中,该临床评估算法产生一系列输出临床评tt估值,包括三个或更多离散值,例如与以下一个或多个相关的三个或tt更多值:癌症的侵袭性;未来治疗例如未来化疗的成功的预后;现有tt治疗例如现有化疗的成功的诊断和/或预后;未来癌症发病的可能性;tt癌症复发的可能性;和长期存活的可能性。在另一个实施方案中,该tt系列输出值是三个或更多离散值,例如选自例如选自或临床上相似于tt以下的值:侵袭性值例如无侵袭性、轻微侵袭性和极度侵袭性;未来tt发病或复发值例如未预计、中等可能性和强可能性;治疗成功值例如tt不可能、中等可能或非常可能;和其他与前列腺癌受试者的临床评估tt相关的多水平输出。多个离散值可以是如上所述的定性评估或定量范tt围例如0-100,其中最大和最小值代表临床评估值的界限。tt

  在另一个实施方案中,该临床评估算法可将本发明的前列腺癌标tt志物的(标准化的)表达水平与一个或多个阈值比较(例如以将其分为tt两个或更多离散的临床评估值)。在一个具体实施方案中,该阈值可tt允许分类为两个或更多涉及以下的离散的临床评估值:癌症的存在与tt否;癌症的侵袭性;癌症的分期;癌症的位置;Gleason评分;发生tt癌症的可能性,例如发生侵袭性癌症的可能性;治疗成功的可能性例tt如涉及一个或多个化疗药物的治疗;实现长期存活的可能性;以及其tt他临床评估值。例如,对具体化疗剂“可能响应”的第一临床评估值可tt对应低于第一阈值的前列腺癌标志物表达水平,对该化疗剂“中等可tt能响应”的第二临床评估值课对应高于第一阈值但低于第二阈值的前tttttt列腺癌标志物表达水平。因此,对该化疗剂“不可能响应”的第三临床tt评估值可对应高于第二阈值的前列腺癌标志物表达水平。tt

  在具体实施方案中,本发明的阈值优选地基于对来自具有确定的tt前列腺癌诊断的个体以及来自其他个体例如具有其他非前列腺癌疾tt病/病症和健康个体的样品(称为阳性和阴性“对照样品”或“训练样品”)tt的之前和可能现有的测试。通过测试已知的健康个体和具有确定的前tt列腺癌诊断的受试者确定前列腺癌标志物的表达水平允许临床评估tt算法识别一个或多个阈值的决定值,特别是其与确定前列腺癌的存在tt与否的阈值相关。阈值也可基于来自具有已知的以下一种或多种病史tt的受试者的对照样品的测试确定:癌症发病;存在高级别癌症;癌症tt复发;一种或多种具体疗法例如具体化疗剂临床成功;和其他已知临tt床结果。可选或额外地,阈值可通过测试来自根据本发明被测试的同tt一受试者的对照样品,例如在较早时间获得的样品而确定。优选地,tt测试此类对照样品以确定一个或多个阈值包括标准化检测到的前列tt腺癌标志物表达水平,例如用一个或多个对照标志物标准化。tt

  在其他实施方案中,该阈值可以是0的数量,例如其中该前列腺tt癌标志物的任何非0表达水平关联具体临床评估值,例如癌症的存tt在。该阈值可以是非0最小值,例如通过测试一个或多个本发明的对tt照标志物确定的值。在进一步的实施方案中,一个或多个阈值可分别tt用于确定两个或多个临床评估值。在一个备选实施方案中,两个或多tt个阈值可与本发明的前列腺癌标志物和/或对照标志物的标准化表达tt水平比较。在其他实施方案中,每个标志物可以是要相同或不同的阈tt值。tt

  前列腺癌的临床评估

  本发明的“评分”或“前列腺癌评分”(或不同评分的比较)为临床医tt生提供关于受试者中前列腺癌状态的信息。如本文所用,“临床评估”tt可包括患者的身体状况的评价和对前列腺癌的存在和/或严重程度及tttttt其进展的预测,以及根据常规病程预计的恢复前景,基于从体检和实tt验室检查和患者的病史收集到的信息。在不同实施方案中,前列腺癌tt的临床评估包括以下一个或多个:前列腺癌筛查、诊断、分期、预后、tt侵袭性确定、治疗计划、检测治疗响应、监控和其他前列腺癌临床评tt估。更具体地,该临床评估可代表以下一个或多个:诊断例如癌症筛tt查评估、分级评估或癌症侵袭性分类;预后例如治疗计划评估、癌症tt发病预后(包括该癌症侵袭性之间的分化)、癌症复发预后、疗法效力tt预后、长期存活预后;其他前列腺癌受试者或潜在前列腺癌受试者的tt临床评估;及其任意组合。在另一个实施方案中,该临床评估可包括tt提供分层或以其他方式区分的良性前列腺增生(BPH)或一种或多种细tt胞增殖障碍例如前列腺癌;前列腺上皮内瘤(PIN)和小腺泡增殖(ASAP)tt的评估。在另一个实施方案中,该临床评估可用于确定前列腺癌治疗tt的临床疗程,包括但不限于:观察(观察性等待);手术例如根治性前tt列腺切除术;放疗例如外部光束辐射或近距放疗;药物或其他剂治疗tt例如激素治疗或化疗;睾丸酮降低治疗例如通过药物或手术移除睾丸tt及其组合。tt

  在一个实施方案中,本发明的临床评估可转移或以其他方式提供tt给不同于进行该测试的实体的实体,例如由临床实验室改进修正案tt(CLIA)实验室将临床评估提供给医院或医生办公室。在具体实施方案tt中,该临床评估可以一种或多种交流方式提供,包括口头、电子和实tt体形式。在一个优选的实施方案中,该临床评估以纸和/或电子形式tt提供,例如通过有线或无线通讯方式例如因特网提供的电子形式。除tt了临床评估,也可提供本发明表5和表6A的前列腺癌标志物以及表tt6B的共调控标志物的表达水平。在另一个实施方案中,可提供由本tt发明的数学关联产生,用于分类表5或表6A中列出的前列腺癌标志tt物的表达水平的评分。在另一个实施方案中,该临床评估可允许或包tt括筛查有高风险患前列腺癌的,或被诊断为局部疾病和/或转移的疾tt病,和/或与该疾病遗传上相关的个体。在另一个实施方案中,本发tt明可用于监测正在或已经接受原发前列腺癌治疗的个体以确定癌症tttttt是否转移。在另一个实施方案中,本发明可用于监测正在或已经接受tt原发前列腺癌治疗的个体以确定癌症是否被消除。上述用途都包括在tt提供临床评估的范围内。tt

  在另一个实施方案中,本发明可用于监测以其他方式易感的个tt体,即被识别为遗传上倾向于患前列腺癌的个体(例如通过遗传筛查tt和/或家族病史)。对遗传学的理解的进步和技术/流行病学的发展允许tt改善的关于前列腺癌的概率和风险评估。使用家族健康史和/或遗传tt筛查,可估计特定个体具有的发生某种类型的癌症(包括前列腺癌)的tt概率。此类个体被识别为倾向于患特定形式的癌症,可被监测或筛查tt以检测前列腺癌的证据。在发现此类证据后,可进行早期治疗以对抗tt该疾病。因此,可识别具有发生前列腺癌的风险的个体,并可从此类tt个体获得样品。在另一个实施方案中,本发明也用于监测被识别为具tt有包括患有前列腺癌的亲属的家族病史的个体。同样,本发明也用于tt监测被诊断为患有前列腺癌的个体,特别是被治疗并移除肿瘤和/或tt以其他方式经历减轻的个体,包括被治疗前列腺癌的个体。此外,在tt另一个实施方案中,本发明可用于监测被诊断为患有前列腺癌的个tt体,更具体地,在接收该疾病的治疗前被密切监测疾病进展的个体。tt上述用途都包括在提供临床评估的范围内。tt

  在另一个实施方案中,根据本发明的前列腺癌临床评估还允许或tt包括确定在提供该临床评估后将给予受试者的具体或更适合的疗法。tt适用的疗法包括但不限于:手术(例如前列腺切除);肿瘤破坏疗法(例tt如冷冻疗法);放疗(例如近距放疗);和药物和其他剂疗法(例如化疗tt和激素疗法)。tt

  试剂盒和组合物

  在各种实施方案中,可在本发明的范围内考虑多种试剂盒配置。tt试剂盒可包括如本文所述的一个或多个组分、物质或设备零件。本发tt明还包括用作上述试剂盒的组分的试剂和组合物。在其他实施方案tttttt中,本发明涉及诊断组合物,包括用于检测本发明的前列腺癌签名的tt试剂。在具体实施方案中,该诊断组合物还包括从其提取的尿、血、tt组织或核酸。tt

  在一个实施方案中,该试剂盒或组合物可包括至少一个与以下一tt个或多个杂交的寡核苷酸(例如探针或引物):tt

  (1)根据本发明的前列腺癌标志物的核酸序列;tt

  (2)编码本发明的前列腺癌标志物蛋白的多核苷酸;tt

  (3)与(1)或(2)完全互补的序列;或tt

  (4)在高严格条件下与(1)、(2)或(3)杂交的序列;tt

  在另一个实施方案中,本发明涉及试剂盒或组合物,包括允许检tt测至少两个本发明的前列腺癌标志物(例如RNA标志物)的试剂。tt

  在另一个实施方案中,本发明的试剂盒优选地包括用于运送样品tt的容器,例如用于运送尿或血的容器。tt

  在另一个实施方案中,本发明的试剂盒或组合物优选地也包括至tt少一个与以下一个或多个杂交的寡核苷酸(例如探针或引物):tt

  (1)根据本发明的对照标志物的核酸序列;tt

  (2)编码本发明的对照标志物蛋白的多核苷酸;tt

  (3)与(1)或(2)完全互补的序列;或tt

  (4)在高严格条件下与(1)、(2)或(3)杂交的序列。tt

  应当理解,可在不背离本申请的精神或范围的前提下使用本文说tt明的方法、试剂和组合物的多种其他配置。上述方法的部分可单独地tt视作独特的发明。考虑本文公开的说明书和本发明的实施,本发明的tttttt其他实施方案对于本领域技术人员而言是明显的。预期本说明书和实tt施例仅视为示例性的,本发明的真实范围和精神由权利要求书指出。tt此外,尽管本申请以具体顺序列出了方法或过程的步骤,在某些情况tt下改变一些步骤实施的顺序和/或组合一个或多个步骤是可能或者甚tt至有利的,并且本文说明的方法或过程的具体步骤不意欲被解释为顺tt序特异性的,除非在权利要求书中清楚地说明了这种顺序特异性。tt

  表1tt

  选择用于基因表达谱分析的候选标志物列表tt

  表2tt

  供基因表达标准化而评价的内源对照标志物列表tt

  表3Att

  全尿样品种候选标志物的表达特征tt

  表3Btt

  尿沉淀物中候选标志物的表达特征tt

  表4Att

  全尿样品中前列腺癌多基因签名的性能特征tt

  表4Btt

  确认前列腺细胞存在的尿样中前列腺癌多基因签名的性能特征tt

  表10:序列表tt

  通过以下非限制性实施例进一步详细说明本发明。tt

  实施例1

  全尿样品的基因表达谱分析

  我们确定了在患有或被怀疑患有前列腺癌的男性全尿样品中基tt因表达谱分析的技术可行性。在进行经直肠超声引导的前列腺活检前tt从进行了直肠指检(DRE)的90位男性收集尿样,活检的结果被用于将tt受试者分为两组:(1)患前列腺癌的男性;和(2)不患前列腺癌,有或tt没有良性前列腺症状的男性。活检结果用于将受试者分配如上述两组tt其中一个。良性前列腺癌症状包括:良性前列腺增生(BPH)、高级别tt前列腺上皮内瘤(HG-PIN)、非典型小腺泡增殖(ASAP)和/或非典型前tt列腺细胞(Atypia)。在所有情况下,样品的分类或分层基于病理学家tt评估的活检的解释。在根据活检结果分层后,45个尿样被鉴别为来tt自患有前列腺癌,具有确认的阳性活检的男性,45个尿样被鉴别为tt来自具有阴性活检结果的男性。tt

  在活检前,由医生对受试者进行了细心的DRE,医师被指示进tt行15至30秒的彻底的前列腺触诊。在DRE后,收集最初的20至tt30mL排出的尿并与等体积的含硫氰酸胍的缓冲液混合。从该全尿样tt品基于离液剂的变性性质提取了总RNA,将核酸与二氧化硅颗粒结tt合,最后用缓冲的水洗脱。tt

  基因表达水平用RT-qPCR使用基因表达测定(Applied ttBiosystems)测量。基于其在前列腺或前列腺癌细胞中报道的表达预先tt选择了一组候选标志物。用于本研究的基因表达谱分析的候选标志物tt的列表在表1中给出。所有测定都选择进行标准基因表达实tt验,因为它们可检测到目的基因的最大转录物数而不检测具有相似序tt列的基因产物,例如同系物。大部分测定设计跨过外显子-外显子结tt合处,靶标短扩增子而不检测脱靶序列,因而增加PCR反应的效率tt和特异性。根据用NCBI的Entrez SNP数据库对每个测定的评估,发tttttt现对于本研究使用的一些测定,单核苷酸多态性(SNP)位于某些探针tt或引物序列下。每个相关的SNP的参考序列(RS)编号也列于表1。tt

  使用从全尿样品提取的核酸和High-Capacity Archive试剂盒tt(Applied Biosystems,Foster City,CA),用随机六聚体作为引物将约tt20μL RNA转录为单链cDNA,终体积为100μL,如制造商的实验方tt案所述。对表1中列出的每个候选标志物,按制造商的推荐用5μL 1:tt10(v/v)稀释于不含DNA酶/RNA酶的水中的cDNA反应物、ttFast Advanced Master Mix(Applied Biosystems)和基tt因表达测定(Applied Biosystems)以20μL的终体积在7900HT快速ttPCR系统(Applied Biosystems)上进行定量实时PCR(qPCR)反应。在全tt部qPCR反应中用两份外源性内部阳性对照(VIC探针)作为tt内部阳性对照(IPC)以区分由于没有靶标序列而被鉴别为阴性的样品tt和由于PCR抑制剂存在而被鉴别为阴性的样品。tt

  原始数据用仪器的Sequence Detection System(SDS)软件记录。对tt每个候选前列腺癌标志物确定循化阈值(Ct)。此外,根据ΔCt方法计tt算标准化的基因表达值,其中计算每个前列腺癌标志物的Ct和表2tt中列出的5个对照标志物(即HPRT1、TBP、IPO8、POLR2A和GUSB)tt的平均Ct值的差值。数据被标准化以修正可能的技术变异和每个ttPCR反应中RNA完整性和量的偏差。在正常和前列腺癌受试者之间tt比较标准化的基因表达值。对每个单独的前列腺癌标志物,非癌症和tt癌症受试者之间平均表达值的差异(ΔCt)列于表3A中。根据非癌症和tt癌症受试者之间基于t检验的变化显著性将前列腺癌标志物排序。ptt值<0.05视作统计学上显著的。发现最高评分的前列腺癌标志物ERG、ttPCA3和CACNA1D在来自患有前列腺癌的受试者的全尿样品中比来tt自不患前列腺癌的受试者的样品中高度过表达。tt

  除了基本表达谱分析,用接受者操作特征曲线下面积(以下称为ttAUC和ROC曲线)分析了单个前列腺癌标志物的性能以识别与全尿tt样品中存在前列腺癌细胞相关的基因。表3A提供了全尿样品的性能tttttt特征。可以看到,根据标准化表达,最高评分的基因也是最佳地区分tt尿样来自非前列腺癌受试者还是前列腺癌受试者的基因。tt

  实施例2

  尿沉淀物的基因表达谱分析

  对来自77名受试者,在DRE后获得的尿样重复了实施例1中所tt述的研究并用定量RT-PCR分析了表1中所列基因,不同之处在于没tt有使用全尿,而是在核酸提取前将尿样离心以沉淀细胞。整个过程在tt临床离心机以2,500rpm进行了约15分钟。然后按实施例1中所述提tt取了获得的含有来自泌尿生殖道的上皮细胞尿沉淀物。表3B提供了tt各个基因的正常受试者和癌症受试者平均标准化表达值以及基于ttROC曲线分析的性能特征。与前列腺癌细胞的存在显著相关的基因tt被上调或下调。确定了表达水平在正常受试者和前列腺癌受试者之间tt显著不同的基因可用于预测个体中癌症的存在或癌症的发展。tt

  实施例3

  用于研究与前列腺癌显著相关的基因的机器学习方法

  在此,我们用机器学习方法分析了来自实施例1的90个全尿样tt品的标准化基因表达数据以根据其区分前列腺癌患者和非前列腺癌tt个体的能力选择和加权单个基因、基因对或成组基因。有多种不同的tt组合单独地最佳分离大量数据源的基因的方法,其中一种是根据预先tt选定的基因子集设计类别预测(也称为分类器)。我们用一组通过取两tt个ΔCt的最大值(例如"maxERG CACNA1D")或通过两对基因的ΔCttt相减(例如ERG-SNAI2)获得的成对基因特征补充了该组单个基因特tt征。尽管实施例1和2中发现了一些选定基因与癌症和/或前列腺的tt联系,其与前列腺癌标志物PCA3的联系未被先前记载。tt

  我们选择了5个机器学习算法:朴素贝叶斯、线性判别式分析tt(LDA)、二次判别式分析(QDA)、随机森林、使用径向和线性内核的tttttt支持向量机(SVM)。上述不同的机器学习算法都在本领域普遍认可并tt广泛使用,但其设计差别足够显著以允许我们覆盖大范围的数学模tt型,确保我们找到至少一个最佳模型。通过用机器学习算法对含有一tt组候选标志物的标准化的基因表达值(例如ΔCt)的数据组训练计算模tt型,我们能够定义能提供前列腺癌临床评估的多基因签名,其中调整tt了最佳参数以实现最佳临床性能。tt

  为评估该模型的性能,使用了双样品移除交叉验证。简言之,从tt数据组移除一个癌症和一个非癌症样品,对其余的数据组训练模型的tt参数。在训练期后,将该模型应用于取出的样品。使用交叉验证,由tt于测试模型的样品未被用于训练,能获得该多基因签名性能的无偏估tt计。此交叉验证步骤的结果是交叉验证的接受者操作特征(ROC)曲tt线,我们能计算该ROC曲线下面积(AUC)。表4A说明了每个多基因tt签名的最高评分的机器学习算法及其相应的临床性能。使用ΔCt方法tt基于选自表2的5个内源对照基因的平均表达值的数据标准化允许我tt们用机器学习算法产生多基因签名。我们观察到随机森林和朴素贝叶tt斯分类器代表了两个最佳性能的机器学习方法。AUC与PCA3比PSAtt的比例相比的变化也被定量,用DeLong检验产生了p值。p值<0.05tt视作提供最佳总体检验的统计证据。tt

  总共发现了53个优于PCA3比PSA测试的多基因前列腺癌签名,tt一些签名使用少至两个前列腺癌标志物(表4A)。使用同样的方法,我tt们将选择的机器学习算法应用于包括全尿样品和尿沉淀物,具有由ttKLK3基因表达水平评估确认前列腺细胞存在的一组样品(表4B)。此tt分析的结果用于验证通过使用机器学习算法产生的选择的前列腺癌tt签名能准确地提供含有不一定来自前列腺癌细胞的污染前列腺细胞tt背景的生物样品(例如全尿或尿沉淀物)中前列腺癌的临床评估。tt

  表5提供可在多种前列腺癌签名中作为前列腺癌标志物的25个tt单个基因的列表。有趣的是,我们观察到KRT15、ERG、CACNA1Dtt和LAMB3在最高评分的前列腺癌签名中反复存在。tt

  实施例4

  前列腺组织中选定基因的表达谱分析

  在快速改变的技术环境中开发诊断测定是有挑战性的。存在能区tt分正常、良性和恶性前列腺组织和预测前列腺癌的范围和恶性的新标tt志物的紧迫需求。尽管基于尿的标志物可能对活检前筛查特别需要,tt在经活检的前列腺组织或手术切除的前列腺中的基因表达评估也可tt用于诊断和预后前列腺疾病。因此,本研究用定量RT-PCR考察了参tt比(表2)和前列腺癌相关基因(表6A)构成的一组36个基因的基因表达tt水平。本研究总共使用了9个来自前列腺切除物;5个来自正常组织tt和4个来自前列腺癌组织的样品。样品的分类基于由病理学家评估的ttGleason评分、TNM分期系统和肿瘤相关百分比的解读。用20份重tt悬于1mL试剂(Invitrogen,Carlsbad,CA)的5μm从新鲜冷冻tt的前列腺组织提取RNA。核酸(RNA和少量DNA)的提取按制造商的tt建议提取并重悬于60μL不含DNA酶/RNA酶的水中。tt

  提取的核酸的量和质量用Quant-iTTM RNA测定试剂盒(Invitroge ttn,Carlsbad,CA)和NanodropTM ND-1000分光光度计(Thermo Scien tttific,Wilmington,DE)评估。使用最少250ng从前列腺组织提取的tt核酸和用随机六聚体作为引物的High-Capacity Archive试剂盒(Appli tted Biosystems,Foster City,CA),将RNA转录为单链cDNA,终体tt积为50μL,如制造商的实验方案所述。基因表达水平使用基因表达测定测量。如表2和表6A中列出的,准备两份,和TaqMtt外源性内部阳性对照一起按制造商的推荐用5μL 1:10(v/v)稀释tt于不含DNA酶/RNA酶的水中的cDNA反应物、Fast Adva ttnced Master Mix(Applied Biosystems)和基因表达测定(Appl ttied Biosystems)以20μL的终体积在7900HT快速PCR系统(Applied ttBiosystems)上进行定量实时PCR反应。所有分析对用来自5个参比tt基因(HPRT1、TBP、IPO8、POLR2A和GUSB)的平均Ct值标准化的tt基因表达水平进行。tt

  对每个单独的基因,正常组织和前列腺癌组织之间平均表达值的tt差异(ΔCt)列于表6A中。根据正常受试者和癌症受试者之间基于Stu ttdent's T-检验的变化显著性将基因排序。基本表达谱分析显示同源异tt型盒家族的成员HOXC6和HOXC4在前列腺癌中被上调。同源异型tt盒基因是一个相似基因的大家族,其在早期胚胎发育中指导许多身体tt结构的形成。同源异型盒家族的基因在发育中参与多种重要活性,在tt培养的细胞中,其表达促进细胞转化。也观察到CRISP3、TDRD1和ttPCA3表达的差异,但差异不显著。此外,也发现多个基因在前列腺tt癌组织中被显著地下调。其中有多个已知的前列腺癌相关基因,例如ttTRIM29、EFNA5和LAMB3。参与上皮细胞中原癌基因转化的转录tt抑制因子SNAI2也被发现在前列腺癌中显著下调。tt

  因此,我们提供其表达水平能区分前列腺癌、正常前列腺组织和tt良性前列腺症状的基因的子集(或分类器)。也观察到基因通常共同作tt用,其表达可被以协调的方式共调控,此过程也称为共存(或共调控)。tt为疾病过程例如癌症鉴别的共调控的基因可作为肿瘤状态的生物标tt志物,因此可代替与其共表达的测定基因或与与其共表达的测定基因tt共同使用。用含有来自150个患有前列腺癌的患者的log2全转录物m ttRNA表达值的公共数据组(GSE21032)进行了26个选择的与前列腺癌tt存在相关的基因的相互排斥和共表达分析(表6B)。用Hum ttan Exon 1.0 ST Array(Affymetix,Santa Clara,CA)进行原发和转移tt前列腺癌组织的基因表达谱分析。tt

  某些癌症基因以共存或相互排斥的方式在肿瘤发生中起作用。在tt此,一个目标是鉴别在多个患者中上调或下调,属于相同的生物过程,tt例如癌症发生和发展的成组的相关基因。基本原理是被相似途径调控tt的基因应当比在预先配置的根据多种相似性的测量类别的成组基因tt中预期的更频繁地共存。因此,预期其表达被相似的信号调控的基因tt在不同的基因表达签名中显著地共存,并与不同的生物途径形成强相tt关的网络。显示此类性质的成组基因极可能驱动癌症发展。可通过ttcBio癌症基因组学入口(http://cbioportal.org)获得的算法计算所有基tttttt因对之间的相互排斥或共存,通过对各个基因对进行Fisher精确检tt验,产生所有靶标基因的p值的二元矩阵(表6B)。使用此方法,单个tt基因以及整个签名可分配到途径例如癌症发生和发展,其中基因签名tt的组成完全由与途径分配一致的共同基因组特征确定。在此过程后,tt我们鉴别了两对基因FLNC:TAGLN和HOXC4:HOXC6,其表现tt统计学上显著的强共存倾向,p值<0.00001。大量基因也显示了显著tt的共存倾向。例如,其中一个最高评分基因CRISP3被发现与9个其tt他基因共表达。观察到的对CRISP3最强的相关是TDRD1、ERG和ttCACNA1D(全部p值<0.001)。尽管在癌症组织中只是少量下调,参tt与雄性激素代谢途径的SRD5A2基因是最普遍的共调控基因之一,被tt发现与18个测试的其他基因显著地共表达。在搜索相互排斥成组基tt因时,只发现6个具有强相互排斥倾向的基因。PCA3/KLK3基因对tt有最高的相互排斥p值(p=0.0045)。其他两个高评分对包括ERG:ttHOXC6(p=0.02)和OR51E1:RASSF1(p=0.018)。tt

  实施例5

  用于准确标准化尿样中大量基因表达数据的基因的选择

  为最小化误差和样品间变异,来自定量RT-PCR的基本表达谱分tt析通常基于具体核酸序列与内部标准物的相对定量进行。使用ttRT-qPCR平台或其他相关扩增方法的相对基因表达精确和准确的标tt准化需要评估临床样品中稳定的对照标志物。用于与前列腺癌标志物tt结合使用检测患者样品中前列腺细胞的内源对照标志物应当理想地tt具有不受组织或血液中癌细胞的存在显著影响的表达,以及在取自不tt同个体的样品中或在胁迫因素例如碱性条件下具有相似的行为。tt

  为鉴别在可含有前列腺细胞的样品中具有稳定表达适当的对照tt标志物,确定了来自的152个非前列腺癌受试者、109个前列腺癌受tt试者的全尿样品和9个冷冻前列腺组织(5个非癌症,4个癌症)中10tt个候选内源参比基因的表达。RT-qPCR按上文实施例1中说明的进tttttt行,每个反应板包括使用市售可得的人通用RNA(Clonetech)的外源对tt照反应。tt

  理想的参比基因应当在来自前列腺癌和非前列腺癌受试者的尿tt样中维持恒定的表达。表达稳定性用geNormTM软件分析。大体上,ttgeNormTM使用逐对比较模型选择在样品中显示最小表达比例变异的tt基因对。该软件为每个内源参比基因计算基因稳定性度量(M)。图1tt说明了一些测试的基因的M值。两个基因(IPO8和POLR2A)显示了tt低于geNormTM默认阈值1.5的M值。尽管选择的参比基因具有变化tt的M值,其在前列腺癌中的表达本身不被去调控。此外,尽管POLR2Att和IPO8被鉴别为最稳定的基因对,TBP和GUSB在尿样中显示了其ttmRNA表达更少的变化(图1)。tt

  对于RNA表达标准化,在定量PCR中使用单个基因是标准实践。tt然而,我们的研究发现参比基因表达可相当大地改变。这说明使用多tt个参比基因可提高相对定量研究的准确性。因此,需要鉴别用于待测tt试的样品(例如尿)的适当的对照标志物的组合。为确定定量PCR标准tt化所需的最佳参比基因数量,geNorm软件对每个依次增加数量的参tt比基因计算了逐对变异V。图2A说明了由geNorm软件计算的逐对tt变异的曲线。geNorm V值0.3用作确定最佳基因数量的阈值。此分tt析显示,在使用的条件下,在使用提取自全尿样品的RNA时,内源tt参比基因的最佳数量是4个(POLR2A、IPO8、GUSB和TBP)(图2A)。tt

  例如,列于表2中的对照标志物在癌症前列腺组织中与非癌症前tt列腺组织相比未显示显著不同的表达水平,其表达在取自不同患者的tt相同组织类型中也非常地恒定(图2B)。尽管一个或多个基因的基因表tt达谱分析通常在组织样品中测量,改变的基因的表达水平也可在从远tt离原发肿瘤组织的位点,例如远侧器官、循环肿瘤细胞和体液(例如tt尿、精液、血和血级分)收集的细胞中测量。为此目的,我们用由来tt自10个人细胞系的总RNA组成的人通用RNA进一步评估了源自不tt同于前列腺的其他恶性肿瘤的细胞系中的参比基因表达水平。此人通tttttt用RNA被设计用于基因谱分析实验。tt

  除了上述4个内源参比基因,需要使用特异于前列腺细胞的标志tt物,例如PSA(也称为KLK3)以对照源自样品中前列腺细胞的核酸的tt存在。为证明使用前列腺特异性标志物用于尿样中基因表达数据标准tt化的可能性,在男性泌尿生殖道肿瘤和非肿瘤组织中鉴别了列于表2tt中的(5)个前列腺特异性对照标志物的组织特异性(图2C)。全部基因tt显示了在前列腺组织中比测试的全部其他组织高数个数量级的表达tt水平。此类前列腺特异性对照标志物的高特异性允许识别源自非前列tt腺细胞中前列腺上皮细胞的核酸的存在。因此,此类前列腺特异性对tt照标志物可代替PSA(也称为KLK3)或与其共同用于样品可含有来自tt非前列腺细胞的核酸的基因表达水平标准化。tt

  因此,第二步是测试不同的标准化方法并评估各个前列腺特异性tt对照标志物对AUC的影响。我们测试了用4种不同方法的标准化:tt(1)使用外源内部阳性对照双份PCR的Ct(“Exo”);(2)使用5个内源参tt比基因的平均值(“平均Endo”);(3)使用PSA(“PSA”);和(4)同时使用ttPSA和外源内部阳性对照(“Exo+PSA”)。通过将单个标志物的分类的ttAUC作为不同标准化方法的函数在图3中画图,我们验证了性能的tt差异。水平线对应95%预期随机性能,表示高于此线的全部标志物具tt有显著高于随机预测的性能。使用此类条件,我们观察到在测试大量tt基因表达数据组(例如150个基因或更多)时,使用(5)个内源参比基因tt的平均值的方法对单个基因给出了更可再现的AUC。tt

  实施例6

  根据用RT-qPCR分析的全尿样品(包括来自正进行治疗的患者的尿)验证前列腺癌分类器

  列于表5中的前列腺癌标志物的选择基于t检验p值的不同阈值tt和ROC曲线下面积(AUC)。AUC用作性能度量以确定基因是否有与tt来自尿样的前列腺癌临床评估正或负相关的表达模式。在建立基因子tttttt集后,用贝叶斯规则组合最佳前列腺癌标志物(根据从尿样中前列腺tt癌的检测排序)。为验证用第一方法定义的多基因前列腺癌签名,我tt们组合了两个数据组以评估选择数量的多基因前列腺癌签名的性能,tt随机分配的样品组作为训练组,其余样品作为验证组。用174个全尿tt样品(包括73个来自前列腺癌受试者患者的样品和101个来自非前列tt腺癌受试者的样品)训练获得的朴素贝叶斯分类器随后被用于预测生tt物样品中前列腺癌的可能性。给定属性值a1;a2;…an,该朴素贝叶tt斯分类器选择最可能的分类Vnb(例如正常或肿瘤)。在此实例中,Vnb可以是肿瘤或正常,属性值ai代表对应由RT-qPCR提供的标准化的tt基因表达水平(ΔCt)的真实值。这导致相应的分类器:tt

  Vnb(a1,a2,...,an)=argmaxvjvP(vj)ΠP(ai|vj)

  我们通常用正态分布估计P(ai︱vj),其每个类别和基因的平均μvj值和标准差σvj从训练组估计如下:tt

  P(ai|vj)=12πσvj2e-(ai-μvj)22σvj2

  其中tt

  ai=基因i的ΔCttt

  vj=肿瘤或正常tt

  μvj=类别vj和基因i的平均值tt

  σvj=类别vj和基因i的标准差tt

  例如,对于5基因朴素贝叶斯分类器,我们需要从训练组估计tt2×5×2(代表平均值和标准差)=20个参数。在应用此类机器学习算法tt时,强烈建议加入交叉验证步骤,因为在一些情况下,算法可良好分tt类训练组中的样品,但在独立的测试组中产生较差的结果。这一现象tttttt称为过拟合。为在模型选择中避免过拟合,前列腺癌标志物的选择用tt训练组内20个重复的10倍交叉验证进行。对于本分析,我们使用了tt“取出两个”交叉验证,其涉及移除一个癌症样品和一个非癌症样品以tt训练该算法,然后用该取出的样品回测。不同模型的性能用AUC比tt较。用200个重复选择参数数量以最大化AUC,最小化批次间随机tt变异。对训练组计算得到最高平均交叉验证的AUC的参数鉴别为最tt佳参数。用作朴素贝叶斯参数的真值是前列腺癌标志物的标准化表达tt水平(ΔCt)或从一对基因计算的参数。例如,分类器3包括基因对作tt为朴素贝叶斯参数。在此具体实例中,ERG-SNAI2参数代表在测试tt的全体中最上调的基因ERG和最下调的基因SNAI2之间的差异表tt达,通过从ERG的ΔCt值减去SNAI2的ΔCt值计算。在另一个分类tt器中,朴素贝叶斯参数是从由共调控的基因ERG和CACNA1D组成tt的集合中选择的最过表达的基因,在本文中在分类器4中称为ttmaxERG CACNA1D。tt

  最后,在训练组合格的选择的分类器应用于验证组中的87个生tt物样品。表7A说明了在来自患有或被怀疑患有前列腺癌的男性的174tt个全尿样品的训练组和87个全尿样品的验证组中18个前列腺癌签名tt性能特征。我们使用DeLong检验验证在训练和验证组中从给定的分tt类器观察到的AUC与PCA3/PSA比例相比的差异。也对由活检样品tt中高Gleason评分定义的前列腺癌侵袭性分析了每个个体的性能。与ttGleason评分相关的p值列于表7A中。所有选择的用此方法产生的tt多基因签名能根据前列腺癌的存在与否显著地区分受试者(图4A-F)。ttAUC评分说明该18个前列腺癌签名在训练组和验证组中能多准确地tt相对全部其他症状检测前列腺癌。tt

  在本文中,我们评估了3个不同的标准化方法,其中前列腺特异tt性标志物例如PSA用作对照标志物以标准化与尿样中前列腺上皮细tt胞的存在相关的基因表达数据。我们的结果表明增加标准化基因的数tt量提高分类器的总体性能(表7A)。如实施例5中所述,不同于PSAtt的前列腺特异性标志物可用于标准化步骤,以对照源自样品中前列腺tttttt细胞的核酸的存在。表7B说明了选择的使用不同于PSA的前列腺特tt异性对照标志物的分类器的性能特征。接受者操作特征(ROC)曲线的tt分析确认了将该前列腺特异性对照标志物加入其它对照标志物而获tt得的提高的诊断准确性(表7B)。tt

  我们也是想验证本发明的前列腺癌分类器也能用于正在进行不tt同于前列腺癌的良性症状,例如BPH的治疗的男性群体中。因此,tt对51个服用5-α-还原酶抑制剂,例如度他雄胺(AvodartTM)或非那雄tt胺(ProscarTM、PropeciaTM),或者α-1肾上腺素受体拮抗剂例如坦索罗tt辛(FlomaxTM)或阿夫佐辛(XatralTM)的个体的组进行了ROC曲线分析。tt表8提供了使用来自14位具有确认的前列腺癌的患者的尿样与来自tt非前列腺癌受试者的37份样本相比的前列腺癌分类器的性能特征,tt所有受试者都正在服用BPH药物。为比较目的,提供了来自相似的tt已知不服用BPH药物的队列的结果。该18个前列腺签名的性能特征tt在服用BPH药物的组优于已知不服用BPH药物的队列。tt

  据文献报道,BPH药物(例如5-α-还原酶抑制剂)能降低发生前列tt腺癌的概率。BPH药物的这一可能的额外效果可解释选择的分类器tt在此队列中与未服用BPH药物的个体相比较好的整体性能。上述结tt果说明在服用BPH药物的男性中用本发明的基因签名筛查前列腺癌tt是防止前列腺癌发生的实用的方法。tt

  此外,通过进一步估计其致命性前列腺癌的风险,从而指导治疗tt决定以改善结果并减少过度治疗,该签名似乎也在Gleason7的男性tt中有临床应用。用来自以下的全尿样品进行了比较:(1)非前列腺癌受tt试者;和(2)具有最高Gleason评分(≥7)模式的前列腺癌受试者。用此tt204个尿样子集分析了该18个前列腺癌签名的每一个。表9提供了tt使用朴素贝叶斯算法的前列腺癌分类器在来自52名Gleason评分≥7tt的患者的全尿样品与来自非前列腺癌受试者的152份样品相比的性tt能特征。使用与上述相同的实验设置,每个分类器能根据尿样分析准tt确地区分具有高Gleason评分(≥7)的癌症受试者和非前列腺癌受试tttttt者。增加标准化基因的数量也增加了该分类器的整体性能。tt

  表9也提供了前列腺癌分类器在个体子集中的性能特征,其中该tt测试用在DRE后,但在第一次活检前收集的最初的20至30mL排出tt的尿进行。总共筛查了220个个体,122具有随后的阴性活检结果,tt而98个具有前列腺癌的确诊。重要的是,全部分类器能准确地识别tt具有增加的具有第一个阳性活检结果风险的患者,其性能特征列于表tt9。tt

  实施例7

  与前列腺癌存在显著相关的基因的预后能力

  对于一些应用,不仅基于概率评分诊断受试者中癌症的存在,而tt且能使用该评分预测受试者治疗后的结果可以是有用的。如实施例6tt中所述,某些分类器中选择的一些前列腺癌标志物与高Gleason评分tt相关(表7A和表9),因此可用于预测疾病发展和不良结果。因此,我tt们选择从(5)个分类器选择了一个子集的基因并通过测试进行了根治tt性前列腺切除术的前列腺癌受试者测试它们是否具有预后能力。我们tt使用了含有来自150个前列腺癌组织样品的基因表达数据的公共数tt据组(GSE21032)测试此子集的基因的基因表达水平改变是否与增加tt的发生侵袭性癌症的风险相关,因而与不良结果相关。每名受试者的tt基因表达数据用Human Exon 1.0 ST Array(Affymetix,Santa ttClara,CA)产生,包括对每名受试者的临床数据注释。我们根据5个tt选择的与前列腺癌的存在相关的基因签名通过cBio癌症基因组学入tt口(http://cbioportal.org)进行了无疾病存活分析。作为说明性实例,图tt5A展示了两个包括于分类器1的前列腺癌标志物的OncoPrintTM。在tt此情况下,我们观察到,此分类器内基因的mRNA表达改变在超过tt50%的病例中存在。该入口也支持存在于该分类器的基因与被报道属tt于共同途径的基因之间的网络相互作用的可视化(图5B)。tt

  图5-9的C部分展示了前列腺切除后无疾病存活的卡普兰-梅尔tttttt曲线。对每个选择的分类器,根据mRNA表达Z值,在基因表达改tt变的受试者中与基因未改变的患者相比进行无疾病存活分析。全部5tt个分类器能预测具有改变的mRNA表达的患者中更差的存活。对该5tt个测试的分类器,基因在至少一半的病例中改变,其中一些分类器在tt150个前列腺癌患者中有超过100个具有改变的基因表达的病例。总tt体上,在这些分类器中选择的基因集合在前列腺癌中被上调或下调,tt是前列腺切除后结果的有用的预测工具。本发明强调和证明了基于选tt择的多基因签名的诊断方法,以及作为改进的前列腺癌预后和治疗分tt层的工具的潜在价值。tt

  因此,本发明的分类器和签名不仅涉及前列腺癌的诊断,也涉及tt预后、级别确定、患者结果等。因此,本发明的分类器和签名是前列tt腺癌的极有力的临床评估工具。tt

  实施例8

  合并PCA3标志物的前列腺癌多基因签名的性能特征

  使用如上所述的相同的实验设置,进行了一系列实验以确定将ttPCA3标志物加入本发明的没有PCA3的前列腺癌多基因签名中对性tt能特征的影响。性能标准是ROC曲线下面积(AUC),其中ROC曲线tt是灵敏性作为特异性的函数的曲线。AUC量度分类器在不影响具体tt阈值的情况下监测灵敏性/特异性权衡的良好程度。对此测定,我们tt使用了分类器3(类别3;表7A)多基因签名和5个对照标志物(IPO8、ttPOLR2A、GUSB、TBP、KLK3)以评估加入PCA3标志物的影响。两tt个方法之间的区别只是将PCA3非编码RNA作为已知前列腺癌标志tt物加入该多基因签名以预测生物样品中前列腺癌的可能性。tt

  出乎意料的是,我们的结果证明将PCA3非编码RNA加入本发tt明的前列腺癌分类器不提高该分类器的总体性能(图12A)。总体上,tt面积之间的差异没有导致队列中特异性的灵敏性增加(图13)。如实施tt例6中所述,该分类器能根据尿样分析准确地区分具有高Gleason评tttttt分(≥7)的癌症受试者和非前列腺癌受试者。同样,将PCA3非编码RNAtt包括到该前列腺癌标志物集合未导致AUC统计学上显著的改善,ttAUC为0.807,而没有PCA3的AUC为0.791(DeLong p值=0.4224)(图tt12B)。tt

  尽管本发明在上文中以其具体实施方案的方式说明,它可在不背tt离如所附权利要求书定义的本发明的精神和本质的前提下修改。tt

  参考文献tt

  de la Taille A,Irani J,Graefen M,Chun F,de RT,Kil P,et al.Clinical Evaluation of the PCA3 Assay in Guiding ttInitial Biopsy Decisions.J Urol 2011;185:2119-25tt

  Laxman B,Morris DS,Yu J,Siddiqui J,Cao J,Mehra R,Lonigro RJ,Tsodikov A,Wei JT,Tomlins SA,ttChinnaiyan AM.A first-generation multiplex biomarker analysis of urine for the early detection of prostate cancer.ttCancer Res.,2008,68:645-649tt

  Nam RK,Saskin R,Lee Y,Liu Y,Law C,Klotz LH,et al.Increasing hospital admission rates for urological ttcomplications after transrectal ultrasound guided prostate biopsy.J Urol 2010;183:963-8tt

  Schroder FH,Hugosson J,Roobol MJ,Tammela TL,Ciatto S,Nelen V,et al.Prostate-cancer mortallity at 11 ttyears of follow-up.N Engl J Med 2012;366:981-90tt

《用于提供前列腺癌的临床评估的方法、试剂盒和组合物.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)