欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 胰腺癌生物标记及其用途独创技术222717字

胰腺癌生物标记及其用途

2021-02-02 04:49:56

胰腺癌生物标记及其用途

  相关申请

  本申请要求于2010年8月13日提交的美国临时申请系列号tt61/373,687、于2010年12月1日提交的美国临时申请系列号61/418,689、tt于2011年5月4日提交的美国临时申请系列号61/482,347以及于2011年5tt月4日提交的美国临时申请系列号61/482,480的权益,这些申请每个整体tt援引加入本文。tt

  发明领域tt

  本申请一般涉及个体中生物标记的检测和癌症的诊断,并且更具体地tt涉及用于诊断个体的癌症,更特别是胰腺癌的一种或多种生物标记、方法、tt装置、试剂、系统和试剂盒。tt

  背景技术tt

  下面的描述提供了本申请相关信息的概述,并非承认任何本文提供的tt信息或引用的出版物是本申请的现有技术。tt

  胰腺癌是美国癌症相关死亡的第四主要原因。虽然5年生存率仅5%,tt但是据显示这随着早期手术干预而增加:在20%适合“根治性”切除的个tt体中,生存率增加至15-20%。在诊断时,超过一半的患者患有远端疾病,tt而另外25%具有区域传播。这是因为该疾病在其早期阶段出名地难以诊断。tt约20%患有“可手术”疾病[阶段IIb或更少]的患者进行“根治性”切除,tt并且5年生存率从低于5%增加至15-20%。tt

  胰腺癌可以起因于胰的外分泌和内分泌部分。在胰腺肿瘤中,95%发tt展自胰的外分泌部分,包括导管上皮、腺泡细胞、结缔组织和淋巴组织。tt所有胰腺癌的约75%发生在胰的头部或颈部内,15-20%发生在胰体中,并tt且5-10%发生在尾部中。tt

  复发可以是局部的(在其开始的相同地方或附近)或远端的(扩散至诸如tttttt肝、肺或骨的器官)。当胰腺外分泌癌复发时,其主要用与转移性癌症相同tt的方式治疗,并且如果患者可以忍受,可能包括化疗。通常,胰腺癌首先tt转移至区域淋巴结,然后至肝,并且较不常见的,至肺。其还可以直接侵tt入周围内脏器官,例如十二指肠、胃和结肠,或者通过腹膜扩散转移至腹tt腔中的任何表面。可以导致腹水,并且这具有不祥预后。胰腺癌可以扩散tt至皮肤,作为痛性结节转移。胰腺癌罕见地转移至骨。tt

  基于血液的胰腺癌测试的两个临床应用是用于无症状的高风险群体中tt的临床前诊断以及有症状的群体中的鉴别诊断。这两种指征的临床用途如tt下文所列。tt

  无症状的高风险群体中的筛选:2010年在美国有估计43,140例胰腺癌tt新病例和36,800例死亡。遗传、家族史、慢性胰腺炎、吸烟和大量饮酒增tt加胰腺癌的风险,囊性纤维化也是如此。风险的增加报道为:tt

  吸烟:<25/天为2x风险,>25/天为3x风险tt

  酒精:超过3杯/天产生1.6倍风险增加tt

  家族史:与疾病相关的第一程度产生5x增加tt

  患有囊性纤维化的成年:31x风险tt

  BRCA2基因突变10x风险tt

  在有效筛选范式不存在的情况下,在无症状但是有风险的群体中,癌tt症在症状出现时简单地检测。这可能晚了。早期检测测试的存在会增加适tt合根治性手术的患者的比例。目前20%早期检测个体中20%的治愈率仅为tt总群体的4%。如果根治性手术的适用性通过早期检测在无症状的群体中从tt目前的20%增加,则可治愈的总数会增加,每年拯救的生命的数量也会增tt加。因为胰腺癌为低流行性疾病,即使在这种高风险群体中,高特异性也tt是筛选测试的重要属性。低假阳性率对于减少不必要的后续程序所致的费tt用和减少患者的焦虑极为重要。tt

  有症状的患者中的鉴别诊断。胰腺癌可能难以与良性疾病状况如胰腺tt炎或胃肠病症区分。原发性外分泌胰腺癌的鉴别诊断包括慢性胰腺炎、胰tt腺内分泌肿瘤、自身免疫性胰腺炎、淋巴瘤以及各种其他罕见疾病状况。tt与胰腺癌相关的常见但非特异性症状包括:tt

  腹痛-特别是在放射至背部时tt

  阻塞性黄疸tt

  突然原因不明的糖尿病tt

  体重减轻tt

  厌食、疲劳tt

  恶心、呕吐tt

  急性或慢性胰腺炎tt

  下表示出具有这些相关症状中的至少两种的急诊室和医院出现的患者tt的数量;第一症状是所列症状中的任一种,而第二症状是表中所列的症状。tt急诊室数据来自:(http://hcupnet.ahrq.gov/),而门诊数据来自CDC 2008 ttNational Ambulatory Medical Care Survey2006(number8)。tt

  可切除的疾病的灵敏检测对于这种指征的临床应用非常重要。胰腺癌tt的迅速检测增加可治愈的疾病的诊断机会。胰腺癌的诊断通常通过发现胰tt内的团块来放射显影进行,所述团块常阻塞胰管或胆道。然而,成像可以tt是侵入性和昂贵的。确定哪些患者需要包括诊断成像在内的后续的血液测tt试会有益于患者并简化诊断。tt

  特定疾病状态的生物标记选择包括首先鉴定与对照群体相比在疾病群tt体中具有可测量和统计上显著的差异的标记用于特定医学应用。生物标记tt可以包括分泌或脱落(shed)的分子,其与疾病发展或进程平行,并且容易对tt肿瘤响应而从胰腺癌组织或者从周围组织和循环细胞扩散入血流。鉴定的tt生物标记或生物标记的集合(set)通常临床上进行验证,或者证实为对其所tt选的原始预期用途是可靠的指示物。生物标记可以包括小分子、肽、蛋白tt和核酸。影响生物标记鉴定的一些关键问题包括可用数据的过拟合tt(over-fitting)及数据偏差。tt

  已使用各种方法来试图鉴定生物标记和诊断疾病。对于基于蛋白的标tt记,这些方法包括二维电泳、质谱和免疫测定方法。对于核酸标记,这些tt方法包括mRNA表达谱、微RNA谱、FISH、基因表达系列分析(SAGE)tt和大规模基因表达阵列。tt

  二维电泳的应用由于以下问题而受限:低检测灵敏度;与蛋白溶解性、tt电荷及疏水性相关的问题;凝胶再现性;以及单个斑点代表多种蛋白的可tt能性。对于质谱,取决于所用形式,限制围绕样品加工和分离、对低丰度tt蛋白的灵敏性、信噪比考虑以及不能立即鉴定检测的蛋白而出现。免疫测tt定方法发现生物标记的限制集中在基于抗体的多重测定不能测量大量分析tt物。可以简单地印刷高质量抗体的阵列,并且无需夹心而测量与这些抗体tt结合的分析物。(这会是使用全基因组核酸序列通过杂交测量有机体或细胞tt中的全部DNA或RNA序列的方式上的等同物。因为杂交可以是同一性的tt严紧测试,所以杂交实验可行。甚至非常好的抗体在选择它们的结合配偶tt体中也并非足够严紧来在血液或甚至是细胞提取物环境中工作,因为那些tt基质中的蛋白总体(ensemble)具有极其不同的丰度。)因此,必须使用不同tt的基于免疫测定的方法以发现生物标记-需要使用多重ELISA测定(即夹心)tt以获得足够严紧性来同时测量许多分析物,从而决定哪些分析物的确是生tt物标记。夹心免疫测定不放大至高含量,因此使用标准阵列形式不能用严tt紧夹心免疫测定发现生物标记。最后,抗体试剂产生相当大的批次差异和tt试剂不稳定性。本发明的蛋白生物标记发现平台克服了这个问题。tt

  许多这些方法依赖或需要在分析前一些类型的样品的分级。因此进行tt设计为在一系列良好限定的样品群体中鉴定和发现统计学相关生物标记的tt足够有效的研究所需的样品制备是极其困难、昂贵和耗时的。在分级期间,tt大范围的变异性可以被引入各种样品。例如,一种潜在的标记可能对于方tt法是不稳定的,标记的浓度可能变化,不合适的聚集或解聚可能发生,无tt意的样品污染可能发生,并因此掩盖预期的早期疾病中的微小变化。tt

  广泛接受的是使用这些技术的生物标记发现和检测方法对于鉴定诊断tt性生物标记具有严重限制。这些限制包括不能检测低丰度生物标记,不能tt持续覆盖蛋白质组的完整动态范围,样品加工和分级中的不可再现性,以tt及方法的整体不可再现性和缺乏稳健性(robustness)。另外,这些研究在数tttttt据中引入了偏差,针对鉴定和验证靶疾病群体内的生物标记所需的分布和tt随机化方面,没有充分解决包括适当对照在内的样品群体的复杂性。tt

  尽管旨在发现新的和有效的生物标记的努力已进行了几十年,但是这tt些努力大部分是不成功的。针对各种疾病的生物标记通常在学术性实验室tt中鉴定,通常通过进行一些疾病过程的基础研究时偶然发现。基于所述发tt现和少量临床数据,发表的论文提示鉴定了新的生物标记。然而大多数这tt些建议的生物标记未证实是真实或有用的生物标记,这主要是因为测试的tt少量临床样品对于已确实发现有效的生物标记仅提供弱统计学证据。也就tt是说,最初的鉴定对于统计学的基本元素是不严格的。在1994-2003年的tt每一年中,检索科学文献显示公开了上千篇关于生物标记的参考文献。然tt而,在同时期内,FDA一年最多批准3种新蛋白生物标记的诊断应用,并tt且在若干年中没有批准新的蛋白生物标记。tt

  基于失败的生物标记发现努力的历史,已建议了数学理论以进一步促tt进通常理解,即针对疾病的生物标记很少且难以发现。基于2D凝胶或质谱tt的生物标记研究支持这些观点。通过这些方法鉴定了非常少的有用生物标tt记。然而,通常忽视2D凝胶和质谱测量血液中存在的约1nM或更高浓度tt的蛋白,这种蛋白的总体很可能是最不可能随疾病变化的。除了本发明的tt生物标记发现平台,尚不存在能够精确测量低得多的浓度的蛋白表达水平tt的蛋白质组生物标记发现平台。tt

  关于复杂的人生物学的生物化学途径已知许多。许多生物化学途径以tt在病理学内局部发挥作用的分泌的蛋白达到顶点或开始,例如分泌生长因tt子以刺激病理学中其他细胞的复制,以及分泌其他因子以避开免疫系统等。tt尽管许多这些分泌的蛋白以旁分泌方式发挥作用,但是一些在身体的远端tt运行。具有生物化学途径基本了解的本领域技术人员会理解,许多病理学tt特异性蛋白应当以低于(甚至远低于)2D凝胶和质谱检测极限的浓度存在tt于血液中。在这种相对丰富数目的疾病生物标记的鉴定之前必须有一种蛋tt白质组平台,其可以分析低于2D凝胶或质谱可以检测的浓度的蛋白。tt

  因此,亟需生物标记、方法、装置、试剂、系统和试剂盒,其允许(a)区tt分胰腺癌与良性疾病状况;(b)筛选胰腺癌的无症状的高风险个体;(c)检tt测胰腺癌生物标记;以及(d)诊断胰腺癌。tt

  发明概述

  本申请包括用于检测和诊断癌症,更特别是胰腺癌的生物标记、方法、tt试剂、装置、系统和试剂盒。本申请的生物标记使用实施例1详述的基于tt多重适配体的测定来鉴定。通过使用本文所述的基于适配体的生物标记鉴tt定方法,本申请描述了可用于检测和诊断胰腺癌的惊人的大量胰腺癌生物tt标记以及可用于检测和诊断更一般的癌症的大量癌症生物标记。在鉴定这tt些生物标记中,测量了来自数百个个体样品的超过800种蛋白,其中一些tt的浓度在低毫微微摩尔(femtomolar)范围。这比用2D凝胶和/或质谱进行的tt生物标记发现实验低约4个数量级。tt

  尽管某些所述胰腺癌生物标记可单独用于检测和诊断胰腺癌,但是本tt文所述的方法用于分组用作一组生物标记的胰腺癌生物标记的多个子集。tt一旦鉴定了单独的生物标记或生物标记的子集,则个体中胰腺癌的检测或tt诊断可以使用能够测量生物学样品中所选生物标记或多种生物标记的水平tt差异的任何测定平台或形式来完成。tt

  然而,仅仅通过使用本文所述的基于适配体的生物标记鉴定方法,其tt中超过800个单独的潜在生物标记值从先前已经诊断为患有或不患有胰腺tt癌的大量个体中逐个进行了筛选,才可能鉴定本文公开的胰腺癌生物标记。tt这种发现方法与从条件培养基或裂解的细胞发现生物标记截然相反,因为tt其询问无需翻译为人病理学的更加患者相关的系统。tt

  因此,本申请一方面提供一种或多种生物标记以用于单独或以各种组tt合来诊断胰腺癌,或者允许鉴别诊断胰腺癌与良性胃肠(GI)疾病状况如急性tt或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或后来发现为良性的异常tt成像。示例性实施方案包括表1第2列提供的生物标记,如上所述,这些tt生物标记用实施例1中一般描述并在实施例2中更具体描述的基于多重适tt配体的测定鉴定。表1提供的标记可用于诊断高风险的无症状的群体中的tt胰腺癌以及区分急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或后tt来发现为良性的异常成像与胰腺癌。tt

  尽管某些所述胰腺癌生物标记可以单独用于检测和诊断胰腺癌,但是tt本文所述的方法还用于分组胰腺癌生物标记的多个子集,其各自可用作两tt个或更多个生物标记的组。因此,本申请的各个实施方案提供了包含N个tttttt生物标记的组合,其中N是至少2个生物标记。在其他实施方案中,N选tt自2-65个生物标记中的任意数。tt

  仍然在其他实施方案中,N选自2-7、2-10、2-15、2-20、2-25、2-30、tt2-35、2-40、2-45、2-50、2-55或2-65中的任意数。在其他实施方案中,Ntt选自3-7、3-10、3-15、3-20、3-25、3-30、3-35、3-40、3-45、3-50、3-55tt或3-65中的任意数。在其他实施方案中,N选自4-7、4-10、4-15、4-20、tt4-25、4-30、4-35、4-40、4-45、4-50、4-55或4-65中的任意数。在其他实tt施方案中,N选自5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、tt5-50、5-55或5-65中的任意数。在其他实施方案中,N选自6-10、6-15、tt6-20、6-25、6-30、6-35、6-40、6-45、6-50、6-55或6-65中的任意数。在tt其他实施方案中,N选自7-10、7-15、7-20、7-25、7-30、7-35、7-40、7-45、tt7-50、7-55或7-65中的任意数。在其他实施方案中,N选自8-10、8-15、tt8-20、8-25、8-30、8-35、8-40、8-45、8-50、8-55或8-65中的任意数。在tt其他实施方案中,N选自9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、tt9-55或9-65中的任意数。在其他实施方案中,N选自10-15、10-20、10-25、tt10-30、10-35、10-40、10-45、10-50、10-55或10-65中的任意数。应当理tt解N可以选自包含类似但更高级(order)的范围。tt

  在另一方面,本发明提供了一种诊断个体的胰腺癌的方法,所述方法tt包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个tt生物标记值对应于选自表1第2列提供的生物标记的组的至少一个生物标tt记,其中所述个体基于所述至少一个生物标记值分类为患有胰腺癌。tt

  在另一方面,本发明提供了一种诊断个体的胰腺癌的方法,所述方法tt包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对tt应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中tt基于所述生物标记值确定所述个体患有胰腺癌的似然性(likelihood)。tt

  在另一方面,本发明提供了一种诊断个体的胰腺癌的方法,所述方法tt包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对tt应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中tt基于所述生物标记值将所述个体分类为患有胰腺癌,并且其中N=2-10。tt

  在另一方面,本发明提供了一种诊断个体的胰腺癌的方法,所述方法tttttt包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对tt应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中tt基于所述生物标记值确定所述个体患有胰腺癌的似然性,并且其中N=tt2-10。tt

  在另一方面,本发明提供了一种诊断个体不患有胰腺癌的方法,所述tt方法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少tt一个生物标记值对应于选自表1第2列所列的生物标记的组的至少一个生tt物标记,其中基于所述至少一个生物标记值将所述个体分类为不患有胰腺tt癌。tt

  在另一方面,本发明提供了一种诊断个体不患有胰腺癌的方法,所述tt方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每tt个对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,tt其中基于所述生物标记值将所述个体分类为不患有胰腺癌,并且其中N=tt2-10。tt

  在另一方面,本发明提供了一种诊断胰腺癌的方法,所述方法包括在tt来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一tt组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的tt生物标记的组,其中所述生物标记值的分类指示所述个体患有胰腺癌,并tt且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断胰腺癌的方法,所述方法包括在tt来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一tt组N个生物标记中的生物标记,其中所述生物标记选自表1第2列所列的tt生物标记的组,其中所述生物标记值的分类指示所述个体患有胰腺癌,并tt且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断胰腺癌的方法,所述方法包括在tt来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一tt组生物标记中的生物标记,所述一组生物标记选自表2-11所列的生物标记tt的组,其中所述生物标记值的分类指示所述个体患有胰腺癌。tt

  在另一方面,本发明提供了一种诊断胰腺癌不存在的方法,所述方法tt包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对tttttt应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列tt所列的生物标记的组,其中所述生物标记值的分类指示所述个体中不存在tt胰腺癌,并且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断胰腺癌不存在的方法,所述方法tt包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对tt应于一组N个生物标记中的生物标记,其中所述生物标记选自表1第2列tt所列的生物标记的组,其中所述生物标记值的分类指示所述个体中不存在tt胰腺癌,并且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断不存在胰腺癌的方法,所述方法tt包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对tt应于一组生物标记中的生物标记,所述一组生物标记选自表2-11提供的生tt物标记的组,其中所述生物标记值的分类指示所述个体中不存在胰腺癌。tt

  在另一方面,本发明提供了一种诊断个体的胰腺癌的方法,所述方法tt包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于tt选自表1第2列所列的生物标记的组的至少N个生物标记之一,其中基于tt偏离预定阈值的分类评分将所述个体分类为患有胰腺癌,并且其中N=2-10。tt

  在另一方面,本发明提供了一种诊断个体中不存在胰腺癌的方法,所tt述方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值tt对应于选自表1第2列所列的生物标记的组的至少N个生物标记之一,其tt中基于偏离预定阈值的分类评分将所述个体分类为不患有胰腺癌,并且其tt中N=2-10。tt

  在另一方面,本发明提供了一种指示胰腺癌的似然性的计算机执行方tt法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物tt标记信息包括生物标记值,所述生物标记值每个对应于选自表1第2列所tt列的生物标记的组的至少N个生物标记之一,其中N如上定义;用计算机tt对每个所述生物标记值进行分类;以及基于多个分类指示所述个体患有胰tt腺癌的似然性。tt

  在另一方面,本发明提供了一种将个体分类为患有或不患有胰腺癌的tt计算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,tt其中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自tttttt表1第2列提供的生物标记的组的至少N个生物标记之一;用计算机对每tt个所述生物标记值进行分类;以及基于多个分类指示所述个体是否患有胰tt腺癌。tt

  在另一方面,本发明提供了一种指示胰腺癌的似然性的计算机程序产tt品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程tt序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因tt于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,tt所述生物标记值每个对应于所述生物学样品中选自表1第2列所列的生物tt标记的组的至少N个生物标记之一,其中N如上定义;以及执行分类方法tt的代码,所述分类方法将所述个体患有胰腺癌的似然性指示为所述生物标tt记值的函数。tt

  在另一方面,本发明提供了一种指示个体的胰腺癌状态的计算机程序tt产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述tt程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归tt因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,tt所述生物标记值每个对应于所述生物学样品中选自表1第2列提供的生物tt标记的组的至少N个生物标记之一;以及执行分类方法的代码,所述分类tt方法将所述个体的胰腺癌状态指示为所述生物标记值的函数。tt

  在另一方面,本发明提供了一种指示胰腺癌的似然性的计算机执行方tt法。所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物tt标记信息包括生物标记值,所述生物标记值对应于选自表1第2列所列的tt生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及基tt于所述分类指示所述个体患有胰腺癌的似然性。tt

  在另一方面,本发明提供了一种将个体分类为患有或不患有胰腺癌的tt计算机执行方法。所述方法包括:从计算机检索个体的生物标记信息,其tt中所述生物标记信息包括生物标记值,所述生物标记值对应于选自表1第2tt列提供的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;tt以及基于所述分类指示所述个体是否患有胰腺癌。tt

  在另一方面,本发明提供了一种指示胰腺癌的似然性的计算机程序产tt品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程tttttt序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因tt于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,tt所述生物标记值对应于所述生物学样品中选自表1第2列所列的生物标记tt的组的生物标记;以及执行分类方法的代码,所述分类方法将所述个体患tt有胰腺癌的似然性指示为所述生物标记值的函数。tt

  在另一方面,本发明提供了一种指示个体的胰腺癌状态的计算机程序tt产品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述tt程序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归tt因于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,tt所述生物标记值对应于所述生物学样品中选自表1第2列提供的生物标记tt的组的生物标记;以及执行分类方法的代码,所述分类方法将所述个体的tt胰腺癌状态指示为所述生物标记值的函数。tt

  尽管某些所述癌症生物标记可单独用于检测和诊断癌症,但是本文所tt述的方法用于分组用作一组生物标记的癌症生物标记的多个子集。一旦鉴tt定了单独的生物标记或生物标记的子集,则个体中癌症的检测或诊断可以tt使用能够测量生物学样品中所选生物标记或多种生物标记的水平差异的任tt何测定平台或形式来完成。tt

  然而,仅仅通过使用本文所述的基于适配体的生物标记鉴定方法,其tt中超过800个单独的潜在生物标记值从先前已经诊断为患有或不患有癌症tt的大量个体中逐个进行了筛选,才可能鉴定本文公开的癌症生物标记。这tt种发现方法与从条件培养基或裂解的细胞发现生物标记截然相反,因为其tt询问无需翻译为人病理学的更加患者相关的系统。tt

  因此,在本发明的一方面,提供了一种或多种生物标记用于单独或在tt各种组合中使用以诊断癌症。示例性实施方案包括表19提供的生物标记,tt这些生物标记用实施例1中一般描述并在实施例7中更具体描述的基于多tt重适配体的测定鉴定。表19提供的标记可用于区分患有癌症的个体与不患tt有癌症的个体。tt

  虽然某些所述癌症生物标记可以单独用于检测和诊断癌症,但是本文tt所述的方法还用于分组癌症生物标记的多个子集,其各自用作三个或更多tt个生物标记的组。因此,本申请的各个实施方案提供了包含N个生物标记tttttt的组合,其中N是至少三个生物标记。在其他实施方案中,N选自3-65个tt生物标记中的任意数。tt

  在其他实施方案中,N选自3-7、3-10、3-15、3-20、3-25、3-30、3-35、tt3-40、3-45、3-50、3-55、3-60或3-65中的任意数。在其他实施方案中,Ntt选自4-7、4-10、4-15、4-20、4-25、4-30、4-35、4-40、4-45、4-50、4-55、tt4-60或4-65中的任意数。在其他实施方案中,N选自5-7、5-10、5-15、5-20、tt5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60或5-65中的任意数。在tt其他实施方案中,N选自6-10、6-15、6-20、6-25、6-30、6-35、6-40、6-45、tt6-50、6-55、6-60或6-65中的任意数。在其他实施方案中,N选自7-10、tt7-15、7-20、7-25、7-30、7-35、7-40、7-45、7-50、7-55、7-60或7-65中tt的任意数。在其他实施方案中,N选自8-10、8-15、8-20、8-25、8-30、8-35、tt8-40、8-45、8-50、8-55、8-60或8-65中的任意数。在其他实施方案中,Ntt选自9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55、9-60或9-65tt中的任意数。在其他实施方案中,N选自10-15、10-20、10-25、10-30、10-35、tt10-40、10-45、10-50、10-55、10-60或10-65中的任意数。应当理解N可tt以选自包含类似但更高级的范围。tt

  在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包tt括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一个生tt物标记值对应于选自表19提供的生物标记的组的至少一个生物标记,其中tt基于所述至少一个生物标记值就所述个体分类为患有癌症。tt

  在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包tt括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应tt于选自表19所列的生物标记的组的至少N个生物标记之一,其中基于所述tt生物标记值确定所述个体患有癌症的似然性。tt

  在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包tt括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应tt于选自表19所列的生物标记的组的至少N个生物标记之一,其中基于所述tt生物标记值将所述个体分类为患有癌症,并且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包tt括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应tttttt于选自表19所列的生物标记的组的至少N个生物标记之一,其中所述个体tt患有癌症的似然性基于所述生物标记值来确定,并且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断个体不患有癌症的方法,所述方tt法包括在来自个体的生物学样品中检测至少一个生物标记值,所述至少一tt个生物标记值对应于选自表19所列的生物标记的组的至少一个生物标记,tt其中基于所述至少一个生物标记值将所述个体分类为不患有癌症。tt

  在另一方面,本发明提供了一种诊断个体不患有癌症的方法,所述方tt法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个tt对应于选自表19所列的生物标记的组的至少N个生物标记之一,其中基于tt所述生物标记值将所述个体分类为不患有癌症,并且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断癌症的方法,所述方法包括在来tt自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组ttN个生物标记中的生物标记,其中所述生物标记选自表19所列的生物标记tt的组,其中所述生物标记值的分类指示所述个体患有癌症,并且其中N=tt3-10。tt

  在另一方面,本发明提供了一种诊断癌症的方法,所述方法包括在来tt自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组ttN个生物标记中的生物标记,其中所述生物标记选自表19所列的生物标记tt的组,其中所述生物标记值的分类指示所述个体患有癌症,并且其中N=tt3-10。tt

  在另一方面,本发明提供了一种诊断癌症的方法,所述方法包括在来tt自个体的生物学样品中检测生物标记值,所述生物标记值每个对应于一组tt生物标记中的生物标记,所述一组生物标记选自表20-29所列的生物标记tt的组,其中所述生物标记值的分类指示所述个体患有癌症。tt

  在另一方面,本发明提供了一种诊断癌症不存在的方法,所述方法包tt括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应tt于一组N个生物标记中的生物标记,其中所述生物标记选自表19所列的生tt物标记的组,其中所述生物标记值的分类指示所述个体中不存在癌症,并tt且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断癌症不存在的方法,所述方法包tttttt括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应tt于一组N个生物标记中的生物标记,其中所述生物标记选自表19所列的生tt物标记的组,其中所述生物标记值的分类指示所述个体中不存在癌症,并tt且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断不存在癌症的方法,所述方法包tt括在来自个体的生物学样品中检测生物标记值,所述生物标记值每个对应tt于一组生物标记中的生物标记,所述一组生物标记选自表20-29提供的生tt物标记的组,其中所述生物标记值的分类指示所述个体中不存在癌症。tt

  在另一方面,本发明提供了一种诊断个体的癌症的方法,所述方法包tt括在来自个体的生物学样品中检测生物标记值,所述生物标记值对应于选tt自表19所列的生物标记的组的至少N个生物标记之一,其中基于偏离预定tt阈值的分类评分将所述个体分类为患有癌症,并且其中N=3-10。tt

  在另一方面,本发明提供了一种诊断个体中不存在癌症的方法,所述tt方法包括在来自个体的生物学样品中检测生物标记值,所述生物标记值对tt应于选自表19所列的生物标记的组的至少N个生物标记之一,其中基于偏tt离预定阈值的分类评分将所述个体分类为不患有癌症,并且其中N=3-10。tt

  在另一方面,本发明提供了一种指示癌症的似然性的计算机执行方法。tt所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记tt信息包括生物标记值,所述生物标记值每个对应于选自表19所列的生物标tt记的组的至少N个生物标记之一,其中N如上定义;用计算机对每个所述tt生物标记值进行分类;以及基于多个分类指示所述个体患有癌症的似然性。tt

  在另一方面,本发明提供了一种将个体分类为患有或不患有癌症的计tt算机执行方法。所述方法包括:在计算机上检索个体的生物标记信息,其tt中所述生物标记信息包括生物标记值,所述生物标记值每个对应于选自表tt19提供的生物标记的组的至少N个生物标记之一;用计算机对每个所述生tt物标记值进行分类;以及基于多个分类指示所述个体是否患有癌症。tt

  在另一方面,本发明提供了一种指示癌症的似然性的计算机程序产品。tt所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代tt码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来tt自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述tttttt生物标记值每个对应于所述生物学样品中选自表19所列的生物标记的组的tt至少N个生物标记之一,其中N如上定义;以及执行分类方法的代码,所tt述分类方法将所述个体患有癌症的似然性指示为所述生物标记值的函数。tt

  在另一方面,本发明提供了一种指示个体的癌症状态的计算机程序产tt品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程tt序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因tt于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,tt所述生物标记值每个对应于所述生物学样品中选自表19提供的生物标记的tt组的至少N个生物标记之一;以及执行分类方法的代码,所述分类方法将tt所述个体的癌症状态指示为所述生物标记值的函数。tt

  在另一方面,本发明提供了一种指示癌症的似然性的计算机执行方法。tt所述方法包括:在计算机上检索个体的生物标记信息,其中所述生物标记tt信息包括生物标记值,所述生物标记值对应于选自表19所列的生物标记的tt组的生物标记;用计算机对所述生物标记值进行分类;以及基于所述分类tt指示所述个体患有癌症的似然性。tt

  在另一方面,本发明提供了一种将个体分类为患有或不患有癌症的计tt算机执行方法。所述方法包括:从计算机检索个体的生物标记信息,其中tt所述生物标记信息包括生物标记值,所述生物标记值对应于选自表19提供tt的生物标记的组的生物标记;用计算机对所述生物标记值进行分类;以及tt基于所述分类指示所述个体是否患有癌症。tt

  在另一方面,本发明提供了一种指示癌症的似然性的计算机程序产品。tt所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代tt码可由计算装置或系统的处理器执行,所述程序代码包括:对归因于来自tt个体的生物学样品的数据进行检索的代码,其中所述数据包括生物标记值,tt所述生物标记值对应于所述生物学样品中选自表19所列的生物标记的组的tt生物标记;以及执行分类方法的代码,所述分类方法将所述个体患有癌症tt的似然性指示为所述生物标记值的函数。tt

  在另一方面,本发明提供了一种指示个体的癌症状态的计算机程序产tt品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程tt序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因tttttt于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,tt所述生物标记值对应于所述生物学样品中选自表19提供的生物标记的组的tt生物标记;以及执行分类方法的代码,所述分类方法将所述个体的癌症状tt态指示为所述生物标记值的函数。tt

  在另一方面,本发明提供了一种诊断胰腺癌的方法,所述方法包括在tt来自个体的生物学样品中除了生物标记值,检测肿瘤标记CA19-9,所述生tt物标记值每个对应于一组生物标记中的生物标记,所述一组生物标记选自tt表1所列的生物标记的组,其中组合的CA19-9和生物标记值的分类指示tt所述个体患有胰腺癌。tt

  附图说明tt

  图1A是检测生物学样品中的胰腺癌的示例方法的流程图。tt

  图1B是用朴素贝叶斯(Bayes)分类方法检测生物学样品中的胰腺tt癌的示例方法的流程图。tt

  图2示出单个生物标记CTSB的ROC曲线,其使用用于检测胰腺癌的tt测试的朴素贝叶斯分类器(classifier)。tt

  图3示出2至10个生物标记的生物标记组的ROC曲线,其使用用于tt检测胰腺癌的测试的朴素贝叶斯分类器。tt

  图4说明当生物标记的数目从1增加至10时分类评分(AUC)的增加,tt其使用用于胰腺癌组的朴素贝叶斯分类。tt

  图5示出对于组合的GI和正常对照(实线)和胰腺癌疾病组(虚线),作tt为log转化的RFU形式的累积分布函数(cdf)的CTSB的测量的生物标记分tt布,以及它们的曲线拟合为正态cdf(短划线),以用于训练(train)朴素贝叶tt斯分类器。tt

  图6说明与本文所述的各种计算机执行方法一起使用的示例计算机系tt统。tt

  图7是一实施方案的指示个体患有胰腺癌的似然性的方法的流程图。tt

  图8是一实施方案的指示个体患有胰腺癌的似然性的方法的流程图。tt

  图9说明可以用于检测生物学样品中一个或多个胰腺癌生物标记的示tt例适配体测定。tt

  图10示出从聚集的潜在生物标记的集合使用哪些生物标记来构建分类tt器以区分胰腺癌与GI和正常对照的频率的柱状图。tt

  图11A示出一对柱状图,其总结了使用表1所列的生物标记(实线)和tt随机标记的集合(虚线)的所有可能的单蛋白朴素贝叶斯分类器评分(AUC)。tt

  图11B示出一对柱状图,其总结了使用表1所列的生物标记(实线)和tt随机标记的集合(虚线)的所有可能的二蛋白蛋白朴素贝叶斯分类器评分tt(AUC)。tt

  图11C示出一对柱状图,其总结了使用表1所列的生物标记(实线)和tt随机标记的集合(虚线)的所有可能的三蛋白朴素贝叶斯分类器评分(AUC)。tt

  图12示出使用选自完全组(菱形)的2-10个标记的朴素贝叶斯分类器的ttAUC,以及通过在分类器产生期间放弃最好的5个、10个和15个标记而tt获得的评分。tt

  图13示出三个不同分类器的性能:单独CA19-9、SOMAmer组以及ttSOMAmer和CA19-9的组合。tt

  图14示出CA19-9加上1个(HAMP)或2个(HAMP和CTSB)SOMAmertt生物标记的性能。tt

  图15示出10个标记的随机森林分类器(random forest classifier)的性能。tt

  图16A示出一组ROC曲线,其从表14中的数据对1至5个标记的组tt建模。tt

  图16B示出一组ROC曲线,其从图12A的1至5个标记的组的训练tt数据计算。tt

  图17A和17B示出通过贪婪选择方法选择的10个生物标记(表19)与tt10个“非标记”生物标记的1,000个随机样品集合之间性能的比较。表19tt中10个生物标记的平均AUC显示为虚线垂直线。在图17A中,10个生物tt标记的集合随机选自未通过贪婪方法选择的所有3个癌症研究中存在的所tt有10种分析物。在图17B中,使用与17A相同的方法;然而,采样仅限tt于未通过贪婪方法选择的来自表1的剩余的55个生物标记。tt

  图18示出表19所列的3个朴素贝叶斯分类器的接受者操作特征(ROC)tt曲线。对于每个研究,曲线下面积(AUC)也在图例旁边示出。tt

  发明详述

  现在详细描述本发明的代表性实施方案。虽然本发明结合列举的实施tt方案进行描述,但是应理解本发明并不限于这些实施方案。相反,本发明tt旨在涵盖可以包括在如权利要求书所限定的本发明范围内的所有替代、修tt饰和等价物。tt

  本领域技术人员会知道与本文所述的方法和材料相似或等价的许多方tt法和材料,其可以使用并在本发明的实践的范围内。本发明不以任何方式tt限制于所述方法和材料。tt

  除非另有定义,本文所用的技术和科学术语具有本发明所属领域技术tt人员通常理解的相同含义。尽管与本文所述的方法、装置和材料相似或等tt价的任何方法、装置和材料可以用于实施或测试本发明,但是现在描述优tt选的方法、装置和材料。tt

  本申请中引用的所有出版物、公开的专利文件和专利申请指示本申请tt所属领域的技术水平。本文引用的所有出版物、公开的专利文件和专利申tt请援引加入本文,与每个单独的出版物、公开的专利文件或专利申请具体tt地和单独地指明援引加入本文的程度相同。tt

  如在包括所附权利要求书在内的本申请中所用,除非特别说明,单数tt形式“一个(a)”、“一个(an)”和“这个(the)”包括复数形式,且与“至少一tt个”和“一个或多个”可互换使用。因此,提及的“一个适配体”包括适tt配体的混合物,提及的“探针”包括探针的混合物等。tt

  如本文所用,术语“约”表示数值的不明显更改或变化,由此该数值tt所涉及的项目的基本功能未改变。tt

  如本文所用,术语“包含(comprises)”、“包含(comprising)”、“包括tt(includes)”、“包括(including)”、“含有(contains)”、“含有(containing)”及它tt们的任何变体意图覆盖非排他的包含,由此包含、包括或含有一个元件或tt者一系列元件的过程、方法、方法限定产品或组成(composition of matter)tt不仅包括这些元件,而且可以包括未明确列举或这样的过程、方法、方法tt限定产品或组成固有的其他元件。tt

  本申请包括用于检测和诊断胰腺癌和更一般的癌症的生物标记、方法、tt装置、试剂、系统和试剂盒。tt

  在一方面,本发明提供了一种或多种生物标记,其单独或以各种组合tt用于诊断胰腺癌,允许鉴别诊断胰腺癌与非恶性GI疾病状况,包括急性或tt慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或后来发现为良性的异常成tt像,监测胰腺癌复发或者寻址(address)其他临床指征。如下文详细描述,示tt例性实施方案包括表1第2列提供的生物标记,这些生物标记使用基于多tt重适配体的测定来鉴定,所述测定在实施例1中一般描述,并且在实施例2tt中更具体地描述。tt

  表1第2列列出获得自以下分析的发现:来自胰腺癌病例的几百个个tt体血液样品,以及来自GI和正常对照的几百个等价个体血液样品。GI和tt正常对照组设计为匹配胰腺癌诊断测试可以具有最大益处的群体,包括无tt症状的个体和有症状的个体。正常对照组代表具有胰腺癌的高风险的无症tt状的个体。胰腺癌的高风险包括胰腺癌的家族史、肥胖、吸烟、糖尿病、tt囊性纤维化、慢性或遗传性胰腺炎、BRCA突变载体、p16突变以及波-杰tt综合征(Brand E et a1.Gut2007:56:1460)。GI对照组包括非特异性腹部症状tt如急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或者后来发现为良tt性的异常成像。将来自正常对照的样品与GI对照合并以发现可用于筛选高tt风险无症状的个体和有症状的个体的鉴别诊断的生物标记。潜在的生物标tt记在单独的样品而不是在混合疾病和对照血液中测量;这允许更好地理解tt与疾病(在这种情况下是胰腺癌)的存在和不存在相关的表型中个体和组的tt变化。由于对每个样品进行823个蛋白测量,并且单独测量来自每个疾病tt和对照群体的几百个样品,所以表1第2列得自非常大的数据集合的分析。tt使用本文“生物标记的分类和疾病评分计算”章节中描述的方法分析测量tt结果。表1第2列列出发现可用于区分得自患有胰腺癌的个体的样品与得tt自GI和正常对照的样品的65个生物标记。GI对照包括具有急性或慢性胰tt腺炎(或两者)、胰腺梗阻、GERD、胆石或者后来发现为良性的异常成像的tt个体。tt

  虽然某些所述胰腺癌生物标记可单独用于检测和诊断胰腺癌,但是本tt文还描述了胰腺癌生物标记的多个子集的分组方法,其中每个分组或者子tt集选择可作为一组三个或更多个生物标记使用,这在本文中可互换地称为tt“生物标记组”和一组。因此,本申请的各个实施方案提供了包含N个生tttttt物标记的组合,其中N是至少2个生物标记。在其他实施方案中,N选自tt2-65个生物标记。tt

  在其他实施方案中,N选自2-7、2-10、2-15、2-20、2-25、2-30、2-35、tt2-40、2-45、2-50、2-55或2-65中的任意数。在其他实施方案中,N选自tt3-7、3-10、3-15、3-20、3-25、3-30、3-35、3-40、3-45、3-50、3-55或3-65tt中的任意数。在其他实施方案中,N选自4-7、4-10、4-15、4-20、4-25、tt4-30、4-35、4-40、4-45、4-50、4-55或4-65中的任意数。在其他实施方案tt中,N选自5-7、5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、tt5-55或5-65中的任意数。在其他实施方案中,N选自6-10、6-15、6-20、tt6-25、6-30、6-35、6-40、6-45、6-50、6-55或6-65中的任意数。在其他实tt施方案中,N选自7-10、7-15、7-20、7-25、7-30、7-35、7-40、7-45、7-50、tt7-55或7-65中的任意数。在其他实施方案中,N选自8-10、8-15、8-20、tt8-25、8-30、8-35、8-40、8-45、8-50、8-55或8-65中的任意数。在其他实tt施方案中,N选自9-15、9-20、9-25、9-30、9-35、9-40、9-45、9-50、9-55tt或9-65中的任意数。在其他实施方案中,N选自10-15、10-20、10-25、10-30、tt10-35、10-40、10-45、10-50、10-55或10-65中的任意数。应当理解N可tt以选自包含类似但更高级的范围。tt

  在一实施方案中,可用于生物标记子集或组的生物标记的数目基于生tt物标记值的特定组合的灵敏性和特异性值。本文所用术语“灵敏性”和“特tt异性”是关于基于在个体的生物学样品中检测的一个或多个生物标记值来tt正确分类个体患有胰腺癌或不患有胰腺癌的能力。“灵敏性”指生物标记或tt多个生物标记关于正确分类患有胰腺癌的个体的性能。“特异性”指生物标tt记或多个生物标记关于正确分类不患有胰腺癌的个体的性能。例如,用于tt测试一组对照样品和胰腺癌样品的一组标记的85%特异性和90%灵敏性指tt85%的对照样品由该组正确分类为对照样品,并且90%的胰腺癌样品由该tt组正确分类为胰腺癌样品。期望或优选的最小值可以如实施例3所述确定。tt代表性组如表4-11所示,其示出一系列3-10个生物标记的100个不同的组,tt其具有所示的每组的特异性和灵敏性水平。这些组的每个中每个标记出现tt的总数目在每个表的底部示出。tt

  在一方面,在个体中通过以下方法检测或诊断胰腺癌:对来自所述个tttttt体的生物学样品进行测定并检测生物标记值,所述生物标记值每个对应于tt生物标记CTSB、C5a或C5中的至少一个以及选自表1第2列的生物标记tt列表的至少N个额外的生物标记,其中N等于2、3、4、5、6、7、8或9。tt在另一方面,在个体中通过以下方法检测或诊断胰腺癌:对来自所述个体tt的生物学样品进行测定并检测生物标记值,所述生物标记值每个对应于生tt物标记CTSB、C5a或C5以及选自表1第2列的生物标记列表的至少N个tt额外的生物标记之一,其中N等于1、2、3、4、5、6或7。在另一方面,tt在个体中通过以下方法检测或诊断胰腺癌:对来自所述个体的生物学样品tt进行测定并检测生物标记值,所述生物标记值每个对应于生物标记CTSBtt以及选自表1第2列的生物标记列表的至少N个额外的生物标记之一,其tt中N等于2、3、4、5、6、7、8或9。在另一方面,在个体中通过以下方tt法检测或诊断胰腺癌:对来自所述个体的生物学样品进行测定并检测生物tt标记值,所述生物标记值每个对应于生物标记C5a以及选自表1第2列的tt生物标记列表的至少N个额外的生物标记之一,其中N等于2、3、4、5、tt6、7、8或9。在另一方面,在个体中通过以下方法检测或诊断胰腺癌:对tt来自所述个体的生物学样品进行测定并检测生物标记值,所述生物标记值tt每个对应于生物标记C5以及选自表1第2列的生物标记列表的至少N个tt额外的生物标记之一,其中N等于2、3、4、5、6、7、8或9。tt

  本文鉴定的胰腺癌生物标记表示较大数目的可以用于有效检测或诊断tt胰腺癌的生物标记的子集或组的选择。期望数目的这类生物标记的选择取tt决于所选生物标记的特定组合。重要的是记住:用于检测或诊断胰腺癌的tt生物标记的组还可以包括在表1第2列中未发现的生物标记,并且包括在tt表1第2列中未发现的额外的生物标记可以减少选自表1第2列的特定子tt集或组中的生物标记的数目。如果额外的生物医学信息与生物标记值联合tt用于建立对于给定测定可接受的灵敏性和特异性值,则用于子集或组的来tt自表1第2列的生物标记的数目也可以减少。tt

  可以影响用于生物标记的子集或组的生物标记数目的另一因素是用于tt从进行胰腺癌诊断的个体中获得生物学样品的方法。在精心控制的样品获tt取环境中,满足期望的灵敏性和特异性值所必需的生物标记的数目会低于tt在样品收集、处理和贮存中可以存在更多变化的情况中的数目。在研究表1tttttt第2列所列的生物标记列表中,利用多个样品收集位点来收集数据以进行tt分类器训练。这提供了更稳健的生物标记,其对于样品收集、处理和贮存tt中的变化较不敏感,但是如果训练数据全部在非常相似的条件下获得,则tt还可以要求子集或组中更大的生物标记数目。tt

  本申请的一方面可以参考图1A和1B来一般性描述。生物学样品获得tt自所关注的一个或多个个体。然后测定该生物学样品以检测所关注的一个tt或多个(N个)生物标记的存在,并且确定所述N个生物标记的每一个的生tt物标记值(在图1B中称为标记RFU)。一旦检测生物标记并指定生物标记值,tt则如本文详细描述地对每个标记进行评分或者分类。然后组合标记评分以tt提供总诊断评分,其表示获取样品的个体患有胰腺癌的似然性。tt

  “生物学样品”、“样品”和“测试样品”在本文中可互换使用,指获tt得自或以另外的方式源自个体的任何材料、生物液体、组织或者细胞。这tt包括血液(包括全血、白细胞、外周血单核细胞、血沉棕黄层(buffy coat)、tt血浆和血清)、痰、泪液、粘液、洗鼻液(wash)、鼻抽吸物(aspirate)、呼吸tt物(breath)、尿、精液、唾液、腹腔灌洗液、腹水、囊液、脑膜液(meningeal ttfluid)、羊水、腺体液(glandular fluid)、胰液、淋巴液、胸膜液、乳头抽吸tt物、支气管抽吸物、支气管刷检(brushing)、滑液、关节抽吸物、器官分泌tt物、细胞、细胞提取物和脑脊液。其还包括上述所有材料的实验分离级分。tt例如,血液样品可以分级分离为血清、血浆或者含有诸如红细胞或白细胞tt(white blood cell)(白细胞(leukocyte))的特定类型血细胞的级分。如果需要,tt样品可以是来自个体的样品的组合,如组织与液体样品的组合。术语“生tt物学样品”还包括含有均质固体材料的材料,如来自粪便样品、组织样品tt或组织活检样品的材料。术语“生物学样品”还包括源自组织培养或者细tt胞培养的材料。可以采用获得生物学样品的任何合适方法;示例性方法包tt括如静脉切开放血术、拭子(如口腔拭子)以及细针抽吸活检方法。易受细针tt抽吸影响的示例性组织包括淋巴结、肺、肺洗液、BAL(支气管肺泡灌洗液)、tt甲状腺、乳腺、胰和肝。样品还可以通过显微切割(如激光捕获显微切割tt(LCM)或激光显微切割(LMD))、膀胱冲洗、涂片(如PAP涂片)或导管灌洗tt收集。获得自或源自个体的“生物学样品”包括在获得自所述个体之后已tt经通过任何合适方式处理的任何此类样品。tt

  此外,应当认识到生物学样品可以通过从许多个体中取得生物学样品tt并将它们混合或混合每个个体的生物学样品的等份而获得。混合的样品可tt以作为来自单个个体的样品进行处理,并且如果在混合的样品中确定癌症tt的存在,则可以将每个个体的生物学样品再进行测试以确定哪个/哪些个体tt患有胰腺癌。tt

  为了本说明书的目的,短语“归因于来自个体的生物学样品的数据”tt指所述数据以某种形式源自所述个体的生物学样品或利用所述个体的生物tt学样品产生。数据在产生后可以被重新格式化、修改或以数学方式改变至tt某种程度,例如通过从一种测量系统中的单位转变为另一测量系统中的单tt位;但是应当理解,数据源自所述生物学样品或利用所述生物学样品产生。tt

  “靶标”、“靶分子”和“分析物”在本文中可互换使用,指可能存在tt于生物学样品中的任何所关注的分子。“所关注的分子”包括特定分子的任tt何微小变化,如在蛋白的情况下,例如氨基酸序列的微小变化、二硫键形tt成、糖基化、脂质化、乙酰化、磷酸化或者任何其他操作或修饰,如与基tt本不改变分子同一性的标记组分偶联。“靶分子”、“靶标”或“分析物”是tt一种类型或种类的分子或多分子结构的一组拷贝。“靶分子”、“靶标”和“分tt析物”指一组以上这样的分子。示例性靶分子包括蛋白、多肽、核酸、碳tt水化合物、脂质、多糖、糖蛋白、激素、受体、抗原、抗体、affybodies、tt抗体模拟物(mimic)、病毒、病原体、毒性物质、底物、代谢物、过渡态类tt似物、辅因子、抑制剂、药物、染料、营养素、生长因子、细胞、组织以tt及前述任何物质的任何片段或部分。tt

  如本文所用,“多肽”、“肽”和“蛋白”在本文中可互换使用,指任何tt长度的氨基酸聚合物。聚合物可以是线性或支化的,其可以包含修饰的氨tt基酸,并且其可以被非氨基酸中断。该术语还涵盖已经被天然修饰或者通tt过干预修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂质化、乙酰tt化、磷酸化或任何其他操作或修饰,如与标记组分偶联。该定义还包括例tt如含有一个或多个氨基酸类似物(包括例如非天然氨基酸等)以及本领域已tt知的其他修饰的多肽。多肽可以是单链或缔合(associated)链。该定义还包tt括前蛋白和完整的成熟蛋白;衍生自成熟蛋白的肽或多肽;蛋白的片段;tt剪接变体;蛋白的重组形式;具有氨基酸修饰、缺失或取代的蛋白变体;tttttt消化;以及翻译后修饰,如糖基化、乙酰化、磷酸化等。tt

  如本文所用,“标记”和“生物标记”可互换使用,指指示个体中正常tt或异常过程或者个体中疾病或其他疾病状况的迹象或者是个体中正常或异tt常过程或者个体中疾病或其他疾病状况的迹象的靶分子。更具体地,“标记”tt或“生物标记”是与无论正常与否的特定生理状态或过程的存在相关的解tt剖学、生理学、生物化学或分子参数,并且如果是异常的,则无论是慢性tt或急性的。生物标记可以通过各种方法检测和测量,包括实验室测定和医tt学成像。当生物标记是蛋白时,还可以使用相应基因的表达作为生物学样tt品中相应蛋白生物标记的量或存在或不存在或者编码该生物标记的基因或tt控制该生物标记表达的蛋白的甲基化状态的替代测量。tt

  如本文所用,“生物标记值”、“值”、“生物标记水平”和“水平”可互tt换使用,指使用任何分析方法来检测生物学样品中的生物标记而进行的测tt量,其示出所述生物学样品中的生物标记、对于所述生物标记或对应于所tt述生物标记的存在、不存在、绝对量或浓度、相对量或浓度、效价、水平、tt表达水平、测量水平的比率等。所述“值”或“水平”的确切性质取决于tt用于检测生物标记的特定分析方法的具体设计和组分。tt

  当生物标记表示个体中异常过程或疾病或其他疾病状况或者是个体中tt异常过程或疾病或其他疾病状况的迹象时,该生物标记通常描述为与表示tt个体中正常过程或不存在疾病或其他疾病状况或者是个体中正常过程或不tt存在疾病或其他疾病状况的迹象的生物标记的表达水平或值相比时是过表tt达或低表达的。“上调”、“上调的”、“过表达”、“过表达的”及其任何变体tt可互换使用,指生物学样品中生物标记的值或水平高于通常在来自健康或tt正常个体的相似生物学样品中检测的所述生物标记的值或水平(或者值或tt水平的范围)。该术语还可以指生物学样品中生物标记的值或水平高于在特tt定疾病的不同阶段检测的生物标记的值或水平(或者值或水平的范围)。tt

  “下调”、“下调的”、“低表达”或“低表达的”及其任何变体可互换tt使用,指生物学样品中生物标记的值或水平低于通常在来自健康或正常个tt体的相似生物学样品中检测的生物标记的值或水平(或者值或水平的范围)。tt该术语还可以指生物学样品中生物标记的值或水平低于在特定疾病的不同tt阶段检测的所述生物标记的值或水平(或者值或水平的范围)。tt

  此外,过表达的或低表达的生物标记还可以指与所述生物标记的“正tt常”表达水平或值相比是“差异表达的”或者具有“不同水平”或“不同tt值”,所述“正常”表达水平或值表示个体中正常过程或不存在疾病或其他tt疾病状况或者是个体中正常过程或不存在疾病或其他疾病状况的迹象。因tt此,生物标记的“差异表达”还可以指与所述生物标记的“正常”表达水tt平不同。tt

  术语“不同的基因表达”和“差异表达”可互换使用,指在患有指定tt疾病的对象中基因(或其相应的蛋白表达产物)的表达被激活至相对于其在tt正常或对照对象中的表达较高或较低的水平。该术语还包括基因(或其相应tt的蛋白表达产物)的表达在相同疾病的不同阶段被激活至较高或较低水平。tt还应当理解差异表达的基因可以在核酸水平或蛋白水平激活或抑制,或者tt可以进行可变剪接以获得不同的多肽产物。这样的差异可以通过许多改变tt来证实,包括多肽的mRNA水平、表面表达、分泌或其他分配(partitioning)。tt不同的基因表达可以包括比较两个或更多个基因或者它们的基因产物之间tt的表达;或者比较两个或更多个基因或者它们的基因产物之间的表达的比tt率;或者甚至比较相同基因的两种不同加工的产物,其在正常对象与患病tt对象之间或者在相同疾病的不同阶段之间是不同的。差异表达包括在例如tt正常和患病细胞或者经历不同疾病事件或疾病阶段的细胞中的基因或其表tt达产物在时间或细胞表达模式中的定量以及定性的差异。tt

  如本文所用,“个体”指测试对象或患者。个体可以是哺乳动物或非哺tt乳动物。在许多实施方案中,个体是哺乳动物。哺乳动物个体可以是人或tt非人。在许多实施方案中,个体是人。健康或正常个体是其中通过常规诊tt断方法不可检测出所关注的疾病或疾病状况(包括例如胰腺疾病、胰腺相关tt疾病或其他胰腺疾病状况)的个体。tt

  “诊断(Diagnose)”、“诊断(diagnosing)”、“诊断(diagnosis)”及其变体tt指基于个体相关的一种或多种迹象、症状、数据或其他信息对所述个体的tt健康状态或疾病状况的检测、确定或识别。个体的健康状态可以诊断为健tt康/正常(即诊断为不存在疾病或疾病状况)或者诊断为患病/异常(即诊断为tt存在疾病或疾病状况或者对疾病或疾病状况的特征的评价)。对于特定疾病tt或疾病状况,术语“诊断(diagnose)”、“诊断(diagnosing)”、“诊断(diagnosis)”tttttt等涵盖对疾病的初始检测;对疾病的表征或分类;疾病的进展、缓解或复tt发的检测;以及在给予个体治疗或疗法后疾病应答的检测。胰腺癌的诊断tt包括区分患有癌症与不患有癌症的个体。其还包括区分GI和正常对照与胰tt腺癌。tt

  预后“(Prognose)”、“预后(prognosing)”、“预后(prognosis)”及其变体tt指预测患有疾病或疾病状况的个体中所述疾病或疾病状况的未来进程(如tt预测患者存活),并且这类术语涵盖在给予个体治疗或疗法后评价疾病的应tt答。tt

  “评价(Evaluate)”、“评价(evaluating)”、“评价(evaluation)”及其变体tt涵盖“诊断”和“预后”,并且还涵盖对不患病个体的疾病或疾病状况的未tt来进程的确定或预测以及确定或预测在表面上已经治愈疾病的个体中所述tt疾病或疾病状况复发的似然性。术语“评价”还包括评价个体对疗法的应tt答,例如预测个体是否可能对治疗剂顺利地应答,或者不大可能对治疗剂tt应答(或者会例如经历毒性或其他不期望的副作用);选择给予个体的治疗tt剂;或者监测或确定个体对已经给予该个体的疗法的应答。因此,“评价”tt胰腺癌可以包括例如以下任何方面:预后个体中胰腺癌的未来进程;预测tt表面上已经治愈胰腺癌的个体中胰腺癌的复发;或者确定或预测个体对于tt胰腺癌治疗的应答;或者基于确定源自个体生物学样品的生物标记值来选tt择给予该个体的胰腺癌治疗。tt

  任何如下实例均可以称作“诊断”或“评价”胰腺癌:最初检测胰腺tt癌的存在或不存在;确定胰腺癌的具体阶段、类型或亚型或者其他分类或tt特征;确定可疑团块是否为良性病变或恶性胰腺肿瘤;或者检测/监测胰腺tt癌进展(如监测肿瘤生长或转移扩散)、缓解或复发。tt

  如本文所用,“额外的生物医学信息”指除了使用本文所述的任何生物tt标记之外的对个体所做的与癌症风险或更具体地与胰腺癌风险相关的一个tt或多个评价。“额外的生物医学信息”包括任何以下方面:个体的物理描述tt(physical descriptor),包括通过任何具有三维重建的对比增强的多层(多检测tt器)螺旋计算机断层扫描(CT)、经皮或内镜超声(US或EUS)、内镜逆行胰胆tt管造影(ERCP)、磁共振成像(MRI)、MR胰胆管造影(MRCP)或者腹部超声tt观察到的胰腺团块;个体的身高和/或体重;体重变化;个体的种族;职业tttttt史;胰腺癌(或其他癌症)的家族史;个体或家族成员中与胰腺癌(或其他癌tt症)的高风险相关的遗传标记的存在;胰腺团块或其他腹部团块的存在或不tt存在;团块的大小;团块的位置;团块和相关腹部区域的形态学(例如通过tt成像观察的);临床症状如腹部疼痛、体重减轻、厌食、早饱、腹泻、或脂tt肪泻、黄疸、最近发生的非典型糖尿病、最近但原因不明的血栓静脉炎历tt史、或者以前的胰腺炎攻击等;基因表达值;个体的物理描述,包括通过tt放射成像观察到的物理描述;个体的身高和/或体重;个体的性别;个体的tt种族;吸烟史;酒精使用历史;职业史;暴露于已知的致癌物(如暴露于任tt何石棉、氡气、化学品、来自火的烟以及空气污染,这可以包括来自静止tt或移动来源的排放物,如工业/工厂或汽车/海运/飞机排放物);暴露于二手tt烟;以及胰腺癌或其他癌症的家族史。生物标记水平的测试联合任何额外tt的生物医学信息的评价,包括其他实验室测试(例如,CA19-9、血清胆红素tt浓度、碱性磷酸酶活性、贫血的存在)与单独测试生物标记或单独评价额外tt的生物医学信息的任何特定项目(例如,单独的超声成像)相比,可以例如改tt善检测胰腺癌(或其他胰腺癌相关用途)的灵敏性、特异性和/或AUC。额外tt的生物医学信息可以通过使用本领域已知的常规技术得自个体,如通过使tt用常规患者问卷调查或健康史问卷调查等得自个体自身,或者得自医学从tt业人员等。生物标记水平的测试联合任何额外的生物医学信息的评价与单tt独测试生物标记或单独评价额外的生物医学信息的任何特定项目(如单独tt的CT成像)相比,可以例如改善检测胰腺癌(或其他胰腺癌相关用途)的灵tt敏性、特异性和/或AUC。tt

  癌症相关抗原19-9(CA19-9)是已知的胰腺癌的血液标记。报道的CAtt19-9对胰腺癌的灵敏性和特异性分别为80-90%。然而,这些值与肿瘤大小tt密切相关。CA19-9鉴定患有小型手术可切除的癌症的患者的准确性有限。ttCA19-9需要Lewis血型抗原(糖基转移酶)的存在以表达。在具有Lewis阴tt性表型的个体(估计5-10%的群体)中,CA19-9水平不是可用的肿瘤标记。ttCA19-9的特异性也是有限的。CA19-9经常在患有各种良性胆胰病症的患tt者中升高。CA19-9升高的程度(在最初出现和手术后环境中)与长期预后有tt关。此外,在看来患有潜在的可切除的疾病的患者中,CA19-9水平的数量tt级还可以有助于预测放射显影隐匿性转移性疾病的存在。CA19-9水平的系tttttt列监测可用于随访潜在的根治性手术后的患者以及接受晚期疾病的化疗的tt患者。升高的CA19-9水平通常在复发性疾病的放射显影出现之前,但是tt疾病发展的证实应当通过成像研究和/或活组织检查来进行。生物标记水平tt的检测联合CA19-9与单独CA19-9相比,可以例如改善检测胰腺癌(或其tt他胰腺癌相关用途)的灵敏性、特异性和/或AUC。tt

  术语“曲线下面积”或“AUC”指接受者操作特征(ROC)曲线下的面tt积,这两个术语均为本领域所熟知。AUC测量可用于比较完整数据范围内tt的分类器的精确性。具有较大AUC的分类器具有较大的能力来正确分类两tt个所关注的组(如胰腺癌样品与正常或对照样品)之间的未知情况。ROC曲tt线可用于对特定特征的性能作图(如本文描述的任何生物标记和/或任何额tt外的生物医学信息项目),以在两个群体之间进行区分(如患有胰腺癌的病例tt与无胰腺癌的对照)。通常,整个群体(如病例与对照)的特征数据基于单个tt特征的值递增分类。然后,对于该特征的每个值,计算数据的真阳性率和tt假阳性率。真阳性率通过计数高于该特征值的病例数,然后除以病例总数tt来确定。假阳性率通过计数高于该特征值的对照数,然后除以对照总数来tt确定。尽管这个定义指其中特征在病例中与在对照中相比升高的情况,但tt是这个定义还适用于其中特征在病例中与在对照中相比降低的情况(在这tt种情况下,计数低于该特征值的样品)。ROC曲线可以对单个特征以及其他tt单个输出产生,例如两个或更多个特征的组合可以是数学组合(如加、减、tt乘等)以提供单个的和值,并且该单个的和值可以在ROC曲线中绘制。此tt外,其中组合产生单个输出值的多个特征的任意组合可以在ROC曲线中绘tt制。这些特征的组合可以包括测试。ROC曲线是测试的真阳性率(灵敏性)tt对测试的假阳性率(1-特异性)的作图。tt

  如本文所用,“检测”或“确定”生物标记值包括使用观察和记录对应tt于生物标记值的信号所需的设备以及产生该信号所需的材料。在各种实施tt方案中,生物标记值使用任何合适的方法检测,包括荧光、化学发光、表tt面等离子共振、表面声波、质谱、红外线光谱、拉曼光谱、原子力显微术、tt扫描隧道显微术、电子化学检测方法、核磁共振、量子点等。tt

  “固体支持物”在本文中指具有分子可以直接或间接,通过共价键或tt非共价键附着的表面的任何支持物。“固体支持物”可以具有各种物理形式,tttttt可以包括例如膜;芯片(如蛋白芯片);玻片(如载玻片或盖玻片);柱;空心、tt固体、半固体、有孔或有腔的颗粒,例如珠;凝胶;纤维,包括光学纤维tt材料;基质;以及样品容器。示例性样品容器包括样品孔、管、毛细管、tt小瓶以及能够容纳样品的任何其他容器、沟槽或凹陷。样品容器可以包含tt于多样品平台上,如微量滴定板、玻片、微流体装置等。支持物可以由天tt然或合成材料、有机或无机材料组成。其上附着捕获剂的固体支持物的成tt分通常取决于附着方法(如共价附着)。其他示例性容器包括微滴和微流体控tt制的或大量的油/水性乳液,在其中可以进行测定和相关操作。合适的固体tt支持物包括例如塑料、树脂、多糖、硅石或基于硅石的材料、官能化玻璃、tt改性的硅、碳、金属、无机玻璃、膜、尼龙、天然纤维(例如丝、羊毛和棉)、tt聚合物等。包含固体支持物的材料可以包含反应基团,例如羧基、氨基或tt羟基以用于捕获剂的附着。聚合固体支持物可以包括如聚苯乙烯、聚对苯tt二甲酸乙二醇酯、聚乙酸乙烯酯、聚氯乙烯、聚乙烯吡咯烷酮、聚丙烯腈、tt聚甲基丙烯酸甲酯、聚四氟乙烯、丁基橡胶、苯乙烯丁二烯橡胶、天然橡tt胶、聚乙烯、聚丙烯、(聚)四氟乙烯、(聚)偏氟乙烯、聚碳酸酯和聚甲基戊tt烯。可以使用的合适的固体支持物颗粒包括例如编码的颗粒,如Luminex-tt型编码的颗粒、磁性颗粒以及玻璃颗粒。tt

  生物标记的示例性用途tt

  在许多示例性实施方案中,本发明提供了诊断个体的胰腺癌的方法,tt所述方法通过检测对应于个体的循环如血清或血浆中存在的一个或多个生tt物标记的一个或多个生物标记值来进行,并且通过任何数目的分析方法来tt进行,包括本文所述的任何分析方法。这些生物标记例如在胰腺癌个体中tt与在无胰腺癌个体相比差异表达。生物标记在个体中的差异表达的检测可tt以用于例如允许胰腺癌的早期诊断,区分良性和恶性团块(例如,在计算机tt断层扫描(CT)、MRI或超声上观察到的团块),监测胰腺癌复发,或者用于tt鉴别诊断其他临床疾病状况如急性或慢性胰腺炎(或两者)、胰腺梗阻、ttGERD、胆石或者后来发现为良性的异常成像。tt

  本文所述的任何生物标记可以用于胰腺癌的各种临床指征,包括以下tt任何方面:检测胰腺癌(例如在高风险个体或群体中);表征胰腺癌(例如,tttttt确定胰腺癌类型、亚型或阶段),如通过区分胰腺癌(胰腺癌)与急性或慢性tt胰腺炎(或两种)、胰腺梗阻、GERD、胆石或者后来发现为良性的异常成像tt和/或区分腺癌与其他恶性细胞类型(或者以其他方式促进组织病理学);确tt定胰腺团块是否为良性或恶性胰腺肿瘤;确定胰腺癌预后;监测胰腺癌进tt展或缓解;监测胰腺癌复发;监测转移;治疗选择;监测对治疗剂或其他tt治疗的应答;对个体的内镜超声(EUS)筛查分层(stratification)(例如,鉴定tt面临较高胰腺癌风险从而最可能受益于放射学筛查的那些个体,因此增加ttEUS的阳性预测值);组合生物标记测试与额外的生物医学信息如吸烟或饮tt酒史等,或者CA19-9水平,指示胰腺癌的高风险的遗传标记的存在等,tt或者与团块大小,形态学,腹水的存在等(例如以提供与CA19-9测试或其tt他生物标记测试或者与团块大小、形态学等相比具有增加的诊断性能的测tt定);促进腹部团块为恶性或良性的诊断;促进一旦在CT、MRI、PET或ttEUS上观察到腹部团块则作出临床决定(例如,如果认为腹部团块是低风险tt的,例如如果基于生物标记的测试是阴性的,有或无团块大小的分类,则tt进行重复放射扫描,或者如果认为该团块是中高风险的,例如如果基于生tt物标记的测试是阳性的,有或无团块大小或组织侵袭程度的分类,则考虑tt活组织检查);或者促进关于临床随访的决定(例如,在成像上观察到腹部团tt块后是否进行重复放射成像扫描、细针活组织检测或手术)。生物标记测试tt可以单独提高高风险个体的EUS筛查的阳性预测值(PPV)。除了联合EUStt筛查之外,本文所述的生物标记还可以与用于与胰腺癌癌的任何其他成像tt方式如CT、MRI或PET扫描联合使用。此外,所述生物标记还可用于在tt通过成像方式或其他临床相关性检测胰腺癌指征之前或者在症状出现之前tt允许这些应用的某一些。其还包括区分急性或慢性胰腺炎(或两者)、胰腺梗tt阻、GERD、胆石或者后来发现为良性的异常成像与胰腺癌。tt

  本文所述的任何生物标记可以用于诊断胰腺癌的示例性方式是:未知tt患有胰腺癌的个体中一个或多个所述生物标记的差异表达可以表明该个体tt患有胰腺癌,从而使得可以在治疗最有效的疾病早期检测胰腺癌,也许在tt通过其他方式检测胰腺癌之前或者在症状出现之前检测胰腺癌。胰腺癌期tt间一个或多个生物标记的过表达可以指示胰腺癌的进展,如胰腺肿瘤生长tt和/或转移(并且因此表示不良预后);而一个或多个生物标记差异表达程度tttttt的降低(即在随后的生物标记测试中,个体中的表达水平趋向或接近“正常”tt表达水平)可以指示胰腺癌的缓解,如胰腺肿瘤缩小(并且因此提示良好或较tt好的预后)。相似地,在胰腺癌治疗期间一个或多个生物标记差异表达的程tt度增加(即在随后的生物标记测试中,个体中的表达水平进一步远离“正常”tt表达水平)可以指示胰腺癌的进展,并因此表示所述治疗是无效的;而在胰tt腺癌治疗期间一个或多个生物标记的差异表达降低可以指示胰腺癌的缓tt解,并因此表示该治疗是成功的。此外,在个体看起来已经治愈胰腺癌之tt后一个或多个生物标记的差异表达的增加或降低可指示胰腺癌的复发。在tt这种情况下,例如可以在早期对个体重新启动治疗(或者如果个体维持治tt疗,则修改治疗方案以增加剂量和/或频率),否则直至晚期还未检测到胰腺tt癌的复发。此外,个体中一个或多个生物标记的差异表达水平可以预测个tt体对特定治疗剂的应答。在监测胰腺癌复发或进展中,生物标记表达水平tt的改变可以指示需要重复成像(如重复EUS),例如来确定胰腺癌活性或确tt定需要改变治疗方案。tt

  本文所述的任何生物标记的检测可以特别地在胰腺癌治疗后使用或者tt与胰腺癌治疗联合使用,如评价治疗的成功或者监测治疗后胰腺癌的缓解、tt复发和/或进展(包括转移)。胰腺癌治疗可以包括例如给予个体治疗剂、进tt行手术(如手术切除至少一部分胰腺肿瘤或者去除胰腺和周围组织)、给予放tt疗或本领域所用的任何其他类型的胰腺癌治疗方法以及这些治疗的任意组tt合。例如,任何生物标记可以在治疗后检测至少一次,或者可以在治疗后tt检测多次(如定期检测),或者可以在治疗之前和之后检测。个体中任何生物tt标记随时间的差异表达水平可以指示胰腺癌的进展、缓解或复发,其实例tt包括以下方面:生物标记的表达水平在治疗后与治疗前相比增加或降低;tt生物标记的表达水平在治疗后较晚时间点与治疗后较早时间点相比增加或tt降低;以及生物标记的表达水平在治疗后的一个时间点与该生物标记的正tt常水平相比不同。tt

  作为具体的实例,本文所述的任何生物标记的生物标记水平可以在手tt术前和手术后(例如手术后2-8周)的血清或血浆样品中确定。手术后样品与tt手术前样品相比生物标记表达水平的增加可以指示胰腺癌的进展(如不成tt功的手术);而手术后样品与手术前样品相比生物标记表达水平的降低可以tttttt指示胰腺癌的消退(如成功除去胰腺肿瘤的手术)。生物标记水平的相似分析tt可以在其他形式的治疗之前和之后进行,如在放疗或者给予治疗剂或癌症tt疫苗之前和之后进行。tt

  除了作为独立运行的诊断测试的生物标记水平测试之外,生物标记水tt平还可以联合SNP或者指示疾病易感性风险增加的其他遗传病变或变异性tt的确定来进行。(参见,例如,Amos et al.,Nature Genetics40,616-622(2009))。tt

  除了作为独立运行的诊断测试的生物标记水平测试之外,生物标记水tt平还可以联合放射筛查进行。除了作为独立运行的诊断测试的生物标记水tt平测试之外,生物标记水平还可以联合相关症状或遗传测试进行。本文所tt述的任何生物标记的检测可以在已通过成像观察到胰腺团块之后用来辅助tt诊断胰腺癌并指导适当的个体临床护理,包括由适当的外科专家或者在不tt可切除的患者中通过姑息疗法来护理。除了联合相关症状或风险因素测试tt生物标记水平,关于生物标记的信息还可以联合其他类型的数据进行评价,tt特别是指示个体的胰腺癌风险的数据(例如,患者临床史、症状、胰腺癌家tt族史、吸烟或饮酒史、糖尿病的突然发生、黄疸、风险因素如存在遗传标tt记、和/或其他生物标记的状态等)。这些不同数据可以通过自动化方法评价,tt如计算机程序/软件,其可以在计算机或其他设备/装置中实施。tt

  除了在高风险个体中联合放射筛查测试生物标记水平之外(如联合在tt成像扫描上观察到的胰腺团块的大小或其他特征评价生物标记水平),关于tt生物标记的信息还可以联合其他类型的数据进行评价,特别是指示个体的tt胰腺癌风险的数据(例如,患者临床史、症状、癌症家族史、风险因素如个tt体是否是吸烟者、酗酒者和/或其他生物标记的状况等)。这些不同数据可以tt通过自动化方法评价,如计算机程序/软件,其可以在计算机或其他设备/tt装置中实施。tt

  任何所述生物标记还可以用于成像测试。例如,显像剂可以与任何所tt述生物标记偶联,这可以用于辅助胰腺癌诊断、监测疾病进展/缓解或转移、tt监测疾病复发或者监测对治疗的应答等。tt

  生物标记和生物标记值的检测和确定tt

  本文所述的生物标记的生物标记值可以使用任何已知的分析方法来检tttttt测。在一实施方案中,生物标记值使用捕获试剂(capture reagent)检测。如tt本文所用,“捕获剂(capture agent)”或“捕获试剂”指能够特异性结合生物tt标记的分子。在许多实施方案中,捕获试剂可以在溶液中暴露于生物标记,tt或者可以暴露于生物标记,同时该捕获试剂固定在固体支持物上。在其他tt实施方案中,捕获试剂含有与固体支持物上的第二特征反应的特征。在这tt些实施方案中,捕获试剂可以在溶液中暴露于生物标记,然后该捕获试剂tt上的特征可以联合固体支持物上的第二特征来将所述生物标记固定在固体tt支持物上。捕获试剂基于进行的分析类型加以选择。捕获试剂包括但不限tt于适配体、抗体、adnectin、锚蛋白、其他抗体模拟物(mimetic)及其他蛋白tt支架、自身抗体、嵌合物、小分子、F(ab′)2片段、单链抗体片段、Fv片段、tt单链Fv片段、核酸、凝集素、配体-结合受体、affybodies、纳米抗体tt(nanobodies)、印迹聚合物(imprinted polymer)、高亲合性多聚体(avimer)、tt肽模拟物(peptidomimetic)、激素受体、细胞因子受体及合成受体以及这些tt物质的修饰物和片段。tt

  在一些实施方案中,生物标记值使用生物标记/捕获试剂复合物来检tt测。tt

  在其他实施方案中,生物标记值得自生物标记/捕获试剂复合物,并且tt例如作为生物标记/捕获试剂相互作用之后的反应结果间接检测,但是依赖tt于生物标记/捕获试剂复合物的形成。tt

  在一些实施方案中,生物标记值从生物学样品中的生物学标记直接检tt测。tt

  在一实施方案中,生物标记使用多重形式检测,这允许在生物学样品tt中同时检测两个或更多个生物标记。在多重形式的一实施方案中,捕获试tt剂直接或间接、共价或非共价地固定在固体支持物上分散的位置。在另一tt实施方案中,多重形式使用分离的固体支持物,其中每个固体支持物具有tt与该固体支持物相关的独特捕获试剂,例如量子点。在另一实施方案中,tt单独的装置用于检测生物学样品中待检测的多个生物标记的每一个。可以tt配置单独的装置以允许同时处理生物学样品中的每个生物标记。例如,可tt以使用微量滴定板,由此该板中的每个孔用于独特地分析生物学样品中待tt检测的多个生物标记之一。tt

  在一个或多个前述实施方案中,可以使用荧光标签(tag)来标记生物标tt记/捕获复合物的组分以允许检测生物标记值。在许多实施方案中,使用已tt知技术可以将荧光标记(fluorescent label)与对本文所述的任何生物标记特tt异性的捕获试剂偶联,然后该荧光标记可以用于检测相应的生物标记值。tt合适的荧光标记包括稀土元素螯合物、荧光素及其衍生物、罗丹明及其衍tt生物、丹磺酰、别藻蓝蛋白、PBXL-3、Qdot 605、丽丝胺(Lissamine)、藻tt红蛋白、德克萨斯红及其他这样的化合物。tt

  在一实施方案中,荧光标记是荧光染料分子。在一些实施方案中,荧tt光染料分子包括至少一个取代的吲哚环(indolium ring)体系,其中吲哚环的tt3-碳上的取代基含有化学反应性基团或偶联的物质。在一些实施方案中,tt染料分子包括AlexFluor分子,例如AlexaFluor 488、AlexaFluor 532、ttAlexaFluor 647、AlexaFluor 680或AlexaFluor 700。在其他实施方案中,染tt料分子包括第一类型和第二类型的染料分子,如两种不同的AlexaFluor分tt子。在其他实施方案中,染料分子包括第一类型和第二类型的染料分子,tt并且两种染料分子具有不同的发射光谱。tt

  荧光可以用与大范围的测定形式相容的许多仪器测量。例如,已经设tt计了分光荧光计来分析微量滴定板、显微镜载玻片、印刷阵列(printed ttarray)、小杯等。参见Principles of Fluorescence Spectroscopy,by J.R.Lakowicz,ttSpringer Science+Business Media,Inc.,2004。参见Bioluminescence & ttChemiluminescence:Progress & Current Applications;Philip E.Stanley and ttLarry J.Kricka editors,World Scientific Publishing Company,January2002。tt

  在一个或多个前述实施方案中,化学发光标签可以任选地用于标记生tt物标记/捕获复合物的组分以允许检测生物标记值。合适的化学发光材料包tt括任何草酰氯、Rodamin 6G、Ru(bipy)32+、TMAE(四三(二甲基氨基)乙烯tt(tetrakis(dimethylamino)ethylene))、连苯三酚(1,2,3-三羟基苯tt(1,2,3-trihydroxibenzene))、光泽精、过氧草酸酯(peroxyoxalate)、芳基草酸tt酯、吖啶酯(acridinium ester)、二氧杂环丁烷(dioxetane)等。tt

  在其他实施方案中,检测方法包括酶/底物组合,其产生对应于生物标tt记值的可检测信号。通常,酶催化生色底物的化学改变,这种改变可以使tt用多种技术测量,包括分光光度法、荧光及化学发光。合适的酶包括例如tttttt萤光素酶、萤光素、苹果酸脱氢酶、脲酶、辣根过氧化物酶(HRPO)、碱性tt磷酸酶、β-半乳糖苷酶、葡糖淀粉酶、溶菌酶、葡萄糖氧化酶、半乳糖氧tt化酶及葡萄糖-6-磷酸脱氢酶、尿酸氧化酶、黄嘌呤氧化酶、乳过氧化物酶、tt微过氧化物酶等。tt

  在其他实施方案中,检测方法可以是产生可测量信号的荧光、化学发tt光、放射性核素或酶/底物组合的组合。多种方式的信号在生物标记测定形tt式中可以具有独特且有利的特征。tt

  更特别地,本文所述的生物标记的生物标记值可以使用已知的分析方tt法来检测,包括单重适配体测定、多重适配体测定、单重或多重免疫测定、ttmRNA表达谱、miRNA表达谱、质谱分析、组织学/细胞学方法等,这在tt下文中详细地描述。tt

  使用基于适配体的测定确定生物标记值tt

  检测和定量生物学样品及其他样品中生理学上有意义的分子的测定在tt科学研究和卫生保健领域是重要的工具。一类这样的测定包括使用包含固tt定在固体支持物上的一个或多个适配体的微阵列。所述适配体各自能够以tt高特异性方式和非常高的亲和力结合靶分子。参见例如题为“核酸配体”tt的美国专利第5,475,096号;还参见例如美国专利第6,242,246号、美国专tt利第6,458,543号和美国专利第6,503,715号,这些专利的题目均为“核酸tt配体诊断生物芯片”。一旦使微阵列与样品接触,则适配体结合所述样品中tt存在的它们各自的靶分子,从而允许确定对应于生物标记的生物标记值。tt

  如本文所用,“适配体”指对靶分子具有特异性结合亲和力的核酸。应tt当了解到亲和相互作用的问题关键是程度;然而在本文中,适配体对其靶tt标的“特异性结合亲和力”指适配体通常以与其结合测试样品中其他组分tt的亲和力相比更高程度的亲和力结合其靶标。“适配体”是一种类型或物种tt的核酸分子的一系列拷贝,其具有特定的核苷酸序列。适配体可以包含任tt何合适数目的核苷酸,包括任何数目的化学修饰的核苷酸。“适配体”指多tt于一个的这种系列的分子。不同的适配体可以具有相同或不同数目的核苷tt酸。适配体可以是DNA或RNA或化学修饰的核酸,并且可以是单链、双tt链的或者含有双链区,以及可以包含高级结构。适配体还可以是光适配体tttttt(photoaptamer),其中该适配体中包含光反应性或化学反应性官能团以允许tt其与其对应靶标共价连接。本文公开的任何适配体方法可以包括使用特异tt性结合相同靶分子的两种或更多种适配体。如下文进一步描述,适配体可tt以包含标签。如果适配体包含标签,则该适配体的所有拷贝不需要具有相tt同的标签。此外,如果不同的适配体各自包含标签,则这些不同的适配体tt可以具有相同的标签或者不同的标签。tt

  适配体可以使用任何已知方法鉴定,包括SELEX方法。一旦鉴定,则tt可以根据任何已知方法制备或合成适配体,这些已知方法包括化学合成方tt法和酶促合成方法。tt

  如本文所用,“SOMAmer”或低解离速率修饰的适配体指具有改善的tt解离速率特征的适配体。SOMAmer可以使用题为“产生具有改善的解离速tt率的适配体的方法”的美国公开第2009/0004667号所述的改进的SELEXtt方法来产生。tt

  术语“SELEX”和“SELEX方法”在本文中可互换使用,通常指(1)tt与(2)的组合,其中(1)是选择以期望的方式与靶分子相互作用的适配体,例tt如以高亲和力结合蛋白,(2)是扩增那些选择的核酸。SELEX方法可以用于tt鉴定对特定靶标或生物标记具有高亲和力的适配体。tt

  SELEX通常包括制备核酸的候选混合物;使所述候选混合物与期望的tt靶分子结合以形成亲和复合物;分离所述亲和复合物与未结合的候选核酸;tt使核酸与所述亲和复合物分开并分离所述核酸;纯化所述核酸;以及鉴定tt特异性适配体序列。所述方法可以包括多次循环以进一步精制所选适配体tt的亲和力。所述方法可以包括在该方法的一个或多个点的扩增步骤。参见tt例如题为“核酸配体”的美国专利第5,475,096号。SELEX方法可以用于tt产生与适配体的靶标共价结合的适配体,以及与适配体的靶标非共价结合tt的适配体。参见例如题为“通过指数富集的核酸配体的系统进化:ttChemi-SELEX”的美国专利第5,705,337号。tt

  SELEX方法可以用于鉴定含有修饰的核苷酸的高亲和力适配体,所述tt修饰的核苷酸赋予该适配体改善的特征,例如改善的体内稳定性或改善的tt递送特征。此类修饰的实例包括核糖和/或磷酸和/或碱基位置的化学取代。tt通过SELEX方法鉴定的含有修饰的核苷酸的适配体描述于题为“含有修饰tttttt的核苷酸的高亲和力核酸配体”的美国专利第5,660,985号,其描述了含有tt在嘧啶的5′-和2′-位置处经化学修饰的核苷酸衍生物的寡核苷酸。见上文,tt美国专利第5,580,737号描述了高特异性适配体,其含有用2′-氨基(2′-NH2)、tt2′-氟(2′-F)和/或2′-O-甲基(2′-OMe)修饰的一个或多个核苷酸。还参见题为tt“SELEX和PHOTOSELEX”的美国专利申请公开20090098549,其描述了tt具有扩展的物理和化学性质的核酸文库及其在SELEX和photoSELEX中的tt用途。tt

  SELEX还可以用于鉴定具有期望的解离速率特征的适配体。参见题为tt“产生具有改善的解离速率的适配体的方法”的美国专利申请公开tt20090004667,其描述了产生可以结合靶分子的适配体的改进SELEX方法。tt描述了产生与各自的靶分子具有较慢解离速率的适配体和光适配体的方tt法。所述方法包括使候选混合物与靶分子接触;允许形成核酸-靶标复合物;tt以及进行缓慢解离速率富集过程,其中具有快解离速率的核酸-靶标复合物tt解离并不再形成,而具有慢解离速率的复合物会保持完整。此外,所述方tt法包括在产生候选核酸混合物中使用修饰的核苷酸,以产生具有改善的解tt离速率性能的适配体。tt

  这种测定的变化使用包含光反应性官能团的适配体,这允许适配体与tt其靶分子共价结合或“光交联”。参见例如题为“核酸配体诊断生物芯片”tt的美国专利第6,544,776号。这些光反应性适配体也称作光适配体。参见例tt如美国专利第5,763,177号、美国专利第6,001,577号和美国专利第6,291,184tt号,所述专利的题目均是“通过指数富集的核酸配体的系统进化:核酸配tt体的光选择和溶液SELEX”;还参见例如题为“核酸配体的光选择”的美tt国专利第6,458,539号。在使微阵列与样品接触并使光适配体具有结合其靶tt分子的机会之后,将该光适配体光激活并洗涤固体支持物以除去任何非特tt异性结合的分子。可以使用严格洗涤条件,因为结合光适配体的靶分子由tt于该光适配体上光激活的官能团所产生的共价键而通常未被除去。在这种tt方式中,测定允许检测对应于测试样品中的生物标记的生物标记值。tt

  在这两种测定形式中,适配体在与样品接触之前固定在固体支持物上。tt然而,在某些情况下,在与样品接触之前固定适配体也许无法提供最佳的tt测定。例如,预固定适配体可能导致适配体与靶分子在固体支持物表面上tttttt的无效混合,这可能导致漫长的反应时间及因此延长的温育时间以允许适tt配体与其靶分子有效结合。此外,当光适配体用于测定并且取决于用作固tt体支持物的材料时,该固体支持物可能趋于分散或吸收用于实现光适配体tt与其靶分子之间的共价键形成的光。此外,根据所用的方法,结合适配体tt的靶分子的检测可能不准确,因为固体支持物的表面也可能暴露于且受所tt用的任何标记剂的影响。最后,适配体固定在固体支持物上通常包括在适tt配体暴露于样品之前的适配体制备步骤(即固定),这个制备步骤可能影响适tt配体的活性或功能性。tt

  还描述了适配体测定,其允许适配体在溶液中捕获其靶标,然后在检tt测之前使用设计为除去适配体-靶标混合物中特定组分的分离步骤(参见题tt为“测试样品的多重分析”的美国专利申请公开20090042206)。所述适配tt体测定方法允许检测和定量测试样品中的非核酸靶标(如蛋白靶标),这通过tt检测和定量核酸(即适配体)进行。所述方法产生核酸替代物(surrogate)(即适tt配体)以检测和定量非核酸靶标,由此允许包括扩增在内的许多核酸技术用tt于包括蛋白靶标在内的更大范围的期望靶标。tt

  可以构建适配体以促进从适配体生物标记复合物(或光适配体生物标tt记共价复合物)分离测定组分,以及允许分离适配体以进行检测和/或定量。tt在一实施方案中,这些构建体可以包含适配体序列中可裂解或可释放的元tt件。在其他实施方案中,可以在适配体中引入额外的官能性,例如标记的tt或可检测的组分、间隔组分或者特异性结合标签或固定元件。例如,适配tt体可以包含通过可裂解部分与适配体连接的标签、标记、分隔标记与可裂tt解部分的间隔组分。在一实施方案中,可裂解元件是光可裂解接头(linker)。tt光可裂解接头可以连接至生物素部分和间隔区段,可以包含NHS基团以用tt于胺的衍生化,以及可以用于在适配体中引入生物素基团,从而允许适配tt体在测定方法中较晚地释放。tt

  用溶液中所有测定组分进行的均质测定在检测信号之前不需要分离样tt品与试剂。这些方法是快速且易于使用的。这些方法基于分子捕获或与其tt特异性靶标反应的结合试剂产生信号。对于胰腺癌,分子捕获试剂是适配tt体或抗体等,特异性靶标是表1第2列的胰腺癌生物标记。tt

  在一实施方案中,一种信号产生方法利用由于荧光团-标记的捕获试剂tttttt与其特异性生物标记靶标的相互作用而导致的各向异性信号改变。当标记tt的捕获剂与其靶标反应时,增加的分子量导致附着于该复合物的荧光团的tt旋转运动变得更慢,从而改变各向异性值。通过监测各向异性改变,结合tt事件可以用于定量测量溶液中的生物标记。其他方法包括荧光偏振测定、tt分子信标方法、时间分辨荧光猝灭法、化学发光、荧光共振能量转移等。tt

  可以用于检测对应于生物学样品中生物标记的生物标记值的基于溶液tt的示例性适配体测定包括以下步骤:(a)通过使所述生物学样品与适配体接tt触来制备混合物,所述适配体包含第一标签并具有对所述生物标记的特异tt性亲和力,其中当所述样品中存在所述生物标记时形成适配体亲和复合物;tt(b)使所述混合物暴露于包含第一捕获元件的第一固体支持物,并且允许所tt述第一标签与所述第一捕获元件结合;(c)除去未与所述第一固体支持物结tt合的混合物的任何组分;(d)使第二标签附着于所述适配体亲和复合物的生tt物标记组分;(e)从所述第一固体支持物释放所述适配体亲和复合物;(f)使tt释放的适配体亲和复合物暴露于包含第二捕获元件的第二固体支持物,并tt且允许所述第二标签与所述第二捕获元件结合;(g)通过分离未复合的适配tt体与所述适配体亲和复合物来从所述混合物除去任何未复合的适配体;(h)tt从固体支持物洗脱适配体;以及(i)通过检测所述适配体亲和复合物的适配tt体组分来检测所述生物标记。tt

  本领域已知的任何方法可以用于通过检测适配体亲和复合物的适配体tt组分来检测生物标记值。许多不同的检测方法可以用于检测亲和复合物的tt适配体组分,例如,杂交测定、质谱分析或QPCR。在一些实施方案中,tt核酸测序方法可以用于检测适配体亲和复合物的适配体组分,从而检测生tt物标记值。简单地说,可以使测试样品进行任何种类的核酸测序方法以鉴tt定和定量测试样品中存在的一种或多种适配体的序列或多个序列。在一些tt实施方案,序列包括整个适配体分子或者可以用来唯一地鉴定该分子的该tt分子的任何部分。在其他实施方案中,鉴定序列是添加至适配体的特定序tt列;这类序列常称为“标签”、“条形码”或“邮政编码”。在一些实施方案tt中,测序方法包括酶促步骤以扩增适配体序列,或者将任何种类的核酸(包tt括在任何位置包含化学修饰的RNA和DNA)转化为适合测序的任何其他种tt类的核酸。tt

  在一些实施方案中,测序方法包括一个或多个克隆步骤。在其他实施tt方案中,测序方法包括没有克隆的直接测序方法。tt

  在一些实施方案中,测序方法包括具有靶向测试样品中的一种或多种tt适配体的特异性引物的直接方法。在其他实施方案中,测序方法包括靶向tt测试样品中的所有适配体的鸟枪法。tt

  在一些实施方案中,测序方法包括酶促步骤以扩增测序靶向的分子。tt在其他实施方案中,测序方法直接测序单一分子。可以用来检测对应于生tt物学样品中的生物标记的生物标记值的示例性基于核酸测序的方法包括以tt下步骤:(a)通过酶促步骤将包含化学修饰的核苷酸转化为未修饰的核酸;tt(b)用大规模平行测序平台鸟枪测序所得的未修饰的核酸,例如454测序系tt统(454Life Sciences/Roche)、Illumina测序系统(Illumina)、ABI SOLiD测序tt系统(Applied Biosystems)、HeliScope单分子测序仪(Helicos Biosciences)、tt或Pacific Biosciences实时单分子测序系统(Pacific BioSciences)或Polonator ttG测序系统(Dover Systems);以及(c)通过特异性测序和测序计数来鉴定和tt定量混合物中存在的适配体。tt

  使用免疫测定确定生物标记值tt

  免疫测定方法基于抗体与其对应靶标或分析物的反应,并且根据特定tt测定形式可以检测样品中的分析物。为了改进基于免疫反应性的测定方法tt的特异性和灵敏性,通常由于单克隆抗体的特异性表位识别而使用单克隆tt抗体。多克隆抗体由于其与单克隆抗体相比增加的靶标亲和力而成功地用tt于各种免疫测定中。免疫测定已经设计为用于大范围生物学样品基质。免tt疫测定形式已经设计为提供定性、半定量和定量结果。tt

  定量结果通过使用已知浓度的待检测的特定分析物产生的标准曲线来tt产生。将来自未知样品的应答或信号在标准曲线上作图,并确定该未知样tt品中对应于靶标的量或值。tt

  已经设计了许多免疫测定形式。ELISA或EIA可以定量检测分析物。tt这种方法依赖于标记对分析物或抗体的附着,并且标记组分直接或间接包tt括酶。ELISA测试可以设计为直接、间接、竞争性或者夹心检测分析物。tt其他方法依赖于标记,如放射性同位素(I125)或荧光。其他技术包括例如凝tttttt集反应、浊度测定法、比浊法、蛋白印迹、免疫沉淀、免疫细胞化学、免tt疫组织化学、流式细胞术、Luminex测定等(参见ImmunoAssay:A Practical ttGuide,edited by Brian Law,published by Taylor & Francis,Ltd.,2005 ttedition)。tt

  示例性测定形式包括酶联免疫吸附测定(ELISA)、放射性免疫测定、荧tt光、化学发光以及荧光共振能量转移(FRET)或时间分辨的-FRET(TR-FRET)tt免疫测定。检测生物标记的方法的实例包括生物标记免疫沉淀及随后允许tt辨别大小和肽水平的定量方法,如凝胶电泳、毛细管电泳、平面电色谱等。tt

  检测和/或定量可检测标记或信号产生材料的方法取决于所述标记的tt性质。由合适的酶催化的反应产物(其中所述可检测标记是酶,见上文)可以tt是但不限于荧光、发光或放射性的,或者它们可以吸收可见光或紫外光。tt适合于检测这样的可检测标记的检测仪的实例包括但不限于X光照片、放tt射性计数器、闪烁计数器、分光光度计、比色计、荧光计、发光计和光密tt度计。tt

  可以通过允许适当准备、处理和分析反应的任何方式来进行任何检测tt方法。这可以例如在多孔测定板(如96孔或384孔)中进行,或者使用任何tt合适的阵列或微阵列进行。可以人工或自动化制备各种试剂的储液,使用tt能够检测可检测标记的可商购的分析软件、机器人技术和检测仪器自动化tt进行所有随后的移液、稀释、混合、分配、洗涤、温育、样品读取、数据tt收集和分析。tt

  使用基因表达谱确定生物标记值tt

  测量生物学样品中的mRNA可以用作检测该生物学样品中相应的蛋白tt水平的替代。因此,本文所述的任何生物标记或生物标记的组还可以通过tt检测适当的RNA来检测。tt

  mRNA表达水平通过逆转录定量聚合酶链式反应(RT-PCR及随后的ttqPCR)测量。RT-PCR用于从mRNA产生cDNA。cDNA可以用于qPCR测tt定以随DNA扩增过程的进展而产生荧光。通过与标准曲线比较,qPCR可tt以产生绝对测量度,如每细胞的mRNA拷贝数。RNA印迹、微阵列、Invadertt测定以及与毛细管电泳组合的RT-PCR全部已经用于测量样品中mRNA的tttttt表达水平。参见Gene Expression Profiling:Methods and Protocols,Richard A.ttShimkets,editor,Humana Press,2004.tt

  miRNA分子是小RNA,其不编码但是可以调节基因表达。适合测量ttmRNA表达水平的任何方法均可以用于相应的miRNA。最近,许多实验室tt已经研究了miRNA作为疾病的生物标记的用途。许多疾病涉及广泛的转录tt调节,并且毫不意外地发现miRNA可以作为生物标记。miRNA浓度与疾tt病之间的关联通常不如蛋白水平与疾病之间的关联明确,但是miRNA生物tt标记值可能是重要的。当然,随着疾病期间任何RNA的不同表达,开发体tt外诊断产品所面临的问题包括需要miRNA在患病细胞中存活及易于提取tt以进行分析,或者miRNA被释放进入血液或其他基质中,在此它们必须存tt活足够长的时间以进行测量。蛋白生物标记具有相似的要求,尽管许多潜tt在的蛋白生物标记以旁分泌方式在疾病期间于病变和功能部位有意地分tt泌。许多潜在的蛋白生物标记设计为在合成那些蛋白的细胞外起作用。tt

  使用体内分子成像技术检测分子标记tt

  任何所述的生物标记(见表1第2列)还可以用于分子成像测试。例如,tt显像剂可以与任何所述生物标记偶联,这可以用于辅助胰腺癌诊断、监测tt疾病进展/缓解或转移、监测疾病复发或者监测对治疗的应答等。tt

  体内成像技术提供了用于确定个体体内特定疾病状态的非侵入性方tt法。例如,身体的所有部分或者甚至整个身体均可以作为三维图像观察,tt从而提供关于身体内形态学和结构的有价值的信息。这样的技术可以与检tt测本文所述的生物标记组合以提供关于个体的癌症状态,特别是胰腺癌状tt态的信息。tt

  体内分子成像技术的应用由于该技术的各种进展而得以扩展。这些进tt展包括新造影剂或标记的开发,如放射性标记和/或荧光标记,其可以在身tt体内提供强信号;以及开发更强的新成像技术,其可以从身体外部检测和tt分析这些信号,并且具有足够的灵敏性和精确度以提供有用的信息。造影tt剂可以在适当的成像系统中观察,从而提供所述造影剂所处位置的身体部tt分或多个部分的图像。造影剂可以与捕获试剂结合或缔合,例如适配体或tt抗体,例如和/或结合或缔合肽或蛋白,或寡核苷酸(例如为了检测基因表tttttt达),或者复合物,所述复合物含有任何这些物质及一种或多种大分子和/tt或其他颗粒形式。tt

  造影剂还是可用于成像的放射性原子的特征。对于闪烁照相研究,合tt适的放射性原子包括锝-99m或碘-123。其他易于检测的部分包括例如磁共tt振成像(MRI)的自旋标记物,如碘-123、碘-131、铟-111、氟-19、碳-13、氮tt-15、氧-17、钆、锰或铁。这样的标记为本领域熟知,并且可以由本领域技tt术人员容易地选择。tt

  标准成像技术包括但不限于磁共振成像、计算机断层扫描、正电子发tt射断层扫描(PET)、单光子发射计算机断层扫描(SPECT)等。对于诊断性体tt内成像,可用的检测设备的类型是选择指定造影剂的主要因素,如用于靶tt标(蛋白、mRNA等)的指定放射性核素和特定生物标记。所选的放射性核tt素通常具有通过指定类型设备可检测的衰变类型。此外,当选择用于体内tt诊断的放射性核素时,其半衰期应当足够长以允许在靶组织最大吸收时进tt行检测,但是也应当足够短,以最小化宿主所受的有害辐射。tt

  示例性成像技术包括但不限于PET和SPECT,这是将放射性核素全身tt(synthetically)或局部地给予个体的成像技术。随后,随时间测量放射性示tt踪剂的吸收,并用于获得关于靶向的组织与生物标记的信息。由于所用的tt特定同位素的高能(γ-射线)发射以及用于检测它们的设备的灵敏性和完善tt(sophistication),可以从身体外部推导出放射性的二维分布。tt

  PET中常用的正电子发射核素包括例如碳-11、氮-13、氧-15和氟-18。tt通过电子捕获和/或γ-发射衰变的同位素用于SPECT中,并且包括例如碘tt-123和锝-99m。用锝-99m标记氨基酸的示例性方法是在螯合前体的存在下tt还原高锝酸盐离子以形成不稳定的锝-99m-前体配合物,其又与双官能修饰tt的趋化肽的金属结合基团反应,形成锝-99m-趋化肽偶联物。tt

  抗体常用于这样的体内成像诊断方法。用于体内诊断的抗体的制备和tt用途为本领域熟知。可以将特异性结合表1第2列的任何生物标记的标记tt的抗体注入疑似患有某种类型癌症(如胰腺癌)的个体,并且根据所用的特定tt生物标记的可检测性来诊断或评价所述个体的疾病状态。如上文所述,使tt用的标记根据所用的成像形式来选择。标记的定位允许确定癌症的扩散。tt器官或组织内标记的量还允许确定该器官或组织中癌症的存在与否。tt

  相似地,适配体可以用于这样的体内成像诊断方法。例如,用于鉴定tt表1第2列所述的特定生物标记的适配体(并且因此特异性结合该特定生物tt标记)可以适当地进行标记并注入疑似患有胰腺癌的个体,并且根据该特定tt生物标记的可检测性来诊断或评价所述个体的胰腺癌状态。如上文所述,tt使用的标记根据所用的成像形式来选择。标记的定位允许确定癌症的扩散。tt器官或组织内标记的量还允许确定该器官或组织中癌症的存在与否。适配tt体定向的显像剂与其他显像剂相比可以具有关于组织渗透、组织分布、动tt力学、消除、效力和选择性方面独特且有利的特征。tt

  这样的技术还可以任选地用标记的寡核苷酸进行,例如通过用反义寡tt核苷酸成像检测基因表达。这些方法用于原位杂交,例如用荧光分子或放tt射性核素作为标记。检测基因表达的其他方法包括例如检测报道基因的活tt性。tt

  另一种常见类型的成像技术是光学成像,其中对象体内的荧光信号通tt过所述对象体外的光学设备检测。这些信号可以是由于实际的荧光和/或生tt物发光。光学检测设备灵敏性的改进增加了光学成像在体内诊断测定中的tt应用。tt

  体内分子生物标记成像的用途日益增加,包括临床试验,例如在新癌tt症疗法的试验中更快速地测量临床效力,和/或避免对诸如多发性硬化的那tt些疾病的长期安慰剂治疗,其中这样的长期治疗可能被认为是存在伦理问tt题的。tt

  关于其他技术的综述,参见N.Blow,Nature Methods,6,465-469,2009。tt

  使用组织学/细胞学方法确定生物标记值tt

  对于胰腺癌的评价,许多组织样品可用于组织学或细胞学方法。样品tt选择取决于原发肿瘤位置和转移的部位。例如,在内镜逆行胰胆管造影tt(ERCP)或内镜超声(EUS)指导的FNA时采集的组织样品(钳夹活检、细针抽tt吸(FNA)和/或刷检(brush cytology))可以用于组织学。腹水或腹腔灌洗液或tt胰液可以用于细胞学。本文鉴定的在胰腺癌个体中表现出上调的任何生物tt标记(见表1第6列)可以用于染色组织学样本作为疾病的指征。tt

  在一实施方案中,对于相应的生物标记是特异性的一种或多种捕获试tttttt剂用于胰细胞样品的细胞学评价,并且可以包括以下一个或多个方面:收tt集细胞样品、固定细胞样品、脱水、透明(clearing)、将细胞样品固定在显tt微镜载玻片上、使细胞样品透化、分析物检索处理、染色、脱色、洗涤、tt封闭以及在缓冲溶液中与一种或多种捕获试剂反应。在另一实施方案中,tt细胞样品从细胞块(cell block)中产生。tt

  在另一实施方案中,对于相应的生物标记是特异性的一种或多种捕获tt试剂用于胰腺组织样品的组织学评价,并且可以包括以下一个或多个方面:tt收集组织样本、固定组织样品、脱水、透明、将组织样品固定在显微镜载tt玻片上、使组织样品透化、分析物检索处理、染色、脱色、洗涤、封闭、tt再水合以及在缓冲溶液中与一种或多种捕获试剂反应。在另一实施方案中,tt固定和脱水用冷冻代替。tt

  在另一实施方案中,使对于相应的生物标记是特异性的一种或多种适tt配体与组织学或细胞学样品反应,并且可以作为核酸扩增方法中的核酸靶tt标。合适的核酸扩增方法包括例如PCR、q-β复制酶、滚环扩增、链置换、tt解旋酶依赖性扩增、环介导的等温扩增、连接酶链式反应以及限制和环化tt辅助的滚环扩增。tt

  在一实施方案中,将对于用于组织学或细胞学评价的相应生物标记是tt特异性的一种或多种捕获试剂在缓冲溶液中混合,所述缓冲溶液可以包含tt任何以下成分:封闭材料、竞争剂、去污剂、稳定剂、载体核酸、聚阴离tt子材料等。tt

  “细胞学方案”通常包括样品收集、样品固定(fixation)、样品固定tt(immobilization)和染色。“细胞制备”可以包括样品收集后的一些处理步骤,tt包括使用一种或多种慢解离速率的适配体来染色制备的细胞。tt

  样品收集可以包括直接将样品置于未处理的转运容器中,将样品置于tt含有一些类型的介质的转运容器中,或者将样品直接置于玻片上(固定)而不tt进行任何处理或固定。tt

  样品固定可以通过将一部分收集的样本涂在用聚赖氨酸、明胶或硅烷tt处理的载玻片上而改进。玻片可以通过在玻片上涂有薄且均匀的细胞层而tt制备。通常采取小心操作以最小化机械扭转和干燥假象。液体样本可以通tt过细胞块方法处理。或者,液体样本可以与固定溶液在室温下1∶1混合约tttttt10分钟。tt

  细胞块可以从剩余的积液、痰、尿液沉淀、胃肠液、细胞刮取物或细tt针抽吸物中制备。通过离心或膜过滤浓缩或压实细胞。已经开发了许多细tt胞块制备方法。代表性方法包括固定的沉淀、细菌琼脂或膜过滤方法。在tt固定的沉淀方法中,将细胞沉淀与诸如鲍音液(Bouins)、苦味酸或缓冲的福tt尔马林的固定剂混合,然后将混合物离心以沉淀固定的细胞。除去上清,tt尽可能完全地干燥细胞团块(pellet)。收集团块并包在镜头纸中,然后置于tt组织盒(tissue cassette)中。将组织盒置于包含其他固定剂的罐子中并作为组tt织样品进行处理。琼脂方法与上述方法非常相似,只是取出团块并在纸巾tt上干燥,然后切成两半。将切面置于载玻片上一滴熔化的琼脂中,然后将tt该团块用琼脂包被,保证琼脂中无气泡形成。使琼脂变硬,然后除去任何tt过多的琼脂。将其置于组织盒中,完成组织处理。或者,可以将团块直接tt悬浮于在65℃的2%液体琼脂中并离心样品。使琼脂细胞团块在4℃下固tt化1小时。可以从离心管中取出固体琼脂并切成两半。将琼脂包在滤纸中,tt然后置于组织盒中。从这点开始的处理与上述方法相同。在任何这些方法tt中可以用膜过滤代替离心。任何这些方法均可以用于产生“细胞块样品”。tt

  细胞块可以使用专门的树脂制备,包括Lowicryl树脂、LR White、LR ttGold、Unicryl和MonoStep。这些树脂具有低粘度,并且可以在低温下及用tt紫外(UV)光聚合。包埋方法依赖于在脱水期间逐渐冷却样品,将样品转移tt至树脂以及于最终低温下在合适的UV波长处聚合细胞块。tt

  细胞块切片可以用苏木精-伊红染色以进行细胞形态学检查,而其他切tt片用于特异性标记检查。tt

  无论方法是细胞学方法或组织学方法,可以在进一步处理之前将样品tt固定以防止样品降解。这种方法称作“固定”,并且描述了可以互换使用的tt许多材料和方法。基于待检测的靶标和待分析的特定细胞/组织类型,根据tt经验最佳地选择样品固定方案和试剂。样品固定依赖于试剂,如乙醇、聚tt乙二醇、甲醇、福尔马林或异丙醇。样品应当尽可能在收集及附着在玻片tt上后很快固定。然而,所选的固定剂可以在各种分子靶标中引入结构改变,tt这使得随后更难以检测。固定(fixation)和固定(immobilization)方法及其顺序tt可以改变细胞的外观,并且这些改变必须是由细胞学技术人员预期及认可tttttt的。固定剂可以导致某些类型细胞收缩,并且导致细胞质出现颗粒或网状tt物。许多固定剂通过使细胞组分交联而起作用。这可以破坏或改变特异性tt表位,产生新表位,导致分子缔合以及降低膜通透性。福尔马林固定是一tt种最常用的细胞学/组织学方法。福尔马林在相邻蛋白之间或在蛋白内形成tt甲基桥。沉淀或凝固也用于固定,乙醇常用于这种类型的固定。交联与沉tt淀的组合也可以用于固定。牢固的固定方法在保留形态学信息方面是最佳tt的,而较弱的固定方法对于保留分子靶标方面是最佳的。tt

  代表性固定剂是50%无水乙醇、2mM聚乙二醇(PEG)、1.85%甲醛。tt这种制剂的变化包括乙醇(50%-95%)、甲醇(20%-50%)以及仅福尔马林(甲tt醛)。另一种常用的固定剂是2%PEG1500、50%乙醇以及3%甲醇。将玻片tt在室温下置于固定剂中约10-15分钟,然后取出并干燥。一旦玻片被固定,tt可以用诸如PBS的缓冲溶液对其进行漂洗。tt

  许多染料可以用于差异地突出和反差或“染色”细胞、亚细胞和组织tt特征或形态学结构。苏木精(hematoylin)用于将核染色为蓝色或黑色。橘黄ttG-6和天青伊红(Eosin Azure)均将细胞质染色。橘黄G将含有角蛋白和糖原tt的细胞染成黄色。伊红Y用于将核仁、纤毛、红细胞和表面上皮扁平细胞tt染色。罗曼诺夫斯基(Romanowsky)染色用于空气干燥的玻片,并且可以用tt于增强复型及区分细胞外与细胞质内材料。tt

  染色方法可以包括增加细胞对染色的通透性的处理。用去污剂处理细tt胞可以用于增加通透性。为了增加细胞和组织通透性,可以将固定的样品tt用溶剂、皂苷类或非离子型去污剂进一步处理。酶促消化还可以改进组织tt样品中特异性靶标的可接近性。tt

  染色后,使用渐增的醇浓度进行连续醇漂洗将样品脱水。最终的洗涤tt使用二甲苯或诸如柑桔萜的二甲苯取代物,其具有接近在载玻片上应用的tt盖玻片的折射率。这个最后的步骤称作透明。一旦使样品脱水及透明,应tt用封固剂。所选的封固剂具有接近玻璃的折射率,并且能够使盖玻片与载tt玻片粘合。其还抑制细胞样品另外的干燥、收缩或褪色。tt

  无论使用的染色或处理,对胰细胞学样本的最后评价通过一些类型的tt显微镜检查进行以允许通过肉眼观察形态学并确定标记的存在与否。示例tt性显微镜检查方法包括明视野显微镜、相差显微镜、荧光显微镜和微分干tttttt涉相差显微镜方法。tt

  如果在检查后需要对样品进行次级测试,则可以除去盖玻片并对载玻tt片进行脱色。脱色包括使用用于染色该载玻片的最初未加入染料的原始溶tt剂系统,并以与原始染色程序相反顺序进行。脱色还可以通过将该载玻片tt浸泡在酸醇中直至细胞无色来完成。一旦无色,则将载玻片用水浴充分漂tt洗并进行第二染色程序。tt

  此外,通过使用特异性分子试剂,如抗体或者核酸探针或适配体,可tt以将特异性分子区分与细胞形态学分析组合。这改进了诊断细胞学的精确tt性。显微切割可以用于分离细胞的子集以进行另外的评价,特别是用于遗tt传学评价异常染色体、基因表达或突变。tt

  制备用于组织学评价的组织样品包括固定、脱水、浸润(infiltration)、tt包埋和切片。用于组织学的固定试剂与用于细胞学的固定试剂非常相似或tt相同,并且在以诸如个体蛋白的分子为代价的情况中具有相同的保持形态tt学特征的问题。如果组织样品不进行固定和脱水而是代之以冷冻然后在冷tt冻时切片可以节省时间。这是更温和的处理程序,并且可以保留更多的个tt体标记。然而,冷冻对于组织样品的长期保存不可接受,因为由于冰晶体tt的引入引起亚细胞信息丧失。冷冻组织样品中的冰也妨碍切片过程产生极tt薄的切片,并且因此可以丧失一些显微镜分辨力和亚细胞结构的图像。除tt了福尔马林固定之外,四氧化锇也用于固定和染色磷脂(膜)。tt

  组织的脱水是通过用渐增浓度的醇连续洗涤来完成。透明使用可以与tt醇和包埋材料混溶的材料,并且包括从50∶50醇∶澄清试剂开始至100%澄tt清试剂(二甲苯或二甲苯取代物)的逐步处理过程。浸润包括将组织与液体形tt式的包埋剂(温热的蜡,硝化纤维素溶液)一起温育,首先是50∶50包埋剂∶tt澄清剂,随后是100%包埋剂。包埋通过将组织置于模具或盒中并充填熔化tt的包埋剂如蜡、琼脂或明胶来完成。使包埋剂硬化。然后将硬化的组织样tt品切成薄切片以用于染色和随后的检查。tt

  在染色之前,将组织切片脱蜡并再水合。用二甲苯使切片脱蜡,可以tt更换一次或多次二甲苯,并且通过在递减浓度的醇中连续洗涤来再水合。tt在脱蜡之前,可以将组织切片于约80℃下在载玻片上热固定约20分钟。tt

  激光捕获显微切割允许从组织切片分离细胞的子集以进行进一步分tttttt析。tt

  在细胞学中,为了增强显微特征的观察,可以将组织切片或薄片用各tt种染色方法染色。许多可商购的染色方法可以用于增强或鉴定特定的特征。tt

  为了进一步增加分子试剂与细胞学/组织学样品的相互作用,已经开发tt了许多“分析物检索(analyte retrieval)”技术。第一种这样的技术使用高温tt加热固定的样品。这种方法也称作热诱导的表位检索或HIER。已经使用了tt许多加热技术,包括蒸汽加热、微波、高压蒸汽、水浴以及加压蒸煮或这tt些加热方法的组合。分析物检索溶液包括例如水、柠檬酸盐和普通盐水缓tt冲液。分析物检索的关键是高温的时间,但是较低温度进行较长时间也已tt经成功使用。分析物检索的另一关键是加热溶液的pH。据发现低pH提供tt最佳的免疫染色,但是也产生经常需要使用第二组织切片作为阴性对照的tt背景。无论缓冲液组成,使用高pH溶液通常获得最一致的益处(增加免疫tt染色而不增加背景)。对特异性靶标的分析物检索方法根据经验对使用加热tt的靶标、时间、pH和缓冲液组成的变量加以优化。使用微波分析物检索方tt法允许用抗体试剂顺序染色不同的靶标。但是在染色步骤之间获得抗体与tt酶复合物所需的时间也证实使细胞膜分析物降解。微波加热方法也改进原tt位杂交方法。tt

  为了开始分析物检索过程,首先将切片脱蜡并水合。然后将玻片置于tt平皿或罐子中的10mM柠檬酸钠缓冲液pH6.0中。代表性程序使用1100Wtt微波,以100%功率对玻片微波处理2分钟,随后在确保玻片保留覆盖于液tt体中之后使用20%功率对玻片微波处理18分钟。然后使玻片在敞口容器中tt冷却,随后用蒸馏水漂洗。HIER可以与酶促消化组合使用以改进靶标对免tt疫化学试剂的反应性。tt

  一种这样的酶促消化方案使用蛋白酶K。20g/ml浓度的蛋白酶K在tt50mM Tris碱、1mM EDTA、0.5%Triton X-100、pH8.0缓冲液中制备。该tt方法首先包括将切片在更换2次的二甲苯中脱蜡,每次5分钟。然后将样tt品在更换2次的100%乙醇中水合,每次3分钟,在95%和80%乙醇中水合,tt每次1分钟,然后在蒸馏水中漂洗。将切片用蛋白酶K工作溶液覆盖,于tt37C下在加湿室中温育10-20分钟(最佳温育时间可以根据组织类型和固定tt程度而变化)。将切片在室温下冷却10分钟,然后在PBS吐温(Tween)20tttttt中漂洗2次2分钟。如果需要,可以将切片封闭以消除来自内源化合物和tt酶的潜在干扰。然后将切片用在一抗稀释缓冲液中适当稀释的一抗在室温tt下温育1小时或者在4C下温育过夜。然后将该切片用PBS吐温20漂洗2tt次2分钟。如果需要特定的应用,可以进行另外的封闭,随后用PBS吐温tt20再漂洗3次2分钟,然后最后完成免疫染色方案。tt

  在室温下用1%SDS简单处理也已经证实改进了免疫组织化学染色。tt分析物检索方法已经应用于玻片固定切片(slide mounted section)以及自由tt浮动切片(free floating section)。另一处理选择是将玻片置于pH6.0的含有tt柠檬酸和0.1诺纳德(Nonident)P40的罐子中,并加热至95℃。然后将该玻tt片用诸如PBS的缓冲溶液洗涤。tt

  对于组织的免疫学染色,可以通过将切片浸入诸如血清或脱脂奶粉的tt蛋白溶液中来封闭抗体与组织蛋白的非特异性结合。tt

  封闭反应可以包括需要降低内源生物素的水平;消除内源电荷作用;tt失活内源核酸酶;和/或失活内源酶如过氧化物酶和碱性磷酸酶。内源核酸tt酶可以通过以下方式失活:用蛋白酶K降解;热处理;使用螯合剂,如EDTAtt或EGTA;引入载体DNA或RNA;用离液剂处理,如尿素、硫脲、盐酸tt胍、硫氰酸胍、高氯酸锂等或焦碳酸二乙酯。碱性磷酸酶可以通过用0.1NttHCl在室温下处理5分钟或用1mM左旋咪唑处理来失活。过氧化物酶活tt性可以通过用0.03%过氧化氢处理来消除。内源生物素可以通过将玻片或tt切片在室温下浸入抗生物素蛋白(链霉抗生物素蛋白,可以取代中性链亲和tt素(neutravidin))溶液中至少15分钟来封闭。然后将玻片或切片在缓冲液中tt洗涤至少10分钟。这个步骤可以重复至少3次。然后将玻片或切片浸入生tt物素溶液中10分钟。这个步骤可以重复至少3次,每次使用新鲜的生物素tt溶液。重复缓冲液洗涤程序。应当减少封闭方案以防止破坏所关注的细胞tt或组织结构或者靶标或多个靶标,但是可以组合一种或多种这样的方案以tt“封闭”玻片或切片,然后与一种或多种慢解离速率适配体反应。参见Basic ttMedical Histology:the Biology of Cells,Tissues and Organs,authored by ttRichard G.Kessel,Oxford University Press,1998。tt

  使用质谱方法确定生物标记值tt

  许多质谱仪的配制(configuration)可以用于检测生物标记值。一些类型tt的质谱仪可以获得或可以用各种配制生产。通常,质谱仪具有以下主要部tt件:样品入口、离子源、质量分析仪、检测仪、真空系统以及设备控制系tt统和数据系统。样品入口、离子源和质量分析仪的差异通常限定设备的类tt型及其能力。例如,入口可以是毛细管柱液体层析源,或者可以是直接探tt针或镜台(stage)如用于基质辅助激光解吸电离中。常用的离子源是例如电喷tt射,包括纳米喷射(nanospray)和微喷射(microspray);或者基质辅助激光解tt吸电离。常用的质量分析仪包括四极滤质器(quadrupole mass filter)、离子阱tt质量分析仪和飞行时间质量分析仪。其他质谱方法为本领域熟知(参见ttBurlingame et al.Anal.Chem.70:647R-716R(1998);Kinter and Sherman,ttNew York(2000))。tt

  蛋白生物标记和生物标记值可以通过任何以下方式检测和测量:电喷tt射离子化质谱(ESI-MS)、ESI-MS/MS、ESI-MS/(MS)n、基质辅助激光解吸tt离子化飞行时间质谱(MALDI-TOF-MS)、表面增强激光解吸/离子化飞行时tt间质谱分析(SELDI-TOF-MS)、硅表面解吸/离子化(DIOS)、二次离子质谱tt(SIMS)、四极飞行时间(Q-TOF)、称作ultraflex III TOF/TOF的串联式飞行tt时间(TOF/TOF)技术、大气压化学离子化质谱(APCI-MS)、APCI-MS/MS、ttAPCI-(MS)N、大气压光电离质谱(APPI-MS)、APPI-MS/MS和APPI-(MS)N、tt四极质谱、傅里叶变换质谱(FTMS)、定量质谱以及离子阱质谱。tt

  样品制备策略用于在对蛋白生物标记进行质谱表征及确定生物标记值tt之前标记和富集样品。标记方法包括但不限于用于相对和绝对定量的等量tt异位标签(iTRAQ)和在细胞培养中用氨基酸稳定同位素标记(SILAC)。在质tt谱分析之前用于选择性富集候选生物标记蛋白样品的捕获试剂包括但不限tt于适配体、抗体、核酸探针、嵌合物、小分子、F(ab’)2片段、单链抗体片tt段、Fv片段、单链Fv片段、核酸、凝集素、配体-结合受体、affybodies、tt纳米抗体、锚蛋白、结构域抗体、可变抗体支架(例如双抗体等)印刷的聚合tt物、高亲合性多聚体、肽模拟物、拟肽、肽核酸、苏糖核酸、激素受体、tt细胞因子受体及合成的受体以及这些物质的修饰和片段。tt

  使用邻位连接技术确定生物标记值tt

  邻位连接技术可以用来确定生物标记值。简单地说,使测试样品与一tt对亲和性探针接触,所述一对亲和性探针可以是一对抗体或一对适配体,tt这对的每个成员延伸出寡核苷酸。这对亲和性探针的靶标可以是一个蛋白tt上的两个不同决定簇或者两个不同蛋白中每一个上的一个决定簇,其可以tt作为同源或异源多聚复合物存在。当探针结合靶决定簇时,寡核苷酸延伸tt的游离端足够接近以杂交在一起。寡核苷酸延伸的杂交通过常见的连接寡tt核苷酸来促进,所述连接寡核苷酸在位置足够接近时用于将寡核苷酸延伸tt连接在一起。一旦探针的寡核苷酸延伸杂交,延伸的末端通过酶促DNA连tt接而连接在一起。tt

  每个寡核苷酸延伸包含用于PCR扩增的引物位点。一旦寡核苷酸延伸tt连接在一起,寡核苷酸形成连续的DNA序列,通过PCR扩增,其显示关tt于靶蛋白的性质和量的信息,以及当靶决定簇在两个不同蛋白上时关于蛋tt白-蛋白相互作用的信息。邻位连接可以通过使用实时PCR提供实时蛋白浓tt度和相互作用信息的高度灵敏和特异性的测定。不结合所关注的决定簇的tt探针不具有邻近的相应的寡核苷酸延伸,并且不可以进行连接或PCR扩增,tt导致没有信号产生。tt

  前述测定允许检测可用于诊断胰腺癌的方法的生物标记值,其中所述tt方法包括在来自个体的生物学样品中检测至少N个生物标记值,所述至少ttN个生物标记值每个对应于选自表1第2列提供的生物标记的组的生物标tt记,其中如下文详述,利用生物标记值的分类指示所述个体是否患有胰腺tt癌。尽管某些所述胰腺癌生物标记可以单独用于检测和诊断胰腺癌,但是tt本文所述的方法还用于分组胰腺癌生物标记的多个子集,其各自可用作三tt个或更多个生物标记的组。因此,本申请的各个实施方案提供了包含N个tt生物标记的组合,其中N是至少三个生物标记。在其他实施方案中,N选tt自2-65个生物标记中的任意数。应当理解N可以选自任何上述范围以及相tt似但更高级范围中的任意数。根据本文所述的任何方法,可以单独检测和tt分类生物标记值,或者可以共同检测和分类生物标记值,例如以多重测定tt形式。tt

  在另一方面,本发明提供了检测胰腺癌不存在的方法,所述方法包括tt在来自个体的生物学样品中检测至少N个生物标记值,所述至少N个生物tttttt标记值每个对应于选自表1第2列提供的生物标记的组的生物标记,其中tt如下文详述,生物标记值的分类指示所述个体中不存在胰腺癌。尽管某些tt所述胰腺癌生物标记可以单独用于检测和诊断胰腺癌不存在,但是本文所tt述的方法还用于分组胰腺癌生物标记的多个子集,其各自可用作三个或更tt多个生物标记的组。因此,本申请的各个实施方案提供了包含N个生物标tt记的组合,其中N是至少三个生物标记。在其他实施方案中,N选自2-65tt个生物标记中的任意数。应当理解N可以选自任何上述范围以及相似但更tt高级范围中的任意数。根据本文所述的任何方法,可以单独检测和分类生tt物标记值,或者可以共同检测和分类生物标记值,例如以多重测定形式。tt

  生物标记分类和疾病评分计算tt

  给定诊断测试的生物标记“特征”含有标记的集合,每个标记在所关tt注群体中具有不同水平。在这方面,不同水平可以指针对两个或更多个组tt中个体的标记水平的不同平均值(mean),或者两个或更多个组中的不同的tt方差,或者这两者的组合。对于最简单形式的诊断测试,这些标记可以用tt于将来自个体的未知样品分配到两组中的一组中,疾病组或非疾病组。将tt样品分配于两个或更多个组中的一组称为分类,用于实现这种分配的程序tt称为分类器或分类方法。分类方法也可以称为评分方法。有许多分类方法tt可以用于从生物标记值的集合构建诊断分类器。通常,分类方法最容易用tt监督学习技术进行,其中用获得自希望区分的两个(或更多个,对于多个分tt类状态)不同组内的个体的样品收集数据集合。因为每个样品所属的类别(组tt或群体)事先对于每个样品均是已知的,所以可以训练分类方法以获得期望tt的分类应答。还可以使用无监督学习技术来产生诊断分类器。tt

  开发诊断分类器的常用方法包括决策树;bagging,boosting,foreststt和随机forests;基于规则推论的学习(rule inference based learning);Parzentt窗方法(Parzen Windows);线性模型;逻辑;神经网络方法;无监督聚类;ttK-means;分级上升/下降(hierarchical ascending/descending);半监督学习;tt原型方法;近邻取样(nearest neighbor);核密度估计(kernel density ttestimation);支持向量机(support vector machine);隐马尔可夫模型(hidden ttMarkov model);玻尔兹曼学习(Boltzmann Learning);并且分类器可以简单tttttt组合或者以最小化特定目标函数的方式组合。综述参见例如Pattern ttClassification,R.O.Duda,et al.,editors,John Wiley & Sons,2nd edition,2001;tt还参见The Elements of Statistical Learning-Data Mining,Inference,and ttPrediction,T.Hastie,et al.,editors,Springer Science+Business Media,LLC,tt2nd edition,2009;它们均整体援引加入本文。tt

  为了用监督学习技术产生分类器,获得称为训练数据的样品集合。在tt诊断测试的情况下,训练数据包括来自未知样品稍后会被分配的不同组(类tt别)的样品。例如,收集自对照群体的个体和特定疾病群体的个体的样品可tt以组成训练数据以开发可以分类未知样品(或者,更特别地,样品所来自的tt个体)为患有该疾病或无该疾病的分类器。从训练数据开发分类器已知为训tt练该分类器。分类器训练的具体细节取决于监督学习技术的性质。作为示tt例,训练朴素贝叶斯(Bayesian)分类器的实例在下文进行描述(参见例tt如Pattern Classification,R.O.Duda,et al.,editors,John Wiley & Sons,2nd ttedition,2001;还参见The Elements of Statistical Learning-Data Mining,ttInference,and Prediction,T.Hastie,et al.,editors,Springer Science+Business ttMedia,LLC,2nd edition,2009)。tt

  由于通常在训练集合中存在比样品多得多的潜在生物标记值,所以必tt须小心避免过拟合。当统计学模型描述随机误差或噪声而非潜在关系时发tt生过拟合。过拟合可以由各种方式避免,这包括例如限制开发分类器中使tt用的标记数目,假设标记应答互相独立,限制采用的潜在统计学模型的复tt杂性,以及保证潜在统计学模型符合数据。tt

  使用生物标记的集合开发诊断测试的说明性实例包括应用朴素贝叶斯tt分类器,这是一种基于贝叶斯(Bayes)定理的简单或然性分类器,具有生物tt标记的严格独立处理。每个生物标记由针对每种类别中测量的RFU值或logttRFU(相对荧光单位)值的类别依赖性概率密度函数(pdf)描述。一个类别中的tt标记的集合的共同pdf(joint pdf)假定为每个生物标记的个体类别依赖性pdftt的积。在这种情况下训练朴素贝叶斯分类器意味着分配参数(“参数化”)tt以表征类别依赖性pdf。类别依赖性pdf的任何潜在模型均可以使用,但是tt模型应该通常符合在训练集合中观察到的数据。tt

  具体地,测量疾病类别中生物标记i的值xi的类别依赖性概率写作ttttttp(xi|d),并且观察具有值的n个标记的整体朴素贝叶斯概tt率写作其中各个xi是以RFU或log RFU表示的测量tt的生物标记水平。对于未知的分类分配通过以下方法来促进:对于相同测tt量值,计算与不患病(对照)的概率相比的具有测量的的患病概率tt这些概率的比率通过应用贝叶斯定理从类别依赖性pdf计算,即tt其中p(d)为适合测试的群体中疾病的发病率。对tt这一比率的两边取对数并从以上代入朴素贝叶斯类别依赖性概率,获得ttln(p(d|x~)p(c|x~))=Σi=1nln(p(xi|d)p(xi|c))+ln(p(d)1-p(d)).这种形式已知为log似然tt比,并简单地表示不患有特定疾病比患有所述疾病的log似然性,并且主tt要由n个单独生物标记的单独log似然比的总和组成。在其最简单的形式tt中,未知样品(或者,更特别地,样品所来自的个体)分类为不患有疾病,如tt果上述比率大于0;而分类为患有疾病,如果所述比率小于0。tt

  在一示例性实施方案中,类别依赖性生物标记pdf p(xi|c)和p(xi|d)假tt定为在测量的RFU值xi中为正态分布或log正态分布,即ttp(xi|c)=12πσc,iexp(-(xi-μc,i)22σc,i2),并且对于具有相似表达。模型的参数tt化要求估计来自训练数据的每个类别依赖性pdf的两个参数,平均值μ和tt方差δ2。这可以通过许多方式实现,包括例如最大似然估计、最小平方以tt及本领域技术人员已知的任何其他方法。将正态分布代入上文所定义的log-tt似然比,获得以下表达式:ttln(p(d|x~)p(c|x~))=Σi=1nln(σc,iσdi)-12Σi=1n[(xi-μd,iσd,i)2-(xi-μc,iσc,i)2]+ln(p(d)1-p(d))

  一旦μ和δ2的集合已对来自训练数据的每个类别的每个pdf定义,并tt且确定群体中的疾病发病率,则贝叶斯分类器完全确定并且可以用于分类tt具有测量值的未知样品。tt

  朴素贝叶斯分类器的性能取决于用于构建和训练分类器的生物标记的tt数目和质量。如以下实施例3所定义,单个生物标记根据其KS-距离(柯尔tt莫可洛夫-斯米洛夫(Kolmogorov-Smirnov))运行。如果分类器性能度量tt(metric)定义为接受者操作特征曲线(AUC)下的面积,则完美分类器的评分tt为1,而随机分类器的平均评分为0.5。大小为n和m的两个集合A和Btt之间的KS-距离的定义为值Dn,m=supx|FA,n(x)-FB,m(x)|,其为两个基于经tt验的累积分布函数(cdf)之间的最大差异。n个观察Xi的集合A的基于经验tt的cdf定义为FA,n(x)=1nΣi=1nIXix,其中为指示物函数,如果Xi<x,tt其等于1,否则其等于0。通过定义,这个值介于0和1之间,其中1的ttKS-距离表示基于经验的分布不重叠。tt

  具有良好KS距离(例如>0.3)的后续标记的加入通常会改善分类性能,tt如果后续加入的标记独立于第一标记。使用灵敏性加特异性作为分类器评tt分,用贪婪算法的变体会直接产生许多高评分分类器。(贪婪算法是那些应tt用了解决问题的元启发式(metaheuristic)算法,这些算法使得本地优化选择tt在每个阶段都可以找到全方位的最优化。)tt

  此处使用的算法在实施例4中详细描述。简单地说,从潜在生物标记tt表中产生所有单分析物分类器并加入到列表中。接下来,向每个存储的单tt分析物分类器进行所有可能的第二分析物的加入,在一个新列表上储存预tt定数目的最佳评分配对,例如一千个。用这个最佳二-标记分类器的新列表tt开发所有可能的三标记分类器,再次储存其中最佳的一千个。继续这个过tt程直至评分进入平稳状态或开始随着额外标记的加入而变差。可以评价那tt些在收敛后仍保留的高评分分类器对于目标用途的期望性能。例如,在一tt种诊断应用中,具有高灵敏性和中等特异性的分类器可以比中等灵敏性和tttttt高特异性是更期望的。在另一诊断应用中,具有高特异性和中等灵敏性的tt分类器可以是更期望的。期望的性能水平通常基于在假阳性和假阴性数之tt间必须进行的交换(trade-off)而选择,所述假阳性和假阴性可以针对特定诊tt断应用而各自容忍。这种交换通常取决于假阳性或假阴性误差的医学后果。tt

  现有技术已知各种其他技术,并且可以用来使用朴素贝叶斯分类器从tt生物标记列表产生许多潜在分类器。在一实施方案中,所谓的遗传算法可tt以使用上文定义的适合度评分用于组合不同的标记。遗传算法特别适合开tt发潜在分类器的大且多样的群体。在另一实施方案中,所谓的蚁群优化(ant ttcolony optimization)可以用于产生分类器的集合。现有技术已知的其他策略tt也可以采用,包括例如其他进化策略以及模拟退火和其他随机检索方法。tt还可以采用元启发式方法如和声搜索(harmony search)。tt

  示例性实施方案使用表1第2列所列的任意数目的胰腺癌生物标记以tt各种组合来产生用于检测胰腺癌的诊断测试(如何鉴定这些生物标记的详tt细描述见实施例2)。在一实施方案中,诊断胰腺癌的方法使用朴素贝叶斯tt分类方法联合表1第2列所列的任意数目的胰腺癌生物标记。在说明性实tt例(实施例3)中,用于从GI和正常对照群体检测胰腺癌的最简单的测试可tt以使用诸如CTSB的单生物标记来构建,CTSB在胰腺癌中差异表达,KS-tt距离为0.52。使用来自表16的针对CTSB的参数μc,i、σc,i、μd,i和σd,i以及tt上述log-似然性的等式,可以产生具有0.79的AUC的诊断测试,见表15。tt这个测试的ROC曲线示于图2。tt

  例如,具有0.40的KS-距离的生物标记C5a的添加将分类器性能显著tt改善至0.85的AUC。注意,由两个生物标记构建的分类器的评分不是KS-tt距离的简单加和;当组合生物标记时KS-距离不是加合性时,要使用许多tt较弱标记来实现与强标记相同的性能水平。例如,加入第三标记C5将分类tt器性能增加至0.88的AUC。加入额外的生物标记例如CCL18、CSF1R、ttKLK7、ETHE1、C5-C6、KLK8和VEGFA产生了一系列胰腺癌测试,总tt结在表15中,并在图3中显示为一系列ROC曲线。作为分类器构建中使tt用的分析物数目的函数的分类器评分示于图4。这种示例性10-标记分类器tt的AUC为0.91。tt

  表1第2列所列的标记可以许多方式组合以产生用于诊断胰腺癌的分tttttt类器。在一些实施方案中,根据所选的特定诊断性能标准,生物标记的组tt由不同数目的分析物组成。例如,生物标记的某些组合会产生比其他组合tt更灵敏(或更特异性)的测试。tt

  一旦组限定为包括来自表1第2列的生物标记的特定集合,并且从训tt练数据集合构建分类器,则诊断测试的定义完整。在一实施方案中,用于tt分类未知样品的程序示于图1A。在另一实施方案中,用于分类未知样品的tt程序示于图1B。将生物学样品适当稀释,然后进行一个或多个测定以产生tt用于分类的相关定量生物标记水平。测量的生物标记水平用作分类方法的tt输入,该方法输出所述样品的分类和任选的评分,这反映了类别分配的置tt信度。tt

  表1鉴定了可用于诊断胰腺癌的65种生物标记。当与在生物标记发现tt的尝试中通常发现的相比时,这比预期令人惊讶地高,可能归因于所述研tt究的规模,其涵盖在几百个个体样品中测量的超过800种蛋白,在一些情tt况下浓度为低毫微微摩尔范围。据推测,发现的大量生物标记反映了在肿tt瘤生物学和身体对肿瘤存在的应答中涉及的不同生物化学途径;每种途径tt和过程均涉及许多蛋白。结果显示没有一小组蛋白的单个蛋白对这样复杂tt的过程独特提供信息;相反,多种蛋白包括在相关过程中,如凋亡或细胞tt外基质修复。tt

  鉴于在所述研究中鉴定的许多生物标记,可以预期能够衍生大量高性tt能分类器,它们可以用于各种诊断方法。为测试这个观点,用表1的生物tt标记评价了几万个分类器。如实施例4所述,表1所示的生物标记的许多tt子集可以组合以产生有用的分类器。例如,提供了用于检测胰腺癌的包含1、tt2和3个生物标记的分类器的描述。如实施例4所述,用表1的生物标记构tt建的所有分类器比用“非标记”构建的分类器明显更好。tt

  还测试了通过随机排除表1的一些标记获得的分类器的性能,随机排tt除产生了较小的子集,从这些子集来构建分类器。如实施例4部分3所述,tt从表1中标记的随机子集构建的分类器的表现类似于用表1中标记的完全tt列表构建的最佳分类器。tt

  还测试了通过从10-标记聚集中排除“最佳”单个标记而获得的10-标tt记分类器的性能。如实施例4部分3所述,未用表1的“最佳”标记构建tttttt的分类器也表现良好。表1所列生物标记的许多子集表现接近最佳,甚至tt在除去表中所列最好的15个标记之后也如此。这暗示任何特定分类器的性tt能特征可能不是由于生物标记的一些小核心组所致,并且疾病过程可能影tt响许多生物化学途径,其改变许多蛋白的表达水平。tt

  实施例4的结果提示一些可能的结论:首先,大量生物标记的鉴定允tt许它们聚集成巨大数目的分类器,其提供相似的高性能。第二,分类器可tt以这样构建:特定生物标记可以以反映冗余的方式取代其他生物标记,所tt述冗余无疑遍及潜在疾病过程的复杂性。也就是说,由表1中鉴定的任何tt单个生物标记贡献的有关疾病的信息与由其他生物标记贡献的信息重叠,tt由此表1中特定生物标记或生物标记的小组无需包括在任何分类器中。tt

  示例性实施方案使用从表16的数据构建的朴素贝叶斯分类器以分类未tt知样品。图1A和1B中示出了程序。在一实施方案中,将生物学样品任选tt地稀释并且进行多重适配体测定。将来自所述测定的数据如实施例3所述tt正态化及校准,将所得生物标记水平用作贝叶斯分类方案的输入。对于每tt个测量的生物标记单独计算log-似然比,然后求和以产生最终分类评分,tt其也称为诊断评分。可以报道所得分配及总体分类评分。任选地,还可以tt报道对每个生物标记水平计算的个体log-似然性风险因子。分类评分计算tt的细节示于实施例3。tt

  试剂盒tt

  表1第2列的生物标记(以及额外的生物医学信息)的任何组合可以通过tt使用合适的试剂盒检测,如用于进行本文公开的方法的试剂盒。此外,任tt何试剂盒可以含有本文所述的一种或多种可检测标记,如荧光部分等。tt

  如本文进一步描述,在一实施方案中,试剂盒包含:(a)一种或多种捕tt获试剂(如至少一种适配体或抗体),以检测生物学样品中的一种或多种生物tt标记,其中所述生物标记包括表1第2列所列的任何生物标记,及任选存tt在的(b)一种或多种软件或计算机程序产品,以将从其中获得所述生物学样tt品的个体分类为患有或不患有胰腺癌,或者确定所述个体患有胰腺癌的似tt然性。或者,除了一种或多种计算机程序产品之外,可以提供人工进行上tt述步骤的一种或多种操作指南。tt

  固体支持物与相应捕获试剂及信号产生材料的组合在本文中称作“检tt测装置”或“试剂盒”。试剂盒还可以包含使用该装置和试剂、处理样品以tt及分析数据的使用说明书。此外,试剂盒可以与计算机系统或软件一起使tt用以分析和报道生物学样品的分析结果。tt

  试剂盒还可以含有一种或多种试剂(如增溶缓冲液、去污剂、洗涤剂或tt缓冲液),以对生物学样品进行处理。本文所述的任何试剂盒还可以包含例tt如缓冲液、封闭剂、质谱基质材料、抗体捕获剂、阳性对照样品、阴性对tt照样品、软件以及信息如方案、指导和参考数据。tt

  在一方面,本发明提供了分析胰腺癌状态的试剂盒。试剂盒包含用于tt选自表1第2列的一个或多个生物标记的PCR引物。试剂盒还可以包含使tt用及生物标记与胰腺癌相关性的指导。试剂盒还可以包含DNA阵列,其含tt有选自表1第2列的一个或多个生物标记的补体、用于扩增或分离样品ttDNA的试剂和/或酶。试剂盒可以包含用于实时PCR的试剂,例如TaqMantt探针和/或引物,以及酶。tt

  例如,试剂盒可以包含:(a)试剂,其至少包含用于定量测试样品中的tt一种或多种生物标记的捕获试剂,其中所述生物标记包括表1第2列所列tt的生物标记或本文所述的任何其他生物标记或生物标记组;以及任选存在tt的(b)一种或多种算法或者计算机程序,以进行以下步骤:比较所述测试样tt品中定量的每个生物标记的量与一个或多个预定截断值,基于所述比较分tt配定量的每个生物标记评分,组合定量的每个生物标记的分配评分以获得tt总评分,比较该总评分与预定评分,以及使用所述比较确定个体是否患有tt胰腺癌。或者,除了一种或多种算法或计算机程序之外,可以提供人工进tt行上述步骤的一种或多种操作指南。tt

  计算机方法和软件tt

  一旦选择生物标记或生物标记组,则诊断个体的方法可包括以下步骤:tt1)收集或以其他方式获得生物学样品;2)进行分析方法以检测和测量所述tt生物学样品中的生物标记或生物标记组;3)进行用于收集生物标记值的方tt法所需的任何数据归一化或标准化;4)计算标记评分;5)组合所述标记评tt分以获得总诊断评分;以及6)报告所述个体的诊断评分。在这种方法中,tttttt诊断评分可以是从所有标记计算的总和确定的单一数值,将该数值与指示tt疾病存在与否的预设阈值比较。或者,诊断评分可以是一系列带(bar),其tt各自代表生物标记值,并且可以将应答模式与预设模式比较以确定疾病的tt存在与否。tt

  本文所述方法的至少一些实施方案可以使用计算机实施。计算机系统tt100的实例在图6中示出。参考图6,系统100示出包含通过总线108电耦tt合的硬件元件,包括处理器101、输入设备102、输出设备103、存储设备tt104、计算机可读取的存储介质读取器105a、通讯系统106、处理加速(如ttDSP或特定用途处理器)107和存储器109。计算机可读取存储介质读取器tt105a与计算机可读取的存储介质105b进一步耦合,该组合全面地代表远tt程、局域、固定和/或可移动的存储装置加上存储介质、存储器等,以暂时tt和/或更长久地含有计算机可读取的信息,这可以包括存储设备104、存储tt器109和/或任何其他这样的可存储系统100资源。系统100还包含软件元tt件(显示目前位于工作内存191中),包括操作系统192及其他编码193,如tt程序、数据等。tt

  关于图6,系统100具有广泛的灵活性和可配置性。因此,例如单一计tt算机结构(single architecture)可以用于完成一个或多个服务器,其可以根据tt目前期望的方案、方案变化、扩展等进一步配置。然而,本领域技术人员tt应当了解可以根据更具体的应用要求更好地利用实施方案。例如,一个或tt多个系统元件可以在系统100部件内作为子元件执行(如在通讯系统106tt内)。也可以使用定制的硬件和/或特定元件可以在硬件、软件或者硬件和软tt件中执行。此外,虽然可以使用与其他计算设备如网络输入/输出设备(未示tt出)连接,但是应当理解也可以利用有线、无线、调制解调器和/或与其他计tt算设备的其他连接或多个连接。tt

  在一方面,所述系统可以包含含有胰腺癌特征性生物标记的特征的数tt据库。生物标记数据(或生物标记信息)可以用作计算机的输入以用作计算机tt执行方法的一部分。所述生物标记数据可以包括本文所述的数据。tt

  在一方面,所述系统还包含一个或多个装置以将输入数据提供给一个tt或多个处理器。tt

  所述系统还包含用于存储分等级的数据元件的数据集合的存储器。tt

  在另一方面,用于提供输入数据的装置包括检测仪以检测数据元件的tt特征,如质谱仪或者基因芯片读取器。tt

  所述系统还可以包含数据库管理系统。用户请求或询问可以通过数据tt库管理系统理解的适当语言格式化,该数据库管理系统处理所述询问以从tt训练集合的数据库中提取相关信息。tt

  所述系统可以与网络连接,所述网络连接网络服务器以及一个或多个tt客户端。网络可以是本领域已知的局域网(LAN)或广域网(WAN)。优选地,tt服务器包括运行计算机程序产品(如软件)所需的硬件,以进入数据库数据来tt处理用户请求。tt

  所述系统可以包含操作系统(如UNIX或Linux),以执行来自数据库管tt理系统的命令。在一方面,操作系统可以在全球通讯网络上运行,如在国tt际互联网上运行,并且利用全球通讯网络服务器来连接这样的网络。tt

  所述系统可以包括这样的一个或多个装置,其包含图形显示界面,该tt界面包括界面元件如按钮、下拉菜单、滚动条、输入文本的信息栏等,这tt些是本领域已知的图形用户界面的常见元件。用户界面上登录的请求可以tt传给系统中的应用程序以格式化从而在一个或多个系统数据库中搜寻相关tt信息。用户登录的请求或询问可以任何合适的数据库语言建立。tt

  图形用户界面可以通过作为操作系统一部分的图形用户界面编码产tt生,并且可以用于输入数据和/或显示输入的数据。处理的数据的结果可以tt在界面上显示,在与该系统通讯的打印机上打印,存储在存储装置中,和/tt或上传至网络或者可以计算机可读取介质的形式提供。tt

  所述系统可以与输入装置通讯,以将关于数据元件的数据提供给系统tt(如表达值)。在一方面,输入装置可以包括基因表达谱系统,包括如质谱仪、tt基因芯片或阵列读取器等。tt

  根据各个实施方案分析胰腺癌生物标记信息的方法和设备可以通过任tt何合适的方式执行,例如使用在计算机系统上运行的计算机程序。可以使tt用常规的计算机系统,其包含处理器和随机存取存储器,如可远程登录的tt应用服务器、网络服务器、个人电脑或工作站。其他计算机系统部件可以tt包括存储装置或信息存储系统,如大量存储系统和用户界面,例如常规的tt监视器、键盘和跟踪装置。计算机系统可以是单机系统,或者是包含服务tttttt器以及一个或多个数据库的计算机网络的一部分。tt

  胰腺癌生物标记分析系统可以提供完整数据分析的运算(function)和运tt行,如数据收集、处理、分析、报告和/或诊断。例如,在一实施方案中,tt计算机系统可以执行计算机程序,该程序可以接收、储存、搜寻、分析和tt报告关于胰腺癌生物标记的信息。计算机程序可以包含进行各种运算或运tt行的多个模块,如处理原始数据和产生补充数据的处理模块,以及分析原tt始数据和补充数据以产生胰腺癌状态和/或诊断的分析模块。诊断胰腺癌状tt态可以包括产生或收集任何其他信息,包括额外的生物医学信息、关于个tt体相对于疾病的状况,鉴定是否需要进一步检测,或者另外评价个体的健tt康状态。tt

  关于图7,可以看出根据公开的实施方案的原理利用计算机的方法的一tt个实例。在图7中,示出了流程图3000。在模块(block)3004中,可以检索tt个体的生物标记信息。所述生物标记信息可以从计算机数据库中检索,例tt如在测试个体的生物学样品之后。生物标记信息可以包含生物标记值,所tt述生物标记值每个对应于选自由表1第2列提供的生物标记组成的组的至tt少N个生物标记之一,其中N=2-65。在模块3008中,计算机可以用于将tt每个生物标记值分类。在模块3012中,基于多个分类可以确定个体患有胰tt腺癌的似然性。可以将该指示输出至显示器或其他显示装置,以供人观察。tt因此,例如该指示可以在计算机的显示器屏幕或其他输出装置上显示。tt

  现在关于图8,通过流程图3200举例说明了根据另一实施方案利用计tt算机的可选方法。在模块3204中,可以利用计算机检索个体的生物标记信tt息。生物标记信息包含生物标记值,所述生物标记值对应于选自表1第2tt列提供的生物标记的组的生物标记。在模块3208中,可以用计算机将生物tt标记值进行分类。并且,在模块3212中,基于所述分类可以对个体患有胰tt腺癌的似然性作出指示。可以将该指示输出至显示器或其他显示装置,以tt供人观察。因此,例如该指示可以在计算机的显示器屏幕或其他输出装置tt上显示。tt

  本文所述的一些实施方案可以执行以包含计算机程序产品。计算机程tt序产品可以包括具有包含于介质中的计算机可读取程序编码的计算机可读tt取介质,以使得应用程序可以在具有数据库的计算机上执行。tt

  如本文所用,“计算机程序产品”指自然或程序设计语言语句形式的组tt织化的指令集合,其包含于任何性质的物理介质上(如书写、电子、磁性、tt光学或其他性质),并且可以与计算机或其他自动化数据处理系统一起使tt用。这样的程序设计语言语句在由计算机或数据处理系统执行时,使得所tt述计算机或数据处理系统根据语句的特定内容起作用。计算机程序产品包tt括但不限于:包含于计算机可读取介质中的源代码和目标码和/或测试或数tt据库中的程序。此外,允许计算系统或数据处理设备以预选方式起作用的tt计算机程序产品可以以多种形式提供,包括但不限于源代码(original source ttcode)、汇编码(assembly code)、目标码、机器语言、前述代码的加密或压缩tt形式以及任何和所有等价物。tt

  在一方面,本发明提供了一种指示胰腺癌的似然性的计算机程序产品。tt所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程序代tt码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因于来tt自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,所述tt生物标记值每个对应于所述生物学样品中选自表1第2列提供的生物标记tt的组的至少N个生物标记之一,其中N=2-65;以及执行分类方法的代码,tt所述分类方法将所述个体的胰腺癌状态指示为所述生物标记值的函数。tt

  在另一方面,本发明提供了一种指示胰腺癌的似然性的计算机程序产tt品。所述计算机程序产品包括包含程序代码的计算机可读取介质,所述程tt序代码可由计算装置或系统的处理器执行,所述程序代码包括:检索归因tt于来自个体的生物学样品的数据的代码,其中所述数据包括生物标记值,tt所述生物标记值对应于所述生物学样品中选自表1第2列提供的生物标记tt的组的生物标记;以及执行分类方法的代码,所述分类方法将所述个体的tt胰腺癌状态指示为所述生物标记值的函数。tt

  虽然已经描述了本发明的方法或设备的各种实施方案,但是应当理解tt所述实施方案可以通过与计算机耦合的代码执行,如在计算机上或可由计tt算机登录的代码。例如,软件和数据库可以用于执行许多上述方法。因此,tt除了由硬件完成的实施方案之外,还应当注意到这些实施方案可以通过使tt用这样的产品实现,所述产品包含具有在其中包含计算机可读取程序代码tt的计算机可用介质,其允许行使本文公开的功能。因此,期望所述实施方tttttt案也可以被视为由本专利以其程序代码方式等保护。此外,所述实施方案tt可以体现为存储在实际上任何类型的计算机可读取存储器中的代码,包括tt但不限于RAM、ROM、磁性介质、光学介质或磁-光学介质。更通常地,tt所述实施方案可以在软件或硬件或者它们的任何组合中实施,包括但不限tt于在通用处理器、微代码、PLA或ASIC上运行的软件。tt

  还期望所述实施方案可以作为包含于载波中的计算机信号以及通过传tt送介质传送的信号(如电信号和光信号)实现。因此,上述各种类型的信息均tt可以在结构中格式化,如数据结构,并且作为电信号通过传送介质传送,tt或者存储在计算机可读取介质中。tt

  还应当注意,本文所列举的许多结构、材料和条文可以列举为用于行tt使功能或行使功能的步骤的方式。因此,应当理解这样的语言有权覆盖本tt说明书公开的所有的这些结构、材料或条文以及它们的等价物,包括通过tt引用并入本文的内容。tt

  关于胰腺癌,上文详细描述了生物标记鉴定过程、本文公开的生物标tt记的利用以及确定生物标记值的各种方法。然而,所述过程的应用、鉴定tt的生物标记的用途以及确定生物标记值的方法完全可以应用于其他特定类tt型的癌症,一般的癌症,任何其他疾病或医学状况,或者鉴定可能或可能tt不受益于辅助医学治疗的个体。除了当从上下文清楚地看出指与胰腺癌相tt关的特定结果时,本文中提到胰腺癌可以理解为包括其他类型的癌症、一tt般的癌症或者任何其他疾病或医学状况。tt

  实施例tt

  下述实施例仅用于示例目的而不意图限制所附权利要求限定的本申请tt的范围。本文描述的所有实施例用本领域技术人员公知的常规标准技术进tt行。下述实施例描述的常规分子生物学技术可以如标准实验室手册所述进tt行,如Sambrook et al.,Molecular Cloning:A Laboratory Manual,3rd.ed.,Cold ttSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,(2001)。tt

  实施例1.样品的多重适配体分析tt

  本实施例描述用于分析样品和对照以鉴定表1第2列所列的生物标记tttttt(见图9)和鉴定表19所列的癌症生物标记的多重适配体测定。对于胰腺癌、tt肺癌和间皮瘤研究,多重分析使用823个适配体,每个对于特定靶标是独tt特的。tt

  在这个方法中,每次添加溶液均更换移液器尖头。tt

  而且,除非另有说明,大多数溶液转移和洗涤添加使用Beckman ttBiomek FxP的96孔头(head)。除非另有说明,手工移液的方法步骤使用12tt通道P200 Pipetteman(Rainin Instruments,LLC,Oakland,CA)。称为SB17的tt定制缓冲液由内部(in-house)制备,其包含40mM HEPES、100mM NaCl、tt5mM KCl、5mM MgCl2、1mM EDTA,pH7.5。称为SB18的定制缓冲液tt由内部制备,其包含40mM HEPES、100mM NaCl、5mM KCl、5mM ttMgCl2,pH7.5。除非另有说明,所有步骤均在室温下进行。tt

  1.适配体储液的制备tt

  对于不具有光可裂解生物素接头的适配体,用合适的光可裂解生物素tt酰化引物在1x SB17,0.05%吐温-20中以8x浓度制备用于10%、1%和0.03%tt血浆的定制适配体储液,其中所得的引物浓度是相关适配体浓度的3倍。tt引物与全部或部分相应适配体杂交。tt

  将3种8x适配体溶液的每一种分别以1∶4稀释入1xSB17,0.05%吐温tt-20(1500μL的8x储液稀释入4500μL的1xSB17,0.05%吐温-20)以实现tt2x浓度。然后将每种稀释的适配体主混合物(master mix)分配到4个2mLtt螺旋盖试管中,每个试管1500μL,并且加热至95℃保持5分钟,随后在tt37℃下温育15分钟。温育后,将对应于特定适配体主混合物的4个2mLtt试管组合入试剂槽(trough),将55μL的2x适配体混合物(对于所有三种混tt合物)手工移液入96孔Hybaid平板并用箔将平板密封。最终结果是3个96tt孔箔密封的Hybaid平板。各个适配体浓度为0.5nM。tt

  2.测定样品制备tt

  将储存在-80℃的100%血浆的冷冻等份置于25℃水浴中保持10分钟。tt将融化的样品置于冰上,温和地涡漩(设为4)8秒钟,然后再置于冰上。tt

  在4℃下,用50μL的8通道多通道移液器(spanning pipettor)将16μLtt样品转移至96孔Hybaid平板中以制备20%样品溶液,每个孔含有64μLtt合适的样品稀释物(对于血浆,0.8x SB18、0.05%吐温-20、2μM Z-block_2、tttttt0.6mM MgCl2)。将这个平板保存在冰上直至开始下一个样品稀释步骤。tt

  为了开始样品和适配体平衡,将20%样品平板短暂离心并置于ttBeckman FX上,在此将其用96孔移液器上下移液来混合。然后通过将10ttμL的20%样品稀释至90μL的1xSB17,0.05%吐温-20中来制备2%样品。tt然后,将6μL所得的2%样品稀释至194μL的1xSB17,0.05%吐温-20中tt以制备0.06%样品平板。在Beckman Biomek FxP上进行稀释。每次转移后,tt通过上下移液来将溶液混合。然后,通过将55μL样品加入到55μL合适tt的2x适配体混合物中,将3个样品稀释平板转移至它们各自的适配体溶液。tt将样品和适配体溶液通过上下移液在机器人(robot)上混合。tt

  3.样品平衡结合tt

  将样品/适配体平板用箔密封,并且置于37℃培养箱中保持3.5小时,tt然后进行Catch1步骤。tt

  4.制备Catch2珠平板tt

  将5.5mL的MyOne(Invitrogen Corp.,Carlsbad,CA)链霉抗生物素蛋白ttC1珠等份(10mg/mL)用等体积的20mM NaOH洗涤2次(每次洗涤温育5tt分钟),用等体积的1x SB17,0.05%吐温-20洗涤3次,并且重悬浮于5.5mLtt的1x SB17,0.05%吐温-20中。用12-通道(span)多通道移液器将50μL该tt溶液手工移液至96孔Hybaid平板的每个孔中。然后将平板用箔覆盖,并tt保存在4℃用于测定。tt

  5.制备Catch1珠平板tt

  将3个0.45μm的Millipore HV平板(Durapore membrane,Cat# ttMAHVN4550)用100μL的1x SB17,0.05%吐温-20平衡至少10分钟。然tt后通过平板过滤平衡缓冲液,向每孔中加入133.3μL的7.5%链霉抗生物素tt蛋白-琼脂糖珠浆液(于1x SB17,0.05%吐温-20中)。为了在将链霉抗生物tt素蛋白-琼脂糖珠转移入滤板时保持它们悬浮,将珠溶液用200μL,12-通tt道移液器手工混合15次。在将珠分配于3个滤板中之后,施加真空以除去tt珠上清。最后,将珠在滤板中用200μL的1x SB17,0.05%吐温-20洗涤,tt然后重悬于200μL的1x SB17,0.05%吐温-20中。将滤板的底部吸干(blot),tt并将平板储存以用于测定。tt

  6.装载Cytomattt

  将cytomat用所有尖头、平板、槽中的所有试剂(除了NHS-生物素试剂,tt其在即将加入到平板之前制备)、3个制备的Catch1滤板和1个制备的ttMyOne平板装载。tt

  7.Catch1tt

  3.5小时平衡时间之后,将样品/适配体平板从培养箱中移出,离心约1tt分钟,除去箔,置于Beckman Biomek FxP平台上。开始Beckman Biomek FxPtt程序。除非另有说明,Catch1中的所有后续步骤均由Beckman Biomek FxPtt机器人完成。在该程序内,向Catch1滤板施加真空以除去珠上清。将100tt微升10%、1%和0.03%平衡结合反应的每一种加入到它们各自的Catch1tt滤板,每个板用即用(on-deck)轨道摇床(orbital shaker)以800rpm混合10分tt钟。tt

  通过真空过滤除去未结合的溶液。通过分配溶液并立即施加真空以使tt溶液通过平板过滤,将Catch1珠用190μL的1x SB17,0.05%吐温-20中tt的100μM生物素洗涤,然后用190μL的1x SB17,0.05%吐温-20洗涤。tt

  然后,将190μL的1x SB17,0.05%吐温-20加入Catch1平板中。用tt即用吸干装置(blot station)将平板吸干以除去液滴,然后用轨道摇床在800ttrpm、25℃下温育10分钟。tt

  机器人通过真空过滤除去这个洗涤液,并且用即用吸干装置吸干滤板tt底部以除去液滴。tt

  8.标记(Tagging)tt

  将NHS-PEO4-生物素等份在37℃下融化6分钟,然后用标记缓冲液tt(pH=7.25的SB170.05%吐温-20)以1∶100稀释。将NHS-PEO4-生物素试剂tt在无水DMSO中溶解为100mM的浓度,并且冷冻保存于-20℃。在机器人tt辅助下,将稀释的NHS-PEO4-生物素试剂手工加入即用槽中,手工重新启tt动机器人程序以将100μL的NHS-PEO4-生物素分配到每个Catch1滤板的tt每个孔中。将这个溶液用Catch1珠在轨道摇床上以800rpm振荡温育5分tt钟。tt

  9.动力学攻击(Kinetic Challenge)和光裂解tt

  通过向Catch1平板加入150μL的1x SB17,0.05%吐温-20中的20mMtt甘氨酸来中止标记反应,同时仍含有NHS标签。然后将平板在轨道摇床上tttttt以800rpm温育1分钟。通过真空过滤除去NHS-标签/甘氨酸溶液。然后,tt将190μL的20mM甘氨酸(1x SB17,0.05%吐温-20)加入到每个平板,并tt在轨道摇床上以800rpm温育1分钟,之后通过真空过滤除去。tt

  将190μL的1x SB17,0.05%吐温-20加入到每个平板,并通过真空过tt滤除去。tt

  然后,通过加入190μL的1x SB17,0.05%吐温-20,将平板置于轨道tt摇床上以800rpm保持1分钟随后真空过滤来将Catch1平板的孔洗涤3次。tt最后一次洗涤后,将平板置于1mL深孔平板的顶部并从平台上移开。将ttCatch1平板在1000rpm下离心1分钟以在洗脱之前从琼脂糖珠上尽可能除tt去无关的体积。tt

  将平板放回Beckman Biomek FxP上,并向滤板的每孔中加入85μL的tt1x SB17,0.05%吐温-20中的10mM DxSO4。tt

  将滤板从平台上移开,置于Variomag Thermoshaker(Thermo Fisher ttScientific,Inc.,Waltham,MA)上,在BlackRay(Ted Pella,Inc.,Redding,CA)tt光源下,以800rpm振荡同时照射10分钟。tt

  通过首先将10%Catch1滤板置于1mL深孔平板的顶部并以1000rpmtt离心1分钟来将光裂解的溶液依次从每个Catch1平板洗脱入同一个深孔平tt板。然后,将1%和0.03%Catch1平板依次离心入相同的深孔平板。tt

  10.Catch2珠捕获tt

  将含有合并的Catch1洗脱物的1mL深孔块(block)置于用于Catch2tt的Beckman Biomek FxP的平台上。tt

  机器人将所有光裂解洗脱物从1mL深孔平板转移至含有先前制备的ttCatch 2 MyOne磁珠的Hybaid平板上(通过磁性分离除去MyOne缓冲液后)。tt

  将溶液在Variomag Thermoshaker(Thermo Fisher Scientific,Inc.,ttWaltham,MA)上于25℃以1350rpm振荡温育5分钟。tt

  机器人将平板转移至即用磁性分离器。将平板在磁体上温育90秒,然tt后除去并弃去上清。tt

  11.37℃30%甘油洗涤tt

  将Catch2平板移到即用保温摇床上,并且将75μL的1x SB17,0.05%tt吐温-20转移到每孔中。将平板在37℃下以1350rpm混合1分钟以重悬并tttttt加热珠。在37℃下,向Catch2平板的每个孔中转移75μL的60%甘油,tt并且将平板继续在37℃下以1350rpm再混合1分钟。机器人将平板转移tt到37℃磁性分离器上,在此将其在磁体上温育2分钟,然后机器人除去并tt弃去上清。将这些洗涤再重复2次。tt

  将第三30%甘油洗涤液从Catch2珠除去后,将150μL的1x SB17,tt0.05%吐温-20加入每孔中,并且在37℃下以1350rpm振荡温育1分钟,tt然后在37℃磁体上通过磁性分离除去。tt

  将Catch2珠用150μL的1x SB19,0.05%吐温-20在25℃下以1350rpmtt振荡温育1分钟来进行最后洗涤一次,然后进行磁性分离。tt

  12.Catch2珠洗脱和中和tt

  通过向每孔加入105μL含1M NaCl,0.05%吐温-20的100mM CAPSOtt来将适配体从Catch2珠洗脱。将珠用这种溶液以1350rpm振荡温育5分tt钟。tt

  然后,将Catch2平板置于磁性分离器上保持90秒,然后将90μL洗tt脱物转移至每孔含有10μL的500mM HCl、500mM HEPES、0.05%吐温-20tt的新96孔平板中。转移后,通过移液90μL上下5次来机器混合溶液。tt

  13.杂交tt

  Beckman Biomek FxP转移20μL中和的Catch2洗脱物至新鲜的ttHybaid平板,向每孔加入5μL含有10x峰值(spike)杂交对照的10x Agilent ttBlock。然后,将25μL的2x Agilent Hybridization缓冲液手工移液入含有tt中和的样品和封闭缓冲液的平板的每孔中,并且通过手工缓慢移液25μLtt上下15次以避免大量泡沫形成而将溶液混合。将平板以1000rpm离心1tt分钟。tt

  将gasket slide置于Agilent杂交室中,将40μL每种含有杂交和封闭溶tt液的样品手工移液至每个gasket中。以减少气泡形成的方式使用8-通道可tt调(variable)多通道移液器。然后将定制Agilent微阵列玻片(Agilent ttTechnologies,Inc.,Santa Clara,CA)以条形码朝上缓慢下降到gasket slide上tt(参见Agilent手册的详细描述)。tt

  将杂交室上部置于玻片/背衬(backing)夹心结构上,将夹紧支架tt(clamping bracket)盖在整个装置上。通过旋紧螺旋来夹紧这些装置。tt

  目视检查每个玻片/背衬玻片夹心结构以确保溶液气泡可以在样品内tt自由活动。如果气泡不自由活动,则轻拍杂交室装置以释放靠近垫片(gasket)tt的气泡。tt

  将组装的杂交室在Agilent杂交炉中在60℃下以20rpm旋转温育19tt小时。tt

  14.杂交后洗涤tt

  将约400mL的Agilent Wash Buffer1置于两个单独的玻璃染色皿的每tt一个中。将一个染色皿置于磁力搅拌板上,将玻片架和搅拌棒置于缓冲液tt中。tt

  通过将搅拌棒置于空玻璃染色皿中来制备用于Agilent Wash2的染色tt皿。tt

  将第四玻璃染色皿置于一旁以用于最终乙腈洗涤。tt

  分解6个杂交室中的每一个。逐个将玻片/背衬夹心结构从其杂交室移tt开并浸入含有Wash1的染色皿中。用一对镊子将玻片/背衬夹心结构撬开,tt同时仍浸没微阵列玻片。将玻片快速转移至磁力搅拌板上的Wash1染色皿tt中的玻片架中。tt

  将玻片架缓慢上升和降低5次。将磁力搅拌器以低设定开启,并且将tt玻片温育5分钟。tt

  当Wash1剩余1分钟时,将在培养箱中预热至37℃的Wash Buffer2tt加入第二制备的染色皿中。将玻片架快速转移至Wash Buffer2中,并且通tt过将其在染色皿顶部刮擦来除去玻片架底部的任何过量缓冲液。将玻片架tt缓慢上升和降低5次。将磁力搅拌器以低设定开启,并且将玻片温育5分tt钟。tt

  将玻片架从Wash2中缓慢取出,将玻片从溶液中取出需要约15秒。tt

  当在Wash2中剩余1分钟时,将乙腈(ACN)加入第四染色皿中。将玻tt片架转移至乙腈染色皿中。将玻片架缓慢上升和降低5次。将磁力搅拌器tt以低设定开启,并且将玻片温育5分钟。tt

  将玻片架缓慢从ACN染色皿中取出并置于吸水纸上。将玻片底部边缘tt快速干燥,并且将玻片置于干净的玻片盒中。tt

  15.微阵列成像tt

  将微阵列玻片置于Agilent扫描仪玻片容器中,并根据厂商指导装载至ttAgilent微阵列扫描仪中。tt

  将玻片在Cy3通道中以5μm分辨率在100%PMT设定及XRD选项为tt0.05的条件下成像。将所得的tiff图像用Agilent特征抽取软件版本10.5处tt理。tt

  实施例2.生物标记鉴定tt

  进行潜在的胰腺癌生物标记的鉴定,用于诊断无症状的个体以及患有tt急性或慢性胰腺炎(或两者)、胰腺梗阻、GERD、胆石或者后来发现为良性tt的异常成像的有症状的个体(统称为GI和正常对照)中的胰腺癌。这个研究tt的招收标准是年龄18岁或更大,能够签署知情同意书,并且提供血浆样品tt以及胰腺癌或良性发现的记录诊断。对于病例,在治疗或手术之前采集血tt液样品,随后诊断为胰腺癌。排除标准包括抽血的5年内癌症(除了皮肤的tt鳞状细胞癌)的早期诊断或治疗。血浆样品采集自2个不同部位,并且包括tt143个胰腺癌样品和115个对照组样品。用实施例1所述的多重适配体亲和tt测定测量和报道这些258个样品中每一个的823个分析物的RFU值。因为tt血浆样品在相似方案下获得自2个独立研究和部位,所以在生物标记发现tt分析之前进行位点差异的检测。tt

  每个病例和对照群体分别通过产生823个分析物中每一个的类别依赖tt性累积分布函数(cdf)来比较。来自样品的两个集合的值之间的KS-距离(柯tt尔莫可洛夫-斯米洛夫统计量)是如下程度的非参数测量,即来自一个集合tt(集合A)的值的经验分布与来自另一集合(集合B)的值的分布的差异程度。tt对于阈值T的任何值,来自集合A的某些比例的值小于T,并且来自集合ttB的某些比例的值小于T。KS-距离测量对于任何T选择来自两个集合的值tt的比例之间的最大(无符号)差异。tt

  潜在生物标记的这个集合可以用于构建分类器,该分类器将样品分配tt至对照或疾病组。事实上,许多这样的分类器是从这些生物标记的集合产tt生的,并且确定了任何生物标记用于良好评分分类器的频率。在顶级评分tt分类器中最常出现的那些生物标记对于产生诊断测试是最有用的。在本实tt施例中,贝叶斯分类器用于开发分类空间,但是许多其他监督学习技术可tttttt以为此目的而采用。任何单独分类器的评分适合度使用贝叶斯表面分类器tt的接受者操作特征曲线下面积(ROC的AUC)而判断,假定疾病发病率为tt0.5。这个评分度量从0到1变化,1是无误差分类器。从生物标记群体测tt量构建贝叶斯分类器的细节如实施例3所述。tt

  使用表1中的65个分析物,发现总计973个10-分析物分类器具有诊tt断胰腺癌与对照组的0.90的AUC。从分类器的这个集合,发现总计11个tt生物标记存在于30%或更多的高评分分类器中。表13提供这些潜在生物标tt记的列表,并且图10为鉴定的生物标记的频率图。tt

  实施例3.胰腺癌的朴素贝叶斯分类tt

  从鉴定为可用于区分胰腺癌和对照的生物标记列表,选择一组10个生tt物标记并构建朴素贝叶斯分类器,见表16。将类别依赖性概率密度函数(pdf)ttp(xi|c)和p(xi|d)建模为log-正态分布函数,其中xi为生物标记i的测量的ttRFU值的log,c和d指对照和疾病群体,该函数的特征在于平均值μ和方tt差σ2。10个生物标记的pdf的参数列于表16,拟合为正态pdf的原始数据tt与模型的实例示于图5。如图5所示,潜在的假设看起来拟合数据非常好。tt

  这样的模型的朴素贝叶斯分类在下述等式中给出,ttln(p(d|x~)p(c|x~))=Σi=1nln(σc,iσdi)-12Σi=1n[(xi-μd,iσd,i)2-(xi-μc,iσc,i)2]+ln(p(d)1-p(d)),其中P(d)为适合测试的群体中的疾病发病率,并且n=10。求和中的每一tt项是单个标记的log似然比,不患有所关注的疾病(即在这种情况下是胰腺tt癌)比患有该疾病的样品的总log似然比是这些单独项加上表示疾病发病tt率的项的简单加和。为简便起见,我们假设p(d)=0.5,从而ttln(p(d)1-p(d))=0.

  鉴于6.3、9.3、8.7、10.8、7.4、11.4、11.7、9.0、8.0、7.3的10个生tt物标记中每一个的以log(RFU)计的未知样品测量,分类的计算在表16中详tt述。将包含疾病比对照类别的log似然比的单个组分制成表格,并且可以tttttt从表16中的参数和的值计算。个体log似然比的总和为-3.044,或者没有tt疾病比患有疾病的个体的似然性为21,其中似然性e3.044=21。前3个生物tt标记值具有与疾病组更一致的似然性(log似然性>0),但是据发现剩余的7tt个生物标记全部一致有利于对照组。将似然性相乘给出上述相同结果;未tt知样品不患有疾病的似然性为21。事实上,这个样品来自训练集合中的对tt照群体。tt

  实施例4.选择用于分类器的生物标记组的贪婪算法tt

  本实施例描述了从表1选择生物标记以形成可以在本文所述的任何方tt法中用作分类器的组。选择表1的生物标记的子集以构建具有良好性能的tt分类器。这个方法还用于确定哪些潜在标记包括为实施例2中的生物标记。tt

  此处所用的分类器性能的测量是AUC;0.5的性能是随机(抛硬币(coin tttoss))分类器的基线预期值,比随机差的分类器的评分在0.0至0.5之间,比tt随机性能好的分类器的评分在0.5至1.0之间。无误差的完美分类器具有1.0tt的灵敏性和1.0的特异性。可以将实施例4的方法用于性能的其他常规测量,tt如F-测量、灵敏性和特异性之和或者灵敏性和特异性之积。特别地,可能tt想要用不同加权处理灵敏性和特异性,从而选择具有较高特异性而损失一tt些灵敏性的那些分类器,或者选择具有较高灵敏性而损失一些特异性的那tt些分类器。因为本文所述的方法仅涉及“性能”的一个测量,因此可以使tt用导致单个性能测量的任何加权方案。不同应用对于真阳性和真阴性发现tt会有不同益处,以及与假阳性发现和假阴性发现相关的不同成本。例如,tt筛选无症状的高风险个体以及鉴别诊断胰腺癌与良性GI症状通常不具有tt相同的特异性与灵敏性之间的最佳平衡(trade-off)。两种测试的不同需求通tt常需要对阳性和阴性误分类设定不同的加权,反映在性能测量中。改变性tt能测量通常会改变对于给定数据集合的选自表1第2列的确切标记子集。tt

  对于实施例3所述的区分胰腺癌样品与对照样品的贝叶斯方法,通过tt生物标记在疾病和良性训练样品中的分布来将分类器完全参数化,并且生tt物标记列表选自表1;即,给定训练数据集合,选择包括的标记子集以一对tt一的方式确定分类器。tt

  此处采用的贪婪方法用于从表1检索最佳标记子集。对于小数目标记tttttt或具有较少标记的分类器,列举每个可能的标记子集并评价用该特定标记tt集合构建的分类器的性能(见实施例4,部分2)。(这种方法在统计学领域公tt知为“最佳子集选择”;参见例如Hastie等人)。但是,对于本文所述的分tt类器,多个标记的组合的数目可能非常大,并且评价10个标记的每个可能tt的集合是不可行的,因为可以从仅30个总分析物的列表产生30,045,015种tt可能的组合。因为通过每个标记子集检索不切实际,所以单个最佳子集可tt能不能发现;但是,通过使用这种方法,发现了许多优异的子集,并且在tt许多情况下,任何这些子集可以代表最佳的子集。tt

  代替评价每个可能的标记集合,可以进行“贪婪”正向逐步方法tt(″greedy″forward stepwise approach)(参见例如Dabney AR,Storey JD(2007)ttOptimality Driven Nearest Centroid Classification from Genomic Data.PLoS ttONE2(10):e1002.doi:10.1371/journal.pone.0001002)。使用这种方法,分类tt器以最佳的单个标记(基于各个标记的KS-距离)开始,并且在每步通过依次tt尝试标记列表中目前不是分类器中的标记集合的成员的每个成员而成长。tt将与现有分类器组合评分最佳的一个标记加入到分类器中。重复直至不再tt实现性能的进一步改善。不幸地,这种方法可能错过有价值的标记组合,tt一些单独的标记在方法终止前没有全部被选择。tt

  此处使用的贪婪方法是前述正向逐步方法的加工,为了扩大检索,而tt不是在每个步骤中保持仅单个候选分类器(标记子集),保持候选分类器列tt表。该列表用每个单个标记子集(使用表中每个标记自身)播种。通过从目前tt在列表中的分类器衍生新的分类器(标记子集)并将它们加入列表中来逐步tt扩大列表。通过加入不是该分类器的部分的来自表1的任何标记(其加入到tt子集不会复制现有子集)(这些称为“允许标记”)延伸目前在列表上的每个tt标记子集。每个现有标记子集通过来自列表的每个允许标记延伸。很明显,tt这种方法最终会产生每个可能的子集,并且该列表会用完空间。因此,所tt有产生的分类器仅保持到列表小于某些预定大小时(通常足以保持所有三tt个标记子集)。一旦列表达到预定大小限制,其变成精英(elitist);即,仅显tt示一定水平性能的那些分类器保持在列表上,其他分类器跌落到列表末尾tt并被丢弃。这通过保持按照分类器性能顺序分选的列表来实现;插入至少tt与目前列表上最差分类器一样好的新的分类器,使得强制排除当前末尾的tttttt后进者。一种进一步执行细节是列表在每个产生步骤被完全置换;因此,tt列表上的每个分类器具有相同数目的标记,在每个步骤每个分类器的标记tt数目增加一个。tt

  由于这个方法使用不同标记组合产生候选分类器列表,所以人们会询tt问是否可以组合分类器以避免可能由最佳单个分类器或由最佳分类器的少tt数组产生的误差。这类“总体”和“专家委员会(committee of experts)”方tt法是统计学和机器学习领域公知的,并且包括例如“Averaging”、“Voting”、tt“Stacking”、“Bagging”和“Boosting”(参见例如Hastie等人)。简单分类tt器的这些组合提供了通过包括一些不同分类器及因此来自生物标记表的更tt大的标记集合的信息来降低分类中由于任何特定标记集合中的噪声所导致tt的方差的方法,这有效地在分类器之间平均。这种方法的有用性的实例是tt其可以防止单个标记中的异常值(outlier)负面影响单个样品的分类。测量更tt大数目信号的需求在常规的“一次一个标记”抗体测定中可能是不切实际tt的,但是对于完全多重适配体测定没有下降趋势(downside)。这些技术获益tt于更广泛的生物标记表,并且使用有关疾病过程的多种信息来源以提供更tt稳健的分类。tt

  表1中选择的生物标记给出的分类器表现好于用“非标记”(即具有不tt满足包括在表1中的标准的信号的蛋白(如实施例2所述))构建的分类器。tt

  对于仅含有一个、两个和三个标记的分类器,用表1的生物标记获得tt的所有可能的分类器被列举并检查性能分布,与从随机选择的非标记信号tt的相似表构建的分类器进行比较。tt

  在图11中,AUC用作性能的测量;0.5的性能是随机(抛硬币)分类器tt的基线预期值。分类器性能的柱状图与来自从65个非标记信号的“非标记”tt表构建的分类器的相似穷举的性能的柱状图进行比较;所述65个信号随机tt选自未证实对照与疾病群体之间的差异信号的适配体。tt

  图11显示从表14的生物标记参数构建的所有可能的单标记、二标记tt和三标记分类器对于可以区分对照组和胰腺癌的生物标记的性能的柱状tt图,并且将这些分类器与用65个“非标记”适配体RFU信号构建的所有tt可能的单标记、二标记和三标记分类器进行比较。图11A示出单标记分类tt器性能的柱状图,图11B示出二标记分类器性能的柱状图,而图11C示出tttttt三标记分类器性能的柱状图。tt

  在图11中,实线表示使用表14中GI和正常对照以及胰腺癌的生物标tt记数据的所有单标记、二标记和三标记分类器的分类器性能的柱状图。虚tt线是使用对照和胰腺癌的数据但是使用随机非标记信号集合的所有单标tt记、二标记和三标记分类器的分类器性能的柱状图。tt

  从表1所列的标记构建的分类器形成了独特的柱状图,对于所有单标tt记、二标记和三标记比较,与用来自“非标记”的信号构建的分类器分离tt良好。从表1的生物标记构建的分类器的性能和AUC评分随标记数增加也tt比从非标记构建的分类器更快,随着每个分类器标记数增加,标记和非标tt记分类器之间的分离增加。用表14所列的生物标记构建的所有分类器比用tt“非标记”构建的分类器表现更好。tt

  分类器性能的分布显示有许多可能的多标记分类器可以来源于表1的tt分析物的集合。虽然如通过单一分析物的分类器评分的分布和AUC所证实tt的,一些生物标记本身比其他生物标记好,但是确定构建高性能分类器是tt否需要这类生物标记是可取的。为了进行这种确定,通过去掉一定数量的tt最佳生物标记来检测分类器性能的行为。图12比较了用表1的生物标记的tt完整列表构建的分类器的性能与用排除顶级标记的来自表1的生物标记的tt子集构建的分类器的性能。tt

  图12证实未用最佳标记构建的分类器表现良好,这暗示分类器的性能tt不是由一些小的核心组标记所决定,并且与疾病相关的潜在过程中的变化tt反映在许多蛋白的活性中。表1中的许多生物标记子集表现接近最佳,甚tt至在除去表1的65个标记的最好的15个之后也是如此。从表1去掉15个tt顶级标记(通过KS-距离评级)后,分类器性能随着选自该表的标记的数目增tt加至达到几乎0.87的AUC,与选自生物标记的完整列表的0.91的最佳分tt类器评分的性能接近。tt

  最后,图16示出根据实施例3从表14中的参数列表构建的典型分类tt器的ROC性能。用CTSB、C5a、C5、CCL18和CSF1R构建5分析物分类tt器。图16A示出模型的性能,假设这些标记的独立性,如实施例3,并且tt图16B示出从用于定义表14的参数的研究数据集合产生的经验ROC曲线。tt如通过AUC证实的,可以看出给定数目的所选标记的性能在定性上是一致tttttt的,并且定量一致性一般很好,虽然模型计算倾向于高估分类器性能。这tt与以下观点一致,即有关疾病过程的任何特定生物标记贡献的信息与表1tt提供的其他生物标记贡献的信息是冗余的,而模型计算假设完全独立性。tt因此图16证实表1联合实施例3所述的方法允许构建和评价可用于区分胰tt腺癌与对照组的许多分类器。tt

  实施例5.并入CA19-9tt

  癌症相关抗原19-9(CA19-9)是已知的胰腺癌的血清标记。报道的CAtt19-9对胰腺癌的灵敏性和特异性分别为80-90%。然而,CA19-9鉴定患有tt小型手术可切除的癌症的患者的准确性有限。CA19-9的特异性也是有限tt的;CA19-9经常在患有各种良性胆胰病症的患者中升高。tt

  CA19-9在胰腺癌中升高的程度与长期预后有关。此外,在看来患有潜tt在的可切除的疾病的患者中,CA19-9水平的数量级还可以有助于预测放射tt显影隐匿性转移性疾病的存在。CA19-9水平的系列监测可用于随访潜在的tt根治性手术后的患者以及接受晚期疾病的化疗的患者。升高的CA19-9水tt平通常在复发性疾病的放射显影出现之前,但是疾病发展的证实应当通过tt成像研究和/或活组织检查来进行。生物标记水平的检测联合CA19-9与单tt独CA19-9相比,可以改善检测胰腺癌(或其他胰腺癌相关用途)的灵敏性、tt特异性和/或AUC。tt

  升高的CA19-9水平据认为是血清中35-40U/ml。tt

  我们收到了训练样品的子集的临床CA19-9测量。最初的100个病例和tt69个对照中,我们具有99个病例和52个对照的CA19-9测量。因此,我tt们利用表1中的SOMAmer的子集在样品的这个子集上训练随机森林模型tt的新集合。我们还训练新的分类器,其并入CA19-9测量与我们的SOMAmertt组(合并的组)。tt

  三种不同方法(SOMAmer、CA19-9及合并的组)的分类器性能如图13tt所示。SOMAmer组和CA19-9表现相似,然而当这两者合并入单个分类器tt时,性能显著提高。对于100%的特异性,SOMAmer组和CA19-9具有正tt好低于50%的灵敏性,而合并的分类器具有约75%的灵敏性。tt

  进一步分析显示当CA19-9包括在分类器中时,相同的相对性能所需的ttttttSOMAmer数目减少。图14示出使用CA19-9以及一个或两个额外的ttSOMAmer的随机森林分类器的性能。左图示出利用CA19-9和HAMP训tt练的模型的性能,而右图示出CA19-9、HAMP和CTSB的性能。tt

  实施例6.临床生物标记组tt

  随机森林分类器构建自可能最适合用于临床诊断测试的所选生物标记tt的组。不像通过朴素贝叶斯贪婪正向算法选择的模型,随机森林分类器不tt假设生物标记是随机分布的。因此这个模型可以利用在朴素贝叶斯分类器tt中无效的来自表1的生物标记。tt

  使用利用随机森林分类器提供的基尼重要性度量的反向淘汰法选择tt组。基尼重要性是生物标记正确分类训练集合中的样品的有效性的度量。tt生物标记重要性的这种度量可以用来淘汰对于分类器的性能较不重要的标tt记。反向淘汰法通过构建包括表1中所有65个的随机森林分类器开始。然tt后淘汰最不重要的生物标记,并且用剩余的生物标记构建新模型。继续这tt个过程直至仅剩单个生物标记。tt

  所选的最终的组提供最大AUC与模型中标记的最低数目之间的最佳tt平衡。满足这些标准的10个生物标记的组由以下分析物组成:APOA1、ttCTSB、C2、MMP7、HAMP、TFPI、C5、c5a、SFRP1和ETHE1。这个生tt物标记组的ROC曲线的图如图15所示。该图示出箭头所示的两种可能的tt决定截断值:有症状的截断值,其中84%或更多的灵敏性可以与至少80%tt特异性一起获得;以及无症状的截断值,其中97.5%的特异性可以与至少tt60%灵敏性一起获得。tt

  实施例7.用于诊断癌症的生物标记tt

  鉴定用于癌症的一般诊断的潜在生物标记。评价来自3种不同类型的tt癌症(胰腺癌、肺癌和间皮瘤)的病例和对照样品。在采集部位中,包括标准tt是至少18岁,签署知情同意书。病例和对照均排除除考虑的癌症之外的已tt知恶性肿瘤。tt

  胰腺癌.病例和对照样品如实施例2所述获得。tt

  肺癌.病例和对照样品获得自3个学术癌症中心生物数据库tttttt(biorepositories)和一个商业生物数据库以鉴定潜在的标记,用于鉴别诊断非tt小细胞肺癌(NSCLC)与高风险吸烟者的对照组和具有良性肺小结的个体。tt该研究由采集自吸烟者和具有良性小结的患者以及320个诊断患有NSCLCtt的个体的978个样品组成。tt

  胸膜间皮瘤.tt

  病例和对照样品获得自学术癌症中心数据库以鉴定潜在的标记,用于tt鉴别诊断恶性胸膜间皮瘤与具有石棉接触史或良性肺疾病的患者,包括后tt来诊断为非恶性的可疑放射学发现。该研究由采集自接触石棉的个体的30tt个样品和采集自间皮瘤患者的41个样品组成。tt

  癌症生物标记的最终列表通过组合3个不同癌症研究中的每一个考虑tt的生物标记的集合来鉴定。利用贪婪算法成功构建了使用增加大小的生物tt标记集合的贝叶斯分类器(如本实施例的7.2节更详细地描述)。将可用于在tt所述癌症类型中一般诊断癌症的生物标记的集合(或组)汇编为函数集合(或tt组)大小并分析它们的性能。这个分析导致表19所示的10个癌症生物标记tt的列表,其中每一个存在于这些连续标记集合的至少一个中,所述连续标tt记集合的大小为3-10个标记。作为说明性实例,我们描述如表32所示的tt由10个癌症生物标记组成的特定组的产生。tt

  7.1癌症的朴素贝叶斯分类tt

  如本实施例的7.2节所述,从表1中生物标记的列表,利用生物标记选tt择的贪婪算法选择10个潜在癌症生物标记的组。给这3个中的每一个构建tt不同的朴素贝叶斯分类器。将类别依赖性概率密度函数(pdf)、p(xi|c)和ttp(xi|d)建模为log-正态分布函数,其中xi为生物标记i的测量的RFU值的ttlog,c和d指对照和疾病群体,该函数的特征在于平均值μ和方差σ2。由tt10个潜在生物标记组成的3个模型的pdf的参数如表31所列。tt

  这样的模型的朴素贝叶斯分类在下述等式中给出,ttln(p(d|x~)p(c|x~))=Σi=1nln(σc,iσdi)-12Σi=1n[(xi-μd,iσd,i)2-(xi-μc,iσc,i)2]+ln(p(d)1-p(d)),其中P(d)为适合测试的群体中的疾病发病率,并且n=10。求和中的每一tt项是单个标记的log似然比,不患有所关注的疾病(即在这种情况下,来自tttttt3种不同癌症类型的每种特定疾病)比患有该疾病的样品的总log似然比是这些单独项加上表示疾病发病率的项的简单加和。为简便起见,我们假tt设p(d)=0.5,从而ln(p(d)1-p(d))=0.

  鉴于10.1、8.9、8.8、8.8、9.1、7.3、8.2、9.5、6.7、7.7的10个生物tt标记中每一个的以log(RFU)计的未知样品测量,分类的计算在表32中详tt述。将包含疾病比对照类别的log似然比的单个组分制成表格,并且可以tt从表31中的参数和的值计算。个体log似然比的总和为-4.568,或者没有tt疾病比患有疾病的个体的似然性为96,其中似然性e4.568=96。仅1个生物tt标记值具有与疾病组更一致的似然性(log似然性>0),但是据发现剩余的9tt个生物标记全部一致有利于对照组。将似然性相乘给出上述相同结果;未tt知样品不患有疾病的似然性为96。事实上,这个样品来自NSCLC训练集tt合中的对照群体。tt

  7.2选择用于分类器的癌症生物标记组的贪婪算法tt

  部分1tt

  选择表1中生物标记的子集以构建潜在的分类器,其可以用来确定哪tt些可以用作一般癌症生物标记以检测癌症。tt

  考虑到标记的集合,为3个癌症研究中的每一个训练不同的模型,所tt以需要性能的全面测量以选择能够同时分类许多不同类型的癌症的生物标tt记的集合。这里使用的分类器性能的测量是所有朴素贝叶斯分类器的ROCtt曲线下面积的平均值。ROC曲线单个分类器真阳性率(灵敏性)对假阳性率tt(1-特异性)的作图。ROC曲线下面积(AUC)范围为0-1.0,其中1.0的AUCtt对应于完美分类,而0.5的AUC对应于随机(抛硬币)分类器。可以应用性tt能的其他常规测量如F-测量或者灵敏性和特异性之和或之积。特别地,可tt能想要用不同加权处理灵敏性和特异性,以便选择具有较高特异性而损失tt一些灵敏性的那些分类器,或者选择具有较高灵敏性而损失特异性的那些tt分类器。我们选择使用AUC,因为它在单一测量中涵盖灵敏性和特异性的tt所有组合。不同应用对于真阳性和真阴性发现会有不同益处,并且会具有tt与假阳性发现和假阴性发现相关的不同成本。改变性能测量可能改变选择tt用于数据的给定集合的标记的确切子集。tt

  对于本实施例7.1节所述的区分癌症样品与对照样品的贝叶斯方法,通tt过生物标记在3个癌症研究中的每一个中的分布来将分类器完全参数化,tt并且生物标记列表选自表19。即,给定训练数据集合,选择包括的标记子tt集以一对一的方式确定分类器。tt

  此处采用的贪婪方法用于从表1检索最佳标记子集。对于小数目标记tt或具有较少标记的分类器,列举每个可能的标记子集并评价用该特定标记tt集合构建的分类器的性能(见实施例4,部分2)。(这种方法在统计学领域公tt知为“最佳子集选择”;参见例如Hastie等人)。但是,对于本文所述的分tt类器,多个标记的组合的数目可能非常大,并且评价10个标记的每个可能tt的集合是不可行的,因为可以从仅30个总分析物的列表产生30,045,015种tt可能的组合。因为通过每个标记子集检索不切实际,所以单个最佳子集可tt能不能发现;但是,通过使用这种方法,发现了许多优异的子集,并且在tt许多情况下,任何这些子集可以代表最佳的子集。tt

  代替评价每个可能的标记集合,可以进行“贪婪”正向逐步方法(参见tt例如Dabney AR,Storey JD(2007)Optimality Driven Nearest Centroid ttClassification from Genomic Data.PLoS ONE 2(10):e1002.ttdoi:10.1371/journal.pone.0001002)。使用这种方法,分类器以最佳的单个标tt记(基于各个标记的KS-距离)开始,并且在每步通过依次尝试标记列表中目tt前不是分类器中的标记集合的成员的每个成员而成长。将与现有分类器组tt合评分最佳的一个标记加入到分类器中。重复直至不再实现性能的进一步tt改善。不幸地,这种方法可能错过有价值的标记组合,一些单独的标记在tt方法终止前没有全部被选择。tt

  此处使用的贪婪方法是前述正向逐步方法的加工,为了扩大检索,而tt不是在每个步骤中保持仅单个标记子集,保持候选标记集合的列表。该列tt表用单个标记的列表播种。通过从目前在列表中的标记子集衍生新的标记tt子集并将它们加入列表中来逐步扩大列表。通过加入不是该分类器的部分tt的来自表1的任何标记(其加入到子集不会复制现有子集)(这些称为“允许tt标记”)延伸目前在列表上的每个标记子集。每次定义标记的新集合,利用tt这些标记训练由每个癌症研究各一个组成的分类器的集合,并且通过全部3tt个研究的平均AUC测量全面性能。为了避免潜在的过拟合,通过10倍交tttttt叉验证方法计算每个癌症研究模型的AUC。每个现有标记子集通过来自列tt表的每个允许标记延伸。很明显,这种方法最终会产生每个可能的子集,tt并且该列表会用完空间。因此,所有产生的标记集合仅在列表小于某些预tt定大小时保持。一旦列表达到预定大小限制,其变成精英;即,仅显示一tt定水平性能的那些分类器集合保持在列表上,其他分类器跌落到列表末尾tt并被丢弃。这通过保持按照分类器集合性能顺序分选的列表来实现;插入tt其分类器整体上至少与目前列表上最差分类器一样好的新标记集合,使得tt强制排除当前实现分类器集合下的末尾。一种进一步执行细节是列表在每tt个产生步骤被完全置换;因此,列表上的每个标记集合具有相同数目的标tt记,在每个步骤每个分类器的标记数目增加一个。tt

  在一实施方案中,可用于构建诊断一般癌症与非癌症的分类器的生物tt标记的集合(或组)是基于用于分类方案的生物标记的特定组合的平均ttAUC。我们鉴定了许多能够有效分类不同癌症样品与对照的衍生自表19的tt标记的生物标记组合。代表性组如表22-29所示,其示出一系列3-10个生tt物标记的100个不同的组,其具有所示的每组的验证(CV)AUC平均值。这tt些组的每个中每个标记出现的总数目在每个表的底部示出。tt

  表19所选的生物标记产生表现比用“非标记”构建的分类器更好的分tt类器。在图17中,我们示出与其他可能的分类器相比的我们的10生物标tt记分类器的性能。tt

  图17A示出分类器的平均AUC分布,所述分类器构建自10个“非标tt记”的随机采样集合,其采自存在于所有3个研究中的10的整个集合,排tt除表19中的10个标记。10个潜在的癌症生物标记的性能显示为垂直虚线。tt这个图清楚显示这10个潜在的生物标记的性能远远超过其他标记组合的分tt布。tt

  图17B显示与图17A相似的分布,然而,随机采样集合限于通过10tt分析物分类器的贪婪生物标记选择方法未选择的来自表1的55个生物标tt记。这个图证实通过贪婪算法选择的10个标记代表生物标记的子集,其推tt广至类型的癌症,远优于用剩余的55个生物标记构建的分类器。tt

  最后,图18示出3个癌症研究分类器中每一个的分类器ROC曲线。tt上述实施方案和实施例仅作为实例示出。没有特定实施方案、实施例或者tttttt特定实施方案或实施例的要素被认为是任何权利要求关键的、需要的或必tt需的要素或特征。另外,本文描述的要素不是实施所附权利要求所需的,tt除非明确描述为“必需”或“关键的”。可以对所公开的实施方案进行各种tt改变、修饰、取代和其他变化而不背离所附权利要求限定的本申请的范围。tt包括附图和实施例的说明书是示例性而非限制性的,所有这样的修饰和取tt代包括在本申请范围内。因此,本申请的范围应当由所附的权利要求及其tt法律等价物限定而非由上述实施例限定。例如,任何方法或过程权利要求tt中列举的步骤可以任何可行顺序执行而不限于任何实施方案、实施例或权tt利要求中的顺序。另外,在任何上述方法中,表1或表19的一个或多个生tt物标记可以作为单个生物标记或作为来自任何组的生物标记特别地排除。tt

  表1:癌症生物标记tt

  表1:续前页tt

  表2:一种生物标记的组tt

  表2:续前页tt

  表3:二种生物标记的组tt

  表3:续前页tt

  表3:续前页tt

  表4:三种生物标记的组tt

  表4:续前页tt

  表4:续前页tt

  表5:四种生物标记的组tt

  表5:续前页tt

  表5:续前页tt

  表6:五种生物标记的组tt

  表6:续前页tt

  表6:续前页tt

  表7:六种生物标记的组tt

  表7:续前页tt

  表7:续前页tt

  表7:续前页tt

  表7:续前页tt

  表8:七种生物标记的组tt

  表8:续前页tt

  表8:续前页tt

  表8:续前页tt

  表8:续前页tt

  表9:八种生物标记的组tt

  表9:续前页tt

  表9:续前页tt

  表9:续前页tt

  表9:续前页tt

  表10:九种生物标记的组tt

  表10:续前页tt

  表10:续前页tt

  表10:续前页tt

  表10:续前页tt

  表11:十种生物标记的组tt

  表11:续前页tt

  表11:续前页tt

  表11:续前页tt

  表11:续前页tt

  表12:生物标记组中的标记计数tt

  表12:续前页tt

  

  表13:10标记分类器中的分析物tt

  

  表14:源自朴素贝叶斯分类器训练组的参数tt

  

  表14:续前页tt

  

  表15:生物标记的示例性组合的AUCtt

  

  表16:源自朴素贝叶斯分类器训练组的计算tt

  表17:训练组的临床特征tt

  表18:10生物标记分类器蛋白质tt

  表19:一般癌症的生物标记tt

  

  表20:一种生物标记的组tt

  表21:二种生物标记的组tt

  表21:续前页tt

  表21:续前页tt

  表22:三种生物标记的组tt

  表22:续前页tt

  表22:续前页tt

  表23:四种生物标记的组tt

  表23:续前页tt

  表23:续前页tt

  表24:五种生物标记的组tt

  表24:续前页tt

  表24:续前页tt

  表25:六种生物标记的组tt

  表25:续前页tt

  表25:续前页tt

  表25:续前页tt

  表25:续前页tt

  表26:七种生物标记的组tt

  表26:续前页tt

  表26:续前页tt

  表26:续前页tt

  表26:续前页tt

  表27:八种生物标记的组tt

  表27:续前页tt

  表27:续前页tt

  表27:续前页tt

  表27:续前页tt

  表28:九种生物标记的组tt

  表28:续前页tt

  表28:续前页tt

  表28:续前页tt

  表28:续前页tt

  表29:十种生物标记的组tt

  表29:续前页tt

  表29:续前页tt

  表29:续前页tt

  表29:续前页tt

  表30:生物标记组中标记的计数tt

  表31:源自朴素贝叶斯分类器癌症数据组的参数tt

  表32:源自朴素贝叶斯分类器训练组的计算tt

《胰腺癌生物标记及其用途.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)