当前位置：首页 > 化学技术 > 组合技术> 肺癌多基因突变文库的构建方法独创技术45552字

肺癌多基因突变文库的构建方法

2021-02-25 14:36:37

肺癌多基因突变文库的构建方法

　　技术领域

　　本发明涉及一种用于高通量测序检测的肺癌多基因突变文库的构建方法。

　　背景技术

　　2015年中国预计有429.2万例新发肿瘤病例和281.4万例死亡病例。肺癌是发病率最高的肿瘤，也是癌症死因之首。胃癌、食管癌和肝癌是紧随其后的我国发病率和死亡率较高的常见肿瘤。

　　癌症治疗传统的方法有手术、化疗、放疗。随着医学技术的进步，靶向药物治疗中晚期肺癌越来越成为一条新路，其中的治疗也根据疾病类型各不相同。对不同驱动基因类型的癌症患者，在治疗上一定要区别对待。存在有靶点的患者，可优先采用靶向治疗。靶向治疗和化疗是完全不同的治疗措施，有很多的机制参与肿瘤的发病，而这些机制往往是肿瘤细胞所特有的，所谓的靶向治疗就是阻断肿瘤发病机制当中特有的信号传导通路，或者某一分子发病机制，从而达到扼杀肿瘤的目的。因此靶向治疗能显著减少患者的不良反应，提高患者的生活质量。

　　目前具有明确指导意义的靶点部分信息如下：

　　1.EGFR基因概述

　　1.1.EGFR基因结构与功能

　　EGFR基因位于染色体7p22-p12上。表皮细胞生长因子受体(EGFR)及其配体是影响不同细胞功能的细胞信号分子，包括细胞增殖、分化、迁移和生存，并影响组织生长。EGFR(表皮生长因子受体)分子有3个部分：第一个部分延伸在细胞外，包括结合表皮生长因子(EGF)的位点；第二部分嵌入细胞膜中；第三部分延伸至细胞内的细胞质中。EGFR是一种由相连的磷酸化酪氨酸残基组成的蛋白质激酶。

　　1.2.EGFR基因临床意义

　　EGFR是一种跨膜受体酪氨酸激酶，该区域的激活即磷酸化对癌细胞增值、生长的相关信号传递具有重要意义。因此，EGFR作为癌症治疗的分子靶标受体普遍关注，并陆续开发出了吉非替尼(gefitinib)、厄洛替尼(erlotinib)和埃克替尼(icotinib)等EGFR酪氨酸激酶抑制剂(EGFR-tyrosine kinase inhibitor,EGFR-TKI)和抗EGFR抗体等。

　　大量研究结果显示，EGFR基因突变状态是决定EGFR-TKI疗效最重要的预测因子。而EGFR基因突变的发生率在女性、非吸烟者、腺癌、亚裔人群中发生频率较高。EGFR基因突变的发生率虽然在腺癌中较高，但在未分化腺癌、腺鳞癌、小细胞癌(尤其是与腺癌的复合型)等患者中也经常可以检测到EGFR基因的突变。

　　在非小细胞肺癌患者中检测EGFR基因的突变状态具有重要的临床意义，是决定患者是否能够应用EGFR-TKI治疗的先决条件。

　　2.K-ras基因概述

　　K-ras基因结构与功能

　　K-ras基因长约38Kb，带有4个外显子，其中外显子4具有2种转录形式，分别为4A和4B。随后研究发现K-ras基因总共带有6个外显子，外显子2、3、4是保守不变的外显子编码区，外显子5在转录时有可能发生拼接而形成K-ras B蛋白。在K-ras A的转录mRNA中外显子6编码3端非编码区，而在K-ras的转录mRNA中外显子6编码碳端区域。

　　在细胞增殖分化信号从激活的跨膜受体传递到下游蛋白激酶的过程中K-ras起重要作用。ras蛋白为膜结合型的三磷酸鸟苷(GTP)P二磷酸鸟苷(GDP)结合蛋白，相对分子质量21×103，又称为p21蛋白，以两种形式存在于细胞膜内表面，活性形式p21-GTP，非活性形式为p21-GDP，当p21蛋白受一些影响细胞生长，发育，分化的因子诱导激活后，就将细胞膜表面的信号，如生长因子、激素、神经递质等转递到细胞内效应器上，同时自身受由缝隙控制的GTPase水解，从活性状态恢复到非活性状态。通过Ras信号转导通路，激活下游信号分子，持续刺激细胞生长、发育、增殖，引起细胞恶变。

　　2.2K-ras基因临床意义

　　K-ras基因是启动与维持恶性转化表型所必需的，但它不诱导转移表型。在临床实验中，只有当细胞处于增殖阶段时，K-ras才能导致细胞恶性转化。K-ras突变基因产生的癌蛋白与肿瘤细胞的转移和血管生成有关。对于肿瘤来说，肿瘤的生长主要依赖于肿瘤周围的血管不断补充营养，这个过程大部分是通过癌蛋白的活性来激发的，使肿瘤抑制基因失活，致癌基因能够在癌细胞中促进瘤血管的生成。K-ras的基因12位密码子野生型为甘氨酸，突变型常为半胱氨酸、缬氨酸、精氨酸三种，突变的结果导致编码的氨基酸发生改变，从而产生具有致癌活性的p21蛋白。K-ras基因发生异常时，鸟苷三磷酸酶(GTPase)活性降低，p21-GTP牢固结合而不被GTPase水解，一直处于激活状态，持续刺激细胞生长、发育、增殖，引起细胞恶变。因此，K-ras基因在12、13密码子的基因突变产生具有致癌活性的p21蛋白，通过Ras信号转导通路，激活下游信号分子，持续刺激细胞生长、发育、增殖，引起细胞恶变。

　　K-ras是最容易被激活的原癌基因之一，在所有人类肿瘤中K-ras突变率能达到17％至25％。K-ras基因易激活的主要区域包括密码子12、13、25、61和63。这些突变激活能导致RAS蛋白聚集，影响GTP结合状态，从而抑制GTP酶活性和阻抑GTP酶激活蛋白。

　　西妥昔单抗和帕尼单抗是作用于EGFR的单克隆抗体靶向药物，可以抑制下游的信号通路传导。RAS/RAF/MAPK通路位于EGFR信号传导通路的下游。大约40％的结直肠癌伴有编码KRAS基因的区域第2外显子的12、13和61密码子突变。研究表明KRAS基因突变接受西妥昔单抗与帕尼单抗的治疗无效，因此美国FDA对西妥昔单抗和帕尼单抗的产品说明书里特别指明，这类药品不推荐用于KRAS突变型的结直肠癌。

　　3.B-raf基因概述

　　3.1B-raf基因结构与功能

　　B-raf基因全名为鼠类肉瘤滤过性毒菌(V-raf)致癌同源体B1，定位于人染色体7q34，其具有功能的编码区由2150对碱基组成，编码MAPK通路中的丝氨酸苏氨酸蛋白激酶，该酶将信号从Ras转导至MEK1/2，从而参与调控细胞内多种生物学事件。B-raf基因突变能激活ERK信号，诱导细胞增殖，防止细胞凋亡。约70％的恶性黑色素瘤和15％的结肠癌中存在体细胞B-raf基因错义突变。

　　3.2B-raf基因临床意义

　　B-raf基因作为raf-MEK-ERK信号转导通路中的重要成员，在肿瘤细胞增殖、分化和凋亡等方面发挥重要作用。正常的B-raf蛋白的功能是传递来自细胞膜的信号。B-raf蛋白通常只在需要传递信号时保持活性状态。然而，突变的B-raf则一直保持活性状态，并因此干扰了细胞信号传递链的正常功能，引起细胞的异常。使用小分子抑制剂MAPK/ERK激酶和合成基因及药理学分析发现B-raf突变能增强MEK途径，无论其是否有野生型细胞还是RAS突变细胞。MEK依赖于组织是否携带有B-raf突变，与组织相关性无关，与细胞周期蛋白D1蛋白表达和G1期阻滞诱导下调无关。用药物抑制MEK作用能完全消除带有B-raf突变的肿瘤的生长。

　　BRAF基因突变最先在黑色素瘤患者中检测到，在黑色素瘤、甲状腺瘤中突变率较多(约80％)，而在淋巴瘤、直肠癌、肝癌、乳腺癌、卵巢癌及肺癌中突变率较少。其中非小细胞肺癌(NSCLC)中BRAF突变率约为3％，大部分是腺癌。

　　4.N-ras基因概述

　　4.1N-ras基因结构与功能

　　N-ras基因由四个外显子组成，分布于全长约30kb的DNA上。它们的编码产物为相对分子质量2.1万的蛋白质，故称为P21蛋白。N-ras位于1号染色体短臂上(1p22～p32)。

　　作为原癌基因的N-ras基因被激活以后就变成有致癌活性的癌基因。N-ras基因激活的方式有3种：基因点突变，基因大量表达，基因插入及转位。其中N-ras基因被激活最常见的方式就是点突变，多发生在N端第12,13和61密码子，其中又以第12密码子突变最常见。不同突变位点对P21的活化机制不同，第12密码子突变可以减弱P21内在的GTP酶活性，并使细胞凋亡减少，细胞间接触抑制减弱；第61密码子突变可削弱GAP对P21的内在GTP酶活性，并可减弱GAP与P21结合的稳定性。

　　4.2N-ras基因临床意义

　　N-ras基因激活构成癌基因，其表达产物Ras蛋白发生构型改变，功能也随之改变，与GDP的结合能力减弱，和GTP结合后不需外界生长信号的刺激便自身活化.此时Ras蛋白内在的GTP酶活性降低，或影响了GTP的活性，使Ras蛋白和GTP解离减少，失去了GTP与GDP的有节制的调节，活化状态的Ras蛋白持续地激活PLC产生第二信使，造成细胞不可控制地增殖，恶变。同时细胞凋亡减少，细胞间接触抑制增强也加速了这一过程。

　　西妥昔单抗和帕尼单抗是作用于EGFR的单克隆抗体靶向药物，可以抑制下游的信号通路传导。RAS/RAF/MAPK通路位于EGFR信号传导通路的下游。大约20％的结直肠癌伴有编码N-ras基因的区域第2外显子的12、13和61密码子突变。研究表明N-ras基因突变接受西妥昔单抗与帕尼单抗的治疗无效。

　　5.PIK3CA基因概述

　　5.1PIK3CA基因结构与功能

　　PIK3CA基因位于3q26.3，长34kb，包含21个外显子，编码1068种氨基酸，该组氨基酸产生一组长124kD的蛋白。PIK3CA编码I类磷脂酰肌醇-3-激酶(phosphatidylino-sitol3-kinases,PI3Ks)的p110催化亚单位，即PI3Kp110a。

　　PIK3CA的突变约4/5发生在螺旋区(exon9)和激酶区(exon20)这两个热点区域。其突变不仅可以减少细胞的凋亡还可以促进肿瘤的浸润、提高其下游激酶PI3Ks的活性。关于PIK3CA突变这两个热点区的研究发现，激酶区和螺旋区的突变可能通过不同的机制引起酶功能性的改变。不同区域的突变，分别通过与PI3Ks的调节亚单位p85和RAS-GTP相互作用的不同机制导致PI3Ks的活化。

　　5.2PIK3CA基因临床意义

　　癌基因PIK3CA是在关于PI3Ks家族与肿瘤的发生关系及其机制的研究中发现的。PI3Ks活性改变与PIK3CA癌基因的突变有关，PIK3CA的突变可以通过增强PI3Ks的活性参与人类原发性肿瘤的发生。约30％的人类实体肿瘤中存在癌基因PIK3CA的突变，其突变的比例在结直肠癌、成胶质细胞瘤、胃癌、乳腺癌和肺癌中分别约为32％、27％、25％、8％和4％。

　　6.HER2基因概述

　　6.1HER2基因结构与功能

　　HER2基因，即c-erbB-2基因，定位于染色体17q12-21.32上，编码相对分子质量为185000的跨膜受体样蛋白，具有酪氨酸激酶活性。

　　HER2/ErbB2是表皮生长因子受体(epidermalgrowth factor receptor，EGFR)家族的一员，其他3个成员分别为HER1/ErbB1、HER3/ErbB3、HER4/ErbB4，其中HER2无可溶性的配体，因此又称“孤儿受体”(orphans receptor)。然而其他3个受体成员在形成异二聚体时都优先选择HER2共同形成异二聚体。EGFR家族是磷酸激酶受体，当EGF结合到细胞表面EGFR时，使受体发生磷酸化，并与Grb2结合，激活SOS(促GTP释放酶)，进而激活RAS通路，活化的ERK进入核内启动相关基因表达。

　　HER2无可溶性的配体，但可与MUC4相互作用。MUC4在气管、胰腺等组织的肿瘤细胞膜上高表达，MUC4的EGF-like domain可与HER2结合，并活化HER2。但在仅有MUC4和HER2时，它们作用可促进CDK抑制剂P27KIP1表达，使细胞周期处于停滞状态。如果同时还存在神经调节素Neuregulin，则可同时激活HER3，进而激活RAS-ERK途径和PI3K-AKT途径，促进细胞增殖、迁移。

　　6.2HER2基因临床意义

　　HER2基因突变，在框内插入大量的20号外显子，在1％～4％的非小细胞肺癌中，专门针对腺癌组织学类型，已经被认为是一种致癌驱动改变。I期和II期的试验数据表明：阿法替尼、来那替尼和dacomitinib对这些分子亚型组有一些活性。

　　7.c-MET基因概述

　　7.1c-MET基因结构与功能

　　原癌基因c-MET位于人类第7号染色体7q31上，编码MET酪氨酸激酶。正常的生理条件下，MET酪氨酸激酶受体及其配体HGF(肝细胞生长因子)显著影响并控制组织内环境稳定。研究显示，MET酪氨酸激酶在肺癌、结直肠癌、乳腺癌等组织中存在扩增和过表达等现象。7.2c-MET基因临床意义

　　c-MET基因扩增是TKIs获得性耐药的次要因素。研究显示MET基因扩增能激活ErbB3/PI3K/AKT信号途径，引发对EGFR激酶抑制剂的耐药性。由于c-MET基因扩增和NSCLC预后不良以及对表皮生长因子受体(EGFR)抑制剂(如厄洛替尼和吉非替尼)耐药相关，c-MET受体酪氨酸激酶成为了NSCLC治疗中受关注的抗癌靶点。

　　8.AKT1基因概述

　　AKT1基因结构与功能AKT1基因编码丝苏蛋白激酶，在PI3K相关的信号通路中起重要的作用，影响细胞的生存、增值和侵袭等。3个高度同源的蛋白AKT1、AKT2和AKT3均是由三个功能域构成：一个氨基酸pleckstrin同源性(PH)区域，一个中央的催化区域和一个羧基端具有疏水结构的调节区域。

　　PI3-激酶/AKT途径是人类肿瘤中最为活跃的细胞途径之一，导致癌细胞的生存和增长，途径中的许多成分是新药研发的候选靶标。AKT1是该途径的活性中心，在癌症中是联系上游突变调控蛋白和下游存活信号途径蛋白的中间环节。

　　8.2AKT1基因临床意义

　　AKT活性失调是与肿瘤发生密切相关的遗传缺陷，在激活状态下，AKT通过对大量底物的激酶活性执行抗凋亡及细胞增殖功能。

　　乳腺癌、结肠癌和卵巢癌中发现一种AKT1基因复发突变(recurring mutation)，这种突变AKT1基因诱导肿瘤细胞增殖，并帮助癌细胞抵抗某些治疗剂。

　　9.C-KIT基因概述

　　9.1c-KIT基因结构与功能

　　c-KIT基因位于人染色体4q12-13，属于原癌基因，其产物是Ⅲ型酪氨酸激酶。c-KIT原癌基因表达产物c-KIT受体与其配体细胞因子结合后，可激发酪氨酸残基磷酸化，从而调节细胞的生长，对肿瘤的增殖、恶性演进及凋亡等方面都有重要作用。

　　9.2c-KIT基因临床意义

　　格列卫(Glivec)是一种酪氨酸激酶抑制剂，经FDA批准可用于治疗c-KIT阳性、不能手术切除和/或转移性的恶性GIST，其临床疗效令人振奋。其作用机理在于药物结合于KIT蛋白胞浆内酪氨酸激酶功能区的ATP结合位点，阻断磷酸基团由ATP向底物酪氨酸残基的转移，从而抑制细胞增殖并恢复细胞凋亡程序。

　　临床研究表明GIST中c-KIT基因的突变情况与格列卫分子靶向治疗的疗效相关：存在11号外显子突变患者的疗效最好，存在9号外显子突变的患者疗效次之，而野生型GIST的疗效最差。另外，对于9号外显子突变的患者，提高用药剂量可显著提高疗效。格列卫耐药相关突变主要发生在17号外显子D816V突变。检测c-KIT基因突变对于指导GIST患者的合理用药，具有重要的参考价值。

　　10.PDGFRA基因概述

　　10.1PDGFRA基因结构与功能

　　PDGFRA基因编码一种单链跨膜糖蛋白，能将有丝分裂等信号传递入细胞核，引起细胞分裂和增殖，该基因突变可导致恶性肿瘤的产生。

　　10.2PDGFRA基因临床意义

　　PDGFRA基因D842V突变是导致GIST患者格列卫原发耐药的原因，PDGFRA突变与c-KIT基因突变是相互独立的。因此，检测肿瘤患者PDGFRA基因突变情况可用于判断格列卫治疗能否有效。

　　PDGFRA在胃肠道间质瘤(GIST)中表达概率较高，因此常作为GIST诊断中的参考指标。

　　11.ALK-EML4基因概述

　　11.1ALK-EML4基因结构与功能

　　ALK-EML4融合基因(间变性淋巴瘤激酶-棘皮动物微管相关蛋白样4)2007年由Soda等在非小细胞肺癌中发现1。ALK-EML4融合基因的重排发生在2号染色体短臂上的2区1带和2区3带，其ALK部分均包括开始于第20外显子的编码细胞内酪氨酸激酶结构域的基因片段，EML4部分则包括长短不一的编码蛋白N端部分的基因片段，共有9种具有生物性功能的融合基因，其表达产物为一种嵌合酪氨酸激酶，可持续促进细胞增殖，导致肿瘤的产生和转移。

　　11.2ALK-EML4基因临床意义

　　ALK-EML4融合的突变基因，在全球的非小细胞肺癌中约占5％(超过7万人/年)，其中东亚患者约占3～13％。ALK-EML4在基因水平下融合，此融合与ALK抑制剂药物的反应性有关，原因可能是因为这种突变改变了ALK基因的ATP结合区的结构，提高了ALK对ALK抑制剂(克唑替尼)的结合能力。据2010年临床研究报道ALK抑制剂能使ALK-EML4的非小细胞肺癌患者中57％肿瘤体积缩小，87％停止疾病发展。

　　克唑替尼(Crizotinib)是第一个针对ALK基因融合的ALK抑制剂靶向药物，2011年由美国FDA批准用于治疗ALK阳性的非小细胞肺癌患者。

　　12.ROS1基因概述

　　12.1ROS1基因结构与功能

　　ROS1(c-ros oncogene 1receptor tyrosine kinase,c-ros,原癌基因1酪氨酸激酶)，在肿瘤患者中，染色体的重排式ROS1活化的首要机制，而原癌基因形式的ROS1被看做是激活与恶性肿瘤形成相关的下游信号通路物质，ROS1基因可能参与了肺癌发生的过程。

　　12.2ROS1基因临床意义

　　Crizotinib治疗ROS1阳性NSCLC患者的初步疗效，研究结果提示：与ALK-EML4阳性相似，ROS1重排是Crizotinib治疗的又一个潜在靶点。携带ROS1融合基因患者对ALK抑制剂crizotinib高度敏感，缓解率高达到57.1％。

　　肺癌患者ROS1基因重排阳性率约0.8-1.7％。ROS1基因重排的局部晚期或转移性非小细胞肺癌能够从克唑替尼治疗中获益，检测ROS1重排是筛选克唑替尼合适患者的重要前提。

　　13.RET基因概述

　　RET基因结构与功能RET原癌基因1985年Takahashi等首先在转化小鼠的NIH3T3细胞中发现了RET原癌基因。它位于10ql1.2，含有21个外显子，全长60kb，与其他染色体易位或10号染色体发生倒置可使RET活化。RET原癌基因编码一种跨膜的酪氨酸激酶受体RET蛋白，调节细胞的生长、分化。

　　13.2RET基因临床意义

　　RET基因的致癌作用RET基因的致瘤作用最初发现于甲状腺乳头状癌，不同形式的染色体异位和插入导致PTC/RET融合基因的形成，被认为是乳头状甲状腺癌的驱动突变。除基因重排外，RET基因突变与甲状腺髓样癌(MTC)相关。一项Ⅱ期临床试验结果表明，多靶点激酶抑制剂凡德他尼(Vandetanib)治疗局部晚期或转移性家族遗传性MTC，疾病控制率为73％，且不良反应可控；另一项关于MTC的Ⅲ期临床试验(ZETA)结果显示，截止至2009年7月31日，凡德他尼组较安慰剂组无进展生存期(PFS)明显延长，疾病进展风险降低54％。因此，凡德他尼被美国食品药品管理局(FDA)批准用于不宜手术切除或转移性MTC的治疗。此外文献报道在胰腺癌、黑色素瘤中发现RET激活。

　　KIF5B—RET融合基因KIF5B和RET分别位于lOpl1.22和10ql1.21，相距10.6Mb，通过臂间倒位后相融合，形成KIF5B-RET融合基因。KIF5B和RET双螺旋DNA的融合断点并非完全一致，目前已发现KIF5B-RET至少存在7种变体。KIF5B-RET融合蛋白由卷曲螺旋域和蛋白激酶域组成，卷曲螺旋域诱导融合激酶二聚体化，从而使蛋白酪氨酸激酶域自身磷酸化而激活。

　　RET抑制剂的抗肿瘤作用凡德他尼是VEGFR-2、EGFR和RET信号通路的抑制剂。在表达KIF5B—RET而无野生型或其他RET融合基因的人肺癌细胞中，RET激酶活化环上的Tyr905在无血清刺激的情况下磷酸化，提示与KIF5B的融合使RET激酶异常活化。这种磷酸化作用可被凡德他尼所抑制。由KIF5B-RET诱导的NIH3T3纤维母细胞的生长可被凡德他尼所抑制，而由K-Ras突变导致的细胞生长则不能被其所抑制。此外，还在该融合基因阳性的肺腺癌标本中检测到KIFSB-RET蛋白在Tyrg05的磷酸化。

　　肿瘤的发生发展是一个多因素作用、多基因参与、多信号通路激活的极其复杂的生物学过程。近年的肿瘤基因研究发现，每个肿瘤均可通过靶标检测明确其驱动变异基因，从而针对性实施治疗。靶向药物作用于与癌症发生、肿瘤生长所必需的特定分子靶点，阻断肿瘤细胞内控制细胞生长增殖的信号传导通路杀灭癌细胞，阻止其进展，具有针对性强，毒副作用低等特点。多项临床研究表明，单一检测某项靶标对患者接受治疗的指导意义存在明显局限，通过多通路多靶标并行检测获得每位患者肿瘤的全面基因信息，才能为患者制定出针对这些驱动基因的最佳药物组合。本试剂盒基于肿瘤组织样本，通过高通量测序的方法，检测肿瘤靶向药物相关的多基因突变进行快速的变异检测。

　　现有的肿瘤基因检测主要采用荧光定量PCR法，检测通量低，对于多基因多靶点检测时，费用高及样本量需求大，导致临床收费高及样本量不足。而目前行业公认的基因突变检测金标准是Sanger测序法，这类技术操作复杂，通量较低，灵敏度低，具有一定的漏检风险，难以满足大量肿瘤患者的检测需求。因此，发展一种准确率高、通量大、安全的肿瘤多基因检测方法，是对现有肿瘤个体化诊疗的有效补充和完善。

　　高通量测序(High-Throughput Sequencing)又名下一代测序(Next GenerationSequencing，NGS)，能够实现一次并行对几十万到几百万条目标核酸分子进行序列测定，具有高输出量与高解析度的特性，不仅提供了丰富的序列变异信息，而且使得测序的费用和时间大大缩短，迅速获得认可。在癌症多通路多靶标研究中发挥显著作用，凸显出这一全新技术手段的临床重要性。多项创新型临床研究(如Lung-MAP1、CRUK、WIN Consortium和NCI-MATCH等)表明基于NGS平台的多通路多靶标检测可成为多种治疗方案的伴随诊断方法。

　　发明内容

　　针对现有技术中存在的上述不足，本发明提供了一种用于高通量测序检测的肺癌多基因突变文库的构建方法。

　　为了解决上述技术问题，本发明采用了如下技术方案：

　　一种含有各特异修饰性引物、不对称探针、缓冲液、DNA聚合酶和dNTP的肺癌多基因突变文库制备的试剂盒，该试剂盒用于通过使利用多个特异修饰性引物在特定的多重PCR反应体系，对目标核酸序列扩增捕获。肺癌多基因突变文库的构建方法，覆盖人类基因EGFR、K-ras、B-raf、N-ras、PIK3CA、c-MET、TP53、c-Kit、PDGFRA、ALK、ROS1、RET、ERBB2、NTRK1和NTRK3上的总共1435种体细胞突变，具体包括如下步骤：

　　(1)针对目的基因EGFR、K-ras、B-raf、N-ras、PIK3CA、c-MET、TP53、c-Kit、PDGFRA、ALK、ROS1、RET、ERBB2、NTRK1和NTRK3设计第一和第二基本扩增引物组，该第一和第二基本扩增引物组的正向引物和反向引物的5’端设有额外的2～5个T，且该2～5个T的靠近3’端的第一个T具有PNA修饰，同时该第一和第二基本扩增引物组的Tm值相差不超过1℃；

　　(2)将模板、上述第一基本扩增引物组置于一含有HS-Taq酶的第一PCR反应体系中进行扩增，纯化后得第一扩增产物；将第一扩增产物、多对第一不对称连接探针、通用引物和上述HS-Taq酶混合进行PCR，纯化后获得第一文库产物；

　　(3)将模板、上述第二基本扩增引物组置于一含有HS-Taq酶的第二PCR反应体系中进行扩增，纯化后得第二扩增引物；将第二扩增产物、多对第二不对称连接探针、通用引物和上述HS-Taq酶混合进行PCR，纯化后获得第二文库产物；

　　(4)将第一文库产物和第二文库产物组成所述用于高通量测序的肿瘤基因变异文库；

　　上述HS-Taq酶由Taq酶、DNA连接酶和DNA末端修饰酶组成。

　　作为本发明的一种优选方案，所述第一基本扩增引物组包括E-18-F、E-18-R、E-19-F、E-19-R、E-20-F、E-20-R、、E-21-F、E-21-R、K-1-F、K-1-R、K-2-F、K-2-R、K-3-F、K-3-R、B-1-F、B-1-R、PI-1-F、PI-1-R、PI-2-F、PI-2-R、N-1-F、N-1-R、N-2-F、N-2-R、ERBB2-1-F、ERBB2-1-R、ERBB2-2-F、ERBB2-2-R、ERBB2-3-F、ERBB2-3-R、ERBB2-4-F、ERBB2-4-R、cK-1-F、cK-1-R、cK-2-F、cK-2-R、cK-3-F、cK-3-R、PD-1-F、PD-1-R、cM-1-F、cM-1-R、cM-2-F、cM-2-R、cM-3-F、cM-3-R、cM-4-F、cM-4-R、cM-5-F、cM-5-R、TP-1-F、TP-1-R、TP-2-F、TP-2-R、TP-3-F、TP-3-R、TP-4-F、TP-4-R、TP-5-F、TP-5-R；

　　所述第二基本扩增引物组包括EA-1-F、EA-1-R、EA-2-F、EA-2-R、EA-3-F、EA-4-F、EA-5-F、EA-5-R、EA-6-F、EA-7-F、EA-7-R、EA-8-F、EA-9-F、EA-10-F、RS-1-F、RS-1-R、RS-2-R、RS-3-F、RS-4-F、RS-4-R、RS-5-R、RS-6-F、RS-7-F、RS-8-F、RS-9-F、RS-10-F、RS-11-F、RS-12-F、RS-12-R、RS-13-F、RS-13-R、RS-14-F、RS-14-R、RS-15-F、RS-15-R、RT-1-F、RT-1-R、RT-2-F、RT-2-R、RT-4-F、RT-4-R、RT-5-F、RT-5-R、RT-6-F、RT-6-R、RT-7-F、RT-7-R、RT-8-F、RT-8-R、RT-9-F、RT-9-R、RT-10-F、RT-11-F、RT-11-R、RT-12-F、RT-13-F、RT-14-F、RT-15-F、RT-16-F、RT-17-F、RT-17-R、RT-18-F、RT-18-R、RT-19-F、RT-19-R、RT-20-F、RT-20-R、RT-21-F、RT-21-R、NT1-1-F、NT1-1-R、NT1-2-F、NT1-2-R、NT1-3-F、NT1-3-R、NT1-4-F、NT1-4-R、NT1-5-F、NT1-5-R、NT1-6-F、NT1-6-R、NT1-7-F、NT1-7-R、NT1-8-F、NT1-8-R、NT1-9-F、NT1-9-R、NT1-10-F、NT1-11-F、NT1-12-F、NT1-12-F、NT1-13-F、NT1-14-F、NT1-15-F、NT1-16-F、NT1-17-F、NT1-18-F、NT2-1-F、NT2-1-R、NT2-2-F、NT2-2-R、NT2-3-F、NT2-3-R、NT2-4-F、NT2-4-R、NT2-5-F、NT2-5-R、NT2-6-F、NT2-6-R、NT3-1-F、NT3-1-R、NT3-2-F、NT3-2-R、NT3-3-F、NT3-3-R、NT3-4-F、NT3-4-R、NT3-5-F、NT3-5-R、NT3-6-F和NT3-6-R。

　　作为本发明的另一种优选方案，引物序列如下：E-18-F，序列为

　　TTTTGCCTCTTACACCCAGTGGAGA；E-18-R，序列为

　　TTTTTGTGCCAGGGACCTTACCTTA；E-19-F，序列为

　　TTTTCCTTCTCTCTCTGTCATAGGGAC；E-19-R，序列为

　　TTTTCACAGCAAAGCAGAAACTCACAT；E-20-F，序列为

　　TTTTCTCCAGGAAGCCTACGTGAT；E-20-R，序列为TTTTTGTGTTCCCGGACATAGTCC；

　　E-21-F，序列为TTTTCAGGAACGTACTGGTGAAAAC；E-21-R，序列为

　　TTTTGAAAATGCTGGCTGACCTAAAG；K-1-F，序列为

　　TTTTCATGTACTGGTCCCTCATTGC；K-1-R，序列为

　　TTTTGTAATAATCCAGACTGTGTTTCTCCCT；K-2-F，序列为

　　TTTTGTTATGATTTTGCAGAAAACAGATCTG；K-2-R，序列为

　　TTTTGCCTTCTAGAACAGTAGACACAAAA；K-3-F，序列为

　　TTTTTACCTCTATTGTTGGATCATATTC；K-3-R，序列为

　　TTTTTATTATAAGGCCTGCTGAAAATGACTGA；B-1-F，序列为

　　TTTTTCAGTGGAAAAATAGCCTCAATTCTTACC；B-1-R，序列为

　　TTTTCTTCATGAAGACCTCACAGTAAAAATAGGT；PI-1-F，序列为

　　TTTTTACAGAGTAACAGACTAGCTAGAGACAATG；PI-1-R，序列为

　　TTTTTAGCACTTACCTGTGACTCCATAGAA；PI-2-F，序列为

　　TTTTCAATCTTTTGATGACATTGCATACATTCGA；PI-2-R，序列为

　　TTTTGGAAGATCCAATCCATTTTTGTTGTCC；N-1-F，序列为

　　TTTTGTGGGATCATATTCATCTACAAAGTGGT；N-1-R，序列为

　　TTTTGATTACTGGTTTCCAACAGGTTCTTG；N-2-F，序列为

　　TTTTGCAAATGACTTGCTATTATTGATGGCA；N-2-R，序列为

　　TTTTGTTATAGATGGTGAAACCTGTTTGTTGG；ERBB2-1-F，序列为

　　TTTTCTCCCATACCCTCTCAGCGT；ERBB2-1-R，序列为

　　TTTTAGCCATAGGGCATAAGCTGT；ERBB2-2-F，序列为

　　TTTTCAGAAGGTCTACATGGGTGC；ERBB2-2-R，序列为

　　TTTTGCCAGCCCGAAGTCTGTAA；ERBB2-3-F，序列为TTTTGGGCATCTGGATCCCTGA；

　　ERBB2-3-R，序列为TTTTTTCCTGTCCTCCTAGCAGG；ERBB2-4-F，序列为

　　TTTTGATGCACAATAAAACAGTTAGCCAG；ERBB2-4-R，序列为

　　TTTTGTTTGAGAATGTCAGTTAAGTTAATGA；cK-1-F，序列为

　　TTTTCCTTACTCATGGTCGGATCACAA；cK-1-R，序列为

　　TTTTGTTGAAACTAAAAATCCTTTGCAGGACT；cK-2-F，序列为

　　TTTTGGCACGGTTGAATGTAAGGCTTA；cK-2-R，序列为

　　TTTTACTGATATGGTAGACAGAGCCTAAACAT；cK-3-F，序列为

　　TTTTCCCACAGAAACCCATGTATGAAGT；cK-3-R，序列为

　　TTTTACTGACCAAAACTCAGCCTGTT；PD-1-F，序列为

　　TTTTTCTTCCTTTTCCATGCAGTGTGT；PD-1-R，序列为

　　TTTTCTGCCTTTCGACACATAGTTCGA；cM-1-F，序列为

　　TTTTCCCACAATCATACTGCTGACATACA；cM-1-R，序列为

　　TTTTGATGAACCGGTCCTTTACAGATGAAA；cM-2-F，序列为

　　TTTTTCTTTTGCACAGGGCATTTTGG；cM-2-R，序列为

　　TTTTGCAAACCACAAAAGTATACTCCATGGTTA；cM-3-F，序列为

　　TTTTCAGTCAAGGTTGCTGATTTTGGT；cM-3-R，序列为

　　TTTTCTTGGTGGTAAACTTTTGAGTTTGCA；cM-4-F，序列为

　　TTTTTCTGTTTTAAGATCTGGGCAGTGAAT；cM-4-R，序列为

　　TTTTTAGCTCGGTAGTCTACAGATTCATTTGA；cM-5-F，序列为

　　TTTTTTCGCACAAAGCAAGCCAGATT；cM-5-R，序列为

　　TTTTGGTCCGTAAAAATGCTGGAGACA；TP-1-F，序列为

　　TTTTTCCACTCACAGTTTCCATAGGTC；TP-1-R，序列为

　　TTTTTGTTGGAAGTGTCTCATGCTGG；TP-2-F，序列为

　　TTTTTGGCTGTCCCAGAATGCAAG；TP-2-R，序列为TTTTGATGAAGCTCCCAGAATGC；

　　TP-3-F，序列为TTTTTGCACAGGGCAGGTCT；TP-3-R，序列为

　　TTTTCCGTCTTCCAGTTGCTTTATCT；TP-4-F，序列为TTTTACCAGCCCTGTCGTCT；

　　TP-4-R，序列为TTTTGTGCAGCTGTGGGTTGATT；TP-5-F，序列为

　　TTTTCCAGTTGCAAACCAGACC；TP-5-R，序列为TTTTAGGCCTCTGATTCCTCACTG；

　　EA-1-F，序列为TTTTGGAATGGAGATGTTCTTACTGGAGACT；EA-1-R，序列为

　　TTTTCTCAGGGCTCTGCAGCTCC；EA-2-F，序列为

　　TTTTGGATGTTATTAACTGGAGGAGGGAAA；EA-2-R，序列为

　　TTTTAGGAGGTCTTGCCAGCAAAG；EA-3-F，序列为

　　TTTTAGGCAGATCAATTTTTAGTAGGCACAT；EA-4-F，序列为

　　TTTTTGGATGCAGAAACCAGAGATCTAGT；EA-5-F，序列为

　　TTTTCTGTGATAATACTCCAGTTACCTTTTCTTGT；EA-5-R，序列为

　　TTTTGAGCTCTGAACCTTTCCATCATACTTAG；EA-6-F，序列为

　　TTTTCATTCCAGCTACATCACACACCTT；EA-7-F，序列为

　　TTTTGCGGCTTTGGCTGATGTTTT；EA-7-R，序列为TTTTCCTGGCCCTTGAAGCACTA；

　　EA-8-F，序列为TTTTTGTATCTACCTTTTAAGGCTCCCAACT；EA-9-F，序列为

　　TTTTTGTCTCAACCAGCAAAAATGTCAAC；EA-10-F，序列为

　　TTTTGCAGGTAGGGTCTTTAAGTGAACT；RS-1-F，序列为

　　TTTTCACCATTGGCTCCTGTTTGAAAT；RS-1-R，序列为

　　TTTTTCAGCTTTCTCCCACTGTATTGAATTTT；RS-2-R，序列为

　　TTTTTCAGTGGGATTGTAACAACCAGAAAT；RS-3-F，序列为

　　TTTTGCTGCAGGACTATGAGGAGAAGA；RS-4-F，序列为

　　TTTTCCCTTCGTAGACATATAGCTGTTCTC；RS-4-R，序列为

　　TTTTGGAAGGCAGGAAGATTTTCAATCTC；RS-5-R，序列为

　　TTTTTCAGCCAACTCTTTGTCTTCGTTTATA；RS-6-F，序列为

　　TTTTCGGGCAGGAATCTGATGACTTT；RS-7-F，序列为

　　TTTTGGTGTCAATGTCCAGCACTGT；RS-8-F，序列为

　　TTTTGGCTCCTGAGACCTTTGATAACATAAC；RS-9-F，序列为

　　TTTTCGTGTGCTCCCTGGATATTCTTAGTA；RS-10-F，序列为

　　TTTTCAGAGACCCGTGCTGAGTTT；RS-11-F，序列为

　　TTTTTGGTGCTAGTTGCAAAGACACAA；RS-12-F，序列为

　　TTTTATGTATCTATTGGTTATTGTTTCACACGTCT；RS-12-R，序列为

　　TTTTCCAATCAGTACTTGACCATTCCCTTT；RS-13-F，序列为

　　TTTTATCACCTAAATAGGTGATATAGTCAACAC；RS-13-R，序列为

　　TTTTTCTGCCCTAGTTGTAGAATCATGAGTAA；RS-14-F，序列为

　　TTTTACTTTGATGCTAGTTGTTCTAAGACTTTGT；RS-14-R，序列为

　　TTTTCCAGTCTTTCTTGCCCTTCAAAA；RS-15-F，序列为

　　TTTTGGGAAAATGCTGCTATGTTAAAAATGCT；RS-15-R，序列为

　　TTTTGGAGACCTACAAACTGAAGTGCAA；RT-1-F，序列为

　　TTTTCCAAATTCGCCTTCTCCTAGAGT；RT-1-R，序列为

　　TTTTGAGCAGCTGAGATGATGGCA；RT-2-F，序列为TTTTGAGCAGCTGAGATGATG；

　　RT-2-R，序列为TTTTACAGCGGCTGCGATCA；RT-4-F，序列为

　　TTTTCCACGCCTGGATAATTTTGTTT；RT-4-R，序列为

　　TTTTTGGTTCCTGGTCTACTGTCC；RT-5-F，序列为

　　TTTTAGATTAGTTCACGGACCAGACA；RT-5-R，序列为TTTTCCAGGTCTCCTGCTCCTG；

　　RT-6-F，序列为TTTTCCCGGCCTGTTGTTGTTCTTAA；RT-6-R，序列为

　　TTTTGCAGAACACAGGCCTCGTC；RT-7-F，序列为TTTTTCCTGGCTTGGCAACTGAAT；

　　RT-7-R，序列为TTTTCATAGCCACCCCTGCAAAGAA；RT-8-F，序列为

　　TTTTAGTGGCAAAAGAACTTCAGA；RT-8-R，序列为TTTTCCAAATTCGCCTTCTCCTAG；

　　RT-9-F，序列为TTTTGCGCTGCTCAGAAGCA；RT-9-R，序列为

　　TTTTCCAAATTCGCCTTCTCCTA；RT-10-F，序列为

　　TTTTTCAGAGTCCTCAGGAATTTTTAT；RT-11-F，序列为TTTTATCGCAAACGCTATCAG；

　　RT-11-R，序列为TTTTACAGCGGCTGCGATCACC；RT-12-F，序列为

　　TTTTGGCATCGACCGAGACAGCTA；RT-13-F，序列为TTTTGCTGATGGGCCAGAT；

　　RT-14-F，序列为TTTTTGAAGAGGTTAGAAGCCA；RT-15-F，序列为

　　TTTTTGATACTCAGCAGCTGGA；RT-16-F，序列为TTTTGTGATTTAAGGCGGCAGGTT；

　　RT-17-F，序列为TTTTCCTTAGTTTGCAAGTTATGATCA；RT-17-R，序列为

　　TTTTCATAGCCACCCCTGCAAAGAA；RT-18-F，序列为

　　TTTTCGCAGCGGCTCACGCCTGTAA；RT-18-R，序列为TTTTAGAGGGCATGGATGGA；

　　RT-19-F，序列为TTTTAAATTGAATGCTTCCCTTGA；RT-19-R，序列为

　　TTTTCTCCAGGATACTCGGCA；RT-20-F，序列为TTTTCCAGGACTGGCTTACCC；RT-20-R，序列为TTTTCCAAATTCGCCTTCTCC；RT-21-F，序列为TTTTTTCCTGGAGAAGAGAGG；

　　RT-21-R，序列为TTTTTGACCACTGCCTCTC；NT1-1-F，序列为

　　TTTTTCAGAGACCCGTGCTGAG；NT1-1-R，序列为TTTTAAGGACGAAACACCTT；

　　NT1-2-F，序列为TTTTCACCTCAGTAATATGG；NT1-2-R，序列为

　　TTTTACCTTTTGGGGTCTCG；NT1-3-F，序列为TTTTAAAAATGTTATGTCAGC；NT1-3-R，序列为TTTTTTTTGGGGTCTCG；NT1-4-F，序列为TTTTAAAAATGTTATGTC；NT1-4-R，序列为TTTTGACCCCATCCCTGACACT；NT1-5-F，序列为TTTTCTTTCTGCCGACCC；

　　NT1-5-R，序列为TTTTTCCCTGCATTTCATGACA；NT1-6-F，序列为

　　TTTTAGGTTGGTGCAAAAG；NT1-6-R，序列为TTTTCCGGTGGAGAAGAAGG；NT1-7-F，序列为TTTTAGTCCCCTGACAGTGC；NT1-7-R，序列为TTTTCTGAGCTGCTCACC；

　　NT1-8-F，序列为TTTTAAAAATGTTATGTCAGCGT；NT1-8-R，序列为

　　TTTTTCTCTGTGGATGGGCAG；NT1-9-F，序列为TTTTCACCATTCTTCCAC；NT1-9-R，序列为TTTTGCTGAAGCGAGAACT；NT1-10-F，序列为

　　TTTTTCATCGGGAAGACCTGGCT；NT1-11-F，序列为TTTTAAGAGGAGAGACATCGT；

　　NT1-12-F，序列为TTTTCCGTCCACCTGTCTTCTG；NT1-12-F，序列为

　　TTTTGGCCATGTCCCTGCA；NT1-13-F，序列为TTTTCAGTGCCAGCGTGAGA；NT1-14-F，序列为TTTTCCTGCATTTCATGACA；NT1-15-F，序列为TTTTAGTCCCCTGACAGTGCCA；

　　NT1-16-F，序列为TTTTTGCATTTCATGACA；NT1-17-F，序列为

　　TTTTCTTCTGGTCCATCGGAG；NT1-18-F，序列为TTTTCGAGTGTGAATTTCCTG；

　　NT2-1-F，序列为TTTTTCCTCAGCATCTCCTGGG；NT2-1-R，序列为

　　TTTTCAGAGGATGGGCTGGCCATG；NT2-2-F，序列为TTTTCCTCCTCAGCAGCTCACC；

　　NT2-2-R，序列为TTTTAGACCCGGTGGAGAAGA；NT2-3-F，序列为

　　TTTTGATCCGAGTCCAGGCTG；NT2-3-R，序列为TTTTACCCGGTGGAGAAGAAGGAC；

　　NT2-4-F，序列为TTTTGGATGGCCCAGTGTCTGAAGGTT；NT2-4-R，序列为

　　TTTTACAGGAAGAACGTGACGT；NT2-5-F，序列为TTTTCCATGTCCCTGCATTT；

　　NT2-5-R，序列为TTTTGAACTTCTGGCTCTTGGAA；NT2-6-F，序列为

　　TTTTTCATTGAGAACCCCCAGT；NT2-6-R，序列为TTTTCAGCCGGTACGAAAACTT；

　　NT3-1-F，序列为TTTTAGTGCCAGCGTGAGAACC；NT3-1-R，序列为

　　TTTTCATTCTTCCACCCTGGAA；NT3-2-F，序列为TTTTCACACAGCCGGAGGTCA；

　　NT3-2-R，序列为TTTTTCATCGGGAAGACCTGGCT；NT3-3-F，序列为

　　TTTTAACCACATCATGGTCT；NT3-3-R，序列为TTTTAGCACATTAAGAGGAGA；NT3-4-F，

　　序列为TTTTCGTCAACAACGGCA；NT3-4-R，序列为TTTTGCATTGCTTCCTCCTCCTC；

　　NT3-5-F，序列为TTTTATCATGGCTGCCTTCATGGACAA；NT3-5-R，序列为

　　TTTTTGAGTCAGCTAAGACAGAC；NT3-6-F，序列为TTTTTGCCTTCATGGACAACCC；

　　NT3-6-R，序列为TTTTCCGACAGCATTGCTTCCT。

　　作为本发明的又一种优选方案，在步骤(2)中，多重富集PCR的反应体系为：

　　1×PCR缓冲液

　　作为本发明的进一步改进方案，该构建方法的试剂盒，包括

　　一DNA富集反应组件，由第一扩增引物组组成；

　　—RNA富集反应组件，由第二扩增引物组组成；

　　一HS-Taq酶，由Taq酶、DNA连接酶和DNA末端修饰酶组成；

　　一管阳性质控品；

　　和一管阴性质控品。

　　与现有技术相比，本发明具有如下优点：

　　1、本发明的构建方法针对多个靶序列进行单管，快速完成文库的构建，整个文库构建过程仅需要2～3小时，手动时间仅仅需要45分钟即可，通用于illumina和Ion torrent平台，结合高通量测序平台可以十分有效的解决目前对于临床上肺癌中在少量的石蜡组织样本或外周血样本基础上需要对体细胞多基因、多靶点检测这一难点，且成本低廉。

　　2、本发明的构建方法所制备的文库序列可被目前高通量测序系统识别并进行检测，从而实现文库构建进行核酸序列的检测的应用，该核酸检测可应用于目前多种高通量测序平台、基因芯片平台、杂交检测平台，见图1。

　　3、本发明的构建方法对于来自甲醛固定石蜡包埋的样品和来自血浆的样品所获得的短片段DNA依然适用，基于其的检测方法依然具有与新鲜组织样品DNA同样的扩增和检测能力，见图2、图3。

　　附图说明

　　图1为本发明的实施例构建的核酸文库进行高通量测序总数据图；

　　图2为本发明的实施例检测肺癌多基因突变的检测均一性结果图；

　　图3为本发明的实施例检测肺癌多基因突变的检测突变结果。

　　具体实施方式

　　下面结合附图和具体实施方式对本发明作进一步详细地描述。

　　血浆样品，使用Qiagen公司血浆DNA/RNA提取试剂盒提取基因组DNA/RNA，具体步骤按试剂盒操作说明。每次提取血浆不少于1000μl。所提DNA/RNA溶于Tris-HCl(10mmol/L,pH 8.0)，经紫外分光光度计检测提取质量，并确定浓度，用Tris-HCl溶液(10mmol/L,pH8.0)调整DNA/RNA浓度到2ng/μl作为PCR扩增的模板。

　　基于上述构建方法的试剂盒包括：

　　一DNA富集反应组件，由第一扩增引物组组成，每人份的DNA富集反应组件的配方如下表所示：

　　一RNA富集反应组件，由第一扩增引物组组成，每人份的DNA富集反应组件的配方如下表所示：、

　　HS-Taq酶，由Taq酶、DNA连接酶和DNA末端修饰酶组成，比例为0.8～1.2:0.8～1.2:0.8～1.2，优选比例1:1:1；

　　一阴性质控品，具体为无核酸水；

　　和一阳性质控品，具体由20个阳性突变质粒序列野生型基因组DNA混合而成，浓度为2ng/μL。

　　将上述试剂盒用前述的构建方法进行实验，以Kras基因热点突变外显子2上的G12D突变为例来分析本发明的检测肺癌多基因突变的方法。实验用细胞系4株，分别为KRAS基因G12D突变质粒；50份健康的全血样品、50份临床肺癌样品(全血)：

　　所述第一和第二PCR反应体系的模板量(待测样品、阳性质控品和阴性质控品)为5uL，其余组分如下表所示：

　　PCR扩增程序设置如下表：

　　上述第一和第二PCR反应体系所得的第一和第二扩增产物的纯化具体如下：

　　取出Agencourt AMPure XP试剂置于室温，同时要打散磁珠，同时配制新鲜的70％的乙醇(230μL无水乙醇+100μL无核酸酶水)，必须是新鲜配制的。

　　第一轮纯化步骤

　　(1)向每个样品反应管25μL产物中分别加入12.5μL(0.5x样本体积)的AgencourtAMPure XP试剂，上下吸取吹打5次，完全混匀重悬DNA；

　　(2)室温孵育5分钟；

　　(3)放置在磁力架上面，孵育5分钟，一直到溶液澄清；

　　(4)小心地吸取上清液置于新的离心管，不要扰动磁珠；注意：上清液中含有扩增产物不要丢弃。

　　第二轮纯化步骤

　　(1)向上述吸取的上清液25μL中加入30μL(1.2x样本体积)的Agencourt AMPureXP试剂，上下吸取吹打5次，完全混匀重悬DNA；

　　(2)室温孵育5分钟；

　　(3)放置在磁力架上面，孵育3分钟，一直到溶液澄清，小心地吸走并弃掉上清，不要扰动磁珠；注意：磁珠上含有扩增文库不要丢弃。

　　(4)加入150μl新鲜配制的70％乙醇，没过磁珠样品即可，离心管正反方向移动5次，然后磁力架上孵育2分钟，去除上清液；

　　(5)重复上述步骤4，进行第二次洗涤；

　　(6)确保乙醇液滴已全部从孔中吸走，将板放置于磁力架上，室温空气干燥5分钟，注意不要过度干燥。

　　(7)将样品管从磁力架上拿开，在每孔中加入25μL TE(PH8.0)缓冲液充分浸润磁珠。充分振荡混匀，快速离心将液体收集到管底。(也可以选择用枪吸取一半以上的液体上下吹打至少5次来混匀)；注意：上清液含有扩增文库不要丢弃。

　　将样品管置于磁力架上2分钟。上清液中含有扩增产物。取出20μL上清。

　　上述纯化所得的第一扩增产物和第二扩增产物制备第一文库产物和第二文库产物的PCR反应的模板量为5uL，其余组分如下表所示：

　　PCR扩增程序设置如下表：

　　PCR产物分别按纯化第一扩增产物和第二扩增产物方法进行纯化，制得第一文库产物和第二文库产物。

　　上述第一文库产物和第二文库产物的检测具体如下：

　　采用Ion torrent PGM半导体测序仪(Thermofisher公司)一次可以检测16份样品(包括阴阳性对照)。

　　前述50份全血样品以及阳性质粒经本发明的体系检测，只有阳性质粒有检测到突变序列，其他样品无突变序列，进一步证明了该方法的特异性，具体结果如图1至图3所示。

　　灵敏度分析：将突变型质粒从100ng/μL连续10倍梯度稀释，分别为100ng/μL，10ng/μL，1ng/μL，100pg/μL，10pg/μL，1pg/μL。每次反应加入5μL DNA。结果表明本发明的文库构建方法的灵敏度高，50拷贝DNA基因组即可检出。

　　选择性能力分析：固定每次PCR反应总DNA用量，100ng/反应和10ng/反应。先将突变质粒的DNA和野生型细胞系DNA浓度都调整为20ng/μL和2ng/μL。这样每个反应加5μL模板即为100ng/反应和10ng/反应。按下述方法配置模拟DNA模板。

　　A:50％即为100ng/μL突变细胞DNA。

　　B:30％取A液60μL后混入40μL 100ng/μL细胞DNA，震荡混均。

　　C:20％取A液40μL后混入60μL 100ng/μL细胞DNA，震荡混均。

　　D:15％取B液50μL后混入50μL 100ng/μL细胞DNA，震荡混均。

　　E:10％取C液50μL后混入50μL 100ng/μL细胞DNA，震荡混均。

　　F:5％取E液50μL后混入50μL 100ng/μL细胞DNA，震荡混均。

　　G:1％取F液20μL后混入80μL 100ng/μL细胞DNA，震荡混均。

　　H:0.5％取G液50μL后混入50μL 100ng/μL细胞DNA，震荡混均。

　　I:0.1％取H液20μL后混入80μL 100ng/μL细胞DNA，震荡混均。

　　J:0.01％取H液2μL后混入80μL 100ng/μL细胞DNA，震荡混均。

　　结果表明本发明的肺癌多基因突变方法的在平均测序深度达到20000层时选择性检测能力为在10ng总DNA中可以检出5拷贝的突变DNA，检测能力为0.1％。

　　重复性试验：每个反应分别加入突变细胞系DNA10ng、1ng和100pg，重复10次进行高通量测序检测，10次结果一致，符合率100％。

　　收集肺癌血浆标本共50例。其中男性28例，女性22例。年龄为36-71岁，平均年龄为55岁。对于肺癌基因，本发明检测结果与DNA测序结果相对照，DNA测序结果阳性的，本发明均能检出，另有3例本发明检测结果阳性的，并且突变率为1～5％的，DNA测序未能检出，因此本发明检测方法与DNA测序法比较具有更高的灵敏度。

　　以上可知本发明肿瘤多基因文库构建反应就可以同时检测肺癌多基因1435个突变位点，文库构建时间仅需3小时，因此本发明省时省力，准确性高，可满足突变的快速诊断。而且，高通量测序法灵敏度和选择性检测能力高于传统测序方法，10ng样品DNA中含0.1％的突变DNA即可检出。

　　最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。

《肺癌多基因突变文库的构建方法.doc》

将本文的Word文档下载到电脑，方便收藏和打印

推荐度：

点击下载文档

文档为doc格式(或pdf格式)

组合技术图文推荐

上一篇：用于检测感染性疾病的试剂和方法

下一篇：一种构建小鼠TCRbetaCDR3区文库的方法