欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 制备核酸文库的方法和用于实施所述方法的组合物和试剂盒独创技术163404字

制备核酸文库的方法和用于实施所述方法的组合物和试剂盒

2021-02-19 18:02:53

制备核酸文库的方法和用于实施所述方法的组合物和试剂盒

  相关申请的交叉引用

  按照35 U.S.C.§119(e),本申请要求2017年2月16日提交的美国临时专利申请序列号62/459,858的提交日期的优先权;所述申请的公开内容以引用的方式并入本文中。

  背景技术

  下一代测序(NGS)技术的发展已经允许从产生的核酸文库快速提取有价值的基因组和转录物组信息。例如Illumina(Solexa)测序、Roche 454测序、Ion torrent(质子/PGM测序)和SOLiD测序等高通量NGS技术允许比先前使用的桑格测序(Sanger sequencing)更迅速和廉价地对核酸分子测序,因而这些技术已经彻底改革生物技术和生物医学研究。

  这些有效的测序技术尤其着重于文库制备。可以使用NGS技术分析充分制备的逆转录互补DNA(cDNA)文库,以达成一系列不同目的。举例来说,取决于文库制备方法,转录物组数据可以用于进行差异表达分析以鉴定在某些情况下上调或下调的基因。

  cDNA文库还可以用于通过NGS进行T细胞受体(TCR)概况分析。TCR控制T细胞的选择、功能和活化,并确定T细胞对抗原肽-主要组织相容性复合物(MHC)中的哪些复合物反应。由于TCRα-链和β-链基因是从各细胞中可变区、多样性和连接(V(D)J)TCR基因区段的体细胞重组衍生的,所以个体的TCR谱系是非常不同的。对TCR的此多样性进行概况分析推动了对免疫谱系动力学的了解,促进对免疫反应的性质和免疫病症的病变的认识。这样的见解使多种疗法得到发展,包括迅速促进免疫肿瘤学领域。

  发明内容

  提供了制备核酸文库的方法。所述方法的方面包括由通过涉及RNA样品的模板转换反应产生的双股互补DNA(cDNA)产生一个或多个文库,包括例如表达文库和/或免疫细胞受体谱系文库。在一些方面,所述方法包括由单细胞制备文库和/或制备在单细胞水平下索引的文库。还提供了用于进行所述方法的组合物和试剂盒。

  附图说明

  图1提供了根据本公开的一实施方案由单一RNA样品制备两个核酸文库的方法的示意图。

  图2提供了根据本公开的一实施方案由单一RNA样品制备表达文库和免疫细胞受体谱系文库的方法的示意图。

  图3提供了使用模板转换反应产生产物双股核酸的示意图。

  图4提供了在文库制备方法中使用标签化的一实例,其可能适用于本公开的方法中。

  图5提供了展示根据本公开的一实施方案,用于产生用于组合的差异基因表达分析和TCR概况分析的文库的全过程的总示意图。

  图6提供了显示如本文中提供的有关实例中所述,用于由单T细胞制备TCR概况分析文库的全过程的总示意图。

  图7描绘了如与图6中所示的实例相关,96孔盘中索引寡核苷酸分布和样品的汇集。

  图8提供了测试免疫细胞概况分析工作流程的性能的数据,其展示与由单Jurkat细胞或与单细胞同等量的Jurkat RNA产生的TCR-α或TCR-β CDR3区域对应的测序读数的百分比。

  图9提供了测试免疫细胞概况分析工作流程的性能的进一步数据,其展示与预期Jurkat克隆型对应的测序读数的百分比。

  图10提供了以多样品纳米分配器(MSND)格式测试的单细胞TCR概况分析工作流程的总示意图。

  图11提供了与TCR-α或TCR-β的CDR3区域对应的来自单Jurkat细胞的测序数据的比对分析的结果。

  图12A-12D提供了根据本发明的一实施方案以多样品纳米分配器(MSND)格式测试的单细胞TCR概况分析工作流程的总细节。

  图13描绘了如以下实验部分中所述,来自使用图12A至12D的方案产生的免疫细胞受体测序文库的α和β受体读数计数。

  图14A-14B描绘了如以下实验部分中所述,来自使用图12A-12D的方案产生的分割WTA文库的例示性数据。图14A展示基因身体覆盖率数据,其中X轴上为所有基因上标准化覆盖率且其Y轴上为所有对应的外显子读数。图描绘一种实例CCRF-CEM细胞。图14B展示利用如图13中所述,来自TALL、CCRF和处理(PMA)CCRF细胞的5'DE文库的对应读数的主成分分析。

  定义

  如本文所用,术语“杂交条件”意指引物或其它多核苷酸与如下靶核酸区域特异性杂交的条件,所述引物或其它多核苷酸与所述靶核酸区域共享一些互补性。引物是否与靶核酸特异性杂交由如聚合物与靶核酸之间的互补程度和发生杂交的温度等因素决定,发生杂交的温度可以由引物的熔融温度(TM)而得知。熔融温度是指使引物-靶核酸双链体的一半保持杂交且双链体的一半解离成单股的温度。双链体的Tm可以通过实验确定或使用下式预测:Tm=81.5+16.6(log10[Na+])+0.41(分数G+C)–(60/N),其中N为链长且[Na+]小于1M。参见Sambrook和Russell(2001;Molecular Cloning:A Laboratory Manual,第3版,ColdSpring Harbor Press,Cold Spring Harbor N.Y.,第10章)。取决于多种参数的其它更先进模型也可以用于预测引物/靶双链体的Tm,取决于各种杂交条件。用于实现特异性核酸杂交的方法可以见于例如Tijssen,Laboratory Techniques in Biochemistry andMolecular Biology-Hybridization with Nucleic Acid Probes,第I部分,第2章,“Overview of principles of hybridization and the strategy of nucleic acidprobe assays,”Elsevier(1993)中。

  如本文所用,术语“互补”和“互补性”是指通过非共价键,与整个靶核酸或其区域(例如产物核酸区域)进行碱基配对的核苷酸序列。在典型的沃森-克立克碱基配对(Watson-Crick base pairing)中,腺嘌呤(A)与胸腺嘧啶(T)形成碱基对,如同DNA中鸟嘌呤(G)与胞嘧啶(C)一样。在RNA中,胸腺嘧啶由尿嘧啶(U)替代。因而,A与T互补且G与C互补。在RNA中,A与U互补,反之亦然。典型地,“互补”是指至少部分互补的核苷酸序列。术语“互补”还可以涵盖完全互补,使得一股中的每个核苷酸与另一股中对应位置的每个核苷酸互补的双链体。在某些情况下,核苷酸序列可以与靶部分互补,其中不是所有的核苷酸在所有对应的位置都与靶核酸中的每个核苷酸互补。举例来说,引物可以与靶核酸完全(即100%)互补,或引物和靶核酸可以共享一定程度互补性,其小于完全(例如70%、75%、85%、90%、95%、99%)。

  两个核苷酸序列的同一性百分比可以通过出于最佳比较的目的(例如可以在第一序列的序列中引入缺口以进行最佳比对)比对序列来确定。然后比较对应位置的核苷酸,且两个序列之间的同一性百分比是所述序列共享的同一位置的数目的函数(即同一性%=同一位置的数目/总位置的数目×100)。当一个序列中的位置被与另一序列中对应位置相同的核苷酸占据时,所述分子在该位置处同一。此类数学算法的一非限制性实例描述于Karlin等人,Proc.Natl.Acad.Sci.USA 90:5873-5877(1993)中。此类算法合并至如Altschul等人,Nucleic Acids Res.25:389-3402(1997)中所述的NBLAST和XBLAST程序(2.0版)。当利用BLAST和缺口化BLAST程序时,可以使用相应程序(例如NBLAST)的缺省参数。在一方面,用于序列比较的参数可以定在分数=100,字长=12,或可以改变(例如字长=5或字长=20)。

  结构域是指由多个核苷酸组成的核酸的延伸或长度,其中延伸或长度为核酸提供界定功能。结构域的实例包括条型码化独特分子标签(BUMI)结构域、引物结合域、杂交结构域、条型码结构域(例如源条型码结构域)、独特分子标签(UMI)结构域、下一代测序(NGS)接头结构域、NGS索引结构域等等。在一些情况下,术语“结构域”和“区域”可以互换使用,包括例如在描述免疫受体链结构域/区域的情况下,例如免疫受体恒定结构域/区域。虽然给定结构域的长度可以改变,但在一些情况下,长度在2至100nt,例如5至50nt,例如5至30nt范围内。

  具体实施方式

  提供了制备核酸文库的方法。所述方法的方面包括由通过涉及RNA样品的模板转换反应产生的双股互补DNA(cDNA)产生一个或多个文库,包括例如表达文库和/或免疫细胞受体谱系文库。在一些方面,所述方法包括由单细胞制备文库和/或制备在单细胞水平下索引的文库。还提供了用于进行所述方法的组合物和试剂盒。

  在更详细地描述本公开的方法前,应了解所述方法不局限于所描述的具体实施方案,因而当然可以变化。还应了解本文中使用的术语仅仅是出于描述具体实施方案的目的,且不意图限制,因为所述方法的范围仅仅受随附权利要求书限制。

  在提供值的范围的情况下,应了解除非上下文另外清楚地规定,否则所述方法内涵盖该范围的上下限之间的每个中间值,至下限单位的十分之一,以及所说明范围内的任何其它所说明或中间值。这些较小范围的上下限可以独立地包括在较小范围中,且也涵盖于所述方法内,服从于所说明范围中的任何特别排除的界限。在所说明的范围包括界限中的一个或两个界限的情况下,排除那些包括的界限中的任一个或两个界限的范围也包括在所述方法中。

  本文中呈现某些范围,其中术语“约”放在数值之前。术语“约”在本文中用于提供前面放其的精确数值的文字支持,以及靠近或近似前面放该术语的数目的数目。在确定数目是否靠近或接近特别叙述的数目时,靠近或接近的未叙述的数目可以是在其呈现的上下文中与特别叙述的数目基本上同等的数目。

  除非另外定义,否则本文中使用的所有技术和科学术语都具有与所述方法所属领域的一般技术人员通常所了解的含义相同的含义。虽然与本文所述的方法和材料类似或同等的任何方法和材料也可以用于实施或测试本发明,但是现在描述代表性的例示性方法和材料。

  本说明书中所引用的所有公布和专利都以引用的方式并入本文中,其引用程度如同特别且个别地指示各个别公布或专利以引用的方式并入一般,且以引用的方式并入本文中以公开和描述引用的公布所相关的方法和/或材料。任何公布的引用是为了其在编档日期前的公开内容,且不应解释为承认本发明无权借助在先发明而先于此类公布。此外,所提供的公布日期可以与实际公布日期不同,实际公布日期可以独立地证实。

  注意到,如本文和随附权利要求书中所用,除非上下文另外清楚规定,否则单数形式“一种(a/an)”和“所述”包括多个指示物。进一步注意到,权利要求书可以被撰写成排除任何任选的要素。因而,此陈述意图作为与权利要求要素的叙述一起使用排他性术语如“单独地”、“仅”等,或采用“负面”限制的先前基础。

  应了解,为清楚起见,在分开实施方案的上下文中描述的方法的某些特征也可能在单个实施方案中组合提供。相反地,为简便起见,在单个实施方案的上下文中描述的方法的多种特征也可以分开或呈任何合适的子组合提供。本发明特别涵盖实施方案的所有组合且本文中公开,如同每个组合个别且明确地公开一般,公开程度达到此类组合涵盖可操作的方法和/或装置/系统/试剂盒。另外,本发明的方法还特别涵盖描述此类变量的实施方案中列出的所有子组合,且在本文中公开,如同每个此类子组合个别且明确地在本文中公开一般。

  如本领域的技术人员在阅读本公开后显而易见,本文中所描述和示出的个别实施方案中的每一个实施方案具有离散组分和特征,所述组分和特征可以在不脱离本发明方法的范围或精神下容易与任一其它若干实施方案的特征分离或组合。任何叙述的方法都可以按叙述的事件的次序或按逻辑上可能的任何其它次序进行。

  方法

  如以上所概述,提供了制备一个或多个核酸文库的方法。单个文库或多个文库可以由单个RNA样品制备。举例来说,在一些情况下,单个免疫细胞受体谱系文库可以由RNA样品制备。在一些情况下,表达文库和免疫细胞受体谱系文库由单个RNA样品制备。

  在主题方法包括由单个样品制备多个文库的情况下,可以连续或同时制备多个文库。举例来说,在一些情况下,本发明的方法可以包括同时制备表达文库和免疫细胞受体谱系文库。“同时制备”意指在制备两个或更多个文库中进行的一个或多个文库制备步骤(例如扩增、末端捕捉等)同时发生或至少部分地在时间上重叠发生。在一些情况下,本发明的方法可以包括相继制备表达文库和免疫细胞受体谱系文库,包括例如其中在免疫细胞受体谱系文库前制备表达文库或其中在表达文库前制备免疫细胞受体谱系文库。“相继制备”意指两个文库的制备在时间上不重叠,例如在制备两个文库中进行的一个或多个文库制备步骤不同时发生。在一些情况下,相继制备的文库可以包括在开始制备下一个文库前第一文库完成。因此,在一些情况下,同时制备的文库可以包括在第一文库的制备完成前制备第二文库。

  无论相继还是同时制备,在由单个RNA样品制备多个文库下,主题方法可以包括由所述RNA样品产生产物双股cDNA,随后将所产生的产物双股cDNA分割为第一反应混合物和第二反应混合物。举例来说,如图1中所图式,RNA样品(100)可以用于模板转换反应中以由RNA样品产生双股cDNA(101)。所产生的双股cDNA依照要求可以扩增或可以不扩增,然后可以例如分割为两个反应,随后用于产生第一文库(102)和第二文库(103),如所描绘。在一些实施方案中,含有分割的双股cDNA的多种反应混合物可以用于产生表达文库(200)和免疫细胞受体谱系文库(201),如图2中所描绘。因此,此类分割的反应混合物可以分别用以依照要求产生多种文库,包括例如第一反应混合物用于产生表达文库且第二反应混合物用于产生免疫细胞受体谱系文库。

  所产生的产物双股cDNA的分割可以均匀或不均匀地进行,使得第一反应混合物和第二反应混合物可以得到同等或不等量的所产生的产物双股cDNA。举例来说,在一些情况下,与用以产生免疫细胞受体谱系文库的反应混合物得到的所分割的产物双股cDNA的量相比,用以产生表达文库的反应混合物可以得到更多的所分割的产物双股cDNA。在一些情况下,与用以产生免疫细胞受体谱系文库的反应混合物得到的所分割的产物双股cDNA的量相比,用以产生表达文库的反应混合物可以得到更少的所分割的产物双股cDNA。在一些情况下,与用以产生免疫细胞受体谱系文库的反应混合物得到的所分割的产物双股cDNA的量相比,用以产生表达文库的反应混合物可以得到相同量的所分割的产物双股cDNA。

  尽管如上所述,产物双股cDNA可以分割为两个反应混合物,但产物双股cDNA的分割不一定限于分割为两个反应混合物,且在一些情况下产物双股cDNA可以分割为超过两个反应混合物。举例来说,在一些情况下,产物双股cDNA可以分割为三个或更多个反应混合物。产物双股cDNA分割为超过两个反应混合物可以用于达成各种目的,包括但不限于例如可以由产物双股cDNA,包括由单个RNA样品产生的产物双股cDNA产生三个或更多个文库。

  任何合宜的将所产生的产物双股cDNA分割为不同反应混合物的方法可以用于主题方法。举例来说,在一些情况下,产物双股cDNA可以例如通过手动吸移产物双股cDNA的等分试样至反应混合物而手动分割为反应混合物。在一些情况下,例如通过使用液体操作机器人或被编程成分配产物双股cDNA的等分试样至反应混合物的其它自动化装置,可以将产物双股cDNA自动分割为反应混合物。在一些情况下,所述方法可以包括在分割为用于产生个别文库的反应混合物前,例如通过预扩增PCR步骤将产物双股cDNA预扩增。

  在一些情况下,个别制备的反应混合物可以在进一步加工前汇集,因而进行的方法可以包括汇集步骤。举例来说,在一些情况下,个别制备的产物双股cDNA可以在制备一种或多种文库前汇集。在一些情况下,所制备的产物双股cDNA可以在如上所述,分割产物双股cDNA以分开反应,例如用于制备两个或更多个文库前汇集。可以将由分开的单个RNA样品个别地制备的反应汇集,包括例如由多个细胞制备的那些单RNA样品或由单细胞制备的那些样品。可以采用任何合宜的汇集方法,包括例如将整个反应体积汇集在一起或反应体积的部分汇集在一起。在一些情况下,可以在个别容器或孔(例如多孔板的孔)中进行个别反应,且可以将孔的容器的反应混合物汇集成单个容器或孔。

  在一些情况下,在随后汇集的个别反应中产生的核酸可以含有或被改性成含有鉴定核酸序列,所述序列允许在汇集后追溯性鉴定核酸的个别反应源。适用的鉴定核酸序列包括例如如以下更详细地描述的条型码核酸序列和索引序列。

  如上所述,产物双股cDNA和随后一个或多个文库可以由RNA样品产生。RNA样品为含有一种或多种类型模板RNA的样品,如以下更详细地描述。RNA样品可以来源于细胞样品,包括含有单细胞或含有例如两个或更多个细胞的细胞群体的细胞样品。细胞样品可以来源于多种来源,包括但不限于例如细胞组织、活组织检查、血液样品、细胞培养物等。另外,细胞样品可以来源于特定器官、组织、肿瘤、赘生物等等。此外,来自任何群体的细胞可以为用于主题方法中的细胞样品的来源,例如包括细菌或酵母的原核或真核单细胞生物体的群体。然而,在本发明的方法包括制备免疫细胞受体谱系文库的情况下,包括哺乳动物细胞的真核细胞一般用作RNA样品的来源。

  因而,在一些情况下,用于主题方法中的RNA样品的来源可以为哺乳动物细胞样品,例如啮齿动物(例如小鼠或大鼠)细胞样品、非人灵长类动物细胞样品、人细胞样品等等。在一些情况下,哺乳动物细胞样品可以为哺乳动物血液样品,包括但不限于例如啮齿动物(例如小鼠或大鼠)血液样品、非人灵长类动物血液样品、人血液样品等等。

  在一些实施方案中,适用的细胞样品可以包括含有一种或多种免疫细胞类型的样品。如本文所用,术语“免疫细胞”一般包括源自于骨髓中产生的造血干细胞(HSC)的白血球(白细胞)。“免疫细胞”包括例如淋巴细胞(T细胞、B细胞、自然杀伤(NK)细胞)和髓系来源细胞(嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、单核细胞、巨噬细胞、树突状细胞)。“T细胞”包括所有类型的表达CD3的免疫细胞,包括T-辅助细胞(CD4+细胞)、细胞毒性T细胞(CD8+细胞)、调节T细胞(Treg)和γ-δT细胞。“细胞毒性细胞”包括CD8+ T细胞、自然杀伤(NK)细胞和嗜中性粒细胞,所述细胞能够介导细胞毒性反应。

  在一些情况下,用于本文所述的方法中的RNA样品将源自于免疫细胞的群体,包括但不限于例如混合免疫细胞群体、T细胞群体、B细胞群体等等。在一些情况下,用于本文所述的方法中的RNA样品将源自于单免疫细胞,包括但不限于例如单T细胞、单B细胞等等。

  文库

  如上所述,在主题方法中产生的文库可以由所产生的产物双股cDNA产生。“产物双股cDNA”一般意指由逆转录反应产生的含有模板核酸的互补核酸的双股DNA。产物双股cDNA可以由模板RNA使用逆转录反应产生,其中可以采用任何RNA模板,包括例如mRNA模板。因此,所提供的方法可以包括通过使用逆转录反应,例如以下更详细地描述的模板转换逆转录反应,由RNA样品中存在的模板RNA产生产物双股cDNA。

  在一些情况下,主题方法包括由多个单细胞制备多个文库,例如多个表达文库、多个免疫细胞受体谱系文库、其组合等等。举例来说,在一些情况下,多个个别RNA样品可以各自源自于单细胞,包括例如个别免疫细胞,且个别RNA样品可以用于制备产物双股cDNA并随后用于产生多个文库。在产生多个文库的情况下,用于制备文库的组分(例如产物双股cDNA)或文库自身可能汇集或可以不汇集。如上所述且如下更详细地描述,在文库或文库制备组分汇集的情况下,核酸可以包括未模板化鉴定核酸序列,其可以用于追溯性地鉴定具体的文库组分或其序列的来源。此类追溯的性鉴定可以例如通过多路分解实现。

  在一些实施方案中,本发明的方法的方面包括制备表达文库。“表达文库”意指可用于评估包括例如单细胞样品或含有细胞群体的样品在内的细胞样品的核酸表达的核酸文库。表达文库的制备可以包括制备用于进行下一代测序(NGS)的表达文库,包括由RNA样品制备NGS表达文库。

  如本文所述产生的NGS文库是核酸成员在其末端包括可用于使用所关注的测序平台进行测序的部分或完整的测序平台接头序列的文库。所关注的测序平台包括(但不限于)来自的HiSeqTM、MiSeqTM和Genome AnalyzerTM测序系统;来自Ion TorrentTM的Ion PGMTM和Ion ProtonTM测序系统;来自Pacific Biosciences的PACBIO RS II Sequel系统、来自Life TechnologiesTM的SOLiD测序系统、来自Roche的454GS FLX+和GS Junior测序系统、来自Oxford Nanopore的MinIONTM系统或所关注的任何其它测序平台。

  如上所述,本公开的方法包括由RNA样品产生产物双股cDNA,其中所产生的产物双股cDNA可以分割为两种或更多种反应混合物,其中一种可以用以制备表达文库。所制备的表达文库可以是全长表达文库或非全长表达文库。“全长表达文库”意指文库的核酸成员含有与其逆转录的全长RNA成员对应的全长cDNA序列。举例来说,在个别文库成员是mRNA的全长cDNA的情况下,全长cDNA将包括mRNA的整个编码序列,例如整个剪接的mRNA编码序列,即在mRNA的5’-帽与聚(A)尾之间的整个mRNA编码序列。全长cDNA可能包括或可能不包括与mRNA的一个或多个非翻译区(UTR),例如3’UTR或5’UTR对应的序列。

  在一些情况下,所制备的表达文库可以是被特别制成用于捕捉主题RNA分子的末端的文库。此类文库在本文中可以称为“末端捕捉”文库或其成员可以称为末端捕捉核酸。末端捕捉文库包括个别地经受3’末端捕捉或5’末端捕捉方法的核酸以及核酸经受3’和5’末端捕捉方法。末端捕捉方法可以利用末端扩增引物。如本文所用,术语“末端扩增引物”泛指用于PCR反应中以从在双股DNA中引入的有待扩增的末端扩增的核酸引物。被引入末端扩增引物所结合的双股DNA中的末端一般不是双股DNA的原始末端(例如不是原始5’末端,例如与逆转录RNA的原始5’末端对应;或不是原始3’末端,例如与逆转录RNA的原始3’末端对应),且可以是新引入的末端,例如作为碎裂和/或连结反应的产物而产生的末端。

  因此,在某些实施方案中,制备表达文库的方法为末端捕捉方法。末端捕捉方法可以用于对RNA(例如mRNA转录产物)进行测序和/或定量,例如用于差异表达分析。末端捕捉方法可以利用标签化反应,其中主题双股DNA碎裂且所产生的碎片连结至含有合成序列,例如本文所述的未模板化序列中的一种或多种序列的所需寡核苷酸。可以通过使用介导碎裂和连结的转座酶实现标签化。

  在某些实施方案中,末端捕捉方法捕捉RNA的3’末端,例如其中通过第一股cDNA引物中扩增引物结合位点和通过标签化引入的5’标签化后PCR引物结合位点的存在来促进末端捕捉。在其它实施方案中,末端捕捉方法捕捉RNA的5’末端,例如其中通过模版转换寡核苷酸中扩增引物结合位点和通过标签化引入的3’标签化后PCR引物结合位点的存在来促进末端捕捉。

  图4中示意性说明末端捕捉表达文库制备方法的一实例。所述方法包括在足以产生双股产物核酸(未示)的条件下将RNA样品、包括PCR引物结合域的第一股cDNA引物、包括3'杂交结构域和5'第二PCR引物结合域的模板转换寡核苷酸、逆转录酶(未示)和dNTP(未示)组合在包括各自与第一股cDNA的相邻区域杂交的模板mRNA和模板转换寡核苷酸的反应混合物中。在此实例中,RNA样品包括mRNA(聚A+)模板,且第一股cDNA引物包括oligo-dT 3’杂交结构域、条型码、测序接头结构域(这里为读数引物2序列)、第一PCR引物结合域(这里为结合引物IIA的结构域)和阻断修饰(黑色星号)。在第一股合成期间,逆转录酶模板从模板mRNA转换成模板转换寡核苷酸(在此实例中,为Clontech SMART-Seq v4模板转换寡核苷酸),所述模板转换寡核苷酸包含包括LNA的3’杂交结构域和包括第二PCR引物结合域的5’结构域。在此实例中,第二PCR引物结合域(结合引物IIA的结构域)与第一PCR引物结合域相同。在第一股合成后,使用阻断的引物IIA对cDNA进行PCR扩增以产生产物双股cDNA(图4中标记的“双股cDNA”)。

  在图4中所示的实例中,描绘产物双股cDNA的产生供参考,以推动下游扩增和测序中所利用的引物结合域和条型码序列的鉴定。如以下更详细地描述,用于所提供的方法中的标签化可以在各种元件(例如未模板化序列)的存在、不存在和位置方面与图4中所描绘的情况有所不同。举例来说,虽然图4的示意图描绘了3’末端捕捉,但所述方法的各个步骤的组分容易针对5’末端捕捉重新配置。此外,如上所述,所提供的方法一般可以包括产物双股cDNA的产生和随后在标签化前所产生的双股cDNA分割为反应混合物。关于涉及标签化反应的文库产生的进一步描述提供于国际申请No.PCT/US2016/051989中;其公开内容以引用的方式整体并入本文中。

  所产生的表达文库可以展现出所需复杂性(例如高复杂性)。表达文库的“复杂性”与在对文库进行测序时所获得的冗余测序读数(例如共享同一起始位点)的比例有关。复杂性与冗余测序读数的比例逆相关。在低复杂性文库中,某些靶序列过度表示,而其它标靶(例如低表达水平的mRNA)几乎没有覆盖。在高复杂性文库中,测序读数更密切地追踪起始核酸样品中靶核酸的已知分配,且将包括已知在起始样品中相对低水平地存在的标靶(例如低表达水平的mRNA)的覆盖率。根据某些实施方案,根据所提供的方法产生的表达文库的复杂性使得起始核酸样品(例如RNA样品)中靶核酸的不同种类(例如mRNA的不同种类)中的70%或更多、75%或更多、80%或更多、85%或更多、90%或更多、95%或更多、96%或更多、97%或更多、98%或更多或99%或更多得到测序读数。文库的复杂性可以通过使测序读数与参考基因组或转录物组(例如具体的细胞类型)对应来确定。已经研发出用于确定测序文库的复杂性的特定方法,包括Daley等人(2013)Nature Methods 10(4):325-327中描述的方法。

  在某些实施方案中,所提供的方法还包括使所制备的表达文库进行NGS方案。所述方案可以在任何合适的NGS测序平台上进行。所关注的NGS测序平台包括(但不限于)提供的测序平台(例如HiSeqTM、MiSeqTM和/或NextSeqTM测序系统);IonTorrentTM(例如Ion PGMTM和/或Ion ProtonTM测序系统);Pacific Biosciences(例如PACBIO RS II Sequel测序系统);Life TechnologiesTM(例如SOLiD测序系统);Roche(例如454GS FLX+和/或GS Junior测序系统);或所关注的任何其它测序平台。NGS方案将视所采用的具体的NGS测序系统而变。用于对NGS文库进行测序的详细方案可从所采用的NGS测序系统的制造商获得,例如所述方案可以包括进一步扩增(例如固相扩增)、对扩增子进行测序以及对测序数据进行分析。

  在某些实施方案中,主题方法可以用于产生与mRNA相对应的表达文库,所述表达文库用于在所关注的测序平台(例如提供的测序平台、Ion TorrentTM、PacificBiosciences、Life TechnologiesTM、Roche等等)上进行下游测序。根据某些实施方案,主题方法可以用于产生与未聚腺苷酸化的RNA相对应的NGS文库,所述文库用于在所关注的测序平台上进行下游测序。举例来说,微型RNA可以聚腺苷酸化,然后在如本文中其它地方描述的模板转换聚合反应中用作模板。还可以使用随机或基因特异性启动,取决于研究人员的目标。文库可以与对照文库(例如的PhiX对照文库)50:50混合并在测序平台(例如测序系统)上进行测序。可以除去对照文库序列并将剩余序列与mRNA来源(例如类、小鼠或任何其它mRNA来源)的转录物组对应。

  所制备的表达文库可以用于各种下游分析中,且在一些情况下,文库的制备可以针对所需类型的下游分析特别地进行重新配置。举例来说,在一些情况下,所制备的表达文库可以进行全转录物组分析(WTA),所述全转录物组分析包括对mRNA以及非mRNA的RNA种类,例如非编码RNA(例如snRNA和snoRNA)的分析。因此,在一些情况下,文库制备可以被特别地配置成允许分析转录物组内非mRNA的RNA,例如通过利用不依赖于与聚(A)尾杂交的引物(例如随机引物)或通过添加加尾反应,例如通过添加聚(A)尾至在产生产物双股cDNA前未天然聚腺苷酸化的RNA种类。

  在一些情况下,例如WTA的文库等文库的制备可以包括减少样品和/或文库内核糖体RNA的量的步骤。任何合宜的减少和/或除去不必要的核糖体RNA的方法都可以用于选择性除去,包括例如使用亲和力纯化、降解污染核酸(例如使用RiboGoneTM(Takara Bio USAInc.,Mountain View,CA)以及美国专利No.9,428,794和美国专利申请公布No.US 2015/0225773 A1中所述的那些方法;其公开内容以引用的方式整体并入本文中)、其组合等等。

  在某些实施方案中,所制备的表达文库可以用于差异表达分析中,包括例如其中测定一种或多种基因的相对表达(即上调或下调)。差异表达可以从质量方面或数量方面测定,且此类分析可以是全转录物组的或可以是靶向的。因而,在主题差异表达分析中进行评估的表达的转录产物的数目将变化。在一些情况下,差异表达分析可以评估主题基因组中表达的转录产物的50%或更多,包括但不限于例如主题基因组的60%或更多、70%或更多、80%或更多、90%或更多、95%或更多、99%或更多或基本上所有的表达的转录产物。靶向差异表达分析可以包括仅仅分析转录产物的子集或具体类别。靶向表达分析所限于的转录产物类别将变化且可以包括但不限于例如免疫基因转录产物。

  免疫基因的适用类别和亚类一般包括负责免疫系统的功能和对病原体的成功防御的那些基因的组,包括但不限于例如与免疫系统过程相关的那些基因(例如通过基因本体论(GO)登录号GO:0002376(可在geneontology(.)org上在线获得)鉴定的基因,包括但不限于例如与B细胞介导的免疫性、B细胞选择、T细胞介导的免疫性、T细胞选择、免疫反应的活化、抗原加工和呈现、黏膜相关的淋巴组织中的抗原取样、嗜碱性粒细胞介导的免疫性、嗜酸性粒细胞介导的免疫性、血球分化、血球增殖、免疫效应子过程、免疫反应、免疫系统发育、免疫记忆过程、白细胞活化、白细胞体内平衡、白细胞介导的免疫性、白细胞游出、淋巴细胞共刺激、淋巴细胞介导的免疫性、肥大细胞介导的免疫性、骨髓细胞体内平衡、骨髓白细胞介导的免疫性、自然杀伤细胞介导的免疫性、免疫系统过程的负调节、嗜中性粒细胞介导的免疫性、免疫系统过程的正调节、免疫反应分子介体的产生、免疫系统过程的调节、免疫受体的体细胞多样化、诱导耐受等等相关的那些基因。所关注的特定基因包括(但不限于):细胞因子、白细胞介素、白细胞介素受体、CD4、CD8、CD3、PD-1等等。

  如以上概述,在一些实施方案中,本发明的方法包括由RNA样品制备免疫细胞受体谱系文库。主题方法的方面包括从由RNA样品产生的产物双股cDNA扩增免疫细胞特异性cDNA以产生免疫细胞受体谱系文库。“免疫细胞受体谱系文库”一般意指包括细胞或细胞群体的一种或多种类型免疫受体的全长或部分序列的核酸文库。举例来说,免疫细胞受体谱系文库可以是针对单细胞或针对源自于单细胞样品或单个受试者或细胞样品群体的细胞群体产生的,包括例如来自两个或更多个受试者的样品群体。在一些情况下,可以由个别的单细胞产生主题文库,在添加鉴定核酸序列后可以将其汇集。

  如上所述,免疫细胞受体谱系文库的成员可能在长度上变化且可以是全长或小于全长。在一些情况下,文库的成员将优先包括免疫细胞受体的5’末端。所关注的免疫细胞受体包括但不限于例如T细胞受体(TCR)和B细胞受体(BCR)。

  在一些情况下,免疫细胞受体谱系文库可以包括TCR谱系文库。TCR复合物是一种通过二硫键连接的膜锚定的杂二聚体蛋白质,其通常在T细胞表面上表达,并由表达为与CD3链分子的复合物的一部分的高变α(α)和β(β)链组成。许多天然TCR呈杂二聚体αβ或γδ形式存在。呈杂二聚体αβ形式的完整内源性TCR复合物包括八条链,即α链(本文中称为TCRα或TCRα)、β链(本文中称为TCRβ或TCRβ)、δ链、γ链、两条ε链和两条ξ链。α和βTCR链包括可变(V)和恒定(C)区。TCR多样性是由基因重组(α链的VJ重组和β链的VDJ重组)产生的,产生对于抗原(即肽/MHC)识别来说重要的交叉区域。

  在一些情况下,TCR谱系文库可以包括TCR-α链序列、TCR-β链序列或TCR-α链序列与TCR-β链序列。主题TCR谱系文库的TCR链序列可以包括全长TCR链序列(例如全长TCRα链序列、全长TCRβ链序列)或部分TCR链序列(例如部分长度TCRα链序列、部分长度TCRβ链序列)。

  在主题TCR谱系文库成员包括部分TCR链序列的情况下,部分TCR链序列可以包括整个或基本上整个TCR链可变区(例如TCRα链可变区、TCRβ链可变区)。在一些情况下,所得文库成员包括TCR可变区和至少TCR恒定区的一部分。在一些情况下,所得文库成员包括与TCRα和/或β链5’mRNA末端相对应的序列。在一些情况下,所得文库成员包括从TCRα或β链5’末端到至少相对应的链恒定区的一部分的序列。

  在某些实施方案中,免疫细胞特异性文库的制备可以包括TCR特异性扩增。此类TCR特异性扩增可以利用TCR特异性引物。“TCR特异性引物”意指与TCR链(例如TCRα链、TCRβ链)核酸序列的区域或其互补区域特异性杂交的引物。在一些情况下,TCR特异性引物可以只与一种类型TCR链,例如只与TCRα链或只与TCRβ链杂交。在一些情况下,TCR特异性引物可以被配置成与超过一种类型TCR链杂交,例如被配置成与TCRα链与TCRβ链都杂交。

  TCR特异性引物可以被设计成能与TCRα链恒定区或其互补区域特异性杂交。举例来说,在一些情况下,TCR特异性引物可以与哺乳动物TCRα链恒定区或其互补区域,包括例如人TCRα链恒定区、小鼠TCRα链恒定区等等杂交。

  例示性人TCRα链恒定区具有以下氨基酸序列:

  PNIQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKTVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSCDVKLVEKSFETDTNLNFQNLSVIGFRILLLKVAGFNLLMTLRLWSS(SEQ ID NO:01),

  其由以下核酸序列编码:

  CCAAATATCCAGAACCCTGACCCTGCCGTGTACCAGCTGAGAGACTCTAAATCCAGTGACAAGTCTGTCTGCCTATTCACCGATTTTGATTCTCAAACAAATGTGTCACAAAGTAAGGATTCTGATGTGTATATCACAGACAAAACTGTGCTAGACATGAGGTCTATGGACTTCAAGAGCAACAGTGCTGTGGCCTGGAGCAACAAATCTGACTTTGCATGTGCAAACGCCTTCAACAACAGCATTATTCCAGAAGACACCTTCTTCCCCAGCCCAGAAAGTTCCTGTGATGTCAAGCTGGTCGAGAAAAGCTTTGAAACAGATACGAACCTAAACTTTCAAAACCTGTCAGTGATTGGGTTCCGAATCCTCCTCCTGAAAGTGGCCGGGTTTAATCTGCTCATGACGCTGCGGCTGTGGTCCAGCTGA(SEQ ID NO:02;T细胞受体α链C区,人;GenBank:AY247834.1、AAO72258.1;UniProtKB:P01848)。

  例示性小鼠TCRα链恒定区具有以下氨基酸序列:

  PYIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKSNGAIAWSNQTSFTCQDIFKETNATYPSSDVPCDATLTEKSFETDMNLNFQNLSVMGLRILLLKVAGFNLLMTLRLWSS(SEQ IDNO:03;UniProtKB:P01849)或

  PNIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKSNGAIAWSNQTSFTCQDIFKETNATYPSSDVPCDATLTEKSFETDMNLNFQNLSVMGLRILLLKVAGFNLLMTLRLWSS(SEQ IDNO:04;GenBank:AAA53226.1)

  其分别由以下核酸序列编码:

  CCATACATCCAGAACCCAGAACCTGCTGTGTACCAGTTAAAAGATCCTCGGTCTCAGGACAGCACCCTCTGCCTGTTCACCGACTTTGACTCCCAAATCAATGTGCCGAAAACCATGGAATCTGGAACGTTCATCACTGACAAAACTGTGCTGGACATGAAAGCTATGGATTCCAAGAGCAATGGGGCCATTGCCTGGAGCAACCAGACAAGCTTCACCTGCCAAGATATCTTCAAAGAGACCAACGCCACCTACCCCAGTTCAGACGTTCCCTGTGATGCCACGTTGACCGAGAAAAGCTTTGAAACAGATATGAACCTAAACTTTCAAAACCTGTCAGTTATGGGACTCCGAATCCTCCTGCTGAAAGTAGCGGGATTTAACCTGCTCATGACGCTGAGGCTGTGGTCCAGT(SEQ ID NO:05),

  CCAAACATCCAGAACCCAGAACCTGCTGTGTACCAGTTAAAAGATCCTCGGTCTCAGGACAGCACCCTCTGCCTGTTCACCGACTTTGACTCCCAAATCAATGTGCCGAAAACCATGGAATCTGGAACGTTCATCACTGACAAAACTGTGCTGGACATGAAAGCTATGGATTCCAAGAGCAATGGGGCCATTGCCTGGAGCAACCAGACAAGCTTCACCTGCCAAGATATCTTCAAAGAGACCAACGCCACCTACCCCAGTTCAGACGTTCCCTGTGATGCCACGTTGACCGAGAAAAGCTTTGAAACAGATATGAACCTAAACTTTCAAAACCTGTCAGTTATGGGACTCCGAATCCTCCTGCTGAAAGTAGCGGGATTTAACCTGCTCATGACGCTGAGGCTGTGGTCCAGT(SEQ ID NO:06;GenBank:U07662.1)。

  TCR特异性引物可以被设计成能与TCRβ链(例如TCRβ1链恒定区或TCRβ2链恒定区)恒定区或其互补区域特异性杂交。举例来说,在一些情况下,TCR特异性引物可以与哺乳动物TCRβ链恒定区或其互补区域,包括例如人TCRβ链恒定区、小鼠TCRβ链恒定区等杂交。

  例示性人TCRβ链1恒定区具有以下氨基酸序列:

  EDLNKVFPPEVAVFEPSEAEISHTQKATLVCLATGFFPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSVSYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDF(SEQ ID NO:07;UniProtKB:P01850;GenBank:CAA25134.1)

  其由以下核酸序列编码:

  GAGGACCTGAACAAGGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTGTGCCTGGCCACAGGCTTCTTCCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTTACCTCGGTGTCCTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAGGCCACCCTGTATGCTGTGCTGGTCAGCGCCCTTGTGTTGATGGCCATGGTCAAGAGAAAGGATTTC(SEQ ID NO:08;GenBank:EF101778.1、X00437.1)。

  例示性人TCRβ链2恒定区具有以下氨基酸序列:

  DLKNVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVSTDPQPLKEQPALNDSRYCLSSRLRVSATFWQNPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGRADCGFTSESYQQGVLSATILYEILLGKATLYAVLVSALVLMAMVKRKDSRG(SEQ ID NO:09;UniProtKB:A0A5B9,GenBank:AAA60662.1)

  其由以下核酸序列编码:

  GACCTGAAAAACGTGTTCCCACCCGAGGTCGCTGTGTTTGAGCCATCAGAAGCAGAGATCTCCCACACCCAAAAGGCCACACTGGTATGCCTGGCCACAGGCTTCTACCCCGACCACGTGGAGCTGAGCTGGTGGGTGAATGGGAAGGAGGTGCACAGTGGGGTCAGCACAGACCCGCAGCCCCTCAAGGAGCAGCCCGCCCTCAATGACTCCAGATACTGCCTGAGCAGCCGCCTGAGGGTCTCGGCCACCTTCTGGCAGAACCCCCGCAACCACTTCCGCTGTCAAGTCCAGTTCTACGGGCTCTCGGAGAATGACGAGTGGACCCAGGATAGGGCCAAACCCGTCACCCAGATCGTCAGCGCCGAGGCCTGGGGTAGAGCAGACTGTGGCTTCACCTCCGAGTCTTACCAGCAAGGGGTCCTGTCTGCCACCATCCTCTATGAGATCTTGCTAGGGAAGGCCACCTTGTATGCCGTGCTGGTCAGTGCCCTCGTGCTGATGGCCATGGTCAAGAGAAAGGATTCCAGAGGCTAG(SEQ ID NO:10;GenBank:L34740.1)。

  例示性小鼠TCRβ链1恒定区具有以下氨基酸序列:

  EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGKEVHSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAEAWGRADCGITSASYQQGVLSATILYEILLGKATLYAVLVSTLVVMAMVKRKNS(SEQ ID NO:11;UniProtKB:P01852)

  其由以下核酸序列编码:

  GAGGATCTGAGAAATGTGACTCCACCCAAGGTCTCCTTGTTTGAGCCATCAAAAGCAGAGATTGCAAACAAACAAAAGGCTACCCTCGTGTGCTTGGCCAGGGGCTTCTTCCCTGACCACGTGGAGCTGAGCTGGTGGGTGAATGGCAAGGAGGTCCACAGTGGGGTCAGCACGGACCCTCAGGCCTACAAGGAGAGCAATTATAGCTACTGCCTGAGCAGCCGCCTGAGGGTCTCTGCTACCTTCTGGCACAATCCTCGCAACCACTTCCGCTGCCAAGTGCAGTTCCATGGGCTTTCAGAGGAGGACAAGTGGCCAGAGGGCTCACCCAAACCTGTCACACAGAACATCAGTGCAGAGGCCTGGGGCCGAGCAGACTGTGGGATTACCTCAGCATCCTATCAACAAGGGGTCTTGTCTGCCACCATCCTCTATGAGATCCTGCTAGGGAAAGCCACCCTGTATGCTGTGCTTGTCAGTACACTGGTGGTGATGGCTATGGTCAAAAGAAAGAATTCATGA(SEQ ID NO:12;GenBank:FJ188408.1)。

  例示性小鼠TCRβ链2恒定区具有以下氨基酸序列:

  EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGKEVHSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAEAWGRADCGITSASYHQGVLSATILYEILLGKATLYAVLVSGLVLMAMVKKKNS(SEQ ID NO:13;UniProtKB:P01851)

  其由以下核酸序列编码:

  GAGGATCTGAGAAATGTGACTCCACCCAAGGTCTCCTTGTTTGAGCCATCAAAAGCAGAGATTGCAAACAAACAAAAGGCTACCCTCGTGTGCTTGGCCAGGGGCTTCTTCCCTGACCACGTGGAGCTGAGCTGGTGGGTGAATGGCAAGGAGGTCCACAGTGGGGTCAGCACGGACCCTCAGGCCTACAAGGAGAGCAATTATAGCTACTGCCTGAGCAGCCGCCTGAGGGTCTCTGCTACCTTCTGGCACAATCCTCGAAACCACTTCCGCTGCCAAGTGCAGTTCCATGGGCTTTCAGAGGAGGACAAGTGGCCAGAGGGCTCACCCAAACCTGTCACACAGAACATCAGTGCAGAGGCCTGGGGCCGAGCAGACTGTGGAATCACTTCAGCATCCTATCATCAGGGGGTTCTGTCTGCAACCATCCTCTATGAGATCCTACTGGGGAAGGCCACCCTATATGCTGTGCTGGTCAGTGGCCTGGTGCTGATGGCCATGGTCAAGAAAAAAAATTCCTGA(SEQ ID NO:14;GenBank:U46841.1)。

  在一些情况下,免疫细胞受体谱系文库可以包括BCR谱系文库。BCR复合物是在B细胞的表面上发现且包括膜结合的免疫球蛋白(即抗体)结合部分,其包括重链和轻链,每条链含有恒定(C)和可变(V)区。BCR的免疫球蛋白链通过二硫键结合于信号转导CD79A/B链。BCR的免疫球蛋白链可以是各种同型,包括IgD、IgM、IgA、IgG或IgE。类似于TCR,BCR的免疫球蛋白部分进行V(D)J重组以在群体内产生巨大的多样性。

  在一些情况下,免疫细胞受体谱系文库可以包括BCR谱系文库,其中例如BCR谱系文库可以包括BCR免疫球蛋白链序列(包括例如IgD、IgM、IgA、IgG或IgE链序列)。主题BCR谱系文库的免疫球蛋白链序列可以包括全长免疫球蛋白链序列(例如全长重链序列、全长轻链序列)或部分免疫球蛋白序列(例如部分重链序列、部分轻链序列)。

  在主题BCR谱系文库成员包括部分免疫球蛋白链序列的情况下,部分免疫球蛋白链序列可以包括整个或基本上整个免疫球蛋白可变区(例如免疫球蛋白轻链可变区、免疫球蛋白重链可变区)。在一些情况下,所得文库成员包括免疫球蛋白可变区和至少免疫球蛋白恒定区的一部分。在一些情况下,所得文库成员包括与免疫球蛋白重链和/或轻链5’mRNA末端相对应的序列。在一些情况下,所得文库成员包括从免疫球蛋白重链或轻链5’末端到至少相对应的免疫球蛋白链恒定区的一部分的序列。

  在某些实施方案中,免疫细胞特异性文库的制备可以包括BCR特异性扩增(包括例如免疫球蛋白链特异性扩增)。此类免疫球蛋白特异性扩增可以利用免疫球蛋白特异性引物。“免疫球蛋白特异性引物”意指与免疫球蛋白链(例如免疫球蛋白重链、免疫球蛋白轻链)核酸序列的区域或其互补区域特异性杂交的引物。在一些情况下,免疫球蛋白特异性引物可以只与一种类型免疫球蛋白链杂交,例如只与免疫球蛋白重链、只与免疫球蛋白轻链、只与IgD链、只与IgM链、只与IgA链、只与IgG链、只与IgE链等杂交。

  免疫球蛋白特异性引物可以被设计成能与免疫球蛋白重链恒定区或其互补区域特异性杂交。举例来说,在一些情况下,免疫球蛋白特异性引物可以与哺乳动物免疫球蛋白重链恒定区或其互补区域,包括例如人免疫球蛋白重链恒定区、小鼠免疫球蛋白重链恒定区等等杂交。

  免疫球蛋白特异性引物可以被设计成能与免疫球蛋白轻链恒定区或其区域特异性杂交。举例来说,在一些情况下,免疫球蛋白特异性引物可以与哺乳动物免疫球蛋白轻链恒定区或其互补区域,包括例如人免疫球蛋白轻链恒定区、小鼠免疫球蛋白轻链恒定区等等杂交。

  在文库制备期间进行的扩增,包括例如免疫受体特异性扩增,可以单轮进行,或可以采用多轮扩增。举例来说,在一些情况下,在第一轮扩增后,可以将在第一轮中不利用的一种或多种扩增引物添加至反应混合物,以推动使用第一轮扩增的产物作为核酸模板的第二轮扩增。在一些情况下,第二轮或随后数轮扩增可以包括嵌套式扩增,即其中第二轮或随后数轮扩增中利用的引物结合位点在第一轮扩增中产生的产物内(即距离3’或5’末端一个或多个核苷酸)。在采用的情况下,嵌套程度将依照所需变化,包括例如其中第二或随后引物结合位点为距离在第一轮扩增中产生的扩增子的3’或5’末端一个或多个,包括2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、15个或更多个、20个或更多个核苷酸等等。

  在一些情况下,第二轮或随后数轮扩增不会嵌套进行,包括其中第二轮扩增利用在前一轮扩增或中利用的一个或多个引物结合位点或在前一轮扩增期间添加的引物结合位点(例如作为未模板化序列的一部分添加的引物结合位点)。在一些情况下,第二轮或随后一轮扩增可以在一个末端利用嵌套式引物扩增位点并在另一末端利用非嵌套式扩增位点(例如先前使用的引物结合位点或添加的引物结合位点),包括其中嵌套位点在扩增子的3’末端或扩增子的5’末端处。

  在指定的文库扩增步骤后,所制备的文库可以视为准备好进行测序。在某些实施方案中,所提供的方法还可以包括使所制备的免疫细胞受体谱系文库进行NGS方案。所述方案可以在任何合适的NGS测序平台上进行。所关注的NGS测序平台包括(但不限于)由提供的测序平台(例如HiSeqTM、MiSeqTM和/或NextSeqTM测序系统);IonTorrentTM(例如the Ion PGMTM和/或Ion ProtonTM测序系统);Pacific Biosciences(例如PACBIO RS II Sequel测序系统);Life TechnologiesTM(例如SOLiD测序系统);Roche(例如454GS FLX+和/或GS Junior测序系统);或所关注的任何其它测序平台。NGS方案将视所采用的具体的NGS测序系统而变。用于对NGS文库进行测序的详细方案可从所采用的NGS测序系统的制造商获得,例如所述方案可以包括进一步扩增(例如固相扩增)、对扩增子进行测序以及对测序数据进行分析。

  单细胞、反应容器和液滴

  如以上概述,在一些情况下,RNA样品可以源自于单细胞以产生一个或多个如本文所述的文库。然后此类“单细胞文库”可以用于进一步下游应用,例如测序应用。如本文所用,“单细胞”是指一种细胞。适用作模板RNA的来源和/或可用于产生单细胞文库,例如表达文库和/或免疫细胞受体谱系文库的单细胞可以从所关注的组织或活组织检查、血液样品或细胞培养物获得。另外,可以从特定器官、组织、肿瘤、赘生物等获得细胞并用于本文所述的方法中。

  用于此类方法中的单细胞可以通过任何合宜的方法获得。举例来说,在一些情况下,单细胞可以通过细胞样品的有限稀释来获得。在一些情况下,本发明的方法可以包括获得单细胞的步骤。可以使用本领域中已知的标准方法获得单细胞悬浮液,所述标准方法包括例如以酶促方式使用胰蛋白酶或木瓜蛋白酶消化蛋白质、连接组织样品中的细胞或释放培养的粘附细胞,或机械分离样品中的细胞。单细胞可以放在其中可以个别地处理单细胞的任何合适的反应容器中。例如96孔板、384孔板或具有许多个孔,例如2000个、4000个、6000个或10000个或更多个孔的平板。多孔板可以是芯片和/或装置的一部分。本公开不受多孔板中孔的数目限制。在多个实施方案中,板上孔的总数为100至200,000,或5000至10,000。在其它实施方案中,板包含较小芯片,每个芯片包括5,000至20,000个孔。举例来说,正方形芯片可以包括172×72个纳米孔,直径为0.1mm。

  在一些情况下,单细胞可以通过使用细胞分选器分选细胞样品来获得。如本文所用的“细胞分选器”意指允许个别细胞分选至适当容器中进行后续过程,例如如本文所述的文库制备的那些过程的任何仪器。

  适用的细胞分类器包括流式细胞仪,例如用于荧光活化细胞分选(FACS)的那些仪器。流式细胞术是一种众所周知的使用多参数数据的方法,用于鉴定和区别流体介质中的不同粒子(例如细胞)类型,即在标记(波长、强度)、尺寸等方面彼此不同的粒子。在以流式细胞术分析样品时,样品的等分试样首先被引入流式细胞仪的流径中。当在流径中时,样品中的细胞基本上一次一个通过一个或多个传感区域,其中每个细胞分别个别地暴露于单波长下的光源(或在一些情况下两个或更多个不同的光源),且依照要求,分别记录每个细胞的散射和/或荧光参数的量测。对所记录的有关每个细胞的数据实时分析或存储在例如计算机等数据存储和分析装置中,以供依照要求进行后面分析。

  使用流式细胞仪分选的细胞可以被分到共同的容器(即单个管)中,或可以分别被分到个别容器。举例来说,在一些情况下,细胞可以被分到多孔板的个别孔中,如下所述。

  根据某些实施方案,细胞分选可以包括细胞分析和/或鉴定的上游过程,有时也称为表型分析。举例来说,在一些情况下,细胞样品的细胞可以被FACS分选鉴定为具有具体的表型特征(表面标志物表达、活力、形态、基因表达、细胞因子表达等)并基于所述特征被选用于进一步加工。举例来说,在一些情况下,细胞样品的细胞可以基于表达一种或多种免疫细胞标记物,包括例如T细胞标记物、B细胞标记物等等进行分选,并收集用于进一步下游过程。在一个实例中,T细胞可以基于一种或多种T细胞表面标志物(例如CD4、CD8等)的表达进行选择且可以收集T细胞以供进一步加工。在一些情况下,所收集的细胞(例如通过FACS分选)可以在如本文所述的包括文库制备的进一步加工前再分布至单细胞样品中。

  适用的细胞分选器还包括不采用流式细胞术的基于多孔的系统。此类基于多孔的系统基本上包括其中细胞可以通过任何合宜的方式,包括例如通过使用泊松分布(即限制稀释)、统计资料(例如多样品纳米分配(MSND)系统)、细胞的个别放置(例如通过手工细胞挑选或使用机器人臂或移液器分配)沉淀至多孔容器的个别孔中的任何系统。在一些情况下,适用的多孔系统包括多孔晶片或芯片,其中细胞沉淀至孔或晶片/芯片中并被微观分析系统个别地鉴定。在一些情况下,自动化微观分析系统可以结合多孔晶片/芯片使用,以自动鉴定个别细胞进行如本文所述的下游分析,包括文库制备。

  在一些情况下,一个或多个细胞可以被分选至或以其它方式转移至适当的反应容器,其中此类容器包括足以执行如本文所述的文库制备的一个或多个方面的容器。反应组分可以添加至反应容器,包括例如用于制备RNA样品的组分、用于产生产物双股cDNA的组分、一个或多个文库制备反应的组分等。反应混合物和其组分可以加入且内部可以发生主题方法的反应的反应容器将变化。适用的反应容器包括但不限于例如管(例如单管、多管条等)、孔(例如多孔板(例如96孔板、384孔板或具有许多个孔,例如2000个、4000个、6000个或10000个或更多个孔的平板)。多孔板可以是独立的或可以是芯片和/或装置的一部分。

  在一些情况下,反应混合物和其组分可以添加至液滴(例如油包水乳液液滴)中,且主题方法的反应可以在其中进行,例如如以下更详细描述。尽管液滴可以充当个别反应容器,液滴(或含有液滴的乳液)一般容纳在合适容器,例如管或孔或微流体通道中。可以例如基于荧光(例如来自核酸检测试剂或标记探针),使用基于荧光的液滴分选器,分选在液滴中进行的扩增反应适用的基于荧光的液滴分选器将变化且可以包括例如流式细胞仪、基于微流体的液滴分选器等等。

  如上所指出,在包括汇集步骤的方案中,汇集步骤可以在由单细胞、液滴、孔等产生产物双股cDNA后进行。因而,在本文所述的方法的某些实施方案中,细胞从所关注的组织(例如血液)获得并获得单细胞悬浮液。单细胞置于多孔板的一个孔或例如微流体室或管等其它合适的容器中。使细胞溶解且将反应组分直接添加至溶解产物。无论是否汇集单细胞样品,都可以对所产生的文库进行测序以产生读数。此可以允许鉴定在每个单细胞中表达的基因。

  在本文所述的方法的某些实施方案中,获得液滴且将单个液滴分选至多孔板的一个孔或例如微流体室或管等其它合适容器中。反应混合物可以直接添加至液滴,例如不进行额外纯化。

  在一些情况下,方法可以包括获得单个液滴的步骤。可以根据任何合宜的方案,包括例如机械分选液滴(例如利用基于荧光的分选器(例如流式细胞仪或基于微流体的分选器)获得液滴细胞。单个液滴可以放在其中可以个别地处理单个液滴的任何合适的反应容器中。例如96孔板、384孔板或具有许多个孔,例如2000个、4000个、6000个或10000个或更多个孔的平板。多孔板可以是芯片和/或装置的一部分。本公开不受多孔板中孔的数目限制。在多个实施方案中,板上孔的总数为100至200,000,或5000至10,000。在其它实施方案中,板包含较小芯片,每个芯片包括5,000至20,000个孔。举例来说,正方形芯片可以包括72×72个或125×125个纳米孔,直径为0.1mm。

  多孔板中的孔(例如纳米孔)可以制造成任何合宜的尺寸、形状或体积。孔可以是100μm至1mm长,100μm至1mm宽,以及100μm至1mm深。在多个实施方案中,每个纳米孔具有1至4的纵横比(深度与宽度的比率)。在一个实施方案中,每个纳米孔具有2的纵横比。横剖面面积可以是圆形、椭圆形、卵形、圆锥形、矩形、三角形、多面体或任何其它形状。在孔的任何给定深度的横截面积也可以在尺寸和形状上变化。

  在某些实施方案中,孔具有0.1nl至1μl的体积。纳米孔可以具有1μl或更少的体积,例如500nl或更少。体积可以是200nl或更少,例如100nl或更少。在一个实施方案中,纳米孔的体积是100nl。需要时,可以将纳米孔制造成表面积与体积比增加,从而便于热传递通过此单元,这样可以减少热循环的升温时间。每个孔(例如纳米孔)的腔可以采取多种构型。举例来说,孔内的腔可以被线型壁或曲壁分隔,以形成分开但相邻的隔室,或被圆形壁分隔,以形成内部和外部环状隔室。

  孔可以被设计成单个孔包括单细胞或单个液滴。个别细胞或液滴还可以被分离在例如微流体室、液滴、纳米孔、管等任何其它的合适容器中。可以采用任何合宜的用于操控单细胞或单个液滴的方法,其中此类方法包括荧光活化的细胞分选(FACS)、机器人装置注射、重力流或显微操作以及使用半自动化的细胞拣选机(例如来自Stoelting Co.的QuixellTM细胞传输系统)等。在一些情况下,根据泊松统计,单细胞或单个液滴可以沉淀在平板的孔中(例如使得近似10%、20%、30%或40%或更多的孔含有单细胞或单个液滴-所述数字可以通过调整分配至容器中的给定单位体积的液体中细胞或液滴的数目来界定)。在一些情况下,合适的反应容器包含液滴(例如微滴)。可以例如基于可通过显微镜观察检测的特征,例如位置、形态、报告基因的存在(例如表达)、结合抗体的存在(例如抗体标记)、FISH、RNA的存在(例如细胞内RNA标记)或qPCR,对个别细胞或液滴个别地选择。

  在例如如上所述,获得所需细胞群体或单细胞后,核酸可以通过溶解细胞从细胞释放。溶解可以通过例如加热或冻融细胞,或通过使用清洁剂或其它化学法,或通过这些方法的组合来实现。然而,可以使用任何合适的溶解方法。在一些情况下,宜使用轻度溶解程序以防止核染色质释放,从而避免cDNA文库的基因组污染,并将mRNA的降解降到最低。举例来说,在Tween-20存在下在72℃下加热细胞2分钟足以使细胞溶解,同时未检测到来自核染色质的基因组污染。可替代地,细胞可以在水中加热至65℃,保持10分钟(Esumi等人,Neurosci Res 60(4):439-51(2008));或在补充有0.5%NP-40的PCR缓冲液II(AppliedBiosystems)中加热至70℃,保持90秒(Kurimoto等人,Nucleic Acids Res 34(5):e42(2006));或溶解可以用例如蛋白酶K或通过使用高离液盐,例如异硫氰酸胍蛋白酶实现(美国公布No.2007/0281313)。

  需要时,给定单细胞或液滴工作流程可以包括汇集步骤,其中将例如由产物双股cDNA组成的核酸产物组合物与从一个或多个其它细胞或液滴获得的核酸产物组合物组合或汇集。在此类实施方案中组合或汇集的由不同细胞或液滴产生的不同核酸产物组合物的数目可以变化,其中在一些情况下数值范围在2至50,例如3至25,包括4至20或10,000或更多。

  在一些实施方案中,采用多样品纳米分配器(MSND)系统,其包括例如呈可访问的纳米孔阵列形式的多孔板和样品分配器。此类MSND系统的一实例是单细胞MSND系统(Wafergen,Fremont,Ca)。 MSND系统的细节进一步见美国专利No.7,833,709和8,252,581,以及公布的美国专利申请公布No.2015/0362420和2016/0245813,其公开内容以引用的方式并入本文中。

  标签化

  如以上概述,在一些情况下,所提供的方法可以包括末端捕捉所产生的产物双股cDNA的一个或多个末端。在某些实施方案中,此类末端捕捉可以利用标签化反应,所述标签化反应可以采用一种或多种标签化反应组分。所采用的标签化过程将变化且可以包括例如通过标签化反应的5’末端捕捉、通过标签化反应的3’末端捕捉或其组合。

  在存在于所提供的方法中的情况下用于标签化中的转座体可以包括转座酶和转座子核酸,所述转座子核酸包括转座子末端结构域和标签化后PCR引物结合域。这些结构域在功能上进行界定,因此可以是在相同序列中或可以是不同的序列,根据研究人员的需要。结构域也可以重叠,使得标签化后PCR引物结合域的一部分可以存在于转座子末端结构域中。

  “转座酶”意指能够与含有转座子末端结构域的组合物(例如转座子、转座子末端、转座子末端组合物)形成功能复合物并催化含有转座子末端的组合物插入或易位至在体外易位反应中一起培育的双股靶DNA中的酶。可用于实施所提供的方法的转座酶包括(但不限于)Tn5转座酶、Tn7转座酶和μ转座酶。转座酶可以是野生型转座酶。在其它方面,转座酶包括一种或多种修饰(例如氨基酸取代)以提高转座酶的性质,例如增强转座酶的活性。举例来说,已经研发出在Tn5蛋白质中具有取代突变(例如E54K、M56A和L372P)的Tn5转座酶的过度活性突变体,且描述于例如Picelli等人(2013)Genome Research 24:2033-2040中。

  术语“转座子末端结构域”意指只由与在体外易位反应中发挥功能的转座酶或整合酶形成复合物所需的核苷酸序列(“转座子末端序列”)组成的双股DNA。转座子末端结构域与转座酶或整合酶形成“复合物”或“突触复合物”或“转座体复合物”或“转座体组合物”,其识别且结合于转座子末端结构域且所述复合物能够将转座子末端结构域插入或易位至在体外易位反应中一起孵育的靶DNA中。转座子末端结构域展现由“转移的转座子末端序列”或“转移股”和“非转移的转座子末端序列”或“非转移股”组成的两个互补序列。举例来说,与在体外易位反应中具有活性的过度活性Tn5转座酶(例如EZ-Tn5转座酶,EPICENTREBiotechnologies,Madison,Wis.,USA)形成复合物的一个转座子末端结构域包括展现如下“转移的转座子末端序列”的转移股:5'AGATGTGTATAAGAGACAG 3'(SEQ ID NO:15);和展现如下“非转移的转座子末端序列”的非转移股:5'CTGTCTCTTATACACATCT 3'(SEQ ID NO:16)。在体外易位反应中转移股的3'末端连接至或转移至靶DNA。展现与转移的转座子末端序列互补的转座子末端序列的非转移股在体外易位反应中不连接至或转移至靶DNA。在实施所提供的方法时采用的具体的转座子末端结构域的序列将视所采用的具体的转座酶而变。举例来说,Tn5转座子末端结构域当与Tn5转座酶一起使用时可以包括在转座子核酸中。关于可以用于本发明的转座体中的转座酶和转座子末端结构域的更多细节包括(但不限于):美国专利No.9,040,256、9,080,211、9,080,211和9,115,396中所述的转座酶和转座子末端结构域;其中公开内容以引用的方式并入本文中。

  除转座子末端结构域外,转座子核酸还包括标签化后引物结合域。在一些情况下,随后标签化后引物结合域可以用于扩增反应中,所述扩增反应添加测序平台接头构建体结构域(例如通过使用与标签化后引物结合域杂交且连接有测序平台接头构建体结构域的引物)。在一些情况下,标签化后引物结合域可以包括测序平台接头构建体结构域。

  在标签化或随后且视标签化而定的扩增期间添加的测序平台接头构建体结构域将变化。此类测序平台接头构建体可以是选自以下结构域的核酸结构域:特异性结合于通过表面连接的测序平台寡核苷酸(例如测序系统中连接于流动池的表面的P5或P7寡核苷酸)的结构域(例如“捕捉位点”或“捕捉序列”);测序引物结合域(例如平台的读数1或读数2引物可以结合的结构域);条型码结构域(例如通过用特定的条型码或“标签”印记每个分子来独特地鉴定所测序的核酸的样品来源以使样品能多路复用的结构域)、条型码测序引物结合域(用于对条型码进行测序的引物结合的结构域)、分子鉴定结构域或此类结构域的任何组合。

  如图4中所描绘,产物双股cDNA经受标签化,所述标签化使用包括转座酶和转座子核酸的转座体,所述转座子核酸包括转座子末端结构域和第二标签化后PCR引物结合域。。在此实例中,使用包括Tn5转座酶和 TnRP1或TnRP2序列的转座体(图4)。

  应了解图4呈现的例示性的标签化介导的末端捕捉方法可以有许多变体。代替捕捉RNA的3’末端,例如所述方法可以用于捕捉RNA的5’末端。5’末端捕捉可以例如通过将标签化后PCR引物结合域(例如RP2序列)合并至模板转换寡核苷酸,而非将此类结构域合并至第一股cDNA引物中来进行。根据此变体,可以使用结合于最初在模板转换寡核苷酸中存在的标签化后PCR引物结合域的扩增引物连同结合于例如在标签化步骤期间添加的TnRP1或TnRP2序列的扩增引物进行标签化后扩增。

  在另一个变体中,不是使用两种类型转座体(例如以上实例中所采用的TnRP1或TnRP2转座体),而是可以采用单一类型转座体(具有单一类型的标签化后PCR引物结合域)。所需标签化产物的扩增可以使用结合于由转座体提供的单一类型标签化后PCR引物结合域的引物连同在较早步骤期间(例如第一股合成或双股产物核酸的扩增等)已经添加的结合于标签化后PCR引物结合域的引物进行。

  作为非限制性实例,在产物双股cDNA分割为两个反应后,可以在产物双股cDNA上进行标签化,从而将TnRP1序列引入产物双股cDNA标签化的5’末端。此实例的一实施方案描绘于以下更详细地描述的图5中。如图5所示,标签化将转座子序列(例如“TnRP1”)添加至所捕捉的5’产物双股cDNA的3’末端。在随后步骤中,所添加的转座子序列用作所捕捉的5’产物双股cDNA的扩增中的引物结合位点。具体地说,在所描绘的实例中,与在模板转换反应中添加的序列杂交的第一引物(“5’末端捕捉引物1”)和结合“Tn读数1”序列的第二引物(“5’末端捕捉引物2”)用于扩增所捕捉的5’产物双股cDNA,同时添加制备用于NGS的文库所必需的测序平台接头构建体结构域。

  在一些情况下,例如在由转座酶的核酸酶活性引起的双股核酸的新建立的末端处结合于所引入的转座子序列的引物可以称为末端扩增引物。在这里,此类末端扩增引物可以用以从标签化产生的末端例如扩增至主题RNA的原始末端。举例来说,在一些情况下,扩增反应可以采用末端扩增引物和从双股cDNA的5’末端(即与RNA的原始5’末端相对应的末端)扩增的第二引物。在一些情况下,扩增反应可以采用末端扩增引物和从双股cDNA的3’末端(即与RNA的原始3’末端相对应的末端)扩增的第二引物。

  其它变体包括例如用来自例如以下的测序系统所需的测序结构域替换各种引物/寡核苷酸中的特异性测序结构域:Ion TorrentTM(例如Ion PGMTM及IonProtonTM测序系统);Pacific Biosciences(例如PACBIO RS II测序系统);LifeTechnologiesTM(例如SOLiD测序系统);Roche(例如454GS FLX+和GS Junior测序系统);或所关注的任何其它测序平台。

  在其它变体中,不是使用一种或两种类型的转座体(例如以上实例中所用的TnRP1或TnRP2转座体),而是可以采用3种或更多种不同类型的转座体用于标签化。举例来说,可以采用3种或更多种、4种或更多种、5种或更多种、6种或更多种、7种或更多种、8种或更多种、9种或更多种、10种或更多种、20种或更多种、50种或更多种或100种或更多种不同类型的具有不同的标签化后PCR引物结合域的转座体。此类标签化样品中所关注的标签化产物可以使用结合于具体类型的转座体的标签化后PCR引物结合域的引物连同在较早步骤期间(例如第一股合成或双股产物核酸的扩增等)已经添加的结合于标签化后PCR引物结合域的引物进行。

  当需要制备转座体用于标签化步骤时,可以使用任何合适的转座体制备方法,且此类方法可以视例如采用的特定转座酶和转座子核酸而变。举例来说,转座子核酸和转座酶可以依合适的摩尔比率(例如2:1摩尔比率、1:1摩尔比率、1:2摩尔比率等)在合适的缓冲液中一起孵育。根据一个实施方案,当转座酶是Tn5转座酶时,制备转座体可以包括转座酶和转座子核酸以1:1摩尔比率在2x Tn5透析缓冲液中孵育充足的时间段,例如1小时。

  标签化产物双股cDNA包括使双股cDNA与转座体在标签化条件下接触。此类条件可以视采用的具体转座酶而变。典型地,条件将包括转座体和标签化的延伸产物在缓冲反应混合物(例如经Tris-乙酸盐缓冲的反应混合物等等)中在7至8的pH值、例如pH 7.5下孵育。可以提供转座体,使得相对于标签化的延伸产物存在约摩尔同等或摩尔过量的转座子。合适的温度包括32℃至42℃,例如37℃。使反应进行充足的时间量,例如5分钟至3小时。反应可以通过添加溶液(例如“终止”溶液)终止,所述溶液可以包括一定量的SDS和/或适于终止反应的的其它转座酶反应终止试剂。可利用用于使用转座体实现核酸碎裂的方案和材料,且包括例如从EPICENTRE Biotechnologies(Madison,Wis.,USA)获得的EZ-Tn5TM易位试剂盒中提供的方案和材料。

  然后所得到的标签化样品经受PCR扩增条件,使用一种或多种标签化后PCR引物,所述引物与在标签化反应期间添加的一种或多种标签化后引物结合位点杂交。标签化后引物可以包括测序平台接头结构域。测序平台接头构建体可以包括本文中其它地方描述的任一核酸结构域(例如特异性结合于通过表面连接的测序平台寡核苷酸的结构域、测序引物结合域、条型码结构域、条型码测序引物结合域、分子鉴定结构域或其任何组合)。此类实施方案可用于例如如下情况:标签化样品的核酸不包括在所关注的测序平台中进行测序时所适用或所必需的所有接头结构域,且其余接头结构域由用于扩增标签化样品的核酸的引物来提供。

  模板转换逆转录

  如以上概述,本发明的方法的方面可以包括使用模板转换逆转录反应。举例来说,在一些情况下,主题方法可以包括使用模板转换逆转录反应由核酸样品产生产物双股cDNA。因此,在一些情况下,在双股cDNA分割为可以分别用于制备一种或多种文库,例如表达文库和/或免疫细胞受体谱系文库的分开的反应混合物前,可以使用模板转换逆转录反应由模板核酸产生双股cDNA。

  模板转换逆转录反应一般将包括产生产物双股cDNA的模板核酸。产生模板核酸的来源和/或方法将变化。模板核酸可以存在于模板核酸组合物(例如界定的组合物)或生物样品(例如从活生物体和/或活细胞获得或含有活生物体和/或活细胞的样品)。含有模板核酸的生物样品可以通过任何合宜的方式制备,以使样品的核酸可以用于本文中所述的方法的组分(例如引物、寡核苷酸等)。

  制备含有模板核酸的生物样品的方法将变化。适用的方法可以包括但不限于例如将样品均质化、使样品的一种或多种细胞类型溶解、使样品富集所需核酸、除去样品中存在的一种或多种组分(例如蛋白质、脂质、污染核酸)、进行核酸分离以分离模板核酸等等。在一些情况下,生物样品的细胞可以通过溶解样品细胞来制备。用于溶解细胞的适用方法包括但不限于例如化学溶解、酶促溶解、机械溶解、冷冻/解冻溶解等等。在一些情况下,样品的细胞可以在从细胞或样品的细胞获得的模板核酸用于如本文所述的方法中前不固定。在一些情况下,样品的细胞可以在从细胞或样品的细胞获得的模板核酸用于如本文所述的方法中前固定。

  主题公开内容的模板核酸可以含有具有不同序列的多个不同模板核酸。模板核酸(例如模板RNA、模板DNA等等)可以是任何长度的聚合物。虽然聚合物的长度可以变化,但在一些情况下聚合物是10nt或更长、20nt或更长、50nt或更长、100nt或更长、500nt或更长、1000nt或更长、2000nt或更长、3000nt或更长、4000nt或更长、5000nt或更长或更多nts。在某些方面,模板核酸是聚合物,其中基于聚合物的数目可以变化,且在一些情况下是10nt或更少、20nt或更少、50nt或更少、100nt或更少、500nt或更少、1000nt或更少、2000nt或更少、3000nt或更少、4000nt或更少或5000nt或更少、10,000nt或更少、25,000nt或更少、50,000nt或更少、75,000nt或更少、100,000nt或更少。

  根据某些实施方案,模板核酸是模板核糖核酸(模板RNA)。模板RNA可以是任何类型RNA(或其亚型),包括(但不限于)信使RNA(mRNA)、微型RNA(miRNA)、小干扰RNA(siRNA)、顺式作用小干扰RNA(ta-siRNA)、天然小干扰RNA(nat-siRNA)、核蛋白体RNA(rRNA)、转移RNA(tRNA)、小核仁RNA(snoRNA)、小核RNA(snRNA)、长非编码RNA(lncRNA)、非编码RNA(ncRNA)、转移信使RNA(tmRNA)、前驱信使RNA(pre-mRNA)、小型卡哈尔体特异性RNA(scaRNA)、piwi相互作用RNA(piRNA)、核糖核酸内切酶制备的siRNA(esiRNA)、小型短暂RNA(stRNA)、信号识别RNA、端粒RNA、核糖酶或其RNA类型或其亚型的任何组合。

  给定模板核酸组合物中具有不同序列的不同模板核酸的数目可以变化。虽然给定模板核酸组合物中不同模板核酸的数目可以变化,但在一些情况下,给定模板核酸组合物中不同模板核酸的数目在1至108,例如1至107,包括1至105范围内。

  用于此类方法中的模板核酸组合物可以是任何合适的核酸样品。包括模板核酸的核酸样品可以以足以产生产物核酸的量组合成反应混合物。根据一个实施方案,核酸样品组合成反应混合物,使得反应混合物中核酸的最终浓度为1fg/μL至10μg/μL,例如1pg/μL至5μg/μL,例如0.001μg/μL至2.5μg/μL,例如0.005μg/μL至1μg/μL,例如0.01μg/μL至0.5μg/μL,包括0.1μg/μL至0.25μg/μL。在某些方面,从单细胞分离包括模板核酸的核酸样品,例如如以下更详细地描述。在其它方面,包括模板核酸的核酸样品从2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个、20个或更多个、50个或更多个、100个或更多个或500个或更多个细胞分离。根据某些实施方案,包括模板核酸的核酸样品从500个或更少、100个或更少、50个或更少、20个或更少、10个或更少、9个、8个、7个、6个、5个、4个、3个或2个细胞分离。

  模板核酸可以存在于所关注的任何核酸样品中,包括但不限于从单细胞、多个细胞(例如培养细胞)、组织、器官或生物体(例如小鼠、大鼠等等)分离的核酸样品。在某些方面,核酸样品从哺乳动物(例如人、啮齿动物(例如小鼠)或所关注的任何其它哺乳动物)的细胞、组织、器官等等分离。在其它方面中,核酸样品从除哺乳动物以外的来源,例如两栖动物(例如蛙(例如非洲蟾蜍属(Xenopus)))、鱼(斑马鱼(斑马鱼(Danio rerio))或任何其它非哺乳动物核酸样品来源分离。

  本领域中已知用于从此类来源分离核酸的方法、试剂和试剂盒。举例来说,可利用用于从所关注的来源分离核酸的试剂盒,例如Takara Bio USA公司(Mountain View,CA)的基因组DNA或RNA分离试剂盒。在某些方面,核酸从固定生物样品,例如福尔马林固定的石蜡包埋(FFPE)的组织分离。来自FFPE组织的核酸可以使用市售试剂盒,例如Takara Bio USA公司(Mountain View,CA)的 FFPE DNA或RNA分离试剂盒分离。

  图3中图示模板转换反应的一般描绘。在所示实例中,单产物核酸引物(300)与模板核酸(301)通过所述单产物核酸引物和模板享有的互补序列(由“XXXX”表示)杂交。单产物核酸引物可以但不一定包括不与模板互补(例如未模板化)的其它序列区域(302)。在单产物核酸引物与模板退火粘接后,通过使用逆转录酶,进行逆转录(303),产生与模板互补的单产物核酸股(304)。具有末端转移酶活性的逆转录酶将未模板化核苷酸转移至所产生的单产物核酸(由“YYY”表示)且模板转换寡核苷酸(305)与单产物核酸的未模板化核苷酸通过模板转换寡核苷酸上的互补核苷酸的序列(也由“YYY”表示且本文中又称为3'杂交结构域)杂交。模板转换寡核苷酸包括不与未模板化核苷酸杂交的其它序列(306)。发生模板转换(307),其中逆转录酶从模板转换,利用模板转换寡核苷酸作为第二模板,将其它序列(306)转录以产生其互补序列(308)。现在完全产生的单产物核酸股(309)包括单产物核酸引物的完整序列,包括不与模板、模板的互补序列和模板转换寡核苷酸的互补序列杂交的任何其它序列(302)(如果存在)。美国专利No.9,410,173中也描述了与模板转换相关的方法和试剂;其公开内容以引用的方式整体并入本文中。

  模板转换寡核苷酸

  模板转换逆转录反应可以利用模板转换寡核苷酸。“模板转换寡核苷酸”意指在核酸聚合反应期间聚合酶从初始模板(例如模板核酸(例如RNA模板))转换成的寡核苷酸模板。关于此,模板可以称为“供体模板”,且模板转换寡核苷酸可以称为“接受体模板”。如本文所用,“寡核苷酸”是具有2个至500个核苷酸,例如2个至200个核苷酸的单股核苷酸多聚体。寡核苷酸可以是合成的或者可以在酶催化下制造,且在一些实施方案中,10个至50个核苷酸长。寡核苷酸可以含有核糖核苷酸单体(即可以是寡核糖核苷酸或“RNA寡核苷酸”)或脱氧核糖核苷酸单体(即可以是寡脱氧核糖核苷酸或“DNA寡核苷酸”)。寡核苷酸可以为例如10至20个、21至30个、31至40个、41至50个、51-60个、61至70个、71至80个、80至100个、100至150个或150至200个、至多500个或更多个核苷酸长。

  模板转换逆转录反应可以利用合适的反应混合物。适用于模板转换逆转录反应的反应混合物可以包括浓度足以轻易允许聚合酶从模板经过模板转换至模板转换寡核苷酸以及模板转换寡核苷酸通过聚合酶以任何其它序列(如果存在)模板化进行进一步伸长的模板转换寡核苷酸。举例来说,模板转换寡核苷酸可以依0.01至100μM,例如0.1至10μM,例如0.5至5μM,包括1至2μM(例如1.2μM)的最终浓度添加至反应混合物。

  在模板转换逆转录反应中,模板转换寡核苷酸可以包括或可以不包括一种或多种进行修饰或在其它方面非天然存在的核苷酸(或其类似物)。举例来说,模板转换寡核苷酸可以包括一种或多种核苷酸类似物(例如LNA、FANA、2'-O-Me RNA、2'-氟基RNA等等)、键修饰(例如硫代磷酸酯、3'-3'和5'-5'反向键)、5'和/或3'末端修饰(例如5'和/或3'氨基、生物素、DIG、磷酸酯、硫醇、染料、淬灭剂等等)、一种或多种荧光标记的核苷酸或为模板转换寡核苷酸提供所需功能性的任何其它特征。

  在某些方面,模板转换寡核苷酸包括3’杂交结构域。3'杂交结构域的长度可以变化,且在一些情况下,在2至10nt长,例如3至7nt长范围内。模板转换寡核苷酸的3’杂交结构域可以包括添加至模板转换反应的单产物核酸中的与未模板化序列(例如cDNA)互补的序列。以下更详细地描述的未模板化序列泛指不与例如RNA模板或DNA模板等模板相对应且未被所述模板进行模板化的那些序列。在未模板化序列存在于模板转换寡核苷酸的3’杂交结构域中的情况下,其可以涵盖整个3’杂交结构域或其部分。在一些情况下,未模板化序列可以包括异源多核苷酸或由其组成,其中此类异源多核苷酸在长度上可以在2至10nt长,例如3至7nt长变化,包括3nt。在一些情况下,未模板化序列可以包括同源多核苷酸或由其组成,其中此类同源多核苷酸在长度上可以在2至10nt长,例如3至7nt长之间变化,包括3nt。

  模板转换寡核苷酸可以在溶液中游离,或可以连接于固体支撑物(例如珠粒)。在一些情况下,模板转换寡核苷酸在容器(例如多孔阵列芯片)中干燥。干燥的模板转换寡核苷酸可以共价或非共价连接于容器。

  尾部序列和加尾

  在一些情况下,本发明的方法可以包括产生双股产物cDNA和/或使用具有与尾部序列互补的序列的引物扩增具有尾部序列的模板核酸。如本文所用,术语“尾部序列”泛指在由单核苷酸种类(例如A、C、G、T等)组成的模板核酸的3’末端上存在的多核苷酸延伸。在一些情况下,第一股互补脱氧核糖核酸(cDNA)引物可以完全或部分地与尾部序列互补。举例来说,mRNA模板的聚(A)尾是尾部序列的一个非限制性实例。因此,在一些情况下,第一股cDNA引物可以包括与mRNA模板的聚(A)尾互补的聚(T)序列或由其组成。

  尾部序列可以天然存在于主题模板核酸上,或可以通过合成方式添加。因此,可以存在于主题模板核酸上的尾部序列的实例包括但不限于例如聚(A)尾、聚(C)尾、聚(G)尾、聚(T)尾等等。尾部序列的尺寸可以在小于10nt至300nt或更多核苷酸的范围内,包括但不限于例如10至300nt、10至200nt、10至150nt、10至100nt、10至90nt、10至80nt、10至70nt、10至60nt、10至50nt、10至40nt、10至30nt、10至20nt、20至300nt、20至200nt、20至150nt、20至100nt、20至90nt、20至80nt、20至70nt、20至60nt、20至50nt、20至40nt、20至30nt、15nt、16nt、18nt、20nt等。在模板核酸含有尾部序列的情况下,用于产生双股产物cDNA的引物,例如第一股cDNA引物,可以含有与引物所杂交且启动第一股cDNA的伸长的尾部序列互补的序列。适于与尾部序列互补的序列将变化且可以包括但不限于例如聚(dA)序列、聚(dC)序列、聚(dG)序列、聚(dT)序列等等

  如上所述,模板核酸上存在的尾部序列可以是天然存在的(例如在mRNA模板的聚(A)尾的情况下),或者可以人工或通过合成方式产生。举例来说,在一些情况下,尾部序列可以在加尾反应中添加至核酸模板中。加尾反应将变化且可以包括例如尾部序列通过酶促过程添加至模板的情况。适用于主题核酸模板加尾的酶包括但不限于例如末端转移酶(例如末端脱氧核苷酸转移酶、RNA特异性核苷酸转移酶等等)。加尾序列的核苷酸种类可以依照要求,例如通过在利用末端转移酶的加尾反应中只利用所需dNTP种类(例如只利用dATP、只利用dCTP、只利用dGTP或只利用dTTP)来进行控制。在一些情况下,“dNTP加尾混合物”用于加尾反应中,其中此类混合物只含有一个dNTP种类(例如ATP)。在一些情况下,可以例如通过除去核酸模板上存在的3’磷酸酯(脱磷酸化)来制备用于加尾反应的核酸模板。可以采用任何合宜和适当的磷酸酶来达成此类目的,包括但不限于例如碱性磷酸酶(例如虾碱性磷酸酶和其衍生物等等。

  在一些情况下,主题方法可以包括例如通过在一种dNTP存在下在足以产生具有尾部序列的模板(即加尾模板)的条件下使模板核酸与末端转移酶接触来进行加尾反应,以添加加尾序列至模板核酸。dNTPs添加的比率和因此尾部序列的长度随3'末端与dNTP浓度的比率以及使用哪种dNTP而变。在末端转移酶具有活性的温度下,例如介于30℃与50℃之间,包括37℃下进行末端转移酶反应。末端转移酶反应中的dNTP可以呈0.01mM至1mM,例如0.05mM至0.5mm,包括0.1mM的最终浓度存在。模板核酸可以呈0.05至500pmol,例如0.5至50pmol,包括1至25pmol,例如5pmol的浓度存在于末端转移酶反应。末端转移酶反应中还可以包括末端转移酶缓冲溶液和任何其它有用组分(例如金属辅因子如Co等等),例如呈分开溶液(例如缓冲液)或作为“dNTP加尾混合物”的一部分。末端转移酶反应使得核苷酸添加在核酸模板的3’末端,且所得加尾模板核酸然后可以用于根据主题方法的反应的其它步骤中。

  在一些情况下,模板转换寡核苷酸包括在合成模板转换寡核苷酸的5’末端的互补物(例如模板转换寡核苷酸的5’接头序列)后防止聚合酶从模板转换寡核苷酸转换至不同的模板核酸的修饰。适用的修饰包括(但不限于)无碱基损害(例如四氢呋喃衍生物)、核苷酸加合物、异核苷酸碱基(例如异胞嘧啶、异鸟嘌呤等等)和其任何组合。

  在一些情况下,模板转换寡核苷酸可以包括5’接头序列(例如模板转换寡核苷酸的3’杂交结构域的界定的核苷酸序列5’),5’接头序列可以用于达成下游应用中的各种目的。在一些情况下,5’接头序列可以用作所扩增的dsDNA的进一步扩增或例如嵌套式扩增或抑制扩增的引物结合位点。

  引物

  单产物核酸引物又称为单产物核酸合成引物(例如第一股cDNA引物)或第一股引物,包括模板结合域。举例来说,核酸可以包括被配置成与例如mRNA等模板核酸杂交的第一(例如3’)结构域,且可以包括或可以不包括一种或多种其它结构域,所述其它结构域可以被视为不与模板核酸杂交的第二(例如5’)结构域,例如如以下更详细地描述的非模板序列结构域。模板结合域的序列可以独立地界定或是任意的。在某些方面,模板结合域具有界定的序列,例如聚dT或基因特异性序列。在其它方面,模板结合域具有任意序列(例如随机序列,例如随机六聚物序列)。虽然模板结合域的长度可以变化,但在一些情况下此结构域的长度在5至50nt、例如6至25nt、例如6至20nt范围内。

  单产物核酸引物可以包括或可以不包括一种或多种进行修饰或在其它方面非天然存在的核苷酸(或其类似物)。举例来说,单产物核酸引物可以包括一种或多种核苷酸类似物(例如LNA、FANA、2'-O-MeRNA、2'-氟基RNA等等)、键修饰(例如硫代磷酸酯、3'-3'和5'-5'反向键)、5'和/或3'末端修饰(例如5'和/或3'氨基、生物素、DIG、磷酸酯、硫醇、染料、淬灭剂等等)、一种或多种荧光标记的核苷酸或为单产物核酸引物提供所需功能性的任何其它特征。

  在一些情况下,单产物核酸引物可以包括5’接头序列(例如单产物核酸引物的3’杂交结构域的界定的核苷酸序列5’),5’接头序列可以用于达成下游应用中的各种目的。在一些情况下,5’接头序列可以用作进一步扩增或例如嵌套式扩增或抑制扩增的引物结合位点。

  在一些情况下,一或多种所采用的引物或寡核苷酸(包括例如单产物核酸引物、模板转换寡核苷酸等)可以包括两个或更多个结构域。举例来说,引物或寡核苷酸可以包括与模板杂交的第一(例如3’)结构域和不与模板杂交的第二(例如5’)结构域。第一和第二结构域的序列可以独立地界定或是任意的。在某些方面,第一结构域具有界定的序列且第二结构域的序列是界定的或任意的。在其它方面,第一结构域具有任意序列(例如随机序列,例如随机六聚物序列)且第二结构域的序列是界定的或任意的。在一些情况下,两种结构域的序列是界定的。在主题方法中利用的引物(包括例如单产物核酸引物、模板转换寡核苷酸等)包括两个或更多个结构域的情况下,结构域中的一个或多个可以包括如下所述的未模板化序列。

  聚合酶

  在一些情况下,组合至模板转换逆转录反应混合物中的聚合酶能够进行模板转换,其中所述聚合酶使用第一核酸股作为聚合的模板,然后转换至第二模板核酸股的3’末端,继续相同的聚合反应。在一些情况下,能够进行模板转换的聚合酶是逆转录酶。可用于实施主题方法的能够进行模板转换的逆转录酶包括(但不限于)逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒逆转录酶、反转子逆转录酶、细菌逆转录酶、第II组内含子衍生的逆转录酶和其突变体、变异衍生物或功能片段,例如核糖核酸酶H-或核糖核酸酶H减少的酶。举例来说,逆转录酶可以是莫洛尼鼠科白血病毒逆转录酶(MMLV RT)或家蚕逆转录酶(例如家蚕R2非LTR元件逆转录酶)。可用于实施主题方法的能够进行模板转换的聚合酶可购得且包括可从Takara Bio USA公司(Mountain View,CA)获得的SMARTScribeTM逆转录酶和PrimeScriptTM逆转录酶。

  本发明的方法的模板转换逆转录反应可以包括使用具有末端转移酶活性的聚合酶。举例来说,组合至反应混合物中的聚合酶(例如逆转录酶,例如MMLV RT)具有末端转移酶活性,使得同型核苷酸延伸(例如同型三核苷酸,例如C-C-C)可以添加至初期股的3’末端,且模板转换寡核苷酸的3’杂交结构域包括与初期股的3’末端互补的同型核苷酸延伸(例如同型三核苷酸,例如G-G-G)。在其它方面,当具有末端转移酶活性的聚合酶将核苷酸延伸添加至初期股的3’末端(例如三核苷酸延伸)时,模板转换寡核苷酸的3’杂交结构域包括异型三核苷酸,其包括包含胞嘧啶的核苷酸和包含鸟嘌呤的核苷酸(例如r(C/G)3寡核苷酸),模板转换寡核苷酸的异型三核苷酸延伸与初期股的3’末端互补。3'杂交结构域和模板转换寡核苷酸的实例进一步描述于美国专利No.5,962,272中,其公开内容以引用的方式并入本文中。

  具有末端转移酶活性的聚合酶能够催化脱氧核糖核苷酸添加至RNA或DNA分子的3’羟基末端。在某些方面,当聚合酶到达模板的5’末端时,聚合酶能够在非模板编码的初期股的3’末端并入一种或多种其它核苷酸。举例来说,当聚合酶具有末端转移酶活性时,聚合酶能够在初期股的3’末端并入1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个其它核苷酸。所有的核苷酸可以相同(例如在初期股的3’末端建立同型核苷酸延伸)或核苷酸中的一种或多种可以不同于其它(例如在初期股的3'末端建立异型核苷酸延伸)。在某些方面,聚合酶的末端转移酶活性添加具有2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个相同核苷酸(例如都是dCTP、都是dGTP、都是dATP或都是dTTP)的同型核苷酸延伸。举例来说,根据一个实施方案,聚合酶是MMLV逆转录酶(MMLV RT)。MMLV RT在初期股的3’末端并入其它核苷酸(主要为dCTP,例如三个dCTP)。如本文中其它地方更详细地描述,这些其它核苷酸可用于使模板转换寡核苷酸的3’杂交结构域与初期股的3’末端进行杂交,例如以促进聚合酶从模板进行模板转换至模板转换寡核苷酸。

  在一些情况下,主题方法中利用的逆转录酶可以是热敏性聚合酶,即非热稳定的聚合酶。此类热敏性聚合酶在超过其活性温度范围的温度下变成非活性的。举例来说,在一些情况下,在暴露于75℃或更高、80℃或更高、85℃或更高、90℃或更高或95℃或更高后热敏性聚合酶可以变成非活性的,或显示活性显著减少。

  在采用逆转录酶的情况下,其可以组合至反应混合物中,使得逆转录酶的最终浓度足以产生所需量的RT反应产物,例如所需量的单产物核酸。在某些方面,逆转录酶(例如MMLV RT、家蚕RT等)以0.1至200单位/微升(U/μL),例如0.5至100U/μL,例如1至50U/μL,包括5至25U/μL,例如20U/μL的最终浓度存在于反应混合物中。

  未模板化序列和非模板序列

  在一些情况下,所述方法的方面包括使用未模板化序列。术语“未模板化序列”和“非模板序列”泛指主题方法中所涉及的不与模板相对应的那些序列(例如不存在于模板中,模板中不具有互补序列,或不可能存在于模板中或具有模板中的互补序列)。未模板化序列是未被模板,例如RNA或DNA模板进行模板化的序列,因此其可以例如在伸长反应期间在缺乏对应模板下添加,例如通过具有非模板定向末端转移酶活性的聚合酶添加的核苷酸。未模板化序列添加至核酸不一定限于伸长反应。举例来说,在一些情况下,未模板化序列可以通过未模板化序列与核酸的连结来添加。在一些情况下,未模板化序列可以通过转座酶介导的反应,例如通过标签化反应添加,所述反应将未模板化序列添加至主题核酸。因此,未模板化序列可以变化且可以通过多种方式添加至模板化序列。

  非模板和未模板化序列可以指(但不绝对)在引物、模板转换寡核苷酸或转座子上存在的不与核酸模板杂交的那些序列(在一些情况下此类序列可以称为非杂交序列)。未模板化序列将在尺寸和组成方面有所变化。在一些情况下,未模板化序列,例如在模板转换寡核苷酸或引物上存在的未模板化序列可以在10nt至1000nt或更多核苷酸范围内,包括但不限于例如10nt至900nt、10nt至800nt、10nt至700nt、10nt至600nt、10nt至500nt、10nt至400nt、10nt至300nt、10nt至200nt、10nt至100nt、10nt至90nt、10nt至80nt、10nt至70nt、10nt至60nt、10nt至50nt、10nt至40nt、10nt至30nt、10nt至20nt等。

  在一些情况下,如上所述的未模板化序列可以包括在模板转换寡核苷酸的3’杂交结构域中当未模板化序列存在于模板转换寡核苷酸的3’杂交结构域中时,其可以包括异型多核苷酸或由异型多核苷酸组成,其中此类异型多核苷酸在长度上可以在2至10nt长、例如3至7nt长之间变化,包括3nt。在一些情况下,存在于模板转换寡核苷酸的3’杂交结构域中的未模板化序列可以包括同型多核苷酸或由同型多核苷酸组成,其中此类同型多核苷酸在长度上可以在2至10nt长、例如3至7nt长之间变化,包括3nt。

  在寡核苷酸或引物上存在的未模板化序列可以存在于寡核苷酸或引物的5’末端,且在此类情况下可以称为5’未模板化序列。在一些情况下,在主题反应中只有一种寡核苷酸或引物可以包括未模板化序列(例如5’未模板化序列)。在一些情况下,在主题反应中利用的两种或更多种寡核苷酸和/或引物可以包括未模板化序列(例如5’未模板化序列)。在两种或更多种寡核苷酸和/或引物包括未模板化序列的情况下,可以采用不同的未模板化序列。在一些情况下,在两种或更多种寡核苷酸和/或引物具有5’未模板化序列的情况下,此类序列可以具有相同5’未模板化序列。

  在一些情况下,包括例如5’未模板化序列在内的未模板化序列可以包括一个或多个限制性核酸内切酶识别位点。在一些情况下,一个或多个限制性核酸内切酶识别位点可以并入主题核酸中,从而允许例如通过使主题核酸在所并入的限制性核酸内切酶识别位点中的一个或多个位点处裂解而操控所产生的核酸。

  在一些情况下,包括例如5’未模板化序列在内的未模板化序列可以包括一个或多个引物结合位点。在一些情况下,一个或多个引物结合位点可以并入主题核酸中,从而允许所产生的核酸进行进一步扩增,包括例如使用引物结合位点中的一个或多个位点将所有或一部分核酸扩增。

  适用的引物结合位点将广泛地变化,取决于对引物结合位点所需的复杂性和对应的引物。在一些情况下,适用的引物结合位点包括与II A引物(例如如可以从Takara BioUSA,Inc.,Mountain View,CA获得)互补的引物结合位点。根据一个实施方案,在产生产物双股cDNA中利用的寡核苷酸或引物包括包含II A引物结合位点的非模板序列。根据一个实施方案,在末端捕捉反应中利用的核酸包括包含II A核酸结合位点的非模板序列。

  在一些情况下,包括例如5’未模板化序列在内的未模板化序列可以包括一个或多个条型码序列。在一些情况下,此类条型码序列可以是或可以包括独特分子标签(UMI)结构域和/或条型码化独特分子标签(BUMI)结构域。UMI和BUMI核酸以及其在各种应用中的使用在公布的美国专利申请公布No.US20150072344中进一步描述;其公开内容以引用的方式整体并入本文中。

  在一些情况下,例如在对条型码进行测序的测序反应后,未模板化序列的一个或多个条型码序列可以对所产生的核酸的来源进行追溯性鉴定。举例来说,在一些情况下,包括对模板来源(例如样品、孔、细胞等)具有特异性的条型码的未模板化序列在反应期间并入。此类来源鉴定条型码在本文中可以称为“来源条型码序列”,且此类序列可以变化并基于通过条型码鉴定的来源分配术语。来源条型码可以包括例如:条型码序列,其追溯性地鉴定产生所测序的核酸的样品;孔条型码序列,其追溯性地鉴定产生所测序的核酸的孔(例如多孔板);液滴条型码序列,其追溯性地鉴定产生所测序的核酸的液滴;细胞条型码序列,其追溯性地鉴定产生所测序的核酸的细胞(例如多细胞样品)等。条型码可用于各种程序,包括例如在条型码化后,例如在测序前汇集核酸的情况。

  在一些情况下,例如在寡核苷酸和/或核酸引物上存在的未模板化序列包括测序平台接头构建体。“测序平台接头构建体”意指包括所关注的测序平台利用的核酸结构域(例如测序平台接头核酸序列)或其互补序列的至少一部分的核酸构建体,所述测序平台例如提供的测序平台(例如HiSeqTM、MiSeqTM和/或Genome AnalyzerTM测序系统);Ion TorrentTM(例如Ion PGMTM和/或Ion ProtonTM测序系统);Pacific Biosciences(例如PACBIO RS II测序系统);Life TechnologiesTM(例如SOLiD测序系统);Roche(例如454GSFLX+和/或GS Junior测序系统);或所关注的任何其它测序平台。

  在某些方面,未模板化序列包括包含核酸结构域的测序平台接头构建体,所述核酸结构域为:特异性结合于通过表面连接的测序平台寡核苷酸(例如测序系统中连接于流动池的表面的P5或P7寡核苷酸)的结构域(例如“捕捉位点”或“捕捉序列”);测序引物结合域(例如平台的读数1或读数2引物可以结合的结构域)。测序平台接头构建体可以包括适合于所关注的测序平台的任何长度和序列的核酸结构域(例如“测序接头”)。在某些方面,核酸结构域长度为4至200nt。举例来说,核酸结构域长度可以为4至100nt,例如6至75nt、8至50nt或10至40nt长。根据某些实施方案,测序平台接头构建体包括长度为2至8nt,例如9至15nt、16-22nt、23-29nt或30-36nt长的核酸结构域。

  核酸结构域的长度和序列可以使所关注的测序平台采用的多核苷酸(例如寡核苷酸)特异性结合于核酸结构域,例如用于通过合成核酸结构域所侧接的cDNA插入物进行固相扩增和/或测序。示例核酸结构域包括基于的测序平台上采用的P5(5’-AATGATACGGCGACCACCGA-3’)(SEQ ID NO:17)、P7(5’-CAAGCAGAAGACGGCATACGAGAT-3’)(SEQID NO:18)、读数1引物(5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’)(SEQ ID NO:19)和读数2引物(5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3’)(SEQ ID NO:20)结构域。其它示例核酸结构域包括基于Ion TorrentTM的测序平台上采用的A接头(5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-3’)(SEQ ID NO:21)和P1接头(5’-CCTCTCTATGGGCAGTCGGTGAT-3’)(SEQ ID NO:22)结构域。

  适用于在所关注的测序平台上测序的未模板化序列结构域的核苷酸序列可以随着时间变化和/或改变。接头序列典型地由测序平台的制造商提供(例如在与测序系统一起提供的技术文献中和/或可在制造商的网点上获得)。基于此类信息,未模板化序列(例如模板转换寡核苷酸和/或单产物核酸引物等等)的测序平台接头构建体的序列可以设计成包括一个或多个核酸结构域全部或一部分,呈能够在所关注的平台上对核酸插入物(与模板核酸相对应)进行测序的构型。未模板化序列中可以包括的测序平台接头构建体以及本文所述的其它核酸试剂进一步描述于作为US 2015-0111789 A1公布的美国专利申请序列号14/478,978中,其公开内容以引用的方式并入本文中。

  未模板化序列可以通过多种方式添加至所关注的核酸,例如添加至寡核苷酸、核酸引物、所产生的dsDNA等等。举例来说,如上所述,未模板化序列可以通过具有末端转移酶活性的聚合酶的作用添加。例如在引物或寡核苷酸上存在的未模板化序列可以在扩增反应期间并入产物核酸中。在一些情况下,未模板化核酸序列可以直接地连接于核酸,例如在扩增前连接于引物或寡核苷酸,连接于核酸扩增产物等。将未模板化序列直接连接于核酸的方法将变化且可以包括但不限于例如连结、化学合成/连接、酶促核苷酸添加(例如通过具有末端转移酶活性的聚合酶)等等。

  在一些情况下,所述方法可以包括将测序平台接头构建体连接至核酸末端。举例来说,在一些情况下,在主题方法中利用的寡核苷酸和/或引物可以不包括测序平台接头构建体,因此所需测序平台接头构建体可以在产生所关注的核酸后连接。连接至所关注的核酸或其衍生物的末端的接头构建体可以包括任何可用于下游测序应用的序列元件,包括上文关于本文中所述的方法的寡核苷酸和/或引物的任选测序平台接头构建体描述的任一元件。举例来说,连接至所关注的核酸或其衍生物的末端的接头构建体可以包括选自由以下组成的组的核酸结构域或其互补物:特异性结合于通过表面连接的测序平台寡核苷酸的结构域、测序引物结合域、条型码结构域、条型码测序引物结合域、分子鉴定结构域和其组合。

  可以使用任何合适的方法实现测序平台接头构建体的连接。在某些方面,使用与“无缝”克隆策略相同或类似的方法,将接头构建体连接于产物核酸或其衍生物的末端。无缝策略去除一轮或多轮限制酶分析和消化、DNA末端修复、脱磷酸化、接合、酶钝化和清理以及核酸物质的相应丧失。所关注的无缝连接策略包括:克隆系统,可得自Takara Bio USA公司(Mountain View,CA);SLIC(序列和连结酶独立的克隆),如Li和Elledge(2007)Nature Methods 4:251-256中所述;Gibson assembly,如Gibson等人(2009)Nature Methods 6:343-345中所述;CPEC(环形聚合酶延伸克隆),如Quan和Tian(2009)PLoS ONE 4(7):e6441中所述;SLiCE(无缝连结克隆提取),如Zhang等人(2012)Nucleic Acids Research 40(8):e55中所述;以及Life Technologies(Carlsbad,CA)的无缝克隆技术。

  任何合适的方法都可以用于为具有少于所关注的测序平台的适用或必要测序结构域全部的所关注的核酸或其衍生物提供其它核酸测序结构域。举例来说,可以使用在5’末端具有接头序列(例如引物的5’区域与所关注的核酸或其衍生物互补)的PCR引物扩增所关注的核酸或其衍生物,使得扩增子包括原始核酸中的接头序列以及引物中的接头序列,呈任何所需构型。可以包括基于无缝克隆策略、限制消化/连结等的方法在内的其它方法。

  其它方法参数

  如以上概述,本文中所述的方法可以包括某些核酸反应,包括例如模板转换逆转录反应、核酸扩增反应、末端捕捉反应、标签化反应等等。此类反应中的反应混合物组分是在足以产生反应产物的条件下组合的。举例来说,在一些情况下,模板转换逆转录反应的反应组分是在足以产生产物双股cDNA的条件下组合的。在一些情况下,核酸扩增反应的反应组分是在足以产生扩增产物核酸的条件下组合的。在一些情况下,末端捕捉反应的反应组分是在足以产生末端捕捉核酸的条件下组合的。在一些情况下,标签化反应的反应组分是在足以产生标签化核酸的条件下组合的。

  “足以产生主题核酸的条件”意指允许反应中有关的核酸和/或其它反应组分以所需方式彼此相互作用的反应条件。举例来说,在一些情况下,所述条件可以足够反应混合物的核酸进行杂交。在一些情况下,条件可以足够使反应混合物的酶催化例如聚合、水解等化学过程。实现合适的反应条件可以包括选择反应混合物组分、其浓度和反应温度以建立进行有关过程,包括例如有关核酸以序列特异性方式彼此杂交,有关聚合酶聚合,使得核酸伸长等等的环境。除反应的特定核酸(例如模板核酸、寡核苷酸、引物等)外,反应混合物可以包括确立适当pH值、盐浓度(例如KCl浓度)等的缓冲组分。足以产生双股核酸复合物的条件可以包括适合于杂交的那些条件,又称为“杂交条件”。

  实现合适的反应条件可以包括选择反应混合物组分、其浓度和反应温度以建立在其中一种或多种聚合酶具有活性和/或反应中的有关核酸以所需方式彼此相互作用(例如杂交)的环境。在合适的反应条件中,除反应组分外,反应混合物可以包括确立适当pH值、盐浓度(例如KCl浓度)、金属辅因子浓度(例如Mg2+或Mn2+浓度)等以使延伸反应和/或模板转换发生的缓冲组分。可以包括其它组分,例如一种或多种核酸酶抑制剂(例如核糖核酸酶抑制剂和/或脱氧核糖核酸酶抑制剂)、一种或多种用于促进富含GC序列的扩增/复制的添加剂(例如GC-MeltTM试剂(Takara Bio USA公司(Mountain View,CA))、甜菜碱、DMSO、乙二醇、1,2-丙二醇或其组合)、一种或多种分子拥挤试剂(例如聚乙二醇等等)、一种或多种酶稳定组分(例如以在1至10mM范围内的最终浓度(例如5mM)存在的DTT)和/或任何其它的可用于促进聚合酶介导的延伸反应和/或模板转换的反应混合物组分。

  一种或多种反应混合物可以具有适合于引物延伸反应和/或模板转换的pH值。在某些实施方案中,反应混合物的pH值在5至9,例如7至9,包括8至9,例如8至8.5的范围内。在一些情况下,反应混合物包括pH值调节剂。所关注的pH值调节剂包括(但不限于)氢氧化钠、盐酸、磷酸缓冲溶液、柠檬酸缓冲溶液等等。举例来说,反应混合物的pH值可以通过添加适当量的pH值调节剂调至所需范围。

  适合于引物延伸反应的温度范围可以根据例如具体采用的聚合酶、任何采用的引物的熔融温度等因素变化。在一些情况下,可以采用逆转录酶(例如MMLV逆转录酶)且足以进行逆转录酶介导的杂交引物延伸的反应混合物条件包括使反应混合物达至在4℃至72℃,例如16℃至70℃,例如37℃至50℃,例如40℃至45℃范围内的温度,包括42℃。

  在一些情况下,本文所述的方法可以包括例如通过使含有模板的反应混合物经受足以使模板的二级结构变性的温度使模板变性。视情况而定,变性可以在一种或多种反应组分添加至反应混合物前或添加后发生,且在一些情况下在开始转录,例如逆转录前进行,以产生单产物核酸。适用的变性温度将变化且可以在小于50℃至超过100℃范围内,包括但不限于例如50℃或更多、55℃或更多、65℃或更多、70℃或更多、72℃或更多、75℃或更多、80℃或更多、85℃或更多、90℃或更多、95℃或更多等。

  在一些情况下,所提供的方法可以包括分离和/或纯化最终核酸产物(例如核酸文库)和/或中间核酸产物(例如双股产物cDNA)。可以采用任何合宜的纯化方法,包括但不限于例如核酸沉淀(即乙醇沉淀)、凝胶纯化等等。

  在一些情况下,所提供的方法可以包括使用扩增聚合酶,例如用于扩增所产生的双股cDNA、所产生的核酸文库等等。可以采用任何合宜的扩增聚合酶,包括但不限于DNA聚合酶,包括热稳定的聚合酶。适用的扩增聚合酶包括例如Taq DNA聚合酶、Pfu DNA聚合酶、其衍生物等等。在一些情况下,扩增聚合酶可以是热起动聚合酶,包括但不限于例如热起动Taq DNA聚合酶、热起动Pfu DNA聚合酶等等。

  扩增聚合酶可以组合至反应混合物中,使得扩增聚合酶的最终浓度足以产生所需量的产物核酸,例如所需量的扩增的产物双股cDNA、所需量的文库核酸等等。在某些方面,扩增聚合酶(例如热稳定DNA聚合酶、热起动DNA聚合酶等)以0.1至200单位/微升(U/μL),例如0.5至100U/μL,例如1至50U/μL,包括5至25U/μL,例如20U/μL的最终浓度存在于反应混合物中。

  主题方法的核酸反应,例如扩增反应可以包括将dNTP组合至反应混合物中。在某些方面,将四种天然存在的dNTP(dATP、dGTP、dCTP和dTTP)中的每一种添加至反应混合物中。举例来说,dATP、dGTP、dCTP和dTTP可以添加至反应混合物,以使得每种dNTP的最终浓度为0.01至100mM,例如0.1至10mM,包括0.5至5mM(例如1mM)。在一些情况下,添加至反应混合物中的一种或多种类型核苷酸可以是非天然存在的核苷酸,例如连接有结合或其它部分(例如荧光部分)的修饰型核苷酸、核苷酸类似物或任何其它类型的可用于主题方法或所关注的下游应用的非天然存在的核苷酸。

  反应混合物可以经受各种温度,以驱动反应的各个方面,包括但不限于例如核酸的变性/熔融、核酸的杂交/退火、聚合酶介导的伸长/延伸等等。进行各种过程的温度可以根据发生的过程来提及,包括例如熔融温度、退火温度、伸长温度等等。此类过程的最适温度将变化,例如取决于所使用的聚合酶,取决于核酸的特征等等。包括逆转录酶和扩增聚合酶在内的具体聚合酶的最适温度容易从参考文本获得。可以基于主题核酸已知的特征,包括例如全长、杂交长度、G/C含量百分比、二级结构预测等,容易计算与核酸有关的最适温度,例如退火和熔融温度。

  根据某些实施方案,主题方法可以包括分离、扩增和/或分析(例如测序)脱氧核糖核酸(DNA)。在主题方法包括分离、扩增和/或分析DNA的情况下,所采用的DNA可以称为DNA模板(或有时称为模板DNA)。模板DNA可以是任何类型的DNA(或其亚型),包括(但不限于)基因组DNA(例如动物基因组DNA(例如哺乳动物基因组DNA(例如人基因组DNA、啮齿动物基因组DNA(例如小鼠、大鼠等)等)、线粒体DNA或前述DNA类型或其亚型的任何组合。

  在某些实施方案中,基因组DNA(gDNA)可以依照要求分离和/或加工用于分析。举例来说,在一些情况下,所提供的方法可以包括由含有RNA的样品制备一种或多种文库,且还包括分离、加工和/或分析来自所述样品的gDNA。因此,在一些情况下,样品可以包括含有RNA和DNA(例如gDNA)的样品,包括例如从多个细胞分离的核酸样品和从单细胞分离的样品。举例来说,在一些情况下,主题方法可以包括分离、加工和/或分析来自单细胞的RNA和DNA,包括例如RNA的加工包括由RNA样品制备两种或更多种文库(例如表达文库和免疫细胞受体谱系文库)的情况。

  可以出于多种目的,对gDNA进行分离、加工和/或分析。举例来说,在一些情况下,可以对样品的gDNA测序以获得基因组序列信息。在一些情况下,主题样品的gDNA的此类测序包括对免疫基因座或一个或多个免疫基因座测序。“免疫基因座”一般意指任何免疫相关基因的基因座,包括与免疫系统过程相关的那些基因(例如通过基因本体论(GO)登录号GO:0002376(可在geneontology(.)org上在线获得)鉴定的基因,包括但不限于例如与B细胞介导的免疫性、B细胞选择、T细胞介导的免疫性、T细胞选择、免疫反应的活化、抗原加工和呈现、黏膜相关的淋巴组织中的抗原取样、嗜碱性粒细胞介导的免疫性、嗜酸性粒细胞介导的免疫性、血球分化、血球增殖、免疫效应子过程、免疫反应、免疫系统发育、免疫记忆过程、白细胞活化、白细胞体内平衡、白细胞介导的免疫性、白细胞游出、淋巴细胞共刺激、淋巴细胞介导的免疫性、肥大细胞介导的免疫性、骨髓细胞体内平衡、骨髓白细胞介导的免疫性、自然杀伤细胞介导的免疫性、免疫系统过程的负调节、嗜中性粒细胞介导的免疫性、免疫系统过程的正调节、免疫反应分子介体的产生、免疫系统过程的调节、免疫受体的体细胞多样化、诱导耐受等等相关的那些基因。

  在一些情况下,可以在主题方法中进行测序和/或以其它方式分析的免疫基因座可以是TCR基因座。在一些情况下,可以在主题方法中进行测序和/或以其它方式分析的免疫基因座可以是BCR基因座。在一些情况下,对免疫基因座的gDNA进行测序允许与本文中产生的包括例如表达文库和/或免疫细胞受体谱系文库在内的文库的一个或多个NGS分析进行协调分析。在一些情况下,在所提供的方法中进行的gDNA分析可以包括全基因组测序。

  组合物和试剂盒

  本公开的方面还包括组合物和试剂盒。组合物和试剂盒可以包括例如上文关于主题方法所述的任何反应混合物组分中的一种或多种。举例来说,组合物和试剂盒可以包括核酸样品(例如RNA样品、组合的RNA和DNA样品等)、扩增聚合酶(例如热稳定聚合酶等)、逆转录酶(例如能够进行模板转换的逆转录酶等)模板转换寡核苷酸、末端捕捉引物、免疫受体特异性引物、标签化反应的一种或多种组分、dNTP、盐、金属辅因子、一种或多种核酸酶抑制剂(例如核糖核酸酶抑制剂和/或脱氧核糖核酸酶抑制剂)、一种或多种分子拥挤剂(例如聚乙二醇等)、一种或多种酶稳定组分(例如DTT)或任何其它所需的试剂盒组分。

  在一些情况下,主题组合物和/或试剂盒的组分可以呈现为“混合物”,其中如本文所用,混合物是指两种或更多种不同但类似的组分收集或组合在单个容器中。主题试剂盒中适用的混合物包括但不限于例如“引物混合物”,其中此类混合物的组成可以变化且可以包括例如包括例如末端扩增引物和免疫受体特异性引物等两种或更多种引物的混合物。主题试剂盒中适用的混合物也可以包括但不限于例如“标签化混合物”,其中此类混合物的组成可以变化且可以包括例如包括例如转座子和转座酶的标签化反应的两种或更多种组分的混合物。

  在某些实施方案中,试剂盒包括用于从所关注的核酸来源分离核酸的试剂。试剂可以适合于从包括单细胞、培养细胞、组织、器官或生物体在内的多种DNA或RNA来源分离核酸样品。主题试剂盒可以包括用于从固定细胞、组织或器官,例如福尔马林固定、石蜡包埋(FFPE)的组织分离核酸样品的试剂。此类试剂盒可以包括一种或多种脱蜡剂、一种或多种适于使核酸脱除交联的剂等等。

  试剂盒的组分可以存在于分开的容器中,或多种组分可以存在于单个容器中。举例来说,用于进行模板转换反应的组分和用于制备文库的组分(例如在所产生的双股cDNA分割后使用)可以提供于不同的管中。在一些情况下,模板转换寡核苷酸和第一股cDNA引物可以提供于相同的管中,或可以提供于不同的管中。在一些情况下,一种或多种免疫受体特异性引物和一种或多种末端(例如5’末端)引物可以提供于相同的管中,或可以提供于不同的管中。在一些情况下,一种或多种末端(例如5’末端或3’末端)引物和一种或多种标签化后引物可以提供于相同的管中,或可以提供于不同的管中。在一些情况下,三磷酸脱氧核糖核苷酸(dNTP)可以包括在与逆转录酶、扩增聚合酶或一种或多种引物或寡核苷酸相同的管中。

  在某些实施方案中,所提供的试剂盒可以包括5’扩增引物、免疫细胞受体特异性扩增引物(即免疫受体特异性引物)和末端扩增引物的一定组合。举例来说,试剂盒可以包括以下各物的组合:结合于通过模板转换寡核苷酸添加的引物结合位点的5’扩增引物;特异性结合于一种或多种免疫细胞受体多肽(例如TCRα链、TCRβ链、免疫球蛋白链)的区域(例如恒定区)的免疫细胞受体特异性扩增引物;以及用于末端捕捉中(例如结合于在例如标签化反应等末端捕捉过程中添加的引物结合位点)的末端扩增引物。

  在某些情况下,所提供的试剂盒可以包括用于进行模板转换逆转录反应的一种或多种组分。此类组分包括但不限于本文所述的组分,包括例如模板转换寡核苷酸、引物、逆转录酶等等。在一些情况下,例如寡核苷酸和引物等此类组分可以包括接头序列。举例来说,在一些情况下,所提供的模板转换寡核苷酸可以包括5’接头序列。

  在某些情况下,所提供的试剂盒可以包括用于进行标签化反应的一种或多种组分。举例来说,此类试剂盒可以包括一种试剂或以下各物的一定组合:包含标签化后扩增引物结合域的转座子核酸;与标签化后扩增引物结合域杂交的标签化后扩增引物;转座酶(例如Tn5转座酶);或可以包括本文所述的一种或多种其它组分的一些其它组合;其组合。

  在某些情况下,所提供的试剂盒可以包括一种或多种用于在自动化系统(例如来自Takara Bio USA的ICELL8系统)上进行多个反应的组分。所提供的试剂盒可以包括多孔板(即阵列芯片)。多孔阵列芯片可以在多孔阵列芯片的孔中包含模板转换寡核苷酸和/或本公开的任何其它引物(例如呈脱水格式)。

  除以上提及的组分外,主题试剂盒还可以包括关于使用试剂盒组分例如实施如上所述的主题方法的说明书。此外,例如在试剂盒的引物和/或寡核苷酸包括BUMI结构域的情况下,试剂盒还可以包括为分析结果进行编程,包括例如将编码BUMI解码、计数独特分子种类等等。说明书和/或分析编程一般记录在合适的记录媒体上。说明书和/或编程可以印刷在例如纸或塑料等衬底上。因而,说明书可以作为包装说明书、呈试剂盒或其组分的容器的标签(即与包装或分装相关)等存在于试剂盒中。在其它实施方案中,说明书呈存在于例如CD-ROM、磁盘、硬盘驱动器(HDD)等合适的计算机可读存储媒体上的电子存储数据文件存在。在其它实施方案中,实际说明书不存在于试剂盒中,但提供例如经由因特网从远端源获得说明书的方式。此实施方案的一实例是包括可以看到说明书和/或可以从中下载说明书的网址的试剂盒。如同说明书一样,用于获得说明书的此方式记录在合适的衬底上。

  主题组合物可以存在于任何合适的环境中。根据一个实施方案,组合物存在于反应管(例如0.2mL管、0.6mL管、1.5mL管等等)或孔或微流体室或液滴或其它合适的容器中。在某些方面,组合物存在于两个或更多个(例如多个)反应管或孔中(例如平板,例如96孔板、例如含有约1000个、5000个或10,000个或更多个孔的多孔板)。管和/或板可以由例如聚丙烯、PDMS或铝等任何合适的材料制成。还可以对容器进行处理以减少核酸吸附至容器壁。在某些方面,存在组合物的管和/或板有效地将热传递至组合物(例如当置于加热块、水浴、热循环仪等中时),以便可以在短时期内改变组合物的温度,例如如发生具体的酶促反应所需。根据某些实施方案,组合物存在于薄壁聚丙烯管或具有薄壁聚丙烯孔的板或例如铝等具有高导热性的材料中。在一些情况下,本公开的组合物可以呈液滴存在。在某些实施方案中,反应宜在固体表面或珠粒上发生,在此情况下,单产物核酸引物和/或模板转换寡核苷酸或一种或多种其它引物可以通过本领域中已知的方法,例如生物素键或通过共价键,连接至固体支撑物或珠粒,且允许反应在支撑物上进行。可替代地,寡核苷酸可以直接在固体支撑物上合成,例如如Macosko,EZ等人,Cell 161,1202-1214,2015年5月21日中所述。

  其它适合于主题组合物的环境包括例如微流体芯片(例如“芯片实验室装置”,例如包含通道和进口的微流体装置)。组合物可以存在于被配置成使组合物达至所需温度的仪器,例如温度控制的水浴加热块、加热块接头等等。被配置成使组合物达至所需温度的仪器可以被配置成使组合物达至一系列不同的所需温度,每个温度持续合适的时段(例如仪器可以是热循环仪)。

  效用

  主题方法可用于多种应用,包括采用免疫细胞受体谱系分析和/或两个或更多个不同地制备的测序文库的分析的应用,包括此类分析可以相继或同时进行的情况。

  如上所述,在一些情况下,从两个不同地制备的文库获得的数据可以协调。此类协调的数据可以用于达成共同或相关的目的。举例来说,在一些情况下,从免疫细胞受体谱系文库获得的数据可以与从表达文库获得的数据协调。在一些实施方案中,免疫细胞受体谱系文库的测序可以提供关于鉴定由细胞、细胞群体或受试者或受试者群体表达的免疫受体谱系的信息,且表达文库的差异表达分析可以提供关于可能与免疫受体谱系信息相关的相对基因表达水平的信息。举例来说,在一些情况下,表达文库可以提供与一种或多种细胞的全转录物组有关的差异表达信息(例如作为全转录物组分析(WTA)的一部分),且此类转录物组信息可以与...相同一种或多种细胞的免疫受体谱系信息相比或相关。作为另一实例,在一些情况下,表达文库可以提供与一种或多种细胞中一种或多种免疫相关基因(例如细胞因子、白细胞介素、白细胞介素受体、CD4、CD8、CD3、PD-1等)的表达有关的差异表达信息,且此类免疫相关的基因表达信息可以与相同一种或多种细胞的免疫受体谱系信息相比或相关。通过此类过程,可以确定细胞或细胞群体、免疫受体谱系和包括免疫相关基因和非免疫相关基因在内的其它基因的表达之间的关系,和/或作进一步研究。

  此外,单产物双股cDNA平行文库制备的使用可以允许增加结果的一致性和使数据集上结果相关的能力。此外,在多个文库制备方法中使用单产物双股cDNA进一步可用于希望产生两个或更多个文库的使用者输入和“传递时间”减少的那些方法,不管来自所述两个或更多个文库的数据随后是否相关。

  主题方法的应用包括其中需要鉴定和/或筛选免疫分子的医学和研究应用。此类应用包括人临床研究应用以及临床前研究应用,例如在例如啮齿动物、小型和大型哺乳动物、非人灵长类动物等动物模型上进行的研究。

  在本文中公开的方法中产生的准备测序文库包括能够使用任何合宜的测序平台对文库成员进行测序的接头序列,所述测序平台包括:来自的HiSeqTM、MiSeqTM和Genome AnalyzerTM测序系统;来自Ion TorrentTM的Ion PGMTM和Ion ProtonTM测序系统;来自Pacific Biosciences的PACBIO RS II测序系统;来自Life TechnologiesTM的SOLiD测序系统;来自Roche的454GS FLX+和GS Junior测序系统或任何其它合宜的测序系统。所提供的方法可用于产生一个或多个与所关注的RNA起始物质,例如mRNA、未聚腺苷酸化RNA(例如微型RNA)的任何单个样品相对应的准备测序文库。此外,本发明的方法可以用以由源自于个别单细胞或相关细胞群体的单个RNA样品单独或平行地产生准备测序的cDNA文库。

  以下实施例借助于说明来提供而非限制。

  实施例

  实施例1:来自单细胞的组合的差异基因表达分析和TCR概况分析

  图5中提供了显示产生文库所采用的全过程的总示意图,所述文库用于来自单细胞的组合的差异基因表达分析和TCR概况分析。

  逆转录(RT)反应和预扩增PCR

  在方案的第一部分中,通过模板转换逆转录反应,由从单细胞输入获得的mRNA样品产生双股cDNA。将单细胞mRNA样品分散在96孔盘的孔中,且T细胞受体(TCR)dT引物和逆转录酶(RT)用于每个孔中,以由单细胞mRNA样品合成第一股。RT的末端转移酶活性引起所合成的第一股加尾。使SMART-Seq索引寡核苷酸与加尾的核苷酸杂交,从而允许RT的模板转换和合成的第一股的延伸,以包括由SMART-Seq索引寡核苷酸模板化的索引和预扩增PCR引物结合位点序列。

  然后与预扩增PCR引物结合位点杂交的TCR dT引物和预扩增PCR引物用于扩增模板转换反应的产物,最终产生产物双股cDNA。将从每个孔产生的产物双股cDNA汇集并进行PCR净化,所述产物双股cDNA含有每个单细胞反应所独有的索引序列。在汇集和净化之后,双股cDNA在两个反应之间分离,从而分别产生用于(1)差异序列分析和(2)TCR概况分析的测序文库。

  差异序列分析文库制备

  通过5’末端捕捉制备用于差异序列分析的测序文库。简单地说,使用TnRP1和TnPR2转座子和Tn5转座酶将产物双股cDNA标签化。标签化产生具有完整5’末端(即维持索引和预扩增PCR引物结合位点序列)和合并标签化后扩增引物结合域的标签化3’末端的产物双股cDNA片段。两个5’末端捕捉引物用于扩增标签化5’片段并合并测序接头序列,所述捕捉引物中第一个(“5’末端捕捉引物1”)与预扩增PCR引物结合位点序列杂交,且第二个(“5’末端捕捉引物2”)与标签化后扩增引物结合域。第一引物(“5’末端捕捉引物1”)包括P7、i7、读数2和SMART序列。第二引物(“5’末端捕捉引物2”)包括P5、i5和Tn读数1序列。扩增后,文库完成并准备用于测序。

  TCR概况分析文库的制备

  在管内,使用TCR特异性扩增和添加序列接头,制备用于TCR概况分析的TCR特异性文库。使用包括读数2序列的SMART引物1以及SMART序列和对人TCR α/β链恒定区具有特异性的引物(“TCR a/b人引物1”)实现TCR特异性扩增。在第一轮扩增(“PCR 1”)中,SMART引物1与预扩增PCR引物结合位点序列杂交且TCR a/b人引物1与TCR α/β链恒定区杂交。使用以下各物进行第二轮扩增(“PCR 2”):TCR引物2正向HT索引,其与读数2序列杂交且合并P7和i7序列;和TCR a/b人引物2反向HT索引,其与扩增的TCR α/β恒定区序列杂交且合并读数1、i5和P5序列。扩增后,文库完成并准备用于测序。

  实施例2:单细胞T细胞受体概况分析

  单细胞分选至96孔板的个别孔中的溶解缓冲液中。然后将逆转录试剂加入板,包括每一行独特指示的SMART-Seq寡核苷酸(A-H,图7)。RT和预扩增PCR步骤在板的每个孔中进行,并将产物按照列汇集,得到12个池,每个池含有根据其所源自的个别细胞条型码化的cDNA分子的混合物。随后在12个池中的每一个上进行文库构建步骤(如以下更详细地描述),将需要制备的文库的数目从96减小至12。条型码的包括允许每个池的测序数据多路分解,从而允许分辨单细胞以及TCR-α和TCR-β子单元的序列信息配对。

  图6中提供了显示用于由单T细胞制备TCR概况分析文库的全过程的总示意图。用于制备文库的过程类似于在实施例1中描述的过程的TCR概况分析文库制备部分。

  简单地说,单细胞分选至96孔板中。第一股cDNA合成由TCR dT引物起动,且通过MMLV衍生的逆转录酶(RT)进行。到达每个mRNA分子的5’末端后,RT将非模板核苷酸加入第一股cDNA。SMART-索引寡核苷酸包括与除行特异性索引序列外通过RT加入的非模板核苷酸互补且与第一股cDNA杂交的序列。在模板转换步骤中,RT使用SMART-Seq索引寡核苷酸的其余部分作为模板以将其他序列合并在第一股cDNA的末端上。

  然后在每个孔中进行预扩增PCR步骤,以产生双股cDNA,其用作PCR扩增和文库构建的起始物质。在净化步骤后,将来自96孔板的每列的cDNA汇集在分开的管中(参见图7),且通过PCR,使用与寡核苷酸模板序列(“SMART引物1”)和TCR-α和/或TCR-β子单元的恒定区(“TCR a/b人引物1”)互补的引物,扩增TCR特异性序列。使用TCR引物2正向HT索引和TCR a/b人引物2反向HT索引,进行随后一轮PCR,以进一步扩增TCR-α和/或TCR-β子单元的可变区并合并接头序列。引物中包括与测序平台相容的接头和索引序列(分别为读数2+i7+P7和读数1+i5+P5)。在纯化、选择尺寸和质量分析后,在Illumina平台上,使用300bp成对末端读数,对TCR cDNA文库测序。

  为测试工作流程性能,由单Jurkat细胞或者由Jurkat RNA的单细胞同等量(2.5pgRNA)产生TCR-α和TCR-β序列文库。八种细胞及八种RNA样品个别地在96孔板中加工,针对相同类型的每个输入,使用不同的SMART-Seq索引寡核苷酸。在各孔中进行RT及预扩增PCR反应,且如上所述,在随后数轮PCR前将来源于相同类型的输入的cDNA产物汇集在一起。最终文库在MiSeq上利用300bp成对末端读数测序。在测序后,来源于SMART-Seq索引寡核苷酸的条型码序列用于将测序数据多路分解,然后使用MiXCR(Bolotin等人,(2015)Nat.Methods12(5):380-381)分析。

  确定与来自每种细胞或RNA样品的TCR-α或TCR-β中的CDR3区域对应的测序读数的百分比(图8)。对于每种RNA样品,>96%读数与任一TCR子单元对应。对于所分析的八种细胞中的七种,>89%读数与任一TCR子单元对应。

  还确定与来自每种细胞或RNA样品的预期Jurkat克隆型(TRAV8-4、TRAJ3/TRBV12-3、TRBJ1-2)对应的测序读数百分比(图9)。对于每种RNA样品,>92%读数鉴定正确的Jurkat克隆型。对于所分析的八种细胞中的七种,>86%读数鉴定正确的Jurkat克隆型,与读数-比对数据一致。

  概括地说,在96孔格式测定方法中测试Jurkat细胞证明平均92%测序读数对应于TCR序列,而平均90%读数鉴定正确的Jurkat克隆型。

  实施例3:使用ICELL8系统进行单细胞T细胞受体概况分析

  a.双引物介导的cDNA合成

  还在多样品纳米分配器(MSND)格式中测试单细胞TCR概况分析。利用WaferGen(Fremont,CA) MSND系统分配纳升体积的细胞和试剂至芯片的孔中。在图10中图示工作流程大体上。

  芯片内反应过程包括三个分配步骤。在“分配#_1”(单细胞溶液)中,使用MSND将T细胞分配至WaferGen 72×72芯片中,有(或无)预先印刷的条型码化PCR引物,使用设计成能最大化如泊松统计所规定的单细胞产量的方法。使用软体(Wafergen,Fremont CA)进行细胞的自动化成像。含有单细胞的孔向下选择,因此仅仅使用各条型码一次。芯片在上存在各条型码(n=1,728)的三个拷贝,其提供良好特异性地址。通过冻融使细胞在芯片内溶解,且立即加工。

  在“分配#_2”(RT混合物)中,通过TCR dT引物启动链cDNA合成,且通过MMLV衍生的逆转录酶(RT)在细胞溶解缓冲液存在下进行。到达每个mRNA分子的5’末端后,RT将非模板核苷酸加入第一股cDNA。SMARTSeqv4寡核苷酸含有与通过RT加入的非模板核苷酸互补且与第一股cDNA杂交的序列。在模板转换步骤中,RT使用SMART-Seq v4模板转换寡核苷酸的其余部分作为模板以将其它序列合并在第一股cDNA的末端上。

  在分配#_3(预扩增混合物)中,进行十个预扩增循环,以合并预先打印的PCR1-A引物(与TCR dT引物一致使用)。使用夹具,通过离心作用,提取芯片的内容,然后进行柱纯化。

  在管内进行PCR扩增反应。通过PCR,使用与寡核苷酸模板序列(TCR引物2正向HT索引)和TCR-α和/或TCR-β子单元的恒定区(TCRα/β人引物1)互补的索引引物,选择性地扩增TCR cDNA的全长可变区。使用TCR引物2正向HT索引和TCR a/b人引物2反向HT索引,进行随后一轮PCR,以进一步扩增TCR-α和/或TCR-β子单元的可变区并合并接头序列。引物中包括与Illumina测序平台相容的接头和索引序列(分别为读数2+i7+P7和读数1+i5+P5)。在纯化、选择尺寸和质量分析后,在Illumina平台上,使用300bp成对末端读数,对TCR cDNA文库测序。

  为评估 cDNA合成试剂盒(Takara Bio USA,Mountain View,CA)的性能,针对三个独立的文库制备操作,分析芯片内工作流程,即使用 MSND系统产生的测序数据。最初在Jurkat细胞和RNA对照样品上进行所述方案,且使用单个条型码((1)和(2))产生文库。然后在含有1,728个条型码的预先印刷的芯片上进行验证。将所得cDNA文库测序,然后使用MiXCR(Bolotin等人,(2015)Nat.Methods 12(5):380-381)分析。

  在使用单个条型码的验证实验中,最终文库中包括1,471个Jurkat细胞和6或48个PBMC RNA对照孔。这两个实验得到很多与TCR-α或TCR-β中的CDR3区对应的读数(操作1(1)和操作2(2)分别为约84%和约69%),这些读数中大多数用于克隆型呼叫。(1)中,超过99%的用于纯系型呼叫的读数鉴定出正确的Jurkat克隆型(TRAV8-4,TRAJ3/TRBV12-3,TRBJ1-2)。(2)中,在使用更多PBMC RNA对照样品下,此数目为约95%(剩余约5%的读数鉴定出PBMC RNA对照物中存在的替代克隆型)。

  然后测试预先印刷1,728个条型码的 MSND芯片上的工作流程。在此实验中,最终文库中包括824个Jurkat细胞、10个Jurkat RNA对照物和10个PBMC对照物。在此情况下,67%的读数与TCR-α或TCR-β中的CDR3区域对应。超过99%的用于纯系型呼叫的读数鉴定出正确的Jurkat克隆型(TRAV8-4,TRAJ3/TRBV12-3,TRBJ1-2),其充分表示α链和β链。下表中提供此数据的概述:

  

  

  进一步分析来自单个Jurkat细胞的测序读数的比对。对上文所述的实验中所包括的25个随机选择的细胞的测序数据进行分析以确定与TCR-α或TCR-β中的CDR3区域对应的测序读数的百分比。此分析的结果提供于图11中,其中“R”和“C”分别是指每个细胞的行和列位置。在大部分细胞(21/25)中,>60%读数与TCR-α或TCR-β序列对应。鉴定所有细胞的正确Jurkat克隆型(TRAV8-4,TRAJ3/TRBV12-3,TRBJ1-2)。来自对照孔的数据产生比对比率的类似范围。

  以上证明MSND格式的单细胞TCR概况分析可以产生每次约1,000个细胞的测序文库,且这些文库可以汇集在一起并成功地通过单次运行(例如单次运行)来分析。使用此方法,对个别Jurkat细胞的分析鉴定大部分细胞中>60%与TCR序列对应的读数,其中约70-80%的这些读数用于克隆型鉴定中。

  b.单引物介导的cDNA合成

  图12A-12D展示以上实例的变体,其中单个引物用以使用 MSND系统产生cDNA,所述cDNA根据本发明的实施方案进一步采用。如在以上实施例3a中,利用WaferGen(Fremont,CA) MSND系统分配纳升体积的细胞和试剂至 MSND芯片的孔中。

  图12A中所示的芯片内反应过程包括三个分配步骤。在“分配#_1”(单细胞溶液)中,使用MSND分配器将T细胞分配至WaferGen 72×72 SmartChip芯片中,所述芯片包括预先印刷的条型码化TSO,使用设计成能最大化如泊松统计所规定的单细胞产量的方法。条型码化TSO可以包含一个或多个引物结合位点和条型码序列。条型码序列可以为孔条型码序列,其指示72×72 SmartChip上序列所来源的孔。使用软体进行细胞的自动化成像。含有单细胞的孔向下选择,因此仅仅使用各条型码一次。通过冻融使细胞在芯片内溶解,且立即加工。

  在“分配#_2”(RT-PCR混合物)中,通过寡核苷酸dT引物启动第一股cDNA合成,且通过MMLV衍生的逆转录酶(RT)在细胞溶解缓冲液存在下进行。到达每个mRNA分子的5’末端后,RT将非模板核苷酸加入第一股cDNA。预先印刷的TSO含有与通过RT加入的非模板核苷酸互补且与第一股cDNA杂交的序列。在模板转换步骤中,RT使用TSO的其余部分作为模板以将其它序列合并在第一股cDNA的末端上。

  在所示方案中,TSO和CDS的末端序列相同,以能够进行双股cDNA合成的单个引物扩增。TSO可以含有一种或多种额外TSO特异性序列,其可以是例如引物结合位点、UMI、细胞/样品条型码等等。虽然仍在芯片上,但使用单个引物扩增cDNA,从而产生全长cDNA文库(如图12B中生物分析器迹线所示)。单个引物可以为新的引物,或其可以为用于逆转录中的TSO和CDS引物。

  如图12C中所示,从芯片移出样品并汇集在方案的“芯片外”部分。然后汇集的样品可以分割以产生两种样品。可以采用一种样品产生免疫细胞受体谱系测序文库。另一样品可以用于WTA或其它基因特异性扩增。

  如所示,用于产生免疫细胞受体谱系文库的样品可以使用TCRα/β基因特异性引物和TSO末端特异性引物扩增。也可以进行第二嵌套式PCR扩增。扩增可以产生含有TCRα和β受体的文库,如图12D中的生物分析器迹线所示。

  在以上方案的实现方式的一个实例中,分配两个芯片不同的T细胞系。芯片1具有188个TALL-104细胞、两个阳性对照孔(Jurkat RNA-5皮克/孔)和两个阴性对照孔。芯片2具有94个CCRF-CEM细胞、94个用PMA处理的CCRF-CEM细胞、两个阳性对照孔(Jurkat RNA-5皮克/孔)、两个阴性对照孔。

  在 MSND系统中分选细胞,并进行如上所述的TCR扩增方法。对文库进行测序和分析。如图13中所示,能够鉴定出用于实验中的CCRF和TALL细胞的TCRα和β受体。用PMA处理的CCRF细胞还展示α和β受体读数增加,这表明所述方法可以检测活化细胞中的受体。如图13所示,使用Excel过滤MiXCR输出,以界定TCRα和TCRβ克隆型的读数阈值(实线标志80个读数计数)超过1XPBS阴性对照。使用JMP软体分析数据且绘制成箱形图,其中下条表示第一四分位数且上条表示第三四分位数。每个点表示细胞中的TCRα和TCRβ克隆型。芯片内阴性对照用于设定阈值以区别样品与NTC或“无用”低读数克隆型。展示由未刺激和刺激的CCRF-CEM细胞和Jurkat RNA(阳性对照)产生的数据。用佛波醇肉豆蔻乙酸酯(PMA)诱导CCRF-CEM细胞增加TCRα基因的表达。使用用PMA处理和未用PMA处理的细胞产生CCRF-CEM数据。基于TCRα和TCRβ克隆型数据,用PMA处理CCRF-CEM细胞使呼叫速率增加四倍(从14%至52%)。

  图14A和14B展示从根据图12A至12D的方案产生的初始扩增双股cDNA样品分割的样品上成功的全转录物组扩增(WTA)。将通过分割扩增反应而产生的全转录物组扩增(WTA)用NEXTERATM核酸文库制备试剂盒(Illumina)处理以使扩增子成碎片且添加接头序列。使用对TSO特异性序列(例如引物结合位点)具有特异性的引物和对Nextera引入的接头具有特异性的引物扩增扩增子的5’末端。针对基因体覆盖率和主遗传组分,对5’差异表达文库测序和分析。如图14A和14B所示,5’DE文库制备方法充分地捕捉扩增子的5’末端且还鉴定不同的细胞类型。

  尽管随附条款,但本公开内容还由以下条款界定:

  1.一种由核糖核酸(RNA)样品制备表达文库和免疫细胞受体谱系文库的方法,所述方法包括:

  (a)使用模板转换逆转录反应,由RNA样品产生产物双股cDNA;

  (b)将所产生的产物双股cDNA分割为第一反应混合物和第二反应混合物;以及

  (c)末端捕捉所述产物双股cDNA以由所述第一反应混合物产生表达文库,并扩增所述产物双股cDNA的免疫细胞特异性cDNA以由所述第二反应混合物产生免疫细胞受体谱系文库。

  2.根据条款1的方法,其中所述末端捕捉和所述扩增同时发生。

  3.根据条款1的方法,其中所述末端捕捉和所述扩增相继发生。

  4.根据前述条款中任一项的方法,其中所述RNA样品从细胞样品获得。

  5.根据条款1至3中任一项的方法,其中所述RNA样品从单细胞获得。

  6.根据条款5的方法,其中所述单细胞是T细胞。

  7.根据条款5的方法,其中所述单细胞是B细胞。

  8.根据条款5至7中任一项的方法,其中所述方法还包括在所述分开前汇集由多个单细胞RNA样品产生的产物双股cDNA。

  9.根据条款5至8中任一项的方法,其中用于产生所述产物双股cDNA的引物或寡核苷酸包含鉴定产生所述产物双股cDNA的所述单细胞的索引序列。

  10.根据条款9的方法,其中所述引物或寡核苷酸为模板转换寡核苷酸。

  11.根据条款5至10中任一项的方法,其中所述单细胞从生物样品获得。

  12.根据条款11的方法,其中所述方法还包括使用细胞分选器分离所述单细胞。

  13.根据条款12的方法,其中所述细胞分选器是流式细胞仪。

  14.根据条款12的方法,其中所述细胞分选器是基于多孔的系统。

  15.根据前述条款中任一项的方法,其中所述表达文库是5’末端文库。

  16.根据条款1至14中任一项的方法,其中所述表达文库是3’末端文库。

  17.根据前述条款中任一项的方法,其中所述方法还包括对所述表达文库和所述免疫细胞受体谱系文库进行测序。

  18.根据条款17的方法,其中所述方法还包括对所测序的表达文库的差异表达分析。

  19.根据条款18的方法,其中所述差异表达分析包含全转录物组分析(WTA)。

  20.根据条款18或19的方法,其中所述差异表达分析包含靶向表达分析。

  21.根据条款20的方法,其中所述靶向表达分析包含免疫基因表达分析。

  22.根据前述条款中任一项的方法,其中所述免疫细胞受体特异性cDNA包含免疫细胞受体序列的5’末端。

  23.根据前述条款中任一项的方法,其中所述免疫细胞受体特异性cDNA包含全长免疫细胞受体序列。

  24.根据前述条款中任一项的方法,其中所述扩增包括使所述第二反应混合物与5’扩增引物和免疫细胞受体特异性扩增引物接触。

  25.根据条款24的方法,其中所述免疫细胞受体特异性扩增引物与免疫细胞受体的一条或多条链的恒定区特异性杂交。

  26.根据条款25的方法,其中所述免疫细胞受体是T细胞受体(TCR)。

  27.根据条款25或26的方法,其中所述一条或多条链是TCR-α链、TCR-β链或两者。

  28.根据条款25的方法,其中所述免疫细胞受体是B细胞受体(BCR)。

  29.根据条款25或28的方法,其中所述一条或多条链是免疫球蛋白链。

  30.根据条款24至29中任一项的方法,其中所述免疫细胞受体特异性扩增引物包含一个或多个测序平台接头构建体。

  31.根据条款24至30中任一项的方法,其中所述5’扩增引物包含索引序列。

  32.根据条款24至31中任一项的方法,其中所述5’扩增引物包含一个或多个测序平台接头构建体。

  33.根据前述条款中任一项的方法,其中所述末端捕捉包括使所述第一反应混合物与末端扩增引物接触。

  34.根据条款33的方法,其中所述末端捕捉包含5’末端捕捉。

  35.根据条款34的方法,其中所述5’末端捕捉包括使所述第一反应混合物与5’末端扩增引物接触。

  36.根据条款35的方法,其中所述5’末端扩增引物包含一个或多个测序平台接头构建体。

  37.根据条款33的方法,其中所述末端捕捉包含3’末端捕捉。

  38.根据条款37的方法,其中所述3’末端捕捉包括使所述第一反应混合物与3’末端扩增引物接触。

  39.根据条款38的方法,其中所述3’末端扩增引物包含一个或多个测序平台接头构建体。

  40.根据前述条款中任一项的方法,其中所述最终捕捉包括标签化以将标签化后的扩增引物结合域添加至所述产物双股cDNA。

  41.根据条款40的方法,其中所述标签化包括使用末端扩增引物和与标签化后扩增引物结合域杂交的标签化后扩增引物扩增所述产物双股cDNA。

  42.根据条款40或41的方法,其中所述标签化还包括使所述产物双股cDNA与Tn5转座酶接触。

  43.根据前述条款中任一项的方法,其中产生所述产物双股cDNA包括在足以产生所述产物双股cDNA的条件下在反应混合物中组合:

  所述RNA样品;

  第一股互补脱氧核糖核酸(cDNA)引物;

  包含3’杂交结构域和5’接头序列结合域的模板转换寡核苷酸;

  逆转录酶;以及

  dNTP。

  44.根据前述条款中任一项的方法,其中所述方法还包括对所述单细胞的基因组DNA(gDNA)测序。

  45.根据条款44的方法,其中所述方法还包括在所述测序前分离所述单细胞的所述gDNA。

  46.根据条款44或45的方法,其中对所述单细胞的gDNA测序包含免疫基因座特异性测序。

  47.根据条款46的方法,其中所述免疫基因座特异性测序包含T细胞受体(TCR)基因座特异性测序。

  48.根据条款46或47的方法,其中所述免疫基因座特异性测序包含B细胞受体(BCR)基因座特异性测序。

  49.根据条款44至48中任一项的方法,其中对所述单细胞的gDNA测序包含全基因组测序。

  50.根据前述条款中任一项的方法,其中所述表达文库是全长表达文库。

  51.一种试剂盒,其包含:

  5’扩增引物;

  免疫细胞受体特异性扩增引物;以及

  末端扩增引物。

  52.根据条款51的试剂盒,其中所述试剂盒还包含聚(dT)引物。

  53.根据条款51或52的试剂盒,其中所述5’扩增引物包含索引序列。

  54.根据条款51至53中任一项的试剂盒,其中所述5’扩增引物包含一个或多个测序平台接头构建体。

  55.根据条款51至54中任一项的试剂盒,其中所述免疫细胞受体特异性扩增引物包含索引序列。

  56.根据条款51至55中任一项的试剂盒,其中所述免疫细胞受体特异性扩增引物包含一个或多个测序平台接头构建体。

  57.根据条款51至56中任一项的试剂盒,其中所述末端扩增引物包含索引序列。

  58.根据条款51至57中任一项的试剂盒,其中所述末端扩增引物包含一个或多个测序平台接头构建体。

  59.根据条款51至58中任一项的试剂盒,其中所述末端扩增引物是5’末端扩增引物。

  60.根据条款51至58中任一项的试剂盒,其中所述末端扩增引物是3’末端扩增引物。

  61.根据条款51至60中任一项的试剂盒,其中所述试剂盒还包含一种或多种用于进行模板转换逆转录反应的组分,其包含包括5’接头序列的模板转换寡核苷酸。

  62.根据条款61的试剂盒,其中所述5’扩增引物包含所述5’接头序列或其互补序列。

  63.根据条款61或62的试剂盒,其中所述末端扩增引物包含所述5’接头序列或其互补序列。

  64.根据条款51至63中任一项的试剂盒,其中所述试剂盒包含第二5’扩增引物,所述第二5’扩增引物包含与所述5’扩增引物的5’部分同一的序列。

  65.根据条款51至64中任一项的试剂盒,其中所述试剂盒包含第二免疫细胞受体特异性扩增引物,所述第二免疫细胞受体特异性扩增引物包含与所述免疫细胞受体特异性扩增引物的一部分同一的序列。

  66.根据条款65的试剂盒,其中所述部分是所述免疫细胞受体特异性扩增引物的5’部分。

  67.根据条款65的试剂盒,其中所述部分是所述免疫细胞受体特异性扩增引物的3’部分。

  68.根据条款51至67中任一项的试剂盒,其中所述试剂盒还包含一种或多种用于进行标签化反应的组分。

  69.根据条款68的试剂盒,其中所述一种或多种用于进行标签化反应的组分包含:

  转座子核酸,其包含标签化后扩增引物结合域;

  标签化后扩增引物,其与所述标签化后扩增引物结合域杂交;

  转座酶;或

  其组合。

  70.根据条款69的试剂盒,其中所述转座酶是Tn5转座酶。

  71.一种由多个单细胞制备免疫细胞受体谱系文库的方法,所述方法包括:

  (a)从所述多个单细胞中的每个单细胞分离RNA样品;

  (b)使用模板转换逆转录反应,由所述RNA样品产生索引产物双股cDNA;

  (c)汇集所产生的索引产物双股cDNA;

  (d)扩增所述索引产物双股cDNA的免疫细胞特异性cDNA以产生包含单细胞索引免疫细胞特异性cDNA的免疫细胞受体谱系文库。

  72.根据条款71的方法,其中所述单细胞是T细胞。

  73.根据条款71的方法,其中所述单细胞是B细胞。

  74.根据条款71至73中任一项的方法,其中用于产生所述索引产物双股cDNA的引物或寡核苷酸包含鉴定所述单细胞的索引序列。

  75.根据条款74的方法,其中所述引物或寡核苷酸为模板转换寡核苷酸。

  76.根据条款74的方法,其中所述引物或寡核苷酸是包含与用于所述模板转换逆转录反应中的模板转换寡核苷酸的5’部分同一的序列的5’扩增引物。

  77.根据条款71至76中任一项的方法,其中所述索引免疫细胞受体特异性cDNA包含免疫细胞受体序列的5’末端。

  78.根据条款71至77中任一项的方法,其中所述索引免疫细胞受体特异性cDNA包含全长免疫细胞受体序列。

  79.根据条款71至78中任一项的方法,其中所述扩增包括使所述汇集的索引产物双股互补cDNA与5’扩增引物和免疫细胞受体特异性扩增引物接触。

  80.根据条款79的方法,其中所述免疫细胞受体特异性扩增引物与免疫细胞受体的一条或多条链的恒定区特异性杂交。

  81.根据条款80的方法,其中所述免疫细胞受体是T细胞受体(TCR)。

  82.根据条款81的方法,其中所述一条或多条链是TCR-α链、TCR-β链或两者。

  83.根据条款80的方法,其中所述免疫细胞受体是B细胞受体(BCR)。

  84.根据条款83的方法,其中所述一条或多条链是免疫球蛋白链。

  85.根据条款79至84中任一项的方法,其中所述免疫细胞受体特异性扩增引物包含一个或多个测序平台接头构建体。

  86.根据条款79至85中任一项的方法,其中所述5’扩增引物包含索引序列。

  87.根据条款79至86中任一项的方法,其中所述5’扩增引物包含一个或多个测序平台接头构建体。

  88.根据条款79至87中任一项的方法,其中所述单细胞从生物样品获得。

  89.根据条款88的方法,其中所述方法还包括使用细胞分选器分离所述单细胞。

  90.根据条款89的方法,其中所述细胞分选器是流式细胞仪。

  91.根据条款89的方法,其中所述细胞分选器是基于多孔的系统。

  92.根据条款71至91中任一项的方法,其中所述方法还包括对所述单细胞的基因组DNA(gDNA)测序。

  93.根据条款92的方法,其中所述方法还包括在所述测序前分离所述单细胞的所述gDNA。

  94.根据条款92或93的方法,其中对所述单细胞的gDNA测序包含免疫基因座特异性测序。

  95.根据条款94的方法,其中所述免疫基因座特异性测序包含T细胞受体(TCR)基因座特异性测序。

  96.根据条款94或95的方法,其中所述免疫基因座特异性测序包含B细胞受体(BCR)基因座特异性测序。

  97.根据条款92至96中任一项的方法,其中对所述单细胞的gDNA测序包含全基因组测序。

  98.根据条款71至97中任一项的方法,其中所述方法还包括对所述免疫细胞受体谱系文库测序。

  99.一种试剂盒,其包含:

  包含5’接头序列的模板转换寡核苷酸;

  包含所述5’接头序列的5’扩增引物;以及

  免疫细胞受体特异性扩增引物。

  100.根据条款99的试剂盒,其中所述模板转换寡核苷酸包含索引序列。

  101.根据条款99或100的试剂盒,其中所述5’扩增引物包含索引序列。

  102.根据条款99至101中任一项的试剂盒,其中所述5’扩增引物包含一个或多个测序平台接头构建体。

  103.根据条款99至102中任一项的试剂盒,其中所述免疫细胞受体特异性扩增引物包含索引序列。

  104.根据条款99至103中任一项的试剂盒,其中所述免疫细胞受体特异性扩增引物包含一个或多个测序平台接头构建体。

  105.根据条款99至104中任一项的试剂盒,其中所述试剂盒还包含聚(dT)引物。

  106.根据条款99至105中任一项的试剂盒,其中除所述模板转换寡核苷酸外,所述试剂盒还包含一种或多种用于进行模板转换逆转录反应的组分。

  107.根据条款99至106中任一项的试剂盒,其中所述试剂盒包含第二5’扩增引物。

  108.根据条款107的试剂盒,其中所述第二5’扩增引物包含一个或多个测序平台接头构建体。

  109.根据条款107或108的试剂盒,其中所述第二5’扩增引物包含与所述5’扩增引物的5’部分同一的序列。

  110.根据条款107至109中任一项的试剂盒,其中所述试剂盒还包含第三5’扩增引物。

  111.根据条款110的试剂盒,其中所述第三5’扩增引物包含一个或多个测序平台接头构建体。

  112.根据条款110或111的试剂盒,其中所述第三5’扩增引物包含与所述第二5’扩增引物的5’部分同一的序列。

  113.根据条款107或108的试剂盒,其中所述第二5'扩增引物包含与附接于所述5’扩增引物的5’非模板序列中存在的引物结合位点杂交的序列。

  114.根据条款99至113中任一项的试剂盒,其中所述试剂盒包含第二免疫细胞受体特异性扩增引物,所述第二免疫细胞受体特异性扩增引物包含与所述免疫细胞受体特异性扩增引物的一部分同一的序列。

  115.根据条款99至114中任一项的试剂盒,其中所述部分是所述免疫细胞受体特异性扩增引物的5’部分。

  116.根据条款99至114中任一项的试剂盒,其中所述部分是所述免疫细胞受体特异性扩增引物的3’部分。

  虽然为了清楚理解,以上发明已经借助于图例和实施例相当详细地描述,但本领域的一般技术人员根据本发明的教示内容显而易见可以在不脱离随附权利要求书的精神或范围下进行某些改变和修改。

  因此,前述内容仅仅说明本发明的原理。应了解本领域的技术人员将能够设计出多种布置,虽然本文中未明确描述或展示这些布置,但其体现了本发明的原理且包括在其精神和范围内。此外,本文中叙述的所有实施例和条件性语言主要打算帮助读者理解本发明的原理和本发明人为深化本领域而提出的概念,且将视为不限于此类特定叙述的实施例和条件。此外,本文中叙述本发明的原理、方面和实施方案的所有声明以及其特定实施例打算涵盖其结构和功能同等物。另外,打算此类同等物包括当前已知的同等物和将来研发的同等物,即不管结构如何,执行相同功能的任何研发要素。因此,本发明的范围不意图限于本文所示和所述的例示性实施方案。更确切些,本发明的范围和精神由随附权利要求书体现。

《制备核酸文库的方法和用于实施所述方法的组合物和试剂盒.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)