单细胞基因组测序用的DNA文库的构建方法
技术领域
本发明涉及生物技术,特别是涉及一种单细胞基因组测序用的DNA文库的构建方法。
背景技术
单细胞基因组测序技术是在单细胞水平对全基因组进行扩增和测序的一项技术。其原理是将分离的单个细胞的全基因组DNA进行扩增,获得高覆盖率的完整的基因组后进行高通量测序,可用于揭示细胞群中个体差异和细胞进化关系。
目前,单细胞基因组测序首先需要构建单细胞基因组文库,然后再进行测序分析。然而在构建单细胞基因组文库时,要依赖于昂贵的微流控平台及试剂对单细胞进行分离,此操作较为繁琐、成本较高。
发明内容
基于此,有必要提供一种快捷、成本较低的单细胞基因组测序用的DNA文库的构建方法。
一种单细胞基因组测序用的DNA文库的构建方法,包括:
将细胞核内的DNA片段化,得到DNA被片段化的细胞核;
采用不同的序列标签对多个所述细胞核内的片段化DNA进行多轮标记,使得各所述细胞核内的片段化 DNA连接有由多个所述序列标签组成的标签码,各所述细胞核的片段化DNA连接的标签码各不同;及
扩增所述连接有标签码的片段化DNA,得到单细胞基因组测序用的DNA文库。
上述细胞基因组测序用的DNA文库的构建方法。通过将细胞核作为标记DNA的反应室,采用不同的序列标签对细胞核内的DNA进行多轮标记,最终使得每个细胞核内的DNA都连上一个经多轮标记而形成的独特标签码,以该标签码区分不同的细胞核,从而实现单个细胞的区分。该方法操作简便、且成本较低。
附图说明
图1为实施例1的单细胞DNA片段分布图;图2为实施例1的细胞区分效率图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的部分实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使本发明公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
一实施方式的单细胞基因组测序用的DNA文库的构建方法,该方法通过将细胞核作为标记DNA的反应场所,采用不同的序列标签对细胞核内的DNA进行多轮标记,最终使得每个细胞核内的DNA都连上一个经多轮标记而形成的独特标签码,以该标签码区分不同的细胞核,从而实现单个细胞的区分。以序列标签种类为96种为例,经过一轮标记之后就形成96种标记,经过两轮标记之后能形成9216种标记,经三轮标记之后就能形成884736种标记。因此,若待区分的细胞个数小于884736,则经过三轮标记就能使得各个细胞核中的DNA连接的标签码各不相同。该方法不必使用微流控技术区分单个细胞,通过多轮DNA标记(DNA连接反应)就能实现单个细胞的区分,操作简便,成本低,是一种快捷且成本较低的单细胞基因组测序用的DNA 文库的构建方法。
具体地,该单细胞基因组测序用的DNA文库的构建方法包括步骤S110~步骤S130。
步骤S110:将细胞核内的DNA片段化,得到DNA被片段化的细胞核。
具体地,收集细胞并计数,然后将细胞的细胞膜裂解,得到细胞核;然后将细胞核内的DNA片段化,得到DNA被片段化的细胞核。将细胞核内的DNA片段化便于加上序列标签。
在本实施方式中,细胞的计数采用先甲醛固定后计数的方式。具体地,先将收集的细胞与甲醛混合,使得细胞固定以便计数,然后对固定的细胞进行计数。当然,在其他实施方式中,也可以采用其他本领域常用的细胞计数方式进行细胞计数。
在本实施方式中,将细胞核内的DNA片段化的方式为酶切。具体地,酶切所用的酶为Dpn II。在标记之前将细胞核内的DNA片段化,使得DNA有粘性末端出现,便于序列标签与DNA连接。
步骤S120:采用不同的序列标签对多个细胞核内的片段化DNA进行多轮标记,使得各细胞核内的片段化DNA连接有由多个序列标签组成的标签码,各细胞核的片段化DNA连接的标签码各不同。
具体地,序列标签为碱基序列,用于形成标签码。在测序时,同一个细胞核内的片段化DNA连接的标签码相同,不同细胞核内的片段化DNA连接的标签码不同。通过识别标签码而区分不同的细胞核内的片段化 DNA,从而实现单细胞基因组测序。序列标签包括识别部(barcode),识别部起标识作用。在本实施方式中,序列标签为200种,200种序列标签的识别部的碱基序列如SEQ ID No.1~SEQ ID No.200所示。进一步地,序列标签还包括连接部(linker),连接部用于序列标签之间的连接。更进一步地,识别部与连接部通过碱基互补配对的方式连接。
当然,在其他实施方式中,标签序列不限于200种,可以根据需要区分的细胞的总数及标记的轮数进行选择,例如可以是48种、96种、384种等。序列标签的识别部的碱基序列也不限于上述SEQ ID No.1~SEQ ID No.200所示的碱基序列,可以根据实际需求进行选择,只要能够其识别作用即可。
进一步地,采用不同的序列标签对多个细胞核内的片段化DNA进行多轮标记,使得各细胞核内的片段化 DNA连接有由多个序列标签组成的标签码,各细胞核的片段化DNA连接的标签码各不同的步骤包括步骤 S121~步骤S123。
步骤S121:将多个DNA被片段化的细胞核分组后,采用不同的第一序列标签对各组细胞核内的片段化 DNA进行标记,使得各组细胞核内的片段化DNA均连接上第一序列标签,各组细胞核的片段化DNA连接的第一序列标签各不相同,得到多组一级标记细胞核。其中,第一序列标签包括用于标识的第一序列和用于与第二序列标签连接的第一连接序列。第一序列与第一连接序列、第一连接序列与第二序列标签均通过碱基互补配对的方式连接。进一步地,第一序列的5’端连接有磷酸基团。通过磷酸基团能够使得第一序列与片段化DNA连接。
在本实施方式中,第一序列的碱基序列选自如SEQ ID No.1~SEQ ID No.96所示的碱基序列中的一种;第一连接序列的碱基序列如SEQ ID No.201所示。当然,第一序列的碱基序列不限于上述SEQ ID No.1~SEQ ID No.96所示的碱基序列中的一种。在其他实施方式中,还可以是本领域其他常用于起标识作用的碱基序列或根据本领域的常规方法设计的用于起标识作用的碱基序列;同样地,第一连接序列的碱基序列也不限于上述SEQ IDNo.201所示的碱基序列。
在本实施方式中,多个细胞的细胞核的分组方式为随机均等分组。
具体地,将多个DNA被片段化的细胞核分组后与不同的第一序列标签混合,然后孵育,得到多组含有不同第一序列标签的预连接液;及向各组预连接液中加入DNA连接酶,然后孵育,得到多组一级标记细胞核。通过先将第一序列标签与细胞核混合孵育之后,再加入连接酶孵育,使得第一序列标签先进入细胞核内与细胞核内的片段化DNA混合,使得多个片段化DNA被第一序列标签间隔,减少多个片段化DNA间的互联。
进一步地,多个DNA被片段化的细胞核均分到含有第一序列标签的不同反应容器(例如EP管或多孔板) 中混合,其中不同的反应容器中的第一序列标签不同;然后孵育,得到多组含有不同第一序列标签的预连接液。向多组含有不同第一序列标签的预连接液中加入DNA连接酶并孵育,使得反应容器中细胞核内的片段化 DNA与第一序列标签发生连接反应,从而得到多组一级标记细胞核。其中,同一反应容器内的细胞核内的片段化DNA均连接上相同的第一序列标签,不同反应容器内的细胞核内的片段化DNA连接上的第一序列标签各不相同。
在其中一个实施例中,在将多个DNA被片段化的细胞核分组后,采用不同的第一序列标签对各组所述细胞核内的片段化DNA进行标记,使得各组所述细胞核内的片段化DNA均连接上所述第一序列标签,各组所述细胞核的片段化DNA连接的第一序列标签各不相同,得到多组一级标记细胞核的步骤之后,还包括将各组一级标记细胞核分别与阻断序列混合的步骤。一般地,采用过量的第一序列标签与细胞核混合,使得细胞核内的所有片段化DNA均连接上第一序列标签,所以,在连接反应结束之后,会有游离的第一序列标签。此时,若直接将各个反应容器中的细胞核混合,则可能会干扰下一轮的标记。因此,通过向连接反应结束后的反应容器中加入阻断序列,使得阻断序列与各反应容器中游离的第一序列标签结合,减少上一轮标记对下一轮标记的影响。
在本实施方式中,阻断序列的碱基序列如SEQ ID No.203所示。当然,阻断序列的碱基序列不限于如SEQ ID No.203所示的碱基序列。在其他实施方式中,还可以是本领域其他常用于阻断的碱基序列或根据本领域的常规方法设计的用于起阻断作用的碱基序列。
步骤S122:将多组一级标记细胞核混合后分组,然后采用不同的第二序列标签对分组后的一级标记细胞核内的片段化DNA进行标记,使得各组一级标记细胞核内的片段化DNA均连接上第二序列标签,各组一级标记细胞核的片段化DNA连接的第二序列标签各不相同,得到多组二级标记细胞核。其中,第二序列标签包括用于标识的第二序列和用于与第一序列标签连接的第二连接序列。
在本实施方式中,第二序列的碱基序列选自如SEQ ID No.97~SEQ ID No.192所示的碱基序列中的一种;第二连接序列的碱基序列如SEQ ID No.202所示。当然,在其他实施方式中,第二序列的碱基序列不限于上述SEQ ID No.97~SEQ ID No.192所示的碱基序列中的一种,还可以是本领域常用的其他碱基序列或根据本领域的常规方法设计的用于起标识作用的碱基序列;同样地,第二连接序列的碱基序列也不限于上述SEQ ID No.202所示的碱基序列。
进一步地,第二序列的5’端连接有生物素,以便于后续连接有标签码的片段化DNA的纯化。
在本实施方式中,多组一级标记细胞核混合后分组的方式为随机均等分组。
更具体地,将多个一级标记细胞核均分到含有第二序列标签的不同反应容器中混合,其中不同反应容器中的第二序列标签不同;然后孵育,得到多组含有不同第二序列标签的预连接液。向多组含有不同第二序列标签的预连接液中加入DNA连接酶并孵育,使得反应容器中细胞核内片段化DNA的第一序列标签与第二序列标签发生连接反应,从而得到多组二级标记细胞核。其中,同一反应容器内的细胞核内的片段化DNA均连接上相同的第二序列标签,不同反应容器内的细胞核内的片段化DNA连接上的第二序列标签各不相同。
步骤S123:将多组二级标记细胞核混合后分组,然后采用不同的第三序列标签对分组后的二级标记细胞核内的片段化DNA进行标记,使得各组二级标记细胞核的片段化DNA均连接上第三序列标签,各组二级标记细胞核的DNA连接的第三序列标签各不相同,得到多组三级标记细胞核。其中,第三序列标签包括用于标识的第三序列。
在本实施方式中,第三序列的碱基序列选自如SEQ ID No.193~SEQ ID No.200所示的碱基序列中的一种。当然,在其他实施方式中,第三序列的碱基序列不限于上述SEQ IDNo.193~SEQ ID No.200所示的碱基序列中的一种,还可以是本领域常用的其他碱基序列或根据本领域的常规方法设计的用于起标识作用的碱基序列。
更具体地,将多个二级标记细胞核均分到含有第三序列标签的不同反应容器中混合,其中不同反应容器中的第三序列标签不同;然后孵育,得到多组含有不同第三序列标签的预连接液。向多组含有不同第三序列标签的预连接液中加入DNA连接酶并孵育,使得反应容器中细胞核内片段化DNA的第二序列标签和第三序列标签发生连接反应,从而得到多组三级标记细胞核。其中,同一反应容器内的细胞核内的片段化DNA均连接上相同的第三序列标签,不同反应容器内的细胞核内的片段化DNA连接上的第三序列标签各不相同。
需要说明的是,本实施方式中,第一序列标签、第二序列标签及第三序列标签的起标识作用的序列均各不相同。当然,在其他一些实施方式中,第一序列标签、第二序列标签及第三序列标签起标识作用的序列可以相同。例如,第一标签的第一序列和第二标签的第二序列均是如SEQ ID No.1~SEQ ID No.96所示的碱基序列。
本实施方式中,通过三轮标记形成各细胞核内的DNA的标签码。第一序列标签的种类数与第二序列标签的种类数和第三序列标签的种类数之积大于DNA被片段化的细胞核的个数;三轮标记之后,各细胞核内的 DNA的标签码由各细胞核内的DNA对应的第一序列标签、第二序列标签及第三序列标签依次连接而成。当然,用作区分不同细胞核的DNA的标签码的形成所需的轮数不限于三轮,还可以根据需要区分的细胞核的个数及序列标签的种类数进行设计。
当然,在获得各所述细胞核的片段化DNA连接的标签码各不同的步骤之后,还包括裂解细胞核,并纯化连接有标签码的DNA的步骤。例如,若标签码的形成只需三轮,则在获得三级标记的细胞核的步骤之后,还包括将三级标记的细胞核裂解,并纯化释放的连接有第一序列标签、第二序列标签及第三序列标签的DNA,得到连接有标签码的DNA。
步骤S130:扩增连接有标签码的片段化DNA,得到单细胞基因组测序用的DNA文库。
具体地,将连接有标签码的片段化DNA采用Tagmentation技术片段化并接上建库接头,得到多个长度更短的连接有标签码的片段化DNA;然后扩增长度更短的连接有标签码的片段化DNA,得到单细胞基因组测序用的DNA文库。当然,在其他实施方式中,也可以采用本领域常用的其他方法将连接有标签码的片段化DNA片段化并连接上建库接头。
另一实施方式的单细胞基因组测序用的DNA文库的构建方法,该单细胞基因组测序用的DNA文库的构建方法的步骤大致与上述单细胞基因组测序用的DNA文库的构建方法相同,其不同在于使各个细胞核的片段化DNA连接的标签码各不同的步骤,该单细胞基因组测序用的DNA文库的构建方法使各个细胞核的片段化DNA连接的标签码各不同的步骤包括:
将多个DNA被片段化的细胞核分组后,采用不同的第一序列标签对各组细胞核内的片段化DNA进行标记,使得各组细胞核内的片段化DNA均连接上第一序列标签,各组细胞核的片段化DNA连接的第一序列标签各不相同,得到多组一级标记细胞核,其中,第一序列标签为序列标签;
将多组一级标记细胞核混合后分组,然后采用不同的第二序列标签对分组后的一级标记细胞核内的片段化DNA进行标记,使得各组一级标记细胞核内的片段化DNA均连接上第二序列标签,各组一级标记细胞核的片段化DNA连接的第二序列标签各不相同,得到多组二级标记细胞核,其中,第二序列标签为序列标签;
将多组二级标记细胞核混合后均等分组,各组的细胞核的数量小于第一序列标签的种类数与第二序列标签的种类数之积,得到多组待裂解液,待裂解液中各细胞核内的片段化DNA连接有由第一序列标签和第二序列标签组成的标签码,各细胞核的片段化DNA连接的标签码各不同;或同一组待裂解液中的细胞核的片段化 DNA连接的标签码相同的概率小于5%;
裂解其中一组待裂解液,以释放待裂解液中各细胞核内的连接有第一序列标签及第二序列标签的片段化 DNA,然后通过Tagmentation技术将连接有第一序列标签及第二序列标签的片段化DNA片段化,并连接上含有第三序列标签的建库接头,得到多个连接有由第一序列标签、第二序列标签及第三序列标签组成的标签码的片段化DNA,各片段化后的DNA连接的含有第三序列标签的标签码各不相同。
该实施方式的单细胞基因组测序用的DNA文库的构建方法中通过以多组二级标记细胞核混合后均等分组,并各组的细胞核的数量小于第一序列标签的种类数与第二序列标签的种类数之积的方式替代第三轮标记,在各组细胞核裂解后,各细胞核内的片段化DNA连接有由第一序列标签和第二序列标签组成的标签码,各细胞核的片段化DNA连接的标签码各不同。
具体实施例
以下结合具体实施例进行详细说明。实施例中采用药物和仪器如非特别说明,均为本领域常规选择。实施例中未注明具体条件的实验方法,按照常规条件,例如文献、书本中所述的条件或者生产厂家推荐的方法实现。
实施例1
(1)委托上海生工生物工程技术服务有限公司合成第一序列标签、第二序列标签、阻断序列及建库接头。其中:第一序列标签共96种,每种第一序列标签均由第一连接序列及与第一连接序列连接的第一序列组成,第一序列有96种,96种第一序列的碱基序列如SEQID No.1~SEQ ID No.96所示,96种第一序列的5’端均连接有磷酸基团,96种第一序列标签的第一连接序列的碱基序列均如SEQ ID No.201所示。第二序列标签共96 种,每种第二序列标签均由第二连接序列及与第二连接序列连接的第二序列组成,第二序列有96种,96种第二序列的碱基序列如SEQ ID No.97~SEQ ID No.192所示,96种第二序列的5’端均连接有生物素,96种第二序列标签的第二连接序列的碱基序列均如SEQ ID No.202所示。阻断序列能与96种第一连接序列的5’端的碱基互补配对,阻断序列的碱基序列如SEQ ID No.203所示。建库接头包括i5端接头及8种i7端接头,i5端接头的碱基序列如SEQ ID No.204所示,8种i7端接头的碱基序列如SEQ ID No.205~SEQ ID No.212所示,8 种i7端接头的包括8种第三序列标签,8种第三序列标签的序列如8种SEQ ID No.193~SEQ ID No.200所示。
(2)收集细胞并交联:收集人细胞(293T)和鼠细胞(CT26)并分别进行交联,人细胞和鼠细胞的操作均如下:A、离心收集新鲜培养的细胞1×106个,1500rpm,3min,并重悬至1mL DMEM培养基中。B、加312.5μL 16%甲醛(浓度为1%)至步骤A的细胞悬液中对细胞进行固定,并室温旋转孵育10min。C、向步骤B中孵育后的细胞悬浮液加入312.5μL 2M甘氨酸(终浓度为0.125M),室温旋转孵育5min,终止交联反应。然后在冰上孵育15min。D、1500rpm离心3min,收集细胞。E、1×PBS缓冲液清洗一次。F、弃去上清后,细胞可直接进行裂解提取细胞核,也可以暂存于-80℃。
(3)裂解细胞并将细胞核内的DNA片段化:
A、将步骤(2)获得的人细胞和鼠细胞分别计算,然后按照1:1混合,使得细胞总数为1×105个。B、加500μL预冷的裂解缓冲液(由10mM Tris-HCl pH 8.0、10mM NaCl、0.2%Igepal CA-630、EDTA-free蛋白酶抑制剂组成的混合物)至步骤A获得的人细胞与鼠细胞的混合物中,充分重悬,冰上孵育30min,使细胞充分裂解。C、4℃,650g,离心5min,去掉上清,收集细胞核。D、500μL 1×Dpn II缓冲液清洗细胞核两次。E、362μL 1×Dpn II重悬细胞核。F、增加细胞核膜通透性:加38μL 1%SDS入步骤E的细胞核中,小心吹打混匀,避免产生气泡。65℃孵育10min后迅速插入冰上,并加入44μL 10%Triton X-100,小心吹打混匀,避免产生气泡。G、酶切消化染色体:增加细胞核膜通透性后,加入50μL 1%BSA,10μL 10×DpnII 缓冲液和20μL Dpn II(NEB),于37℃旋转孵育(50rpm)过夜。
(4)对细胞核内的DNA进行标记
A、65℃处理细胞核20min,使Dpn II失活。B、将细胞核依次通过孔径为40μm和20μm的过滤器,去除粘连在一起的细胞团。C、准备2块96孔板,制备第一序列标签和第二序列标签:1)第一序列标签:第一轮用的96种第一序列标签中,每种第一序列的终浓度为14μM,第一连接序列的终浓度13μM。先在96孔板的每个反应孔中添加14μL第一序列,各个孔中第一序列各不相同;然后向每个添加有第一序列的反应孔中添加13μL的第一连接序列;最后向每个添加了第一连接序列的反应孔中添加73μL的水。2)第二序列标签:第二轮用的96种第二序列标签中,每种第二序列的终浓度为16μM,第二连接序列的终浓度15μM。先在96孔板的每个反应孔中添加16μL第二序列,各个反应孔中第二序列各不相同;然后向每个添加有第二序列的反应孔中添加15μL的第二连接序列;最后向每个添加了第二连接序列的反应孔中添加69μL的水。使用前,对于每个96孔板,用以下热循环操作进行退火:加热到95℃,持续2min;然后下降到20℃,速率为-0.1℃/s;然后4℃,得到第一轮标记用的96孔板及第二轮标记用的96孔板。D、第一轮连接:1)按照表1配置细胞核溶液,然后将得到的细胞核溶液分至第一轮标记用的96孔板的每个反应孔,每个反应孔10μL,用枪头充分吹打混匀。然后用胶合板密封盖好,37℃培养箱中缓慢旋转孵育30min。
表1
2)按照表2配置连接酶溶液,将连接酶溶液分至已加入细胞核及连接酶缓冲液的96孔板的反应孔,每个反应孔10μL,用枪头充吹打混匀。然后用胶合板密封盖好,室温缓慢旋转孵育2小时。
表2
3)第一轮连接的阻断:在步骤2)孵育结束后的每个反应孔中加入10μL的阻断序列,用自粘封板膜密封,37℃培养箱中缓慢旋转(50rpm)孵育30min。
E、阻断结束后,取出96孔板,取下封板膜,将所有细胞核转入分液槽进行合并。F、通过20μm过滤器后转入新分液槽,以除去粘连的细胞核团。G、第二轮连接:将100μL T4 DNA连接酶加入细胞核溶液中,吹打20次混合,避免产生气泡。将细胞核转移至装有已退火的第二轮标记用的96孔板中,每个反应孔28μL。放入37℃培养箱中缓慢旋转(50rpm)孵育30min。H、终止连接反应:在新的分液槽中加入终止反应液(由 400mL 0.5M EDTApH8.0和800mLH2O组成)。然后将步骤G孵育后的细胞核转移至分液槽中,每次转入时将细胞核与终止反应液充分吹打混匀再加入新的细胞核。I、将所有细胞核转到一个15mL的离心管中,得到约5mL的二级标记细胞核溶液,该二级标记细胞核内的片段化DNA依次连接有第一序列标签和第二序列标签。
(5)DNA与蛋白解交联、裂解细胞核:
A、按照表3准备2×的裂解缓冲液:
表3
B、准备下述清洗缓冲液:
表4
C、按100:1的比例添加10%Triton X-100到步骤(4)得到的二级标记细胞核溶液中(Triton X-100的终浓度为0.1%)。D、4℃,1000g,离心5min,小心弃去上清后,加4mL清洗缓冲液重悬沉淀,充分混匀,清洗细胞核。E、4℃,1000g离心5min。然后吸入上清液,重新悬浮于50μL PBS中。F、取5μL到5μL 的1×PBS中,用血细胞板计数。H、根据第一序列标签及第二序列标签的种类数量确定子库含有的细胞数量,本实施例中,每个子库中的细胞数量均小于1800个。I、将每个子库所需的细胞数放入新的1.7mL试管中。每管加入1×PBS,最终体积为50μL。J、每管加入50μL 2×裂解缓冲液。K、在每个裂解液中加入10 μL蛋白酶K(20mg/mL)。L、在55℃反应2小时或过夜。
(6)连接有第一序列标签和第二序列标签的片段化DNA的纯化:
A、取2μL链霉亲和素磁珠加到装有400μL Tween Wash Buffer(TWB)的1.5毫升管中。室温旋转混匀2 min。其中,TWB配方如表5所示:
表5
B、将离心管置于磁力架上,待至溶液变澄清,吸去上清。C、再次重复步骤A和步骤B。D、用dd H2O 将步骤C得到的细胞核裂解液体积增加到400μL。E、将400μL 2×Binding缓冲液(BB)与400μL细胞核裂解液重悬磁珠。2×Binding缓冲液(BB)的配方如表6所示:
表6
F、在室温条件下旋转孵育15min,使被生物素标记的片段结合到链霉亲和素磁珠上。G、将离心管置于磁力架上。待至溶液变澄清,弃上清。H、用400μL 1×Binding缓冲液重悬磁珠并转移到新的LoBind管。I、将离心管置于磁力架上。待至溶液变澄清,弃上清。J、用100μL 1×Binding缓冲液重悬磁珠并转移到新的 LoBind管。K、将离心管置于磁力架上。待至溶液变澄清,弃上清。I、加20μL ddH2O重悬磁珠。
(7)采用Tagmentation技术将DNA打成小片段并插入建库接头:
A在冰上融化5×TTBL缓冲液并按表7进行tagmentation反应:先将TTBL、纯化后的磁珠-DNA、TTE Mix V5及H2O的混合液充分混匀,避免起泡,然后在55℃孵育10min,迅速冷却至4℃。最后将7.5μL 1% SDS添加到管中并充分吹打混合,55℃孵育15min。
表7
B、将离心管置于磁力架上。待至溶液变澄清,弃去上清。C、800μL 1×BB重悬磁珠并转移到新的LoBind 管。D、将离心管置于磁力架上。待至溶液变澄清,弃去上清。E、用100μL 1×BB重悬磁珠并转移到新的 LoBind管。离心管置于磁力架上,待至溶液变澄清,去除上清。F、20μL ddH2O重悬磁珠。
(8)文库扩增:使用Vazyme公司的Vazyme TruePrepTM DNA文库准备试剂盒V2,TD502。其中,扩增体系如表8所示,扩增条件如表9所示。
表8
表9
(9)文库扩增:使用AMpure XP磁珠对片段进行片段分选及纯化,用于去除引物二聚体,并得到300bp ~500bp的DNA片段:
A、使用前将Vazyme VAHTS DNA磁珠放室温中30min,平衡至室温。B、轻轻离心取PCR产物上清。并按0.55×的比例,在PCR产物上清中加入DNA磁珠。C、反复吹打至少10次,充分混匀。D、室温静置5 min。E、用磁力架结合磁珠约5min,然后将上清液转移到新的试管中。F、在上清液中加入0.15×体积的磁珠。反复吹打至少10次,充分混匀。G、室温静置5min。H、用磁力架结合磁珠约5min。弃去上清。I、用 1mL新配置的70%乙醇将磁珠清洗两次,小心不要吸到磁珠。J、吸去上清后将离心管置于磁力架上,把珠子风干。K、将磁珠重悬在30μLddH2O中,吹打10次以上以充分混匀。L、室温静置10min,每隔2min轻敲一次试管。M、将离心管置于磁力架上静置5min。N、将包含最终文库的上清转移到新的离心管中。O、如上所述,使用2%琼脂糖凝胶(5μL文库)电泳检测文库大小,并进行Qubit定量(1μL文库)。P、将上述文库送至深圳市海普洛斯生物科技有限公司进行上机测序,测序模式为PE150测序,测序平台为HiSeq X Ten。
(10)采用生物信息学方法对测序数据进行质量分析。
A、使用bwa mem将含有基因组信息的read1比对到人和小鼠的参考基因组上,参数为默认参数。B、保留read1中可以比对到基因组上的片段,并记录比对信息从而确认该read来自何物种。C、利用fastp对含有标识的第一序列、第二序列及UMI(Unique molecularidentifiers)序列的read2质控,使用参数-A保留接头序列。D、提取剩余的read2文件中的barcode1,barcode2和UMI。E、利用starcode对提取出的序列标签和UMI 进行聚类,使用参数-d设置允许的最大编辑距离为1。F、去除含有标签库中不存在的序列标签的reads。G、将含有相同序列标签组合的reads归为同一类群,同时根据UMI信息对reads去重,随后基于read1提取到的物种信息标注每个类群中所含有的人源和鼠源的reads数目。H、分别绘制各个类群人源和鼠源reads数目的直方图,其一般为双峰分布,选取恰好可以分开两个峰的位点作为阈值。然后对每个类群进行归类,规则如下:a)若某一类群所含有的人源和鼠源reads数均低于其对应的阈值,则将其归类为“非细胞”;
b)若某一类群所含有的人源reads数高于其对应的阈值,且该类群90%以上的reads为人源,则将其归类为“人类细胞”。
c)若某一类群所含有的鼠源reads数高于其对应的阈值,且该类群90%以上的reads为鼠源,则将其归类为“小鼠细胞”。
d)若不满足a)、b)、c)中的条件,则将其归类为“混合细胞”。
下机数据按照步骤(10)处理后,可得到单细胞DNA片段数目分布图(如图1)和人和小鼠细胞区分效率图(如图2)。图1中,横坐标表示单个细胞里得到的非冗余基因组DNA片段数目分布,纵坐标表示细胞数目。图2中,浅灰(位于图中左上部分)表示成功进行单细胞标记的小鼠来源单细胞,每个细胞仅含有一种标签码。浅黑(位于图中右下部分)表示成功标记的人来源细胞,每个细胞仅含有一种标签码。黑色(位于图中右上部分)表示一个序列标签标记细胞既有小鼠来源又有人来源的DNA,即序列标签码发生污染,无法区分单细胞,该部分细胞比例为4.62%,处于单细胞污染可接受范围(<5%)。深灰色(位于图中左下部分)为背景噪声或者是标记失败的DNA片段。图2的横坐标和总坐标都表示每个单细胞里包含的reads数。
因此,由图1和图2可知,采用实施例1的方法能够区分单个细胞,可以用于构建单细胞基因组测序用的DNA文库。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110>南方科技大学
<120>单细胞基因组测序用的DNA文库的构建方法
<160>212
<170>SIPOSequenceListing 1.0
<210>1
<211>38
<212>DNA
<213>Artificial Sequence
<400>1
catcggcgta cgactaacgt gatatccacg tgcttgag38
<210>2
<211>38
<212>DNA
<213>Artificial Sequence
<400>2
catcggcgta cgactaaaca tcgatccacg tgcttgag38
<210>3
<211>38
<212>DNA
<213>Artificial Sequence
<400>3
catcggcgta cgactatgcc taaatccacg tgcttgag38
<210>4
<211>38
<212>DNA
<213>Artificial Sequence
<400>4
catcggcgta cgactagtgg tcaatccacg tgcttgag38
<210>5
<211>38
<212>DNA
<213>Artificial Sequence
<400>5
catcggcgta cgactaccac tgtatccacg tgcttgag38
<210>6
<211>38
<212>DNA
<213>Artificial Sequence
<400>6
catcggcgta cgactacatt ggcatccacg tgcttgag38
<210>7
<211>38
<212>DNA
<213>Artificial Sequence
<400>7
catcggcgta cgactcagat ctgatccacg tgcttgag38
<210>8
<211>38
<212>DNA
<213>Artificial Sequence
<400>8
catcggcgta cgactcatca agtatccacg tgcttgag38
<210>9
<211>38
<212>DNA
<213>Artificial Sequence
<400>9
catcggcgta cgactcgctg atcatccacg tgcttgag38
<210>10
<211>38
<212>DNA
<213>Artificial Sequence
<400>10
catcggcgta cgactacaag ctaatccacg tgcttgag38
<210>11
<211>38
<212>DNA
<213>Artificial Sequence
<400>11
catcggcgta cgactctgta gccatccacg tgcttgag38
<210>12
<211>38
<212>DNA
<213>Artificial Sequence
<400>12
catcggcgta cgactagtac aagatccacg tgcttgag38
<210>13
<211>38
<212>DNA
<213>Artificial Sequence
<400>13
catcggcgta cgactaacaa ccaatccacg tgcttgag38
<210>14
<211>38
<212>DNA
<213>Artificial Sequence
<400>14
catcggcgta cgactaaccg agaatccacg tgcttgag38
<210>15
<211>38
<212>DNA
<213>Artificial Sequence
<400>15
catcggcgta cgactaacgc ttaatccacg tgcttgag38
<210>16
<211>38
<212>DNA
<213>Artificial Sequence
<400>16
catcggcgta cgactaagac ggaatccacg tgcttgag38
<210>17
<211>38
<212>DNA
<213>Artificial Sequence
<400>17
catcggcgta cgactaaggt acaatccacg tgcttgag38
<210>18
<211>38
<212>DNA
<213>Artificial Sequence
<400>18
catcggcgta cgactacaca gaaatccacg tgcttgag38
<210>19
<211>38
<212>DNA
<213>Artificial Sequence
<400>19
catcggcgta cgactacagc agaatccacg tgcttgag38
<210>20
<211>38
<212>DNA
<213>Artificial Sequence
<400>20
catcggcgta cgactacctc caaatccacg tgcttgag38
<210>21
<211>38
<212>DNA
<213>Artificial Sequence
<400>21
catcggcgta cgactacgct cgaatccacg tgcttgag38
<210>22
<211>38
<212>DNA
<213>Artificial Sequence
<400>22
catcggcgta cgactacgta tcaatccacg tgcttgag38
<210>23
<211>38
<212>DNA
<213>Artificial Sequence
<400>23
catcggcgta cgactactat gcaatccacg tgcttgag38
<210>24
<211>38
<212>DNA
<213>Artificial Sequence
<400>24
catcggcgta cgactagagt caaatccacg tgcttgag38
<210>25
<211>38
<212>DNA
<213>Artificial Sequence
<400>25
catcggcgta cgactagatc gcaatccacg tgcttgag38
<210>26
<211>38
<212>DNA
<213>Artificial Sequence
<400>26
catcggcgta cgactagcag gaaatccacg tgcttgag38
<210>27
<211>38
<212>DNA
<213>Artificial Sequence
<400>27
catcggcgta cgactagtca ctaatccacg tgcttgag38
<210>28
<211>38
<212>DNA
<213>Artificial Sequence
<400>28
catcggcgta cgactatcct gtaatccacg tgcttgag38
<210>29
<211>38
<212>DNA
<213>Artificial Sequence
<400>29
catcggcgta cgactattga ggaatccacg tgcttgag38
<210>30
<211>38
<212>DNA
<213>Artificial Sequence
<400>30
catcggcgta cgactcaacc acaatccacg tgcttgag38
<210>31
<211>38
<212>DNA
<213>Artificial Sequence
<400>31
catcggcgta cgactgacta gtaatccacg tgcttgag38
<210>32
<211>38
<212>DNA
<213>Artificial Sequence
<400>32
catcggcgta cgactcaatg gaaatccacg tgcttgag38
<210>33
<211>38
<212>DNA
<213>Artificial Sequence
<400>33
catcggcgta cgactcactt cgaatccacg tgcttgag38
<210>34
<211>38
<212>DNA
<213>Artificial Sequence
<400>34
catcggcgta cgactcagcg ttaatccacg tgcttgag38
<210>35
<211>38
<212>DNA
<213>Artificial Sequence
<400>35
catcggcgta cgactcatac caaatccacg tgcttgag38
<210>36
<211>38
<212>DNA
<213>Artificial Sequence
<400>36
catcggcgta cgactccagt tcaatccacg tgcttgag38
<210>37
<211>38
<212>DNA
<213>Artificial Sequence
<400>37
catcggcgta cgactccgaa gtaatccacg tgcttgag38
<210>38
<211>38
<212>DNA
<213>Artificial Sequence
<400>38
catcggcgta cgactccgtg agaatccacg tgcttgag38
<210>39
<211>38
<212>DNA
<213>Artificial Sequence
<400>39
catcggcgta cgactcctcc tgaatccacg tgcttgag38
<210>40
<211>38
<212>DNA
<213>Artificial Sequence
<400>40
catcggcgta cgactcgaac ttaatccacg tgcttgag38
<210>41
<211>38
<212>DNA
<213>Artificial Sequence
<400>41
catcggcgta cgactcgact ggaatccacg tgcttgag38
<210>42
<211>38
<212>DNA
<213>Artificial Sequence
<400>42
catcggcgta cgactcgcat acaatccacg tgcttgag38
<210>43
<211>38
<212>DNA
<213>Artificial Sequence
<400>43
catcggcgta cgactctcaa tgaatccacg tgcttgag38
<210>44
<211>38
<212>DNA
<213>Artificial Sequence
<400>44
catcggcgta cgactctgag ccaatccacg tgcttgag38
<210>45
<211>38
<212>DNA
<213>Artificial Sequence
<400>45
catcggcgta cgactctggc ataatccacg tgcttgag38
<210>46
<211>38
<212>DNA
<213>Artificial Sequence
<400>46
catcggcgta cgactgaatc tgaatccacg tgcttgag38
<210>47
<211>38
<212>DNA
<213>Artificial Sequence
<400>47
catcggcgta cgactcaaga ctaatccacg tgcttgag38
<210>48
<211>38
<212>DNA
<213>Artificial Sequence
<400>48
catcggcgta cgactgagct gaaatccacg tgcttgag38
<210>49
<211>38
<212>DNA
<213>Artificial Sequence
<400>49
catcggcgta cgactgatag acaatccacg tgcttgag38
<210>50
<211>38
<212>DNA
<213>Artificial Sequence
<400>50
catcggcgta cgactgccac ataatccacg tgcttgag38
<210>51
<211>38
<212>DNA
<213>Artificial Sequence
<400>51
catcggcgta cgactgcgag taaatccacg tgcttgag38
<210>52
<211>38
<212>DNA
<213>Artificial Sequence
<400>52
catcggcgta cgactgctaa cgaatccacg tgcttgag38
<210>53
<211>38
<212>DNA
<213>Artificial Sequence
<400>53
catcggcgta cgactgctcg gtaatccacg tgcttgag38
<210>54
<211>38
<212>DNA
<213>Artificial Sequence
<400>54
catcggcgta cgactggaga acaatccacg tgcttgag38
<210>55
<211>38
<212>DNA
<213>Artificial Sequence
<400>55
catcggcgta cgactggtgc gaaatccacg tgcttgag38
<210>56
<211>38
<212>DNA
<213>Artificial Sequence
<400>56
catcggcgta cgactgtacg caaatccacg tgcttgag38
<210>57
<211>38
<212>DNA
<213>Artificial Sequence
<400>57
catcggcgta cgactgtcgt agaatccacg tgcttgag38
<210>58
<211>38
<212>DNA
<213>Artificial Sequence
<400>58
catcggcgta cgactgtctg tcaatccacg tgcttgag38
<210>59
<211>38
<212>DNA
<213>Artificial Sequence
<400>59
catcggcgta cgactgtgtt ctaatccacg tgcttgag38
<210>60
<211>38
<212>DNA
<213>Artificial Sequence
<400>60
catcggcgta cgacttagga tgaatccacg tgcttgag38
<210>61
<211>38
<212>DNA
<213>Artificial Sequence
<400>61
catcggcgta cgacttatca gcaatccacg tgcttgag38
<210>62
<211>38
<212>DNA
<213>Artificial Sequence
<400>62
catcggcgta cgacttccgt ctaatccacg tgcttgag38
<210>63
<211>38
<212>DNA
<213>Artificial Sequence
<400>63
catcggcgta cgacttcttc acaatccacg tgcttgag38
<210>64
<211>38
<212>DNA
<213>Artificial Sequence
<400>64
catcggcgta cgacttgaag agaatccacg tgcttgag38
<210>65
<211>38
<212>DNA
<213>Artificial Sequence
<400>65
catcggcgta cgacttggaa caaatccacg tgcttgag38
<210>67
<211>38
<212>DNA
<213>Artificial Sequence
<400>67
catcggcgta cgacttggct tcaatccacg tgcttgag38
<210>67
<211>38
<212>DNA
<213>Artificial Sequence
<400>67
catcggcgta cgacttggtg gtaatccacg tgcttgag38
<210>68
<211>38
<212>DNA
<213>Artificial Sequence
<400>68
catcggcgta cgactttcac gcaatccacg tgcttgag38
<210>69
<211>38
<212>DNA
<213>Artificial Sequence
<400>69
catcggcgta cgactaactc accatccacg tgcttgag38
<210>70
<211>38
<212>DNA
<213>Artificial Sequence
<400>70
catcggcgta cgactaagag atcatccacg tgcttgag38
<210>71
<211>38
<212>DNA
<213>Artificial Sequence
<400>71
catcggcgta cgactaagga cacatccacg tgcttgag38
<210>72
<211>38
<212>DNA
<213>Artificial Sequence
<400>72
catcggcgta cgactaatcc gtcatccacg tgcttgag38
<210>73
<211>38
<212>DNA
<213>Artificial Sequence
<400>73
catcggcgta cgactaatgt tgcatccacg tgcttgag38
<210>74
<211>38
<212>DNA
<213>Artificial Sequence
<400>74
catcggcgta cgactacacg accatccacg tgcttgag38
<210>75
<211>38
<212>DNA
<213>Artificial Sequence
<400>75
catcggcgta cgactacaga ttcatccacg tgcttgag38
<210>76
<211>38
<212>DNA
<213>Artificial Sequence
<400>76
catcggcgta cgactagatg tacatccacg tgcttgag38
<210>77
<211>38
<212>DNA
<213>Artificial Sequence
<400>77
catcggcgta cgactagcac ctcatccacg tgcttgag38
<210>78
<211>38
<212>DNA
<213>Artificial Sequence
<400>78
catcggcgta cgactagcca tgcatccacg tgcttgag38
<210>79
<211>38
<212>DNA
<213>Artificial Sequence
<400>79
catcggcgta cgactaggct aacatccacg tgcttgag38
<210>80
<211>38
<212>DNA
<213>Artificial Sequence
<400>80
catcggcgta cgactatagc gacatccacg tgcttgag38
<210>81
<211>38
<212>DNA
<213>Artificial Sequence
<400>81
catcggcgta cgactatcat tccatccacg tgcttgag38
<210>82
<211>38
<212>DNA
<213>Artificial Sequence
<400>82
catcggcgta cgactattgg ctcatccacg tgcttgag38
<210>83
<211>38
<212>DNA
<213>Artificial Sequence
<400>83
catcggcgta cgactcaagg agcatccacg tgcttgag38
<210>84
<211>38
<212>DNA
<213>Artificial Sequence
<400>84
catcggcgta cgactcacct tacatccacg tgcttgag38
<210>85
<211>38
<212>DNA
<213>Artificial Sequence
<400>85
catcggcgta cgactccatc ctcatccacg tgcttgag38
<210>86
<211>38
<212>DNA
<213>Artificial Sequence
<400>86
catcggcgta cgactccgac aacatccacg tgcttgag38
<210>87
<211>38
<212>DNA
<213>Artificial Sequence
<400>87
catcggcgta cgactcctaa tccatccacg tgcttgag38
<210>88
<211>38
<212>DNA
<213>Artificial Sequence
<400>88
catcggcgta cgactcctct atcatccacg tgcttgag38
<210>89
<211>38
<212>DNA
<213>Artificial Sequence
<400>89
catcggcgta cgactcgaca cacatccacg tgcttgag38
<210>90
<211>38
<212>DNA
<213>Artificial Sequence
<400>90
catcggcgta cgactcggat tgcatccacg tgcttgag38
<210>91
<211>38
<212>DNA
<213>Artificial Sequence
<400>91
catcggcgta cgactctaag gtcatccacg tgcttgag38
<210>92
<211>38
<212>DNA
<213>Artificial Sequence
<400>92
catcggcgta cgactgaaca ggcatccacg tgcttgag38
<210>93
<211>38
<212>DNA
<213>Artificial Sequence
<400>93
catcggcgta cgactgacag tgcatccacg tgcttgag38
<210>94
<211>38
<212>DNA
<213>Artificial Sequence
<400>94
catcggcgta cgactgagtt agcatccacg tgcttgag38
<210>95
<211>38
<212>DNA
<213>Artificial Sequence
<400>95
catcggcgta cgactgatga atcatccacg tgcttgag38
<210>96
<211>38
<212>DNA
<213>Artificial Sequence
<400>96
catcggcgta cgactgccaa gacatccacg tgcttgag38
<210>97
<211>55
<212>DNA
<213>Artificial Sequence
<400>97
cagacgtgtg ctcttccgat ctnnnnnnnn nnaacgtgat gtggccgatg tttcg 55
<210>98
<211>55
<212>DNA
<213>Artificial Sequence
<400>98
cagacgtgtg ctcttccgat ctnnnnnnnn nnaaacatcg gtggccgatg tttcg 55
<210>99
<211>55
<212>DNA
<213>Artificial Sequence
<400>99
cagacgtgtg ctcttccgat ctnnnnnnnn nnatgcctaa gtggccgatg tttcg 55
<210>100
<211>55
<212>DNA
<213>Artificial Sequence
<400>100
cagacgtgtg ctcttccgat ctnnnnnnnn nnagtggtca gtggccgatg tttcg 55
<210>101
<211>55
<212>DNA
<213>Artificial Sequence
<400>101
cagacgtgtg ctcttccgat ctnnnnnnnn nnaccactgt gtggccgatg tttcg 55
<210>102
<211>55
<212>DNA
<213>Artificial Sequence
<400>102
cagacgtgtg ctcttccgat ctnnnnnnnn nnacattggc gtggccgatg tttcg 55
<210>103
<211>55
<212>DNA
<213>Artificial Sequence
<400>103
cagacgtgtg ctcttccgat ctnnnnnnnn nncagatctg gtggccgatg tttcg 55
<210>104
<211>55
<212>DNA
<213>Artificial Sequence
<400>104
cagacgtgtg ctcttccgat ctnnnnnnnn nncatcaagt gtggccgatg tttcg 55
<210>105
<211>55
<212>DNA
<213>Artificial Sequence
<400>105
cagacgtgtg ctcttccgat ctnnnnnnnn nncgctgatc gtggccgatg tttcg 55
<210>106
<211>55
<212>DNA
<213>Artificial Sequence
<400>106
cagacgtgtg ctcttccgat ctnnnnnnnn nnacaagcta gtggccgatg tttcg 55
<210>107
<211>55
<212>DNA
<213>Artificial Sequence
<400>107
cagacgtgtg ctcttccgat ctnnnnnnnn nnctgtagcc gtggccgatg tttcg 55
<210>108
<211>55
<212>DNA
<213>Artificial Sequence
<400>108
cagacgtgtg ctcttccgat ctnnnnnnnn nnagtacaag gtggccgatg tttcg 55
<210>109
<211>55
<212>DNA
<213>Artificial Sequence
<400>109
cagacgtgtg ctcttccgat ctnnnnnnnn nnaacaacca gtggccgatg tttcg 55
<210>110
<211>55
<212>DNA
<213>Artificial Sequence
<400>110
cagacgtgtg ctcttccgat ctnnnnnnnn nnaaccgaga gtggccgatg tttcg 55
<210>111
<211>55
<212>DNA
<213>Artificial Sequence
<400>111
cagacgtgtg ctcttccgat ctnnnnnnnn nnaacgctta gtggccgatg tttcg 55
<210>112
<211>55
<212>DNA
<213>Artificial Sequence
<400>112
cagacgtgtg ctcttccgat ctnnnnnnnn nnaagacgga gtggccgatg tttcg 55
<210>113
<211>55
<212>DNA
<213>Artificial Sequence
<400>113
cagacgtgtg ctcttccgat ctnnnnnnnn nnaaggtaca gtggccgatg tttcg 55
<210>114
<211>55
<212>DNA
<213>Artificial Sequence
<400>114
cagacgtgtg ctcttccgat ctnnnnnnnn nnacacagaa gtggccgatg tttcg 55
<210>115
<211>55
<212>DNA
<213>Artificial Sequence
<400>115
cagacgtgtg ctcttccgat ctnnnnnnnn nnacagcaga gtggccgatg tttcg 55
<210>116
<211>55
<212>DNA
<213>Artificial Sequence
<400>116
cagacgtgtg ctcttccgat ctnnnnnnnn nnacctccaa gtggccgatg tttcg 55
<210>117
<211>55
<212>DNA
<213>Artificial Sequence
<400>117
cagacgtgtg ctcttccgat ctnnnnnnnn nnacgctcga gtggccgatg tttcg 55
<210>118
<211>55
<212>DNA
<213>Artificial Sequence
<400>118
cagacgtgtg ctcttccgat ctnnnnnnnn nnacgtatca gtggccgatg tttcg 55
<210>119
<211>55
<212>DNA
<213>Artificial Sequence
<400>119
cagacgtgtg ctcttccgat ctnnnnnnnn nnactatgca gtggccgatg tttcg 55
<210>120
<211>55
<212>DNA
<213>Artificial Sequence
<400>120
cagacgtgtg ctcttccgat ctnnnnnnnn nnagagtcaa gtggccgatg tttcg 55
<210>121
<211>55
<212>DNA
<213>Artificial Sequence
<400>121
cagacgtgtg ctcttccgat ctnnnnnnnn nnagatcgca gtggccgatg tttcg 55
<210>122
<211>55
<212>DNA
<213>Artificial Sequence
<400>122
cagacgtgtg ctcttccgat ctnnnnnnnn nnagcaggaa gtggccgatg tttcg 55
<210>123
<211>55
<212>DNA
<213>Artificial Sequence
<400>123
cagacgtgtg ctcttccgat ctnnnnnnnn nnagtcacta gtggccgatg tttcg 55
<210>124
<211>55
<212>DNA
<213>Artificial Sequence
<400>124
cagacgtgtg ctcttccgat ctnnnnnnnn nnatcctgta gtggccgatg tttcg 55
<210>125
<211>55
<212>DNA
<213>Artificial Sequence
<400>125
cagacgtgtg ctcttccgat ctnnnnnnnn nnattgagga gtggccgatg tttcg 55
<210>126
<211>55
<212>DNA
<213>Artificial Sequence
<400>126
cagacgtgtg ctcttccgat ctnnnnnnnn nncaaccaca gtggccgatg tttcg 55
<210>127
<211>55
<212>DNA
<213>Artificial Sequence
<400>127
cagacgtgtg ctcttccgat ctnnnnnnnn nngactagta gtggccgatg tttcg 55
<210>128
<211>55
<212>DNA
<213>Artificial Sequence
<400>128
cagacgtgtg ctcttccgat ctnnnnnnnn nncaatggaa gtggccgatg tttcg 55
<210>129
<211>55
<212>DNA
<213>Artificial Sequence
<400>129
cagacgtgtg ctcttccgat ctnnnnnnnn nncacttcga gtggccgatg tttcg 55
<210>130
<211>55
<212>DNA
<213>Artificial Sequence
<400>130
cagacgtgtg ctcttccgat ctnnnnnnnn nncagcgtta gtggccgatg tttcg 55
<210>131
<211>55
<212>DNA
<213>Artificial Sequence
<400>131
cagacgtgtg ctcttccgat ctnnnnnnnn nncataccaa gtggccgatg tttcg 55
<210>132
<211>55
<212>DNA
<213>Artificial Sequence
<400>132
cagacgtgtg ctcttccgat ctnnnnnnnn nnccagttca gtggccgatg tttcg 55
<210>133
<211>55
<212>DNA
<213>Artificial Sequence
<400>133
cagacgtgtg ctcttccgat ctnnnnnnnn nnccgaagta gtggccgatg tttcg 55
<210>134
<211>55
<212>DNA
<213>Artificial Sequence
<400>134
cagacgtgtg ctcttccgat ctnnnnnnnn nnccgtgaga gtggccgatg tttcg 55
<210>135
<211>55
<212>DNA
<213>Artificial Sequence
<400>135
cagacgtgtg ctcttccgat ctnnnnnnnn nncctcctga gtggccgatg tttcg 55
<210>136
<211>55
<212>DNA
<213>Artificial Sequence
<400>136
cagacgtgtg ctcttccgat ctnnnnnnnn nncgaactta gtggccgatg tttcg 55
<210>137
<211>55
<212>DNA
<213>Artificial Sequence
<400>137
cagacgtgtg ctcttccgat ctnnnnnnnn nncgactgga gtggccgatg tttcg 55
<210>138
<211>55
<212>DNA
<213>Artificial Sequence
<400>138
cagacgtgtg ctcttccgat ctnnnnnnnn nncgcataca gtggccgatg tttcg 55
<210>139
<211>55
<212>DNA
<213>Artificial Sequence
<400>139
cagacgtgtg ctcttccgat ctnnnnnnnn nnctcaatga gtggccgatg tttcg 55
<210>140
<211>55
<212>DNA
<213>Artificial Sequence
<400>140
cagacgtgtg ctcttccgat ctnnnnnnnn nnctgagcca gtggccgatg tttcg 55
<210>141
<211>55
<212>DNA
<213>Artificial Sequence
<400>141
cagacgtgtg ctcttccgat ctnnnnnnnn nnctggcata gtggccgatg tttcg 55
<210>142
<211>55
<212>DNA
<213>Artificial Sequence
<400>142
cagacgtgtg ctcttccgat ctnnnnnnnn nngaatctga gtggccgatg tttcg 55
<210>143
<211>55
<212>DNA
<213>Artificial Sequence
<400>143
cagacgtgtg ctcttccgat ctnnnnnnnn nncaagacta gtggccgatg tttcg 55
<210>144
<211>55
<212>DNA
<213>Artificial Sequence
<400>144
cagacgtgtg ctcttccgat ctnnnnnnnn nngagctgaa gtggccgatg tttcg 55
<210>145
<211>55
<212>DNA
<213>Artificial Sequence
<400>145
cagacgtgtg ctcttccgat ctnnnnnnnn nngatagaca gtggccgatg tttcg 55
<210>146
<211>55
<212>DNA
<213>Artificial Sequence
<400>146
cagacgtgtg ctcttccgat ctnnnnnnnn nngccacata gtggccgatg tttcg 55
<210>147
<211>55
<212>DNA
<213>Artificial Sequence
<400>147
cagacgtgtg ctcttccgat ctnnnnnnnn nngcgagtaa gtggccgatg tttcg 55
<210>148
<211>55
<212>DNA
<213>Artificial Sequence
<400>148
cagacgtgtg ctcttccgat ctnnnnnnnn nngctaacga gtggccgatg tttcg 55
<210>149
<211>55
<212>DNA
<213>Artificial Sequence
<400>149
cagacgtgtg ctcttccgat ctnnnnnnnn nngctcggta gtggccgatg tttcg 55
<210>150
<211>55
<212>DNA
<213>Artificial Sequence
<400>150
cagacgtgtg ctcttccgat ctnnnnnnnn nnggagaaca gtggccgatg tttcg 55
<210>151
<211>55
<212>DNA
<213>Artificial Sequence
<400>151
cagacgtgtg ctcttccgat ctnnnnnnnn nnggtgcgaa gtggccgatg tttcg 55
<210>152
<211>55
<212>DNA
<213>Artificial Sequence
<400>152
cagacgtgtg ctcttccgat ctnnnnnnnn nngtacgcaa gtggccgatg tttcg 55
<210>153
<211>55
<212>DNA
<213>Artificial Sequence
<400>153
cagacgtgtg ctcttccgat ctnnnnnnnn nngtcgtaga gtggccgatg tttcg 55
<210>154
<211>55
<212>DNA
<213>Artificial Sequence
<400>154
cagacgtgtg ctcttccgat ctnnnnnnnn nngtctgtca gtggccgatg tttcg 55
<210>155
<211>55
<212>DNA
<213>Artificial Sequence
<400>155
cagacgtgtg ctcttccgat ctnnnnnnnn nngtgttcta gtggccgatg tttcg 55
<210>156
<211>55
<212>DNA
<213>Artificial Sequence
<400>156
cagacgtgtg ctcttccgat ctnnnnnnnn nntaggatga gtggccgatg tttcg 55
<210>157
<211>55
<212>DNA
<213>Artificial Sequence
<400>157
cagacgtgtg ctcttccgat ctnnnnnnnn nntatcagca gtggccgatg tttcg 55
<210>158
<211>55
<212>DNA
<213>Artificial Sequence
<400>158
cagacgtgtg ctcttccgat ctnnnnnnnn nntccgtcta gtggccgatg tttcg 55
<210>159
<211>55
<212>DNA
<213>Artificial Sequence
<400>159
cagacgtgtg ctcttccgat ctnnnnnnnn nntcttcaca gtggccgatg tttcg 55
<210>160
<211>55
<212>DNA
<213>Artificial Sequence
<400>160
cagacgtgtg ctcttccgat ctnnnnnnnn nntgaagaga gtggccgatg tttcg 55
<210>161
<211>55
<212>DNA
<213>Artificial Sequence
<400>161
cagacgtgtg ctcttccgat ctnnnnnnnn nntggaacaa gtggccgatg tttcg 55
<210>162
<211>55
<212>DNA
<213>Artificial Sequence
<400>162
cagacgtgtg ctcttccgat ctnnnnnnnn nntggcttca gtggccgatg tttcg 55
<210>163
<211>55
<212>DNA
<213>Artificial Sequence
<400>163
cagacgtgtg ctcttccgat ctnnnnnnnn nntggtggta gtggccgatg tttcg 55
<210>164
<211>55
<212>DNA
<213>Artificial Sequence
<400>164
cagacgtgtg ctcttccgat ctnnnnnnnn nnttcacgca gtggccgatg tttcg 55
<210>165
<211>55
<212>DNA
<213>Artificial Sequence
<400>165
cagacgtgtg ctcttccgat ctnnnnnnnn nnaactcacc gtggccgatg tttcg 55
<210>166
<211>55
<212>DNA
<213>Artificial Sequence
<400>166
cagacgtgtg ctcttccgat ctnnnnnnnn nnaagagatc gtggccgatg tttcg 55
<210>167
<211>55
<212>DNA
<213>Artificial Sequence
<400>167
cagacgtgtg ctcttccgat ctnnnnnnnn nnaaggacac gtggccgatg tttcg 55
<210>168
<211>55
<212>DNA
<213>Artificial Sequence
<400>168
cagacgtgtg ctcttccgat ctnnnnnnnn nnaatccgtc gtggccgatg tttcg 55
<210>169
<211>55
<212>DNA
<213>Artificial Sequence
<400>169
cagacgtgtg ctcttccgat ctnnnnnnnn nnaatgttgc gtggccgatg tttcg 55
<210>170
<211>55
<212>DNA
<213>Artificial Sequence
<400>170
cagacgtgtg ctcttccgat ctnnnnnnnn nnacacgacc gtggccgatg tttcg 55
<210>171
<211>55
<212>DNA
<213>Artificial Sequence
<400>171
cagacgtgtg ctcttccgat ctnnnnnnnn nnacagattc gtggccgatg tttcg 55
<210>172
<211>55
<212>DNA
<213>Artificial Sequence
<400>172
cagacgtgtg ctcttccgat ctnnnnnnnn nnagatgtac gtggccgatg tttcg 55
<210>173
<211>55
<212>DNA
<213>Artificial Sequence
<400>173
cagacgtgtg ctcttccgat ctnnnnnnnn nnagcacctc gtggccgatg tttcg 55
<210>174
<211>55
<212>DNA
<213>Artificial Sequence
<400>174
cagacgtgtg ctcttccgat ctnnnnnnnn nnagccatgc gtggccgatg tttcg 55
<210>175
<211>55
<212>DNA
<213>Artificial Sequence
<400>175
cagacgtgtg ctcttccgat ctnnnnnnnn nnaggctaac gtggccgatg tttcg 55
<210>176
<211>55
<212>DNA
<213>Artificial Sequence
<400>176
cagacgtgtg ctcttccgat ctnnnnnnnn nnatagcgac gtggccgatg tttcg 55
<210>177
<211>55
<212>DNA
<213>Artificial Sequence
<400>177
cagacgtgtg ctcttccgat ctnnnnnnnn nnatcattcc gtggccgatg tttcg 55
<210>178
<211>55
<212>DNA
<213>Artificial Sequence
<400>178
cagacgtgtg ctcttccgat ctnnnnnnnn nnattggctc gtggccgatg tttcg 55
<210>179
<211>55
<212>DNA
<213>Artificial Sequence
<400>179
cagacgtgtg ctcttccgat ctnnnnnnnn nncaaggagc gtggccgatg tttcg 55
<210>180
<211>55
<212>DNA
<213>Artificial Sequence
<400>180
cagacgtgtg ctcttccgat ctnnnnnnnn nncaccttac gtggccgatg tttcg 55
<210>181
<211>55
<212>DNA
<213>Artificial Sequence
<400>181
cagacgtgtg ctcttccgat ctnnnnnnnn nnccatcctc gtggccgatg tttcg 55
<210>182
<211>55
<212>DNA
<213>Artificial Sequence
<400>182
cagacgtgtg ctcttccgat ctnnnnnnnn nnccgacaac gtggccgatg tttcg 55
<210>183
<211>55
<212>DNA
<213>Artificial Sequence
<400>183
cagacgtgtg ctcttccgat ctnnnnnnnn nncctaatcc gtggccgatg tttcg 55
<210>184
<211>55
<212>DNA
<213>Artificial Sequence
<400>184
cagacgtgtg ctcttccgat ctnnnnnnnn nncctctatc gtggccgatg tttcg 55
<210>185
<211>55
<212>DNA
<213>Artificial Sequence
<400>185
cagacgtgtg ctcttccgat ctnnnnnnnn nncgacacac gtggccgatg tttcg 55
<210>186
<211>55
<212>DNA
<213>Artificial Sequence
<400>186
cagacgtgtg ctcttccgat ctnnnnnnnn nncggattgc gtggccgatg tttcg 55
<210>187
<211>55
<212>DNA
<213>Artificial Sequence
<400>187
cagacgtgtg ctcttccgat ctnnnnnnnn nnctaaggtc gtggccgatg tttcg 55
<210>188
<211>55
<212>DNA
<213>Artificial Sequence
<400>188
cagacgtgtg ctcttccgat ctnnnnnnnn nngaacaggc gtggccgatg tttcg 55
<210>189
<211>55
<212>DNA
<213>Artificial Sequence
<400>189
cagacgtgtg ctcttccgat ctnnnnnnnn nngacagtgc gtggccgatg tttcg 55
<210>190
<211>55
<212>DNA
<213>Artificial Sequence
<400>190
cagacgtgtg ctcttccgat ctnnnnnnnn nngagttagc gtggccgatg tttcg 55
<210>191
<211>55
<212>DNA
<213>Artificial Sequence
<400>191
cagacgtgtg ctcttccgat ctnnnnnnnn nngatgaatc gtggccgatg tttcg 55
<210>192
<211>55
<212>DNA
<213>Artificial Sequence
<400>192
cagacgtgtg ctcttccgat ctnnnnnnnn nngccaagac gtggccgatg tttcg 55
<210>193
<211>6
<212>DNA
<213>Artificial Sequence
<400>193
gatctg6
<210>194
<211>6
<212>DNA
<213>Artificial Sequence
<400>194
tcaagt6
<210>195
<211>6
<212>DNA
<213>Artificial Sequence
<400>195
ctgatc6
<210>196
<211>6
<212>DNA
<213>Artificial Sequence
<400>196
aagcta6
<210>197
<211>6
<212>DNA
<213>Artificial Sequence
<400>197
gtagcc6
<210>198
<211>6
<212>DNA
<213>Artificial Sequence
<400>198
tacaag6
<210>199
<211>6
<212>DNA
<213>Artificial Sequence
<400>199
ttgact6
<210>200
<211>6
<212>DNA
<213>Artificial Sequence
<400>200
ggaact6
<210>201
<211>19
<212>DNA
<213>Artificial Sequence
<400>201
gatcctcaag cacgtggat 19
<210>202
<211>30
<212>DNA
<213>Artificial Sequence
<400>202
agtcgtacgc cgatgcgaaa catcggccac 30
<210>203
<211>5
<212>DNA
<213>Artificial Sequence
<400>203
gatca 5
<210>204
<211>51
<212>DNA
<213>Artificial Sequence
<400>204
aatgatacgg cgaccaccga gatctacact agatcgctcg tcggcagcgt c 51
<210>205
<211>64
<212>DNA
<213>Artificial Sequence
<400>205
caagcagaag acggcatacg agatgatctg gtgactggag ttcagacgtg tgctcttccg60
atct 64
<210>206
<211>64
<212>DNA
<213>Artificial Sequence
<400>206
caagcagaag acggcatacg agattcaagt gtgactggag ttcagacgtg tgctcttccg60
atct 64
<210>207
<211>64
<212>DNA
<213>Artificial Sequence
<400>207
caagcagaag acggcatacg agatctgatc gtgactggag ttcagacgtg tgctcttccg60
atct 64
<210>208
<211>64
<212>DNA
<213>Artificial Sequence
<400>208
caagcagaag acggcatacg agataagcta gtgactggag ttcagacgtg tgctcttccg60
atct 64
<210>209
<211>64
<212>DNA
<213>Artificial Sequence
<400>209
caagcagaag acggcatacg agatgtagcc gtgactggag ttcagacgtg tgctcttccg60
atct 64
<210>210
<211>64
<212>DNA
<213>Artificial Sequence
<400>210
caagcagaag acggcatacg agattacaag gtgactggag ttcagacgtg tgctcttccg60
atct 64
<210>211
<211>64
<212>DNA
<213>Artificial Sequence
<400>211
caagcagaag acggcatacg agatttgact gtgactggag ttcagacgtg tgctcttccg60
atct 64
<210>212
<211>64
<212>DNA
<213>Artificial Sequence
<400>212
caagcagaag acggcatacg agatggaact gtgactggag ttcagacgtg tgctcttccg60
atct 64