当前位置：首页 > 化学技术 > 组合技术> 一种用于单细胞ChIP-seq文库制备的融合蛋白及其应用独创技术48701字

一种用于单细胞ChIP-seq文库制备的融合蛋白及其应用

2021-03-18 22:26:54

一种用于单细胞ChIP-seq文库制备的融合蛋白及其应用

　　技术领域

　　本发明属于生物技术领域，具体而言，涉及一种用于单细胞ChIP-seq文库制备的融合蛋白及其应用。

　　背景技术

　　随着基因测序的完成以及后基因组时代的到来，表观遗传学已经成为生物领域的研究热点。表观遗传学(epigenetics)主要研究在基因核苷酸序列不发生改变的情况下，DNA及有关蛋白分子发生的可遗传修饰，这些修饰可被细胞“记忆”并在随后的细胞分裂过程中保留下来，其研究方向包括：一是基因转录水平选择性表达的调控，二是基因转录后的调控。目前，表观遗传学的热点主要集中在基因转录水平选择性表达调控上，特别是转录因子与DNA的相互作用、DNA的甲基化和组蛋白修饰等[1]。

　　染色质免疫共沉淀(Chromatin Immunoprecipitation,ChIP)也称结合位点分析法，其一般流程主要包括：(1)用甲醛将DNA和结合在所述DNA上的蛋白交联，染色体分离并打碎成一定大小的片段；(2)用特异性抗体免疫沉淀并富集目标蛋白与DNA交联的复合物；(3)采用低pH值条件反交联，释放DNA片段；(4)通过对DNA片段的纯化与检测，获得DNA与蛋白质相互作用的序列信息。由于ChIP技术能够研究蛋白质与DNA的相互作用，其被广泛应用表观遗传学领域，用于研究转录因子与DNA的相互作用、DNA甲基化和组蛋白修饰等。

　　随着新一代测序技术的发展，在ChIP技术的基础上发展出一种可在全基因组范围内研究蛋白质与DNA相互作用的技术——染色质免疫共沉淀-测序(即，ChIP-seq)。ChIP-seq技术包括染色质免疫共沉淀和高通量测序两部分，其中，先通过染色质免疫共沉淀技术特异性地富集目的蛋白结合的DNA，然后构建测序文库，采用新一代测序技术对富集得到的DNA片段进行高通量测序，最后通过将获得的数百万条序列标签精确定位到基因组上，从而获得全基因组范围内与目标蛋白相互作用的DNA区段信息[2]。

　　目前，一种优化的并与本技术相关的一种ChIP-seq技术叫做“CUT&RUN(CleavageUnder Targets&Release Using Nuclease)”[3]。所述CUT&RUN将Protein A与核酸酶MNase(Micrococcal Nuclease)融合，通过Protein A能特异与免疫球蛋白G结合的特性，ProteinA将MNase引入抗体(识别特异转录因子或者组蛋白修饰的抗体)结合的位点，通过MNase的核酸内切和外切酶活性，Protein A-MNase能特异将抗体结合的DNA两端切开，被切开的DNA片段从细胞核中释放出来，对这些DNA片段进行建库和测序分析，能在全基因组水平绘制特定蛋白与DNA相互作用图谱。

　　其具体技术方案如图1所示：Con A beads和细胞结合，加入识别特异转录因子的抗体，孵育一定时间，让抗体与转录因子充分结合，加入ProteinA-MNase融合蛋白，ProteinA-MNase能特异结合抗体结合的位点，然后加入Ca2+离子激活MNase核酸酶的活性，ProteinA-MNase能特异将抗体结合的DNA的两端切开，终止MNase的反应之后，这些被切开的DNA片段从细胞核中释放出来，之后对这些DNA片段进行建库和二代测序分析，根据测序结果可以在全基因组水平绘制特定转录因子的结合图谱。

　　然而，目前通用的ChIP-seq技术存在以下缺陷：

　　1、建库效率低，导致做少量细胞时文库信息丢失严重

　　对Protein A-MNase切割后释放出来的DNA片段建库时，需要采用传统的TruSeq的建库策略，建库时Adaptor和DNA片段连接效率低。尤其以少量细胞为起始材料时，DNA片段在建库过程中丢失太多，最终导致文库主要信息丢失，实验失败几率高，也无法得到全基因组水平上的蛋白与DNA相互作用图谱。

　　2、文库背景较高

　　Protein A-MNase切割反应被终止后，所有小的DNA片段将从细胞核中释放出来，它们没有与转录因子或蛋白质结合。这些小片段，在建库过程中会被Adaptor连接，最后通过PCR扩增，形成高背景，降低了文库复杂度(complexity)，导致实验失败。

　　3、现有的ChIP-seq技术无法对组织切片等进行原位检测，破坏其空间分辨率。

　　有鉴于此，本领域亟待提出一种能够有效提高文库建立的效率、降低文库背景以及能够实现原位检测的ChIP-seq技术。

　　【参考文献】：

　　1、下一代测序技术在表观遗传学研究中的重要应用及进展，沈圣等，遗传，第36卷，第3期，第256-275页，2014年3月

　　2、染色质免疫沉淀-测序：全基因组范围研究蛋白质-DNA相互作用的新技术，梁芳等，生物化学与生物物理进展，第216-225页，第40卷第3期，2013年。

　　3、An efficient targeted nuclease strategy for high-resolution mappingof DNA binding sites.Skene PJ et al.,Elife,6:e21856 2017

　　发明内容

　　本发明首先涉及一种用于染色质免疫共沉淀-测序(ChIP-seq)建库的融合蛋白，所述的融合蛋白是同源二聚体，其单体包括如下结构：

　　(1)第一功能嵌段：Tn5转座酶突变型；

　　(2)第二功能嵌段：金黄色葡萄球菌A蛋白(Protein A)、链球菌G蛋白(Protein G)或Protein A和Protein G的组合；

　　(3)各个功能嵌段的连接结构(Linker)，蛋白纯化标签。

　　所述的Tn5转座酶突变型为在野生型Tn5转座酶(氨基酸序列如SEQ ID NO.1所示)的氨基酸结构上进行如下点突变：E54K、L372P，所述的Tn5转座酶突变型的氨基酸序列如SEQ ID NO.2所示。

　　优选的，通过氨基酸序列如SEQ ID NO.3所示的Linker连接所述融合蛋白的各个功能嵌段；

　　优选的，所述的蛋白纯化标签为：-HIS标签、GST标签、MBP标签、SUMO标签、NusA标签、或直接利用Protein A标签和IgG蛋白的特异亲和性，用IgG磁珠进行纯化所述融合蛋白；

　　优选的，所述的第二功能嵌段连接在第一功能嵌段的氨基酸序列的N端(氮端)；

　　最优选的，所述的融合蛋白的单体为PAT或PAGT，PAT的氨基酸序列如SEQ ID NO.4所示，PAGT的氨基酸序列如SEQ ID NO.5所示。

　　本发明还涉及所述的融合蛋白在制备特定生物学样本的高通量测序文库中的应用，所述的生物学样本包括但不限于：未经交联或固定/经过交联或固定培养细胞样本、新鲜组织/经过交联或固定的组织样本，所述的高通量测序文库为染色质免疫共沉淀-测序(ChIP-seq)文库。

　　具体的，所述的制备特定生物学样本的高通量测序文库中的方法为：

　　(1)收集并处理目标生物学样本，获得单细胞悬液；

　　(2)用结合缓冲液重悬细胞，加入适量的特定蛋白结合抗体，使抗体充分结合后清洗除去未结合的抗体；

　　(3)重悬细胞，加入所述融合蛋白，使融合蛋白与抗体充分结合后除去未结合的融合蛋白；

　　(4)激活所述融合蛋白，充分反应获得被所述融合蛋白识别并切割的带有标记的DNA片段；

　　(5)加入终止缓冲液终止反应，用纯化试剂盒进行纯化DNA片段；

　　(6)加入引物进行PCR扩增完成建库。

　　本发明还涉及一种用于构建高通量测序文库的试剂盒，所述的试剂盒包括：所述的融合蛋白及常规的建库过程所使用的样本洗涤缓冲液、结合缓冲液、激活缓冲液和建库引物等，所述的高通量测序文库为染色质免疫共沉淀-测序(ChIP-seq)文库。

　　与现有技术相比，本公开的有益效果为：

　　(1)本公开所述融合蛋白、试剂盒和方法在ChIP-seq检测过程中能够提高建库效率，降低文库背景，从而提高ChIP-seq检测方法的准确性并简化ChIP-seq的实验流程。

　　(2)本公开所述方法对Tn5转座酶和Fc结合蛋白的突变体、表达体系、纯化手段、抗体、融合蛋白的孵育条件以及切割反应的条件进行优化，提高抗体、融合蛋白的结合效率以及DNA切割的效率和准确性，从而降低文库的背景和分辨率；

　　(3)本公开所述方法能够对组织切片、细胞涂片和细胞爬片进行原位检测，不需要裂解细胞核以及超声打断染色质，保留原样本的空间分辨率。

　　(4)本公开所述方法能够实现多器官多组织的单细胞ChIP-seq，可以同时平行处理多种不同组织来源，或者多种不同病理状态下的细胞。

　　(5)本公开所述方法能够快捷的完成单细胞ChIP-seq的制备，从实验开始，单日便可完成。

　　(6)本公开所述方法能够实现高通量的单细胞ChIP-seq，能够一次获得成上万个单细胞的ChIP-seq文库。

　　(7)本公开所述方法不需要使用特殊定制的高成本的单细胞文库测序方法，使用特殊设计的Mosaic Truseq两步PCR的文库制备方法，得到的文库可以使用illunima标准的测序方法和平台进行测序。与特殊定制的单细胞测序方法相比，一方面，Mosaic Truseq文库只需要1/15的测序成本，另一方面，实验人员不需要精通专业的测序知识，即可进行大规模的单细胞测序。

　　附图说明

　　图1、ProteinA-MNase在ChIP-seq中的作用原理。

　　图2、PAT表达载体构建图谱。

　　图3、高纯PAT纯化结果。

　　图4、PAT与IgG结合验证实验。

　　图5、Protein A嵌段在Tn5嵌段的N端插入型融合蛋白(PA2-Tn5)产生高活性的PAT。

　　图6、自然状态(A)和交联状态(B)下，原位ChIP-seq(In situ-ChIP)和超声ChIP-seq(Sonicate ChIP)方法比较，H3K4me3在Pou5f1基因启动子区域，H3K27ac在Nanog基因增强子区域信号分布(IGV track示意图)。

　　图7、自然状态(A)和交联状态(B)下，原位ChIP-seq(In situ-ChIP)和超声ChIP-seq(Sonicate ChIP)方法比较，H3K4me3(A)和H3K27ac(B)在启动子区域的信号分布(热图)，其中TSS表示转录起始位点。

　　图8、时空特异的原位ChIP。

　　图9、PAGT、PAT与传统ChIP的比较结果，H3K27ac在Pou5f1基因启动子区域的信号分布(IGV track显示图)。

　　图10、PAGT、PAT与传统ChIP的比较结果，H3K27ac在Pou5f1基因启动子区域的信号分布(热图)。

　　图11、高通量单细胞的ChIP-seq流程图。

　　图12、Mosaic Truseq两步PCR文库制备流程图。

　　具体实施方式

　　下述实施例中所涉及的融合蛋白PAT(ProteinA-Tn5)或融合蛋白PAGT(ProteinA-proteinG-Tn5)，所用洗涤缓冲液1、洗涤缓冲液2、结合缓冲液、反应缓冲液和终止缓冲液的配方如下所示：

　　洗涤缓冲液1：50mM HEPES、150mM NaCl和0.5mM亚精胺；

　　洗涤缓冲液2：50mM HEPES、150mM NaCl、0.5mM亚精胺和0.01％(w.t.)毛地黄皂苷；

　　结合缓冲液：50mM Hepes、150mM NaCl、0.5mM亚精胺、0.01％(w.t.)毛地黄皂苷和5mM EDTA；

　　反应(激活)缓冲液：25mM Mg2+和50mM三羟甲基甲胺基丙磺酸；

　　终止缓冲液：100mM EDTA和1％(w.t.)SDS。

　　下述实施例5～6融合蛋白为Protein A-Tn5，所用洗涤缓冲液A、洗涤缓冲液B、洗涤缓冲液C、抗体孵育缓冲液等的配方如下所示(高通量单细胞专用)：

　　洗涤缓冲液A：20mM HEPES、150mM NaCl和0.5mM亚精胺；

　　洗涤缓冲液B：20mM HEPES、150mM NaCl、0.5mM亚精胺，0.01％(w.t.)毛地黄皂苷；

　　洗涤缓冲液C：20mM HEPES、150mM NaCl、0.5mM亚精胺，0.01％(w.t.)毛地黄皂苷和0.1％Triton X-100；

　　激活缓冲液：20mM HEPES、10mM KCl、1mM CaCl2、1mM MnCl2

　　抗体孵育缓冲液：20mM HEPES、150mM NaCl、0.5mM亚精胺，0.01％(w.t.)毛地黄皂苷、0.1％Triton X-100和2mM EDTA；

　　单细胞反应缓冲液：25mM Mg2+、50mM三羟甲基甲胺基丙磺酸和0.01％(w.t.)毛地黄皂苷；

　　单细胞终止缓冲液：40mM EDTA。

　　单细胞分选缓冲液：2％BSA/PBS+2mM EDTA

　　单细胞裂解缓冲液:10mM Tris-HCl pH 8.5,0.05％SDS,0.1mg/ml蛋白酶K。

　　实施例1、高活性ProteinA-Tn5(PAT蛋白)的设计、表达及纯化

　　本实施例提供一种超高活性Tn5((突变型Tn5提升酶活)及ProteinA-Tn5融合蛋白的设计及纯化，本方法成本低，蛋白生产效率高，所述方法包括以下步骤：

　　1、ProteinA-Tn5融合蛋白(PAT)的设计

　　1)将突变型Tn5E54K,L372P(以下简称Tn5)的核酸序列克隆到pET28表达载体，如图2所示。

　　2)连接上2xProtein A的IgG识别结构域。

　　3)通过Sanger测序，确保编码区的真实性。

　　相比野生型Tn5，PAT中的突变型的Tn5具有更强的adaptors结合能力，切割活性提高十倍以上，切割活性的提高有利于其应用到各种实验和技术当中。

　　2、PAT蛋白的纯化，所述方法包括以下步骤：

　　1)将测序正确的由上述步骤1获得的PAT表达质粒转入BL21(ED3)表达菌中。

　　2)在10ml LB培养中添加终浓度为1μg/ml的卡拉霉素，并且接种一个表达PAT的单克隆，37℃，220rpm，过夜培养。

　　3)将过夜培养的菌液(10ml)直接按1/100接种到新鲜LB培养基中，37℃，220rpm。

　　4)约培养3h左右，在冰水中冷却，冷却约15min后添加终浓度为0.2mM的IPTG。

　　5)23℃，100rpm，诱导5h，4℃，4500rpm离心10min收集菌体。

　　6)新鲜的菌体沉淀用30ml预冷的PBS重悬，4℃，4500rpm离心10min，收集菌体。

　　7)用20ml HGX缓冲液(cocktail+PMSF)重悬菌体，充分混匀。

　　8)超声波破碎：超声波处理条件：4s on，8s off，150瓦特，工时5min。

　　9)4℃，12000rpm离心30min，留上清液，并用0.22um滤膜过滤，除去少量菌体。

　　10)在20ml上清液中加入100μl 10％的PEI，充分混匀沉淀细菌DNA，在冰上静置10分钟。

　　11)4℃，12000rpm离心10min，留上清液，并用0.22um滤膜过滤。

　　12)滤液中的PAT蛋白通过亲和层析纯化，并用截留分子量为10kD的透析袋透析含有高浓度盐的PAT蛋白，4℃，12h。

　　13)透析完后，用截留分量为30kD的超滤管浓缩PAT，4℃，4000rpm离心至体积为500μl。

　　14)加入500μl的100％甘油，轻轻混匀，-20℃保存。

　　对纯化好的蛋白进行电泳分析，结果如图3所示(我们利用BSA为标准品来定量纯化好的蛋白浓度。定量之前，先取10μl纯化好的蛋白进行15倍稀释，然后将稀释好的蛋白分别取1μl和2μl与BSA标准品进行比较从而定量。)获得质量好酶活高的PAT融合蛋白为高通量单细胞测序的相关应用奠定了基础，我们使用的一步亲和层析纯化方式(PEI沉淀细菌DNA)是最理想的选择。利用该亲和层析纯化PAT的优势是：

　　1步骤简便，可操作性强，所需时间短；

　　2产量高；

　　3蛋白纯化费用少；

　　4可放大纯化规模。

　　我们纯化的PAT无细菌DNA残留，一步纯化的纯度达到95％以上，PAT的产量可以达到14mg/L培养基，足够进行100万个单细胞文库的制备。

　　实施例2、PAT融合蛋白各个功能嵌段的优化

　　一、linker序列的优化筛选

　　选择特异的linker(-GGSDDDKEF-)序列连接PAT的不同功能片段，能够保护ProteinA和Tn5的天然构象，从而获得活性更好的融合蛋白。

　　连接不同linker的融合蛋白的的方法和活性验证的步骤如下：

　　1、在Tn5的原有序列上连上2xProtein A(IgG识别序列)时，通过PCR引入不同的linker序列(见表1，共10种linker序列)。

　　表1不同linker序列

　　2、按照实施例1所述的方法获得通过不同linker连接的PAT，随后对其进行功能鉴定，方法如下：

　　1)取10μl IgG beads，用200μl HGX缓冲液洗涤三次，4℃，2000g离心3min。

　　2)加入6μg Tn5(没有融合Protein A)或PAT(融合Protein A)，放大到100μl体系，4℃，孵育1h。

　　3)用200μl HGX缓冲液漂洗三次，4℃，2000g离心3min，弃掉上清。

　　4)用20μl 0.5M HAc(pH 3.4)洗脱Tn5或PAT，用1M NaOH调节pH至7.2。

　　5)4％-7.5％SDS-PAGE检测，

　　我们进行了一组的IP(蛋白质免疫沉淀)对照试验，检测结果如图4所示，每组做了两个平行，当没有融合Protein A的Fc结构域时，Tn5不能被IgG beads特异捕获，Tn5蛋白最后全出现在废液中(post-SN)，当Tn5融合Protein A的Fc结构域时并以linker(-GGSDDDKEF-)序列连接时，PAT全部被IgG beads捕获，证明Protein A可以高效(效率为98％)的识别IgG。

　　通过添加的linker筛查证明，linker(-GGSDDDKEF-)序列可以保护Protein A和Tn5的天然构象，不影响Tn5的酶活，并且不影响Protein A蛋白对抗体的识别，如图4的结果所示。(见下方结果描述，IP1和IP2指的是一个实验的两个平行，我们最后所使用的linker序列在表1中是编号4)。

　　通过上述筛选，最后确定在保护Protein A和Tn5的天然构象以及维持Tn5超高酶活方面有着特殊优势。

　　二、Protein A和Tn5嵌段的融合方式对PAT活性的影响试验

　　所述试验方法包括以下步骤：

　　1)在Tn5的N端融合两个来源于金黄色酿脓葡萄球菌Protein A蛋白的IgG识别结构域，，并命名为pA2-Tn5。

　　2)在Tn5的C端融合两个来源于金黄色酿脓葡萄球菌Protein A蛋白的IgG识别结构域，并命名为Tn5-pA2。

　　3)将纯化完的pA2-Tn5和Tn5-pA2装配上反应接头(连上切割adaptors)。

　　4)取500ng的小鼠基因组作为反应底物，用不同浓度的pA2-Tn5和Tn5-pA2，55℃反应10min。

　　5)用stopping缓冲液终止反应，55℃反应5min，经1.5％琼脂糖凝胶电泳检测,如图5所示。

　　通过实验比较，如图5的结果所示，随着加入的PAT量的增加，酶切产生的DNA片段越来越小，并且当Protein A的编码序列添加在Tn5的N端时(pA2-Tn5)，纯化出的Tn5酶活更高，是C端融合Protein A(Tn5-pA2)酶活的16.7倍，我们将酶活更高的pA2-Tn5统一简称为PAT。

　　实施例3、自然状态和细胞交联ChIP-seq方法验证PAT活性

　　1、PAT ChIP-seq方法一(细胞不交联，处于自然状态)，包括以下步骤：

　　1)收集约1,000,000个体外培养的胚胎干细胞，用PBS洗2次，离心收集细胞后用洗涤缓冲液1洗3次。

　　2)用结合缓冲液重悬细胞，加入适量的抗体，所述抗体为H3K4me3抗体(Millipore,04-745,Lot:2872328)，在4℃孵育30min，使抗体与目标蛋白充分结合。

　　3)用洗涤缓冲液2洗涤细胞3次，除去多余没有结合的抗体。

　　4)用洗涤缓冲液2重悬细胞，之后加入PAT融合蛋白，在4℃孵育30min，使得融合蛋白与抗体充分结合。

　　5)用洗涤缓冲液2洗涤细胞3次以除去多余的PAT融合蛋白。

　　6)加入反应缓冲液，激活PAT融合蛋白的活性，为降低反应背景，在4℃下进行反应，反应30min。

　　7)加入终止缓冲液终止反应，反应终止后，用QIAGEN DNA纯化试剂盒进行纯化。

　　8)纯化好的DNA直接用NEB Nextera index引物进行PCR扩增完成建库。

　　9)将完成建库的文库用于二代测序。

　　检测上述方法和下述对比例1(基于普通超声波的H3K4me3Sonicate ChIP-seq)所述方法的文库背景，具体检测结果详见图6-A和图7-A。

　　根据图6-A(Rep1和Rep2是两个实验重复)的实验结果可知，使用所述PAT融合蛋白的ChIP-seq能够获得与对比例1所述超声ChIP-Seq基本相同的阳性信号，同时，其背景信号(如图6-A所示的阴影部分)要明显低于对比例1。

　　根据图7-A所示结果可知，与对比例1相比，使用所述PAT融合蛋白的ChIP-seq获得的H3K4me3信号在TSS附近更为集中，表现出更高的信噪比，而对比例1的信号在启动子区域比较分散。

　　2、PAT ChIP-seq方法二(细胞交联)，包括以下步骤：

　　1)收集1,000,000个胚胎干细胞，用1％甲醛室温交联3-10min，甘氨酸中和后用PBS洗3次。

　　2)用含0.3％SDS的低渗溶液重悬细胞，37℃孵育30min使染色质充分打开。

　　3)离心去掉上清。

　　4)用结合缓冲液洗涤细胞1次，然后用结合缓冲液重悬细胞并加入抗体，所述抗体为H3K27ac抗体，在4℃孵育30min使抗体与蛋白充分结合。

　　5)洗涤缓冲液2洗涤细胞3次，除去多余没有结合的抗体。

　　6)用洗涤缓冲液2重悬细胞，之后加入PAT融合蛋白，4℃孵育30min，使得融合蛋白与抗体充分结合。

　　7)洗涤缓冲液2洗涤细胞3次以除去多余的没有结合的PAT融合蛋白。

　　8)加入反应缓冲液，激活PAT融合蛋白的活性，为降低反应背景，在4℃下进行反应，反应30min。

　　9)加入终止缓冲液终止反应，反应终止后，用QIAGEN DNA纯化试剂盒进行纯化。

　　10)纯化好的DNA直接用NEB Nextera index引物进行PCR扩增完成建库。

　　11)将完成建库的文库用于二代测序。

　　检测上述方法和下述对比例2(基于普通超声波的H3K27ac Sonicate ChIP-seq)所述方法的文库背景，具体检测结果详见图6-B和图7-B。

　　根据图6-B(Rep1和Rep2是两个实验重复)的实验结果可知，使用所述PAT融合蛋白的ChIP-seq能够获得与对比例2所述超声ChIP-Seq基本相同的阳性信号，同时，其背景信号(如图6-B所示的阴影部分)要明显低于对比例2。

　　根据图7-B所示结果可知，与对比例2相比，使用所述PAT融合蛋白的ChIP-seq获得的H3K27ac信号在TSS附近更为集中，表现出更高的信噪比，而对比例2的信号在启动子区域比较弱。

　　结果显示：将自然状态下H3K4Me3In situ-ChIP-seq，以及交联状态下H3K27ac Insitu-ChIP-seq分别与对应的传统Sonication ChIP-seq比较，可以得出PAT构建出的文库质量显然都要比传统的方法好，信噪比更强。

　　3、PAT ChIP-seq方法三(原位组织切片)，包括以下步骤：

　　1)PBS洗涤组织切片3次，然后用洗涤缓冲液1洗涤切片3次。

　　2)用结合缓冲液洗涤切片一次，用结合缓冲液覆盖组织切片，加入抗体，所述抗体为H3K4Me3抗体，在4℃孵育1h使抗体与蛋白充分结合。

　　3)洗涤缓冲液2洗涤切片3次，除去多余没有结合的抗体。

　　4)用洗涤缓冲液2覆盖组织切片，之后加入PAT融合蛋白，4℃孵育30min，使得融合蛋白与抗体充分结合。

　　5)洗涤缓冲液2洗涤切片3次以除去多余的PAT融合蛋白。

　　6)加入反应缓冲液，激活PAT融合蛋白的活性，为降低反应背景，在4℃下进行反应，反应30min。

　　7)加入终止缓冲液终止反应，反应终止后直接加入NEB Nextera index引物和等温DNA聚合酶(如Phi29DNA聚合酶)在一定温度下进行PCR扩增建库。

　　8)PCR完成后，将DNA洗脱下来，用AMP beads进行纯化完成建库。

　　9)建库完成的文库直接用于二代测序。

　　结果如图8所示，我们对早期E7.75的胚胎进行组织切片(图8-A)，利用本公开的原位ChIP-seq(图8-B)，从空间位置上探索了重要转录因子周围的H3K4me3在胚胎发育早期(原肠运动)的动态变化(图8-C)。这项技术的实现有利于我们对细胞或组织本身进行直接操作，屏蔽了外界条件造成的背景干扰，真正能够做到探求细胞内最真实的生命调控过程。

　　实施例4、PAGT融合蛋白的构建及功能验证

　　本实施例提供一种PAT融合蛋白的改进方案，由于Protein G对来源于小鼠的IgG有极高的亲和能力，因此，我们进一步开发出PAGT融合蛋白，在PAT中进一步融合Protein G蛋白的IgG识别结构域，丰富了抗体来源的多样性：

　　一、PAGT蛋白的构建

　　在Tn5的N端连上Protein A和Protein G的IgG识别结构域(单体顺序连接两个蛋白，从N端到C端顺序依次是2xProtein A，Protein G，Tn5，然后构成同源二聚体，各个功能嵌段的linker和PAT的一致，linker序列都为-GGSDDDKEF-)，具体的连接质粒的构建及蛋白纯化方法同实施例1。

　　二、PAGT蛋白的功能验证

　　利用PAT和PAGT进行少量细胞的ChIP，按照上述实施例3所述的ChIP-seq检测方法的步骤对所述PAGT蛋白的功能进行验证(如图9-10所示)。

　　结果显示：通过H3K27ac(abcam 4729,GR3216173-1)ChIP-seq的实验比较，PAGT与PAT构建出的文库质量显然都要比传统的方法好，信噪比更强，并且PAGT和PAT构建出的文库质量没有明显差异。

　　实施例5、PAT融合蛋白进行高通量ChIP-seq检测方法(细胞不交联，处于自然状态)

　　包括以下步骤：

　　1)收集约200,000个体外培养的胚胎干细胞，用PBS洗2次，离心收集细胞后用洗涤缓冲液A洗1次。

　　2)用1ml洗涤缓冲液A重悬，加入10μl经激活缓冲液激活的ConA beads，室温反应10min，回收细胞，弃掉上清。

　　3)用100μl洗涤缓冲液C重悬细胞，加入适量的抗体(一般0.5μg/100ul)，所述抗体为H3K27ac抗体(abcam 4729,GR3216173-1，该抗体须全程添加去乙酰化酶抑制剂)，在4℃孵育4h，使抗体与目的蛋白充分结合。

　　4)用洗涤缓冲液B洗涤细胞2次，除去多余没有结合的抗体。

　　5)用1％BSA/PBS液重悬细胞。

　　6)准备一个96孔板，用洗涤缓冲液C配制终浓度为3μg/ml T5/T7 barcoded PAT，每一个孔中都加入100μl如图11。

　　7)结合有ConA beads的细胞经FACS分选进上述96孔板，每孔2000个细胞，在4℃孵育1h，使得PAT与抗体充分结合。

　　8)弃掉每孔的PAT，用180μl洗涤缓冲液C洗涤细胞2次以除去多余的融合蛋白。

　　9)加入10μl单细胞反应缓冲液，激活融合蛋白的活性，为降低反应背景，在25℃下进行反应，反应60min。

　　10)加入10μl单细胞终止缓冲液终止反应，室温15min。

　　11)反应终止后，每孔加入20μl单细胞分选缓冲液，合并所有的孔，经DAPI冰上染色15min。

　　12)经30μm的过滤筛过滤，除掉细胞团块，回收细胞。

　　13)用适量的单细胞分选缓冲液重悬细胞。

　　14)再准备一个96孔板，每孔加入4μl单细胞裂解缓冲液，结合有ConA beads的细胞经FACS分选进上述96孔板，每孔20个细胞。

　　15)于65℃反应6h，反应完全后于85℃，15min失活蛋白酶K。

　　16)每孔加入1μl 1.8％tritonX-100，37℃反应60min。

　　17)采用Mosaic Truseq建库方法进行原管建库(Mosaic Truseq建库流程如图12所示)

　　实施例6、PAT融合蛋白进行高通量ChIP-seq检测方法(细胞交联)

　　包括以下步骤：

　　1)收集200,000个胚胎干细胞，1％甲醛室温交联3min，甘氨酸中和后用PBS洗3次。

　　2)用200μl含0.3％SDS的低渗溶液重悬细胞，于62℃孵育10min使染色质充分打开。

　　3)加入20μl 20％Triton X-100，37℃，孵育60min。

　　4)加入1ml洗缓冲液A，加入10μl经激活缓冲液激活的ConA beads，室温反应10min，回收细胞，弃掉上清。

　　5)用100μl洗涤缓冲液C重悬细胞，加入适量的抗体(一般0.5μg/100ul)，所述抗体为H3K27ac抗体(该抗体须全程添加去乙酰化酶抑制剂)，在4℃孵育4h，使抗体与目的蛋白充分结合。

　　6)用洗涤缓冲液B洗涤细胞2次，除去多余没有结合的抗体。

　　7)用1％BSA/PBS液重悬细胞。

　　8)准备一个96孔板，用洗涤缓冲液C配制终浓度为3μg/ml T5/T7 barcoded PAT,每一个孔中都加入100μl如图11。，

　　9))结合有ConA beads的细胞经FACS分选进上述96孔板，每孔2000个细胞，在4℃孵育1h，使得PAT与抗体充分结合。

　　10)弃掉每孔的PAT,用180μl洗涤缓冲液C洗涤细胞2次以除去多余的融合蛋白。

　　11)加入10μl单细胞反应缓冲液，激活融合蛋白的活性，为降低反应背景，在37℃下进行反应，反应60min。

　　12)加入10μl单细胞终止缓冲液终止反应，室温15min。

　　13)反应终止后，每孔加入20μl单细胞分选缓冲液,合并所有的孔，经DAPI冰上染色15min。

　　14)经30μm的过滤筛过滤，除掉细胞团块，回收细胞。

　　15)用适量的单细胞分选缓冲液重悬细胞。

　　16)再准备一个96孔板，每孔加入4μl单细胞裂解缓冲液，结合有ConA beads的细胞经FACS分选进上述96孔板，每孔20个细胞。

　　17)于65℃反应6h，反应完全后于85℃，15min失活蛋白酶K。

　　18)每孔加入1μl 1.8％tritonX-100，37℃反应60min。

　　19)采用Mosaic Truseq建库方法进行原管建库。

　　实施例7、单细胞Mosaic Truseq两步PCR文库制备方法

　　本实施例提供一种新的单细胞Mosaic Truseq两步PCR的文库制备方法，得到的单细胞文库可以使用illumina标准测序方法和平台。与特殊定制的单细胞测序方法相比，Mosaic Truseq文库只需要1/15的测序成本。所述Mosaic Truseq建库方法包括以下步骤(如图12所示)：

　　1)按照如下体系配制PCR反应体系：

　　引物序列如下：

　　F1st—ACACTCTTTCCCTACACGACGCTCTTCCGATCTTCGTCGGCAGCGTCTCCACGC(SEQ IDNO.6)

　　R1st--GACTGGAGTTCAGACGTGTGCTCTTCCGATCTGTCTCGTGGGCTCGGCTGTCCCTGT(SEQID NO.7)

　　扩增程序为：72℃5min,98℃30s,13个循环(98℃10s+63℃30s+72℃1min),72℃延伸5min.

　　2)每孔加入0.5μl 20U/μl Exo I(NEB M0293S)，37℃孵育30min，72℃孵育20min失活Exo I。

　　3)每孔加入1μl 25uM 5’index(Truseq P5 index)和1μl 25uM 3’index(TruseqP7 index)，8μl反应混合液。

　　扩增程序为：98℃30s,5个循环(98℃10s+63℃30s+72℃1min),72℃延伸5min.

　　4)PCR进行完之后，混合96孔板的96孔，通过柱纯化，60μl elution buffer洗脱DNA。

　　5)用1.0x Ampure XP-beads纯化一次，用(0.5+0.5)x Ampure XP-beads做一次size selection，最后用20μl H2O溶解DNA。

　　6)illunima测序平台双端150bp测序。

　　不仅仅限于少量细胞，本公开的高通量单细胞ChIP-seq技术适用于所有的细胞类型(培养的细胞或组织消化的细胞等均可)；适用于甲醛交联或自然状态下的细胞；适用于组蛋白修饰，DNA结合蛋白和转录因子。总之，PAT和PAGT同时构建了一套完整的选择方案：不受抗体来源限制，不受实验样品来源限制，不受实验条件限制，可以很方便的制作出高质量的ChIP-seq文库。

　　对比例1&2、基于普通超声波的ChIP-seq

　　对比例1、基于普通超声波的H3K4me3 ChIP-seq(H3K4me3sonication ChIP)

　　对比例2、基于普通超声波的H3K27ac ChIP-seq(H3K27ac sonication ChIP)

　　操作方法相同，包括如下步骤：

　　1)收集1,000,000个体外培养的细胞，用甲醛室温交联10min，用甘氨酸中和后用PBS洗涤细胞3次，然后用液氮速冻。

　　2)用1ml低渗溶液(加蛋白酶抑制剂)将细胞悬起，在冰上孵育15min。

　　3)用玻璃Dounce pestle B将细胞混10-20次使细胞进一步分散，并将细胞破碎。

　　4)4℃,3000rpm离心5min以收集细胞核。

　　5)用100μl细胞核裂解液(含1％SDS)重悬细胞核，轻轻混匀，4℃孵育30min以充分裂解细胞核。

　　6)孵育后，简单离心，然后加ChIP稀释缓冲液稀释SDS浓度到0.3％，轻轻混匀。

　　7)超声(Q800R2)：时间：6min；程序:15s on，45s off；能量：600瓦特。

　　8)超声后，加入ChIP稀释缓冲液，混匀后4℃，20,000离心20min，将上清转移至新的EP管中。

　　9)准备70μl Protein G，用1％BSA/PBS洗3次，然后分20μl protein G磁珠加入到步骤8)到上清中，4℃孵育1个小时，以去除非一些特异结合的蛋白。分别加入5μg H3K4me3和5μg H3K27ac抗体到染色体上清中，同时加入1ml 1％BSA/PBS到剩余的50μl protein G磁珠中，4℃过夜。

　　10)1h后，用磁力架收集protein G磁珠，转移上清到一个新的EP管中，加入抗体，4℃孵育过夜。

　　11)第二天，将封闭过夜的protein G磁珠转移到染色质-抗体的混合液中，4℃孵育4h。

　　12)洗protein G磁珠。

　　13)用磁力架收集磁珠，然后进行如下洗涤过程。

　　a.4℃，用高盐洗涤缓冲液洗涤protein G磁珠1次，5min/次。

　　b.4℃，用低盐洗涤缓冲液溶液洗涤protein G磁珠3次，5min/次。

　　c.4℃，用1ml 1×TE溶液简单洗涤磁珠1次。

　　d.4℃，用800μl 1×TE溶液简单洗涤磁珠1次，然后转移到一个新的EP管中。

　　14)去除残留的液体，然后加入110μl ChIP洗脱缓冲液洗脱磁珠上的DNA，将ChIP洗脱缓冲液和磁珠在70℃孵育过夜。

　　15)第三天，用磁力架将上清转移到一个新的EP管中，然后加入100μl TE溶液再次洗脱磁珠上的DNA，将第二次洗脱的TE溶液和第一次的洗脱ChIP elution buffer结合在一起，加入3μl10mg/ml蛋白酶K,55℃孵育6-8h。

　　16)第四天，用QIAGEN DNA纯化试剂盒纯化ChIPed DNA。

　　17)纯化完的DNA用“NEBNext Ultra DNA library Prep Kit for Illumina”试剂盒进行常规建库，常规建库过程需要1天。

　　18)将建库好的文库进行二代测序。

　　试剂配方：

　　ChIP洗脱缓冲液：50mM Tris-HCl(pH 8.0)，10mM EDTA，1％SDS；

　　ChIP稀释缓冲液：0.01％SDS，1％Triton X-100，2mM EDTA，20mM Tris-HCl(pH7.5)，150mM NaCl；

　　低盐洗涤缓冲液：0.1％脱氧胆酸钠，1％Triton X-100，2mM EDTA，50mM HEPES(pH7.5)，150mM NaCl；

　　高盐洗涤缓冲液：0.1％脱氧胆酸钠，1％TritonX-100，2mM EDTA，50mM HEPES(pH7.5)，500mM NaCl；

　　核裂解缓冲液：1％SDS，10mM EDTA，50mM Tris-HCl(pH8.0)。

　　最后应说明的是：以上各实施例仅用做帮助本领域技术人员理解本发明的实质，不作为对本发明保护范围的限定。

　　SEQUENCE LISTING

　　<110> 北京大学

　　<120> 一种用于单细胞ChIP-seq文库制备的融合蛋白及其应用

　　<160> 7

　　<170> PatentIn version 3.3

　　<210> 1

　　<211> 476

　　<212> PRT

　　<213> 人工序列

　　<400> 1

　　Met Ile Thr Ser Ala Leu His Arg Ala Ala Asp Trp Ala Lys Ser Val

　　1 5 1015

　　Phe Ser Ser Ala Ala Leu Gly Asp Pro Arg Arg Thr Ala Arg Leu Val

　　202530

　　Asn Val Ala Ala Gln Leu Ala Lys Tyr Ser Gly Lys Ser Ile Thr Ile

　　354045

　　Ser Ser Glu Gly Ser Glu Ala Met Gln Glu Gly Ala Tyr Arg Phe Ile

　　505560

　　Arg Asn Pro Asn Val Ser Ala Glu Ala Ile Arg Lys Ala Gly Ala Met

　　65707580

　　Gln Thr Val Lys Leu Ala Gln Glu Phe Pro Glu Leu Leu Ala Ile Glu

　　859095

　　Asp Thr Thr Ser Leu Ser Tyr Arg His Gln Val Ala Glu Glu Leu Gly

　　100 105 110

　　Lys Leu Gly Ser Ile Gln Asp Lys Ser Arg Gly Trp Trp Val His Ser

　　115 120 125

　　Val Leu Leu Leu Glu Ala Thr Thr Phe Arg Thr Val Gly Leu Leu His

　　130 135 140

　　Gln Glu Trp Trp Met Arg Pro Asp Asp Pro Ala Asp Ala Asp Glu Lys

　　145 150 155 160

　　Glu Ser Gly Lys Trp Leu Ala Ala Ala Ala Thr Ser Arg Leu Arg Met

　　165 170 175

　　Gly Ser Met Met Ser Asn Val Ile Ala Val Cys Asp Arg Glu Ala Asp

　　180 185 190

　　Ile His Ala Tyr Leu Gln Asp Lys Leu Ala His Asn Glu Arg Phe Val

　　195 200 205

　　Val Arg Ser Lys His Pro Arg Lys Asp Val Glu Ser Gly Leu Tyr Leu

　　210 215 220

　　Tyr Asp His Leu Lys Asn Gln Pro Glu Leu Gly Gly Tyr Gln Ile Ser

　　225 230 235 240

　　Ile Pro Gln Lys Gly Val Val Asp Lys Arg Gly Lys Arg Lys Asn Arg

　　245 250 255

　　Pro Ala Arg Lys Ala Ser Leu Ser Leu Arg Ser Gly Arg Ile Thr Leu

　　260 265 270

　　Lys Gln Gly Asn Ile Thr Leu Asn Ala Val Leu Ala Glu Glu Ile Asn

　　275 280 285

　　Pro Pro Lys Gly Glu Thr Pro Leu Lys Trp Leu Leu Leu Thr Ser Glu

　　290 295 300

　　Pro Val Glu Ser Leu Ala Gln Ala Leu Arg Val Ile Asp Ile Tyr Thr

　　305 310 315 320

　　His Arg Trp Arg Ile Glu Glu Phe His Lys Ala Trp Lys Thr Gly Ala

　　325 330 335

　　Gly Ala Glu Arg Gln Arg Met Glu Glu Pro Asp Asn Leu Glu Arg Met

　　340 345 350

　　Val Ser Ile Leu Ser Phe Val Ala Val Arg Leu Leu Gln Leu Arg Glu

　　355 360 365

　　Ser Phe Thr Leu Pro Gln Ala Leu Arg Ala Gln Gly Leu Leu Lys Glu

　　370 375 380

　　Ala Glu His Val Glu Ser Gln Ser Ala Glu Thr Val Leu Thr Pro Asp

　　385 390 395 400

　　Glu Cys Gln Leu Leu Gly Tyr Leu Asp Lys Gly Lys Arg Lys Arg Lys

　　405 410 415

　　Glu Lys Ala Gly Ser Leu Gln Trp Ala Tyr Met Ala Ile Ala Arg Leu

　　420 425 430

　　Gly Gly Phe Met Asp Ser Lys Arg Thr Gly Ile Ala Ser Trp Gly Ala

　　435 440 445

　　Leu Trp Glu Gly Trp Glu Ala Leu Gln Ser Lys Leu Asp Gly Phe Leu

　　450 455 460

　　Ala Ala Lys Asp Leu Met Ala Gln Gly Ile Lys Ile

　　465 470 475

　　<210> 2

　　<211> 476

　　<212> PRT

　　<213> 人工序列

　　<400> 2

　　Met Ile Thr Ser Ala Leu His Arg Ala Ala Asp Trp Ala Lys Ser Val

　　1 5 1015

　　Phe Ser Ser Ala Ala Leu Gly Asp Pro Arg Arg Thr Ala Arg Leu Val

　　202530

　　Asn Val Ala Ala Gln Leu Ala Lys Tyr Ser Gly Lys Ser Ile Thr Ile

　　354045

　　Ser Ser Glu Gly Ser Lys Ala Met Gln Glu Gly Ala Tyr Arg Phe Ile

　　505560

　　Arg Asn Pro Asn Val Ser Ala Glu Ala Ile Arg Lys Ala Gly Ala Met

　　65707580

　　Gln Thr Val Lys Leu Ala Gln Glu Phe Pro Glu Leu Leu Ala Ile Glu

　　859095

　　Asp Thr Thr Ser Leu Ser Tyr Arg His Gln Val Ala Glu Glu Leu Gly

　　100 105 110

　　Lys Leu Gly Ser Ile Gln Asp Lys Ser Arg Gly Trp Trp Val His Ser

　　115 120 125

　　Val Leu Leu Leu Glu Ala Thr Thr Phe Arg Thr Val Gly Leu Leu His

　　130 135 140

　　Gln Glu Trp Trp Met Arg Pro Asp Asp Pro Ala Asp Ala Asp Glu Lys

　　145 150 155 160

　　Glu Ser Gly Lys Trp Leu Ala Ala Ala Ala Thr Ser Arg Leu Arg Met

　　165 170 175

　　Gly Ser Met Met Ser Asn Val Ile Ala Val Cys Asp Arg Glu Ala Asp

　　180 185 190

　　Ile His Ala Tyr Leu Gln Asp Lys Leu Ala His Asn Glu Arg Phe Val

　　195 200 205

　　Val Arg Ser Lys His Pro Arg Lys Asp Val Glu Ser Gly Leu Tyr Leu

　　210 215 220

　　Tyr Asp His Leu Lys Asn Gln Pro Glu Leu Gly Gly Tyr Gln Ile Ser

　　225 230 235 240

　　Ile Pro Gln Lys Gly Val Val Asp Lys Arg Gly Lys Arg Lys Asn Arg

　　245 250 255

　　Pro Ala Arg Lys Ala Ser Leu Ser Leu Arg Ser Gly Arg Ile Thr Leu

　　260 265 270

　　Lys Gln Gly Asn Ile Thr Leu Asn Ala Val Leu Ala Glu Glu Ile Asn

　　275 280 285

　　Pro Pro Lys Gly Glu Thr Pro Leu Lys Trp Leu Leu Leu Thr Ser Glu

　　290 295 300

　　Pro Val Glu Ser Leu Ala Gln Ala Leu Arg Val Ile Asp Ile Tyr Thr

　　305 310 315 320

　　His Arg Trp Arg Ile Glu Glu Phe His Lys Ala Trp Lys Thr Gly Ala

　　325 330 335

　　Gly Ala Glu Arg Gln Arg Met Glu Glu Pro Asp Asn Leu Glu Arg Met

　　340 345 350

　　Val Ser Ile Leu Ser Phe Val Ala Val Arg Leu Leu Gln Leu Arg Glu

　　355 360 365

　　Ser Phe Thr Pro Pro Gln Ala Leu Arg Ala Gln Gly Leu Leu Lys Glu

　　370 375 380

　　Ala Glu His Val Glu Ser Gln Ser Ala Glu Thr Val Leu Thr Pro Asp

　　385 390 395 400

　　Glu Cys Gln Leu Leu Gly Tyr Leu Asp Lys Gly Lys Arg Lys Arg Lys

　　405 410 415

　　Glu Lys Ala Gly Ser Leu Gln Trp Ala Tyr Met Ala Ile Ala Arg Leu

　　420 425 430

　　Gly Gly Phe Met Asp Ser Lys Arg Thr Gly Ile Ala Ser Trp Gly Ala

　　435 440 445

　　Leu Trp Glu Gly Trp Glu Ala Leu Gln Ser Lys Leu Asp Gly Phe Leu

　　450 455 460

　　Ala Ala Lys Asp Leu Met Ala Gln Gly Ile Lys Ile

　　465 470 475

　　<210> 3

　　<211> 9

　　<212> PRT

　　<213> 人工序列

　　<400> 3

　　Gly Gly Ser Asp Asp Asp Lys Glu Phe

　　1 5

　　<210> 4

　　<211> 611

　　<212> PRT

　　<213> 人工序列

　　<400> 4

　　Met Val Asp Asn Lys Phe Asn Lys Glu Gln Gln Asn Ala Phe Tyr Glu

　　1 5 1015

　　Ile Leu His Leu Pro Asn Leu Asn Glu Glu Gln Arg Asn Ala Phe Ile

　　202530

　　Gln Ser Leu Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu

　　354045

　　Ala Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys Val Asp Asn Lys Phe

　　505560

　　Asn Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile Leu His Leu Pro Asn

　　65707580

　　Leu Asn Glu Glu Gln Arg Asn Ala Phe Ile Gln Ser Leu Lys Asp Asp

　　859095

　　Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala Lys Lys Leu Asn Gly

　　100 105 110

　　Ala Gln Ala Pro Lys Val Asp Ala Asn Ser Ala Gly Lys Ser Thr Gly

　　115 120 125

　　Gly Ser Asp Asp Asp Lys Glu Phe Ile Thr Ser Ala Leu His Arg Ala

　　130 135 140

　　Ala Asp Trp Ala Lys Ser Val Phe Ser Ser Ala Ala Leu Gly Asp Pro

　　145 150 155 160

　　Arg Arg Thr Ala Arg Leu Val Asn Val Ala Ala Gln Leu Ala Lys Tyr

　　165 170 175

　　Ser Gly Lys Ser Ile Thr Ile Ser Ser Glu Gly Ser Lys Ala Met Gln

　　180 185 190

　　Glu Gly Ala Tyr Arg Phe Ile Arg Asn Pro Asn Val Ser Ala Glu Ala

　　195 200 205

　　Ile Arg Lys Ala Gly Ala Met Gln Thr Val Lys Leu Ala Gln Glu Phe

　　210 215 220

　　Pro Glu Leu Leu Ala Ile Glu Asp Thr Thr Ser Leu Ser Tyr Arg His

　　225 230 235 240

　　Gln Val Ala Glu Glu Leu Gly Lys Leu Gly Ser Ile Gln Asp Lys Ser

　　245 250 255

　　Arg Gly Trp Trp Val His Ser Val Leu Leu Leu Glu Ala Thr Thr Phe

　　260 265 270

　　Arg Thr Val Gly Leu Leu His Gln Glu Trp Trp Met Arg Pro Asp Asp

　　275 280 285

　　Pro Ala Asp Ala Asp Glu Lys Glu Ser Gly Lys Trp Leu Ala Ala Ala

　　290 295 300

　　Ala Thr Ser Arg Leu Arg Met Gly Ser Met Met Ser Asn Val Ile Ala

　　305 310 315 320

　　Val Cys Asp Arg Glu Ala Asp Ile His Ala Tyr Leu Gln Asp Lys Leu

　　325 330 335

　　Ala His Asn Glu Arg Phe Val Val Arg Ser Lys His Pro Arg Lys Asp

　　340 345 350

　　Val Glu Ser Gly Leu Tyr Leu Tyr Asp His Leu Lys Asn Gln Pro Glu

　　355 360 365

　　Leu Gly Gly Tyr Gln Ile Ser Ile Pro Gln Lys Gly Val Val Asp Lys

　　370 375 380

　　Arg Gly Lys Arg Lys Asn Arg Pro Ala Arg Lys Ala Ser Leu Ser Leu

　　385 390 395 400

　　Arg Ser Gly Arg Ile Thr Leu Lys Gln Gly Asn Ile Thr Leu Asn Ala

　　405 410 415

　　Val Leu Ala Glu Glu Ile Asn Pro Pro Lys Gly Glu Thr Pro Leu Lys

　　420 425 430

　　Trp Leu Leu Leu Thr Ser Glu Pro Val Glu Ser Leu Ala Gln Ala Leu

　　435 440 445

　　Arg Val Ile Asp Ile Tyr Thr His Arg Trp Arg Ile Glu Glu Phe His

　　450 455 460

　　Lys Ala Trp Lys Thr Gly Ala Gly Ala Glu Arg Gln Arg Met Glu Glu

　　465 470 475 480

　　Pro Asp Asn Leu Glu Arg Met Val Ser Ile Leu Ser Phe Val Ala Val

　　485 490 495

　　Arg Leu Leu Gln Leu Arg Glu Ser Phe Thr Pro Pro Gln Ala Leu Arg

　　500 505 510

　　Ala Gln Gly Leu Leu Lys Glu Ala Glu His Val Glu Ser Gln Ser Ala

　　515 520 525

　　Glu Thr Val Leu Thr Pro Asp Glu Cys Gln Leu Leu Gly Tyr Leu Asp

　　530 535 540

　　Lys Gly Lys Arg Lys Arg Lys Glu Lys Ala Gly Ser Leu Gln Trp Ala

　　545 550 555 560

　　Tyr Met Ala Ile Ala Arg Leu Gly Gly Phe Met Asp Ser Lys Arg Thr

　　565 570 575

　　Gly Ile Ala Ser Trp Gly Ala Leu Trp Glu Gly Trp Glu Ala Leu Gln

　　580 585 590

　　Ser Lys Leu Asp Gly Phe Leu Ala Ala Lys Asp Leu Met Ala Gln Gly

　　595 600 605

　　Ile Lys Ile

　　610

　　<210> 5

　　<211> 702

　　<212> PRT

　　<213> 人工序列

　　<400> 5

　　Met Thr Met Ile Thr Pro Ser Leu Lys Asp Asp Pro Ser Gln Ser Ala

　　1 5 1015

　　Asn Leu Leu Ser Glu Ala Lys Lys Leu Asn Glu Ser Gln Ala Pro Lys

　　202530

　　Ala Asp Asn Lys Phe Asn Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile

　　354045

　　Leu His Leu Pro Asn Leu Asn Glu Glu Gln Arg Asn Gly Phe Ile Gln

　　505560

　　Ser Leu Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala

　　65707580

　　Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys Ala Asp Asn Lys Phe Asn

　　859095

　　Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile Leu His Leu Pro Asn Leu

　　100 105 110

　　Thr Glu Glu Gln Arg Asn Gly Phe Ile Gln Ser Leu Lys Asp Asp Pro

　　115 120 125

　　Ser Val Ser Lys Glu Ile Leu Ala Glu Ala Lys Lys Leu Asn Asp Ala

　　130 135 140

　　Gln Ala Pro Lys Thr Thr Tyr Lys Leu Val Ile Asn Gly Lys Thr Leu

　　145 150 155 160

　　Lys Gly Glu Thr Thr Thr Glu Ala Val Asp Ala Glu Thr Ala Glu Arg

　　165 170 175

　　His Phe Lys Gln Tyr Ala Asn Asp Asn Gly Val Asp Gly Glu Trp Thr

　　180 185 190

　　Tyr Asp Asp Ala Thr Lys Thr Phe Thr Val Thr Glu Lys Pro Glu Val

　　195 200 205

　　Ile Asp Ala Ser Glu Leu Thr Pro Ala Val Gly Gly Ser Asp Asp Asp

　　210 215 220

　　Lys Glu Phe Ile Thr Ser Ala Leu His Arg Ala Ala Asp Trp Ala Lys

　　225 230 235 240

　　Ser Val Phe Ser Ser Ala Ala Leu Gly Asp Pro Arg Arg Thr Ala Arg

　　245 250 255

　　Leu Val Asn Val Ala Ala Gln Leu Ala Lys Tyr Ser Gly Lys Ser Ile

　　260 265 270

　　Thr Ile Ser Ser Glu Gly Ser Lys Ala Met Gln Glu Gly Ala Tyr Arg

　　275 280 285

　　Phe Ile Arg Asn Pro Asn Val Ser Ala Glu Ala Ile Arg Lys Ala Gly

　　290 295 300

　　Ala Met Gln Thr Val Lys Leu Ala Gln Glu Phe Pro Glu Leu Leu Ala

　　305 310 315 320

　　Ile Glu Asp Thr Thr Ser Leu Ser Tyr Arg His Gln Val Ala Glu Glu

　　325 330 335

　　Leu Gly Lys Leu Gly Ser Ile Gln Asp Lys Ser Arg Gly Trp Trp Val

　　340 345 350

　　His Ser Val Leu Leu Leu Glu Ala Thr Thr Phe Arg Thr Val Gly Leu

　　355 360 365

　　Leu His Gln Glu Trp Trp Met Arg Pro Asp Asp Pro Ala Asp Ala Asp

　　370 375 380

　　Glu Lys Glu Ser Gly Lys Trp Leu Ala Ala Ala Ala Thr Ser Arg Leu

　　385 390 395 400

　　Arg Met Gly Ser Met Met Ser Asn Val Ile Ala Val Cys Asp Arg Glu

　　405 410 415

　　Ala Asp Ile His Ala Tyr Leu Gln Asp Lys Leu Ala His Asn Glu Arg

　　420 425 430

　　Phe Val Val Arg Ser Lys His Pro Arg Lys Asp Val Glu Ser Gly Leu

　　435 440 445

　　Tyr Leu Tyr Asp His Leu Lys Asn Gln Pro Glu Leu Gly Gly Tyr Gln

　　450 455 460

　　Ile Ser Ile Pro Gln Lys Gly Val Val Asp Lys Arg Gly Lys Arg Lys

　　465 470 475 480

　　Asn Arg Pro Ala Arg Lys Ala Ser Leu Ser Leu Arg Ser Gly Arg Ile

　　485 490 495

　　Thr Leu Lys Gln Gly Asn Ile Thr Leu Asn Ala Val Leu Ala Glu Glu

　　500 505 510

　　Ile Asn Pro Pro Lys Gly Glu Thr Pro Leu Lys Trp Leu Leu Leu Thr

　　515 520 525

　　Ser Glu Pro Val Glu Ser Leu Ala Gln Ala Leu Arg Val Ile Asp Ile

　　530 535 540

　　Tyr Thr His Arg Trp Arg Ile Glu Glu Phe His Lys Ala Trp Lys Thr

　　545 550 555 560

　　Gly Ala Gly Ala Glu Arg Gln Arg Met Glu Glu Pro Asp Asn Leu Glu

　　565 570 575

　　Arg Met Val Ser Ile Leu Ser Phe Val Ala Val Arg Leu Leu Gln Leu

　　580 585 590

　　Arg Glu Ser Phe Thr Pro Pro Gln Ala Leu Arg Ala Gln Gly Leu Leu

　　595 600 605

　　Lys Glu Ala Glu His Val Glu Ser Gln Ser Ala Glu Thr Val Leu Thr

　　610 615 620

　　Pro Asp Glu Cys Gln Leu Leu Gly Tyr Leu Asp Lys Gly Lys Arg Lys

　　625 630 635 640

　　Arg Lys Glu Lys Ala Gly Ser Leu Gln Trp Ala Tyr Met Ala Ile Ala

　　645 650 655

　　Arg Leu Gly Gly Phe Met Asp Ser Lys Arg Thr Gly Ile Ala Ser Trp

　　660 665 670

　　Gly Ala Leu Trp Glu Gly Trp Glu Ala Leu Gln Ser Lys Leu Asp Gly

　　675 680 685

　　Phe Leu Ala Ala Lys Asp Leu Met Ala Gln Gly Ile Lys Ile

　　690 695 700

　　<210> 6

　　<211> 54

　　<212> DNA

　　<213> 人工序列

　　<400> 6

　　acactctttc cctacacgac gctcttccga tcttcgtcgg cagcgtctcc acgc 54

　　<210> 7

　　<211> 57

　　<212> DNA

　　<213> 人工序列

　　<400> 7

　　gactggagtt cagacgtgtg ctcttccgat ctgtctcgtg ggctcggctg tccctgt 57

《一种用于单细胞ChIP-seq文库制备的融合蛋白及其应用.doc》

将本文的Word文档下载到电脑，方便收藏和打印

推荐度：

点击下载文档

文档为doc格式(或pdf格式)

组合技术图文推荐

上一篇：一种构建捕获文库的方法和试剂盒

下一篇：具有受控化学计量的多核苷酸文库及其合成