欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 一种高通量蛋白质分析方法及其适用文库独创技术62825字

一种高通量蛋白质分析方法及其适用文库

2023-03-09 22:38:20

一种高通量蛋白质分析方法及其适用文库

  技术领域

  本发明涉及生物领域,特别涉及蛋白组学研究领域,尤其涉及一种高通量蛋白质分析方法及其适用文库。

  背景技术

  目前通过人类基因组计划已经发现和定位了26000多个编码蛋白质的功能基因,其中尚有42%的基因尚不知道功能,在已知基因中酶占10.28%,核酸酶占7.5%,信号传导占12.2%,转录因子占6.0%,信号分子占1.2%,受体分子占5.3%,选择性调节分子占3.2%,等。发现并了解这些功能基因的作用对于了解生命和新药的筛选都具有重要的意义。在蛋白质功能的研究中,制备相应的抗体成为必不可少的工作,但是抗体的获得存在以下问题:1)制备繁琐,成本高;2)许多蛋白质缺乏抗体;3)不同来源抗体特异性和研究目的不同导致同一蛋白质抗体种类繁多,根据不同实验还要选择不同抗体;4)在细胞内和体内研究蛋白质时,很多抗体都表现得无能为力;5)同一抗体公司的抗体制备批次不同导致可能存在自然差异等等。这些问题导致科研时间和经费的极大浪费,给研究者带来了极大的麻烦,制约了研究进程。

  卵子和精子结合形成全能性的受精卵,起始了生命。通过胚胎发育最终形成具有200多种不同体细胞的生命个体,这一过程及其复杂。从受精卵到生物个体发育过程中,细胞时刻都面临选择:保持现有的身份和状态还是转变成另一种身份和状态。细胞身份和状态的维持和变化既受细胞自身内在遗传因素的控制,也受细胞周围环境因素的调节。细胞内外因素的相互作用使得细胞的命运具有可变和转换的特征。生命个体诞生后又会经历一个成长、成熟、衰老的过程,而所有这一切变化的物质基础是包括蛋白质在内的生物大分子。然而,生物大分子如何在生命活动中发挥功能?生物大分子之间如何协同发挥作用?对这些问题的揭示,有助于了解生命,为进一步调控生命,避免疾病提供理论支持。然而,目前对生物大分子的研究缺乏一个适于在体、实时和动态研究的体系。

  发明内容

  鉴于现有技术的缺点,本发明一方面提供了一种高通量蛋白质分析方法,为采用带标签的半克隆小鼠文库,以一个或数个标签蛋白抗体对多个不同感兴趣目标蛋白进行平行指示分析,在带标签的半克隆小鼠文库中,各半克隆小鼠为利用孤雄单倍体胚胎干细胞注入卵子后培育获得的半克隆小鼠或其有性繁殖后代,所述孤雄单倍体胚胎干细胞含有表达感兴趣目标蛋白与标签蛋白的融合蛋白的基因,所述半克隆小鼠能表达感兴趣目标蛋白与标签蛋白的融合蛋白。

  本发明第二方面还提供了一种适用前述高通量蛋白质分析方法的带标签的半克隆小鼠文库及其构建方法。

  本发明的带标签的半克隆小鼠文库中,各半克隆小鼠表达的感兴趣目标蛋白均与标签蛋白融合表达,各半克隆小鼠均为利用孤雄单倍体胚胎干细胞注入卵子后培育获得的半克隆小鼠或其有性繁殖后代,所述孤雄单倍体胚胎干细胞含有表达感兴趣目标蛋白与标签蛋白的融合蛋白的基因。

  本发明带标签的半克隆小鼠文库或来自所述文库的半克隆小鼠可用于蛋白质分析、蛋白功能研究或药物研究领域。

  本发明第三方面还提供了适用于前述高通量蛋白质分析方法的带标签的孤雄单倍体胚胎干细胞文库及其构建方法。

  本发明的标签的孤雄单倍体胚胎干细胞文库中,各孤雄单倍体胚胎干细胞均含有表达感兴趣目标蛋白与标签蛋白的融合蛋白的基因,所述孤雄单倍体胚胎干细胞注入卵子后培育获得的半克隆小鼠能表达感兴趣目标蛋白与标签蛋白的融合蛋白。

  本发明的带标签的孤雄单倍体胚胎干细胞文库或来自所述文库的孤雄单倍体胚胎干细胞可用于蛋白质分析、蛋白功能研究、药物研究领域。

  本发明可获得下列有益效果:

  a)极大地简化了蛋白质科学的研究,避免了繁琐复杂的抗体制备过程,无需昂贵的抗体,解决了难以制备抗体的目标蛋白的研究问题。利用常规的“标签”抗体轻松实现蛋白组学分析及蛋白相互作用网络分析,轻松筛选药物靶点,为疾病诊断治疗提供优质的分析方案和廉价的分析成本。

  b)本发明的应用可以使得对蛋白的研究从细胞水平延伸到发育各个阶段、再到成体各个组织器官。利用本发明可实现在体实时动态定性定量观测、揭示细胞内蛋白或RNA分子之间的作用网络、探索未知蛋白表达谱式及生理功能、实现个体发育全程监控等等。

  c)同一标准制备标签,同一抗体的应用,可以使得研究系统的一致性得到提高,结果的可信度得到大大的提升。具备低成本、高效率、大规模的特点。

  d)携带标签的感兴趣编码蛋白质基因均可以细胞的形式存储,建立带标签的孤雄单倍体胚胎干细胞文库,需要的时候通过卵子注射一步获得小鼠,极大节省动物饲养等成本。相比传统的蛋白过表达研究方法,也极大缩减了研发时间。

  附图说明

  图1、Brd4内源基因组TAP-tag标记示意图

  图1A Brd4小鼠基因组及其3个isoform示意图

  图1B Brd4的全长蛋白isoform 3基因组中TAP标记C端或N端示意图

  图1C TAP标记Brd4C端或N端对应isoform 1、2和3标记示意图

  图2、Brd4-N-ATF标记序列

  图3、Brd4-C-FTA标记序列

  图4、Brd4-C-HTA标记序列

  图5、TAP-tag标记的Brd4蛋白表达检测

  图6、TAP-tag标记的Brd4在细胞中的定位检测

  图6A Brd4-C-HTA标记的孤雄单倍体胚胎干细胞及对应的ICAHCI后建立的ES细胞系(带#样本)免疫荧光检测图

  图6B Brd4-C-FTA,Brd4-N-ATF标记的孤雄单倍体胚胎干细胞及对应的ICAHCI后建立的ES细胞系(带#样本)免疫荧光检测图

  图7、TAP-tag标记Brd4的Co-IP结合蛋白检测

  图7A NC和Brd4-N-ATF孤雄单倍体胚胎干细胞Co-IP检测结果

  图7B Brd4-C-FTA、Brd4-N-ATF和Brd4-C-HTA孤雄单倍体胚胎干细胞Co-IP检测结果

  图8、TAP-tag标记bromodomain基因的蛋白表达水平检测

  图8A在DKO-AG-haESCs孤雄单倍体干细胞系C-HTA标记bromodomain基因中的Atad2b、Baz2b、Brd3、Cecr2的蛋白表达水平检测结果

  图8B在DKO-AG-haESCs孤雄单倍体干细胞系C-HTA标记bromodomain基因中的Baz1b、Pbrm1的蛋白表达水平检测结果

  图9、在Phf7的N端KI Flag的标签小鼠中研究Phf7在基因组上的结合位点

  图9A孤雄单倍体胚胎干细胞的Phf7内源基因组的N端插入3×Flag序列示意图

  图9B ICAHCI注射获得Phf7-KI-Flag杂合小鼠F0,通过对F1杂合小鼠之间进行交配获得Phf7-KI-Flag纯合雄鼠的检测结果

  图9C从Phf7-KI-Flag纯合雄鼠分离出的不同生殖细胞中检测到Phf7-Flag的表达检测结果。

  图9D Co-IP检测Phf7-KI-Flag纯合雄鼠生殖细胞中Phf7-Flag的表达检测结果

  图9E利用Flag抗体对Phf7进行chip-seq检测,并与H3K4me3chip-seq和ubH2AChip-seq的结果在promoter/exon/intron/intergenic区域富集情况进行比较结果。

  图9F Phf7chip-seq和H3K4me3chip-seq结合区域的peaks重合度韦恩图

  图9G H3K4me3&Phf7common,H3K4me3unique,Phf7unique的结果中ubH2A的信号分布Heatmap

  图9H ubH2A的信号结果值

  图10、Hspg2的C端KI Flag的小鼠E15.5天胚胎的蛋白检测

  具体实施方式

  本发明的高通量蛋白质分析方法,为采用带标签的半克隆小鼠文库,以一个或数个标签蛋白抗体对多个不同感兴趣目标蛋白进行平行指示分析,所述带标签的半克隆小鼠文库中,各半克隆小鼠为利用孤雄单倍体胚胎干细胞注入卵子后培育获得的半克隆小鼠或其有性繁殖后代,所述孤雄单倍体胚胎干细胞含有表达感兴趣目标蛋白与标签蛋白的融合蛋白的基因,所述半克隆小鼠能表达感兴趣目标蛋白与标签蛋白的融合蛋白。

  之所以称其为高通量蛋白质分析方法,是因为该分析方法中利用了带标签的半克隆小鼠文库,仅需要采用文库中标签对应的有限个通用的标签蛋白抗体即可对文库中多个感兴趣目标蛋白进行同步平行研究,不仅无需制备感兴趣目标蛋白的抗体,还可以采用同样的操作流程同步进行多个感兴趣目标蛋白的在体研究。这区别于现有的需要制备感兴趣目标蛋白抗体的研究方法,极大简化了蛋白质科学的研究,提高了研究效率。本发明的蛋白质分析方法,无需制备或使用感兴趣目标蛋白抗体。尤其对于难以制备抗体或只有十分昂贵的抗体的目标蛋白的研究,具有十分明显的优势。该方法改变了常规蛋白在体研究思路,为药物筛选、药物作用机理分析、药物代谢等研究提供了极大的方便。且由于采用同样的抗体进行研究,抗体抗原结合亲和力等也比较一致,相比对不同的感兴趣目标蛋白利用不同的目标蛋白抗体,在进行平行比对时,且标签蛋白抗体研究成熟,在灵敏度、特异性上均表现稳定,可参考性更强。

  本发明所述孤雄单倍体胚胎干细胞具有干细胞的自我复制能力与多能性,能取代精子与卵母细胞结合支持胚胎的完全发育。

  本发明所述的半克隆小鼠,可以是自孤雄单倍体胚胎干细胞注入卵子后各个阶段的形态,包括二倍体胚胎干细胞形态、胚胎期形态、新生后各个发育生长阶段的形态。

  利用标签蛋白抗体对感兴趣目标蛋白进行指示分析主要是利用了标签蛋白抗体与标签蛋白之间的抗原抗体结合性质,由于感兴趣目标蛋白与标签蛋白融合表达,因此标签蛋白抗体可连带指示感兴趣目标蛋白。

  现有的利用抗原抗体特异性结合反应的免疫分析试验方法均适用于本发明中利用标签蛋白抗体对感兴趣目标蛋白进行指示分析,包括但不限于:western blot、免疫荧光检测(IF)、免疫沉淀(IP)、免疫共沉淀(Co-IP)、染色质免疫沉淀(Chip-seq)、RNA免疫沉淀(RIP)、交联免疫沉淀(CLIP)、质谱MS、Elisa、串联亲和纯化技术、荧光共振能量转移技术、融合报告基因定位等。进行具体分析实验时,分析样本可采用取自各个形态的半克隆小鼠的生理切片样本、组织样本、体液样本、离体细胞样本、器官样本等。

  本发明的蛋白质分析方法,包括但不限于分析:蛋白质的表达、蛋白质的时空定位、蛋白质相互作用、蛋白质的代谢、蛋白质DNA结合区域、蛋白质与RNA结合区域等。

  具体的,可以利用western blot和Elisa确定蛋白质的表达情况;可以利用免疫荧光检测和融合报告基因定位对蛋白质进行时空定位;可以利用免疫共沉淀技术、串联亲和纯化技术和荧光共振能量转移技术、免疫共沉淀-质谱联用(Co-IP-MS)来分析蛋白质相互作用;通过核磁共振(NMR),质谱(MS),色谱(HPLC,GC)及色谱质谱联用技术技术来分析蛋白质的代谢;通过Chip-seq来分析蛋白质DNA结合区域;通过RIP、CLIP、RNA蛋白质印迹法来分析蛋白质与RNA特异结合区域,并通过上述各系统综合分析研究蛋白质的生理代谢网络。

  可以利用本发明,对来自半克隆小鼠的各个生长阶段、各个组织的样本进行分析,从而了解蛋白质在小鼠体内各个组织中的表现、某具体生长阶段的表现、或一定生长阶段的表现,因此认为,本发明的蛋白质分析方法适于在体、实时、动态的分析。

  应理解,本发明的蛋白质分析方法本身并非以疾病诊断或治疗为目的。

  本发明蛋白质分析方法可以利用带标签的半克隆小鼠文库来实现。在本发明的带标签的半克隆小鼠文库中,各半克隆小鼠表达的感兴趣目标蛋白均与标签蛋白融合表达。各半克隆小鼠可以为利用孤雄单倍体胚胎干细胞注入卵子后培育获得的半克隆小鼠,也可以为其有性繁殖后代。用于构建半克隆小鼠的孤雄单倍体胚胎干细胞应含有表达感兴趣目标蛋白与标签蛋白的融合蛋白的基因。

  可以带标签的孤雄单倍体胚胎干细胞为ICAHCI的供体,采用ICAHCI法获得半克隆胚胎,并进一步可采用胚胎移植的方法在合适的母鼠体内培育所述半克隆胚胎获得半克隆小鼠。

  在已有构建好的带标签的半克隆小鼠文库的基础上,仅需要从中选择能融合表达待研究目标蛋白与标签蛋白融合蛋白的半克隆小鼠,即可方便快速地实现蛋白在体分析。

  由于半克隆小鼠的繁殖保种耗资较大,且也需要占据大量场地,因此,本发明蛋白质分析方法更优选利用带标签的孤雄单倍体胚胎干细胞文库来构建半克隆小鼠或半克隆小鼠文库。基于优化的孤雄单倍体胚胎干细胞技术,孤雄单倍体胚胎干细胞经过体外多轮遗传操作和长期的体外培养后,仍能支持半克隆小鼠的稳定获得。在已有构建好的带标签的孤雄单倍体胚胎干细胞文库的基础上,只需要在蛋白分析前,从文库中选出适于表达目标蛋白与标签蛋白融合蛋白的孤雄单倍体胚胎干细胞注入卵子,只需1个月就能获得所需的半克隆小鼠或半克隆小鼠文库,制备时间短,效率高,节约了大量小鼠饲养的笼位和时间,大大缩减了成本。带标签的孤雄单倍体胚胎干细胞文库以细胞的形式保存,需要时通过卵子注射即可获得小鼠,大大缩减了通过动物保种的成本。

  可根据研发目的,确定带标签的半克隆小鼠文库或带标签的孤雄单倍体胚胎干细胞文库中,与标签蛋白融合表达的表达感兴趣目标蛋白的种类,构成感兴趣目标蛋白组合。将能表达感兴趣目标蛋白组合中,各感兴趣目标蛋白与标签蛋白的融合蛋白的带标签的孤雄单倍体胚胎干细胞或带标签的半克隆小鼠进行组合,构成带标签的孤雄单倍体胚胎干细胞文库或带标签的半克隆小鼠文库。

  感兴趣目标蛋白组合中各感兴趣目标蛋白的选择可以根据需要设定。例如根据结构域分类、功能分类、定位分类、信号通路分类、疾病通路分类等来确定感兴趣目标蛋白组合成员。结构域分类包括但不限于bromodomain家族,death-domain家族,PHD finger家族,POU domain家族,ring finger家族,SET domain家族等等。功能分类包括但不限于细胞黏附、RNA结合、DNA修复、细胞表面受体、细胞因子、细胞因子受体、转录因子、炎症相关因子、激酶、脂转运代谢相关因子、压力相关因子、凋亡、核受体、细胞周期调控因子、热激蛋白、生长因子、细胞迁移等等。定位分类包括但不限于细胞质、核仁、核膜、中心体、高尔基体、内质网、线粒体、核糖体、细胞膜、溶酶体等等。信号通路分类包括但不限于Caspase家族、IAP家族、TRAF家族、TNF受体家族、TNF配体家族、P53信号通路、DNA损失反应通路、细胞周期阻滞通路、Notch信号通路,小GTPase蛋白信号通路,Wnt信号通路等等。疾病通路分类包括但不限于癌症、免疫系统疾病、神经退行性疾病、循环系统疾病、代谢障碍、传染病循环系统疾病等等。

  带标签的孤雄单倍体胚胎干细胞的构建可包括下列步骤:

  1)对孤雄单倍体胚胎干细胞进行基因改造,使其包含表达各感兴趣目标蛋白与标签蛋白的融合蛋白的基因。

  2)筛选出能表达感兴趣目标蛋白与标签蛋白的融合蛋白的孤雄单倍体胚胎干细胞。

  3)将筛选出的孤雄单倍体胚胎干细胞的原代细胞或其传代单倍体细胞保种并建库获得带标签的孤雄单倍体胚胎干细胞文库。

  步骤1)中,可利用现有技术对孤雄单倍体胚胎干细胞进行基因改造。本发明的基因改造可以是对已存在于小鼠孤雄单倍体胚胎干细胞中的感兴趣目标蛋白编码基因通过基因改造原位引入标签蛋白基因;也可以在小鼠孤雄单倍体胚胎干细胞中引入外源的感兴趣目标蛋白编码基因后再对该外源的感兴趣目标蛋白编码基因原位引入标签蛋白基因;或者,也可以直接在小鼠孤雄单倍体胚胎干细胞中引入带标签的外源的感兴趣目标蛋白编码基因。基因改造可利用现有的基因打靶、同源重组等技术来完成,包括但不限于、基于ZFN(锌指核酸酶)、TALEN(转录激活样效应因子核酸酶)和CRISPR/Cas9(成簇规律间隔短回文重复技术)等的基因操作。在本发明的一个较佳的实施方式中,利用CRISPR-Cas9技术介导的基因编辑技术,对孤雄单倍体胚胎干细胞进行的基因打靶以引入标签蛋白基因。

  步骤2)中,可利用PCR进行基因型鉴定,筛选出能表达感兴趣目标蛋白与标签蛋白的融合蛋白的孤雄单倍体胚胎干细胞。可以根据待鉴定的具体情况,设计多对引物以确定基因型。也可以进一步对测序正确的孤雄单倍体胚胎干细胞利用标签蛋白抗体进行western-blot检测,来筛选出能表达感兴趣目标蛋白与标签蛋白的融合蛋白的孤雄单倍体胚胎干细胞。

  步骤3)中,孤雄单倍体胚胎干细胞的传代与保种可采用常规细胞传代与保种的方法。单倍体细胞可采用流式细胞仪收集。

  为了便于利用标签蛋白抗体检测到感兴趣目标蛋白,较佳的,在孤雄单倍体胚胎干细胞或半克隆小鼠表达的感兴趣目标蛋白与标签蛋白的融合蛋白中,标签蛋白全部或部分曝露于融合蛋白表面。可以通过相关模拟软件,例如OMIC Tools,I-TASSER,HHpred,RaptorX,IntFOLD,NAMD(NAnoscale Molecular Dynamics)和VMD来预测设计的融合蛋白能否曝露标签蛋白。

  一种较为推荐的方式是,使所述标签蛋白位于感兴趣目标蛋白的N端和/或C端。这种方式可适合绝大多数的感兴趣目标蛋白。若发现将标签蛋白置于感兴趣目标蛋白的N端或C端无法使标签蛋白的抗原决定簇曝露,也可以将标签蛋白插入感兴趣目标蛋白中的合适位置,以使其抗原决定簇能成功曝露。例如可利用OMIC Tools,I-TASSER,HHpred,RaptorX,IntFOLD,NAMD(NAnoscale Molecular Dynamics)和VMD软件进行相关设计。例如,在有信号肽时,可将标签蛋白设计于感兴趣目标蛋白的C端,或者将标签蛋白设计于N端信号肽的后方。

  在感兴趣目标蛋白的N端融合标签蛋白可将标签蛋白基因插入感兴趣目标蛋白的起始密码子ATG之后感兴趣目标蛋白编码基因之前;在感兴趣目标蛋白的C端融合标签蛋白可将标签蛋白基因插入感兴趣目标蛋白的终止密码子之前感兴趣目标蛋白编码基因之后。当感兴趣目标蛋白N端有信号肽时,可将标签蛋白基因插入感兴趣目标蛋白的信号肽编码基因与感兴趣目标蛋白的其余编码基因之间。

  本发明中,所用的标签蛋白可选自:Flag,HA,Green Proteins(TurboGFP,TagGFP2,mUKG,Superfolder GFP,Emerald,EGFP,Monomeric Azami Green,mWasabi,Clover,mNeonGreen,NowGFP,mClover3),Red Proteins(TagRFP,TagRFP-T,RRvT,mRuby,mRuby2,mTangerine,mApple,mStrawberry,FusionRed,mCherry,mNectarine,mRuby3,mScarlet,mScarlet-I),Cyan Proteins(ECFP,Cerulean,mCerulean3,SCFP3A,CyPet,mTurquoise,mTurquoise2,TagCFP,mTFP1,monomeric Midoriishi-Cyan,Aquamarine),Yellow Proteins(TagYFP,EYFP,Topaz,Venus,SYFP2,Citrine,Ypet,lanRFP-ΔS83,mPapaya1,mCyRFP1),Orange Proteins(Monomeric Kusabira-Orange,mOrange,mOrange2,mKOκ,mKO2),Myc,His,GST,Strep,CBP,MBP,iDimerize,ProteoTuner,Shield1,SNAP-tag,CLIP-tag,ACP-tag,MCP-tag,HaloTag,Avi-tag,TAP-tag,LumioTMtag等等中的一种或多种。具体标签蛋白的选用,可遵循下列原则:荧光共振能量转移技术、融合报告基因定位可根据需要选择Green Proteins、Red Proteins、Cyan Proteins、Yellow Proteins、OrangeProteins、SNAP-tag、CLIP-tag、ACP-tag、MCP-tag、LumioTMtag等;特异性调控蛋白快速降解可根据需要选择ProteoTuner;实现诱导性蛋白重定位或蛋白互作可根据需要选择iDimerize;western blot、免疫荧光检测(IF)、免疫共沉淀(Co-IP)、Chip-seq、质谱MS、Elisa、串联亲和纯化技术、RNA蛋白质印迹法可根据需要选择Flag,HA、Myc,His,GST,Strep,CBP,MBP,HaloTag,Avi-tag,TAP-tag等等中的一种或多种。当在一个标记部位选用多种标签蛋白时,各标签蛋白之间可以直接相连,也可以以连接肽相连,为了便于多次操作,标签蛋白之间还可以连入能被特定酶酶切的蛋白或多肽序列等。本发明具体实施例中分别选用了3×Flag-TEV-Avi、3×Flag-TEV-Avi及HA-TEV-Avi作为bromodomain蛋白的标记蛋白。

  有研究发现,敲除孤雄单倍体胚胎干细胞的H19 DMR及IG-DMR可解决半克隆小鼠出生效率低和半克隆小鼠发育缺陷问题。本发明的孤雄单倍体胚胎干细胞优选H19 DMR及IG-DMR被敲除的孤雄单倍体胚胎干细胞。

  H19 DMR是指:H19-Igf2印记簇内的一段甲基化差异区域(DMR:differentiallymethylated region)。H19 DMR的具体位置与序列可根据现有的甲基化测序或同源序列分析预测等方法明确。已知人H19 DMR定位于染色体1 1p1 5.5区,鼠H19 DMR则位于7号染色体远端,位于H19和Igf2两个基因之间,H19基因的上游的2kb到4kb位置。H19 DMR在父本等位基因上呈甲基化状态,导致CTCF蛋白无法结合到这段甲基化区域上,使H19下游的增强子不需要逾越CTCF这一障碍,进而达到增强上游的Igf2的表达并且降低H19的表达。而在母本等位基因上呈去甲基化状态,CTCF蛋白能够结合到这段未甲基化的区域,因此H19下游的增强子只能增强H19的表达,但是对上游的Igf2无法调控。如果将父本H19 DMR敲除的话,那么H19下游的增强子就能上调Igf2的表达。由于孤雄单倍体是父本来源,理论上应当处于完全甲基化的状态,但是研究发现,体外培养的孤雄单倍体H19 DMR的甲基化出现异常擦除,成为去甲基化状态,导致H19的表达异常上调而Igf2的表达被下调,敲除H19 DMR可纠正了这种H19表达上调Igf2表达下调的异常状态。

  IG-DMR是指:Dlk-Dio3印记簇内的一段甲基化差异区域(DMR:differentiallymethylated region)。IG DMR的具体位置与序列可根据现有的甲基化测序或同源序列分析预测等方法明确。已知小鼠的IG-DMR位于12号染色体上,处在印记簇中Dlk1和Gtl2 2个基因之间4.15kb的一段重复序列,人的则位于14号染色体上(14q32.2)。IG-DMR在父本等位基因中,这段区域发生DNA甲基化,这一印记簇的基因Gtl2以及一些mircroRNA不表达,但是基因Rtl1、Dlk1和Dio3则表达。在母本等位基因中,这段区域不发生DNA甲基化(去甲基化状态),因此Gtl2以及一些mircroRNA进行表达,但是基因Rtl1、Dlk1和Dio3则不表达。在孤雄单倍体(父本来源)和出生异常的SC动物中,研究发现本应该是甲基化状态的IG-DMR,其甲基化出现异常擦除,从而导致基因Rtl1、Dlk1和Dio3的沉默,Gtl2以及一些mircroRNA的异常激活。

  在利用带标签的半克隆小鼠文库或带标签的孤雄单倍体胚胎干细胞文库进行蛋白质分析时,在较佳的实施方式中,与各感兴趣目标蛋白融合表达的标签蛋白均相同。在该情况下,可以采用一个标签蛋白或多个标签蛋白对感兴趣目标蛋白进行标记,例如仅在感兴趣目标蛋白的N端或C端融合表达标签蛋白,或者对感兴趣目标蛋白的N端或C端采用不同的标签蛋白融合表达。当采用多个标签蛋白对感兴趣目标蛋白进行标记时,只需保证各感兴趣目标蛋白均与同样的几个标签蛋白融合表达,即能保证各感兴趣目标蛋白具备相同的标签蛋白。各感兴趣目标蛋白融合表达的标签蛋白均相同可更简化平行分析操作,更便于平行分析。

  当然,带标签的半克隆小鼠文库或带标签的孤雄单倍体胚胎干细胞文库中,与各感兴趣目标蛋白融合表达的标签蛋白也可不同。但由于文库中的标签蛋白来自有限个标签蛋白构成的组合,因此,只要采用该有限个标签蛋白构成的组合中各标签蛋白的抗体,同样可以在无需制备感兴趣目标蛋白抗体的基础上,对各感兴趣目标蛋白进行平行分析。

  利用本发明提供的文库中的小鼠或者孤雄胚胎干细胞,不仅可以对感兴趣目标蛋白进行分析,还可以进行药物研究。将本发明的文库中的小鼠或者孤雄胚胎干细胞用于药物研究的一种实施方式是药物作用前后,通过对感兴趣目标蛋白的研究,了解药物的作用机理。在另一种实施方式中,也可以通过药物作用前后,小鼠体内各感兴趣目标蛋白的表现变化,来高通量筛选出具有特定作用的药物。在另一种实施方式中,可采用构建带标签的毒理学模式动物,通过药物作用前后,检测相应毒理蛋白的表现变化,对药物代谢进行在体研究。

  利用本发明提供的文库中的小鼠或者孤雄胚胎干细胞,还可以对感兴趣目标蛋白进行敲低表达的功能研究。Trim21是E3泛素化连接酶,其可通过结合抗体的Fc区域,被抗体带至其特定识别表位即抗原,引发下游蛋白降解通路,从而实现特异性降解抗体所识别的抗原蛋白。将本发明文库中的孤雄胚胎干细胞导入Trim21和针对标签蛋白特异性抗体,即瞬转或基因组整合Trim21和标签蛋白特异性抗体DNA序列,即可实现与标签蛋白融合表达的目标蛋白的特异性快速高效降解。同时,如果条件性表达Trim21及标签蛋白抗体,如诱导型启动子Tet-On/Off系统驱动表达,则可实现Doxycycline/Tetracycline介导的诱导型特异、高效、快速降解目标蛋白。也可将本发明文库中的小鼠获得F0代杂合标签敲入小鼠后,进一步通过交配的方法获得纯合标签敲入的F2子代小鼠。纯合F2子代小鼠通过与组织特异性启动子或诱导型启动子Tet-On/Off系统驱动表达Trim21及标签蛋白抗体的工具小鼠交配,即可实现目标蛋白的可诱导降解调控,从而检测小鼠表型及生理指标的变化。

  以下通过特定的具体实例说明本发明的实施方式,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围;在本发明说明书和权利要求书中,除非文中另外明确指出,单数形式“一个”、“一”和“这个”包括复数形式。

  除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。

  除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明。

  实验材料与方法:

  1.孤雄单倍体胚胎干细胞系的建立

  按照已报道的方法构建(Yang,H.,Shi,L.,Wang,B.A.,Liang,D.,Zhong,C.,Liu,W.,Nie,Y.,Liu,J.,Zhao,J.,Gao,X.,et al.(2012).Generation of geneticallymodified mice by oocyte injection of androgenetic haploid embryonic stemcells.Cell 149,605-617,)。

  方法:

  去掉MII卵子的细胞核注入相应的精子头。小鼠MII卵在人绒毛膜促性腺激素(HCG)处理的14小时后进行收集,然后利用Piezo针在含有5ug/ml细胞松弛素B(CB)的HEPES-CZB培养液中去核。去核后,单个的精子头注入到卵胞质中。重构的胚胎在CZB培养液中培养1小时,然后转入到含1mM Sr2+的激活液进行激活。激活之后,所有的重构胚胎转到含有氨基酸的KSOM培养液于37℃,5%CO2条件下进行培养。3.5天后到达桑葚或囊胚阶段的重构胚胎种植到ESC培养基中。

  重构胚胎透明带由Acid Tyrode溶液进行消化去除。每个转移到铺有小鼠成纤维细胞滋养层的96孔板孔中,并且用含有20%血清替代物(KSR)、1,500U/ml LIF、3MCHIR99021和1M PD0325901的ESC培养基进行培养。培养4-5天后,细胞克隆由胰酶消化并传到铺有新鲜滋养层的96孔板中。细胞进一步扩大培养,传代到48孔板并进一步至6孔板中,日常的细胞维持仅在6孔板中即可。为了分选出单倍体细胞,胚胎干细胞胰酶消化后,用PBS(GIBCO)洗一遍,然后在含有15μg/ml Hoechst 33342的ESC培养基。水浴30min。随后,通过流式分选仪BD FACS AriaII分选收集出单倍体1N峰形的细胞进行后续的培养获得孤雄单倍体胚胎干细胞系。

  H19 DMR及IG-DMR敲除的孤雄单倍体胚胎干细胞DKO-AG-haESCs参考现有技术构建,具体可参见专利申请WO2017000302中记载。

  2.带标签的孤雄胚胎干细胞的构建

  CRISPR-Cas9质粒构建:将合成好的sgRNA的正向寡核苷酸链和反向寡核苷酸链进行退火获得双链寡核苷酸链(本发明中sgRNA序列均指sgRNA的正向寡核苷酸链序列)然后与BbsI(New England Biolabs)酶切好的pX330-mCherry(Addgene#98750)进行连接。

  KI donor载体的构建:将合成的左、右同源臂扩增引物从包含感兴趣目标蛋白基因的基因组中扩增左、右同源臂。如感兴趣目标蛋白为小鼠内源蛋白,则可以小鼠基因组为模板扩增同源臂。标签蛋白基因如果是非常小的片段,例如20-70bp,可以通过单链DNA的合成和退火进行制备。如果标签蛋白基因的长度比较长不能直接进行合成,可以构建在T载体上或进行基因合成,再进行tag高保真PCR扩增来制备。将左右同源臂片段、标签蛋白基因片段与线性化T载体利用无缝克隆试剂盒(Seamless cloning kit)连接获得KI donor载体。

  构建好的相应质粒及KI donor载体按照说明书用Lipofectamine 2000(LifeTechnologies)转染到孤雄单倍体胚胎干细胞中。转染12小时之后,通过流式(FACSAriaII,BD Biosciences)将单倍体细胞分选出来后,以较低的密度铺下。生长4-5天后,挑取单克隆进行后续的建系。最后通过PCR测序的方法鉴定获得带标签的孤雄胚胎干细胞系。

  CRISPR-Cas9技术介导的基因编辑技术属于成熟技术,可以利用CRISPR design网站(http://crispr.mit.edu:8079/),在线设计所需的sgRNA Oligos,选择预插入标签蛋白位点附近25-40bp的基因组序列进行sgRNA设计。在预插入标签蛋白位点上下游各选择合适长度(1kb-1.5kb)的同源臂,用在线引物设计网站primer3(http://primer3.ut.ee/)设计左、右同源臂的扩增引物以扩增左右同源臂以构建KI donor载体。通过CRISPR-Cas9介导的基因操作,对孤雄单倍体胚胎干细胞进行基因编辑获得能表达带标签的感兴趣目标蛋白的孤雄单倍体胚胎干细胞。

  若感兴趣目标蛋白并非源自小鼠,亦可利用CRISPR-Cas9技术介导的基因编辑技术先构建表达含感兴趣目标蛋白的孤雄单倍体胚胎干细胞,再进一步编辑入标签蛋白。

  3.带标签的半克隆小鼠构建

  胞浆内带标签的孤雄单倍体胚胎干细胞注射(intracytoplasmic AG-haESCsinjection,ICAHCI):

  为获得半克隆(SC)胚胎,将带标签的AG-haESCs用含有0.05μg/ml秋水仙素的培养基处理8h以将细胞同步到M期,然后进行卵胞浆注射。消化好的AG-haESCs用HEPES-CZB培养液洗3遍,然后用3%(w/v)聚乙烯吡咯烷酮(polyvinylpyrrolidone,PVP)的HEPES-CZB培养液重悬。用Piezo显微操作仪将每个M期的AG-haESCs的细胞核注入MII卵子中。重构好的胚胎先在CZB培养液中培养1h,然后用不含CB的激活液激活5-6h。激活之后,所有的重构胚胎在KSOM培养液于37℃,5%CO2条件下进行培养。ICAHCI胚胎在KSOM培养液中培养24h就能到达2细胞期胚胎。

  由ICAHCI获得的每30-40个2细胞胚胎移入到0.5dpc(交配后0.5天)假孕ICR小鼠的每个子宫中。母鼠在怀孕19.5天后进行剖腹产或自然生产。清除掉出生小鼠身上的液体后,小鼠放在有氧气的温箱中,而存活的小鼠则后续由代孕母鼠进行养育。

  4.Western blot免疫印迹分析

  待测细胞用含有蛋白抑制剂的RIPA细胞裂解液裂解(Cell SignalingTechnology),用BCA蛋白浓度测定试剂盒(碧云天)来测定蛋白浓度;将蛋白质样品用SDS/PAGE分离后,湿法转移到硝酸纤维膜上;用5%脱脂奶粉/TBST室温封闭膜1小时;一抗4度杂交过夜;TBST洗三次;二抗室温杂交1.5小时;TBST洗三次;最后用显色液进行(天能)显色,用全自动化学发光图像分析系统(天能)进行拍照。

  5.免疫荧光分析

  细胞以PBS洗一次后用4%PFA室温固定15分钟,或直接用-20度预冷的甲醇固定5分钟;PBS洗三次;然后用0.2%Triton X-100通透30分钟;接着在封闭液(含1%BSA的PBS)中封闭1小时;接着将细胞与稀释于封闭液的一抗4度孵育过夜;PBS洗三次;接着将细胞与稀释于封闭液的二抗室温避光孵育1小时;PBS洗三次;接着将细胞与稀释于PBS的DAPI室温避光孵育5-10分钟;PBS洗一次;最后用荧光封片剂封片,4度避光保存。

  6.Co-IP分析

  待测细胞用含有蛋白抑制剂的TNE细胞裂解液裂解(50mM Tris-HCl(pH7.5),150mM NaCl,1%NP-40),用BCA蛋白浓度测定试剂盒(碧云天)来测定蛋白浓度;将定量后的细胞裂解液用适量的磁珠进行pre-clean 4度1小时;去除磁珠后加入与标签抗体偶联的磁珠进行4℃旋转反应过夜;用含有蛋白抑制剂的TNE细胞裂解液洗磁珠三次,4度10分钟;加入适量体积的1×SDS-PAGE蛋白上样缓冲液,100℃空气浴煮10分钟。IP后的蛋白质样品用SDS/PAGE分离后,湿法转移到硝酸纤维膜上;用5%脱脂奶粉/TBST室温封闭膜1小时;一抗4度杂交过夜;TBST洗三次;二抗室温杂交1.5小时;TBST洗三次;最后用显色液进行(天能)显色,用全自动化学发光图像分析系统(天能)进行拍照。

  7.Chip-seq建库及数据分析

  细胞经过甲醛固定,超声破碎以及加不同抗体提纯等步骤,最后纯化片段大小在200~500bp之间的DNA被用来建库。每个抗体对应107细胞。每组建库合格的样本库经illumina NovaSeq上机产生读长为150bp的reads,每组reads数至少大于20兆。测得的数据经比对到小鼠的基因组mm10上,唯一比对的reads会被保留下来,比对到多个位置的reads随机选取比对结果最好的一个位置保留下来。蛋白作用富集区域(Peak)用默认参数得到。

  8.实时定量PCR检测TAP-tag标记的基因组拷贝数

  待测样本的基因组DNA按照基因组DNA提取试剂盒(天根)流程抽提。实时定量PCR用SYBR Green Realtime PCR Master Mix(TOYOBO)完成,20μl反应体系,其中基因组DNA模板稀释10倍添加1μl,在Bio-Rad CFX96实时定量PCR仪上扩增40个循环数。拷贝数的计算用TAP-tag的值比去打靶的内源的基因组DNA值来进行计算。数据用CFX96实时定量PCR仪自带软件进行分析。

  实施例1

  包含bromodomain的40个小鼠基因的Tandem affinity purification(TAP)-tag标记

  对40个包含bromodomain的小鼠基因(表一)分别进行Tandem affinitypurification(TAP)-tag标记,利用TAP-tag来钓出与标记蛋白结合的蛋白复合物或DNA序列,从而后续进行质谱MS和Chip-seq实验。通过对40个包含相似bromodomain的小鼠基因分别进行MS和Chip-seq检测,分析其结合蛋白网络和DNA结合区域的特异性,进一步对bromodomain蛋白的功能和分工进行深入研究。

  表一、40个包含bromodomain的小鼠基因列表

  

  A.TAP-tag序列和标记位置的选择

  以Brd4蛋白为例,Brd4共有3个isoform,isoform 1、2、3分别表达1401、724和1402个氨基酸(图1A),选择全长蛋白isoform 3来进行标记,分别在其对应的基因组中标记N端和C端,来检测TAP-tag对Brd4蛋白的标记情况(图1B)。由于Brd4isoform 1和3的C端相同,所以C端TAP-tag标记会同时标记isoform 1和3;而isoform 1、2、3的N端都相同,所以N端TAP-tag标记会同时标记上3种isoform。对于TAP-tag选择3×Flag-TEV-Avi,或HA-TEV-Avi这两种形式(图1C),其中N端进行3×Flag-TEV-Avi标记(简称N-ATF);C端进行3×Flag-TEV-Avi标记(简称C-FTA),或HA-TEV-Avi标记(简称C-HTA)。具体标记序列(见图2、3和4)分别为:

  Brd4-N-ATF标记氨基酸序列(SEQ ID NO:1):

  GLNDIFEAQKIEWHEENLYFQGDYKDHDGDYKDHDIDYKDDDDK

  Brd4-C-FTA标记氨基酸序列(SEQ ID NO:2):

  DYKDHDGDYKDHDIDYKDDDDKENLYFQGGLNDIFEAQKIEWHE

  Brd4-C-HTA标记氨基酸序列(SEQ ID NO:3):

  YPYDVPDYAENLYFQGGLNDIFEAQKIEWHE

  B.TAP-tag的Brd4基因组标记

  按照前述2记载的实验方法,在DKO-AG-haESCs孤雄单倍体干细胞系上分别对Brd4基因组DNA进行Brd4-N-ATF,Brd4-C-FTA和Brd4-C-HTA打靶。同源臂扩增用模板为小鼠基因组DNA。将测序验证正确的细胞系,通过ICAHCI注射来获得半克隆囊胚,并进行相应的杂合二倍体ES细胞建系(表二和表三)。

  Brd4-N-ATF sgRNA序列(SEQ ID NO:4):TGGGATCACTAGCATGTCTA

  Brd4-C-FTA sgRNA序列(SEQ ID NO:5):AATCTTTTTTGAGAGCACCC

  Brd4-C-HTA sgRNA序列(SEQ ID NO:6):AATCTTTTTTGAGAGCACCC

  Brd4-N-ATF标记碱基序列(SEQ ID NO:7):

  GGTCTGAACGACATCTTCGAGGCTCAGAAAATCGAATGGCACGAAgagaacctgtacttccagggcGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAG

  Brd4-C-FTA标记碱基序列(SEQ ID NO:8):

  GACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAGgagaacctgtacttccagggcGGTCTGAACGACATCTTCGAGGCTCAGAAAATCGAATGGCACGAA

  Brd4-C-HTA标记碱基序列(SEQ ID NO:9):

  TATCCGTATGATGTGCCGGATTATGCGgagaacctgtacttccagggcGGTCTGAACGACATCTTCGAGGCTCAGAAAATCGAATGGCACGAA

  Brd4-N-ATF左、右同源臂扩增引物序列:

  Brd4-gN-F4(SEQ ID NO:10):ggctgccatgtagttccagt

  Brd4-gN-R4(SEQ ID NO:11):ggcctgcgttgtagacattt

  Brd4-gN-F6(SEQ ID NO:12):ccaagcccagatagatggctagt

  Brd4-gN-R2(SEQ ID NO:13):aaccattcactggggttcagatt

  Brd4-C-FTA左、右同源臂扩增引物序列:

  Brd4-gC-F(SEQ ID NO:14):gaggagaagattcactcaccaatca

  Brd4-gC-R(SEQ ID NO:15):caagccagaatacctagttgcttca

  Brd4-C-HTA左、右同源臂扩增引物序列:

  Brd4-gC-F(SEQ ID NO:16):gaggagaagattcactcaccaatca

  Brd4-gC-R(SEQ ID NO:17):caagccagaatacctagttgcttca

  表二、对孤雄单倍体细胞系进行Brd4-N-ATF,Brd4-C-FTA和Brd4-C-HTA打靶建系统计

  

  表三、Brd4-N-ATF,Brd4-C-FTA和Brd4-C-HTA二倍体ES细胞建系统计

  

  利用realtime PCR对TAP-tag标记的基因组拷贝数进行检测,针对不同TAP-tag序列分别设计两对引物,用Brd4N端和C端内源基因组DNA序列作为内参来进行比较。每株孤雄单倍体胚胎干细胞分别对应2-4株ICAHCI后建立的杂合ES细胞系(带“#”号),NC表示未打靶的孤雄单倍体胚胎干细胞。结果显示:孤雄单倍体胚胎干细胞TAP-tag拷贝数约为1,杂合ES细胞系TAP-tag拷贝数约为0.5。表明TAP-tag为定点整合,没有转基因的随机插入(表四)。

  Brd4-N-ATF realtime PCR扩增引物序列:

  FTA-F1(SEQ ID NO:18):CAAGGATGACGATGACAAGg

  FTA-R1(SEQ ID NO:19):CTGAGCCTCGAAGATGTCGT

  FTA-F2(SEQ ID NO:20):CAAGGATGACGATGACAAGg

  FTA-R2(SEQ ID NO:21):TTCGTGCCATTCGATTTTCT

  ATF-F1(SEQ ID NO:22):CTTCGAGGCTCAGAAAATCG

  ATF-R1(SEQ ID NO:23):GTCTTTGTAGTCgccctgga

  ATF-F2(SEQ ID NO:24):AAATCGAATGGCACGAAgag

  ATF-R2(SEQ ID NO:25):GTCTTTGTAGTCgccctgga

  HTA-F2(SEQ ID NO:26):GCGgagaacctgtacttcca

  HTA-R2(SEQ ID NO:27):TTCGTGCCATTCGATTTTCT

  HTA-F3(SEQ ID NO:28):TATGATGTGCCGGATTATGC

  HTA-R3(SEQ ID NO:29):CTGAGCCTCGAAGATGTCGT

  Brd4-gN-CN-F(SEQ ID NO:30):gtccacagtggcctttcaat

  Brd4-gN-CN-R(SEQ ID NO:31):agctgtcttcagaccctcca

  Brd4-gC-CN-F1(SEQ ID NO:32):ttgccttgaacagaccctct

  Brd4-gC-CN-R1(SEQ ID NO:33):acacaggtgggaaggaactg

  Brd4-gC-CN-F2(SEQ ID NO:34):acagaagcaggagccaaaaa

  Brd4-gC-CN-R2(SEQ ID NO:35):aaaggtcaagaggcaggtga

  表四、TAP-tag拷贝数的检测

  

  C.TAP-tag标记Brd4的蛋白表达水平检测

  各选1-2株Brd4-N-ATF,Brd4-C-FTA和Brd4-C-HTA标记的孤雄单倍体胚胎干细胞(单数字,如4等),分别对应2-4株ICAHCI后建立的ES细胞系(“数字-数字”表示,如4-5等)收样进行蛋白电泳检测,NC表示未打靶的孤雄单倍体胚胎干细胞。用Flag或HA抗体检测,C端TAP-tag确实只能特异性地检测到Brd4大蛋白(约250kDa),N端确实能特异性地检测到Brd4大蛋白和小蛋白(约120kDa),但蛋白大小均比预期大小大些。杂合ES细胞系的TAP-tag标记的Brd4表达量确实比孤雄单倍体胚胎干细胞少,但均有表达。从杂合ES细胞表达量来看,C端TAP-tag好些。用Brd4抗体检测有一条很强的杂带(约150kDa),仅能在250kDa附近检测到微弱的蛋白信号,曝光较强时可以看到条带大小随着是有否有TAP-tag标记而变化,表明该条带确实为Brd4的蛋白。从WB(westen blot)结果来看,Flag标记和HA标记均成功,Brd4蛋白的N端和C端TAP-tag标记也都成功,TAP-tag的抗体在特异性和敏感性上确实显著优于Brd4自身抗体。

  D.TAP-tag标记的Brd4在细胞中的定位检测

  分别选取一株Brd4-N-ATF,Brd4-C-FTA和Brd4-C-HTA标记的孤雄单倍体胚胎干细胞和一株对应的ICAHCI后建立的ES细胞系进行免疫荧光检测(IF)。HA抗体和Brd4抗体均特异性的定位在细胞核内,IF检测灵敏度HA>Brd4(图6A)。Flag抗体可以检测到在细胞核内有定位,但细胞膜上也有定位(图6B)。表明C-HTA入核正常,但C-FTA或N-ATF有部分蛋白没有入核。从IF结果来看,HA的TAP-tag优于Flag TAP-tag。

  E.TAP-tag标记Brd4的Co-IP结合蛋白检测

  分别选取一株Brd4-N-ATF,Brd4-C-FTA和Brd4-C-HTA标记的孤雄单倍体胚胎干细胞来进行TAP-tag标记Brd4的Co-IP结合蛋白检测。结果显示:NC和Brd4-N-ATF孤雄单倍体胚胎干细胞系用Brd4抗体偶联的beads确实能IP到内源的Brd4蛋白。用Brd4抗体检测,均能检测到250kDa大蛋白和110/120kDa小蛋白。LB3裂解液条件还能检测到150kDa的杂蛋白。由于Brd4-N-ATF大小蛋白N端带上TAP-tag,所以大小蛋白分子量均大于NC。用Flag抗体检测,NC细胞为完全的阴性control,Brd4-N-ATF细胞能检测到250kDa大蛋白和120kDa小蛋白。NC和Brd4-N-ATF细胞Co-IP都能检测到与已知结合蛋白CDK9的结合,但和做IP前的总的细胞裂解液的input相比,结合效率比较低,在LB1裂解液条件下的结合更多些。NC和Brd4-N-ATF细胞通过Co-IP可以检测到与H3蛋白的结合(图7A)。Brd4-C-FTA和Brd4-N-ATF孤雄单倍体胚胎干细胞系用Flag抗体偶联的beads确实能IP到内源的Brd4蛋白,用Flag和Brd4抗体分别检测Brd4-C-FTA只有250kDa大蛋白,Brd4-N-ATF有250kDa大蛋白和120kDa小蛋白。而Brd4抗体的input由于杂蛋白的表达量太高,所以只检测到杂蛋白。Brd4-C-HTA孤雄单倍体胚胎干细胞系用HA抗体偶联的beads确实能IP到内源的Brd4蛋白,用HA和Brd4抗体分别检测都只有250kDa大蛋白。从与input的比例来看,HA-beads相比Flag-beads拉下Brd4的效率更高,表明HTA tag更好。Brd4-C-FTA和Brd4-C-HTA Co-IP都能检测到与H3的结合,在LB1裂解液条件下的结合更多些。Brd4-C-HTA的结合量相比Brd4-C-FTA更多,表明HTA tag更好。Brd4-N-ATF Co-IP与H3的结合相对较弱,可能与小蛋白的作用有关(图7B)。实验证明:Brd4-N-ATF,Brd4-C-FTA和Brd4-C-HTA标记正确,TAP-tag标记的Brd4功能正常,确实能与已报道的蛋白相结合,HTA tag相较FTA tag更优,LB1裂解液做co-IP条件更合适。

  F.TAP-tag标记其它bromodomain基因的蛋白表达水平检测

  参考前述实验结果,对bromodomain基因中的Atad2b,Baz2b,Brd3,Cecr2、Baz1b,Pbrm1在DKO-AG-haESCs孤雄单倍体干细胞系上进行C-HTA标记,sgRNA及同源臂及其引物的设计均采用常规,检测TAP-tag标记bromodomain基因的蛋白表达水平。结果显示:细胞系Atad2b-C-HTA-9,Baz2b-C-HTA-4/7/10/26,Brd3-C-HTA-2/4/14,Cecr2-C-HTA-9/22/26/28都标记正确,用HA抗体都能检测到表达,蛋白大小都比预期大~30kDa。表达强弱情况:Brd3(曝光5s)>Cecr2(30s)>Atad2b/Baz2b(180s)(图8A)。细胞系Baz1b-C-HTA-22/24,Pbrm1-C-HTA-15/22/30都标记正确,用HA抗体都能检测到表达。表达强弱情况:Baz1b(HA抗体,曝光10s)>Pbrm1(HA,20s)>Pbrm1(Pbrm1,20s)>Baz1b(Baz1b,120s),HA抗体的敏感度和特异性都优于自身抗体(图8B)。并且利用该方法只用HA抗体就能横向比较这些TAP-tag标记蛋白的表达量差异,从而实现全基因组蛋白在不同组织中的蛋白表达谱式图谱。

  试验所用相关序列:

  Atad2b-C-HTA sgRNA序列(SEQ ID NO:36):ACTCAGCATGAGAAGTTCAT

  Baz2b-C-HTA sgRNA序列(SEQ ID NO:37):ACAACTTCAGCTCACTTTGA

  Brd3-C-HTA sgRNA序列(SEQ ID NO:38):ACTCAGAGTGAACTCGGACT

  Cecr2-C-HTA sgRNA序列(SEQ ID NO:39):TGTACTTTCAGAGCTAGTCC

  Baz1b-C-HTA sgRNA序列(SEQ ID NO:40):CGGAGACAGAAGAAGTAAAG

  Pbrm1-C-HTA sgRNA序列(SEQ ID NO:41):GATGTGATTAAACATTTTCT

  Atad2b-C-HTA左、右同源臂扩增引物序列:

  Atad2b-gC-F(SEQ ID NO:42):AGGAGCCGCCAGAAATGAAA

  Atad2b-gC-R(SEQ ID NO:43):TTTGCCTCTTTGCAACTGCC

  Baz2b-C-HTA左、右同源臂扩增引物序列:

  Baz2b-gC-F(SEQ ID NO:44):CGGGCGTGACTCGTCTATTA

  Baz2b-gC-R(SEQ ID NO:45):TCTATGTGCCTCCAACAGGC

  Brd3-C-HTA左、右同源臂扩增引物序列:

  Brd3-gC-F(SEQ ID NO:46):CAGATGACAGGTCGTAGCCC

  Brd3-gC-R(SEQ ID NO:47):GAACAGGGACCCGTGTCAAA

  Cecr2-C-HTA左、右同源臂扩增引物序列:

  Cecr2-gC-F(SEQ ID NO:48):AACAGTTGCCACCGCATAAG

  Cecr2-gC-R(SEQ ID NO:49):GAGGGAAAACTCCATTGACCCC

  Baz1b-C-HTA左、右同源臂扩增引物序列:

  Baz1b-gC-F(SEQ ID NO:50):TTGATCGCGGCATCACTTCA

  Baz1b-gC-R(SEQ ID NO:51):GATGCTGACACTCCGCTAGA

  Pbrm1-C-HTA左、右同源臂扩增引物序列:

  Pbrm1-gC-F(SEQ ID NO:52):AGTCTGCCAAGCTGTTCACT

  Pbrm1-gC-R(SEQ ID NO:53):ACCACCCAAGCAGGTTCAAA

  实施例2:构建Phf7的N端KI Flag的标签小鼠

  由于市面上没有好用的Phf7抗体,为了研究该基因的功能,在孤雄单倍体胚胎干细胞的Phf7内源基因组的N端插入3×Flag序列(图9A),并通过ICAHCI注射获得Phf7-KI-Flag杂合小鼠F0,通过对F1杂合小鼠之间进行交配获得Phf7-KI-Flag纯合雄鼠(图9B)。

  Phf7-N-Flag sgRNA序列(SEQ ID NO:54):TTCTAGATAGGAAGGACAGA

  Phf7-N-Flag左、右同源臂扩增引物序列:

  Phf7-gN-F(SEQ ID NO:55):aaagtagatccccgtggggacac

  Phf7-gN-R(SEQ ID NO:56):gtttgtacggctgacaaggagc

  从Phf7-KI-Flag纯合雄鼠分离出的不同生殖细胞中检测到Phf7-Flag的表达(图9C)。并用Co-IP检测Phf7-KI-Flag纯合雄鼠生殖细胞中Phf7-Flag的表达(图9D)。利用Flag抗体对Phf7进行chip-seq检测,并与H3K4me3chip-seq和ubH2A Chip-seq的结果在exon/intron/intergenic区域富集情况进行比较(图9E)。韦恩图展示Phf7chip-seq和H3K4me3chip-seq结合区域的peaks具有高度重合(图9F)。Heatmap展示H3K4me3&Phf7common,H3K4me3unique,Phf7unique的结果中ubH2A的信号分布情况(图9G),并具体统计ubH2A的信号结果值(图9H)。实验表明:Phf7-KI-Flag标签小鼠的构建摆脱了Phf7抗体的限制,利用Flag抗体就可以完成标签小鼠体内内源Phf7蛋白的功能研究。

  实施例3:构建Hspg2的C端KI Flag的小鼠

  由于市面上没有好用的Hspg2抗体,为了研究该基因的功能,考虑到Hspg2蛋白的N端有信号肽,在孤雄单倍体胚胎干细胞的Hspg2内源基因组的C端插入3×flag序列,并通过ICAHCI注射获得Hspg2-KI-Flag杂合小鼠。

  Hspg2-C-Flag sgRNA序列(SEQ ID NO:57):TCATAGGCACCCACCTGCCT

  Hspg2-C-Flag左、右同源臂扩增引物序列:

  Hspg2-gC-F(SEQ ID NO:58):GTCCTAATGTGGCGGTCAAC

  Hspg2-gC-R(SEQ ID NO:59):ACCTCTTCCAGTCCCCTTGTC

  取胚胎期E15.5天的Hspg2-KI-Flag杂合小鼠胚胎,进行全胚胎样品蛋白电泳,检测Hspg2-Flag的表达。结果显示:Hspg2蛋白的C端标记成功(图10)。

  上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

  序列表

  <110> 中国科学院上海生命科学研究院

  <120> 一种高通量蛋白质分析方法及其适用文库

  <160> 59

  <170> SIPOSequenceListing 1.0

  <210> 1

  <211> 44

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <400> 1

  Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu Glu

  1 5 1015

  Asn Leu Tyr Phe Gln Gly Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys

  202530

  Asp His Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys

  3540

  <210> 2

  <211> 44

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <400> 2

  Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr

  1 5 1015

  Lys Asp Asp Asp Asp Lys Glu Asn Leu Tyr Phe Gln Gly Gly Leu Asn

  202530

  Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu

  3540

  <210> 3

  <211> 31

  <212> PRT

  <213> 人工序列(Artificial Sequence)

  <400> 3

  Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Asn Leu Tyr Phe Gln Gly

  1 5 1015

  Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu

  202530

  <210> 5

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 5

  tgggatcact agcatgtcta 20

  <210> 5

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 5

  aatctttttt gagagcaccc 20

  <210> 6

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 6

  aatctttttt gagagcaccc 20

  <210> 7

  <211> 132

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 7

  ggtctgaacg acatcttcga ggctcagaaa atcgaatggc acgaagagaa cctgtacttc 60

  cagggcgact acaaagacca tgacggtgat tataaagatc atgacatcga ctacaaggat 120

  gacgatgaca ag 132

  <210> 8

  <211> 132

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 8

  gactacaaag accatgacgg tgattataaa gatcatgaca tcgactacaa ggatgacgat 60

  gacaaggaga acctgtactt ccagggcggt ctgaacgaca tcttcgaggc tcagaaaatc 120

  gaatggcacg aa 132

  <210> 9

  <211> 93

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 9

  tatccgtatg atgtgccgga ttatgcggag aacctgtact tccagggcgg tctgaacgac 60

  atcttcgagg ctcagaaaat cgaatggcac gaa 93

  <210> 10

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 10

  ggctgccatg tagttccagt 20

  <210> 11

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 11

  ggcctgcgtt gtagacattt 20

  <210> 12

  <211> 23

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 12

  ccaagcccag atagatggct agt 23

  <210> 13

  <211> 23

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 13

  aaccattcac tggggttcag att 23

  <210> 14

  <211> 25

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 14

  gaggagaaga ttcactcacc aatca 25

  <210> 15

  <211> 25

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 15

  caagccagaa tacctagttg cttca 25

  <210> 16

  <211> 25

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 16

  gaggagaaga ttcactcacc aatca 25

  <210> 17

  <211> 25

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 17

  caagccagaa tacctagttg cttca 25

  <210> 18

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 18

  caaggatgac gatgacaagg 20

  <210> 19

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 19

  ctgagcctcg aagatgtcgt 20

  <210> 20

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 20

  caaggatgac gatgacaagg 20

  <210> 21

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 21

  ttcgtgccat tcgattttct 20

  <210> 22

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 22

  cttcgaggct cagaaaatcg 20

  <210> 23

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 23

  gtctttgtag tcgccctgga 20

  <210> 24

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 24

  aaatcgaatg gcacgaagag 20

  <210> 25

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 25

  gtctttgtag tcgccctgga 20

  <210> 26

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 26

  gcggagaacc tgtacttcca 20

  <210> 27

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 27

  ttcgtgccat tcgattttct 20

  <210> 28

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 28

  tatgatgtgc cggattatgc 20

  <210> 29

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 29

  ctgagcctcg aagatgtcgt 20

  <210> 30

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 30

  gtccacagtg gcctttcaat 20

  <210> 31

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 31

  agctgtcttc agaccctcca 20

  <210> 32

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 32

  ttgccttgaa cagaccctct 20

  <210> 33

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 33

  acacaggtgg gaaggaactg 20

  <210> 34

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 34

  acagaagcag gagccaaaaa 20

  <210> 35

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 35

  aaaggtcaag aggcaggtga 20

  <210> 36

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 36

  actcagcatg agaagttcat 20

  <210> 37

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 37

  acaacttcag ctcactttga 20

  <210> 38

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 38

  actcagagtg aactcggact 20

  <210> 39

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 39

  tgtactttca gagctagtcc 20

  <210> 40

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 40

  cggagacaga agaagtaaag 20

  <210> 41

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 41

  gatgtgatta aacattttct 20

  <210> 42

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 42

  aggagccgcc agaaatgaaa 20

  <210> 43

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 43

  tttgcctctt tgcaactgcc 20

  <210> 44

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 44

  cgggcgtgac tcgtctatta 20

  <210> 45

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 45

  tctatgtgcc tccaacaggc 20

  <210> 46

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 46

  cagatgacag gtcgtagccc 20

  <210> 47

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 47

  gaacagggac ccgtgtcaaa 20

  <210> 48

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 48

  aacagttgcc accgcataag 20

  <210> 49

  <211> 22

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 49

  gagggaaaac tccattgacc cc 22

  <210> 50

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 50

  ttgatcgcgg catcacttca 20

  <210> 51

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 51

  gatgctgaca ctccgctaga 20

  <210> 52

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 52

  agtctgccaa gctgttcact 20

  <210> 53

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 53

  accacccaag caggttcaaa 20

  <210> 54

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 54

  ttctagatag gaaggacaga 20

  <210> 55

  <211> 23

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 55

  aaagtagatc cccgtgggga cac 23

  <210> 56

  <211> 22

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 56

  gtttgtacgg ctgacaagga gc 22

  <210> 57

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 57

  tcataggcac ccacctgcct 20

  <210> 58

  <211> 20

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 58

  gtcctaatgt ggcggtcaac 20

  <210> 59

  <211> 21

  <212> DNA

  <213> 人工序列(Artificial Sequence)

  <400> 59

  acctcttcca gtccccttgt c 21

《一种高通量蛋白质分析方法及其适用文库.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)