当前位置：首页 > 化学技术 > 组合技术> 一种检测细菌16S rDNA全长的建库测序方法独创技术0字

一种检测细菌16S rDNA全长的建库测序方法

2021-02-05 10:12:18

附图说明" src="/d/file/p/2020/11-23/eff3f981c578950bb142f271ef316c80.gif" />

一种检测细菌16S rDNA全长的建库测序方法

　　技术领域

　　本发明属于细菌分子生物学技术领域，具体涉及一种检测细菌16S rDNA全长的建库测序方法。

　　背景技术

　　16S rRNA基因是原核生物所特有的基因，并且在原核生物中具有极高的拷贝数。全长1542nt的DNA序列包含9个间隔的高变区，兼具特异性和保守性的16S rRNA基因序列作为微生物标记被广泛应用于研究中。之前再对16S人DNA进行研究时，通常使用的是Sanger测序结合克隆的方法，或者芯片杂交方法，但是传统方法存在着通量低的缺陷。很多研究者已经用16S rDNA来对环境中的微生物，粪便微生物，皮肤中的微生物进行分类研究。目前，第二代测序技术已经成为微生物研究的主流手段，但是由于读长的限制，一般基于16SrDNA全长9个可变区中的一个或者几个(V6区、V3-V4区等)，而且只能分析到属级别，无法分析到菌种。例如公开号为CN108070643A的中国发明专利公开了一种微生物16S rDNA单分子水平测序文库的构建方法，包括采集样本，提取DNA；扩增；纯化；定量；测序，生物信息学分析。但是仍采用是16S rDNAV3-V4区测序方法。该类方法作为市场上最为成熟的细菌检测方法，仍存在某些缺陷。例如不能够完全对细菌的菌种级别进行检测，不能够准确的确定环境微生物的生态结构，以及在用于样本特定细菌菌种的检测，比如：病原菌，益生菌的检测。对于深入研究领域而言是远远不够的。

　　因此需要开发一种建库方法，能够检测样本中细菌的16S全长序列，以便分析样本中的菌种组成，确定样本菌群生态结构。

　　发明内容

　　针对以上存在的技术问题，本发明提供一种检测细菌16S rDNA全长的建库测序方法，能够分析样本中的菌种组成，确定样本菌群生态结构。

　　本发明的技术方案为：一种检测细菌16S rDNA全长的建库测序方法，包括以下步骤：

　　(1)定量提取样本中菌群的总DNA，标记为样本A；

　　(2)以步骤(1)样本A的DNA为模板，通过两端带有特异分子标签UMI的引物组PCR扩增16S rDNA全长，并为每一个原始扩增的16S rDNA全长加上特异的分子标签UMI，得到扩增产物；

　　(3)将步骤(2)所得扩增产物用Tn5酶片段化并构建测序用拼接文库，并标记为A-P；

　　(4)将步骤(2)所得扩增产物的环化连接并构建测序用连接文库，并标记为A-L；

　　(5)将所述拼接文库A-P和连接文库A-L使用illumina测序仪测序，得到拼接文库A-P和连接文库A-L的测序结果；

　　(6)将步骤(5)的测序结果进行生物信息技术处理分析，通过识别UMI组合的方式，在拼接文库A-P和连接文库A-L中提取数据，并组装出16S rDNA全长序列，进而比对数据库确定菌种种类。

　　进一步地，步骤(2)进一步包括：

　　(2.1)采用带有UMI标签的第一组引物序列对所述样本A的DNA进行第一轮PCR扩增，并进行第一次纯化步骤；

　　(2.2)采用第二组引物序列对第一次纯化产物进行第二轮PCR扩增，并进行第二次纯化步骤。

　　更进一步地，所述第一组引物序列如SED IQ NO：1-2所示。

　　更进一步地，所述第二组引物序列如SED IQ NO：3-4所示。

　　更进一步地，所述第二组引物序列的5‘端进行了磷酸化。

　　进一步地，步骤(3)进一步包括：

　　(3.1)将步骤(2)所得扩增产物用Tn5酶片段化；

　　(3.2)片段化后第一轮PCR扩增并纯化，扩增引物序列如SED IQ NO：5-7所示；

　　(3.3)对第一轮PCR扩增产物进行第二轮PCR扩增并纯化，拼接文库完成，标记为A-P，扩增引物序列如SED IQ NO：8-9所示。

　　进一步地，步骤(4)进一步包括：

　　(4.1)采用T4 DNA连接酶完成步骤(3)最终扩增产物的环化连接，得到连接产物；

　　(4.2)对所述连接产物进行第一轮PCR扩增并纯化，扩增引物如SED IQ NO：10-11所示；

　　(4.2)对第一轮PCR扩增产物进行第二轮PCR扩增，扩增引物如SED IQ NO：12-13所示。

　　进一步地，步骤(5)中使用illumina测序仪对所述A-P和A-L分别进行双端测序，测序长度为150bp。

　　进一步地，步骤(6)进一步包括：

　　(6.1)连接文库A-L分析：使用cutadaptor在连接文库测序结果中识别成对的UMI组合，用于在拼接文库A-L中提取数据；

　　(6.2)拼接文库A-P分析：根据步骤(6.1)得到的成对的UMI组合，在拼接文库中提取每对UMI组合所包含的reads；

　　(6.3)序列组装：对于每对UMI组合所包含的reads使用SPAdes组装，得到一条全长的16S rDNA序列；

　　(6.4)序列注释：使用bowtie2将步骤(6.3)得到的16s rDNA全长序列与Silva数据库进行比对，进而统计样本的菌种丰度信息。

　　本发明的有益效果为：

　　1)通用性：本发明的建库方法适合所有类型样本的菌群结构检测。

　　2)准确性：本发明将传统的菌群结构鉴定从“属”级别提升到“种”级别，与属水平相比较，种水平的优势，可以更准确的确定环境微生物的生态结构，便于深入研究，由此可对样本进行特定细菌菌种的检测。

　　3)高通量：基于高通量测序技术，通过在每个样品上加上不同的标签序列，可以一次地对大量样品进行分析。

　　4)保真性：使用本发明检测的菌群丰度保真性好。

　　附图说明

　　图1是本发明的样本A基因组DNA的凝胶电泳图；

　　图2是本发明的样本A 16S全长扩增结果的凝胶电泳图；

　　图3是本发明样本A的拼接文库A-P的凝胶电泳图；

　　图4是本发明样本A的连接文库A-L的凝胶电泳图；

　　图5是本发明样本A的菌群丰度图；

　　图6是本发明实施例2中的模拟样本的菌群丰度检测结果图；

　　图7是本发明实施例3中排名前20的属两种方法丰度情况对比图。

　　具体实施方式

　　为对本发明的技术内容、特点与功效有更具体的了解，现结合具体实施例，对本发明的技术方案做进一步详细的说明。

　　实施例中未注明具体条件的实验方法，通常按照常规条件，或按照制造厂商所建议的调剂操作。

　　实施例1

　　(一)样本DNA的提取

　　1.1本发明采用Qiagen的DNeasy PowerSoil Kit对一例粪便样本进行提取总DNA的操作，标记为样本A。

　　具体操作步骤：

　　a.震荡装有3ml保护剂粪便样本的收集管，平分到2个1.5ml离心管中，2500g10min去上清，用1ml广口枪头转移沉淀到Power Beads Tube中，轻轻涡旋混匀。

　　b.加入60μl C1，涡旋振荡10min。

　　c.10000g离心30s。

　　d.转移上清到2ml收集管中。

　　e.向收集管中加250μl C2，震荡5s，4℃孵育5min。

　　f.10000g离心1min。

　　g.转移600μl上清到2ml收集管中。

　　h.加200μl C3，振荡混匀，4℃孵育5min。

　　i.10000g离心1min。

　　j.转移750μl上清到新的2ml收集管中。

　　k.摇匀C4，加1200μl到上清中，震荡5s。

　　l.加675μl到MB Spin柱中，10000g离心1min,弃滤过液体。

　　m.重复步骤12两次，直到所有的液体都滤过。

　　n.加500μl C5.10000g离心30s。

　　o.弃滤过液，10000g离心1min

　　p.将MB spin柱转移到新的2ml收集管中。

　　q.在白色膜中央加100μl C6溶液或者无核酶的水。

　　r.室温孵育30s,10000g离心。

　　凝胶电泳结果见图1。从胶图1结果可知：提取DNA条带单一无降解，可用于后续实验。

　　(二)PCR扩增16S rDNA全长，并为每一个原始扩增的16S全长加上特异的分子标签UMI

　　2.1第一轮PCR

　　本实施例采用带有UMI标签的第一组引物序列对所述样本A的DNA进行第一轮PCR扩增，扩增试剂来自诺维赞公司。其中，第一组引物序列为：

　　16S-1-F:CTCCACCCAGACTCATCCATNNNNNNNNNNNNNNGCGATCTAAGAGTTTGATCMTGGCTCAG(SED IQ NO：1)

　　16S-1-R:AGGGGGGCAAAGATGAAGATNNNNNNNNNNNNNNCGTACTAGTACGGYTACCTTGTTACGACTT(SED IQ NO：2)

　　第一轮PCR扩增的反应体系包括：2×Phanta Max Master Mix 25μl，DNA 10ng，16S-1-F 1μl，16S-1-R 1μl，H2O至50μl。

　　第一轮PCR扩增的反应程序为：95℃预变性3min，循环1次；95℃变性30sec，循环3次；58℃复性30sec，循环3次；72℃延伸30sec，循环3次；72℃后延伸5min，循环1次；4℃保持。

　　采用0.9倍诺维赞磁珠对第一轮PCR扩增的产物进行第一次纯化，包括以下步骤：

　　a.向PCR产物中加入45μl诺维赞磁珠，振荡混匀，室温放置5min.

　　b.将PCR管短暂离心并至于磁力架中分离磁珠和液体，待溶液澄清后(约5min),小心移除上清。

　　c.保持PCR管始终置于磁力架中，加入200μl新鲜配制的80％乙醇漂洗磁珠，室温孵育30sec，小心移除上清。

　　d.重复步骤c，总计漂洗两次。

　　e.保持PCR管始终置于磁力架中，开盖空气干燥磁珠5-10min至无乙醇残留。

　　f.将PCR管从磁力架中取出，加入21μl TE，涡旋振荡，于室温放置2min,将PCR管短暂离心并置于磁力架中静置，待溶液澄清后，小心移取20μl上清至新PCR管中，切勿触碰磁珠。

　　2.2第二轮PCR

　　采用第二组引物序列对第一次纯化产物进行第二轮PCR扩增，其中，第二组引物序列为：

　　16S-2-F:CTCCACCCAGACTCATCCAT(SED IQ NO：3)

　　16S-2-R:AGGGGGGCAAAGATGAAGAT(SED IQ NO：4)

　　引物的5‘端进行了磷酸化，为后续连接实验做准备。

　　第二轮PCR扩增的反应体系包括：2×Phanta Max Master Mix 25μl，DNA 1μl，16S-2-F 1μl，16S-2-R 1μl，H2O至22μl。

　　第二轮PCR扩增的反应程序为：95℃预变性3min，循环1次；95℃变性30sec，循环25次；58℃复性30sec，循环25次；72℃延伸30sec，循环25次；72℃后延伸5min，循环1次；4℃保持。

　　第二次扩增产物用0.9倍磁珠进行纯化，20μl TE溶液溶解。文库跑胶结果见图2，由胶图2结果可知:16S全长产物条带在1600bp左右，条带大小正确且条带单一。

　　(三)扩增产物用Tn5酶片段化

　　3.1配制Tn5酶片段化体系，包括DNA 10μl，TAGMENT DNA buffer 5μl，TAGMENTDNA enzyme 0.5μL，H2O 4.5μL。试剂来自illuminaDNA Library Prep试剂盒。将体系振荡离心，置于PCR仪上，反应程序为：55℃反应5min，循环数为1次；4℃保持。

　　3.2采用第三组引物序列对片段化后产物进行第一轮PCR扩增，其中，扩增试剂来自诺维赞公司。其中，第三组引物序列为：

　　16S-3-F1:GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTCTCCACCCAGACTCATCCAT(SEDIQ NO：5)

　　16S-3-F2:GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAGGGGGGCAAAGATGAAGAT(SEDIQ NO：6)

　　16S-3-R：TCGTCGGCAGCGTCAG(SED IQ NO：7)

　　第一轮PCR扩增反应体系包括：2×Phanta Max Master Mix 25μl，DNA 10μl，16S-3-R 1μl，16S-3-F 1μl，16S-3-F 2μl，H2O至12μl。

　　第一轮PCR扩增的反应程序为：95℃预变性5min，循环1次；95℃变性30sec，循环8次；58℃复性30sec，循环8次；72℃延伸1min，循环8次；72℃后延伸5min，循环1次；4℃保持。

　　第一轮扩增的产物采用0.9倍诺维赞磁珠进行纯化，20ul TE溶解。

　　3.3采用第四组引物序列对第一轮PCR扩增产物进行第二轮PCR扩增，其中，第四组引物序列为：

　　16S-P7-01:CAAGCAGAAGACGGCATACGAGATAGCAGGAAGTGACTGGAGTTCAGACGTG(SED IQNO：8)

　　16S-I5-01:AATGATACGGCGACCACCGAGATCTACACGAGCTGAATCGTCGGCAGCGTCAGAT(SEDIQ NO：9)

　　其中，上述引物序列中的下划线为index，不同的样本可以采用不同的index进行区分。

　　第二轮PCR扩增反应体系包括：2×Phanta Max Master Mix 25μl，DNA 2μl，16S-P7-01μl，16S-I5-01μl，1H2O至21μl。

　　第二轮PCR扩增的反应程序为：95℃预变性5min，循环1次；95℃变性30sec，循环8次；58℃复性30sec，循环8次；72℃延伸1min，循环8次；72℃后延伸5min，循环1次；4℃保持。

　　第二轮PCR扩增产物用0.9倍诺维赞磁珠纯化，20ul TE溶液溶解。拼接文库完成。标记为A-P，文库跑胶结果见图3。由胶图3结果可知，拼接文库在100-1500左右呈弥散状态，说明片段化比较均匀，符合预期。

　　(四)将步骤2.2中的最后扩增产物环化并构建连接文库(Link-tag library)

　　4.1采用T4 DNA连接酶(Thermo)完成步骤2.2中的最后扩增产物的环化连接。具体体系包括：T4 DNA连接酶1μl，T4 DNA连接酶buffer 2μl，DNA 2μl，H2O 15μL。将上述反应体系至于PCR仪上，16℃孵育1h，得到连接产物。

　　4.2采用第五组引物序列对上述连接产物进行第一轮PCR扩增，其中，第五组引物序列为：

　　16S-4-F:TCTACACTCTTTCCCTACACGACGCTCTTCCGATCTCTGAGCCAKGATCAAACTCTTAGATCGC(SED IQ NO：10)

　　16S-4-R:GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTAAGTCGTAACAAGGTARCCGTACTAGTACG(SED IQ NO：11)

　　第一轮PCR扩增反应体系包括：2×Phanta Max Master Mix 25μl，连接产物10μl，16S-4-R 1μl，16S-4-F 1μl，H2O至13μl。

　　第一轮PCR扩增的反应程序为：95℃预变性3min，循环1次；95℃变性30sec，循环8次；58℃复性30sec，循环8次；72℃延伸1min，循环8次；72℃后延伸3min，循环1次；4℃保持。

　　第一轮扩增的产物采用0.9倍诺维赞磁珠进行纯化，20ul TE溶解。

　　4.3采用第六组引物序列对上步的第一轮PCR扩增产物进行第二轮PCR扩增，其中，第六组引物序列为：

　　16S-P7-01:CAAGCAGAAGACGGCATACGAGATAGCAGGAAGTGACTGGAGTTCAGACGTG(SED IQNO：12)

　　16S-P5-01:AATGATACGGCGACCACCGAGATCTACACAAACATCGACACTCTTTCCCTACACGAC(SED IQ NO：13)

　　下划线为index，不同的样本可以采用不同的index进行区分。

　　第二轮PCR扩增反应体系包括：2×Phanta Max Master Mix 25μl，DNA 1μl，16S-P7-01μl，16S-P5-01μl，1H2O至22μl。

　　第二轮PCR扩增产物用0.9倍诺维赞磁珠纯化，20ul TE溶液溶解。连接文库完成，标记为A-L，文库跑胶结果见图4。由胶图4结果可知，连接文库在260bp左右且条带单一，符合预期。

　　(五)使用illumina测序仪测序

　　5.1采用illumina测序仪对连接文库A-L和拼接文库A-P进行双端测序，测序长度150bp，得到连接文库A-L和拼接文库A-P测序结果。

　　(六)测序结果生物信息技术处理分析

　　6.1连接文库A-L分析：使用cutadaptor在连接文库测序结果中识别成对的UMI组合，用于在拼接文库A-L中提取数据；

　　6.2拼接文库A-P分析：根据步骤6.1得到的成对的UMI组合，在拼接文库中提取每对UMI组合所包含的reads；

　　6.3序列组装：对于每对UMI组合所包含的reads使用SPAdes组装，得到一条全长的16S rDNA序列；

　　6.4序列注释：使用bowtie2将步骤(6.3)得到的16s rDNA全长序列与Silva数据库进行比对，进而统计样本的菌种丰度信息，结果见表1和图5。

　　表1样本A确定的细菌种类

　　实施例2

　　将四种已知菌种(Streptococcus_pneumoniae，Enterococcus_faecalis，Streptococcus_pyogenes，Streptococcus_agalactiae)的DNA样本按照1：1：1：1的菌群丰度混合，组成模拟样本(mock community)，用本发明的16S-FAST技术检测样本菌群丰度保真性情况。结果如图6所示，从图6中结果可知：本发明的技术确定的菌群丰度的保真性很好，基本接近真实的比例。

　　实施例3

　　采用本发明的方法对样本的16S全长检测作为实验组，采用现有技术中V3V4区段测序检测方法作为对照组，比对二者的检测结果，如表2所示：

　　表2排名前20的属两种方法丰度情况

　　从表2和图7可知：两种方法确定的属的丰度相关性系数R2为：0.998，说明两种方法确定的属类别基本一致。但是16S-FAST全长技术能够将准确度从属提高到种，所以该方法优于传统的区段测序。

　　序列表

　　<110> 北京群峰纳源健康科技有限公司

　　<120> 一种检测细菌16S rDNA全长的建库测序方法

　　<130> 无

　　<170> PatentIn version 3.5

　　<210> 1

　　<211> 62

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(62)

　　<221> misc_feature

　　<222> (21)..(34)

　　<223> 根据实验要求而设计，作为扩增引物16S-1-F

　　<400> 1

　　ctccacccag actcatccat nnnnnnnnnn nnnngcgatc taagagtttg atcmtggctc 60

　　ag 62

　　<210> 2

　　<211> 64

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(64)

　　<221> misc_feature

　　<222> (21)..(34)

　　<223> 根据实验要求而设计，作为扩增引物16S-1-R

　　<400> 2

　　aggggggcaa agatgaagat nnnnnnnnnn nnnncgtact agtacggyta ccttgttacg 60

　　actt 64

　　<210> 3

　　<211> 20

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(20)

　　<223> 根据实验要求而设计，作为扩增引物16S-2-F

　　<400> 3

　　ctccacccag actcatccat 20

　　<210> 4

　　<211> 20

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(20)

　　<223> 根据实验要求而设计，作为扩增引物16S-2-R

　　<400> 4

　　aggggggcaa agatgaagat 20

　　<210> 5

　　<211> 54

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(54)

　　<223> 根据实验要求而设计，作为扩增引物16S-3-F1

　　<400> 5

　　gtgactggag ttcagacgtg tgctcttccg atctctccac ccagactcat ccat 54

　　<210> 6

　　<211> 54

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(54)

　　<223> 根据实验要求而设计，作为扩增引物16S-3-F2

　　<400> 6

　　gtgactggag ttcagacgtg tgctcttccg atctaggggg gcaaagatga agat 54

　　<210> 7

　　<211> 16

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(16)

　　<223> 根据实验要求而设计，作为扩增引物16S-3-R

　　<400> 7

　　tcgtcggcag cgtcag 16

　　<210> 8

　　<211> 52

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(52)

　　<223> 根据实验要求而设计，作为扩增引物16S-P7-01

　　<400> 8

　　caagcagaag acggcatacg agatagcagg aagtgactgg agttcagacg tg 52

　　<210> 9

　　<211> 55

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(55)

　　<223> 根据实验要求而设计，作为扩增引物16S-I5-01

　　<400> 9

　　aatgatacgg cgaccaccga gatctacacg agctgaatcg tcggcagcgt cagat 55

　　<210> 10

　　<211> 64

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(64)

　　<223> 根据实验要求而设计，作为扩增引物16S-4-F

　　<400> 10

　　tctacactct ttccctacac gacgctcttc cgatctctga gccakgatca aactcttaga 60

　　tcgc 64

　　<210> 11

　　<211> 64

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(64)

　　<223> 根据实验要求而设计，作为扩增引物16S-4-R

　　<400> 11

　　gtgactggag ttcagacgtg tgctcttccg atctaagtcg taacaaggta rccgtactag 60

　　tacg 64

　　<210> 12

　　<211> 52

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(52)

　　<223> 根据实验要求而设计，作为扩增引物16S-P7-01

　　<400> 12

　　caagcagaag acggcatacg agatagcagg aagtgactgg agttcagacg tg 52

　　<210> 13

　　<211> 57

　　<212> DNA

　　<213> 人工序列

　　<221> misc_feature

　　<222> (1)..(57)

　　<223> 根据实验要求而设计，作为扩增引物16S-P5-01

　　<400> 13

　　aatgatacgg cgaccaccga gatctacaca aacatcgaca ctctttccct acacgac 57

《一种检测细菌16S rDNA全长的建库测序方法.doc》

将本文的Word文档下载到电脑，方便收藏和打印

推荐度：

点击下载文档

文档为doc格式(或pdf格式)

组合技术图文推荐

上一篇：一种葡萄抗体库的制备方法

下一篇：血浆DNA文库及其构建方法