欢迎光临小豌豆知识网!
当前位置:首页 > 化学技术 > 组合技术> 陆地棉SNP标记及其应用独创技术15121字

陆地棉SNP标记及其应用

2021-04-24 16:31:10

陆地棉SNP标记及其应用

  技术领域tt

  本发明涉及SNP标记,尤其涉及陆地棉SNP标记,本发明还涉及所述陆地棉SNPtt标记在陆地棉遗传多样性分析和种质资源鉴定中的应用,属于陆地棉SNP标记的开tt发领域。tt

  背景技术tt

  单核苷酸多态性(简称SNPs)标记在基因组中具有数量多、分布密度高的特点,tt而且在基因分型过程中不需要根据片段大小判断,可以大规模的自动化的完成。与微tt卫星标记等重复序列多态(SSR)标记相比,SNPs具有很高的遗传稳定性,尤其是tt处在编码区中的SNPs,工作效率更高,更适合进行大样本量检测分析,因此现在的tt生物学家认为SNP标记是很有应用前景的分子标记技术(王建康,盖钧锰.利用杂种ttF2世代鉴定数量性状主基因一多基因混合遗传模型并估计其遗传效应.遗传学报,tt1997,24(5):432-440.)。tt

  随着棉花基因组研究的深入,二倍体雷蒙徳氏棉、亚洲棉和四倍体陆地棉基因组tt测序相继完成(Wang,K.,Z.Wang,F.Li,W.Ye,J.Wangetal.,2012ThedraftgenomettofadiploidcottonGossypiumraimondii.Nat.Genet.44:1098–110310.1038/ng.2371;Li,ttF.G.,G.Y.Fan,K.B.Wang,F.M.Sun,Y.L.Yuanetal.,2014GenomesequenceofthettcultivatedcottonGossypiumarboreum.Nat.Genet.46:567–57210.1038/Ng.2987;Li,F.ttG.,G.Y.Fan,C.R.Lu,G.H.Xiao,C.S.Zhouetal.,2015GenomesequenceofttcultivatedUplandcotton(GossypiumhirsutumTM-1)providesinsightsintogenomettevolution.NATUREBIOTECHNOLOGY.doi:10.1038/nbt.3208),研究者在此基础上tt开发了大量的SNP标记,进一步利用这些SNP标记合成了一个63K的棉花SNP芯片tt(Hulse-KempA.M.,LemmJ,PlieskeJ,etal.Developmentofa63KSNPArrayforttCottonandHigh-DensityMappingofIntraspecificandInterspecificPopulationsofttGossypiumspp.G3(Bethesda)5:1187-1209)。tt

  然而,上述SNP标记在开发的过程中仅仅根据几个棉花种间的序列差异进行标tt记开发,并没有考虑棉花基因组的异源多倍性。因此,目前已有的棉花SNP标记及tt其棉花SNP芯片并没有对标记的拷贝数进行分析,导致大部分标记在陆地棉基因组tt中存在多个拷贝,在进行遗传多样性分析、品种鉴定、群体遗传结构分析及关联分析tt时的效率比较低。例如,本发明对目前的63K棉花SNP芯片上的63,058个SNP进行tt分析,发现只有21171个标记在陆地棉中具有多态性,筛选效率仅为33.57%。在水tt稻中,目前已经开发出了用于水稻品种鉴定的SNP芯片(中国专利CN104328507A),tt然而该发明在开发过程中,尽管考虑了SNP标记间的连锁不平衡(LD),但是并没tt有分析具体的连锁不平衡衰退距离。因为处于LD衰退距离之内的SNP标记往往表现tt出共分离,这些SNP标记在进行遗传多样性分析、指纹图谱鉴定时很容易给出错误tt的信息。tt

  因此,开发陆地棉基因组单拷贝SNP标记,并进一步对这些单拷贝SNP标记进tt行连锁不平衡分析,获得适于陆地棉遗传多样性分析的SNP标记,对于陆地棉种质tt资源遗传分析和发掘优异基因资源具有重要意义。tt

  发明内容tt

  本发明所要解决的技术问题是提供陆地棉SNP标记,能够用于陆地棉遗传多样tt性分析、群体结构分析或种质鉴定等,且分析效率高。tt

  为解决上述技术问题,本发明所采取的技术方案是:tt

  本发明通过利用芯片杂交和同源序列比对的方法开发出陆地棉基因组单拷贝ttSNP标记,进一步通过连锁不平衡分析剔除掉位于连锁不平衡衰退距离内的SNP标tt记,从而获得本发明陆地棉SNP标记。tt

  本发明所述陆地棉SNP标记所在染色体、SNP位点的物理位置以及核苷酸类型tt的具体信息见说明书表2。本发明所述SNP标记的位点的物理位置是基于陆地棉tt(TM-1)基因组测序序列确定的;其中,所述陆地棉(TM-1)基因组测序序列的版tt本号为:Gossypium_hirsutumv1.0。tt

  利用本发明的SNP标记对120份陆地棉材料进行遗传多样性分析时,全部的4074tt个SNP标记在120份材料间均检测到多态性,检测效率达到100%,平均每个SNPtt标记可以检测到2个等位基因,检测到的等位基因频率围在0.5~0.95,平均为0.75;tt检测到的基因多样性范围在0.1~0.5,平均为0.34;检测到的PIC值范围为0.09~0.38,tt平均为0.27。聚类分析可以明显地将这120份材料按照遗传距离的远近分成不同类群,tt群体结构分析表明这120份材料存在明显的群体结构。tt

  利用本发明的SNP标记对不同种质材料进行指纹图谱鉴定时,通过筛选针对不tt同种质材料鉴定的特征SNP基因型标记,可以实现利用1个SNP标记对特定种质材tt料进行鉴定的目的。具体的,所述SNP标记为i00326Gh、i03099Gh、i02807Gh、tti03003Gh、i00827Gh、i03528Gh、i04354Gh、i03143Gh、i00950Gh、i00546Gh、i01389Gh、tti01439Gh、i01985Gh或i03302Gh中的任意一种或多种。tt

  本发明进一步公开了用于检测所述陆地棉SNP标记的引物对。根据本发明所述tt陆地棉SNP位点对应序列即可设计正向引物和反向引物。引物设计原则为本领域技tt术人员所熟知。tt

  本发明所述的陆地棉SNP标记能够应用于陆地棉的遗传多样性分析或群体结构tt分析中,包括以下步骤:(1)提取待测陆地棉的基因组DNA;(2)利用检测所述tt陆地棉SNP标记的引物对,以步骤(1)提取的基因组DNA为模板,进行PCR扩增,tt得到PCR扩增产物;(3)对所述PCR扩增产物进行测序,获得测序结果;(4)根tt据测序结果,确定待测陆地棉在所述SNP标记的位点的基因型;然后利用相关软件tt进行陆地棉的遗传多样性分析或群体结构分析。tt

  本发明所述的陆地棉SNP标记能够应用于陆地棉的种质鉴定中,包括以下步骤:tt(1)提取待测陆地棉的基因组DNA;(2)利用检测所述陆地棉SNP标记的引物对,tt以步骤(1)提取的基因组DNA为模板,进行PCR扩增,得到PCR扩增产物;(3)tt对所述PCR扩增产物进行测序,获得测序结果;(4)根据测序结果,确定待测陆地tt棉在所述SNP标记的基因型;(5)如果待测陆地棉在所述SNP标记的基因型与本发tt明所述陆地棉SNP标记的基因型相同,则鉴定为同一陆地棉品种;反之,则鉴定为tt不同陆地棉品种。tt

  本发明还公开了一种陆地棉SNP芯片,包括:本发明所述的陆地棉SNP标记。tt本发明所述的陆地棉SNP芯片能够应用于陆地棉的遗传多样性分析、群体结构分析tt或种质鉴定中。tt

  本发明技术方案与现有技术相比,具有以下有益效果:tt

  本发明开发出了陆地棉基因组单拷贝SNP标记,进一步通过连锁不平衡分析剔tt除掉位于连锁不平衡衰退距离内的SNP标记,从而获得适于陆地棉遗传多样性分析、tt指纹鉴定或群体结构分析的SNP标记。本发明的SNP位点为单拷贝并且标记间不存tt在显著的连锁不平衡,因此在进行杂交检测、测序及PCR荧光扩增检测时不会存在tt同源序列的干扰,同时在进行遗传多样性分析、指纹鉴定和群体结构分析时的检测效tt率大大提高,工作效率更高。tt

  附图说明tt

  图1为部分染色体上SNP标记的连锁不平衡分布图;其中,(A)、(B)、(C)、tt(D)分别表示染色体LG13、LG16、LG22、LG25;图中红色部分为高度连锁不平tt衡区域;tt

  图2为是利用本发明的标记进行种质材料聚类分析的NJTREE;tt

  图3为是利用本发明的标记进行群体结构分析的deltak的变化图;tt

  图4为是利用本发明的标记获得的种质群体的群体结构。tt

  具体实施方式tt

  下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而tt更为清楚。但是应理解所述实施例仅是范例性的,不对本发明的范围构成任何限制。tt本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方tt案的细节和形式进行修改或替换,但这些修改或替换均落入本发明的保护范围。tt

  实施例1陆地棉SNP标记的开发与应用tt

  1、实验方法tt

  1.1供试材料tt

  选自120份陆地棉优异种质材料(表1)的嫩绿叶片,提取其总DNA。tt

  表1从嫩绿叶片提取其总DNA进行分析的棉花品系和材料tt

  1.2总DNA提取方法tt

  利用DNA提取试剂盒(TaKaRaMiniBESTPlantGenomicDNAExtractionKit,ttCodeNo.9768)提取各材料幼苗的DNA,DNA质量要求为:DNA浓度大于50ng/ul;ttDNA样品体积大于20ul,DNA总量大于1ug,DNA的吸光度260/280比值在1.7-2.0tt之间。tt

  1.3芯片实验tt

  使用illumina棉花全基因组SNP芯片(商业途径获得)对样品进行SNP位点的tt检测,具体流程参考Infinium芯片实验流程,芯片杂交实验委托北京怡美通德科技发tt展有限公司进行操作,使用illuminaGenomestudio(v2011),Gentrain2.0算法,自动聚tt类对样本进行分型。根据分型结果,筛选MAF>0.05,CallFreq〉0.9,并且不全为杂tt合的SNP位点,共计21171个。tt

  1.4陆地棉基因组序列数据库tt

  以陆地棉(TM-1)基因组测序获得的序列数据(序列版本号:Gossypium_hirsutumttv1.0)作为输入序列,利用BLAST+程序的makeblastdb命令构建本地基因组序列数tt据库,利用blastn命令将上述21171个SNP位点的原始序列与构建的基因组序列数tt据库进行同源比对,筛选比对结果中E值小于-18,并且只有一个比对结果的单拷贝ttSNP位点。tt

  1.5SNP基因型统计tt

  根据芯片杂交分型结果,进一步筛选1.4中的单拷贝SNP位点,根据这些SNP位点tt的芯片杂交分型结果对120份材料进行基因型分析。可选择地,SNP基因型分析除了tt利用芯片杂交结果之外,还可以通过对样本材料DNA中SNP位点对应序列进行测序tt(因本发明的SNP位点为单拷贝,不会存在同源序列的干扰,故测序成功率会大大提tt高),具体测序方法如下:根据SNP位点对应序列设计正向引物和反向引物,以样本tt材料DNA为模板,在PE9600上进行PCR扩增,扩增产物进行2%琼脂糖凝胶电泳,用tt乙醇沉淀法对PCR产物进行纯化,纯化后溶于适量TE缓冲液中备用。PCR产物用DNAtt测序试剂盒((BigDyeTerminatorCycleSequencingReadyReactionKit,PE公司)进行tt双向测序反应,使用ABI310DNA测序仪进行序列测定。tt

  1.6连锁不平衡分析tt

  根据1.5中120份材料的基因型结果,利用TASSEL软件分别对26条染色体上的单tt拷贝SNP位点进行连锁不平衡分析,获得不同染色体的连锁不平衡分布情况(图1),tt进一步根据连锁不平衡分析结果,首先剔除掉处于完全连锁不平衡状态(R2=1)的SNPtt位点,然后利用SPSS软件的非线性回归模型绘制标记间的连锁不平衡曲线,确定棉tt花26条染色体上的连锁不平衡衰退距离,进一步剔除掉位于连锁不平衡衰退距离内的ttSNP标记,从而获得本发明的SNP标记(表2)。tt

  本发明开发的陆地棉基因组SNP标记及其核苷酸类型和染色体定位见表2。tt

  表2本发明开发的陆地棉基因组SNP标记及其序列和染色体定位tt

  1.7遗传多样性分析和群体结构分析tt

  利用表2中的SNP标记对表1的120份材料进行基因型分析,方法同步骤1.5。利用ttPowerMarke3.25软件(LiuKJ,MuseSV(2005)PowerMarker:anintegratedanalysisttenvironmentforgeneticmarkeranalysis.Bioinformatics21:2128–2129.)对材料进行遗tt传多样性分析,利用软件的“summarystatistics”程序计算每个SNP位点的等位基因数tt目、等位基因频率、基因多样性和多态性信息含量,利用“phylogeny”程序进行NJTREEtt聚类分析(图2)。tt

  利用STRUCTURE2.2软件(PritchardJK,StephensM,DonnellyP(2000)Inferencettofpopulationstructureusingmulti-locusgenotypedata.Genetics155:945–959.)对样本tt进行结构分析,利用软件的‘admixturemodel’进行程序运行,选择lengthofburninttperiod为1000,NumberofMCMCRepsafterburnin为1000,其他为默认,群体参数ktt值选择1-15,每个k独立重复5次。根据每个K值的可能性((Ln(k))绘制deltak(deltattk=m(Ln”(k))/S(Ln(k)))的变化图(图3),选择K=2时的barplot图为理想的群体结构tt(图4)。tt

  利用本发明的标记对120份陆地棉材料进行遗传多样性分析时,全部的4074个ttSNP标记在120份材料间均检测到多态性,检测效率达到100%,平均每个SNP标记可tt以检测到2个等位基因,检测到的等位基因频率围在0.5~0.95,平均为0.75;检测到的tt基因多样性范围在0.1~0.5,平均为0.34;检测到的PIC值范围为0.09~0.38,平均为0.27。tt聚类分析可以明显地将这120份材料按照遗传距离的远近分成不同类群,群体结构分tt析表明这120份材料存在明显的群体结构。tt

  1.8利用SNP标记进行种质鉴定tt

  根据对表1的120份材料进行基因型分析的结果,分析不同材料所具有的特征ttSNP标记,利用特征SNP标记对不同材料进行SNP基因型检测,即可获得该材料的tt特征SNP基因型,从而将该材料与其它材料区分开。tt

  具体地,特征SNP标记的获取方法如下:首先利用表2的SNP标记对120份材tt料进行遗传多样性分析,选择SNP位点的等位基因频率大于0.9的SNP标记,分析tt这些SNP标记在120份材料中的SNP基因型,如果只利用某一个SNP标记即可以将tt某一种质材料与其它种质材料区分开,则该SNP标记即为该种质材料的特征SNP标tt记(表3)。tt

  在具体实施时,利用表4中的特征SNP标记对特定种质材料进行SNP基因型检tt测,可以快速筛选出具有特征SNP标记基因型的种质材料(表4)。tt

  表3不同种质材料的特征SNP标记tt

  

  表4不同种质材料的特征SNP标记基因型tt

  

  利用本发明的SNP标记对不同种质材料进行指纹图谱鉴定时,通过筛选针对不tt同种质材料鉴定的特征SNP标记,可以实现利用1个SNP标记对特定种质材料进行tt鉴定的目的。tt

《陆地棉SNP标记及其应用.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)