基于桃全基因组变异信息的SSR和SNP标记开发及应用

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:epippo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
桃(Prunus persica L.)是一种重要的蔷薇科(Rosaceae)落叶果树,在世界范围内广泛栽培。桃种质资源是遗传改良和科学研究的物质基础,其数量和质量,决定优异种质发掘的深度和广度,影响未来世界桃产业的可持续发展。近年来,育种者进行品种选育时趋向使用一些核心亲本,导致种质的遗传基础越来越狭窄,多样性位点丢失,同时也为新品种的DUS测试带来了挑战。随着桃双单倍体砧木品种“Lovell”全基因组测序的完成和高通量测序技术的普及,解析了全基因组的基因型信息和大量的DNA变异,为桃种质资源的研究提供了跨越式发展机遇。然而,桃基因组数据量越来越大,产生的变异信息也越来越多,如何进行有效的筛选和应用是研究者面临的难题。为从全基因组挖掘出适用于桃遗传研究和种质鉴定的SSR和SNP标记,本研究利用366份桃全基因组重测序数据,解析桃全基因组变异信息,筛选出高多态性SSR和SNP标记,探讨在桃的群体遗传多样性、重要农艺性状的关联分析和指纹图谱构建等方面的应用,以期对我国桃地方品种、育成品种的知识产权保护提供理论依据。主要研究结果如下:1.解析了桃全基因组变异特征:通过对6份亲缘关系较远的桃种质进行高深度重测序(75.2 X),共鉴定出141,895个简单重复序列(SSRs)、1,166,551个单核苷酸多态性(SNPs)、44,245个结构变异(SVs)和12,302个拷贝数目变异(CNVs)。基于重测序获得的141,895个SSR位点,共检测到44种SSR重复基元,其中单核苷酸重复有4种,二核苷酸重复基元有6种,分别占总SSR的47.36%和39.87%。我们进一步分析了不同区域内的SSR种类,发现UTR区二碱基重复数目最多,占所有重复单元的46.36%,其中AG/GA(290)和 CT/TC(266)数目最多,然后依次是 AT/TA(54)、AC/CA(30)和GT/TG(23),未检测到CG/GC重复单元。基于全基因组变异注释信息,获得331个含有大于10个SSR序列的基因和203个影响基因功能的large-effect SNP。对其在不同器官进行基因表达分析,分别发现有9个在叶片、13个在果实、22个在种子、17个在根和8个在韧皮部表现出较高表达水平的基因。2.开发了 15个高多态性SSR标记:通过对SSR单元多态性、SSR种类、SSR分布和共有性等过滤,筛选出194个SSR位点用于引物设计,获得187个SSR特异引物序列。利用21份种质进行多态性扩增,从中筛选出15个高多态性SSR标记。基于开发的高态性SSR标记,对221份种质的遗传多样性进行分析。NJ聚类显示,221份种质被分为地方品种、欧美品种、亚洲品种3大类群。同时,构建了 200份鲜食桃、65份观赏桃和80份登记品种的SSR分子身份证,为保护我国桃种质资源的知识产权、桃品种的分子鉴定提供理论依据。3.开发了 775个高多态性SNP标记:利用360份桃重测序获得的1665万个SNPs,进行SNP缺失率、测序深度、质量值、多态性及等位基因数目等参数过滤,获得775个高多态性的SNP标记。进一步构建SNP标记的进化树,将360份桃样本分为地方品种和育成品种2大类群。同时,对6个质量性状进行关联分析,分别鉴定到与果实粘离核关联的SNP(Pp04:24,189,168 bp),与果肉颜色关联的 SNP(Pp01:29,561,885 bp),与果皮毛关联的 SNP(Pp05:13,889,348 bp),与果实酸味关联的SNP(Pp05:494,049 bp),与果实形状关联的SNP(Pp06:28,389,195 bp),与花粉育性关联的 SNP(Pp06:28,389,195 bp)。另外,通过生物信息学手段,筛选出17个基因组特异的SNPs,构建了 80份鲜食桃、29份观赏桃及70份登记品种的SNP分子身份证。为进一步提高品种鉴定的效率,降低分型成本,我们计算桃基因组每1000 bp内SNP数目,获得包含SNP数目最多的区间(Pp02:6,226,000 bp-6,227,000 bp),达到单一PCR内SNP区分最多品种。
其他文献
良性前列腺增生(Benign Prostate hyperplasia,BPH),是老年男性常见疾病,有一部分BPH患者需要手术干预治疗,而绝大部分治疗BPH的前列腺切除手术都不能避免前列腺部尿道尿路上皮的毁损,前列腺部尿道被覆的尿路上皮具有防止尿液中有毒物质渗透的屏障功能,尿路上皮重新覆盖创面的修复过程被称为再上皮化(Re-epithelialization)或尿路上皮再生(Urothelium
学位
稻曲病是由稻曲病菌(Ustilaginoidea virens)引起的一种穗部病害,严重影响世界各地的水稻生产。本研究从稻曲病菌产孢研究入手,开发了水稻组织培养基,建立了诱导稻曲病菌产孢的方法。稻曲病菌在侵染过程中分泌大量的效应蛋白,本研究对其中的三个效应蛋白UvScd1、UvTcd1和UvNLP进行了功能研究。主要结果如下:1.与PSB培养基相比,使用水稻组织培养基可以促进稻曲病菌的产孢。在供试
学位
表皮毛是由植物表皮细胞分化形成的一种毛状结构,广泛存在于各种植物器官的表面。根据表皮毛结构不同可以分为单细胞表皮毛或多细胞表皮毛;腺体毛或非腺体毛;分支或不分支。表皮毛作为植物表皮的第一层屏障,可以帮助植物抵御生物逆境和非生物逆境。表皮毛是研究细胞分化和形态发生的经典模式,在拟南芥中得到了广泛研究;番茄中表皮毛的研究较少,调控表皮毛形成的分子机制还不清楚。为了解析调控番茄表皮毛生长发育的遗传基础和
学位
中国南方亚热带湿润气候区退化喀斯特非地带性森林群落在足够长时间恢复及积淀下,可发育为地带性土壤-黄壤,也可形成非地带性土壤-石灰土,由于石灰土中大量碳酸钙输入土壤,与黄壤具有不同的碳循环特征,因此在“双碳”背景下研究两种土壤的碳循环过程具有重要意义。土壤矿物颗粒有机碳饱和亏缺是反映土壤有机碳固碳潜力的重要指标,探讨其特征及驱动机制是当前“双碳”背景下陆地生态系统碳循环与全球固碳减排研究领域的优先主
学位
模糊微分方程比常微分方程能更为准确地描述客观事物的变化规律,在生物学、工程学、经济学等领域里有诸多应用.由于模糊数空间中模糊数的减法(不是加法的逆运算)不同于实数空间中经典的减法(加法运算的逆运算),从而导致模糊数空间中的导数定义与经典导数定义有本质区别,无法直接继承经典的分析方法给出模糊微分系统的精确解.因此,给出模糊微分系统解的精确表示显得十分重要,也可为研究系统稳定性和可控性问题奠定基础.本
学位
烟草白粉病的发生严重影响了烟叶的产量和品质,目前控制白粉病的常用方法是使用杀菌剂,但这可能会对环境造成严重影响,并且存在农残超标的潜在危险。因此,鉴定白粉病抗性相关基因进而培育抗病品种是控制白粉病的有效的途径。本文从不同类型烟草种质资源中鉴定到了9份抗白粉病材料,对国内2个重要抗源进行遗传分析和功能验证,明确了NtMLO基因在白粉病抗性中的作用,并对其抗病机理进行了解析。主要研究结果如下:1.建立
学位
以深度学习为代表的人工智能技术和机器人技术均是全球热门研究领域,更是我国实现从制造大国向制造强国转变的基本条件。我国将智能制造作为提升制造业实力的主攻方向,先后发布了《中国制造2025》、《智能制造发展规划(2016-2020)年》和《“十四五”智能制造发展规划》征求意见稿,这表明我国对智能制造愈发重视且政策体系愈发完善健全。在此背景下,开展基于机器视觉的机器人智能抓取研究将具有重要意义,不仅促进
学位
氨气是大气中重要碱性气体,与酸性气体反应生成硝酸铵、硫酸氢铵、硫酸铵,是雾霾形成的重要前体物质。养殖场是重要氨排放源,由于高蛋白饲养、低氮素利用效率,导致高氨排放,养殖业氨排放量占全球氨总排放量40%-50%。中国亚热带丘陵区,由于季风作用,摆脱了世界同纬度地区的干旱酷热,凭借水热俱佳的气候优势,在中国畜牧生产中居于重要地位。在中国亚热带丘陵区,养殖生产区与自然区交错分布,复杂的地形地貌不利于大气
学位
耕地保护政策是保护耕地资源,保障粮食安全的有效途径。随着我国生态文明建设战略地位的不断提升,为实现粮食安全与生态建设的双重目标,国家现着力加强耕地数量、质量、生态“三位一体”保护,在促进耕地资源可持续利用的同时,推动生态可持续发展。然而,目前我国耕地补充主要来自土地开发,耕地补充的重心从东南地区向耕地后备资源丰富的中西部地区转移,而我国中西部地区生态环境脆弱,过度开垦耕地会造成荒漠化、水土流失及生
学位
陆地棉(Gossypium hirsutum L.AADD,2n=52)是世界上种植最为广泛的经济作物,并且也是自然纤维的主要来源。上个世纪20年代开始,中国从美国大量引进陆地棉种质资源,包括岱字棉、斯字棉、爱字棉和金字棉等。后来随着陆地棉在国内不断种植和生产区域的扩大,育种家们在提高其产量、纤维品质和早熟性上付出了巨大努力。尤其早熟性的研究以及品种的选育对缓解粮棉争地、促进粮(油)棉两熟机制的发
学位