论文部分内容阅读
农作物种子作为人类食物、动物饲料和工业原材料的重要来源,主要由二倍体的胚胎和三倍体的胚乳组成。大多数农艺性状,包括种子性状都是复杂性状,它不仅仅受到单个基因控制,同时受到上位性效应和基因与环境互作效应的影响。随着高通量测序技术的发展,全基因组关联分析方法是检测人类疾病和农业复杂性状遗传变异的一种有效手段。但是目前大多数关联分析方法均是基于简单的加性模型,且仅对单个数量性状进行分析。针对作物种子性状连锁分析和多性状全基因组关联分析存在的问题,我们基于混合线性模型发展了对应的新方法剖析复杂性状的遗传结构。蒙特卡洛模拟和实例数据分析均证明了新方法的无偏性和可靠性。本论文主要内容包括以下三个章节:第一章首先介绍近年来连锁分析和关联分析的研究进展以及发展的相应软件。此外,我们还介绍了在混合线性模型中,假设检验和参数估计常用的统计方法。第二章介绍了新发展的基于混合线性模型种子性状定位的试验设计和统计方法。开花植物的种子来源于双受精,不但在繁衍中发挥重要作用,而且还是动物饲料和人类食物的主要来源。种子的发育包含多个遗传体系,比如母体基因组、胚基因组和胚乳基因组。由于其复杂的多遗传体系,尤其是来自同一基因组内和来自不同基因组间的上位性以及各项遗传分量与环境互作效应的存在,使得研究种子性状的遗传机制面临巨大的挑战。根据种子性状的遗传特征,我们提出了两个统计遗传模型,该模型中包含母体加性和显性效应,胚或胚乳的加性和显性效应,母体基因组内的加加上位性效应,胚或胚乳基因组内的加加上位性效应,母体和胚或胚乳基因组间的加加上位性效应以及这些效应与环境的互作效应。遗传作图群体可以由永久F2随机交配产生,或是由永久F2与双亲的双向回交产生,或是由永久F2群体自交产生。模特卡洛模拟验证了不同的遗传率和不同的模型对参数估计的影响。棉花种子性状的实例分析也验证了方法的可靠性。基于提出的方法,我们开发了QTLNetwork-Seed-1.0.exe软件,用于种子性状的定位分析。第三章介绍了新发展的基于混合线性模型的多性状全基因组关联分析方法和统计软件。随着高通量测序技术的发展,全基因组关联分析已经变成了广泛使用的探索复杂性状遗传结构的新方法。但是关联分析中主要存在的问题是个体和位点之间的关联会造成假阳性,而混合线性模型是一种有效的控制群体结构的方法。此外,大多数复杂疾病综合症状包含一系列高度关联的临床或分子表现型,因此应该把这些性状联合起来分析检测影响多个性状共有的遗传变异。而目前的大多数方法都是基于加性效应的单性状关联分析的模型。因此,我们拓展了多变量混合线性模型,其中包含了上位性和基因与环境互作效应。我们提出的新方法不但能检测多效性基因,同时还能检测性状特异表达的基因。大量的模拟研究调查了不同的残差相关系数,不同的遗传率以及不同的模型对定位功效和效应估计精度的影响。水稻实例数据也证明了方法的有效性。基于提出的方法,我们开发了相应的软件JAMT (Joint Analysis for Multiple Traits),用于多性状联合关联分析。