论文部分内容阅读
为了阐明华南籼稻优质、丰产等优良农艺性状的分子遗传学基础,我们对华南籼稻谱系育种过程中处于三个重要节点处的水稻培育品种进行基因组学研究。利用solexa双末端测序法,分别以93-11和日本晴为参考基因组,我们对青六矮1号、特青和黄华占三个水稻品种进行基因组重测序。这三个品种分别具有不同的性状优势:特青丰产;青六矮1号米质优良;黄华占则同时具备了丰产、优质、适应性好等特点,是一个目前被大面积推广种植的优质水稻品种。通过高通量测序,我们针对每个品种分别发现了约3万的1~3个碱基插入或缺失(Indel)以及2千多个结构性变异区,并获得了籼稻全基因组水平的单碱基多态(SNP)标记谱。
通过计算机模拟实验,我们发现SNP在基因组中的分布并不符合随机分布,具有明显的偏向性或选择性。结合基因芯片实验,我们发现基因调控和编码区的SNP与基因表达水平的变化紧密偶联。通过对基因区SNP多态的分析,我们发现了824个基因,在二十年左右的遗传育种过程中、在高强度的人工选择压力下表现出高度变异的特点,根据Gene Ontology(Go)进行富集分析(GO enrichment analysis),显示主要有参与防御响应(defense response)、细胞凋亡(apoptosis)、蛋白/ATP/离子结合(protein binding,ATPbinding and iron ion binding)等几类基因在高度变异的基因中显著富集(P<0.01)。对于SNP导致的基因功能丧失(基因提前终止、起始密码子的突变导致无法正常起始、突变导致内含子与外显子无法被正常剪切等)方面的统计,显示在黄华占的培育过程中,有功能的基因数目有增加的趋势。
由于特青和青六矮1号位于育种谱系的上游两个节点处,最终通过谱系育种形成了黄华占,我们试图在三个品种中观察高强度人工选择压下遗传信息的流向。利用基因组水平高密度的SNP数据,搜索遗传信息从特青流向黄华占(Qz)以及青六矮1号流向黄华占(AZ)的SNP模块(区段),这些区段中很可能包含黄华占继承特青丰产以及青六矮1号米质好等优良农艺性状的遗传信息。通过模式识别和相应的统计学分析,我们一共找到了663个AZ区段和597个QZ区段,通过计算机模拟实验再一次推断出这些区段应该受到了某种选择压力。这些区段可能包含了一些重要的代表优良农艺性状的遗传信息,从而在育种品种过程中这些区段从A和Q不断的被选择下来,最终出现在Z的基因组中。
以上工作,为分析华南优质籼稻核心种质的基因组信息,研究常规遗传育种过程中基因型变化的规律奠定了基础,并将指导于未来的分子设计育种。