论文部分内容阅读
随着生物数据的增长,利用计算机处理,分析和存储浩如烟海的生物数据已经成为一种趋势,从原始的序列分析逐渐发展到包含基因组学,基因表达研究学、和结构生物学的科学。MADS-box基因是真核生物中一类重要的转录调控因子,参与植物花器官的发育和开花时间的调节,在植物的生长发育中扮演重要角色。目前,拟南芥,水稻,毛果杨等植物关于MADS-box基因的研究已经发表,而西瓜中只有部分克隆的MADS-box基因的研究,在全基因组层次的研究至今没有。并且西瓜的种植面积和产量居高,是世界最受欢迎的新鲜水果之一,具有重要的经济价值。因此,展开西瓜MADS-box基因的研究是非常有意义的。 植物中MADS-box基因的预测,验证,分类和进化关系研究需要多种算法参与,本课题通过多算法协同(马尔可夫模型,多序列渐进比对算法,邻近法,泊松模型)研究MADS-box基因,包括:基因的预测,验证,分类;探索不同类别MADS-box基因在结构,位置和表达模式上的差异。本文的主要内容如下: (1)以西瓜基因组数据为材料,通过多算法协同鉴定出39个非冗余MADS-box基因,通过系统进化分析将其分为Ⅰ类(11个)和Ⅱ类(28个)。同时,根据分类信息研究不同类别的MADS-box基因在结构,保守基序,染色体定位的异同,以及在不同组织的表达情况,Ka/Ks计算和分化时间估计上的探索。结果显示Ⅰ类和Ⅱ类MADS-box基因均包含一个保守功能基序但在基因数目,结构和染色体分布上也均有差异。Ⅰ类基因数目较少,结构相对简单,零星分布在几条染色体;Ⅱ类基因数目较多,结构相对复杂,几乎遍布整个染色体组。 (2)参考西瓜全基因组MADS-box基因分析思路,基于多算法协同设计一套MADS-box基因家族分析流程,适用于其他植物在全基因组层次MADS-box基因家族分析。包括分析流程的设计原则和架构;流程的需求(参考物种的选择,数据的收集,分析软件和算法的确定)以及分析流程输入输出的详细界面介绍等。 本研究旨在通过多算法协同研究西瓜基因组MADS-box基因,确定MADS-box基因家族的数目、分类和进化关系;位置信息、基因结构和保守基序等。参考西瓜MADS-box基因家族的分析思路,设计一套适合其他植物在全基因组层次MADS-box基因家族分析的流程,为研究植物MADS-box基因提供了一个行之有效的方法,有利于探索不同物种MADS-box基因的异同和进化关系的研究。