论文部分内容阅读
植物基因组进化的重要特征之一就是发生了广泛的基因组多倍化事件。在已经测序的植物基因组中研究发现其在进化过程中均受到多倍化的影响。理清植物基因组的结构和进化过程对于深入认识植物基因组的功能和相关生物学过程都具有十分重要的科学意义和潜在的经济价值。 准确判别基因组染色体同源片段是基因组研究工作的基础,也是整个研究工作中极为重要的一步。然而,由于基因组的复杂性,对基因组染色体同源片段的判别需要一定的时间和精力投入,尤其是现有的方法和软件不能快速、准确地判别基因组染色体同源片段,所以论文旨在结合已有的生物知识,总结归纳了现有对禾本科植物和棉花的基因组倍增事件的研究理论,将具体的生物实际问题转化为数学问题,建立数学模型,改进 Smith-Waterman动态规划算法,设计合理的算法,为判别多基因组染色体同源片段提供了理论基础;采用 C#语言编写程序,开发了一个灵活、通用性强、有与用户交互的界面的软件,以设计好的算法来量化每一个可能为同源片段的基因;在水稻(Oryza sativa)、高粱(Sorghum bicolor)、玉米(Zea mays)、二穗短柄草(Brachypodium)四种禾本科植物的基因组序列上,实际应用设计的算法和编写的程序,准确、有效地判断出2092-14227个基因组内(间)共线基因(表1),60-468个基因组内(间)同源基因区域(表2),并进一步以高粱基因组序列为参照进行了多重序列比对分析(图15);对棉花(Gossypium)的基因组序列进行了同源片段判别分析,依据结果建立了三种数学模型假设,并用计算机模拟验证,得出了棉花与可可基因组分化后,最为可能发生了五倍化事件的结论。 论文研究成果将有力支持今后的基因组研究工作,并为基因组染色体同源片段的判别提供方法和工具。