多算法协同的西瓜MADs-box基因家族全基因组分析

来源 :安徽农业大学 | 被引量 : 0次 | 上传用户:crosslightning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物数据的增长,利用计算机处理,分析和存储浩如烟海的生物数据已经成为一种趋势,从原始的序列分析逐渐发展到包含基因组学,基因表达研究学、和结构生物学的科学。MADS-box基因是真核生物中一类重要的转录调控因子,参与植物花器官的发育和开花时间的调节,在植物的生长发育中扮演重要角色。目前,拟南芥,水稻,毛果杨等植物关于MADS-box基因的研究已经发表,而西瓜中只有部分克隆的MADS-box基因的研究,在全基因组层次的研究至今没有。并且西瓜的种植面积和产量居高,是世界最受欢迎的新鲜水果之一,具有重要的经济价值。因此,展开西瓜MADS-box基因的研究是非常有意义的。  植物中MADS-box基因的预测,验证,分类和进化关系研究需要多种算法参与,本课题通过多算法协同(马尔可夫模型,多序列渐进比对算法,邻近法,泊松模型)研究MADS-box基因,包括:基因的预测,验证,分类;探索不同类别MADS-box基因在结构,位置和表达模式上的差异。本文的主要内容如下:  (1)以西瓜基因组数据为材料,通过多算法协同鉴定出39个非冗余MADS-box基因,通过系统进化分析将其分为Ⅰ类(11个)和Ⅱ类(28个)。同时,根据分类信息研究不同类别的MADS-box基因在结构,保守基序,染色体定位的异同,以及在不同组织的表达情况,Ka/Ks计算和分化时间估计上的探索。结果显示Ⅰ类和Ⅱ类MADS-box基因均包含一个保守功能基序但在基因数目,结构和染色体分布上也均有差异。Ⅰ类基因数目较少,结构相对简单,零星分布在几条染色体;Ⅱ类基因数目较多,结构相对复杂,几乎遍布整个染色体组。  (2)参考西瓜全基因组MADS-box基因分析思路,基于多算法协同设计一套MADS-box基因家族分析流程,适用于其他植物在全基因组层次MADS-box基因家族分析。包括分析流程的设计原则和架构;流程的需求(参考物种的选择,数据的收集,分析软件和算法的确定)以及分析流程输入输出的详细界面介绍等。  本研究旨在通过多算法协同研究西瓜基因组MADS-box基因,确定MADS-box基因家族的数目、分类和进化关系;位置信息、基因结构和保守基序等。参考西瓜MADS-box基因家族的分析思路,设计一套适合其他植物在全基因组层次MADS-box基因家族分析的流程,为研究植物MADS-box基因提供了一个行之有效的方法,有利于探索不同物种MADS-box基因的异同和进化关系的研究。
其他文献
随着科学技术的发展以及信息化的推进,计算机的应用领域越来越广阔,尤其是软件的发展使得软件产品成为各行各业不可或缺的工具。然而,随着软件功能的提高,软件的复杂性也随之
计算机网络的出现极大方便了人们之间信息的传输与获取,但也造成了数字化作品版权失控的问题。数字水印技术的产生,为多媒体数据版权保护、内容认证及操作跟踪的研究开拓了新
文本特征提取是从文本信息中抽取能够代表此类或某文本的信息。特征提取方法研究的目的是过滤数据噪音特征、选择最优的特征子集来优化文本的表示,实现文本数据降维并提高降
传统的分类问题中,一个实例只和一个类标号相关联,但是多类标号分类问题中,一个实例可以和多个类标号相关联,所以,与单类标号分类问题的任务不同,多类标号分类的任务是为一个
随着网络和多媒体技术的迅速普及和发展,越来越多的用户使用多媒体设备和网络获得并查询图像。因此图像检索已经成为一个研究的热点。现有的图像检索技术主要是基于文本查询
网络信息含量的爆炸和过载给人们带来了Web时代的新挑战,网页分类是组织和利用海量互联网信息的一种有效途径。在已出现的多种网页自动分类算法中,支持向量机(SVM)学习能力出
社会发展带来物资与人员的流动。作为经济流动与发展的基础之一,物流行业在近年来得到了巨大的发展与进步,同时物流的成本也受到越来越多的重视。在运输环节,解决车辆路由问
古琴,是中华民族传统文化的瑰宝,更是世界人类文明的重要文化遗产。当前,随着信息科学与技术应用领域的不断深入,各学科领域的信息化、数字化工作正以前所未有之势开展,计算
人体运动捕捉是计算机视觉领域倍受关注的一个研究热点,在智能视频监控、视频分析、动画、游戏、医学诊断和人机交互等领域均有广阔的应用前景。它包括人体的标定与跟踪和人
检测技术及设备在工业、农业等领域应用非常广泛。面对高性能、便捷性等市场需求,系统架构是检测设备成败的关键因素。传统的检测平台或终端多采用以单片机或简易嵌入式微处理