基因识别算法研究与基因组进化分析

来源 :湘潭大学 | 被引量 : 7次 | 上传用户:liyinhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的完成和后基因组时代的到来,生物序列数据呈指数级增长,分析处理大批量数据,从中提取对人类有价值的信息,成为了生物信息学研究的首要任务。我们的工作主要为两个方面:一是区分原核生物完全基因组DNA序列中的编码区与非编码区及人类完全基因组中的基因区与非基因区;二是利用脊椎动物线粒体完全基因组DNA 序列与蛋白质序列、多瘤病毒完全基因组DNA序列与蛋白质序列分析物种之间的系统发育关系。   本博士论文由四章组成。第一章绪论,主要介绍了生物信息学的概念与研究内容及研究意义、生物信息数据的组成、常用的生物信息处理的数学方法、基因识别算法的概念与当前已有的算法和软件、物种系统发育分析的现状和已有的算法与软件。   第二章是关于完全基因组中编码区与非编码区的区分问题,主要综合运用分形、统计、信息等理论和方法,建立处理DNA 序列数据的数学模型,应用已有的算法和我们提出的算法分析处理原核生物完全基因组DNA序列和人类完全基因组DNA 序列,实现编码区与非编码区、基因区与非基因区的区分。目的在于分析这些基因识别方法的稳定性与高准确率,以期为探索新的未知基因提供新方法、新思想。在原核生物完全基因组的编码区与非编码区的区分中,通过应用了分形方法与Fourier 变换方法,获得了较高的区分准确率。在分形方法中,平均区分准确率达78.41%,而Fourier 变换方法的区分准确率达到了86.58%。在人类完全基因组的基因区与非基因区的区分中,通过综合应用重分形分析、正四面体、Z 曲线和全局描述四种方法,尽管人类完全基因组内部结构非常复杂,仍然获得了高达83.74%的区分准确率。   论文的第三章主要介绍系统发育分析的数学模型和方法。第四章应用这些方法去分析处理DNA 序列、蛋白质序列等数据集(包括64 种脊椎动物线粒体完全基因组序列和70 种细菌完全基因组序列),构建物种间的系统发育树,分析各物种间的亲缘与进化关系。在64 种脊椎动物线粒体完全基因组和70 种多瘤病毒完全基因组的系统发育分析中,我们获得了与传统系统发育树一致的树,综合以前我们的工作发现,我们在系统发育分析研究中提出的方法和模型是可靠的、稳定的,对分析物种间的亲缘与进化关系是非常有意义的。
其他文献
报道了活体微生物、微生物代谢产物、疫苗等微生物制剂在淡水养殖中的应用 ,从水质调节、疾病防治 ,作为饲料和饲料添加剂等几个方面探讨了微生物制剂在淡水养殖中的应用前景
大数据时代,数据的价值越来越被重视,数据挖掘作为发现数据价值的工具也被广泛的应用。通过数据挖掘发现数据中所蕴含的价值成为各行各业的重要生产力。本文就是通过数据挖掘
本文提出一种关于退货的供应链超网络模型,它是一个由m个生产商、n个分销商、0个需求市场组成的多层次非线性供应链模型。该模型中,假定制造商投资生产具有同等价值或功能的产
智慧实训智能化管理系统旨在使实训管理智能化,提高实训基地设备使用率,有效缓解学校实训设备有限、师生比限制压力,节约人力物力,提高实训管理智能化.本文从开发的目的、系
信息技术学科与其他学科相比,信息技术课程作为一门新兴学科,缺少现成的教学经验,拓展性开发成为这一新课程不断发展的方向之一。教材的编写虽然年年都有所改进,但总跳不出线性方
本文主要应用有限维KAM理论证明了一类拟周期系数的Lotka-Volterra模型存在正拟周期解,以及应用无穷维KAM理论证明了高维Ginzburg-Landau方程和一维带有非线性项|u|2pu的Ginz
本文从以下几个方面讨论: 1.简述变分不等式理论的历史背景和研究现状. 2.介绍和研究了一类新的随机向量F—隐相补问题和随机向量F—隐变分不等式问题,并且在Banach空间中的
改革开放以来,我国的经济得到了快速的发展,同时我国在各方面的教育也取得了巨大的成就,教育与经济的发展总是相互促进,此起彼长。协调发展的教育有效促进经济增长,教育源源不断地
利率问题一直是金融领域研究的一个焦点问题。本文在吸收前人研究成果的基础之上,借鉴了前人的方法,利用随机分析的知识,在HJM模型中加入了更为一般的跳跃,将HJM模型做了进一
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊