新型表示模式下的DNA序列和RNA二级结构分析方法研究

来源 :湖南大学 | 被引量 : 2次 | 上传用户:liqiang20010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的开展,以及对各种序列、结构和功能的研究,产生了庞大的生物数据。对这些生物数据进行科学的分析、处理推动了生物信息学的发展。序列和结构的相似性分析是生物信息学的基础,通过相似性分析获得的大量的序列或结构信息可以用来推断基因的结构、功能和进化关系,因此生物序列或结构分析研究已成为生物信息学领域中一个非常重要的研究课题。序列和结构的分析主要包括相似性分析、突变分析、进化分析和功能分析。而突变分析、进化分析和功能分析都是以序列和结构的相似性分析为基础的,因此本文将基于DNA序列和RNA二级结构的新型表达模式给出DNA序列和RNA二级结构的相似性分析方法,进而给出点突变分析和进化树构建方法。   论文在综述了序列和结构分析方法的研究现状的基础上,对基于双核苷酸和编码序列的图形表示方法,RNA二级结构的编码方式,基于RNA二级结构编码序列的点突变分析和结构比对方法,基于序列图形表示的相似性分析方法和系统进化树构建方法进行了系统的研究,本文取得的研究成果主要有:   1.提出了一种基于核苷酸二联体理化性质的DNA序列的3D图形表示,并给出基于图形表示的序列相似性分析方法。碱基之间的相互作用对序列所决定的结构和功能起着非常重要的作用。为了提供一种简单直接地展示序列信息的方法,本课题在分析了DNA序列的相邻双重核苷的性质的基础上,给出了一种DNA序列的3D曲线族表示方法,并基于几何中心所构建的协方差矩阵,给出了序列间非相似性的一种度量方式。实验结果表明,该方法能准确地度量序列间的相似性。准确的相似距离矩阵的计算将有助于推断物种之间的亲缘关系,有助于找出各种物种之间特别是人类与其他物种之间的联系。并且以某种生物为研究对象来研究人类的各种生理生化机理。   2.提出了一种基于编码方式的序列比较方法和序列相似性分析方法。根据DNA序列的编码规则,本课题给出了解决序列比较中四个基本问题的方法,同时,基于编码序列给出了一种DNA序列的3D表示,并进行序列相似性分析。序列编码方式简单直接地展示了序列信息,有助于更好地实现突变分析可视化,从而推断疾病发生的机理。序列的编码方式也为序列比较提供了一种很好的数学模型,易于发现序列间的相似性和差异性,便于基因的检测和基因功能区的预测。   3.提出了一种RNA二级结构的编码方法,给出了基于编码序列和异或操作的点突变分析和结构比对方法。针对现有的RNA二级结构预测和功能预测算法因多序列比对而具有鲁棒性和结构数不敏感等问题,针对RNA二级结构表示法中主要的高复杂性和退化问题,本文分别给出了RNA二级结构一种简单和扩展的编码方式。该方式能很好地区分自由基和基对,能区分含假结在内的不同结构类。同时,基于简单的三位编码方式,给出了RNA二级结构比较方法和点突变分析方法。基于扩展的编码方式,给出了一种新型的结构比对方法,并通过实验验证了该方法的有效性。   4.分别提出了一种基于模糊聚类的进化树构建算法和基于最小生成树算法的进化树构建算法。本文分别以已获得的相似性和非相似性矩阵为研究基础,给出了基于模糊聚类的进化树构建算法。该方法用相似性矩阵替代了距离矩阵,并在系统进化树的构建过程中相似矩阵不需要重新调整。很好地体现了物种之间的关系,并降低了时间复杂度。同时,给出了一种基于完全图的最小生成树算法并应用于进化树的构建,也取得了较好的效果。
其他文献
涡轮冷却叶片设计是未来发动机设计的重要环节,涉及大量复杂的数据模型。由于缺乏有效的管理与运用手段,依赖传统的设计建模方法,数据可重用性和一致性差,系统建模效率低且严
随着互联网的飞速发展,网络测量的重要性日益突出。网络测量可以精确地捕捉互联网行为的测量数据,包括延迟、丢包率、带宽、吞吐量、瓶颈、服务器和网络设备的响应时间等。网络
学位
基于人工免疫的入侵检测系统中,不管是基于什么免疫原理的入侵检测系统,检测器都是其核心部件,检测器的生成速度和在非我空间的分布状况直接影响着系统的性能。目前基于人工免疫
无线Mesh网络(WMN)是一种新型的宽带无线网络系统,也是一种大容量、高速率的分布式网络。与传统网络不同的是,WMN具有可靠性、自组织性和自愈性等特点。这种无线网状网不仅可以
Internet技术和Web服务的迅猛发展,导致网络拥塞和服务器负载过大成为用户面临的两大问题。在网络中设置缓存,以空间换取时间己成为降低用户感知延时的主流方法之一。En-route
随着信息处理、计算机、机器人等技术的发展,出现了一大批复杂的人造动态系统,这类系统不同于连续变量系统,它自身带有异步与并发特性,称之为离散事件动态系统。这类系统的特
随着Internet的迅猛发展,XML已成为数据表达和数据交换的主要标准。XML数据库因此成为研究的热点。XML数据查询是XML数据库的基本功能之一,而对XML文档建立索引是提高查询效率
人体姿态估计在各个领域中都有很大的作用,相比较手势识别,更方便的是个人的一些工作。本文主要的研究就在单幅静态图像上的人体姿态估计以及在深度图像上进行的手势识别,论
无线传感器网络需要保证复杂环境下数据处理的大规模性以及实时性,安全对于很多传感器网络的应用是至关重要的,比如军事目标追踪,安全监测等等,安全问题已成为阻碍WSN迈向实际应
在大数据的时代背景下,人们被淹没在信息之中,却得不到更多有用的知识。数据挖掘技术由此应运而生。近年来,关联规则挖掘研究已经成为数据挖掘中的一个热门问题,并被广泛应用