生物序列的相似性分析及种系发生树的构建

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:hulei_1188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类和一些模式生物基因组计划的相继完成和全面实施,产生了大量的生物序列数据。对这些数据的保存、处理、分析和研究推动了分子生物学、数学以及计算机科学的结合,由此发展起来的计算分子生物学也逐渐成为自然科学中异常活跃的一个研究领域。计算分子生物学的研究内容非常丰富,本文在其两个重要的课题生物序列的相似性分析和种系发生树的构建方面进行了研究,主要成果有: 在序列与结构的比较分析方面:(1)给出了一种分析DNA序列相似性的方法,该方法基于两序列间的差别度量,不需要进行序列比对。为了说明差别度量的合理性,对两组数据进行了相似性分析。(2)提出了一种RNA二级结构的图形表示方法。该方法基于CGR及构成RNA的四种碱基的化学性质分类。进一步地,从图形表示中提取数值特征分析了16个RNA二级结构的相似性。(3)提出用偏序集刻画蛋白质序列,偏序关系基于氨基酸的解离常数及氨基酸在序列中出现的位置。从蛋白质序列的广义哈斯矩阵表示中提取数值特征比较了9个神经基因的蛋白质序列。(4)提出了一种分析蛋白质二级结构相似性的方法,并将其应用到一组蛋白质数据来进行蛋白质结构分类,为蛋白质结构类的划分提供了一种辅助性方法。 在进化树构建方面:(1)基于序列间的差别度量给出了两种序列间的距离度量,选取10个物种的β-globin基因序列、20个物种的线粒体基因组编码的全部13条蛋白质序列为数据,构建的系统进化树与传统的根据物种形态和其他方法得到的进化树完全一致;并且基于氨基酸的物化性质对蛋白质序列进行了重新描述,进而将其运用到基于蛋白质序列的进化分析中。(2)根据构成RNA二级结构的碱基的化学性质以及区别自由基和基对,将一个RNA二级结构编码成一条(0,1)序列。采用Lemple-Ziv压缩算法进行进化分析,构建了两组RNA二级结构的进化树。
其他文献
本文研究了几类变换半群的正则性及格林关系,共分三章,各章内容如下: 第一章主要研究了非空有限全序集X上的保E-O部分变换半群PEOPx的正则性、格林关系、正则元的格林关系,并
解决吉林省煤炭经济总量不足、结构不优、效益不佳、质量不高的问题,必须加快转变经济发展方式,推动吉林省煤炭工业由主要依靠资源开采和初加工向资源深度开发、深度加工转变
近年来,特征列方法被成功地用于机器证明、力学、理论物理等跨学科研究以及机器人、机构学、计算机视觉、CAD等高科技领域。Lie对称法的研究在包括现代数学,物理和力学在内的众
地方官员对当地经济增长目标进行调整存在一定的策略性,近年来我国的经济一直处于结构调整过程中,不同地区的经济增长呈现出不同的变化,东部的经济增长已经逐渐呈现出放缓的
随着我国经济、政治的发展,政府的反腐力度日渐加大,但反腐问题仍是政府和公众关注并急需解决的难题。“反腐难”的原因是多方面的。本文从博弈论和机会主义行为的角度探讨中
针对高职会展专业实践教学相关问题,坚持以就业能力提升为导向,通过校企深度合作,开发生产性实训项目,构建有利于生产性实践实施的人才培养体系,根据生产性实践要求,改革实践教学方
随着生物技术的发展,人们获得了大量的基因组数据并用以了解基因组的机制。越来越多的基因组被测序,分子生物学已进入了所谓的后基因组时代。现在我们能够直接探索基因组的一些
本文主要对互联网+的定义、目前我国互联网+的现状以及互联网+对我国经济的作用进行了分析,主要从互联网+农业、工业、服务业的角度进行入手介绍,同时对互联网+的显著特征进
大数据与云计算、互联网和人工智能是当前科技发展主流,本文论述了未来这三大科技为教育行业提供的支持。
2017年3月15日,《中华人民共和国民法总则》获十二届全国人大五次会议表决通过,自2017年10月1日起施行。中国民事法律制度从此开启“民法典时代”。这次的《民法总则》对原来