基于粒度下的蛋白质序列的分析

来源 :江南大学 | 被引量 : 0次 | 上传用户:wuchaoli87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质空间结构的所有信息均隐藏在蛋白质的线性结构里面,确切的说,均隐藏在氨基酸序列里面.于是研究蛋白质序列就成了生物信息学研究领域的一个关键问题.目前已经发现的构成蛋白质分子链上的氨基酸类型有20多种,直接研究蛋白质分子的折叠问题有困难,用分类法研究蛋白质结构,已有多种尝试,三联子串(氨基酸)依据其物理和化学特征,或者是依据氨基酸的空间结构特征来进行的不同的分类方式,分类的依据和偏重不同,分类结果也不同.而这些分类事实上是一种状态合并的问题,即将具有一定关联的对象合并到一个类中,不同的分类对应着不同的粒度划分.在实际问题求解中,粒度划分是动态的,常用的氨基酸分类方法都是静态的.   本文在粒度观点之下,结合Markov模型和已有氨基酸分类,对氨基酸连接偏好性及蛋白质分类进行了一系列分析、研究.   首先本文在Markov模型的基础上,提出了状态空间上合并映射的概念,以及合并过程下转移概率的计算方法.在已有氨基酸分类的基础上,结合Markov模型的概率转移矩阵,对氨基酸连接的偏好性进行了研究.结果表明:同一家族的蛋白质序列的氨基酸连接具有一定的偏好性,这种偏好性与氨基酸的分类有关,从而进一步说明了分类的合理性,同时这种偏好性对氨基酸序列的预测具有一定的作用;   其次木聚糖酶家族蛋白质序列的氨基酸连接偏好性的研究表明:对于该家族的蛋白质序列而言,将氨基酸分成四类来研究更能反映其规律.本文基于经典HP模型(即分四类的情况),提出了一种新的蛋白质序列的比对方法,即蛋白质序列的矩阵图谱表达法(MGR),并给出了两蛋白质序列之间的欧氏距离计算的方法.通过对木聚糖酶F/10和G/11两家族的蛋白质序列的相似性分析、研究表明:被划分为同一木聚糖酶家族的蛋白质序列之间的相似性更大,而且蛋白质序列的相似性程度与分子大小、结构和分子进化相关;   最后基于距离结构聚类的算法对F/10和G/11两个家族的蛋白质序列进行了聚类分析,并确定了最佳的聚类方法.对F/10家族而言,分成三类的时候是最优的,对于G/11家族而言,分成五类是最优的.这为同一家族的蛋白质进行进一步分类分析提供了定量的依据.   本文在如下方面具有创新特色:   (1)提出了Markov模型状态空间上合并映射的概念,以及合并过程下转移概率的计算方法,对氨基酸连接的偏好性进行了研究.为蛋白质序列预测提供了依据.   (2)提出了一种新的蛋白质序列的比对方法,即蛋白质序列的矩阵图谱表达法(MGR),并给出了两蛋白质序列之间的欧氏距离计算方法.同时对F/10和G/11两个家族的蛋白质序列进行了聚类分析.
其他文献
紧空间是拓扑空间中最重要的空间类之一,紧空间具有很好的性质,因此人们希望所讨论的空间是紧空间或者是紧空间的子空间,由此出现了紧化与紧化剩余的概念.1958年,M.Henriksen
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
随着网络技术和数字图书馆的迅猛发展,文本分类已成为处理和组织大量文档数据的关键技术。文本分类方法主要包括两大类:非监督的自动聚类算法和监督的文本分类方法。同时,随
本文主要讨论了高阶非线性具有偏差变元的微分积分方程解的有界性。根据内容本论文分为以下三章:  第一章.主要介绍了问题研究的历史背景和该领域的研究现状。  第二章.在
去年1月,广东省第九届人大主任张帼英在省第十届人大会议换届选举时卸任,退出了她为之奋斗了半个世纪的政治舞台。依然健康、热情、干练的张帼英前不久向记者忆述了自己如何
广义逆理论是矩阵理论的重要组成部分,对于交换环上矩阵的广义逆的研究,已有丰硕的成果,一般域、除环、主理想环上矩阵广义逆的探讨也有不同程度的进展,但在一般非交换环上矩
学位
学位
合作学习是新课程所倡导的新的学习方式之一,它是指学生在小组或团队中为了完成共同的任务,有明确的责任分工的互助性学习。它既有助于培养学生合作的精神、团队的意识和集体
本文将求解鞍点问题的AOR法及四个参数的GAOR法推广到广义鞍点问题的情形,给出了相应的收敛性分析,数值实例验证了新方法的有效性.   第一章简单介绍了鞍点问题的发展及背