基于同源建模的蛋白质结构预测方法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wyfwin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
获取蛋白质的结构和功能是生物学研究的重要目的之一,但是使用X光晶体衍射和核磁共振技术等实验手段测定蛋白质的三维结构,以及使用生物化学方法研究蛋白质的功能时效率不高,已经无法适应蛋白质序列飞速增长的需要。在生物信息学中,通过利用结构已知的蛋白质家族成员(模板)预测新序列的结构可以建立序列与相应结构和功能之间的联系,从而用较低的成本和较短的时间预测出蛋白质的结构和功能。本文主要研究内容是给定一个蛋白质序列,通过采用同源建模的方法最终预测出该蛋白质的三级结构。这个过程包括以下几个部分:目标模板的识别、查询序列和目标序列的排列、构建模型和模型的结构合理性评估。其中的目标模板的识别是通过局部对比排列搜索工具BLAST完成的,构建模型是通过建模软件包MODELLER完成的,结构合理性评估是通过软件包PROCHECK来完成的。另外,在整个的蛋白质结构预测过程中,查询序列和目标序列的排列对于最终的建模影响最大,因此提高这个过程的排列精度,对整个的蛋白质结构预测过程都有很重要的作用。本文的研究重点是如何提高查询序列和目标序列的排列精度。目前对于预测一个新序列的蛋白质结构的各种方法中,大多存在这样的问题:在对一个新序列构建模型的过程中,生成的查询序列和目标序列的排列不够准确,进而影响了最终预测出来的蛋白质结构的准确性。鉴于此,这部分主要研究了以下三个方面的内容:在生成查询序列和目标序列的过程中所使用的profile-profile方法,针对profile-profile方法中profile中出现的数据稀疏问题所采用的数据平滑技术以及对于生成排列过程中对于新的计分体系所采用的动态规划算法。在HOMSTRAD数据库上进行的排列精度实验表明:采用profile-profile方法并结合数据平滑和动态规划技术可以有效的提高查询序列和目标序列的排列精度。最后,我们还参与了CASP7的蛋白质结构预测的评比,对获得的未知序列通过profile-profile方法生成的五个蛋白质结构进行结构合理性评估。
其他文献
作为一种分布式企业级应用系统的开发平台,J2EE以其多种使用方便的标准化组件式服务一度在业界倍受推崇。作为一个整体,J2EE无疑取得了巨大成功。但作为J2EE重要组成部分的EJB
随着分布式系统的不断发展,其规模和复杂度不断增大,为保障系统可靠性并减少开发成本,分布式系统的测试变得愈加重要。TTCN-3(测试及测试控制标记法)是ETSI开发的下一代测试描述
多Agent系统是当前人工智能研究的一个热点。其中,关于知识表示、动作推理、通信和协作是当前很多专家学者的研究焦点,虽然取得了很多成果,但仍存在不少问题,主要是基础理论研究
智能规划是当前人工智能的热点领域,具有突出的理论和应用价值。基于模型检测的规划方法是最近发展起来的新方法,它可以处理带有不确定性的规划问题,例如涉及可达性目标的、限于
软件行业的工业化趋势导致了软件构件的产生。能够像硬件系统那样,将部分软件组合起来构建软件系统,一直是软件行业多年来追求的目标。可以说,软件构件技术的出现是对传统软
张大千(款)《佛光普照》这件张大千《佛光普照》是某机构主办的宋元明清近代大家艺术研讨会专家所点评的精品之一(图1,纵130厘米,横59厘米)。对这件作品,研讨会的专家是这样
云计算由于其先进的理念、方便的使用方式,越来越受到各大厂商和用户的青睐。随着云计算的广泛使用,数据中心和集群的能耗问题越来越受到关注。服务器目前消耗的能源已经达到惊
软件复用作为解决软件危机的有效途径,越来越得到广泛的重视。随着面向对象技术和软件构件技术的应用,软件复用技术得到了迅猛的发展。基于构件的软件工程为应用软件的组织、
在即将过去的2006年里,北京动物园度过了百年华诞。北京动物园就像一位慈祥的母亲抚育着那些被她视若己出的珍禽异兽们,这其中不乏国宝级的大熊猫、世上稀有的白头叶猴等,但似乎唯有朱鹮最牵动她的心,而小朱鹮们的茁壮成长也让她感到欣慰和自豪。可又有多少人知道动物园母亲在朱鹮成长的历程中付出的艰辛呢?    发现最后7只朱鹮    朱鹮素有“东方宝石”之美誉,由于其形态和白鹭相似,因而又有朱鹭之称。在《走进
量子信息科学是物理科学与信息科学相互融合而产生的新兴交叉学科,它把量子力学的基本原理应用于计算、通信和密码学等领域,形成量子计算、量子通信和量子密码学三个分支。量