蛋白质残基接触预测算法研究及其在三级结构预测上的应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:cyt200388
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生物体的重要组成成分,行使催化、免疫、细胞信号传导等重要的生物学功能。蛋白质是以氨基酸为单元,脱水后由肽键连接而成的长链。蛋白质只有在折叠成特定的结构构象之后才能行使其功能,因此认识蛋白质结构对于认识蛋白质功能具有重要意义。  经典的蛋白质结构实验测定方法有X-晶体衍射、核磁共振、冷冻电镜等。这些实验方法可以获得高解析精度的蛋白质结构,然而实验测定方法一般来讲速度较慢、费用较高,并且存在着一些限制。由于蛋白质结构测定的速度远远落后于蛋白质序列测定的速度,因此使用计算技术由一维的蛋白质序列来预测三维的蛋白质结构具有重要意义。  驱动蛋白质序列形成特定空间结构的主要因素是残基之间的大量非共价相互作用,包括疏水作用、范德华力、离子键以及氢键等。从具有相互作用的残基间序列距离来看,上述相互作用可以分作近程相互作用和远程相互作用两类,其中近程相互作用主导蛋白质形成局部结构,而远程相互作用促使残基间形成空间距离较近的接触。残基接触具有决定整体结构框架的重要作用。因此,对残基接触的预测将有助于对蛋白质空间结构的预测,进而有助于对蛋白质生物学功能的了解。  本文着重讨论残基接触预测问题以及其在蛋白质三级结构预测上的应用,取得了如下成果:  (1)提出预测蛋白质残基接触的低秩稀疏矩阵分解算法。同源序列中通常包含由进化造成的较强的背景噪声。具体来说,如果一个位点突变发生在进化早期,其后代都将延续这个突变,从而导致过高地估计了此位点和其他位点之间的共变性。本文提出了低秩稀疏矩阵分解方法去除残基接触预测中的背景噪声。本文假设代表真实接触的共变信号是稀疏的,而背景噪声是低秩的,并用低秩稀疏矩阵分解算法将相关性矩阵分解成稀疏矩阵和低秩矩阵两部分。实验结果表明,由于去掉了背景噪声,本文的方法显著提高了残基接触的预测准确度,并且优于其它的去背景噪音方法。基于该方法,作者实现了蛋白质残基接触预测软件COLORS。  (2)提出预测蛋白质残基接触的复合似然最大化算法。马尔科夫随机场模型能够比较准确地描述蛋白质所有位点的全概率分布,是目前预测残基接触最有效的无监督学习模型。由于准确计算其配分函数是不可行的,一般采用近似算法估计其模型参数。本文提出复合似然最大化算法估计马尔科夫随机场模型的参数。实验结果表明,本文方法的预测准确度优于其他经典的参数估计算法,例如置信传播算法,伪似然最大化算法和平均场近似算法等。基于该方法,作者实现了蛋白质残基接触预测软件clmDCA。  (3)提出预测蛋白质三级结构的树形条件随机场模型。本文将残基接触信息应用到蛋白质三级结构预测。在归范法中,目标序列—模板结构联配准确度是预测蛋白质三级结构的关键。残基接触信息有助于指导目标序列—模板结构联配。但是,当考虑所有的残基接触时,求解最优联配是NP难的。本文只选择比较关键的残基接触,将残基接触图简化成嵌套图,并提出树形随机场模型对联配进行建模。由于嵌套图的特殊结构,最优联配可以在多项式时间内求解。实验结果表明,和经典的三级结构预测软件HHpred相比,本文的方法可以预测出质量更好的蛋白质三级结构。基于该模型,作者实现了蛋白质三级结构预测软件TreeThreader,并将TreeThreader整合到高通量蛋白质三级结构预测平台FALCON@home上,为生物研究领域提供蛋白质三级结构预测服务。
其他文献
目前,随着我国经济的快速发展,各类危及国家和人民群众生命财产安全的突发性事故时有发生。高度重视和切实抓好安全生产工作,是最广大人民根本利益的必然要求,也是构建社会主义和
近年来,移动通信网络迅猛发展,网络优化的作用也变得越发重要。随着信息科技的快速发展,用来帮助网络优化工程师进行网络性能评估和故障分析的网络优化系统软件孕育而生。但
应急救援模拟演练系统是在虚拟空间中仿真各种事故的发生、发展的过程,以及人们在事故环境中可能做出的各种反应。  研究室设计和研发的应急救援模拟演练系统,是为了解决沈阳
视频监控系统是一种综合性的安防监控系统。视频监控系统,监控直观,蕴含信息丰富,因此被广泛应用于银行,超市,交通系统等诸多场合。随着我国城市化建设工作的不断推进,居民生活水平
近些年来无线传感器网络的发展,促进了物联网概念的提出。物联网能够依靠传感器、RFID、红外等技术,拓展人们的感知范围,让人们的生活、工作更加便利和智能化。煤矿生产有其自身
随着大数据时代的来临,传统数据中心逐渐服务越来越多样性的业务,如高性能应用、大数据应用及互联网应用等等。面对多样性应用的具有巨大差异的通信需求,传统数据中心在单一的网
在当今信息技术迅猛发展的社会,网络构成了信息流通的主要媒介,相关技术日新月异,网络管理系统作为网络中的重要元素也倍受人们关注。尤其是近年来IPv4到IPv6过渡,整个网络环
手语虚拟人动画是人体动画合成研究的一个分支。由于手语的语言特性,人们不仅希望合成真实的人体运动,而且要求生成动画能够正确传递语义信息。手语是一种视觉语言,最突出的特点
存档管理器是基于三维游戏引擎模拟演练系统中的一部分,它负责在模拟演练过程中记录演练场景中的数据,在演练结束后进行场景回放和向用户展示日志信息。设计并实现存档管理器的
数控编程技术是数控加工准备阶段的重要内容之一,是直接影响加工零件精度与加工效率的重要因素。伴随着航空、航天工业的不断发展,飞机结构件、发动机等部件具有多种数控加工特