基于框架库的蛋白质局部结构预测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yu830329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质在生物体内执行着各项重要任务,蛋白质功能取决于蛋白质的空间结构。而蛋白质结构取决于蛋白质的序列,蛋白质序列与蛋白质结构存在着一定的对应关系。如何根据蛋白质的序列信息来预测蛋白质的结构是目前生物信息学亟待解决的问题,也是本文研究的重点。通常有以下几种方法来预测蛋白质的结构:如果待测序列和已知序列有很大的相似性,同源建模(Homology Modeling)是最好的方法;如果相似性不高,可采用线索化方法(Threading)。在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,只能采用从头预测方法(AB Initio),即直接根据序列本身来预测其结构。基于框架库(Fragment Database)的蛋白质结构预测方法属于从头预测方法的一种。在CASP6(the Sixth Critical Assessment in Structure Prediction)评测中的典型用法是将这种方法和同源建模方法结合起来使用:在排列区域坐标取自模板,在无排列区域使用该方法进行模拟。以前的方法,虽然可以用很少的框架获得满意的拟合结果,但是问题在于:局部最优的结构对应的不一定是全局最优的。本文尝试找出全局最优框架序列。这些框架具有确定的空间结构并在序列上具有相当大的保守性。本文提出了一种基于框架库的蛋白质结构预测的新方法,旨在根据少量的信息尽可能准确的预测出蛋白质的结构。首先根据空间信息,把已知结构的蛋白质切分成框架,进行聚类,得到框架库。这里的框架是构成蛋白质三维结构的小的联系单元,它从新的层次上解析了蛋白质的空间结构。然后根据序列信息和局部匹配算法,将目标蛋白质切分成片段,并给每个片段赋予特定框架的结构,最后利用图论中的最短路径算法找到和目标蛋白质最匹配的框架序列。预测步骤的输入是框架库,输出是和目标序列匹配的框架序列。该方法将已知结构的蛋白质切分成更小的单元,比起传统的切分方法,能更准确的表示蛋白质的结构;图论方法的采用,降低了计算的复杂度。
其他文献
通信技术和计算机技术的迅猛发展使网络中的故障呈现复杂化、多样化,而传统的诊断方法和现有的智能诊断技术通常只能诊断出单一的故障类型和设备,已不能满足目前网络的需求。
移动学习是近年来随着网络技术、无线通信技术、移动计算技术和多媒体技术等的迅速发展及融合而悄然兴起的一种新型的学习技术与方式。结合移动学习技术,构建移动英语学习平
SEU是由带电粒子投射到集成电路器件的敏感区域引起的,通常会导致器件内部寄存器内容的改变,或内存位翻转。为了抵抗太空中的SEU,使基于FPGA的多光谱图像压缩系统在深空环境
网络教学正在以前所未有的速度和深度在教育领域全面推开,网络教学的推行需要大量的教学资源,教学资源中最重要的组成部分就是教学课件,各种格式的教学课件都需要各种相关软件的
无线传感器网络是一种新型的信息采集网络,通常由分布在一个探测区域内的大量传感器节点组成,这些节点自组织形成网络,获取该区域中的有用信息并将这些信息传输给网络的基站
随着信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的研究。指代消解是自然语言理解中的重点和难点之一。它一方面综合了多种自然语言处理技术,如词性标注
惰性学习不同于传统的急性学习,它具有训练代价少、假说空间丰富、渐进学习能力强、能进行增量学习等优点,因而被广泛应用于数据挖掘和网络信息处理等领域。然而由于惰性学习
随着Internet的迅速增加,查找信息成为问题。搜索引擎的出现在一定程度上解决了找信息难的问题。但由于网络信息增长太快,检索返回的结果太多,查询的歧义性问题,使得用户在返回的
面向服务的体系结构作为软件集成、系统开发技术领域进步的一个里程碑,近年来凭借其自治、开放以及平台无关等特性,得到了越来越多的关注与应用。服务是构造面向服务系统的基
密码协议是以密码学为基础以达到密钥分配与身份认证等目的的一种消息交换协议,是实现计算机网络系统安全的关键,在投入使用之前应该保证它是没有缺陷的。然而大量的事实表明,许