蛋白质三维结构的四元数建模与分析

来源 :燕山大学 | 被引量 : 0次 | 上传用户:zhouxiaorong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪以来,蛋白质结构建模的课题成为了热点研究范畴,该课题丰富并发展了蛋白质结构分析理论,解释了蛋白质功能与结构之间的关联,对蛋白质空间三维结构预测等方面有着重要的现实意义与研究前景。传统方法中,常使用矩阵作为蛋白质结构分析与相似性比较的数学手段,例如距离矩阵、旋转矩阵等,但是由于矩阵包含元素个数多,因此计算过程复杂。针对蛋白质结构建模传统方法中普遍存在的计算复杂度高、几何意义不明确的问题,本文采用四元数作为数学手段,就蛋白质α螺旋检测与蛋白质空间结构比对这两方面内容提出了2种新方法。根据α螺旋几何特点,本文利用四元数替代旋转矩阵,来描述蛋白质分子中相邻Cα坐标系间的相对旋转,提出了一种蛋白质α螺旋检测的四元数新方法。基于PDBselect数据库应用本文方法进行验证,对α螺旋检测精度达到91.7%。该方法具有检测精度高、计算复杂度低和几何意义明确的显著优点。传统的蛋白质空间结构比对方法通常通过距离矩阵的最优化来对蛋白质骨架结构进行配准,这样当蛋白质分子较大时所需的操作时间长且计算复杂。本文通过将蛋白质的空间坐标数据转换为包含大量蛋白质骨架结构几何信息的对称正定矩阵序列,并通过四元数求取两蛋白质的对称正定矩阵序列间的距离,即为四元数黎曼度量,取之作为蛋白质结构相似度的衡量指标。利用四元数取代距离矩阵,因为四元数只包含四个参数,保存全部几何信息的同时大大降低了计算复杂度。本文方法利用4组实验数据从不同算法之间,不同层次的蛋白质结构数据之间,实验常用数据集和典型数据集这4个不同的角度,在大量蛋白质PDB数据上验证了本文方法的有效性与可行性,其中对HOMSTRAD中的700个蛋白质双结构实例计算结果的平均匹配精度达到了89%。结果表明本文方法不仅有效地降低了计算复杂度,还具有很好的统计特性和匹配精度。四元数作为一种数学手段,用于蛋白质α螺旋检测和空间结构比对方面,不仅具有操作简单、计算速度快的优点,而且与传统方法相比有很高的检测精度与匹配精度。通过实验验证,蛋白质三维结构的四元数建模方法有着显著的优越性。
其他文献
本文给出一类三维Caputo分数阶混沌系统,并研究其渐近稳定性。首先,在控制不同状态变量时,利用滑模控制设计控制律得到了分数阶混沌系统渐近稳定的条件,并且,利用Lyapunov稳
本文为一篇高校汉英新闻编译实践报告,所描述的任务为作者参与的天津大学的网页新闻汉英编译实践工作。报告选取了编译实践中的多则新闻文本作为案例分析对象,探讨了德国著名翻译理论家诺德的功能+忠诚翻译原则对于高校汉英新闻编译活动的指导意义。报告介绍了作者在编译实践中所遇到的诸多难题,并详述了作者如何在功能+忠诚原则的指导下,采用多种行之有效的方法,以提高译文的可接受性,最终实现译文的既定功能。译文的可接受
为量化估算陕西省植被碳汇,评估陕西省碳收支状况及对各自然、人文要素的响应。本研究基于CASA(Carnegie Ames Stanford Approach)模型,估算了陕西省2003~2012年逐月植被净初
首先利用1979~2002年ERA-40、ERA interim. JRA-25和NCEP-DOE AMIP-Ⅱ(NCEP-2)再分析资料,采用向量场的自然正交展开、相关分析等方法,对比分析了不同资料所揭示的东亚夏季风
利用1979-2011年的NCEP再分析月平均资料、CMAP月平均降水资料和中国160站降水资料,采用小波分析、EOF分析、合成分析和回归分析等方法,研究了印度尼西亚地区的气候变动特征
热带云团是台风生成的前兆,虽然一些研究将近20年来台风不活跃与大尺度环境场相联系,但是还没有人分析台风不活跃期热带云团的活动特点。本文利用目前仅有的1989-2009年全球
学位
飞沫颗粒两相流在自然界和现代流体机械中普遍存在,研究其运动规律和其在湍流流场中的作用有助于更好地理解和解释自然界和工程界的很多相关现象,并在实践中加以利用,改进和
为了更好模拟预估降水,本文提出一种对标准化时间序列加权集成的方法。本文利用IPCC-AR4提供的10个气候模式模拟的20C3M和A1B情形下的逐月降水资料和IPCC-AR5中10个气候模式
在本文,我们定义了对偶Lorentz空间中的类光Mannheim曲线,并且证明了对偶Lorentz空间中不存在类光Mannheim曲线.进一步,我们证明了对偶Lorentz空间中存在伪类光Mannh eim曲线