论文部分内容阅读
21世纪以来,蛋白质结构建模的课题成为了热点研究范畴,该课题丰富并发展了蛋白质结构分析理论,解释了蛋白质功能与结构之间的关联,对蛋白质空间三维结构预测等方面有着重要的现实意义与研究前景。传统方法中,常使用矩阵作为蛋白质结构分析与相似性比较的数学手段,例如距离矩阵、旋转矩阵等,但是由于矩阵包含元素个数多,因此计算过程复杂。针对蛋白质结构建模传统方法中普遍存在的计算复杂度高、几何意义不明确的问题,本文采用四元数作为数学手段,就蛋白质α螺旋检测与蛋白质空间结构比对这两方面内容提出了2种新方法。根据α螺旋几何特点,本文利用四元数替代旋转矩阵,来描述蛋白质分子中相邻Cα坐标系间的相对旋转,提出了一种蛋白质α螺旋检测的四元数新方法。基于PDBselect数据库应用本文方法进行验证,对α螺旋检测精度达到91.7%。该方法具有检测精度高、计算复杂度低和几何意义明确的显著优点。传统的蛋白质空间结构比对方法通常通过距离矩阵的最优化来对蛋白质骨架结构进行配准,这样当蛋白质分子较大时所需的操作时间长且计算复杂。本文通过将蛋白质的空间坐标数据转换为包含大量蛋白质骨架结构几何信息的对称正定矩阵序列,并通过四元数求取两蛋白质的对称正定矩阵序列间的距离,即为四元数黎曼度量,取之作为蛋白质结构相似度的衡量指标。利用四元数取代距离矩阵,因为四元数只包含四个参数,保存全部几何信息的同时大大降低了计算复杂度。本文方法利用4组实验数据从不同算法之间,不同层次的蛋白质结构数据之间,实验常用数据集和典型数据集这4个不同的角度,在大量蛋白质PDB数据上验证了本文方法的有效性与可行性,其中对HOMSTRAD中的700个蛋白质双结构实例计算结果的平均匹配精度达到了89%。结果表明本文方法不仅有效地降低了计算复杂度,还具有很好的统计特性和匹配精度。四元数作为一种数学手段,用于蛋白质α螺旋检测和空间结构比对方面,不仅具有操作简单、计算速度快的优点,而且与传统方法相比有很高的检测精度与匹配精度。通过实验验证,蛋白质三维结构的四元数建模方法有着显著的优越性。