论文部分内容阅读
随着三维信息获取技术不断发展和三维模型构造手段的不断进步,越来越多的三维数据出现在我们面前。通过CAD造型软件,可以得到三维模型;借助三维扫描设备,可以得到三维点云数据;通过计算机断层扫描或者核磁共振进行三维重建,可以得到物体的三维体数据;依靠X射线晶体衍射、核磁共振和电子显微镜等工具,可以得到微观的蛋白质的三维结构。此外,随着计算机硬件尤其是图形处理硬件性价比的提高,使得三维数据能在微机上快速处理和显示;计算机网络的普及使得人们易于得到并且使用三维数据,也使得三维数据的传播和应用快速发展。
几何矩不变量的研究至今已有40多年历史,出现了很多推导方法,它们也在各个方面得到了广泛的应用。但是,已有的推导方法大部分都是基于代数的推导,使得矩不变量没有明确的几何解释。此外,大部分这些方法的扩展性比较差,很难得到更多高阶的、高维空间中的、不同变换群下的,或者不同流形上的矩不变量。
对一个待查询的三维模型,要识别它所属的类别,或者在庞大的数据库中检索到和它形状相似的其它模型,需要对它进行特征提取。在三维空间中,三维模型可以具有任意的大小、位置和姿态,所以我们需要寻找与这些变换都无关的不变特征描述。蛋白质的生物学功能在很大程度上取决于其空间结构,蛋白质结构构象多样性导致了不同的生物学功能。蛋白质数据仓库(Protein DataBank,PDB)里面目前有超过48000个蛋白质结构数据,然而所有独特的结构却不超过5000个,所以需要对蛋白质三级结构进行相似性比较和匹配。同样蛋白质结构在三维空间中也会有不同的位置和姿态。在这种情况下,三维矩不变量非常适合对这些三维数据进行特征描述。
在三维数据越来越普及和应用越来越广泛的背景下,笔者对几何矩不变量的推导进行了深入和全面的研究,包括任意维空间下的、各种流形和各种变换下的、任意阶的矩不变量的推导,还进一步探索了如何使用三维矩不变量,对实际应用中的三维数据进行检索和匹配。
本文的工作集中于三维几何矩不变量的理论推导及其在三维模型检索和蛋白质结构分析中的应用。论文的主要工作和创新点如下:
1)提出了一种矩不变量构造的统一框架,可以得到任意维空间下任意阶数的几何矩不变量,可以适用于描述各种变换下的物体,包括相似变换、仿射变换、射影变换;还可以适用于描述各种流形上的物体,包括线、面、体。这一结果一般性地推广了在二维图像处理中应用的七个二维矩不变量;还纠正了前人推导二维射影矩不变量时出现的错误。
2)提出了一种基于有监督学习的三维模型检索方法,将神经网络训练后的分类信息用加权的曼哈顿距离表示,并与曲面矩不变量的特征距离结合起来,提高模型检索的精度。
3)提出了一种任意维空间下的快速欧氏距离变换算法,将二值图转化为灰度图,然后结合实体矩不变量用于主轴判断和模型检索,增加了不同类别模型间的区分度。
4)提出了一种蛋白质结构联配的方法,使用曲线矩不变量来描述蛋白质骨架的片断,然后结合迭代最近点来叠合两个蛋白质结构,使得重叠后的均方根距离更小,获得的配对的原子数更多。
5)提出了一种蛋白质问的公共子结构提取方法,将曲线矩不变量和二面角信息作为蛋白质骨架的局部形状的不变描述,提取蛋白质问公共的相似结构,使得提取的公共子结构比其它方法更长。