论文部分内容阅读
本文致力于研究矩技术及其在图像处理与识别中的应用。矩在统计学中用于表征随机量的分布,而在力学中用于表征物质的空间分布。若把二值图或灰度图看作是二维密度分布函数,就可把矩技术应用于图像分析中。这样,矩就可以用于描述一幅图像的特征,并提取为与统计学和力学中相似的特征。近年来,由二隹和三维形状所求取的矩及矩不变量的优良特性已引起了图像界人士的高度重视,并开发了大量的应用。几乎没有任何图像特征可以直接与矩特征相比较,因而有必要研究矩技术及其在图像处理与识别中的应用。 本文在前人研究的基础上,从以下几个方面进行研究和创新: 1、在矩技术及其特性方面,着重探讨了规则矩、正交矩以及其它常用矩及不变量的定义和性质,并就各种矩在图像表示能力、噪声敏感度和信息冗余等方面的性能进行了比较与分析。从全局性能考虑,Zernike矩和伪-Zernike矩是最优的。 2、综述了规则矩和正交矩的各种快速算法并对其性能进行了评估。用直接方法求取二维图像的矩值需要计算大量的加法和乘法,而运算速度在许多应用(尤其是实时模式识别)中是非常关键的,因而有必要研究减少计算复杂度的矩快速算法。 3、提出了一种实用的规则矩快速算法—截线段法。该方法可对任意二值图像的规则矩和矩不变量进行精确计算,突破了Delta方法仅适合于二值水平连续图像的限制。截线段法使用逐行的各个截线段而不是逐点来加快计算速度。对三角形、正方形和飞机图像的实验证实了截线段法的正确性和有效性。 4、综述了矩技术在图像处理、计算机视觉、和模式识别领域内的应用,主要包括:景物匹配、直方图匹配、图像重建、图像压缩、对称性检测、图像规格化、纹理分割、边缘检测、飞机识别和图像检索等等。 5、提出了一种新的图像规格化方法,该方法对四种形式的失真(平移、旋转、伸缩和倾斜)图像都能正确规格化,而已有的规格化算法至多只能处理三种形式的失真。该算法首先用紧凑算法进行处理,紧凑图像对平移和伸缩失真是不变的,但倾斜问题转变成旋转问题。该算法的最后一步是根据“图像椭圆倾角”以及旋转后的图像的三阶矩μ30的符号来旋转图像以使其对旋转变换也保持不变。对飞机图像和汉字图像的实验验证了这种新型的图像规格化方法的正确性和有效性。 6、实现并分析了一个光字符识别系统,该字符识别系统用基于统计矩的特征来识别大小写英文字母。这些矩包括规格化后的中心矩、Hu矩不变量、仿射矩不变量和Tsirikolias-的北丁业人学-6卜学位论义 搁要Mertzios矩。所使川的分类技术包括欧儿里德距离测度、规格化互柏犬和代价判别函数。在分类过柞个,为改进识别精度,攸川特征的类内标准方差的均值什人加权因于。该系统使用不同行数的训纨集和不同字号的文档进行了测试,结果表明,TSirikolias-Mertzios矩利加权规格化生相关提供了最好的识别率。 7、提出了用织合不变量作为特征,加权规格化互相关作为分类技术的不变模式识别方法,该力法可解决现有的基了不变特征的-二维模式识别方洽在目标被模糊了的悄况卜都无法精确识别的问题。对头像和巳机的数字试验证实了织合不变量特征对图像的平移、伸缩、多旋转利模糊变换的不变性利该模式识别方法的可行性。 8、提出了仗川只有旋转不变性的lernike矩的幅值作为特征的图像识别方法。该方法@给出了选取分类所需特征个数的口动方法,所选取的最高阶次使重建图像按近于原始图像。我们用最近邻准则和 26类字符数据进行了测试,我们所得到的分类精度远远高于用规则矩和矩不变量作为特征的方法,由此得出结论,我们所提出的特征和特征数目选取方法对图像识别问题非常有效。