论文部分内容阅读
图像特征提取作为机器视觉、模式分析及图像工程领域中一个最重要的研究课题已经成为工业4.0背景下的研究热点。图像矩作为一种全局性的描述子(特征提取方法)能够对图像的形状特征进行有效的表述;同时,图像矩所对应的不变性(不变矩)因其满足对图像的旋转、尺度拉伸、平移等几何变换及光照不变性,因此对于图像分析、分类及识别等问题具有非常重要的研究意义。
近年来,正交矩由于其核函数满足正交性,所构成的各阶矩相互之间是独立的,不存在信息冗余,具有一定的抗噪能力,因此成为图像矩主要关注的焦点。特别是建立在极坐标系下的径向正交矩因其本身具有旋转不变性,所以成为几何不变性识别特征提取首选描述子。但现有的正交矩,特别是径向正交矩仍存在以下不足:(1)多数正交矩其核函数均是由高阶多项式构成,且存在阶乘运算,计算耗时较高;(2)径向正交矩的多项式通常是由笛卡尔坐标系下的正交多项式通过形变转换而来。为了满足极坐标系下的正交性,这种形变导致了图像原点所构建的图像矩的数值不稳;(3)现有的正交矩,无论是低阶矩或高阶矩均采用同一正交多项式构建,缺乏灵活性,这也导致所构建的低阶矩对图像特征表征不足,高阶矩其数值不稳定,对噪声敏感;(4)传统正交矩仅能对图像全局特征进行描述,缺乏局部特征的构造能力;(5)最新所提出的分数阶正交矩多数针对的是灰阶图像,关于彩色图像的研究和分析较少;(6)所提出的分数阶正交矩与现有的正交矩方法相比,其算法性能提升并不明显。
针对以上问题,本文的工作将围绕半正交矩及分数阶彩色图像矩算法的理论及应用研究展开,主要研究内容和创新点如下:
(1)提出了一种基于exponent函数的半正交图像矩(semi-orthogonal exponent-Fourier moments),主要用于图像重构及几何不变性识别研究。与经典的exponent-Fourier矩相比,半正交exponent-Fourier矩的核函数由分段的半正交指数函数构成,消除了数值不稳,其低阶矩和高阶矩图像描述能力更强。另外,与传统的Zernike矩和正交Fourier-Mellion矩相比,半正交exponent-Fourier矩的多项式不存在高阶多项式的阶乘运算,有效降低了实际的计算时间。最后,根据所提出的半正交exponent-Fourier矩的特点,通过FFT算法可以实现所提出图像矩的快速精确算法;同时,我们也设计了一种基于对数-极坐标系下的旋转、缩放不变性识别方法和基于图像投影的平移不变性方法,将所提出的图像矩用于几何不变性识别中。
(2)提出了一类通用的半正交矩模型。借鉴半正交exponent-Fourier矩的思想,我们分别在笛卡尔坐标系和极坐标空间建立了其对应的通用半正交图像矩模型。通过三角函数建立的半正交-三角函数矩和半正交-径向三角函数矩研究和分析了通用半正交图像矩模型的频域特性、图像全局特征提取特性、图像局部特征提取特性、抗噪能力及旋转不变性等性能。
(3)为了减少存储空间,提高图像矩的实用性,提出一类基于Walsh函数系的半正交Walsh图像矩。该矩的核函数是由只包含+1和-1的二值正交基构成,其运算更加接近硬件处理,可以加速图像特征提取的时间;同时,由于Walsh函数系是由一组完备的不连续二值函数系统构成。因此,与传统的基于连续多项式构建的图像矩相比,能够有效克服Gibbs图像噪声。理论和实验结果表明,该方法在图像重构和抗噪能力上都有明显的优势。
(4)采用分数阶理论和四元数方法相结合,提出了基于分数阶广义Laguerre矩的彩色图像分析和几何不变性识别方法,同时,构建了四元数分数阶彩色图像矩。所构建的彩色图像矩打破了传统彩色图像特征提取时将彩色图像灰度化或分别对其三基色通道进行处理的弊端,与传统方法相比,所构建的四元数分数阶彩色图像矩在一定程度上有助于提高图像特征提取的精准度。另外,在分数阶理论基础上,建立可以捕捉局部图像特征的分数阶图像矩,实现任意图像局部感兴趣区域(ROI)的特征分析和提取操作。最后,可以利用几何不变矩的线性组合来构建四元数分数阶Laguerre矩的几何不变性,将其应用到彩色图像几何不变性物体识别领域。
近年来,正交矩由于其核函数满足正交性,所构成的各阶矩相互之间是独立的,不存在信息冗余,具有一定的抗噪能力,因此成为图像矩主要关注的焦点。特别是建立在极坐标系下的径向正交矩因其本身具有旋转不变性,所以成为几何不变性识别特征提取首选描述子。但现有的正交矩,特别是径向正交矩仍存在以下不足:(1)多数正交矩其核函数均是由高阶多项式构成,且存在阶乘运算,计算耗时较高;(2)径向正交矩的多项式通常是由笛卡尔坐标系下的正交多项式通过形变转换而来。为了满足极坐标系下的正交性,这种形变导致了图像原点所构建的图像矩的数值不稳;(3)现有的正交矩,无论是低阶矩或高阶矩均采用同一正交多项式构建,缺乏灵活性,这也导致所构建的低阶矩对图像特征表征不足,高阶矩其数值不稳定,对噪声敏感;(4)传统正交矩仅能对图像全局特征进行描述,缺乏局部特征的构造能力;(5)最新所提出的分数阶正交矩多数针对的是灰阶图像,关于彩色图像的研究和分析较少;(6)所提出的分数阶正交矩与现有的正交矩方法相比,其算法性能提升并不明显。
针对以上问题,本文的工作将围绕半正交矩及分数阶彩色图像矩算法的理论及应用研究展开,主要研究内容和创新点如下:
(1)提出了一种基于exponent函数的半正交图像矩(semi-orthogonal exponent-Fourier moments),主要用于图像重构及几何不变性识别研究。与经典的exponent-Fourier矩相比,半正交exponent-Fourier矩的核函数由分段的半正交指数函数构成,消除了数值不稳,其低阶矩和高阶矩图像描述能力更强。另外,与传统的Zernike矩和正交Fourier-Mellion矩相比,半正交exponent-Fourier矩的多项式不存在高阶多项式的阶乘运算,有效降低了实际的计算时间。最后,根据所提出的半正交exponent-Fourier矩的特点,通过FFT算法可以实现所提出图像矩的快速精确算法;同时,我们也设计了一种基于对数-极坐标系下的旋转、缩放不变性识别方法和基于图像投影的平移不变性方法,将所提出的图像矩用于几何不变性识别中。
(2)提出了一类通用的半正交矩模型。借鉴半正交exponent-Fourier矩的思想,我们分别在笛卡尔坐标系和极坐标空间建立了其对应的通用半正交图像矩模型。通过三角函数建立的半正交-三角函数矩和半正交-径向三角函数矩研究和分析了通用半正交图像矩模型的频域特性、图像全局特征提取特性、图像局部特征提取特性、抗噪能力及旋转不变性等性能。
(3)为了减少存储空间,提高图像矩的实用性,提出一类基于Walsh函数系的半正交Walsh图像矩。该矩的核函数是由只包含+1和-1的二值正交基构成,其运算更加接近硬件处理,可以加速图像特征提取的时间;同时,由于Walsh函数系是由一组完备的不连续二值函数系统构成。因此,与传统的基于连续多项式构建的图像矩相比,能够有效克服Gibbs图像噪声。理论和实验结果表明,该方法在图像重构和抗噪能力上都有明显的优势。
(4)采用分数阶理论和四元数方法相结合,提出了基于分数阶广义Laguerre矩的彩色图像分析和几何不变性识别方法,同时,构建了四元数分数阶彩色图像矩。所构建的彩色图像矩打破了传统彩色图像特征提取时将彩色图像灰度化或分别对其三基色通道进行处理的弊端,与传统方法相比,所构建的四元数分数阶彩色图像矩在一定程度上有助于提高图像特征提取的精准度。另外,在分数阶理论基础上,建立可以捕捉局部图像特征的分数阶图像矩,实现任意图像局部感兴趣区域(ROI)的特征分析和提取操作。最后,可以利用几何不变矩的线性组合来构建四元数分数阶Laguerre矩的几何不变性,将其应用到彩色图像几何不变性物体识别领域。