论文部分内容阅读
提取有效的特征是数字图像处理和计算机视觉的关键问题。近年来,以局部二值模式(Local Binary Pattern,LBP)为代表的特征提取方法被广泛应用到纹理分类、场景分类、人脸识别、图像检索和行人检测等领域。然而,现有LBP方法在提取图像特征时存在对灰度反转变化敏感、对彩色图像特征描述力弱等问题。为解决这些问题,本文开展了以下研究工作:1.针对现有LBP方法对灰度反转变化敏感的问题,提出一种基于排序局部梯度模式(Sorted Local Gradient Pattern,SLGP)的特征提取方法。首先,提出两种具有互补性的局部梯度模式(Local Gradient Pattern,LGP),二者编码了局部邻域内丰富的梯度信息。然后,提出主导强度序测度(Dominant Intensity Order Measure,DIOM),将像素划分为两个类别,并在分类的像素上分别提取LGP直方图特征。SLGP将局部梯度信息和全局灰度序信息都编码到图像描述符中,从而提高了纹理图像在灰度反转变化下的分类精度。2.针对现有LBP方法对灰度反转变化敏感的问题,提出两种基于补数编码的特征提取方法:完整的局部补数-梯度模式(Completed Local Complement and Gradient Pattern,CLCGP)与局部补数-导数模式(Local Complement and Derivative Pattern,LCDP)。CLCGP利用一种旋转不变局部补数模式(Local Complement Pattern,LCP)编码了SLGP所缺失的近邻差分符号信息,最终形成的描述符是近邻差分符号、近邻差分幅值与中心像素强度信息的3-D联合直方图。LCDP则在LCP的基础上进一步引入局部导数模式(Local Derivative Pattern,LDP),用以编码不同尺度下(一阶和二阶)高斯导数空间中的近邻差分幅值信息。为同时考虑差分符号和差分幅值信息,进一步提出了基于均值采样的联合编码方案。最后,对联合编码结果进行多尺度的直方图表达,得到LCDP描述符。实验表明,CLCGP和LCDP能够有效提高LBP方法在线性和非线性灰度反转条件下的纹理分类精度。3.针对现有LBP方法对彩色图像特征描述力不足的问题,提出一种基于扩展四元数局部二值模式(Quaternionic Extended LBP,QxLBP)与自适应结构金字塔池化(Adaptive Structural Pyramid Pooling,ASPP)的特征提取方法。首先,提出一种扩展的四元数表示(Extended Quaternionic Representation,EQR)。EQR通过引入额外的信息项作为四元数的实部,能够灵活地编码一些判别特征和处理多通道的图像。然后,基于LBP算子设计了一种QxLBP描述符,该描述符编码了彩色图像四元数域中的局部邻域信息、互补的模与相位信息。最后,提出一种多分辨率的自适应结构金字塔池化(ASPP)方法。与传统的空间金字塔池化(Spatial Pyramid Pooling,SPP)不同,ASPP是面向结构的特征聚合方法,对图像旋转和空间变化不敏感,可以根据图像的多分辨率特征自适应地聚合编码特征。对彩色图像进行纹理分类和场景分类,实验表明该方法提高了现有LBP方法对彩色图像的描述能力。