论文部分内容阅读
对多媒体数据进行管理、分类和检索具有广泛的应用价值和迫切的实际需求。有效的图像特征表达是完成上述计算机视觉任务的基础。然而,现有的方法仍然存在语义表达能力弱和判别能力不足等问题。本文以构建高表达力和高判别力的图像表达为研究目标,主要研究图像结构化特征表达方法。通过借鉴人类视觉系统中的层次处理机制,提出了层次结构特征表达模型,同时结合图像中特征的空间相关性和尺度相关性提出了三种图像结构化特征表达方法来刻画图像内容,以提高特征的表达能力和判别能力。具体的研究内容和主要贡献如下:首先,通过借鉴人类视觉系统中的层次信息处理机制,提出了层次化图像结构特征表达模型。该模型通过由简单到复杂的层次关系来组织无序的图像特征,实现对图像信息的有效表达。该表达模型解决了对不同的图像结构进行刻画的问题,指出了描述结构信息的两个基本要素:尺度相关性和空间相关性。视觉认知和统计学习角度的分析以及实验结果,证明了所提出的图像结构表达模型的有效性,同时也证明了尺度和空间因素对图像表达具有重要作用。其次,通过引入图像中特征的空间关联特性,提出了基于空间邻域相关性的单层结构特征表达方法,解决了传统无结构特征的判别力低的问题。通过统计图像中特征的空间分布,构建出单层结构特征对,使用相对位置关系等结构信息对其进行描述,并定义了结构特征对的相似度度量方法。接着,以这种结构特征表达方法为基础,提出了基于空间结构约束的目标检测算法。目标图像识别和图像Logo检测的实验结果表明,所提出的基于空间邻域相关性的单层结构特征表达方法能够更有效地描述图像信息,提高了特征的判别能力。再次,通过引入图像中特征的尺度关联特性,提出了基于尺度相关的两层结构特征表达方法,利用层次约束联合多尺度特征以提高特征的判别能力。通过局部特征的尺度包含关系,将无序的局部特征组成层次结构,采用表观信息和结构信息对该结构进行刻画,并定义对应的结构相似度度量方法实现更准确的相似度计算。为进一步实现更加紧凑高效的表达,提出了基于相似哈希映射的尺度结构特征编码方法。目标图像识别、大规模图像检索和图像匹配的实验结果表明,所提出的尺度相关两层结构特征与无结构特征和单层结构特征相比更具判别能力,并且对尺度、旋转等变化具有较强的鲁棒性。最后,以单层空间相关结构和两层尺度相关结构表达为基础,提出了多层次结构特征表达方法,来更详细地描述图像内容。该方法在包含关系的基础之上使用树形结构来更细致地组织和刻画图像区域内的多尺度特征,进一步提高特征表达的判别能力。接着,提出了自底向上的编码方法将结构信息有效地嵌入到编码向量之中完成对多层次结构树的描述,并在此基础上提出了基于直方图交的结构树相似度计算方法和基于监督信息测度学习的特征映射方法。目标图像识别、纹理分类和场景图像分类的实验结果表明,所提出的多层次结构树方法与无结构特征、单层空间结构特征和两层尺度结构特征的方法相比,具有更强的判别能力,证明了所提出的多层次结构特征表达方法对图像区域表达的有效性。通过上述工作,本文对图像的结构化特征表达问题进行了深入研究,结果表明:图像的结构信息对于提高特征判别力具有重要的作用,而采用层次结构特征表达模型可以有效地刻画图像的结构信息。