论文部分内容阅读
在图像中自动寻找感兴趣的目标在很多领域有广泛的应用,例如图像压缩、图像检索、图像缩放、图像分割等。在图像中寻找感兴趣目标的方法目前分为两类:一种方法是无需先验知识的,这类方法独立于任务,从背景中捕获人类注意的突出区域,即显著区域;另一种方法是任务驱动的,即寻找具体的目标,这类方法常常需要从已有的目标提取特征训练学习,然后再用于识别目标。论文围绕解决目标检测分割及目标识别的视觉显著性模型的相关技术进行了深入的研究,下面介绍论文的主要研究内容:现有的视觉注意显著模型针对不同的数据集采用不同的评价指标体系,存在性能有失公平性的问题,提出了统一的视觉显著模型评价体系。根据现有数据集及评价指标的特点,选取人工合成数据集、HOU-62数据集、Bruce和Tsotsos-120数据集和Achanta-1000数据集及5个评价指标:查准率(Precision)、查全率(Recall)、F-measure、平均曲线下的面积(Areas Under Average ROC Curves,AUC)、线性相关系数(Linear Correlation Coefficient,LCC)构成统一的评价体系。实验证明,这种在同一标准下的对比更具公平性,更能区分各种不同视觉显著模型的显著效果。通过分析现有的视觉注意显著模型的基本算法,针对所得的显著图在低频部分显著能力较弱的问题,提出了一种基于离散余弦变换(Discrete Cosine Transform, DCT)相位谱的视觉显著注意模型,该模型在Lab颜色空间里对颜色和亮度特征进行了多尺度表示,并结合数学形态学的阂值分割方法对获得的全局显著图进行分割,从实验结果评价指标的分数上看,该模型明显优于现有的其他模型。实验结果表明,将该方法应用于基于内容的图像缩放技术中,缩放后的图像能较好的保护显著目标,背景没有明显的变形失真,同时保持了全局的和局部的图像特征。通过图像缩放技术应用的效果比较,基于离散余弦变换相位谱的视觉显著注意模型显著优于剩余谱(Spectral Residual, SR)模型。通过分析评价指标中查准率总是高于查全率的特点,说明阈值分割法虽然能准确找到注意焦点,但是对目标边界的定位能力弱。提出了一种改进的基于视觉注意机制的距离正则化水平集方法(Distance Regularized Level Set Evolution, DRLSE)。该方法首先采用改进的适合眼动实验的ITTI模型确定注意焦点,再确定初始轮廓曲线位置及演化方向,最终演化至目标物体边界实现目标分割,能够检测单个或多个目标物体的边界,定位准确,抗噪能力较强,同时对具有弱边界的图像也具有较好的分割效果。从实验结果的平均误差参数对比可知,该方法明显优于距离正则化水平集方法和自适应Chan_Vese (Adaptive Chan_Vese, ACV)方法。根据人类视觉注意机制具有稀疏性的特点,提出了基于主成份分析(Principal Component Analysis, PCA)理论的视觉注意模型,即利用主成份分析理论对分块图像提取颜色特征、空间特征,加权获得全局显著图。从实验结果中的评价分数上来看,基于主成份分析理论的视觉注意模型同样优于现有的其他模型。以工业领域的太阳能电池表面缺陷检测为应用实例,将主成分分析理论融合径向基神经网络(RBFNN)对已有目标提取特征训练学习,然后再用于识别目标。实验结果表明,与其他三种基于任务驱动的目标识别方法(模糊C均值聚类法(FCM)、独立成分分析(ICA)、反向传播神经网络(PCA-BPNN))相比,具有较高的识别率和较短的计算时间。