论文部分内容阅读
场景辨识隶属目标识别的范畴,在计算机视觉应用领域具有广泛应用前景。场景辨识类似于人脸辨识属于“一对多”的模式识别问题,但是其面临的挑战在于场景图片成像环境复杂。由于不可控因素影响,图像存在尺度、视角、照明的剧烈变化,也有可能因为时间跨度过大导致背景显著变化,以及出现季节、天气、运动目标等干扰因素。因此,场景辨识是一个非受控自然环境中具有复杂动态变化性的目标识别问题,该类问题在计算机视觉领域还不能得到很好解决。本文从不同的视角研究了几种场景辨识的方法,主要工作如下:(1)基于人工特征提取技术,通过局部特征点匹配的原理实现场景辨识。针对传统的单点图像匹配技术错配严重的问题,提出了一种基于LDB描述子和局部空间结构匹配的快速场景辨识方法。该方法继承了二值特征描述子的快速和节约储存空间特性,利用多点匹配取代单点匹配,排除了大量错配点,提升了匹配准确率。该方法在实时性和鲁棒性方面达到了较好的平衡,在湘潭大学标志性建筑数据集中取得了优于传统匹配方法的结果。(2)将场景辨识看作物体分类问题,利用深度神经网络实现场景辨识。深度网络通过层次化的特征学习,摆脱了传统人工提取特征的局限性,本文利用AlexNet网络,对扩充的湘潭大学标志性建筑数据集进行学习和测试,验证了该方法能大大提高场景辨识的成功率,可靠性优于特征点匹配类方法。(3)基于可判别特征表达学习的场景辨识。为了使学习的图像特征表达具有更强的可判别性,本文研究了基于孪生卷积神经网络的场景辨识方法。通过孪生卷积神经网络的特征表达学习,达到使同一场景的图像对在特征空间上分布紧凑,而不同场景的图像对在特征空间中间隔较远的目的。该方法在公开的具有光照大幅变化特点的街景数据集上进行了测试,在只需少量配对训练样本的前提下,孪生卷积神经网络取得了优良的学习效果,很好地解决了光照大幅变化下的场景辨识问题,辨识效果优于采用深度网络分类来解决该类场景辨识问题的方法。本文研究的场景辨识方法,在解决尺度、视角、照明的剧烈变化场景辨识问题时进行了多方面的尝试,获得的结果具有积极的借鉴意义,相关方法也值得进一步深入研究与分析。