论文部分内容阅读
目标检测是计算机视觉领域的重点和难点问题,广泛地应用于诸如智能监控、图片搜索、人机交互等多个领域。由于目标外观信息不足或光照、遮挡、视角等造成的目标外观变化,导致了目标表征的不确定性,降低了目标检测的准确率。而上下文信息能够描述目标的内在联系,所以借助上下文信息,能有效消除或减少这种不确定性对目标检测的影响,提高目标检测的准确度。目前,基于上下文的目标检测研究虽然取得了一定的进展,但由于目标表征与人类视觉语义鸿沟的存在,目标检测的准确度仍亟需大幅提升。为此,围绕这一主题,我们开展了上下文信息的目标检测研究。本文针对目标检测中的不同问题,从多个角度,充分挖掘和利用图像中的上下文信息,进行目标检测。在研究不同上下文表示的基础上,结合诸如卷积神经网络(Convolutional neural network,CNN)等机器学习方法,提出了多个新的目标检测模型,提升了目标检测的准确度。本文主要工作和贡献如下:(1)针对图像中的目标检测问题,提出了一种通用的基于霍夫上下文的目标检测模型。该模型摒弃传统的利用特征对目标中心投票的方式,以图像中每个像素点为投票中心构建新的椭圆形霍夫上下文。基于提出的霍夫上下文,通过有限次采样,巧妙的利用单一特征和联合特征的空间和外观关系,形成了一种新的局部上下文表示。为了充分利用该局部上下文信息,提出了一种包含独立和联合投票函数的新的加权投票函数。实验结果表明,该方法基于单一和联合特征,充分挖掘了目标自身包含的局部上下文信息,进一步加强了目标表征的准确性,提高了目标检测的准确性。(2)针对图像中存在两个同时出现的目标的检测问题,基于一种新的表示目标间牢固语义关系的局部上下文表示,构建了一种新的基于上下文信息的多层目标检测模型。首先,基于混合专家思想,在利用全局上下文特征划分的子场景下,基于不同目标之间的位置、尺度、以及角度的相互一致关系,提出了一种和场景相关的,包含丰富目标间语义关系的局部上下文表示,即一致性目标对。然后,利用这种局部语义的上下文信息,改变树形模型结构,生成相应场景下的子树,完成基于上下文信息的多层目标检测模型的建立。实验结果表明,这种新的局部上下文信息,增强了目标间相互约束,为目标表征,提供了更丰富的信息,进一步提高了目标检测的准确性。(3)针对视频的目标检测问题,基于目标在时空域的动态变化,构建时空上下文表示,在此基础上,提出了新的基于时空上下文信息的火焰检测模型和人数统计模型。针对火焰检测模型,在多个层面上,利用光流法获取的火焰方向信息,构造了一种新的时空上下文表示,并用该表示形成了新的火焰运动特征。在此基础上,结合Kernel SVM建立火焰检测模型。实验结果表明,该特征融合了火焰目标的时空上下文表示,能准确刻画火焰表征,所以能显著提高火焰检测的准确性和降低误报率。针对人数统计模型,首先,描述了一种包含团块运动的光流强度信息和团块面积信息等新的时空上下文表示,并用该表示形成新的团块特征;然后,利用该特征,结合人数统计的特点,设计了一种新的跟踪算法;最后,利用SVM进行线性拟合建立人数统计模型。实验结果表明,这种团块的时空上下文表示,可有效地刻画团块特征,提高了人数统计的准确性。(4)针对特定场景的目标检测问题,基于CNN学习的高层图像表达,构建了一种针对特定场景的上下文表示,在此基础上,建立了一种基于自适应上下文信息的CNN目标检测模型。首先,在特定场景下,基于CNN分别学习目标及其上下文的特征图。在同一尺度下,通过度量两组特征图间差异,保留有效上下文特征图的位置索引,获得一种新的上下文信息表示。然后,利用该表示,获取有效的上下文信息。融合目标和上下文信息,学习建立基于自适应上下文信息的CNN目标检测模型。实验结果表明,这种新的基于高层图像表达的上下文信息,增强了目标表征,有效的提高了目标检测的准确性。