论文部分内容阅读
目标检测作为图像处理和计算机视觉领域中的经典课题,在交通监控、图像检索、人机交互等方面有着广泛的应用。它旨在一个静态图像(或动态视频)中检测出人们感兴趣的目标对象。传统的目标检测算法中特征提取和分类决策分开进行,对特征选取的要求就更加严格,在面对复杂场景的时候很难得到理想效果。自Hinton教授提出深度学习理论,越来越多的研究学者尝试采用深度学习理念来解决目标检测问题,并且提出了不同的模型。不同的模型应用也不尽相同,通常采用卷积神经网络来处理目标检测问题。相比于传统目标检测算法,卷积神经网络中特征提取和模式分类并行进行,而且随着层数的增多可以更好的处理复杂场景,但是它对目标边缘的约束性太差。在这样的基础上,本文对传统算法和卷积神经网络做了深入的研究,实现了将传统算法和卷积神经网络相结合的目标检测算法。本文的主要工作和创新有:(1)针对传统目标检测算法一般是使用矩形框的方式得到目标的大致区域,而我们的需求是尽可能的获得目标的边缘轮廓问题,本文实现了一种改进的基于主动轮廓模型的目标检测算法,使轮廓尽可能的接近目标。(2)针对传统算法需要人工设计图像特征,不同场景模型不稳定问题而卷积神经网络分割不精确以及缺少相邻像素之间的约束的问题,本文将传统算法和卷积神经网络相结合,使用卷积神经网络进行图像“高层次”特征提取,超像素提取出图像“低层次”特征,可以适应不同的复杂场景,并且获得准确的目标边缘。在颐和园景点数据库中进行了充分的实验。通过结果可以看出使用我们的算法进行目标检测提取,可以很精确的提取出目标,而且目标的边缘约束性也非常强。(3)主要创新点:在使用超像素提取特征删除重复特征,减少特征冗余,降低特征的维度;同时将VGGNet(Visual Geometry Group Network)网络换成收敛速度更快的GoogleNet网络,提高了算法的速度。