论文部分内容阅读
目标检测是计算机视觉领域的重要分支,其主要目标是从静态图片或视频序列中检测并定位感兴趣的目标物体。综合运用了图像处理、机器学习、模式识别和人工智能等技术,在智能交通、医学图像分析、人机交互等领域都有着广泛的应用。由于目标所处环境的多样性以及目标形状多变、遮挡等问题,目标检测算法的研究机遇与挑战并存。本文将深度学习与目标检测结合起来,针对目标检测使用传统人工提取特征的方法准确度较低的缺点,本文在深度学习的基础上提出了一种基于卷积神经网络的目标检测算法。为了解决卷积神经网络输入图像框精度较低导致无法获取图像更为本质特征的问题,本文将算法分为三步:(1)利用多层次分割区域多尺度融合的方法提取图像中可能包含目标物体的区域作为候选窗;(2)通过候选窗中包含超像素的程度大小判定候选窗的定位偏差,并依据此指标对其进行优化,为后续特征提取做准备;(3)为了适应卷积神经网络指定的输入大小,本文提出一种新的利用超像素横跨候选窗的部分填充候选窗的方法,此方法进一步提升了网络模型提取特征的准确率;(4)利用卷积神经网络提取特征,并利用提取到的特征针对每一物体类别训练SVM线性分类器。通过提高网络模型输入图像框的准确度,提高了特征提取的准确率;并利用微调后的卷积神经网络模型提取特征,相比于传统人工提取特征的方法来说,提高了检测结果的准确率。为了证明本文算法的有效性,利用PASCAL VOC 2007数据库进行目标检测实验,该数据库提供了 20类常见物体,分为训练验证和测试图像两部分,验证了算法的应用效果。本文以每个物体类别为单位,计算了各个类别检测结果的准确率以及所有类别平均的准确率,实验证明本文算法的准确率超出同样利用卷积神经网络模型提取特征的R-CNN检测框架3.4%,证明了本文算法的有效性。