论文部分内容阅读
基于视觉的目标检测技术可以被直接地应用到视频监控、安全驾驶、人机交互和互动娱乐等领域中,具有广泛的商业应用价值和市场前景,因而一直是计算机视觉和图像处理领域中的研究热点。近年来,随着科学技术的发展,目标检测技术取得了显著的成果,但是由于目标的变化幅度可能较大和易受到光线、遮挡等影响,导致目标检测技术在较为复杂场景上的表现有所欠缺。主要表现为:目前较好的算法的检测准确性依然较低,检测速度依然较慢,离实际应用有着明显的差距。此外,在目标检测中如何平衡准确性和实时性仍然是个很有挑战性的研究课题。可变形部件模型(Deformable Part Model,以下简称为DPM)最近几年在通用目标检测领域得到了极大的关注。这个检测算法通过描述各个部件和部件间的位置关系来表示目标,在处理目标遮挡和类内变化方面有着良好的效果。在学习和研究DPM目标检测算法时,发现DPM目标检测算法虽然有着较高的检测精度,却是以较大的计算量为代价,从而限制了其应用发展。论文主要针对DPM检测速度慢的问题进行研究改进,提出由粗到精的检测思想和快速搭建特征金字塔算法,并在此基础上对特征金字塔进行分层检测。本文的主要工作和创新点如下:第一、全面细致地讲解了基于DPM的目标检测理论和实现细节。第二、将感兴趣区域提取与DPM目标检测算法相结合,形成由粗到细的目标检测方法,对图片进行预处理,获得适用于DPM的建议窗口,能够大大提高检测速度。第三、针对HOG特征单一的问题,提出多特征互补融合方法来对目标进行检测,提高目标检测的准确性,同时,使用近似值计算方法快速搭建特征金字塔,大大降低了计算特征梯度所带来的计算量负担。第四、在针对滤波器响应方面,提出分层检测算法,利用根模型的特点,快速找出存在潜在目标的特征层,然后再使用部件模型进行匹配,来检测是否存在目标,这样能够避免对每层使用根模型和部件模型进行匹配而带来的计算负担。综上所述,本文针对基于可变形部件模型的目标检测任务进行了学习和研究,并且针对其中存在的检测速度慢和检测精度低等问题,提出相应的优化算法。实验表明,本文有效提升了基于DPM的目标检测的效果,并且在保持良好检测准确性的情况下显著提高了检测速度。