论文部分内容阅读
计算机视觉是一门研究用摄像机和计算机模拟生物视觉的科学。目标检测是计算机视觉最基础的任务之一,它通过提取图像的某些特征而检测出特定类别的目标,为更上层的任务如目标识别、行为分析、检索等提供必要的技术基础。作为一个特定的目标检测类别,行人检测研究存在:人体的非刚体性、行人外观多样性、复杂背景、光照变化、尺度变化、遮挡等诸多研究难点。行人检测技术在智能视频监控、车辆辅助驾驶行人保护系统、智能交通控制等领域中得到广泛应用,有着巨大的商业价值。这些因素使得行人检测研究逐渐从目标检测研究中脱离出来,成为一门独立的研究领域。本文研究静态图像上的行人检测方法,以INRIA Person数据集作为实验平台,具体完成的研究工作如下:1.研究简化非极大值抑制后处理方法,针对传统方法约束条件单一、消除重复检测不充分的问题,提出一种改进方案:在传统简化非极大值抑制仅计算交集面积对候选检测边界框的覆盖比例的基础上,增加“抑制完全覆盖检测”约束和"PASCAL VOC重叠判据”约束,分别对应计算交集面积对选中检测边界框的覆盖比例和对并集面积的重叠比例。2.探讨了标准HOG行人检测模型的上下文背景问题,得出去除上下文背景的32×96尺寸模型优于标准模型,同时提出一种结合类Fisher比计算block类别区分力和NMS选择特征子集的特征选择方法,从设计的144个block特征中选出24块,串接为一个1854维的行人检测模型。3.研究人类视觉系统的注意机制,以及视觉注意机制在计算机视觉中的计算模型,试验了一种视觉注意机制下的行人检测方法:首先利用显著性检测模拟人类视觉系统的注意机制,然后将灰度显著图二值化并提取候选检测区域,模拟视觉注意机制下的感兴趣区域,最后在候选区域里检测行人目标。本文研究工作既覆盖了传统行人检测方法中特征提取、分类器训练以及后处理等环节,也尝试了构建一种视觉注意机制下的行人检测方法,实验结果显示:改进的简化非极大值抑制可以有效减少误检,更好地挖掘检测方法的潜能,可以拓展应用到所有基于滑动窗口法的目标检测方法中;提出的特征选择方法实现了在合理的时间代价下获得次优的保留语义的特征子集,利用该特征选择方法改进的行人检测模型性能提升显著;视觉注意机制下的行人检测方法可以显著减小传统行人检测方法的搜索范围,但是受制于视觉注意模型的不完善,该方法在降低误检的同时,也无奈地增加了对目标的漏检。