论文部分内容阅读
行人检测在车辆自动行驶、社区智能监控、人机交互、战争监控等领域有广泛的应用,是当前计算机视觉领域的研究热点之一。论文以单视点固定摄像头和移动摄像头行人检测为研究对象,着重研究具有复杂场景下的背景动态变化及行人姿态多变情况下行人检测和标记问题。其研究内容及创新点体现在:1)针对固定摄像头复杂动态场景下,经典Codebook方法存在计算量和内存需求大、构建的Codewords不准确等问题,提出了一种基于超像素分割的Codebook目标检测方法(CBSP-OD)。该方法在HSL颜色空间下进行超像素分割,用L分量作为亮度值判断,解决了经典方法中计算量和内存需求大问题,同时也增强了缓慢光照变化的鲁棒性;通过采用相似像素的超像素区域块代替单像素进行Codewords构建,考虑了背景目标的完整性,使得背景Codewords构建的更加准确,进一步避免了计算量和内存需求大的问题。在复杂户外场景下的实验表明,该算法平均处理速度达到65帧/秒,基本满足大多数实时系统,准确度也有着显著的提高。2)针对单摄像头移动场景下,基于特征分类行人检测无法适应行人目标尺寸缩放、行人姿态多变和干扰噪声较大问题,提出了一种级联LBP、SPHOG和SURF特征的自适应行人检测算法(CFA-PD)。该算法基于逐级精细提取行人区域的思想,首先采用基于LBP特征行人分类器去除大量非行人区域,在提取出的行人区域用基于SPHOG特征行人分类器再次缩小行人区域,用基于SURF特征行人分类器检测并标记出行人目标。实验结果表明,该算法有效解决了行人尺度缩放、行人姿态多变和背景区域干扰噪声大问题,算法的准确度和实时性有较大的提高。3)针对行人姿态多变、行人与摄像头距离变化导致行人尺寸存在不同程度的缩放和摄像头视角变化,造成行人标记窗口不准确问题,提出了一种行人检测窗口自适应标记算法(PM-OTSU)。该算法以行人检测算法标记的行人窗口作为初始简图,并依据初始简图中要素的数量变化判断尺寸变化并改变标记窗口。实验结果证明,该算法有效解决了行人检测窗口自适应调节问题,算法准确度取得较大的改进。