论文部分内容阅读
随着计算机的发展和各种算法研究的推进,安防监控和家庭看护监控开始更多地应用计算机视觉技术,行人检测成为监控应用中实现姿态识别、行为分析等功能的首要步骤。当前流行的行人检测算法大多采用卷积神经网络及其衍生神经网络检测单帧图片,在视频序列的分析应用中性能表现不佳。本文以安防监控和家庭看护监控需求为导向,针对这些领域中常见的静态背景视频序列场景,研究并设计基于卷积神经网络的行人检测算法,从而改善算法性能。主要的研究内容如下:(1)对INRIA数据集进行处理,使用数据集增强的相关技术对其进行扩充,丰富数据集的多样性,为提高卷积神经网络复杂度、学习更多网络参数提供数据支持。常见行人检测数据集收集的是零散行人、背景图片或车载摄像头拍摄的动态背景视频数据,为了满足静态背景视频序列的要求,本文采集并标记了一些静态背景的行人视频序列,用于行人检测算法的测试。(2)构建了基于区域卷积神经网络的行人检测算法,通过优化网络结构、应用正则化、DROPOUT等技术,反复训练卷积神经网络,从而获得较好的网络收敛效果;然后对选择性搜索算法提取的大量候选区域进行识别,并采用非极大值抑制去除重叠、冗余的候选区域,取得了比传统HOG特征检测更好的行人检测性能。(3)针对静态背景视频序列的特点,改用三帧差分法提取候选区域,实现视频序列中动态目标区域的高效提取,并降低候选区域数量。然后使用卡尔曼滤波跟踪算法对候选区域进行补充,并使用微调后的卷积神经网络对候选区域进行判断。配合基于SIFT特征的帧间匹配去除偶发性误识别。最终改善了静态背景视频序列的行人检测算法性能。