论文部分内容阅读
近年来,机器学习由于硬件技术的大幅提升以及算法的改进,再一次进入了新一轮的热潮。机器学习的热潮为计算机视觉的很多问题提供了解决思路和方法,而且很多解决方案已经转化为产品应用在人类生活的方方面面。机器学习和计算机视觉相结合,可以解决很多现实问题。在传统的影像获取中,最常见的方式是用固定在某个地点的摄像头进行视频或者图片的获取,然后进行相应的处理。随着低空监测影像获取难度的下降,基于低空监测影像的行人检测有了研究意义。在以上描述的背景下,本文主要研究基于低空监测影像的人流识别与密度估计。针对基于视频数据的行人检测问题,本文在传统的HOG+SVM行人检测方法的基础上,结合低秩稀疏矩阵分解的方法进行了改进。通过低秩稀疏矩阵分解,提取出视频连续帧中的稀疏部分,经过处理后可作为前景部分。将这一部分与传统HOG+SVM的检测结果进行结合,由此降低误检率。实验结果表明,与传统HOG+SVM行人检测方法相比,本文提出的改进方法在保持召回率基本不变的同时,可以降低误检率。针对基于图像数据的行人检测问题,本文在Fast YOLO神经网络的基础上,对Fast YOLO的网络结构进行了改进。原Fast YOLO神经网络是基于darknet接口的,本文将用Caffe接口进行实现。并且,原Fast YOLO的网络结构只有九层卷积层,在特征的提取上并不全面,本文将参考Goog Le Net的网络结构,进行相应的修改,以提升网络结构的宽度和深度。实验结果表明,改进后的Fast YOLO神经网络与原Fast YOLO网络相比,在提升了召回率的同时,降低了误检率。针对行人检测问题,本文设计并实现了一个行人检测处理系统。系统共分为五个模块:实时预览模块,云台控制模块,行人检测模块,兴趣点定位模块和与地图结合的定位模块。本文设计实现的系统可以完成获取图片、视频的功能,行人检测的功能以及兴趣点定位等功能。