论文部分内容阅读
随着交通事业的快速发展,以商圈、交通枢纽为中心的人群聚集的公共场所越来越多。随之带来的安全隐含是政府和商家长期困扰的问题,及时获取准确的人群信息是解决这一问题的关键所在。从计算机视觉领域看,及时获取人群信息就是要提高目标检测技术,达到速度快而且精度高的现实要求。从目前的密集人群目标检测器市场投入看,平均精度低是影响目标检测器大规模应用的最主要原因。因此,提高目标检测器的平均精度是解决人群聚集场所安全隐患的关键所在。 论文完成的主要工作: (1)针对DPM(Deformable Part Model)检测器检测速度过慢的问题,本文提出了一种对该检测器进行优化加速的并行算法。该算法米用OpenMP(Open Multi- Processing)并行技术对生成HOG(Histogrrams of Oriented Gradients)特征金子塔过程的中间数据和模型匹配过程的输入数据进行划分,充分利用多核CPU(Central Processing Unit)的硬件计算资源,让每个核都承担划分的计算任务,进而提高计算效率。该算法还使用SIMD(Single Instruction Multiple Data)技术,调用AVX(Advanced Vector Extensions)指令对filter和HOG特征的32维点积操作进行加速。优化加速后的DPM检测器称为Faster DPM检测器。实验结果表明该并行算法具有较高的加速比,相比于DPM检测器,Faster DPM检测器具有更高的检测效率。 (2)针对密集人群环境下目标检测技术精度低的问题,本文提出一种基于深度卷积神经网络的人头目标检测器,称为AnyScale检测器。该检测器摒弃传统的检测层结构模式,采用卷积层作为检测层,突破了传统目标检测器对输入图像的尺寸限制,保证检测器在输入端能够保留真实的图像信息,对提高检测精度起到积极作用。该检测器根据密集人群目标检测这一特殊应用环境,引入“锚”的概念,对输入标签信息进行参数化,使得目标检测器能够适用密集目标环境。实验结果表明,在密集人群目标检测环境下,相比与当前其他主要的目标检测器,AnyScale检测器具有更高的检测平均精度。 (3)针对单一目标检测器检测精度偏低的问题,本文提出一种基于集成学习理论的多尺度检测器。该检测器为异质集成学习器,包含两个个体学习器,分别是Faster DPM检测器和AnyScale检测器。多尺度检测器的结合模块在兼顾两个个体检测器各自优势的同时,删除冗余的预测目标,输出最合理的检测结果。使得粗尺度时,依赖Faster DPM检测器;细尺度时,依赖AnyScale检测器。实验结果表明,相比于单一的检测器,多尺度检测器在检测精度上有显著提升。