论文部分内容阅读
随着经济的发展社会的进步,世界人口规模不断扩增,人口密度不断增大,在人类社会活动场所、内容形式变得丰富多彩的同时,人群的安全问题成为了社会各界关注的焦点。如一些购物广场、体育馆、音乐会场、商业街等公共场所常常分布着不同数量规模的人群,随着人群数量的增加,发生安全事故的概率随之增长,如何对聚集在一起的人群进行有效的分析成为了当下研究的热门问题。依靠人工观看监控视频分析人群行为并做出相应决策的方法,往往缺乏时效性与准确性。而传统的通过不同的特征提取算法来提取行人特征的人群分析方法,常常因为人工提取的特征通用性差,不能准确地反映密集人群的特点,因此具有较低的准确性和鲁棒性。近年来深度学习在各领域中取得了前所未有的成就,一些基于深度学习的密集人群图像分析方法相继被提出,但是这些方法往往具有庞大的参数量,难以部署应用于移动端、嵌入式设备等计算资源不充足场景下的密集人群分析任务。此外,这些方法的准确性与鲁棒性还有待进一步提升。本文针对上述现有方法的不足,分别提出了一种用于密集人群图像分析的轻量级卷积神经网络和一种特征共享卷积神经网络。
本文提出的轻量级密集人群图像分析网络仅包含不到一百万的参数量,并且在CPU上能以平均2.5秒/帧的速度对分辨率为768?1024的密集人群图像进行分析。该轻量级网络利用了一个尺度感知模块提取尺寸大小不同的行人特征,然后将这些特征回归到一个粗糙的密度图上,最后利用自编码器对密度图进行细化提纯,获得准确率更高的人群分布密度图。本文提出的轻量级网络在两个公共数据集上获得了良好的性能表现,实现了准确度和复杂度上的平衡,适合部署于移动端和嵌入式等计算资源不充足的设备上进行密集人群图像分析。
为了进一步提高密集人群图像分析方法的准确性,本文从提高特征利用率的角度出发,提出了一种特征共享卷积神经网络用于密集人群图像分析。该网络使用迁移学习将分类网络VGG16在ImageNet数据集上预训练好的前十层卷积网络用来提取通用性特征,然后利用一个特征共享模块S-Module对通用性特征进行组合、抽象成为高级行人特征,充分利用不同抽象级别的特征进行回归获得一个人群分布密度图。作者在三个数据集上与现有的其他方法进行了对比实验,结果表明本文提出的特征共享卷积神经网络具有较高的准确性和鲁棒性,可用于准确性要求较高的密集人群图像分析任务。
本文提出的轻量级密集人群图像分析网络仅包含不到一百万的参数量,并且在CPU上能以平均2.5秒/帧的速度对分辨率为768?1024的密集人群图像进行分析。该轻量级网络利用了一个尺度感知模块提取尺寸大小不同的行人特征,然后将这些特征回归到一个粗糙的密度图上,最后利用自编码器对密度图进行细化提纯,获得准确率更高的人群分布密度图。本文提出的轻量级网络在两个公共数据集上获得了良好的性能表现,实现了准确度和复杂度上的平衡,适合部署于移动端和嵌入式等计算资源不充足的设备上进行密集人群图像分析。
为了进一步提高密集人群图像分析方法的准确性,本文从提高特征利用率的角度出发,提出了一种特征共享卷积神经网络用于密集人群图像分析。该网络使用迁移学习将分类网络VGG16在ImageNet数据集上预训练好的前十层卷积网络用来提取通用性特征,然后利用一个特征共享模块S-Module对通用性特征进行组合、抽象成为高级行人特征,充分利用不同抽象级别的特征进行回归获得一个人群分布密度图。作者在三个数据集上与现有的其他方法进行了对比实验,结果表明本文提出的特征共享卷积神经网络具有较高的准确性和鲁棒性,可用于准确性要求较高的密集人群图像分析任务。