论文部分内容阅读
近年来,在大规模人群聚集场合中踩踏事故频频发生,造成了大量的人员伤亡和财产损失,对社会公共安全造成了极大地威胁。尽管监控系统已经十分普及,可以对人群聚集场合进行实时监控,但是对人群管控和事故预防仍然缺乏有效的措施。而从监控图片和视频中及时准确的得到人群密度分布情况和总人数能够为事故预防提供有效信息。因此,在计算机视觉领域,人群计数的研究吸引了越来越多研究者的关注,成为当前具有很高研究价值的课题。本文针对图片人群计数进行了研究,提出了一种基于卷积神经网络的图片人群计数算法。该算法采用了密度图回归的方式,通过卷积神经网络学习图片和密度图之间的映射关系。为了适应人群图片中的人物尺度变化以及提升高密度人群图片中小目标的计数能力,算法采用的卷积神经网络划分为两个子网络结构,一个是用于处理尺度变化问题的特征提取网络,另一个是提升小目标计数能力的特征融合网络。当前解决多尺度问题普遍采用多列卷积神经网络和多输入卷积神经网络结构,但这两种结构均存在着各自的不足。针对这两种网络存在的缺点,本文提出的特征提取网络采用了单列网络结构,通过在单列网络中添加一些具有尺度变化感知能力的模块让网络具备处理尺度变化的能力。特征融合网络将特征提取网络中提取的不同尺度的特征图自高层向底层进行融合,将融合之后的特征图进行回归生成密度图,通过在高级语义特征中融入底层细节信息提升网络对小目标的感知和计数能力。本文在ShanghaiTech和UCF<sub>CC50数据集上进行一系列实验。首先,在ShanghaiTech数据集上进行验证性实验,对特征提取网络和特征融合网络分别在解决尺度变化问题和小目标计数问题上的有效性进行验证,实验结果表明本文提出的特征提取网络能够有效处理尺度变化问题的能力,特征融合网络能够提升算法对高密度人群图片中小目标的计数能力。然后,分别在ShanghaiTech和UCFCC50对本文提出的网络结构进行训练和测试,并将测试结果与当前一些主流的人群计数算法进行比较,证明了本文所提出的算法超越了当前大多数人群计数算法,具有优异的计数准确性和鲁棒性。