论文部分内容阅读
针对传统的卷积神经网络应用在人群计数过程中的参数众多、计算消耗大,难以在轻量级平台上实现的问题,提出一种基于轻量级神经网络的人群计数模型。模型以人群的特征提取为导向,对VGG-16网络重新部署。利用GPU完成训练,在容器化开发环境下,利用深度学习的方法进行压缩量化编码,生成轻量级神经网络,提高资源利用效率。将轻量级网络模型部署到FPGA上,完成软硬件协同推断。在Mall Dataset数据集支持下进行系统验证,实验结果表明,该系统轻量化后的均方误差可达到18.4,能效比由在PC上的0.35提高到在F