基于深度特征融合的单幅图像人群计数方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:jiooalpkla
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人群踩踏事件是现代生活中非常危险的事故之一,给人类的生存安全带来了极大的威胁,有效的抑制踩踏事故的发生对于现代化城市建设来说是必不可少。目前,通过将人群密度估计(或者人群计数)技术与人群行为分析相结合可以有效的分析场景中的异常事件,对危险做出预警,这也是目前比较有效的预防踩踏事件的措施之一。但人群计数任务本身容易受到图像中的透视、拥挤、遮挡、密度等因素的干扰,造成图像中的人头在尺度、外貌上出现比较大的变化,最终使得精确的人群计数变成了一个极具挑战性的任务。针对这个问题,本文从问题的根源出发提出了一个基于深度特征融合的人群计数方法,通过挖掘层级信息之间的相关性,以及多尺度的特征有效的融合实现了复杂场景下的人群密度估计。本文主要研究内容如下:1)探究了尺度信息对于人群计数的重要性,本文提出了一个层级多尺度融合模块来有效的逐层融合网络中的不同尺度信息。从而实现准确的人群计数。2)考虑到人群计数任务是对图像中特定的目标进行估计,受周围环境干扰比较严重,本文提出使用一个注意力机制模块来对网络学习到的特征图进行空间位置上的加权,从而有效的限制背景区域对人群计数任务的干扰。3)对于人群计数任务,当前的评价指标平均绝对误差(Mean Absolute Error,MAE)和均方误差(Mean Square Error,MSE)只在意总人数的正确,忽略了密度图本身的合理性。而峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)[1]和结构相似性(Structural Similarity Index Measure,SSIM)[2]的引入是希望度量生成密度图与标注的密度图之间的相关性,这与标签数据本身的不精确性相违背。在本文中引入了一种基于块的度量方式来度量人群密度图的合理性。最后,大量的相关实验表明本文的模型相对于现有的模型算法,在几个公开数据集上均实现了比较有竞争力的性能。这一定程度说明本文的模型在具有比较强性能的同时具有较强的泛化能力。
其他文献
随着网络技术的迅速发展,网络已经从各个方面不断地、深入地渗透到我们的社会生活当中。虽然网络给我们带来了太多的便利,但同时也使得信息安全的问题日益突出,已经成为影响国家政治稳定、经济发展、国防安全以及文化安全的重大问题。作为保障信息安全的密码学的重要分支,数字签名发挥着越来越重要的作用。基于属性的数字签名是于2007年提出的一类特殊数字签名,能够细粒度地划分身份特征,使得数字签名不再是签名者和验证者
Bezier曲线以及B样条曲线在传统几何设计中具有举足轻重的作用.近年来,随着几何工业的发展,传统Bezier曲线以及B样条曲线因其本身的缺陷已经很难满足人们的需要.与此同时许多有理形式的Bezier曲线被提出来,这解决了传统方法的问题,但有理化方法不仅存在渐进问题,而且权因子的使用不当会对曲线曲面设计产生一定的破坏性.鉴于上述问题,大量带形状参数的类Bernstein基或类B样条基孕育而出.目前
为满足尖端技术领域对钨合金零件提出的高表面质量要求,需对钨合金零件进行精密/超精密加工。但目前采用切削等方式加工时存在严重的刀具磨损现象,使获得的钨合金零件表面质
随着工业制造等行业的迅猛发展,工艺水平不断提高,作为保证产品质量的测量定位工作也变得愈发重要,实现高精度的自动化定位成为研究热点和难点。相较于人工定位,激光定位具有检测精度高、安全性好、操作便捷等优点,但是传统的激光中心位置检测算法对光斑形态要求较高,在光斑出现一定畸变时,计算结果可能会出现较大误差。因此,需要提高复杂情况下的激光光斑中心检测精度,保证测量工作的顺利完成。本文的主要研究内容是激光光
论文主要研究塔里木盆地柯坪、巴楚、塔中和塔北地区寒武系盐下肖尔布拉克组白云岩,以碳酸盐岩沉积岩石学、石油地质学、储层地质学等多门学科为理论基础,结合野外露头、岩心
红外探测技术在军事、农业、工业、交通、航空航天、医疗等领域有广泛应用。作为红外探测技术的核心器件,红外探测器及其应用技术是各国争先发展的热点和核心。扩大红外探测器成像面阵规模、缩小像元尺寸是红外探测器发展的主流方向。对红外探测器的验证测试是检验红外探测器性能品质的重要环节,也是红外探测器后端工艺改进的重要依据和支撑。多通道大面阵红外探测器在天文观测、光度测量、对地观测等领域有着至关重要的作用。我国
长周期结构因其特殊的显微组织和优异的性能而广泛受到研究者们的关注。由于其堆垛结构的复杂性以及其独特的组织结构,人们在对长周期结构物质在进行EBSD分析时,发现电子束入
在日常表达中,我们使用隐喻表达抽象的认知体验或者传达审美感受。同时,我们的认知思维机制和概念系统是建立在隐喻之上。因此,隐喻机制的计算实现是自然语言处理任务中必不可少的一环。隐喻计算旨在发掘和表征语言中普适存在的隐喻机制,一般包含如下两个方面的内容:一是识别语料中的隐喻表达,与非隐喻表达进行区分;二是描述隐喻的表述意义,实现隐喻意义的有效理解。本文基于隐喻的认知与语言学特性,运用相关计算模型,解决
近年来,随着科学技术的进步,收集到数据的维数也越来越大。因此如何有效地从海量数据中挖掘出有用的信息逐渐成为科学研究的热点问题。尤其是在生物统计以及基因研究的领域,数据的维度通常都是远高于样本数量(n>>p),又称之为超高维数据。目前统计学中的多数方法以及很多机器学习中的算法只能适用于低维数据,而高维以及超高维领域的研究却相对较少。在超高维的研究范畴中,通常会先将数据的维度降低到可以处理
经历了多年的发展,人工神经网络演化出多种独特的结构。卷积神经网络(CNN)由于在计算机视觉、语音识别和自然语言处理等领域的出色表现引起了研究人员的广泛关注。然而,随着CNN的功能越来越强大其网络模型也越来越庞大,训练耗时,对硬件要求苛刻等一系列问题制约着CNN的发展。因此,对CNN模型压缩的需求应声而出。针对上述问题,本文提出了一种基于逐步修剪策略的CNN模型压缩方法。与前人通过对权重修剪以减少C