基于多尺度信息与注意力机制的人群密度估计算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:itartan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的十年里,随着世界人口的增长和人民生活水平的不断提升,节假日期间的人口大规模流动现象越来越普遍,社会公共安全、城市交通监管和城市规划等领域面临着巨大的挑战。拥挤和踩踏等安全事故经常发生在人群密集的场所。因此,越来越多的科研人员致力于人群计数与密度估计研究。深度学习的兴起,极大的推动了计算机视觉任务研究的发展。在人群计数与密度估计问题上,基于卷积神经网络的人群计数方案可以很好的应对许多诸如人群分布不均、尺度变化、透视扭曲和光照变化等难点。本文首先系统性地对现有的计数和密度估计算法进行分析,然后提出了两种算法,从不同角度解决尺度变化以及透视失真等问题,并在现有的公开数据集ShanghaiTech、UCFCC50和MALL上进行算法评估,论证了所提出算法的可行性和有效性。具体研究工作如下:1.介绍了一种基于感知尺度的人群计数方法。其主要思想为:将人群计数与密度估计任务划分为三个阶段,第一个阶段的主要功能为特征编码,并通过采用图像金字塔集合作为输入来初步增加计数模型对于多尺度特征信息表达的多样性;第二阶段的主要功能为多尺度信息提取,本文通过设计新颖的尺度感知模块与反向尺度感知模块进一步促进计数模型对多尺度信息的挖掘;第三个阶段的主要功能为生成人群分布密度图,该阶段主要由三路不同空洞率的空洞卷积列组成,并利用不同分支回归的特征图生成最终的人群分布密度图。此外,该算法在顶层卷积和底层空洞卷积层之间使用跳跃连接来降低网络梯度消失和梯度爆炸等风险,并利用中间监督策略优化网络参数。2.提出了一种用于人群计数的多阶段注意力卷积神经网络。其主要思想为:多阶段注意力卷积神经网络主要由分级密度估计器、软注意力机制模块和辅助计数分类器组成。分级密度估计器利用分级策略以由粗到细的方式挖掘语义特征与多尺度信息,并以此来解决尺度变化与透视失真问题。此外,本文考虑到背景噪声影响着生成密度图质量,于是将软注意力机制集成到模型中来拉伸前景与背景距离,从而进一步提升密度图质量。除此之外,受多任务学习的启发,本文在计数模型中嵌入辅助计数分类器执行计数分类辅助任务,从而增加模型对于语义信息的表达能力。大量的实验结果论证了所提出算法在解决尺度变化、透视失真问题的有效性与可行性。
其他文献
21世纪以来,为了寻求清洁能源替代日渐枯竭的传统不可再生的石化能源,光伏产业应运而生。虽然太阳能电池在产生电能的过程是清洁无污染的,但是其生产过程会产生大量的光伏晶
我国证券市场发展至今已有20多年的历史,在取得巨大进步的同时也存在一些不足,如2015年曾出现过多次极端行情,极大地打击了投资者的热情,阻碍了市场的健康发展。目前我国证券市场的投资者结构与美国等发达市场的投资者结构有所不同,个人投资者占比高达30%,约为机构投资者的三倍,美国这一比例只有15%,英国、日本的比例更低。由于个人投资者在学历背景、市场经验方面参差不齐,往往交易频率过高,容易追涨杀跌,机
党的十九大报告指出,创新是引领发展的第一动力,是建设现代化经济体系的战略支撑。报告中10余次提到科技、50余次强调创新。创新是一个民族进步的不竭动力,也是一个企业生存发展的力量之源。创新本质上也是一种投资活动。为了实现创新,企业需要投入大量的人力和财力资源,但是归根结底还是资金的投入。投资多少资金进行新技术、新产品、新工艺的研发是每个上市公司都必须面对的重大问题。影响企业研发投入的因素多种多样。上
随着科学技术的发展和数据的爆炸式增长,大数据、互联网和云计算应运而生。与此同时,迅速推动了信息传输、信息挖掘和信息存储等发展。然而,数据的安全性成为前所未有的挑战。现在的大数据以各种各样的形式存在,而图像是常用的信息存储和传输的载体;其中,医学图像承载着人们身体状况等信息。随着医疗技术的发展,人们在享受远程医疗和医疗共享所带来的便利的同时,遭受到信息安全问题的威胁。因此,针对病人的隐私保护和医学图
技术创新是企业不断发展的源动力,也是企业形成核心竞争力和保持竞争优势的重要因素。创业板作为我国多层次资本市场中的重要力量,自成立以来,在培育新兴产业、助推我国经济转型中起到关键作用。但历经多年发展,创业板上市企业技术创新水平并没有得到显著提升。考虑到企业在特定时期内无法选择自身面对的市场结构,因此本文着眼于企业内部治理,研究股权结构如何影响创业板上市企业技术创新。基于此背景及意义,本文在对大量文献
电子设备的不断进步及广泛应用使得空间人为造成的电磁能量持续增长,大量电磁噪声以电磁场形式在空间传播,电磁环境日益复杂。为保证电子设备能在复杂电磁环境中正常运行,必
禽白血病病毒(Avian leukosis virus,ALV)是一种宿主为禽类的具有传染性的反转录病毒,临床上主要引起禽类发生良性或恶性肿瘤、免疫抑制、产蛋率下降、体重减轻和死亡等。鸡禽
贫困问题一直备受关注。在宏观层面上,贫困人口的数量以及贫困率的高低都会影响国家的经济发展和社会民生;在微观层面上,贫困也制约着个体的自由发展。就其本质而言,贫困是一个多维的现象。可能表现为家庭收入低于官方贫困线的经济贫困,也可能体现为营养水平不达标的健康贫困。2016年我国流动人口数量约2.45亿人,在为流入地创造经济财富、加快工业化和城市化进程的同时,大量的人口聚集也加大了对社会服务的需求,进而
习近平总书记在党的十九大报告关于推动中华优秀传统文化创造性转化、创新性发展的重要论述,表明了文化建设的重要作用。中国传统文化的根在乡村,乡村蕴含着丰富的文化资源,尤其传统村落是中华优秀传统文化的承载者。近年来,中国快速的城市化进程使得很多的传统村落逐渐消失,同时也使得具有丰富的自然和人文遗产的传统村落备受青睐,乡村旅游蔚然成风。旅游经济型传统村落正是以古老的乡村文化为特色发展旅游经济的传统村落。乡
学位
基于强度传输方程的层析重建作为典型的非干涉三维重建方法,已经成为目前大量研究的热点。而在相位的层析重建中,通常需要获得多个方向的相位信息。虽然来自光场角矩成像的技术能够给出一个有透视效果的重建光场,但其并不能直接得到相位信息,并且不能直接得到物体的三维形状。另一方面,通过强度传输方程求解相位信息需要轴向强度微分,通常强度微分的获取是通过两幅强度之间的有限差分得到的,其精度不能得到保证。因此,如何提