【摘 要】
:
人群计数是计算机视觉的一个重要研究课题,其主要任务是估计出一张图像包含的人群数量。人群计数算法被广泛应用于公共安全、交通管理及生物研究等多个领域,具有极高的科学研究价值。近年来,研究者通过卷积神经网络回归密度图的方法实现了计数精度的提升。然而,受到图像中人群尺度变化的影响,实现人群数量的准确估计仍然是一项充满挑战的任务。因此,本文在卷积神经网络回归密度图方法的基础上提出了多特征融合策略以解决人群尺
论文部分内容阅读
人群计数是计算机视觉的一个重要研究课题,其主要任务是估计出一张图像包含的人群数量。人群计数算法被广泛应用于公共安全、交通管理及生物研究等多个领域,具有极高的科学研究价值。近年来,研究者通过卷积神经网络回归密度图的方法实现了计数精度的提升。然而,受到图像中人群尺度变化的影响,实现人群数量的准确估计仍然是一项充满挑战的任务。因此,本文在卷积神经网络回归密度图方法的基础上提出了多特征融合策略以解决人群尺度变化问题,主要的研究内容及创新之处如下:(1)提出一种基于多层级特征融合网络的人群计数算法。首先,使用VGG16网络提取图像的多层级特征。然后,将深层特征上采样与浅层特征进行通道拼接,并使用注意力机制实现特征的通道域和空间域的信息增强。接着,使用残差块对增强的特征进一步细化,融合有效信息。最后,采用压缩模块将融合的多层级特征映射为密度图。算法采用均方误差和结构相似性损失组成的联合损失函数训练网络,提高密度图的生成质量。实验结果表明,本文提出的算法在三个公开数据集上提升了人群计数的精度和稳定性。(2)提出一种基于多尺度特征融合网络的人群计数算法。为了更好地解决尺度变化问题,算法在融合多层级特征的基础上进一步融合多尺度特征。首先,采用VGG16网络提取图像的多层级特征。然后,使用跳跃拼接的方法实现特征的跨层级融合。接着,采用不同大小的空洞卷积提取多尺度特征,并利用注意力机制实现多尺度特征的融合。最后,采用压缩模块将融合的多尺度特征映射为密度图。实验结果表明,本文提出的算法在三个公开数据集上进一步提升了人群计数的精度和稳定性。为了进一步提高所提算法的实用性,设计并实现了一个基于多尺度特征融合网络的人群计数系统。首先,用户在界面的本地数据地址栏输入监控视频的存储地址并同时设置好报表的保存地址。然后,系统执行数据处理、模型加载、人群数量预测、结果可视化和报表生成等操作。最后,将视频帧文件和预测结果显示在相应的可视化窗口上。功能测试结果表明,系统达到了预期效果。图37幅,表23个,参考文献76篇。
其他文献
煤是一种富含有机质和少量无机矿物的沉积岩。其中,矿物质的存在降低了煤的质量和利用价值,严重影响煤层气井后期的产气量。因此,煤炭利用前往往要脱出矿物质。其中化学脱灰是较常用的手段,但除去矿物质时,可能对煤的溶剂萃取性能及萃余物结构造成影响。本文以山西古交焦煤为例,首先对采自新鲜工作面的焦煤煤样HCI、HF酸处理,以除去煤中碳酸盐和硅酸盐矿物,得到酸洗煤样(DC),而后在不同温度下用不同浓度的四氢呋喃
属性基加密作为一种新型的公钥密码原语,通过对用户私钥或密文设置属性集或访问结构,只有属性集和访问结构相匹配时才能解密,实现了云存储环境中数据的安全共享与细粒度访问控制功能。但在属性基加密方案中,其计算开销会随着属性数量的增加和访问结构复杂度呈线性递增关系,尤其是可穿戴设备的大量应用,无疑给设备终端带来庞大的计算负担,如何减少设备的存储和计算成本显得至关重要;此外,数据拥有者依照访问策略将加密后的密
随着全球环境污染问题与能源危机日益严峻,新能源的开发与利用成为未来发展的新趋势。电动汽车是新能源在汽车行业的应用,以其高性能、低污染的优势列入我国七大战略性新型产业之中。电池作为电动汽车的核心部件,需要电池管理系统(Battery Management System,BMS)对其进行有效的管理,以提高整车系统的高效性与稳定性。BMS的主要功能包括电池状态分析、数据采集、能量控制管理、安全保护、均衡
图像语义分割通过给每个像素分配相应的语义标签来解释与理解图像,被广泛应用于自动驾驶、医疗图像辅助诊断等领域。近年来,随着以卷积神经网络为代表的深度学习技术的不断发展,基于深度学习的图像语义分割方法被相继提了出来。语义信息与空间信息是语义分割的两个主题,二者对提高语义分割的性能都起到重要的作用。语义信息是图像中深层次特征的抽象表示,有利于对像素分类;空间信息包含着图像的空间结构,有助于准确预测目标边
随着移动定位技术的成熟和无线通信技术的持续发展,基于位置的服务与人们的生活越来越密不可分,但是在用户享受该服务带来的便利的同时,也面临着位置隐私泄露的风险。在位置信息产生、存储、处理和使用的过程中保护其不被攻击者获取利用的前提下,满足人们各种各样的基于位置的服务请求成为亟待解决的问题,受到研究者们的普遍关注。本文围绕位置隐私保护问题,系统分析了现有的位置隐私保护技术。传统的假位置生成算法产生的虚假
随着移动智能终端、无线通信网络和定位技术的发展,基于位置服务(Location Based Services,LBS)技术得到日益广泛的应用。用户对LBS的依赖性与日俱增的同时,也面临着个人隐私泄露的风险。近年来,国内外学者在位置隐私保护领域做了大量工作并取得一系列成果。现有的位置隐私保护方案大多采用的是基于可信第三方(Trusted Third Party,TTP)的集中式结构,但现实中可信第三
在流化床粉煤气化运行过程中,由于气泡运动而造成的压力波动已得到广泛认同。压力波动的随机性和间歇性会给设备和安全生产带来极大的危害。对此,本文以流化床中气泡运动引起的压力波动为研究对象,对不同流型的压力波动风险进行分析,并通过K-means聚类算法识别不同流型。首先,本文采用广义极值分布对流化床运行过程中的四种流型压力波动数据进行极值统计建模。结果表明,采用广义极值分布拟合随机过程下的压力波动数据得
人体姿态估计是计算机视觉领域的基础性问题之一,它在行为识别、人机交互、游戏、动画、自动驾驶等领域均有着广阔的应用前景。基于深度学习的静态图像人体姿态估计任务是将图片输入到网络模型中,输出图片中人体关键点(如头部、手腕、膝盖等关节)的精确像素位置。对静态图像进行人体姿态估计是视频姿势估计和跟踪等相关问题的基础,同时对于动作识别等更高层次的任务也非常有帮助。随着深度学习技术的发展,静态图像人体姿态估计
随着信息技术的高速发展,“互联网+”时代的到来使得大数据应用到了人们社交、交易、购物等方方面面。人们可以在足不出户的前提下完成很多的操作,但与此同时,大量的数据暴露在网络之中,有价值的隐私信息被不断的挖掘,人们的隐私遭受了前所未有的威胁,对隐私的保护成为了社会各界关注的焦点。由于安全多方计算可以在不泄露隐私的前提下完成交互式计算,因此在亟需隐私保护的当下,对于安全多方计算的研究,具有极其重要的科学
基于对水利行业重点院校、大中型设计院、BIM软件公司、造价软件企业等相关单位以及重点大中型水利项目等的调研成果,对BIM在水利工程造价行业的应用现状进行介绍和总结,分析其存在的主要问题,对将水利工程造价融入BIM设计流程、实现精准造价、提升造价工作效率3方面的应用需求进行梳理。根据现状发展水平和行业需求,提出水利工程造价与BIM技术应用相结合方案的“三阶段”发展设想,即实现工程量和造价信息等基础信