机器学习在视频监控下的人群计数研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:goodluckxsb1223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人群计数旨在利用给定场景中的人群特征估计人数和密度分布,其作为一项视频图像处理技术在当今很多行业中都发挥着重要的作用。尤其随着世界人口增长和城市化进程发展,人群计数的应用场景也越来越多,对社会安全和人群控制管理有着举足轻重的意义。得益于计算机硬件不断提升和深度学习飞速发展,近年来人群计数的研究取得了相当大的进展。本文针对不同复杂场景具体分析了现阶段人群计数存在的困难和挑战,主要研究和解决了场景中存在的背景误判、密度分布不均等难题,设计了三种基于卷积神经网络的人群计数算法,均显著提高了计数精度和密度估计图质量,并在常用数据集上验证了其有效性和鲁棒性,主要研究和创新如下:(1)为了增强感兴趣特征并减少背景错误预测,提出一种基于前背景双向监督的空间感知人群计数算法。通过融合通道特征和空间特征,从两个维度上强调高响应特征,增强人群特征的表现力,从而提升网络的表征能力。最后利用两个解码分支分别监督前景和背景预测,加强网络对人头和背景的分辨力,显著减少了背景噪声的误判,提升网络对复杂背景的鲁棒性。(2)为了增强人头特征的表现力,继而提高模型性能,提出基于多层监督的双任务交互人群计数算法,该算法通过监督不同阶段人群特征的分布和计数结果提升网络效率。早期前景增强模块通过提升浅层网络对前景的关注度来提升其对背景噪声的辨别力。计数层根据不同区域对预测结果的贡献度强调了高密集区和易误判区的特征,有效减少了前景预测不足导致的漏判和易混淆背景误判。该算法中不同层次的监督将协同工作,利用多层语义信息自适应地强调高响应特征,以极小的空间代价大幅提升了模型性能。(3)为了提升网络在分布稀疏区域的表现以及进一步减少背景误判,提出基于背景抑制的前景注意力人群计数算法。该算法通过强调前景特征对计数的响应显著提升了稀疏区域预测精度,避免了人群响应图调权对密集区域的过度关注。同时,该算法还通过惩罚密度估计图中在背景上的错误预测,显著减少了密度估计图中背景区域的错误预测,有助于后续场景分析工作。大量的实验和分析证明了本文算法的有效性,其不仅拥有更好的计数能力,还显著提升了密度估计图质量,这为后续场景分析和人群定位工作奠定了很好的基础。
其他文献
移动边缘计算(Mobile Edge Computing,MEC)作为5G可能的关键性技术基础,通过将服务节点下沉到更接近用户的位置,在网络边缘为用户提供计算、通信与存储服务,从而减少处理任务产生的时延和能耗。考虑到无人机灵活、易部署的特点,可以将它作为移动边缘服务器,为终端设备提供有效的通信覆盖。此外,还可以将它作为供能平台,利用无线充电技术为设备提供任务卸载的能量。然而,环境造成的信号阻塞和阴
学位
文本匹配任务旨在从两段文本中挖掘内在的语义特征,预测文本间相关性或者矛盾性。作为自然语言处理领域最重要的任务之一,文本匹配一直是领域内众多研究们关注的焦点任务。受益于其部署易、响应快、模型小、通用性强等特点,在智能问答、搜索引擎以及手机小助手等领域占据核心地位。但该领域仍然存在一些问题,阻碍着文本匹配进一步的发展。为了提高模型研究的准确率,研究者们提出对文本表征进行交互,加强文本之间的联系性。但是
学位
三维人体姿态估计任务旨在从单目或多目视频图像中预测出准确的三维人体姿态。得益于低成本、高效率、易部署等优点,三维人体姿态估计在虚拟现实、智慧医疗、自动驾驶、人机交互等领域有着广泛的应用前景。作为计算机视觉领域的热门研究课题之一,三维人体姿态估计一直受到业内研究者的广泛关注。但该课题依然面临着诸多问题,限制其进一步的发展。虽然研究者们通过引入时序信息以及多视角信息,提高了算法预测的准确度。但是对于复
学位
命名实体识别(Named Entity Recognition,NER)旨在从非结构化文本中提取出人名、地名、机构名或其他专有名词等类型的实体。其作为自然语言处理领域的基础任务之一,在对话问答、机器翻译、信息检索和知识图谱等各种自然语言处理任务中承担着重要的角色,在许多落地应用中具有关键性作用。近年来,命名实体识别技术虽已趋向成熟,但仍然面临许多挑战,尤其是在中文命名实体识别方向中,字词边界模糊、
学位
针对目前推荐算法存在的问题,本文对社交化推荐场景中的推荐方法进行研究,设计了两个基于图神经网络的社交化推荐算法框架,实现提高召回率、优化排序结果的目的。本文的主要研究内容如下:1.基于多图注意力融合的社交化推荐算法。图神经网络技术在社交化推荐领域中有着广泛的应用。然而,随着扩散深度的增加,它往往会导致过度平滑问题,从而抑制其性能。本文提出了一种基于相似性的多关系注意力网络用于社交化推荐场景。提出的
学位
高分辨率高光谱图像同时具有丰富的空间信息以及丰富的光谱信息。因此,高分辨率高光谱图像在目标检测、识别以及跟踪领域有丰富的应用空间。然而,受囿于当前成像设备性能的不足,我们无法直接获取到高分辨率高光谱图像。而是只能退而求其次,在空间上以及光谱上进行一定的退化,转而对同一取景取得一组低分辨率高光谱图像和高分辨率多光谱图像,再通过一定算法的处理,将这一组图像尽可能重建还原成高质量的高分辨率高光谱图像。这
学位
作为图像理解和计算机视觉的基石,目标检测是解决图像分割、场景理解、目标追踪等任务的基础。现在目标检测算法种类繁多,根据是否包含区域建议网络可以分为两阶段目标检测算法和单阶段目标检测算法。根据是否具有锚框又分为基于锚框的目标检测算法和无锚目标检测算法。虽然现在的目标检测算法在精度和速度上都取得极大提升,但是由于视角的多样性,多尺度变化,遮挡和光照强度等复杂场景的影响,以及模型的泛化能力不足等问题使得
学位
阿尔茨海默症(Alzheimer’s Disease,AD)是一种不可逆的大脑神经退行性疾病,一旦发病就没有治愈的可能。随着我国老龄化程度的加深,阿尔茨海默症患者越来越多,给家庭和社会都带来了沉重的负担。日渐增多的患者,极大地增加了相关领域医生的工作量,而计算机技术飞速发展,使之在医学领域有广泛的应用。近年来深度学习技术蓬勃发展,使得深度学习技术在医疗图像的分类、分割等领域有了广泛的应用。因此利用
学位
近年来,随着深度学习的迅速发展,伴随着计算机硬件性能的快速提升,行人重识别在智能监控、智能安保领域扮演着越来越重要的角色,吸引了研究者的广泛关注。相较于过去基于手工设计特征的行人重识别方法,基于卷积神经网络的行人重识别方法从大规模行人图像数据中挖掘信息,具备更好的特征表示能力。很多最近的研究在这一领域取得了一定的成果,但仍存在很多问题需要解决。在行人重识别研究中,按监督级别的不同,可以大致划分为有
学位
准确和鲁棒的视觉目标跟踪是计算机视觉领域中最具挑战性的基础任务之一,在智慧安防、自动驾驶和机器视觉等场景中有着非常广泛的应用。在只给定初始目标状态的情况下,目标跟踪旨在实现对图像序列中后续目标轨迹和状态的准确估计,对目标跟踪算法提出了很高的要求。经过国内外学者多年的研究,目标跟踪方法取得了很大的进展。尤其是近些年来,基于孪生网络的算法提供了全新的跟踪范式,得到了广泛的关注,极大地推动了目标跟踪领域
学位