人群计数的泛化性方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ncwuer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人群计数任务是指对图像中的人数进行准确估计,在交通控制、安全监测和环境研究等方面有很高的应用价值。近年来,研究者们对基于深度卷积神经网络的人群计数方法进行了深入研究,人群计数模型的性能越来越优异。然而,人群计数任务的泛化性问题却研究较少,不具备泛化性的人群计数方法的应用范围十分受限。基于上述研究背景,本文对人群计数任务的泛化性问题进行探索,并提出了人群计数的泛化性方法。本文完成的主要工作如下:(1)针对人群图像间存在风格差异以及图像内部存在细粒度风格差异,使人群计数模型的泛化性下降的问题,提出了基于细粒度风格注意力的人群计数方法。首先使用实例批归一化模块滤除风格信息,然而细粒度风格信息的存在导致一些内容信息可能被滤除,内容信息的不完整会影响模型的性能。为了恢复被滤除的内容信息,本文引入集成学习的思想和注意力机制,设计了多样化的细粒度风格注意力模块。该模块中各个集成子分支输出的注意力图聚焦于不同区域的内容信息,所有子分支互相协作将内容信息提取完整。此外,由于多样性是集成学习的关键,本文提出了多样化学习策略来保证多样化的细粒度风格注意力模块的输出多样性。(2)针对多样化的细粒度风格注意力模块采用所有多样化内容特征相加的集成方式,可能导致特征冗余从而影响模型性能的问题,提出了基于门控集成的人群计数方法。本文引入门控机制设计了通道级别的二值门控模块,对多样化内容特征自适应地进行通道级别的选择,被选中的特征参与集成,从而在利用特征互补性的同时避免了特征的冗余。此外,本文提出输入依赖引导、多样性特征先验和密度等级分类约束等策略来进一步提升通道级别的二值门控模块的准确性和泛化性。(3)在人群计数的公开数据集Shanghai Tech_A(SA)、Shanghai Tech_B(SB)、UCF_QNRF(UQ)以及UCF_CCF50(UC)上,本文对上述两种人群计数方法分别与其他优秀的人群计数方法进行了泛化性对比实验,并通过消融实验对提出模块及策略的有效性进行验证。基于细粒度风格注意力的人群计数方法的对比实验结果显示,该方法在泛化性测试组SA到SB、SB到SA以及UQ到SB和UC的平均绝对误差(Mean Absolute Error,MAE)指标和均方误差(Mean Squared Error,MSE)指标达到最好,即取得了最好的泛化性效果,在其他测试组上的泛化性效果也排名靠前;消融实验对多样化的内容特征以及多样化学习策略进行了验证,实验结果证明了它们的有效性。基于门控集成的人群计数方法的对比实验结果显示,该方法在泛化性测试组SA到UC、UQ到SB的MAE指标和MSE指标以及UQ到UC的MSE指标达到最好,具有最好的泛化性,在其他测试组上的泛化性效果也很有竞争力;消融实验对提出的输入依赖引导、多样性特征先验以及密度等级分类约束等策略进行了实验验证,实验结果显示这些策略提升了模型的性能。
其他文献
X射线层析成像(Computed Tomography,CT)能够清晰呈现物体三维结构,因此被广泛应用于医学影像诊断和工业无损探伤等领域。但该技术也存在一定的局限,由于重建三维图像需要采集数以百计的投影,导致重建时间长、辐射剂量大。为解决以上问题,此前的研究从减少投影采集角度入手,提出了基于有限角度、稀疏角度甚至单视角进行CT重建的方法。尽管近年来深度学习的飞速发展加快了单视角CT重建的研究,但目
学位
随社会经济的飞速发展,陆地的许多资源已无法满足人们需要,对海洋资源的开发处于一个十分重要的战略地位。水声通信在海洋资源的环境勘探与开发等方面扮演着不可或缺的角色。相较陆地无线通信系统,水声通信面临更多挑战,如时延扩展长、带宽受限、多普勒效应显著以及快速时变等。为实现在复杂多变水声信道中的可靠通信,本文将正交时频空间调制(OTFS)与水声通信结合。针对OTFS水声通信系统中的信道估计与信道均衡技术展
学位
无线感知是一种通过分析受目标状态影响的无线信号来获取感兴趣目标状态信息的新兴非接触感知技术。该技术利用周围广泛存在的无线信号来对目标状态进行感知,其具有低成本、不受光照影响、隐私性较好等优点,因而使得其在智能家居、智能监护、人机交互领域有着广泛的应用前景。受深度网络在计算机视觉领域广泛应用并取得丰富成果的启发,无线感知技术近年来很多工作都倾向于采集无线数据集,然后基于数据构建无线射频图像数据集,接
学位
遥感图像目标识别是一种图像级的任务,目的是分辨遥感图像中物体的类别,在军事安全、海上交通等方面应用广泛。近年来,深度卷积网络在遥感图像识别任务中表现优异,相对于传统方法展现出巨大优势。目前,深度学习在遥感图像目标识别领域主要的研究方式为利用注意力机制获取辨识性特征或是加入检测、分割等子网络定位识别重点区域。然而,多数遥感图像目标识别研究仅适用于高分辨率遥感图像。针对低分辨率遥感图像目标识别准确度较
学位
随着资源需求的日益增加,世界各国愈发重视海洋资源的勘探与利用。水下无线传感器网络(Underwater Wireless Sensor Network,UWSN)作为开发利用海洋的重要技术手段之一,受到了学界和业界的广泛关注。但是,目前对水下无线传感器网络的研究仍面临诸多挑战,例如,水下传感器网络多功能节点的设计、网络节点的部署算法等。本论文围绕水下无线传感器网络的移动节点部署方法和水下多媒体信息
学位
显著性目标检测作为计算机视觉领域中的一项重要任务,对于图像高层语义的理解具备重要意义,为各类图像处理和计算机视觉相关任务提供了必要的先验知识。作为像素级图像分割任务,显著性目标检测非常依赖高质量、大规模的像素级标签作为数据支撑,其获取往往费时费力、代价高昂。因此,基于标注高效的图像级标签的弱监督学习近年来受到了广泛关注。现有工作大多关注于如何获取高质量的伪标签,而忽略了伪标签中广泛存在的噪声对于显
学位
虹膜识别使用人眼图像中虹膜区域丰富的纹理信息进行用户身份识别,是目前最安全、使用最广泛的生物识别技术之一。为了提升虹膜识别技术的性能,本文设计了基于深度学习模型的虹膜定位和识别方法,分别从虹膜定位、虹膜识别以及模型轻量化三个方面展开研究。首先,与现有的使用标准圆形拟合虹膜内外轮廓的虹膜定位方法不同,为了缓解标准圆形框无法准确定位变形虹膜的问题,本文设计了一个基于旋转椭圆框的虹膜定位模型,该模型在旋
学位
随着经济、科技和医疗水平的快速发展,社会人口老龄化愈发严重,老年群体的健康问题也随之凸显。跌倒已经成为老年群体意外伤害死亡的主要原因之一,若能及时对跌倒进行检测,则可以为救援提供宝贵的时间先机。本文基于计算机视觉技术,分别从人体的姿态建模和动作的时序建模两方面入手,充分挖掘了人体的姿态信息和动作的时序特征,提高了跌倒检测的准确率。首先,在姿态建模方面,现有的跌倒检测方法通常采用人体骨架来表征姿态。
学位
显著性目标检测目的是识别出图像中最吸引人的对象或区域,是计算机视觉领域的重要任务。根据输入数据的类型,现有的显著性目标检测算法可以分为3类:RGB、RGB-D以及光场方法。与RGB以及RGB-D数据相比,光场数据包含丰富的场景信息,能够满足困难场景的信息需求。近年来,深度卷积神经网络的发展取代了传统基于手工特征的算法,显著提高了光场显著性目标检测的性能。然而实际场景中,较高的光场数据获取成本、极为
学位
深度伪造技术的出现和发展使得视频内容的真实性无法得到保证,同时深度伪造内容的迅速传播和受到的广泛关注使其带来的负面影响和潜在威胁日渐严重。因此,深度伪造检测技术的研究对个人隐私的保护和社会信任体系的维护都有着极其重要的意义。本文的研究内容是面向不同质量的深度伪造检测。现有的检测方法在面向经过压缩的深度伪造图像和视频时,检测准确率会出现明显的下降。本文将检测不同程度压缩率的深度伪造图像和视频定义为不
学位