基于图表示和注意力机制的行人属性识别算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:lyl_chong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人属性识别是视频监控领域中的重要任务,因其在视频监控应用中的巨大潜力在近些年来受到了广泛关注,它可以应用于很多下游任务中,例如行人追踪,人脸验证,行人检索等。行人属性识别任务属于计算机视觉领域中的多标签图像分类任务。多标签图像分类任务的研究重点在于如何利用标签之间的共现关系辅助模型提升分类性能。目前最先进的共现关系建模方法是图神经网络,但它存在两个严重影响性能的问题:1)低频标签无法有效的从高频标签中迁移特征信息导致低频标签分类性能不佳。2)大量图节点不参与图神经网络的信息传递过程,导致图神经网络发生严重的退化。对于图神经网络存在的问题,本论文通过分析行人属性出现的频率和条件概率,提出了一种新的定义共现关系图的方法,并与原有方法相结合,提出了一个基于非对称共现依赖关系图的行人属性识别模型,这个模型能够提升低频行人属性的识别性能并有效的缓解图神经网络的退化问题。注意力机制也是提升行人属性识别任务性能的重要手段之一。然而,由于行人图片质量不佳以及缺乏有效的监督信号等问题,现有的基于注意力机制的模型在行人属性识别任务中通常无法准确的定位与特定行人属性高度相关的图像特征。对于注意力机制存在的问题,本论文使用一种基于词向量语义指导的空间注意力机制模块改进行人属性识别模型,词向量包含了行人属性的语义信息,可以作为一种先验知识对缺乏监督信号的问题进行弥补,并指导注意力机制模块准确的定位与特定行人属性高度相关的图像特征。本文的主要贡献如下:(1)提出了一种基于非对称共现依赖关系图的模型,并在多个数据集上使用多个主干网络进行实验,实验结果表明该方法能够将m AP提升0.6%~3.3%。(2)提出了一种基于词向量语义指导的空间注意力机制模块的行人属性识别模型,在行人属性识别数据集中相比于常规图像分类模型以及不使用词向量语义指导的注意力机制模型来说,m AP提升1.1%~1.9%。(3)将两种改进方法进行结合,相比于单独使用某一种改进方法能够将m AP进一步提升0.4%~0.6%。图14幅,表7个,参考文献53篇。
其他文献
密码技术在维护信息的完整性、不可否认性、机密性及认证方面发挥着至关重要的作用,是保障信息安全的核心技术之一。我国强调密码技术的自主可控,商用密码技术必须加强自主创新。2017年,由我国国家密码管理局发布的《SM9标识密码算法》被国际标准化组织(ISO)采纳。随着国密SM9算法在国内外的认可不断提升,其在将来一定会在各个领域进行大规模应用。但从目前来看,国内外对于SM9标识密码算法的研究还处于起步阶
随着计算机计算能力和存储能力的不断进步,大数据已经成为人们耳熟能详的概念,人类社会也进入了大数据时代。然而,大数据时代也广泛存在着信息过载的问题。对于广大用户,面对数以亿计的数据,想从中寻找到自己真正需要的、有价值的信息往往举步维艰;对于广大创作者,让创作的优质信息精确高效地展现在目标受众面前,也是十分困难的。推荐系统就是这一现象的有效解决方案。推荐系统通过对用户和候选信息进行特征挖掘,给用户推荐
数据图表在展现数据特征方面存在独特的优势,数据可视化分析在人们对于海量数据的挖掘和运用过程中已成为必不可少的一环。但是,在数据爆发式增长的今天,数据集量级与复杂程度不断增加,传统可视化工具需要手动配置生成可视化视图,该方法难以满足用户在海量数据中挖掘有效信息的需求。为解决大数据时代数据可视化分析任务面临的高效性与准确性等难题,自动分析数据集可视化特征并进行价值评估的可视化推荐技术受到研究人员的高度
我国城市轨道交通的飞速发展,为人们的出行带来了很大的便利,但同时也给列车的运行安全带来挑战。随着列车速度不断提高,载重量不断增加,列车的检修也变得越来越重要。列车在长时间运行过程中,由于碰撞、老化等问题,列车底部中心鞘螺栓部位会出现表面裂纹、磨耗、松动、缺失等故障,容易引发重大交通事故,造成人员伤亡和财产损失,因此研究螺栓故障检测方法与技术,通过在线检测及时发现螺栓的故障,避免列车事故的发生,其研
随着数字技术和人类生产生活交汇融合,全球数据呈现爆发增长、海量集聚的特点,数据日益成为重要战略资源和新生产要素。党的十九届四中全会首次提出将数据作为生产要素参与分配。数据资源作为数据经济时代的重要生产要素,构建安全可信的数据要素市场,能够在充分释放数据红利,实现数据价值流转的同时,保障数据资源安全与数据主体的隐私保护需求,从而促进数字经济高效健康发展。联盟链作为区块链技术与实体经济的粘合剂,可以有
近年来,随着视频监控、短视频社交等领域的蓬勃发展,产生了海量的视频数据。视频目标分割算法的发展促进了视频内容理解技术的广泛应用,对于智能安防、视频存储和自动驾驶等任务具有重要意义。视频目标分割旨在将某些特定的、显著的目标从视频背景中分离出来,本质上是一种像素级分类任务。然而,由于视频内容的多样性和复杂性,使得视频中存在大量前景背景混淆、目标形态变化、目标尺度变化等诸多问题,给视频目标分割算法带来了
铁路建设是我国交通领域的重要范畴,随着铁路线路的大量开行及铁路运营里程的逐步增加,对铁路运行安全状态的监控显得越来越重要。目前,我国已经进行了铁路安全图像智能分析设备的铺设,这些系统主要采用人工图像判别方式,该判别方式任务量重、难以满足实时检测要求且容易产生漏报、误报现象。因此,开发基于人工智能的铁路图像监测及检测系统的需求也越来越迫切。本文基于国铁集团组织建设的动车组运行故障动态图像检测系统(T
当今,全球已步入万物互联和人工智能时代,随着智能识别技术的发展和普及,人们在获得便利的同时隐私安全正遭受着潜在的威胁。在视频监控和社交网络的大范围覆盖下,人脸数据成为最容易获取的生物特征隐私信息。因此,在大数据时代下,人脸数据的隐私问题值得人们深思,如何在隐匿人脸身份信息的同时保留人脸属性信息具有重要的研究价值和意义。本文学习了现有的人脸数据隐私保护方法,受监督学习和生成对抗网络的启发,提出了一种
随着我国铁路事业的快速发展,行车安全成为亟待解决的问题之一。其中,行人误闯是影响行车安全的重要因素。因此,及时检测是否有人员误闯列车运行线路可以保障行车安全。传统的行人检测方法难以实现高性能和实时性的检测任务。近年来,随着深度学习技术的快速发展,基于深度学习的目标检测算法取得了优异的成绩。因此,本文以优异的卷积神经网络为基础,结合嵌入式异构设备完成铁路场景下的行人检测,实现铁路安防的智能化。本文的
互联网的高速发展使得用户正在面临信息爆炸的问题。推荐系统通过提供个性化的商品推荐服务来辅助用户进行决策,从而减轻消费者因选择过多而产生的焦虑和困惑。基于评分矩阵的推荐算法可以根据用户的评分模式对用户和商品进行建模,但该类算法面临严重的数据稀疏性问题。而用户生成的评论文本可以反应用户的喜好和商品特征等语义信息,利用这些信息可以有效缓解数据的稀疏性问题,从而提高模型推荐的准确率。本文主要基于深度学习技