基于深度学习的行人属性识别研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户:jiapeng1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在监控系统智能化以前,通常使用人工识别来检索监控系统中的行人目标。但是,随着安防产业在城市中的广泛普及,监控系统的重要性日益突出,监控摄像头的数量也在不断增加,人工识别的检索性能已经难以满足城市监控系统的海量数据处理,这给监控系统的检测工作带来了艰巨的挑战。除了需要大量的人力成本之外,人工识别会使目标搜索的准确度偏低,从而导致错误的人像检索或者遗漏人像的检索。因此,人工智能辅助行人重识别的研究也有了积极的社会意义,通过检索行人属性辅助行人重识别从而提高检索性能也逐渐成为研究热点。由于在现实图像中行人属性复杂多样,导致了行人属性识别任务在研究过程中也遇到了种种阻碍。为了应对当前监控场景下行人属性识别面临的主要挑战:摄像头的模糊像素以及行人外观的多样性,本文以卷积神经网络为基础结构,结合注意力机制和卷积长短期记忆神经网络从不同的层面上提取图像特征,对行人属性识别的问题进行了深入研究,具体工作如下:(1)提出了一个具有注意力机制的神经网络模型,由通道注意力模块和空间变换模块组成。首先注意力机制模块通过引入一种新的权重学习方法,在训练中调整获得的特征权重,对属性识别有积极影响的特征通道加权。其次提出了属性定位模块,自适应地从特征映射中定位到与属性相关的注意力分布区域,通过空间变换模块定位单个属性对应的注意力区域。最后,通过改进的损失函数计算网络预测的损失。(2)提出了一个卷积长短期记忆神经网络,突破注意力机制作用于单属性识别网络的局限性,通过长短期记忆网络存储的历史信息来引导属性之间的内部关联,挖掘属性组间的相关性,优化预测序列,送入单属性分类器对行人属性进行预测,并连接多个单属性分类器作为最后的分类结果。本文提出的方法在Market-1501和Duke MTMC-re ID两个数据集中取得了较好的识别效果,在Market-1501数据集上达到了92.9%的准确率,在Duke MTMC-re ID上达到了90.9%的准确率。实验结果表明,本文所提的方法能够实现有效的行人属性识别。
其他文献
Stacking算法是提高分类器性能的常用方法。Stacking首先训练多个初级分类器;然后将初级分类器的结果作为输入,训练得到一个强分类器。本文将探究Stacking算法在输出变量为定序变量时以及在输入数据为文本时的应用。(1)Stacking算法在定序数据中的应用研究。定序数据是存在顺序关系的离散型数据。常规的Stacking算法在处理定序数据分类任务时没有兼顾定序变量之间的顺序关系,导致分类
学位
面部表情是人们心理活动最直接的反映,对面部表情进行分析有助于计算机理解人们的情感状态。面部表情的形成过程是面部肌肉和面部皱纹共同作用的过程,同时伴随着面部形状的变化,因此,面部表情识别需要更好的形状、纹理等特征描述符来表示面部表情。面部特征的提取和描述在决定面部表情识别系统的准确率中举足轻重。在本文中,我们提出了一种基于空间金字塔的Zernike矩特征和面部表情纹理的Law纹理特征相融合的特征提取
学位
生存分析被广泛应用于医疗、经济、工业、社会科学等领域,生存分析用于研究生存现象和生存时间及其影响因素的统计规律,目前已经有很多传统的统计推断方法在生存分析领域被广泛应用.近年来,随着机器学习算法的快速发展,已有很多算法被引入生存分析领域并在实践中验证了此类算法优越的建模能力和预测性能.本篇论文的目的是基于生存分析提出一种新的回归算法Survival Boost,该算法基于随机生存森林和XGBoos
学位
系统运行不仅会受内部故障影响,很多时候还会受到来自外部的恶意攻击,这直接影响到系统的可靠性。投票系统容错性高,决策力强,已被广泛应用到诸多领域。本文主要针对遭受多次恶意攻击的投票系统的可靠性进行研究并给出相应的最优策略,这里的可靠性是指系统对于输入的命题能做出正确决策的概率。本文讨论了一个由多种组件(普通组件,升级组件和伪装组件)组成的多数投票系统的可靠性,着重关注的最优策略是针对不同类型组件的数
学位
随着信息科学技术的快速发展,商业银行之间的竞争变得越来越激烈。一方面,在信息公开透明的互联网时代,消费者可以快速获取金融产品和服务信息并以此为基础优化购买策略,从而可能导致某银行以往的部分客户流向其他银行。另一方面,消费者的个性化需求也可能会导致银行客户流失现象的发生。为了尽可能的减少客户流失,可以利用银行过往客户的信息进行预测分析,使得银行管理者在后续工作中能有针对性的完善客户服务。本文运用数据
学位
皮肤镜图像中,由于毛发造成的遮挡,严重影响了皮肤病变的诊断操作和分析准确性。真皮毛发有以下不同的特点:细薄;重叠;浅色调;形状各异,长短不一;与底层皮肤或病变纹理有相似的对比度或颜色;以及遮盖或覆盖病变的纹理。毛发的这些复杂特征使得毛发数字去除(DHR)成为一项极具挑战性的任务,该任务涉及到毛发的分割和毛发间隙的修复。基于传统的硬编码阈值毛发去除方法泛化能力差,导致过度去除毛发,从而失去了皮肤病变
学位
测试是贯穿数字集成电路(Digital Integrated Circuit,Digital IC)整个生命周期的核心环节。可靠的测试技术有助于缩短开发周期,提高产品的良率和减少开发成本。然而,随着集成电路的制造工艺不断进步和发展,单一电路的规模越来越大,电路的内部结构也越加复杂。这给测试带来了新的挑战。基于这种情况,结合新兴技术对集成电路测试方法进行优化升级已成为行业的热点。自动测试向量生成(A
学位
髋关节发育不良是婴幼儿较为常见的骨科疾病之一,患病初期及时的诊断和治疗能够有效矫正关节畸形,避免留下终身残疾。基于X-Ray图像的骨盆正位片诊断是髋关节发育情况诊断的主要方式之一,医学解剖学相关关键点的检测是该诊断方法的关键步骤。然而,在该诊断方法中,骨关节钙化过程中的多样性和脱位畸形等因素导致关键点的检测是一项具有挑战性的任务。一般来说,X-Ray图像中的医学解剖学关键点在局部区域表现出稳定的形
学位
股票市场作为企业筹集资金、公众投资获利的重要场所,吸引了各界人士的目光,股价预测方法也喷涌而出。而股票数据是非平稳、高噪声、波动性强的序列,其数据的复杂性和不确定性使得经典统计模型在股价预测中日渐式微。随着机器学习的发展,研究发现深度学习能更好捕捉股票数据信息,所以本文从深度学习出发,基于LSTM,构建基于注意力机制的双向长短期记忆网络(AM-BiLSTM)模型来预测沪深300指数价格。针对一般模
学位
电影艺术作为一种视觉性很强的现代传媒形式,其产生与发展都离不开对媒介技术的研究和探索。当前电影艺术已进入媒介融合的新时代,随着媒介环境变化和新技术的革新,电影早已诞生出各种新的形式,如互动电影、VR电影、DV电影等。作为用数字桌面为载体进行跨媒介叙事的桌面电影,已成为电影与数字媒介融合的最佳例证。本文追溯桌面电影诞生的渊源,分析桌面电影不同于一般电影的视听语言与创作特征,并内含于当前媒介融合的环境
学位