基于深度学习的行人检索

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:nathon_zhwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着深度学习理论的日益完善和硬件设备计算力的飞速提升,计算机视觉领域也取得了长足的发展,很多技术被广泛地应用到工业界和现实生活中去,带来了巨大的经济效益和生活便利。其中,行人重试别(Person Re-Identification)作为计算机视觉领域的一个重要分支,它指的是在图片库中找到与问询图片身份相同的行人,在安防、视频监控、图片检索等许多领域都有着广泛的应用前景。但是,行人重识别任务需要手动地截取图片中的行人框,这给它在真实场景下得到应用和部署带来了很大的局限性。因此,有人提出在行人重识别系统前单独添加一个行人检测系统以减少人力成本,但这种两阶段的系统往往会导致更大的时间消耗,影响实时性。在这种情况下,人们开始将更多的目光放在行人检索任务上,旨在能够自动实现行人框的检测,同时完成身份的匹配。与行人再识别相比,行人检索更加快捷和高效,更符合真实场景的应用条件。在检测行人的过程中,不可避免地会引入一些位置的偏差。此外,考虑到检测出的行人框尺寸不一,框内背景信息繁杂,有的甚至会出现比较严重的遮挡情况,行人检索一直是一个非常具有挑战性的任务。在之前关于行人检索的工作中,以上干扰因素大多没有得到很好的解决。因此,本论文提出了一个基于深度学习的端到端的行人检索网络——多层次协同注意力行人检索网络(Multilvel Collaborative Attention Network,MCAN),效地地解决了以上几个问题。本文的贡献主要包括:1.针对自然条件下行人框尺寸不一的情况,本文引入了一个多层次学习策略。对于不同尺寸的行人,通过特征金字塔网络(FPN)来选取不同分辨率的特征以保证具有合适的语义强度。2.为了解决行人框位置偏差、背景噪声和遮挡的问题,本文提出了一个协同注意力学习模块,可以进一拆分为两个子模块:区域注意力学习模块(Hard Regional Attention)和像素级注意力学习模块(Soft Pixel-Wise Attention)。其中区域注意力学习模块利用人体关节点检测,将人体划分为头部、躯干部和下肢三个区域进而分别提取特征。像素级注意力学习模块旨在在像素级别上提取人体最显著的特征,它将空间注意力和通道注意力学习单元有效地结合在一起,大大减少了参数数量和计算量。3.本文提出了一种基于难样本挖掘的随机取样指数归一化(Online Hard Mined Random Sampling Softmax,OHMRSS)损失函数,它一方面改善了行人重识别的效果,另一方面能够加快网络在训练时的收敛速度。针对上述提出的算法,本论文在PRW和CUHK-SYSU两个数据集上进行了丰富的实验。实验结果表明,本论文提出的算法在PRW数据集上取得了当前最高的准确率,虽然在c UHK-SYSU数据集上与当前学术界最好的结果有一点差距,但进一步的实验证明了本文提出算法的有效性。
其他文献
量子信息学是一门由量子力学和信息科学结合产生的新兴学科,因此它具有很多经典信息学所不具备的特性,例如量子相干性,量子纠缠,量子态叠加原理等。随着量子信息学的发展,人
建立准确且简单的理论模型是研究箔片轴承性能的基础,虽然已有多种建模方式,但在建模时如何考虑箔片间的摩擦效应是一个难点。一些学者将箔片结构简化为线弹簧系统或其他模型
钛基光催化材料TiO2具有催化活性好、化学性质稳定、价格低廉等优势被认为是最具前景的光催化材料。但是由于其吸附性能及选择性能较弱,在实际污水处理中受到了极大的限制。
贯通融合纪法情理推进教育帮助制度建设全面建设社会主义现代化国家,必须有一支政治过硬、具备领导现代化建设能力的干部队伍。纪检监察机关要自觉融入现代化建设大局,突出严
本硕士论文是哈尔滨工业大学委托研究的,目的是对电磁比例阀控制系统的进行新研究与设计。电磁阀在操作原理上与螺线管和线圈的组合相似,这些设备在操作过程中都遵循电磁法则
直流微网具有能量转换效率高、兼容性强的优点,可以利用各种不同类型的分布式电源,同时满足不同直流负荷的用电需求。在现存的直流微网结构中,受控变流器以恒功率负载的形式出现,其负阻抗效应降低了系统阻尼;由于缺失传统电源,系统呈现低惯量的运行特性,易出现电压谐振、功率振荡等现象。鉴于此,本文提出了直流微网的谐振分析方法,并设计了有效的谐振抑制方法。首先,本文对主要的稳定判据进行了综述。在小信号稳定性分析方
辣椒是耐涝能力弱的重要经济作物之一,水涝胁迫时,辣椒生长、光合等会受到不同程度的影响,导致辣椒产量严重降低。本论文以野生型S15和耐涝突变体rw15为试验材料,通过研究水
铜包铁粉是一种省铜、环保、低成本的粉末冶金材料,开发出品质合格的铜包铁粉具有重要的现实意义和极大的工业应用价值。然而,现有的混合扩散法和化学镀法都因各自的一些问题
设R是交换Noether环,我们给出了R?的两个理想由Gorenstein理想来链接的一个等价刻画;并在Gorenstein局部环的情形,给出了RR的两个理想是水平链接的一个等价刻画。设R是交换凝聚半正则环,我们引入了有限表现R-模的水平链接的概念,证明了有限表现R-模的水平链接是稳定的。在有限生成投射R-模是Hopf模的前提下,我们证明了对任意有限表现R-模M,M是水平链接的当且仅当它是稳定的无
“十二五”国民经济和社会发展规划纲要中,明确提出氨氮(AN)减排10%的目标。城市污水厂作为处理生活污水中AN的主要场所,氮超标现象时有发生,近年来已经逐渐由二级处理向深度处