基于深度学习的行人重识别方法研究

来源 :天津科技大学 | 被引量 : 0次 | 上传用户:yufengjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社会智能化进程的不断加速,商场、车站等流量密集场所的社会公共安全问题日益凸显。针对此类安全问题,智能视频监控系统在其中发挥了至关重要的作用。为了能在大量的视频数据中快速准确地找到目标行人,减轻监控人员的工作量,行人重识别逐渐成为计算机视觉领域的研究热点。行人重识别是在多个非必要重叠区域的监控摄像头拍摄的视频中,找到与目标行人特征最相似的行人图片并进行排序,通常可以看作图像检索的子任务。本文针对行人重识别任务中的特征提取与距离度量的角度展开了研究,主要工作和创新点如下:(1)分析行人重识别在实际生活中的应用价值以及存在的困难,简述基于传统方法的行人重识别算法与基于深度学习的行人重识别算法的发展历程,根据研究角度的不同对行人重识别算法进行分类研究并纵向比较其算法的优缺点。(2)研究基于深度学习的行人重识别算法的原理,根据特征提取网络在数据集中提取的特征单一且辨别性弱的特点,提出一种基于多分支网络的行人重识别算法。该算法分别提取数据集中描述人体关键点与行人外貌属性的特征向量,并且设计硬三元损失函数与交叉熵损失函数相结合的联合损失函数进行距离度量,减小相同行人特征向量的类内距离,增大不同行人特征向量的类间距离,进而提高特征向量的辨别度。在公开数据集MARS,Duke MTMC-Video Re ID上进行训练与测试,与主流行人重识别算法相比,本文设计的基于多分支的行人重识别算法在平均精度方面分别提升了0.5%和0.7%。(3)以基于多分支的行人重识别算法为基础,在基础特征提取网络上增加空间-通道注意力机制,将注意力机制模块与特征提取网络中的残差模块相结合,使用注意力机制替换掉残差模块中最后的Re LU层,提升网络对感兴趣区域的关注,削弱背景等复杂信息的干扰,将网络的计算资源集中在能够提供有效信息的部分,减小网络的计算量。本文在公开数据集MARS,Duke MTMC-Video Re ID上进行实验。实验表明,在基于多分支网络的行人重识别算法上增加注意力机制模块后比未增加注意力机制的算法在平均精度上分别提升了1.3%和1.5%。
其他文献
推荐系统得益于其主动推荐的特性,成为大数据时代下解决信息过载问题的有效手段,在各领域都得到了广泛应用。尽管相关领域的专家学者已对推荐系统展开了深入研究,但仍存在着多方面问题制约其推荐效果。一方面,由于推荐算法存在着局限性,数据稀疏环境下,无法给用户生成满意的推荐结果;另一方面,多数推荐算法只基于评分数据进行用户最近邻的查找,未将用户对项目类型的历史偏好考虑在内,数据参照的单一性致使推荐质量较差。为
学位
我国西部地区矿井建设过程常遭遇侏罗系和白垩系软岩地层,该类地层岩石具有强度低、胶结性差遇水易崩解泥化等问题,当矿井穿过该类地层时,工程岩体因地质构造或工程力的作用而形成富水软岩,对地下结构的稳定性具有不利影响。特别是开采过程中富水围岩应力场重新调整过程将改变岩体原有的应力状态和应力路径,影响围岩力学响应、裂隙扩展方向和扩展深度,甚至产生裂缝贯穿,进而引发地下硐室失稳、基坑失效和滑坡等工程灾害。给矿
学位
为了从庞大的数据资源中提取人们所需要的有效信息,所用的数据挖掘技术受到不同领域诸多专家越来越多的关注。数据挖掘最常用的技术是聚类分析,它是一种无监督方法,在聚类分析很多著名算法中,K-Means算法由于具有简单、高效、伸缩性好的优点得到广泛应用,但它也存在一定的局限性。一是该算法随机确定初始聚类中心,导致迭代次数过多,聚类精度不高,甚至聚类失败;二是算法对各样本对象进行相似性计算时,忽视了不同特征
学位
近几年来,以地铁为代表的地下结构迅速发展,已经成为缓解城市交通压力的主力军。地铁以其运输承载量大、运行效率高、环境破坏少等特点,迅速跻身成为城市交通的主导力量,它的应用节约了地上资源,推进了城市的可持续发展。随着地铁在大中型城市的广泛应用,其在地震发生时的安全问题也日渐突出。地下结构破坏的案例中,最著名的是1995年发生在日本神户地震中地铁破坏的案例,此后,2018年我国四川汶川地震中也有一些地下
学位
语义分割作为计算机视觉中一项场景解析推理任务,通过将图像逐像素分类标记为不同类别,从而解决现实场景理解难题。在复杂街景图像分割应用中,聚合多尺度目标上下文相关性,关联语义类别,有利于提高语义分割的推理准确性。本文致力于解决街景图像中语义分割目标比例变化多样性和预测结果不准确的问题,基于Deep Lab网络模型系列,提出了一种语义分割网络模型算法。针对编解码语义分割网络模型中深度卷积神经网络计算复杂
学位
随着人口老龄化问题的加重,需要看护的老年人比例大幅度增加,再加上肢体残疾的人数的增多,助老助残成为现阶段亟待解决的社会问题。随着科技的发展,先进代步工具的出现正在逐步地改善着他们的生活质量,智能轮椅是就是其中重要的一种。智能轮椅的出现,可以提高老年人和残疾人的生活质量。而智能轮椅的避障和路径规划是其研究的核心内容。本文基于Webots机器人仿真软件提出了智能轮椅的避障和路径规划仿真平台,利用Web
学位
基于图神经网络的推荐算法是当前推荐系统核心技术之一。针对基于深层神经网络的推荐算法训练过程中易产生过拟合现象,进而导致算法推荐精准度降低的问题,提出了基于轻量图卷积网络(LightGCN)和DropEdge的推荐算法(LG-DropEdge)。首先,为了减少数据存储与计算成本,在算法的嵌入层初始化用户嵌入和项目嵌入;其次,为了获得高阶的交互关系来优化嵌入表示,在嵌入传播层通过注入高阶连通关系来丰富
学位
数据信息的急剧增多导致从大量的信息中获取需求信息变得愈加困难。推荐系统可以通过对用户历史数据的挖掘,进而为用户推荐可能偏好的信息。协同过滤算法是推荐系统中最常用的推荐算法之一,但随着数据量和数据类型的增多,传统的协同过滤算法在面对稀疏且高维的数据时,出现了推荐准确率低、质量差等问题。针对上述问题,本文提出一种基于子空间划分的协同过滤推荐算法。首先,该算法将用户评分矩阵转化为感兴趣、不感兴趣以及未做
学位
可控震源车是用于地震勘探的重要设备之一。工作状态下,车体振动会对可控震源产生影响,对车体振动的隔离效果直接影响了勘探的精度以及勘探结果的品质。可控震源自身带有空气弹簧进行被动隔振,当激发信号频率小于或等于13Hz,因自身固有频率的影响,难以实现对振动的有效隔离。而低频激振信号具有更强的穿透力,能提供更丰富的石油储藏标识信息。因此,需提升可控震源在低频激振工作过程中的隔振效率。本文以KZ-28型可控
学位
随着信息技术的快速发展,图像信息凭借其生动直观的特点成为日常生活和生产中不可或缺的信息传递载体。当前数据传输的安全性已成为信息科学研究的热点,由于传统的图像加密方法已经很难满足当前信息安全的需求,因此需要提出安全性更高的图像加密算法。混沌系统具有强随机性、初始敏感性等特点,可用于信息加密。相对于耗散混沌,保守混沌的伪随机性更强,并且不存在混沌吸引子,不能被时滞嵌入法重构,有更好的安全性。保守混沌主
学位