基于残差网络的行人再识别方法

来源 :中国人民公安大学 | 被引量 : 0次 | 上传用户:kuyedie222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别旨在完成非重叠视域下图像或者视频序列中的特定行人匹配。但是现实场景中,摄像机视角、分辨率、遮挡、光照以及复杂背景等多种因素,会降低行人再识别算法所提取行人特征的鲁棒性,导致识别精度无法满足应用需求。为解决上述问题,本文围绕基于残差网络的行人再识别方法展开研究,具体工作如下:提出一种基于通道注意力机制的行人再识别方法,增强特征判别力和模型泛化能力。以SCPNet网络模型为基础,首先,将通道注意力机制SE模块嵌入骨干网络Res Net50中,对关键特征信息进行加权强化;其次,采用动态激活函数根据输入特征动态调整Re LU的参数,增强网络模型的非线性表达能力;最后,将梯度中心化算法引入Adam优化器,提升网络模型的训练速度和泛化能力。在Market1501、Duke MTMC-ReID和CUHK03数据集上进行性能评估,Rank-1分别提升2.17%、2.38%和3.50%,mAP分别提升3.07%、3.39%和4.14%。提出一种基于特征关联和多损失融合的行人再识别方法,降低遮挡区域噪声干扰。以PGFA网络模型为基础,首先,利用姿态估计器生成的人体关键点作为辅助信息,引导模型关注行人图像未被遮挡区域,提取姿态引导的全局特征;其次,引入全局对比池化模块,将平均池化和最大池化的特性进行融合,提取对背景噪声和遮挡抗干扰性更强的全局特征;然后,引入One-vs-rest关系模块,挖掘局部分块特征的内在关系,提取能够反映图像整体信息的局部特征;最后,加权融合交叉熵损失、难样本采样三元组损失和中心损失三种损失函数,监督模型学习类间距离大、类内距离小的行人特征。在Occluded-Duke MTMC数据集上进行性能评估,Rank-1和mAP分别达到54.9%和41.5%。提出一种基于颜色空间转换和轻量级网络的行人再识别方法,缩小异质模态间差距。以AGW网络模型为基础,首先,将可见光图像转换到HSV颜色空间,提取只描述图像明暗信息的V分量,并将其复制扩展为三通道图像,降低对颜色信息的依赖;其次,通过轻量级模态生成器对三通道图像进行降维和升维,生成介于可见光和红外图像的中间模态,缩小模态间差异;最后,将三种模态作为输入,通过权重共享的特征学习器来学习跨模态信息。在SYSU-MM01和Reg DB数据集上进行性能评估,Rank-1分别提升6.67%和1.18%,mAP分别提升6.47%和1.15%,m INP分别提升5.59%和0.42%。在软件实现方面,以Pytorch为深度学习框架,利用PyQT5进行界面设计,编程实现了基于残差网络的行人再识别软件,并利用真实场景下采集的数据进行验证测试。
其他文献
目的:分析急诊中重度肝硬化食管胃底静脉曲张出血(EGVB)患者首次内镜治疗疗效,再出血危险因素及分析。方法:选取2018年1月至2021年1月急诊活动性出血,在我院入院48小时内行首次内镜治疗的中重度EGVB患者144例,根据治疗方法进行分组:内镜下食管静脉曲张套扎治疗组(EVL组n=73),内镜下胃底静脉曲张组织胶注射组(ETA组n=32),内镜下套扎联合组织胶治疗组(EVL+ETA组n=39)
学位
行人重识别研究在跨摄像机下识别特定的行人,是计算机视觉领域的重要研究课题之一。行人重识别在智能视频监控系统、智慧安防和交通等有着广泛的应用,逐渐成为维护公共安全和社会稳定的重要手段,如搜索犯罪嫌疑人、跨境追踪和轨迹分析等,具有重要的研究意义。近年来,行人重识别技术取得了重大进展,但在开放的视频监控场景下仍面临着诸多挑战,如视角改变、光照变化、相似行人以及遮挡等,难以满足实际应用的需要,识别精度有待
学位
跟随着我国社会经济发展的脚步,政府也相应地对各种基础设施建设重视起来,投入大量的人力财力,投入基本建设的投资种类也越来越多,规模也在不断地扩大。因此我们应当重视国有企业财政专项资金的财务管理,使专项资金在运用中的安全具有确定的保障,并且能够让国家以及政府的财政支出能够被有效使用。本文从强调国有企业基本建设财政专项资金财务管理的必要性开始并对其所面临以及存在的问题进行分析从而提出相关策略。以下就国有
期刊
目的:分析非终末期糖尿病肾脏病(Diabetic kidney disease,DKD)患者蛋白尿水平与临床及超声心动图指标,探讨其心脏病变相关危险因素以及预后影响因素。方法:收集新疆医科大学第一附属医院2015年1月~2017年11月住院治疗的非终末期DKD患者资料,根据蛋白尿水平分为三组,分析相关指标,采用多因素Logistic回归法分析患者发生左心室肥厚(Left ventricular h
学位
图是复杂系统中常用的信息载体,可以表示现实中许多复杂关系,如社交网络、犯罪网络等。图中蕴含大量有价值的信息,通过高效的方式对图进行分析和挖掘,具有重大现实意义。基于深度学习的图嵌入模型具有较强的表征能力,能够有效建模非线性结构,生成保留原始图信息的低维向量。图卷积自编码器是近年常用的图深度学习模型,其利用节点间信息传递生成保留任意深度邻域特征的低维嵌入,提升图分析任务表现。但是图卷积自编码器模型普
学位
目的:探讨原发性高血压患者亚临床甲状腺功能减退(亚甲减)与中心动脉压相关指标及臂踝脉搏波速度(Ba PWV)之间的关系。方法:纳入原发性高血压患者451例,根据甲状腺功能,分成亚甲减组(n=120)和甲状腺功能正常组(n=331)。比较两组一般资料、实验室数据、中心动脉压相关指标及Ba PWV的差异,探讨原发性高血压合并亚甲减患者甲状腺功能相关指标与中心动脉压相关指标及Ba PWV的相关性及其影响
学位
目的:探讨活动期溃疡性结肠炎(Ulcerative Colitis,UC)患者血清叶酸(Folic Aci,FA)及维生素B12(Vitamin B12,Vit B12)水平及其临床特点与相关性。方法:UC组选择2015年1月至2021年11月就诊于新疆医科大学第一附属医院并临床诊断为活动期UC的住院患者共90例。对照组为同期就诊于该院的健康体检者共110例。UC组根据疾病严重程度分为轻度、中度及
学位
人群计数可较为精确的预测图像中的人群密度及数量,在公共安全、商业规划和交通流量控制等领域具有重要应用,成为计算机视觉领域重要的研究课题。近年来,随着卷积神经网络在图像处理领域的广泛应用,人群计数研究取得了显著进展。但人群计数应用于实际场景,仍然面临复杂背景干扰、多尺度变化以及空间特征信息分布不均衡等诸多挑战。为了探究解决上述问题的方法,本文基于卷积神经网络,引入注意力机制、多尺度融合以及Invol
学位
现阶段,基建专项资金财务管理是国企的重要工作内容,做好基建专项拨款资金财务管理,可以促使基建项目建设做好科学规划,加强资金流转监督管控,从国家层面看,有助于提升国家治理水平和治理能力,缓解财政压力,从企业层面看,能够提升基建专项资金使用效益,保障财政专项资金科学配置,从而达成经营目标。本文基于国有企业展开分析,探讨基建专项资金财务管理的优化策略。
期刊
行人跟踪是计算机视觉领域的研究热点,旨在跟踪视频序列中特定的行人目标。当前行人跟踪的主流方法主要利用行人的外观特征进行定位,当遇到物体遮挡、光线模糊、形态复杂变化等情况,都会产生跟踪算法准确率降低或者行人目标丢失难以找回的问题,很难满足实际应用需求。为解决上述问题,本文围绕基于特征融合的行人跟踪方法进行研究,主要研究内容及贡献如下:提出了一种基于注意力机制的跨模态目标分割方法,解决背景杂乱对目标定
学位