基于位姿嵌入的图表征行人重识别算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:play5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别作为智能视频监控领域中一项关键性技术,旨在从非重叠视角下的监控摄像头采集的图像数据中正确识别出属于同一行人的图像。近年来,深度学习的发展给行人重识别的研究提供了有力的技术基础,其中基于局部特征的行人重识别方法能够有效提升行人重识别准确率,但是大多忽略了行人局部特征之间潜在的关系,由于受到复杂背景噪声和行人姿态变化的影响,以及行人图像间存在相似行人外观或局部遮挡等情况,给行人重识别的研究带来了巨大的挑战。针对以上问题,本文主要从行人的全局关系角度出发,利用基础的卷积神经网络作为骨干网络,充分结合行人丰富的位姿信息,并融入行人固有的骨骼结构信息以及行人图像的细粒度信息,从而有效提升行人重识别算法的准确率,本文主要贡献有以下两个方面:(1)提出了一种基于边缘分数嵌入的图卷积网络行人重识别模型(Edge-ScoreEmbedding Graph Convolutional Network,ESE-GCN)。考虑到现有基于局部特征的方法忽略了行人局部特征之间的潜在关系,并且图像间存在有相似行人外观的情况,本文提出的ESE-GCN通过提取行人丰富的位姿信息,并与行人特有的结构关系相结合,构建人体关节骨骼拓扑结构图。同时充分挖掘行人固有的骨骼结构信息(如行人关节之间的骨骼长度),并通过构建的边缘分数预测器学习得到关于人体拓扑结构图的邻接矩阵。最后将提取的行人关键点局部特征和邻接矩阵作为输入,利用图卷积网络有效整合行人关节骨骼结构中的关联关系,提取更有鲁棒性的行人特征,从而有效提升模型的识别准确率。在公开的Market-1501数据集上,Rank-1和m AP准确率分别达到了96.3%和87.0%,比现有的主流方法平均提升了7.8%和12.9%。(2)提出了一种基于局部特征感知的图卷积网络行人重识别模型ESE-TGCN。ESE-GCN使用卷积神经网络提取的深层行人特征会失去原始图像中的一些细节信息,而这些细节信息也是鉴别不同行人外观相似时的重要依据。为此,在ESE-GCN的基础上加入Transformer学习分支,以提取行人更有辨别力的特征表示。在Transformer学习分支中,构建行人细粒度语义化的局部特征作为输入,使用级联Transformer编码器模型学习行人语义化局部特征序列之间的全局依赖关系,从而驱动模型关注行人不同的局部区域,进一步提升模型的识别准确率。在Market-1501数据集上,Rank-1和m AP准确率分别达到了97.3%和87.8%,比现有的主流方法分别平均提升了8.8%和13.7%。
其他文献
生物发光断层成像(Bioluminescence Tomography,BLT)作为一种无创的医学成像技术,能够动态地提供活体动物肿瘤分布的信息。然而,由于生物组织的高散射特性,以及生物体表面光学测量信息的有限性和噪声干扰,BLT光源重建是一个病态问题。目前,以1L范数凸优化和贪婪算法为代表的稀疏表示理论为解决病态问题提供了解决思路,在BLT重建中得到了广泛的研究,能够实现光源的有效重建。但是,基
学位
在文物保护领域,三维数字化修复是热门研究课题之一。作为三维数字化修复的重要组成,兵马俑三维模型部分结构提取在兵马俑的修复、碎片拼接相关文物保护研究工作中有着重要的研究价值。目前,传统的手动划分与结构提取的方法,依赖专家主观经验,操作较为复杂,最终划分结果误差较大且整体划分过程耗时较长。针对以上问题,本文提出了两种针对兵马俑三维点云的自动化分割聚类方法来实现对兵马俑三维模型的部分结构数据提取。本文的
学位
中国逐步进入老龄化社会,老年残疾失能人口数量也随之上升,给家庭及社会带来了巨大的残疾失能保障压力。而长期护理保险的普及有助于缓解日益高涨的残疾护理需求。目前,社会性长期护理保险尚处于试点阶段,并且试点地区的现行政策存在诸多限制,给商业残疾保障类保险产品留出了充足的发展空间。混合型长期护理年金是一种创新型残疾保障类商业保险产品。根据前人的理论,该产品通过结合生命年金和长期护理保险的保障范围,中和残疾
学位
中国的风险导向偿付能力体系(简称偿二代)是2016年开始正式实施的针对保险公司的风险监管体系,建立起了定量监管、定性监管、市场约束的三大支柱。在偿二代下,监管机构对以保险风险、信用风险为主的可量化风险进行定量监管,对以操作风险、战略风险为主的不可量化风险进行定性监管。战略风险影响巨大,其试错成本和纠错成本都十分高昂,重大战略规划的失误所引发的后果往往是灾难性的,因此银保监会在监管实务工作中对保险公
学位
党的十九届五中全会明确提出要实施积极应对人口老龄化的国家战略,机关事业养老保险作为保障退休人员权益的一项基本社会保障制度,在促进经济和社会发展方面发挥着巨大的作用。积极推进机关事业单位养老保险制度改革,做好养老保险基金的收支预测,提前部署应对方案,提高基金支付能力,为积极应对人口老龄化,防范化解人口老龄化风险保驾护航。2015年初,山东省政府根据《国务院关于机关事业单位工作人员养老保险制度改革的决
学位
保险公司的准备金制度是适应其负债经营的特点而建立起的维持偿付能力的安排,其初衷是保证保险公司有足够的资金以应对未来可能发生的赔付。2016年“偿二代”正式实施,偿二代以风险为导向,更为系统地监控保险公司的偿付能力。偿二代实施期间保险公司面临的风险环境发生了较大变化,因而偿二代在执行层面暴露出许多问题。2017年9月,监管部门开启了偿二代二期建设,2021年底银保监会公布《保险公司偿付能力监管规则(
学位
文本匹配方法旨在判断两段文本是否表达相同的含义或者描述相同的事件。文本匹配是一项非常重要的自然语言理解任务,在搜索引擎、在线客服等服务中有着广泛的应用。由于文本结构复杂,语义丰富,而且文本对之间往往具有复杂的交互关系,使得文本对之间的语义匹配成为一个具有挑战性的任务。因此针对当前文本匹配任务存在的问题,本文研究了一种短文本表示模型、短文本匹配模型以及长文本匹配模型,本文开展的研究工作如下:(1)针
学位
无论是过去还是现在,生命健康一直是人的基本需求。在顶层设计上,国家一直大力提倡健康生活,《“健康中国2030”规划纲要》第二篇明确指出要普及健康生活,推动广大居民养成良好的健康习惯。另外,新冠疫情爆发至今已有两年有余,在疫情持续不断的背景下,人们更加注意自身健康状况,健康意识进一步觉醒。根据健康信念模型(HBM),人的行为习惯是心里活动的外在表现,具体到个人健康习惯来说,即健康意识更为丰富的人群会
学位
随着中国老龄化程度的加剧,社会养老保险基金的压力倍增,围绕养老保险制度与退休政策施以有针对性的改革措施迫在眉睫。养老保险作为居民退休后的重要生活保障,它将如何影响退休决策值得我们关注。现有文献多为社会基本养老保险对退休决策的作用,鲜少提及年金及商业养老保险。此外,退休是一个从酝酿退休意向到实际进行退休行为的过程,而国内研究只关注退休预期或退休行为中的一个方面,对退休路径中可能存在的退休过渡期也了解
学位
图像去雾是指对雾天采集到的有雾图像进行去雾处理,使得图像清晰化,提高图像质量。近些年,图像去雾算法的研究越来越多,取得了一定的成效,然而,这些模型仍旧存在着一些问题,例如模型性能与运行时间之间的平衡、模型无法有效地去除浓雾、合成数据集上训练的模型无法有效迁移到真实场景和去雾后的图像在小目标检测上效果不好等,这些问题导致去雾算法无法在实际场景中被很好的应用,为了解决上述问题,提出本文的研究内容,本文
学位