基于特征融合的行人跟踪方法

来源 :中国人民公安大学 | 被引量 : 0次 | 上传用户:swl3322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人跟踪是计算机视觉领域的研究热点,旨在跟踪视频序列中特定的行人目标。当前行人跟踪的主流方法主要利用行人的外观特征进行定位,当遇到物体遮挡、光线模糊、形态复杂变化等情况,都会产生跟踪算法准确率降低或者行人目标丢失难以找回的问题,很难满足实际应用需求。为解决上述问题,本文围绕基于特征融合的行人跟踪方法进行研究,主要研究内容及贡献如下:提出了一种基于注意力机制的跨模态目标分割方法,解决背景杂乱对目标定位产生影响的问题。以DMN为基础,首先在视觉特征提取主干网络中引入CBAM注意力机制,分别在通道和空间两个维度上提取并优化特征,抑制无关噪声;其次,引入FRN与BN的联合正则,抑制批次量对网络性能的影响;再次,融合优化后的视觉特征与语言特征,并进行连续上采样得到目标分割结果;最后,利用MIo U作为评估指标进行仿真实验,结果证明,改进后模型在Refer It和GRef数据集上分别提升了1.85%和0.52%。提出了一种基于外观与动作特征融合的行人跟踪方法,消除行人目标运动时外观形变对跟踪产生的负面干扰。以Da Siamese-RPN为基础,首先,在子网络中引入外观与动作特征融合模块,融合目标的时空信息和动作特征;其次,分别计算真实标签和预测模板帧之间全局和局部的差异,对二者加权融合构建损失函数,并在线更新模板帧,提高跟踪性能;最后,计算出行人目标的分类与回归分数实现目标跟踪定位。仿真实验结果表明,在La SOT数据集上跟踪成功率提升0.6%,准确率提升1.7%;在OTB100行人数据集上跟踪成功率提升0.9%,准确率提升0.8%。提出了一种基于上下文信息融合的行人跟踪方法,充分利用图像上下文信息对目标进行定位,解决外部环境复杂性导致跟踪目标丢失的问题。以SNLT为基础网络架构,首先,利用卷积充分获取图像的静态上下文信息,计算注意力值并更新特征得到动态上下文信息;然后,融合动静态上下文信息更新视觉特征;最后,根据提取的特征计算分类与回归分数实现跟踪定位。仿真实验结果表明,在行人数据集OTB-99-LANG上成功率提升2.1%,准确率提升0.8%;在公开数据集La SOT上成功率提升1.1%,准确率提升1.2%。在软件实现方面,采用Pytorch深度学习框架,通过Python语言实现核心算法,利用Matlab R2016b进行界面开发,编程实现了行人跟踪软件,该软件具有行人定位和行人跟踪等功能,在公开数据集和真实场景采集的图像上加以验证。
其他文献
目的:继发孔型房间隔缺损(SASD)是最常见的房间隔缺损(ASD)类型。经导管封堵是目前最有效、安全的治疗方法。然而,关于术后心脏重塑与肺动脉压、年龄之间的关系相关研究有限。本研究旨在探索经导管封堵术后的心脏重塑与平均肺动脉压力、年龄之间的关系。方法:本研究纳入自2014年1月至2016年12月在新疆医科大学第一附属医院接受介入封堵治疗的298名SASD患者,年龄在5.5到76岁之间,年龄中位数为
学位
目的:分析急诊中重度肝硬化食管胃底静脉曲张出血(EGVB)患者首次内镜治疗疗效,再出血危险因素及分析。方法:选取2018年1月至2021年1月急诊活动性出血,在我院入院48小时内行首次内镜治疗的中重度EGVB患者144例,根据治疗方法进行分组:内镜下食管静脉曲张套扎治疗组(EVL组n=73),内镜下胃底静脉曲张组织胶注射组(ETA组n=32),内镜下套扎联合组织胶治疗组(EVL+ETA组n=39)
学位
行人重识别研究在跨摄像机下识别特定的行人,是计算机视觉领域的重要研究课题之一。行人重识别在智能视频监控系统、智慧安防和交通等有着广泛的应用,逐渐成为维护公共安全和社会稳定的重要手段,如搜索犯罪嫌疑人、跨境追踪和轨迹分析等,具有重要的研究意义。近年来,行人重识别技术取得了重大进展,但在开放的视频监控场景下仍面临着诸多挑战,如视角改变、光照变化、相似行人以及遮挡等,难以满足实际应用的需要,识别精度有待
学位
跟随着我国社会经济发展的脚步,政府也相应地对各种基础设施建设重视起来,投入大量的人力财力,投入基本建设的投资种类也越来越多,规模也在不断地扩大。因此我们应当重视国有企业财政专项资金的财务管理,使专项资金在运用中的安全具有确定的保障,并且能够让国家以及政府的财政支出能够被有效使用。本文从强调国有企业基本建设财政专项资金财务管理的必要性开始并对其所面临以及存在的问题进行分析从而提出相关策略。以下就国有
期刊
目的:分析非终末期糖尿病肾脏病(Diabetic kidney disease,DKD)患者蛋白尿水平与临床及超声心动图指标,探讨其心脏病变相关危险因素以及预后影响因素。方法:收集新疆医科大学第一附属医院2015年1月~2017年11月住院治疗的非终末期DKD患者资料,根据蛋白尿水平分为三组,分析相关指标,采用多因素Logistic回归法分析患者发生左心室肥厚(Left ventricular h
学位
图是复杂系统中常用的信息载体,可以表示现实中许多复杂关系,如社交网络、犯罪网络等。图中蕴含大量有价值的信息,通过高效的方式对图进行分析和挖掘,具有重大现实意义。基于深度学习的图嵌入模型具有较强的表征能力,能够有效建模非线性结构,生成保留原始图信息的低维向量。图卷积自编码器是近年常用的图深度学习模型,其利用节点间信息传递生成保留任意深度邻域特征的低维嵌入,提升图分析任务表现。但是图卷积自编码器模型普
学位
目的:探讨原发性高血压患者亚临床甲状腺功能减退(亚甲减)与中心动脉压相关指标及臂踝脉搏波速度(Ba PWV)之间的关系。方法:纳入原发性高血压患者451例,根据甲状腺功能,分成亚甲减组(n=120)和甲状腺功能正常组(n=331)。比较两组一般资料、实验室数据、中心动脉压相关指标及Ba PWV的差异,探讨原发性高血压合并亚甲减患者甲状腺功能相关指标与中心动脉压相关指标及Ba PWV的相关性及其影响
学位
目的:探讨活动期溃疡性结肠炎(Ulcerative Colitis,UC)患者血清叶酸(Folic Aci,FA)及维生素B12(Vitamin B12,Vit B12)水平及其临床特点与相关性。方法:UC组选择2015年1月至2021年11月就诊于新疆医科大学第一附属医院并临床诊断为活动期UC的住院患者共90例。对照组为同期就诊于该院的健康体检者共110例。UC组根据疾病严重程度分为轻度、中度及
学位
人群计数可较为精确的预测图像中的人群密度及数量,在公共安全、商业规划和交通流量控制等领域具有重要应用,成为计算机视觉领域重要的研究课题。近年来,随着卷积神经网络在图像处理领域的广泛应用,人群计数研究取得了显著进展。但人群计数应用于实际场景,仍然面临复杂背景干扰、多尺度变化以及空间特征信息分布不均衡等诸多挑战。为了探究解决上述问题的方法,本文基于卷积神经网络,引入注意力机制、多尺度融合以及Invol
学位
现阶段,基建专项资金财务管理是国企的重要工作内容,做好基建专项拨款资金财务管理,可以促使基建项目建设做好科学规划,加强资金流转监督管控,从国家层面看,有助于提升国家治理水平和治理能力,缓解财政压力,从企业层面看,能够提升基建专项资金使用效益,保障财政专项资金科学配置,从而达成经营目标。本文基于国有企业展开分析,探讨基建专项资金财务管理的优化策略。
期刊