基于单标注样本的视频行人重识别研究

来源 :常州大学 | 被引量 : 0次 | 上传用户:taiguomin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是在多个摄像头网络中检测特定的行人是否出现的技术。它在智能视频监控系统中扮演了重要角色,并且在公共安全领域有广泛的应用。由于目前摄像头产生的视频数量繁杂,虽然包含了丰富的行人信息,但是需要在数据标注上花费极大的代价。为了减少数据标注的成本,有效地利用视频数据,同时获得鲁棒的模型,本文主要研究基于单标注样本的视频行人重识别方法。针对单标注样本视频行人重识别中特征提取能力弱,伪标签分配错误率高以及数据浪费的问题,提出了两种有效的解决办法:(1)基于单标注样本的多损失学习与联合度量视频行人重识别方法。多损失学习策略兼顾了有标签数据、伪标签数据和无标签数据。对于有标签数据和伪标签数据,利用标签平滑正则化损失和交叉熵损失联合训练,减少过拟合的情况。对于无标签数据,利用排他损失进行优化,减少无关数据对于特征学习的干扰,避免了无标签数据的浪费。在标签估计时,设计了一个联合距离度量,该度量不仅考虑了无标签数据和有标签数据间的直接联系,还参考了有标签数据近邻的信息,有效地提高了伪标签分配的准确率。(2)基于SAM注意力与相互近邻度量的单标注样本视频行人重识别方法。在单标注样本视频行人重识别方法中,极少采用复杂的结构来提升特征提取能力,因为复杂的网络会带来巨大的计算量,使得训练模型花费的时间变久。为了提升网络的特征提取能力,同时不增加计算的负担,在Res Net-50中嵌入SAM注意力模块,该模块不会增加网络的参数,也不必过多调整网络的结构。在分配伪标签时,本文借鉴了k相互近邻编码的思想,即互为k相互近邻的两个样本极可能属于同一个类别,并将相互近邻距离作为标签估计的度量。该度量由马氏距离和杰卡德距离构成,提高了标签预测的精度。本文的方法在两个大型视频数据集MARS和DukeMTMC-Video Re ID上进行大量实验。与其他方法相比,标签估计更准确,模型判别力更强。
其他文献
传统充气轮胎存在爆胎问题,影响工程机械的正常服役,而免充气轮胎不会爆胎,因此其在工程车辆领域的应用前景看好。仿生技术是近年来的新兴课题,借鉴自然界中生物体的结构特点,将其改良并引入工程机械结构设计中,可以达到提高强度、节省材料等目的。为此,本文在免充气轮胎国内外研究现状分析的基础上,应用仿生技术,提出了一种满足可靠性指标要求的工程机械仿生免充气轮胎结构,并对其承载能力、等效应力、接触压强等进行了研
学位
移动机器人的路径规划分为单目标路径规划和多目标路径规划。强化学习方法能够有效解决单目标路径规划问题,但多目标路径规划问题通常包含多个相互冲突的目标,且强化学习中标量形式的奖励很难同时描述多个目标,导致强化学习算法在多目标路径规划问题中性能不佳。针对上述问题,本文将多目标强化学习(Multiobjective Reinforcement Learning,MORL)应用于多目标路径规划,使用向量形式
学位
近年来,由于网络的日益发达,使用在网络的评价量呈现指数级别上升,这些评论中承载了用户对产品或某一对象的态度和观点,研究这些评论中蕴含的情感倾向具有重要的现实意义。随着对情感分析的深入研究,涌现出许多基于深度学习的各类模型。其中也出现了许多问题,例如基于传统注意力机制的神经网络模型在捕捉句子长依赖关系上的表现并不突出,而能解决该问题的依赖树模型容易忽略依赖弧上的标签信息。另一边,随着科技的发展,用户
学位
近年来,行人重识别技术由于深度学习的发展取得了巨大的进展。然而,目前的行人重识别研究主要是集中在短时间情况下,即行人的衣着不太可能发生改变。这些方法在很大程度上依赖于行人穿着衣物的颜色外观。然而现实中更常见的情况是长时间下,一个人有很大的机会更换衣服,所以现有的方法在此情况下是不可靠的,行人重识别模型应该考虑这种情况。因此,换衣行人重识别任务应运而生,本文针对换衣行人重识别问题,主要做了如下方面的
学位
区块链作为一种去中心化的分布式账本系统受到世界的普遍关注。联盟链作为区块链中的一类,具有高性能、强可控性的特性,其弱中心化的特点也更符合企业属性。因此高性能联盟链系统关键技术研究也是区块链技术研究的一个重要方向。目前对于联盟链系统的性能提升研究主要致力于共识算法的优化,而分片技术的加入能够进一步提高联盟链的扩展性,但是现有的分片协议大多针对公有链系统设计,甚至部分需要硬件依赖。因此,基于联盟链的共
学位
在人体行为识别任务中,基于骨架关节点的模型由于能清晰、直观地表达特征、运算简便,且鲁棒性高,因此倍受关注。但是在传统骨架建模方法中,依然存在空间图构造受预定义影响,忽略了非相邻节点间信息的有效利用,以及常规卷积神经网络对遮挡适应性较差、容易忽略全局特征等问题。针对此,本文在ST-GCN模型基础上,提出几点改进方法,具体如下:(1)提出一种基于全局图遍历的ST-GCN人体行为识别算法。在STGCN模
学位
随着信息技术和人工智能的发展,人脸识别技术的应用越来越广泛,给我们的工作、生活提供了极大的便利。当涉及复杂环境的人脸识别时,人脸识别往往面临很多问题,如遮挡问题、光照变化等。基于这些复杂环境的人脸识别也成为当下研究的热点。针对人脸自遮挡、面部配件、物理遮挡等复杂遮挡问题,本文研究了基于多角度人脸重构和Gabor字典学习的无约束人脸识别。主要包括以下几个方面的内容:首先,许多基于数据、模型分析的方法
学位
任务型对话系统能够以人类语言与用户交流,在多轮交互中监控用户目标,最终完成用户所提供的任务。对话状态追踪是任务型对话系统中承上启下的关键模块,当前研究忽略了槽位与自然语言之间的关联,导致模型无法处理一些特殊的用户表达。此外,传统模型还采用了槽位门控机制并且将对话历史作为输入,这拖累了系统的响应速度,使用户无法获得良好的人机交互体验。针对传统模型忽略了槽位与自然语言之间的关联并且推理速度过慢的问题,
学位
智能手机迅速发展,功能丰富化应用多样化的同时,能耗也不断增加。但由于物理尺寸及电池技术的限制,导致其续航能力得不到提升。智能手机的应用程序离不开网络支持,研究表明,网络请求是造成智能手机耗能的重要原因之一。因此,大量研究者从网络传输方面降低能耗,将网络请求推迟进行合并转发是其中一种方法,但一定程度会影响用户体验。通过对不同使用场景设置不同的延迟时间可在牺牲少量用户体验的前提下降低更多能耗。本文采用
学位
随着农业现代化进程的推进,基于农业领域的知识服务体系成为农业信息化研究的热点问题。传统的信息获取方式以搜索引擎为主,搜索引擎返回大量网页链接,答案高度分散并且呈现多源异构的特点,无法迅速且准确地为农业相关工作者提供知识服务,用户体验感差。领域知识图谱的发展为特定领域内的知识问答提供了高质量的知识库基础。本文基于构建的农业知识图谱,对农业知识问答系统进行研究。主要研究内容如下:(1)构建农业领域知识
学位