【摘 要】
:
行人重识别作为视频监控安防领域的关键技术,由于其对视频智能分析展现出的优异性能,近年来受到工业界与学术界的越来越多的关注。有监督行人重识别方法当前已经取得了较为理想的性能表现,而跨域行人重识别方法仍存在较大的改进提升空间,行人重识别技术实际跨境头应用场景下会遇到目标数据无标签的问题,同时已有模型对新的数据不具备类别学习能力。因此,本文从已标注与无标注行人重识别数据域关联的角度出发,提出一种基于域自
论文部分内容阅读
行人重识别作为视频监控安防领域的关键技术,由于其对视频智能分析展现出的优异性能,近年来受到工业界与学术界的越来越多的关注。有监督行人重识别方法当前已经取得了较为理想的性能表现,而跨域行人重识别方法仍存在较大的改进提升空间,行人重识别技术实际跨境头应用场景下会遇到目标数据无标签的问题,同时已有模型对新的数据不具备类别学习能力。因此,本文从已标注与无标注行人重识别数据域关联的角度出发,提出一种基于域自适应的无监督行人重识别算法,将网络模型从已有标注的源数据域学习到的特征提取能力迁移到无标注的目标数据域,所设计的网络框架可以在没有行人标签信息的场景下学习新数据域的区别性特征表示。本文的主要研究内容如下:1.阐述行人重识别任务的问题起源,课题的研究意义。对比有监督学习、迁移学习和无监督学习行人重识别方法的设计思想与区别,并对行人相似度的常用计算方法进行分析,介绍行人重识别常用数据集与性能评估指标。2.在已有数据域下训练的网络模型通常并不能对未知的数据域起到很好的检索效果,针对这一行人重识别跨域问题,尝试将无标注的目标域行人样本加入训练过程,以提高行人重识别算法在实际应用场景下的准确度。由于无法将分类损失函数应用于无标注数据,提出一种用以存放目标域行人特征的特征库模块(Feature Library,FL),在模型训练阶段实时更新特征库,通过无监督聚类方法学习无标注数据的辨别性特征表示。3.提出一种跨域特征提取器以探索不同数据域之间潜在的样本关联,使网络更加高效地学习不同数据域之间的区别性特征。所提方法在已标注源域上训练的网络模型,能够很好地应用在无标注的目标域数据,从而充分利用已标注的数据提高模型在未知目标域的泛化能力。本文在三大行人重识别数据集进行模型评估,实验表明,所提算法能够同时利用有标注源域与无标注的目标域数据,可以显著提高算法在新数据域的准确度性能。
其他文献
技术对于解决视频数据量不断增长所带来的浏览耗时的问题有着重要的意义。视频摘要即对视频的概括,按照生成的摘要形式可以分为静态视频摘要和动态视频摘要。在实际工程应用中,静态视频摘要技术更为常用,因此本文主要研究静态视频摘要算法,旨在通过一定的技术手段去除视频中的冗余信息,并选取视频中最能代表视频内容的关键帧生成简短的摘要。本文分析了现有的视频摘要算法所存在的一些不足之处,然后提出了两种全新的基于多特征
随着智能信息化时代的到来,诸如图片,视频,文本以及音频等不同模态数据在互联网上与日俱增,这些多模态数据以不同的形式描述着生活中复杂纷繁的场景,并为彼此提供了有用的互补信息。不同模态的数据在其原始形态上呈现出明显的异质性,难以直接将它们从语义层面建立关联。因此,需要将不同模态数据映射到共有子空间并减小它们之间的差异性。跨模态表示学习旨在减小不同模态数据在特征层面的差距,建立起模态间的语义联系并扩大模
目标检测是计算机视觉中的重要分支,由于不同场景之间的特征分布差异(如背景、光照等),在公共数据集上训练的目标检测框架在现实场景中使用时往往会出现性能下降的问题。解决该问题的方法是采用域自适应技术使在源域训练的模型在目标域中也可以很好的使用,但是传统的自适应方法通过对齐不同域之间的边缘分布以减少特征分布差异,但是可能会导致负迁移的问题。此外,仅仅考虑了单一目标域的自适应场景,限制了模型的适用范围。文
数字化时代的到来引领了三维模型的发展,人们对三维模型的研究不断深入,三维模型的应用也越发广泛。其中,以线形方式表示的三维模型抽象地描述了物体的形状或结构特征,在计算机中不仅存储方便,而且易于交互。在此背景下,本文围绕三维模型的线形表达方式,以原子模型和线框模型为研究对象,调研分析了原子模型在建模和渲染、线框模型提取方面的相关工作,对于原子模型的建模和渲染、线框模型的提取过程中存在的问题进行了研究,
在如今信息技术的快速发展中,物联网技术被不断地普及,人机交互是当前领域的一个热门方向。与此同时,人们的工作生活中,久坐行为已经成为一个普遍存在的现象,但是人们对于久坐行为对身体带来的健康风险却知之甚少。本文将创新性地提供两种使用Wi-Fi信道状态信息进行久坐行为识别的系统方案,使用机器学习模型以及并行长短时记忆(Long Short-Term Memory,LSTM)神经网络和卷积神经网络(Con
区块链对计算和存储资源的高需求严重限制了区块链的发展。特别的,在包括物联网在内的资源有限的环境中,区块链难以实现大规模应用。将复杂的区块链计算任务从物联网终端用户卸载到边缘或云是缓解终端用户计算压力的有效解决方案。云/边缘向物联网终端用户提供付费计算资源,物联网终端用户得以执行区块链计算任务而获益。因此,合理的云/边缘计算资源分配与定价对云/边缘和物联网终端用户的收益至关重要。应用纠删码技术是减少
随着人工智能和深度学习的快速发展,跨模态识别研究有了很大的突破。视频描述生成是一个结合了计算机视觉与自然语言的跨模态任务,它的目的是将给定的视频转换为人类可以理解的自然语言序列。简而言之,理解视频的内容对于视力正常的人来说是件简单的任务,但是对于机器或视力残障人士来说却是困难的,它可以帮助视力残障人士理解视频中的信息。视频描述生成在视频检索、人机交互等众多领域都有潜在的应用前景,这需要对视频和自然
伴随着经济、科技水平的不断提高,人们在日常生活中对机器智能化的需求也日益增加。在如今的人工智能浪潮中,机器是否具有情感,是决定机器智能化和人性化程度的关键因素。为此,近年来很多人工智能领域的专家都展开了对情感计算的相关研究。而情感识别正是情感计算领域中最为关键的一项技术。目前关于情感识别的研究通常都只关注于单一模态,而人类的情感表达方式是多模态的,因此,仅基于单模态的情感识别方法可能无法捕捉到个体
作为人类传递和表达情感的重要方式,表情基本不受性别、种族和个人背景影响。精准识别人脸表情有助于实现更智能的人机交互。研究表明,表情可以通过面部活跃区域的动态变化来表示,而如何高效、全面地捕获面部活跃区域的特征一直是研究者们关注的重点。此外,针对自然条件下的人脸表情识别研究,因数据集标注者的主观性和视频本身表情的不确定性,导致部分样本标签被错误标注,进而使得网络学习到错误的特征,最终导致自然条件下人
随着云服务的广泛运用,云服务提供商需要不断提高服务质量,并降低运营成本。云数据中心的极度复杂性使得软硬件故障频繁发生,并进而导致巨额损失。但是,应对软硬件故障的容错机制都不可避免的会增加包括能耗在内的云计算系统成本。因此,服务质量、能量消耗和可靠性已成为云服务提供商和用户关注的焦点。针对上述问题,迫切需要高效的任务部署策略,将任务部署到合适的云数据中心服务器上,从而提高云数据中心的服务质量、能源效