基于风格迁移的跨域行人重识别算法研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户：xjy1234

【摘要】

：

【作者】

：

刘慧婷

【机构】

：

南昌大学

【出处】

：

南昌大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

行人重识别旨在视野非重叠的不同摄像机下寻找包含相同行人的图像,是智慧城市中的重要一环,也是国内外研究的热点课题之一。然而,现阶段的行人重识别研究领域还存在两大问题。问题一是现有的方法往往需要大量高质量标注好的数据来训练模型,并且生成的模型易局限于特定的、单一的场景,不能很好地应用到新场景中,即模型可移植性差、泛化能力弱、容易出现过拟合现象。问题二是不同的监控设施的采集场景不一,不同的摄像机、光照情况、拍摄角度、遮挡障碍物等因素会不可避免地给行人重识别的结果带来消极影响,关键信息和重要信息的遗漏也可能导致模型的性能下滑。针对上述的问题一,本文立足于行人重识别中的无监督域适应问题,提出了一种基于风格迁移的两阶段跨域行人重识别方法。该方法引入的两阶段跨域的方法能够充分挖掘无标注数据集的身份特定信息。第一阶段是在原数据集域内进行摄像机增强,生成摄像机信息丰富的新数据集。第二阶段是将生成的新数据集和目标数据集进行域间整域迁移,使生成的模型能同时适应跨摄像机和跨域两种情况。通过训练鲁棒性更强的模型,可以得到精度更高的排序列表。通过该方法训练出的域适应模型,可以有效平滑摄像机差异与域差异。针对上述的问题二,本文立足于提取区分度更高的行人特征,提出了一种基于多区域特征融合的行人重识别方法。该方法首先将图片水平分割,然后根据不同的策略将被分割的各部分图片组合起来,通过组合后的训练结果确定最优化的图片分割策略。然后将能达到最优结果的融合特征放入网络中进行训练,对融合后的特征进行距离计算,最终得到排序列表。通过该方法可以将容易被忽略的特征利用起来,从而得到的特征具有更好的鲁棒性,可以有效提高模型的精度。在针对问题一提出的基于风格迁移的跨域行人重识别方法中,使用了最广泛的公用数据集Market1501和Duke MTMC来验证本文所提出方法的可行性,以Rank-1和m AP指标反映该方法的性能。在针对问题二提出的基于多区域特征融合的行人重识别方法中,还增加了在公用数据集CUHK03上的实验。实验结果表明,本文提出的方法在这两个数据集上均表现出更高的Rank-1与m AP,表明本文在跨域和特征融合方面的改进能够有效提高行人重识别模型的性能,且优于现有的行人重识别方法。

其他文献

基于多尺度网络的自然图像去模糊研究

图像去模糊的研究已经有了诸多进展,深度学习在图像去模糊领域上也颇有建树,但是纵观深度学习的去模糊方法,或是因为模型结构较为简单,导致去模糊的效果难如人意,产生了诸如伪影、丢失边缘纹理等问题;或是因为模型结构过于复杂,导致其适应性较差,难以将其广泛应用于各类场景中。在这一背景下,本文基于经典的深度多尺度卷积神经网络（DMCNN）,提出了一个相对轻量级的多尺度去模糊网络。本文所做的主要工作如下:（1）

学位

基于优化YOLOv4的中餐食物图像识别与应用研究

为将中餐食物图像检测模型部署在移动端设备上,本文提出了一种基于优化YOLOv4的中餐食物图像检测模型,并通过实验证明其有效性。之后,基于所提出的模型,设计并实现了一个中餐食物图像检测系统。本文的主要研究内容及工作如下:1.针对传统目标检测模型占用资源较多,轻量检测模型精度较低等问题,本文首先从轻量化的角度出发改进YOLOv4模型,一方面使用轻量化神经网络Mobile Net V2替换原始YOLOv

学位

基于近似近邻算法的图像检索研究与应用

随着大数据时代的到来,图像尤其是动物图像已经成为网络数据的重要组成部分。从已有的海量数据中有效地检索出动物图像,对于发现动物和保护动物具有重要的意义。由于科学技术的发展,现如今的图像检索普遍是基于内容的,近些年更是将深度神经网络与图像检索结合以获得更准确的检索结果。但是基于深度学习的方式获取的图像特征往往维度很高,而利用这种高维度的图像特征进行检索,在实际应用中往往会带来难以接受的时延问题。基于上

学位

跟古人学冬季养生之道

＜正＞众所周知,《黄帝内经》是我国最早的医书之一,里面记载了很多古人的养生之道,今天笔者就带大家来看看古人在寒冷的冬季是如何养生的。《黄帝内经》中关于冬季养生是这样记载的:冬三月,此谓闭藏。水冰地坼,无扰乎阳,早卧晚起,必待日光,使志若伏若匿,若有私意,若已有得,去寒就温,无泄皮肤,使气亟夺,此冬气

期刊

基于无监督学习的低照度图像增强研究

低照度图像因对比度低而不利于人眼观察和机器学习,尽管已经提出了不少图像增强方法来解决此类问题,但现有的算法或多或少存在一定的缺陷。例如基于Retinex模型的低照度图像增强（low-light image enhancement,LLIE）算法不仅对图像的亮度和对比度具有提升效果,而且在彩色图像增强方面具有明显的优势。然而此类算法主要对亮度分量进行估计,其结果并不准确且无法保留图像边缘信息,从而导

学位

基于人工蜂群算法的K-medoids聚类挖掘研究

随着大量的社会资源被网络化和数字化,数据浸润各行各业,成为重要的生产要素。从繁杂数据中提取价值信息成为助力生产学习的有效手段,数据挖掘的重要性不言而喻。K-medoids聚类算法是数据挖掘中的有效技术,它在继承了K-means算法优点的基础上,对噪声和离群点过于敏感的不足进行改进,得到了研究者的广泛关注。但K-medoids算法依然容易受到初始聚类中心点随机性的影响。为解决这些问题,本研究提出一种

学位

基于SaaS的工作流系统的设计与实现

工作流系统主要应用于具有明显流程特征的办公软件,但传统的工作流系统存在着部署维护成本高、升级迭代不够简便、应用不够灵活等弊端。随着云计算技术的快速崛起,SaaS模式以其升级维护成本低、按需租赁、即开即用和扩展能力强等优势逐渐被广泛应用于软件技术领域。针对上述问题,本文结合SaaS模式和微服务框架设计并实现了一个全新的工作流系统,有助于工作流系统的资源共享和灵活应用,提高了产品的技术竞争力。本文的主

学位

基于深度学习的配音情感识别的应用研究

随着影视动漫、有声书广播剧等产业的飞速发展,配音逐渐进入大众的视野,越来越多的配音爱好者希望利用业余时间学习配音,不仅可以增加一份收入,还能圆自己的“配音梦”。然而配音看似门槛低,实则需要专业的学习加上系统的训练与实践,其中配音情感的表达是衡量配音质量的关键因素之一。而网上出现的各类线上配音速成培训班教学质量良莠不齐,难以对学生的配音训练实践提供实时指导,学生也无法准确的评估自己配音的情感表达效果

学位

面向提高失智症智能辅助诊断效果的图像深度生成技术研究

失智症是指任何导致记忆或思维能力的改变严重到足以干扰一个人的日常生活的疾病,其中最常见的失智症疾病是阿尔兹海默症。动脉自旋标记是一种使用可自由扩散的内在示踪剂测量脑血流的功能性磁共振成像技术。动脉自旋标记凭借无需注射造影剂、无电离辐射和费用较低的优点,在失智症这种长期性疾病的临床中得到广泛的运用,但遗憾的是目前尚没有公开的基于失智症的动脉自旋标记数据集。为了改善这种现状,本文深入开展了面向提高失智

学位

基于深度学习的短文本分类研究

文本作为人类重要的交流方式,记载了大量的人类文明信息。进入现代文明后,信息技术得到了快速发展,产生了大量的短文本数据。这些短文本数据包含着许多有价值的信息,由此衍生出短文本分类这一重要的课题。然而,由于短文本数据特征矩阵的稀疏性和语义特征不足使得短文本分类面临巨大的挑战。本文针对短文本的文本表示和语义不足方面,提出了基于加入注意力机制的卷积神经网络和神经主题模型的Prod LDA-ACNN模型,基

学位

基于风格迁移的跨域行人重识别算法研究

与本文相关的学术论文