基于深度学习的行人重识别研究

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:jiaqishi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的迅猛发展,人们开始越来越关注社会公共安全问题,在许多大型的公共场合都安装了监控摄像头,形成系统的监控网络。但随之而来面临着一个亟待解决的难题,就是在如此大量的数据中,如何高效、系统的筛选有用信息,传统的方式是依靠人工方式进行筛选信息、提取有用内容,这不仅费时费力、效率低下,关键在于人眼观测监控视频时间越长误判率越高,行人重识别(Person Re-identification,Re-ID)的出现极大的缓解了这种问题。行人重识别主要是利用计算机视觉方法在给定的数据集中找到特定的行人。然而由于实际环境复杂,同一个行人由于光照、遮挡、行人姿态的变化等,难以提取有效的特征,这给正确识别行人带来了极大的困难。传统的方法主要分为人工设计特征提取和相似性距离度量学习两类。然而人工设计的特征无法避免其自身复杂、识别效果不佳的弊端。近些年以来,在计算机视觉领域中,随着深度学习在行人重识别领域中的广泛运用,其在学习特征方面的优势得到了充分的体现。本文主要是基于深度学习中的卷积神经网络来对行人重识别进行研究,并针对其固有难点提出了一种基于无监督域自适应(unsupervised domain adaptation)与重排序(re-ranking)相结合的新模型,并命名为UDA+,其主要过程如下:(1)首先使用生成对抗网络来生成更多无标签的样本,以扩充数据集,有效地缓解了在训练过程中样本不足的问题。(2)然后改进残差网络模型,以ResNet-50为基础模型框架,并在此基础上增加样本记忆模型,引入样本不变性、相机不变性、邻域不变性三种损失函数,共同利用其不变性以减少源域和目标域之间的特征差异及其域间变化,同时使用PyTorch框架在ImageNet中进行微调训练,以达到模型参数的最佳效果。(3)最后在测试阶段,本文采用k-reciprocal近邻重排序方式,对候选列表进行重新排序,进一步的提高再识别的精度。实验结果显示:新提出的算法在公共数据集Market-1501和DukeMTMc-re ID上的测试结果,分别在Rank-1和mAP方面比大多数优秀的算法提高4%和14%,充分证明改进后的模型能够有效的提升行人重识别的准确率。
其他文献
“富煤、贫油、少气”是我国现实的能源禀赋。目前,我国油气产业的可持续发展面临国际油价低迷、国内常规油气勘探开采难度日益增大以及环境规制强度不断提升的多重压迫。在这样的背景下,油气产业技术创新更需要找准创新方向,突破“卡脖子”的核心技术,制定合理的油气产业技术创新发展战略。本研究基于Derwent专利数据库,从油气产业授权的发明专利视角出发,首先分析油气产业技术创新分布规律,然后运用社会网络分析方法
学位
随着环境问题和能源危机的日益凸显,依据国内外地区的经验和各国有关政策,能源转型是解决此问题最有效的方法。风电作为新能源发电中研究最多的一部分,逐渐成为了新能源发电的主流。以风电为代表的可再生能源发电代替传统的化石能源发电也是大势所趋。但是由于风电出力的随机、间歇、难以准确预测的特性,大规模的风电并网给电力系统的可靠运行带来了巨大的挑战,所以提供充足的旋转备用容量就显得十分有必要。尤其是由于负旋转备
学位
目前JPEG图像作为信息的重要载体,是人们获取信息的主要来源之一。随着各种图像编辑工具的普及,JPEG图像很容易被篡改,对其进行取证研究刻不容缓。在图像伪造过程中,通常会对篡改区域进行重采样操作(旋转、缩放、扭曲等),使合成的伪造图像更加逼真。因此,重采样痕迹取证有助于鉴别图像的真伪,具有较高的理论研究意义和实用价值。现有的JPEG图像重采样检测仍存在一定的难度与挑战。一方面针对JPEG图像降尺度
学位
机器学习模型在生产、流通、销售和服务各个环节都有广泛应用,但随着大数据时代的来临,可用于分析的数据急剧增加,导致模型结构日益复杂,逐渐失去可解释性。为提升复杂模型的可解释性而提出的事后解释方法目前已经取得一些成果,但仍存在若干科学问题亟待解决。针对事后解释方法中存在的部分问题,本文进行了改进研究。首先,系统梳理相关研究,对事后解释方法的种类及每一类方法的优缺点进行归纳总结。其次,在此基础上提出一种
学位
机器人是人工智能的产物,彰显了一个国家的科技力量。路径规划是机器人最关键的技术之一,旨在寻到起点与终点间的最短路径,属于典型的最优化问题。蚁群算法属于经典的群智能算法,善于解决旅行商问题(Traveling Salesman Problem,TSP)等最优化问题。蚁群算法具有收敛速度快、求解质量高等优点。然而,在解决大规模问题时,蚁群算法容易陷入局部最优。为了使蚁群算法更好地解决大规模问题,本文对
学位
近年来,我国的能源需求量不断增加,而石油和常规天然气增量有限,增速较缓,威胁我国能源安全,加大了对外依存度。页岩气作为低碳能源,资源量丰富,大力扶持页岩气产业的发展已是大势所趋。目前,我国页岩气经济效益不佳,但伴随产生的生态和社会效益日益显现,建立综合效益评估模型可以实现对项目的全面评估,对企业正确选区,国家制定适宜的页岩气等非常规天然气补贴政策以推动产业发展具有重要作用。本文对页岩气开发利用的综
学位
生物行为分析在神经学、药物学、疾病治疗和认知科学方面有着重要的研究意义。随着计算机视觉、图像处理和MEMS等检测技术的发展,生物行为自动分析系统的设计实现,可以大幅提高传统人工识别与分析方式的工作效率。本文以小鼠为实验对象,设计了一款基于多传感器信息融合的生物行为分析系统,重点研究基于视觉传感器小鼠行为分析中的图像预处理、目标检测、目标特征信息提取、小鼠运动参数计算等关键技术;以及基于IMU传感器
学位
作为一个纺织服装生产、出口、消费大国,中国纺织产业对质量检测提出了更高的要求,而传统的织物结构与外观分析测试方法难以满足现代纺织行业标准和需求,因此,亟需构建一套客观、精确、高效的织物结构以及外观分析系统,提升相关行业检测的效率和准确性。织物结构和外观的智能化分析,不仅是检测领域的难点,也是纺织工业智能化、数字化发展的研究热点。现有研究提出的客观分析方法大多是基于织物二维图像的,受织物纹理和颜色影
学位
随着互联网技术的快速发展,虚拟问答社区已成为了一种热门的知识服务平台,用户可以在其中提出问题或解答问题。为了增强知识共享,社区还为用户提供了输入内容查询相关答案的功能,但社区返回的查询结果通常只是一个与查询内容相关并且具有海量信息的问答列表,并且存在以下问题:查询结果中包含了大量的问答对,同时每一个问题下也包含了大量的答案,用户难以在有限时间内浏览完全部的答案;与此同时,不管是查询结果中的问答对、
学位
在线问答社区作为一种重要的知识共享平台,帮助越来越多的用户满足知识需求。随着问答社区中问答数据的持续积累,海量的问答数据造成了信息过载的问题,用户难以快速、准确地获取所需知识。在浏览问答文档时,为了更好地理解和掌握答案内容,用户通常需要浏览能够对当前答案中的内容进行解释的其他问答。用户的专业背景不同,对于解释性问答的需求也不完全相同。结合用户的个性化特征,向其提供个性化的解释性的问答,可以帮助用户
学位