无监督跨域行人重识别系统的研究与应用

来源 :济南大学 | 被引量 : 0次 | 上传用户:fjms001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着监控摄像机的广泛使用以及公众安全意识的增强,行人重识别技术(Person Re-Identification,Person Re-ID)已经引起了计算机视觉和模式识别界的特别关注。行人重识别是指能够在从不同摄像机拍摄的图像或视频源中再次检索到特定目标对象的技术,它有利于帮助快速处理城市中的异常情况,例如跟踪偷车贼、通缉犯以及失踪儿童等等,在现代社会中具有重要的研究意义和应用价值。近年来,得益于大量标注图片,全监督行人重识别已经取得较高准确率。但是,数据标注的高成本使得全监督行人重识别技术难以扩展到实际应用中,如何利用无标注数据去提高无监督跨域行人重识别性能迫在眉睫。从研究的角度来看,由于需要面对更为复杂的跨域条件,无监督跨域行人重识别面临着一些更具挑战性的问题。其研究复杂性体现在:1)分布复杂性:跨域环境下行人差异大且无标注信息,训练与测试样本特征空间分布不一致,模型不能很好的泛化到新的类别。2)特征与结构复杂性:实际视频侦查中,样本结构更为复杂,正样本极其稀疏,聚类易产生大量离群值,加上模型对局部特征信息不够敏感,易造成对相似特征行人的误判,导致模型识别的准确率降低。针对上述问题,立足于无监督跨域行人重识别的研究与应用,本文开展了以下工作:(1)针对分布复杂性问题,本文率先尝试将多模型组合优化框架与聚类产生伪标签的方式结合,提出了一个具有动态动量更新的多网络协作训练(CTDMU)算法。该算法采用动态动量更新策略生成更加稳定的辅助动量模型后,进一步利用多模型进行高效的协同训练来促进模型的相互修正,同时在动量伪标签和协作伪标签的双重伪监督下,构造了两组协作损失函数和动量损失函数来优化特征空间,从而不断提升伪标签的质量。CTDMU算法有效缓解了目标域和源域分布不同时性能严重下降的问题,大幅度的提高了无监督跨域行人重识别模型的泛化性能。(2)针对特征与结构复杂性问题,在CTDMU算法的基础上,本文设计了基于多融合注意力机制的委员会投票算法(MFACV)。首先提出了一个融合注意力模块来捕捉长距离依赖关系并融合多级特征,其次将其插入多个异质网络模型中充分学习了具有足够判别性细节特征信息,然后在目标域上执行渐进式成对合作训练和基于图的委员会投票机制,最后在投票信息图上利用连通域搜索生成伪标签更好的控制离群值。MFACV算法可以进一步获取有利于行人重识别任务方向的行人线索,大幅度的提高了无监督跨域行人重识别模型的鉴别准确性。(3)针对无监督跨域行人重识别的应用,本文在上述工作获取的高精度模型的基础上,设计并实现了完整的行人重识别系统:包括行人检测、重识别、以及跟踪模块。系统在Windows 10平台进行测试,测试结果表明其能够很好完成面向实际场景的行人重识别任务。
其他文献
随着物联网、云计算、大数据的发展,最优化问题出现在生产实践、科学研究和社会活动的众多领域中。最常见的解决方法是利用目标函数的导数通过多次迭代来求解问题。然而随着问题变得越来越复杂,很多现实问题趋向于黑盒问题的特征,在面对此类问题时传统的数学优化方法由于过于依赖问题的数学特性而失败。因此,如何智能化解决最优化问题成为人工智能领域发展的一大重要难题。启发式算法是进化计算涉及到最优化问题的一个子域,它把
学位
目前,随着互联网的发展以及技术的创新,个体之间相互联系、相互影响不断加强,形成了规模庞大的动态网络,这些动态网络可以被抽象为动态图。为了对动态网络进行分析,就需要一种行之有效的方法,如社区演化分析方法。基于社区演化,可以有效预测社区未来变化,揭示社区发展的规律,从而有效推动社区的发展。为有效进行社区演化分析,需要对社区结构在不同时间快照的状态进行跟踪。但是目前已有的针对动态网络进行社区演化分析的研
学位
工业是产生大数据的重要源头,工业数据的分析有助于提高信息化和工业化的融合水平,实现数据智能分析,同时工业数据的处理也面临着诸多挑战。本文进行分析的工业数据是排污设备运行过程中的主要用电数据,包含数据集结构不规律、数据密度分布不均匀以及存在噪声点的问题。根据需求要采用人工智能的分析方法,通过对这些用电数据进行分析实现设备运行状态的划分,然而这些是无标签数据,无法进行分类,因此选择将其作为一个聚类任务
学位
随着城市化的飞速发展,城市居民面临的各种社区生活风险与日俱增。作为城市居民风险意识的建构基础,居民生活风险感知的水平反映着城市社区治理的运行状况。社区社会资本是对城市居民的社区生活风险感知水平与状况具有影响的社会因素之一。深入研究社区社会资本影响城市居民的社区生活风险感知的内在机理,对促进城市社区治理创新,构建社区风险治理共同体具有重要的理论与现实意义。在综合社会资本、风险感知与社区治理等理论的基
学位
改革开放以来,人们的教育获得需要和现实支付能力之间的矛盾日益凸显,应时而出的教育储蓄方兴未艾。尽管我国家庭教育储蓄的影响因素、持有状况与可能导致的效应已受到学界的重视,但对于家庭教育储蓄影响儿童学业成绩的作用机制与群体差异,国内社会学等有关领域尚未进行经验验证与理论探讨。本研究依据2018年中国家庭追踪调查数据,运用结构方程模型分析方法,实证研究家庭教育储蓄影响儿童学业成绩的路径机制;通过多区组分
学位
近年来,加密数字货币因为其相对于传统货币的优势,流行于世界各地,这导致了挖矿行为的盛行。现阶段,无数高性能计算机正在用来挖矿,挖掘数字货币需要巨大的计算资源,这造成了计算资源的严重浪费。此外,加密货币挖矿行为巨大的能源消耗也是一个不可忽视的问题,甚至成为全球碳排放的一个重要因素。因此,研究识别与管理挖矿行为势在必行。传统识别方法应用规则库,匹配域名、IP地址等特征去识别,尽管此法简单有效,但其泛化
学位
现代社会对工业产品的质量要求越发严格,工业产品的出厂检测越发受到重视,但复杂工件的尺寸测量方式目前仍以人工接触式测量为主,测量精度低且耗时耗力。我们研发了一套多相机测量系统,即采用多台高分辨率相机搭配小视野域镜头采集复杂工件局部图像,进而利用双相机标定尺寸测量法实现微米级测量。该系统精度高、效率高、成本低、非接触,优势明显。然而,随着镜头视野域减小,景深也必然减小,复杂工件图像易受震动、制造公差等
学位
问答社区是当今互联网时代促进知识分享与交流的重要信息平台。然而,伴随用户的急剧增多,平台在短时间内积累了大量的数据,使得提问者无法在短时间内收到高质量的答案、回答者无法迅速识别出他们感兴趣的问题,严重降低了用户体验。如何挖掘用户感兴趣的问题、优化下发问题邀请的准确率,成为问答社区面临的严峻挑战。为此学术界和工业界展开专家推荐的研究,旨在发现专家用户,提高问题解答率以及回答生产数。目前存在的问答社区
学位
电子皮肤(e-skin)是一种能够模拟人体皮肤感知外界刺激的电子设备,被认为是机器人、可穿戴健康监测和人机交互应用的关键技术。虽然电子皮肤吸引了越来越多的研究者的注意,但是,大多数研究只关注单一类别的静态或动态信号的检测,这远远达不到实际应用的要求。为了将电子皮肤从理论上推向实际应用,模仿人类触觉感知功能以实现智能感知是必不可少的。到目前为止,研究人员感兴趣的研究点大多数在于器件性能方面,尤其是在
学位
随着船运行业的发展,船舶数量的增多导致船只事故发生的可能性增大。当事故发生后,搜救失事船舶的关键前提是预测船舶未来一段时间内的航迹。失事船舶的航迹预测方法分为两种:基于运动学方程预测和基于无动力学方程预测。基于运动学方程的预测方法随着外界影响因素的变化,预测模型需要不断地进行人为调整,这使得建立的模型并不具备很好的泛化能力。基于无动力学方程的预测方法通常使用神经网络模型,但这种方法缺乏可解释性,且
学位