【摘 要】
:
作为一项计算机视觉领域在现实生活中的重要应用,行人重识别问题因为日益增长的智能监控领域的需要而得到越来越广泛的关注。当前,基于有监督学习的行人重识别任务已经能够取得超越人类的识别效果,但是仍然有以下两个严重的问题阻碍着这项技术的实际应用:首先是低光照场景下,仅基于可见光图像的训练不足以让模型得到可靠的结果,这大大限制了行人重识别技术的应用范围;其次是大规模的模型训练需要海量的数据和标注,这极大地增
论文部分内容阅读
作为一项计算机视觉领域在现实生活中的重要应用,行人重识别问题因为日益增长的智能监控领域的需要而得到越来越广泛的关注。当前,基于有监督学习的行人重识别任务已经能够取得超越人类的识别效果,但是仍然有以下两个严重的问题阻碍着这项技术的实际应用:首先是低光照场景下,仅基于可见光图像的训练不足以让模型得到可靠的结果,这大大限制了行人重识别技术的应用范围;其次是大规模的模型训练需要海量的数据和标注,这极大地增加了人工成本,并且仅依靠有监督学习得到的模型不能适应未知的行人数据,在这种情况下,研究不需要标签信息的无监督行人重识别就显得尤为重要。本文针对这两个问题分别进行了跨模态行人重识别问题和无监督行人重识别问题的研究。无监督行人重识别由于不需要人工标注的数据信息,近些年来受到越来越广泛的关注。基于聚类和微调的做法是当前跨域行人重识别和无监督行人重识别主流方法,然而这样的方法会舍弃极具价值的离群点带来的信息,从而对模型的训练造成不可挽回的误差。而且,简单地利用伪标签进行交叉熵损失忽略了类内距离和类间距离在这种细粒度分类任务上的重要性。本文根据这两点不足,在跨域行人重识别和无监督行人重识别领域分别做出了改进。本文首先提出利用Arc Face损失对对比损失进行优化增大了类间距离,然后又利用特征线性合成地方法,变相增大了类内密度,减小了类内距离,并将这两种方法应用于当前一个主流的基线模型上,实验验证了这些改进的有效性并取得了先进的精度效果。在无监督行人重识别问题中,本文提出了一个基于动态内存对比学习的无监督行人重识别基线方法,该方法将所有样本实例特征保存在内存中,使用当前数据的特征和内存中的数据特征作对比损失并动态更新,从而确保每一个样本都对模型的训练做出贡献,大量的实验证明,本文提出的基线方法已经取得较为领先的识别结果。随后,本文又结合基线的特性,提出了基于困难样本挖掘的对比损失,并将其同时应用于当前数据和所有内存特征,又提出了基于概率蒸馏算法的平均教师模型来约束模型的训练,防止其参数的快速变化导致的信息损失。在这两种改进下,本文提出的方法在无监督行人重识别和跨域无监督行人重识别两种实验条件下均取得了最先进的实验结果。由于红外图像能够有效弥补可见光图像在低光照条件下的局限性,研究跨模态行人重识别对于提高行人重识别系统的适应性具有重要的实际意义。由于同时存在两种模态的图像,跨模态行人重识别关键在于去除不同模态的特征差异而只保留统一的身份特征。本文提出了基于双路网络的跨模态行人重识别方法,这种方法通过分割骨干网络并不断调整参数共享的范围来分析双路网络应用于跨模态行人重识别中的最佳结构,同时利用类内分布一致性和类间系数相关性约束双路网络输出的不同模态特征。大量实验证明本文提出的方法在当前两个主流的跨模态行人重识别数据集上均取得了先进的识别精度。
其他文献
监控摄像头目前已被广泛应用于公共或私人场所,并在安防活动中扮演着重要的角色,但其带来的隐私安全问题也不能被忽视。监控摄像头通常被安装在酒店前台,超市收银台或售票处等公共场合的角落。在这些场合下,用户输入个人识别码(PIN)解锁或付款的过程可能会在有意或无意中暴露。一旦PIN被破解将会给用户带来严重的隐私泄漏问题和财产损失,然而,几乎没有监控设备的制造商意识到这一隐患。PIN是一种传统的基于知识的认
随着大数据时代的到来,各行业在互联网技术的加持下迎来了蓬勃发展。海量的数据资源蕴含了丰富的实际价值,经过数据挖掘等技术的处理分析可以创造出巨大的社会以及经济价值。大数据技术给各领域带来便利的同时,将数据安全问题辐射到更广泛的领域。数据被盗、非法篡改、恶意传播等大规模数据安全事件屡见不鲜,资源的开发共享和数据的安全保护已成为数字经济时代长期存在的矛盾难题之一。数据库水印技术可以有效地保证数据库所有者
癌症,是一类严重危害人类生命健康的复杂疾病,具有高度异质性。癌症亚型识别问题是癌症研究领域中最重要的问题之一,同一种癌症的患者在生存风险、对药物的敏感性等多个方面存在明显差异,这意味着癌症存在多种不同的亚型,因此研究癌症的亚型划分,能够为癌症患者提供准确的诊断和治疗。高通量测序技术的不断发展,使得测序的规模迅速扩大,并且测序成本极大降低,现已积累了大量癌症患者的基因组、转录组、表观基因组以及蛋白组
信息时代的来临催生了人工智能技术的快速发展,为打破数据孤岛,同时避免传统机器学习模式集中收集训练数据带来的隐私威胁,联邦学习技术得以诞生。联邦学习由一个中央服务器与多个参与者组成,通过多次迭代共同训练一个全局模型。尽管前景看好,联邦学习应用到实际场景中时仍然遇到了很多的挑战,其中最为突出的就是异构问题与隐私问题。首先,联邦学习作为一种分布式机器学习框架,其训练数据在各个客户端的分布往往非均匀,数据
人工智能时代的到来,让人们的生活变得更丰富和便利。深度学习作为人工智能技术中的一柄利器,为机器学习各个领域的发展开辟了新的天地,同时也解开强化学习发展的枷锁。强化学习是一种求取任务中的最优策略的方法。得益于深度学习,强化学习在诸多领域中都获得了里程碑式的进展,例如智能驾驶、机械控制、电子竞技等。多智能体强化学习作为强化学习不可或缺的一门分支,主要被用来研究多智能体合作或竞争的问题,在许多领域中已经
近年来,随着云计算等相关技术被工业界广泛使用,公有云上的数据安全问题成为了一大研究热点。用户的银行交易信息、收入情况、医疗记录等隐私信息在云服务器上有可能被窃取、利用。为了彻底解决云端数据库数据不可信问题,全密文数据库应运而生。在数据传送、查询并返回给客户端的全过程中,服务器无法解密密文,从而有效保证了数据安全性。纯软件密文数据库通常需要借助密码学的相关加密算法实现密文查询运算,如使用顺序可见加密
医学成像技术是将疑似病变部位与电磁场等介质相互作用,把疑似病变部位的组织形态以图像的形式展现出来的技术,医生能够根据医学图像直观地验证自己的判断,了解病变程度。磁共振成像凭借独到的优势在影像检查中的应用越来越广泛,高分辨率磁共振成像是医生进行准确诊断和后续疾病精准治疗的基础。然而,高质量的磁共振成像通常伴随着长时间的采集、患者的不适和资金的耗费等问题,因此,在不改变硬件配置或增加扫描时间的情况下,
随着5G技术(5th Generation Mobile Networks,5G)和物联网技术(Internet of Things,Io T)的飞速发展,通信-感知-计算融合技术已成为新一代通信系统发展的新愿景。随处部署的Wi-Fi设备可通过简单方式获取信道状态信息(Channel State Information,CSI),由于CSI可以细粒度地描述室内环境中电磁波的多径传播情况,目前其已被
拷贝数变异指由基因组发生重排而引起基因组大片段的拷贝数增加或减少。它是一种最常见的结构变异,是癌症的重要致病因素之一。拷贝数变异可通过单样本、多样本或配对样本进行检测。其中,配对样本检测可以直接聚焦于与癌症相关的体细胞拷贝数变异,对研究癌症的发生原因、发展机制及靶向药物治疗具有重大意义。第二代测序技术提供了大量的基因组数据信息,然而因其测序数据的读长较短、复杂度较高等特点也为相关研究带来了极大的挑
以Tor路由网络为代表的匿名系统在保护用户隐私的同时也逐步成为了一些网络空间中不法分子的藏匿场所和工作空间,给网络监管带来了很大压力。尤其在国内环境中因为防火长城的存在需要额外使用以SSR为代表的代理才能正常访问Tor匿名网络,这又进一步给Tor网络流量加了一层混淆外壳,使得对其检测与识别变得尤为困难。为了便于网络监管部门对国内Tor网络访问情况进行一定的监管和取证,需要行之有效的针对基于SSR的