基于多任务联合监督学习的行人再识别研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:haozhiyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别技术作为视频分析中重点的研究内容之一,吸引了大批学者的关注。该技术是根据提取的行人视觉特征,在跨摄像头的情况下判断给定行人是否为相同行人。目前,行人再识别的研究侧重于对行人特征的提取。人工提取行人特征的方法集中在对颜色及纹理等低层特征的处理,基于深度学习的行人再识别的特征提取算法的研究主要是针对以行人身份验证、身份识别任务,通过构建复杂的神经网络结构来实现行人的特征匹配,因此设计简单且有效的网络结构提取更具区分性和鲁棒性的行人特征是本文行人再识别研究的重点内容。本文提出了基于多任务联合监督学习的网络结构,通过提取更具区分能力的深层卷积行人特征,有效提升了行人再识别效果。多任务联合监督学习网络结构主要涉及联合监督的行人身份信息学习和辅助特征提取的行人多属性学习两个方面。本文首先提出利用两个损失函数对行人身份识别任务实现联合监督学习,这种方法既可以使网络学习得到的特征具有不同行人之间得差异性信息又可以使所学特征具有相同行人之间的相关性信息,将两种信息采用联合监督的学习方式指导网络模型的参数更新,有效的提高了行人特征的表现能力。本文又考虑到行人单一的身份信息对于指导网络学习行人的具体特征存在着局限性。因此,在联合监督的行人身份学习任务的基础上加入行人属性学习任务,使网络的学习目标从单一的行人身份识别的学习扩展到详细的行人外貌描述性语义特征的学习。这可以有效的减少行人在跨摄像头下发生变化所带来的影响,从而获得能更加准确的行人描述特征。在网络结构的实现上,本文采用多任务学习的方法利用网络共享结构实现对多任务之间的相关性学习,有效的降低了模型的计算开销,提取的行人特征更有助于提升行人再识别的准确率。为了验证本文所提出的多任务联合监督学习网络结构的有效性,本文分别在Market1501和Duke MTMC-reid行人再识别数据库上进行实验。与单独的Softmax函数所监督的行人身份指导网络结构相比较,本文提出的方法在Market1501中Top-1和m AP准确率分别提升了8.37%和13.23%;在Duke MTMC-reid中Top-1和m AP准确率分别提升了10.28%和9.47%。实验结果表明本文提出的行人特征提取网络结构,可以有效地提高行人再识别的效果。
其他文献
随着互联网技术尤其是Web 2.0的飞速发展,越来越多的web应用出现在人们的日常生活中,如P2P网络、社交网络、多Agent系统、电子商务等。随着web应用的规模不断扩大,其具有的开
目前高清数字电视机顶盒(HDTV STB)大多采用高集成度的单芯片解决方案,最高可支持1920×1080i/1920×1080p数字图像的解码。相对于标清电视机顶盒(SDTV STB)所支持的640×480
高校设备管理的中心任务是为教学、科研服务,以实现国有资产的保值和增值.高校设备管理要与现代化发展相适应,应该积极运用现代信息技术。论文基于这一背景,应用本体技术对设
因特网的普及与网络通信技术的发展使计算模式继主机计算和桌面计算之后进入普适计算时代。这种新的计算模式强调把计算机嵌入到人们日常生活和工作环境中,形成一个无所不在
三维编织复合材料是二十世纪八十年代发展起来的高新纺织材料,它具有异型件一次编织成型、结构不分层、整体性能好和设计灵活等特点,已经成为航空航天重要的结构材料。为了保证
随着互联网的发展及社会信息化的发展,搜索引擎作为人们查找信息的重要工具变得越来越重要。现有的搜索引擎的核心是布尔模型,完全依赖于用户给出的检索关键词,但由于在检索
海量URL的管理一直是提高网络爬虫性能的一个瓶颈。现在,网络规模越来越大,更新速度也变得越来越快,这些都促使网络爬虫系统来提高其性能。所以如何高效地管理网络爬虫的海量
随着互联网的发展,人类电子足迹数据,如微博、日志、110报警数据、ATM交易数据等各种数据资源越来越丰富。目前数据的可视化形式多种多样,如何有效分析不同类型电子足迹数据,
通常情况下气体动力学中对气体的处理采用连续介质假设,这在一般的实践和实验室条件下是成立的。但当气体密度较低时,气体的粒子效应会变得十分显著,从而破坏连续介质假设。
高速铁路的迅速发展给人们生活带来了诸多方便,但也对安全和效率提出了更高的要求。如何保障高速列车安全和高效的运行具有重要的研究意义。铁路调度中心除需要大量的各种业