基于自适应排序函数和深度特征学习的行人搜索算法研究

来源 :大连理工大学 | 被引量 : 3次 | 上传用户:cz1502008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来行人搜索发展迅速,成为智能视频监控中的关键技术,在视频侦查、行人跟踪以及行为分析等领域发挥着越来越重要的作用。行人搜索的目的是利用计算机视觉技术判断监控图像或视频中是否存在特定行人。早期的行人搜索主要是基于给定的目标图像进行跨摄像头行人再识别,随着研究的深入和应用的逐步拓展,行人搜索发展到可以针对视频环境和开放场景来查找目标,并根据自然语言描述来进行跨模态搜索。行人搜索研究技术也从传统的基于手工特征设计和度量函数学习发展到基于深度神经网络从数据中自动学习特征表示。本文分析了行人搜索不同发展阶段的研究现状,并针对行人搜索技术研究中如何学习更优的排序函数和如何学习判别能力更强的特征等问题展开了深入研究。本文主要贡献如下:(1)提出基于特定样本支持向量机学习和最小二乘半耦合字典学习的行人再识别算法。针对大多行人再识别算法中采用统一相似度排序函数而难以考虑样本独特性问题,本文将行人再识别问题转化为二分类问题,并针对每个行人学习特定样本支持向量机作为其相似度排序函数,不仅使得排序函数能够自适应行人的特征表示,提高模型对不同行人的判别能力,还可以有效强化匹配样本和非匹配样本的相似度差异。接下来,本文提出最小二乘半耦合字典学习来联合学习特征字典、排序函数字典以及特征空间和排序函数空间样本重构系数之间的映射关系,从而使得新的样本可以根据自身特征重构出其相适应排序函数。该算法采用l2-范数替代传统字典学习算法中的l1-范数正则化约束,不仅提高了字典学习和排序函数推断效率,而且可以有效应对行人再识别任务中特征维度高、样本数量少、差异大等情况,进一步提升再识别性能。(2)提出基于深度互学习的行人再识别算法。针对基于深度学习的行人再识别算法对平衡模型效率和准确率的需求,本文提出了简单有效的深度互学习算法,通过与其他网络联合训练来提升深度神经网络的再识别性能。本文为互学习训练中每个网络定义两种损失函数:一种是传统的监督损失函数,用来度量网络预测样本类别与真实标签之间的差异;另一种是网络之间的交互损失函数,用于度量不同网络估计的类别概率分布之间的差异。该算法不仅可以使得每个网络学习如何正确分类样本,还可以使得每个网络在训练过程中借鉴其它网络的学习经验来提升泛化能力,从而学习到判别能力更强的深度行人特征。本文将两个网络深度互学习扩展到多网络互学习场景中,并发现更多同伴网络的学习经验可以进一步提升每个网络的性能。本文还将该算法扩展到半监督学习场景,在标记样本数量较少情况下利用未标记样本的模拟损失约束来提升模型的预测能力。最后,本文对深度互学习算法的作用机制进行了理论分析和实验验证,表明深度互学习算法可以帮助网络找到一个更平缓的极小点,对噪声干扰具有较好的鲁棒性,具备更好的泛化性能。(3)提出基于跨模态投影学习的行人搜索算法。针对基于自然语言描述的跨模态行人搜索任务,本文提出了跨模态投影匹配损失函数和跨模态投影分类损失函数来学习文本和图像的联合特征嵌入。跨模态投影匹配损失函数将文本与图像特征之间的标量投影转化为匹配概率,并通过最小化估计匹配概率分布与真值匹配概率分布之间的KL散度来学习跨模态匹配特征。相较于常用的典型相关分析和双向排序损失函数,该损失函数从概率拟合角度来约束匹配样本相似度大于非匹配样本相似度,利用了批量中所有样本之间的相关性,避免了正负样本选择和超参数调节,且对批量大小变化具有较强的鲁棒性。针对具有类别标签的情况,跨模态投影分类损失函数将跨模态投影策略与归一化分类损失函数相结合,通过分类文本和图像特征之间互相投影后的特征向量来进一步增大类间样本差异,并强化类内不同模态特征的紧密度。
其他文献
自上个世纪80年代以来,我国经济飞速发展,但生态环境也付出了相应的沉重代价。环境问题的日渐严重,致使人们对环境问题的关注程度越来越高。为了解决日益严重的生态环境问题,
乳酸锌味甘甜,极易被人体所吸收,是一种替代硫酸锌的新型补锌剂.作为锌营养强化剂用于食品[1]:谷物类20mmg、奶粉类60mmg、食盐类1000mmg、固体饮料1000mmg(以元素锌计).作为
<正>随着大家对宠物的喜爱,养宠人数不断增多,宠物数量的急剧增加促使宠物市场蓬勃发展。让我们看看宠物经济这块"蛋糕"到底有多大"吸猫"、"撸狗"近年成为一种风潮,养宠群体
<正> 笔者运用逍遥饮(《景岳全书·卷五十一·新方八阵·因阵》)加味治疗绝经期综合征82例,获得较好疗效,介绍如下。本组年龄最小43岁,最大56岁。病程最短半年,最长10年,其中
<正>中医心病学是专门研究心系病证的一门临床学科。这里的心是指中医概念的心。简单的讲,中医心病包括西医的心血管系统病变、高级神经系统病变、口腔病、泌尿生殖系疾病等;
会议
谷胱甘肽过氧化物酶(Glutathione Peroxidases, GPXs)是植物体内清除活性氧自由基的重要酶类之一。植物GPXs起步较晚,而对一种植物中GPXs整个家族的研究更少,只在模式植物拟
应用哈里森(Harrison)键联轨道法和固体物理理论和方法,考虑到原子的高阶非简谐振动,计算了ZnSe类石墨烯化合物的σ键和π键的极性、简谐系数和非简谐系数,得到它的德拜温度
近年来,消费者的健康意识不断提高,人们对方便、营养的新型全谷物食品的需求不断增大。本文以糙米为研究对象,首先研究了糙米多酚的组成和热稳定性;然后研究了挤压加工对糙米
<正>20世纪90年代,以信息技术为先导的高科技产业的迅速发展和纵横渗透,极大地改变了世界各国的经济发展面貌和竞争格局,而发达国家的经济比以往任何时候都依赖于知识的生产