基于深度学习与属性学习相结合的行人再识别方法研究

来源 :江苏大学 | 被引量 : 6次 | 上传用户:zeone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别作为公共场所视频监控中最重要的技术之一,受到了研究者的广泛关注。目前,行人再识别方法普遍通过提取行人的颜色、纹理、形状等低层特征来进行行人的区分,而行人作为一种非刚性对象,这些人工设定的特征对于行人的判断并不是最好的,而且基于数值的低层特征缺乏语义表达能力,在行人再识别的实际应用中不易被用户所理解。此外,大多数行人再识别方法采取有监督的学习方式,依赖于大量带标签的训练数据,而在实际应用中,获取关于每个行人的大量带标签样本图像是不可能完成的任务。针对现有行人再识别中存在的这些问题,本文提出基于深度学习与属性学习相结合的行人再识别方法,主要内容如下:(1)提出基于无监督卷积神经网络与行人属性的行人再识别方法。该方法通过结合卷积神经网络的模型结构和卷积自动编码器的学习原理,无监督地对行人图像进行特征提取,避免了对带标签训练样本的依赖,同时通过这种数据驱动的特征学习方式获得更具有代表性的行人特征,从而提高行人再识别的准确率。在行人特征与行人类别间加入属性层,通过对行人图像的属性判断间接地进行行人类别的判断,赋予了行人再识别方法更好的语义表达能力和实用价值。在VIPe R行人数据集上的实验结果表明,与现阶段所提方法相比,该方法能有效解决行人再识别中对带标签数据的依赖问题和缺乏语义表达能力的问题,并有效提高了属性分类器的准确率。(2)提出基于无监督卷积神经网络与层次属性的行人再识别方法。该方法将行人图像按身体部位划分为互相重叠的若干分块,对每个分块针对性地提取特征并分配属性分类器,有效降低了冗余信息对分类器造成的干扰,进一步提高了属性分类器准确率。引入层次属性,利用粗、细粒度属性来对行人进行区分,使得行人再识别方法更加符合人们的认知规律,并能够应对不同程度行人描述时的再识别任务。在VIPe R行人数据集上,从多个方面验证了所提方法的有效性,实验结果表明该方法所取得的行人再识别准确率高于现有其他算法,并且对于属性缺失具有一定的容忍度。(3)设计并实现基于深度学习与属性学习相结合的行人再识别原型系统。采用MATLAB实现了行人再识别系统的开发并设计了简洁的GUI界面。系统包括有目标行人图像的再识别和无目标行人图像的再识别两大功能模块,主要包含目标行人图像输入、行人层次属性选择、行人再识别和候选行人图像展示等功能,验证了本文所提行人再识别方法的可用性。
其他文献
复合粗糙集模型是一种用于处理复合信息系统中不精确、不确定、不完备、不一致信息的数据分析工具。复合粗糙集模型适用于同时包含多种数据类型的复合信息系统,有很好的应用前
面向对象技术在软件工程中的推广和使用,使得传统的结构化测试技术和方法受到了极大的冲击.面向对象软件测试是面向对象软件开发中的不可缺少的一环,是保证面向对象软件质量
随着数据资源的日益增加,人们迫切需要一类工具和方法,以便能够从迅速增长的数据资源中提取出有用的知识,从而帮助我们科学地进行各种决策。粗集理论提供了一种有效的方法。运用
现实中,图像在被获取和被传输时常常会受到各种各样的噪声的干扰,例如高斯白噪声、脉冲噪声和乘性噪声等.为了提高图像的视觉质量以及便于各种后续处理(如图像分割和文字识别
时间一直贯穿客观事物发展的始终,作为记录和管理客观世界信息数据的数据库技术,必然要将"时态"作为其理论研究和实际应用过程中的一个重要方面.由于各种原因,当今的主流数据
近年来,无线通信系统是一个受到广泛讨论的话题,同时,人们对于小区移动电话的需求也在迅猛增加,未来无线通信系统趋向于能够提供各式的服务,包括语音、数据、图像等等。直接序列扩
作为传递信息的重要媒体和手段——图像信息是十分重要的。随着信息技术的进步,数字图像处理技术得到迅速的发展,其研究内容已经由静态图像处理发展到了对序列图像、动态连续图
人脸建模和动画一直是计算机图形学中非常活跃的研究领域,它在电影制作,计算机游戏,视频会议,人机接口等领域都有广泛的应用。MPEG-4是新一代的多媒体压缩标准,采用基于对象的编码
矿山开采中人们希望能随时了解和掌握露天矿的地质构造,以便为矿山开采提供决策支持。然而目前的地理信息系统(GIS)对数据分析解释局限于二维静态表达、三维可视化能力严重不
DSP-ADPCM语音采集压缩卡是四川大学图形图象研究所新研制的集语音采集和回放功能于一体的硬件设备。本文首先阐述了DSP-ADPCM语音采集压缩卡的基本工作原理、硬件结构、技术