基于深度特征表示的行人识别方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:loveandlove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人目标检测与识别技术在智能交通和智能监控系统等领域中一直有着重要应用。虽然该技术在过去几十年中已经取得了长足的发展,但是由于行人外观及复杂的背景环境等因素的影响,行人识别技术仍然是计算机视觉领域公开的难题。针对这一难题,本文提出了新颖的行人识别方法,在3个行人数据集上通过与同类方法比较,证明了所提出方法具有较高的识别率。针对行人识别中的特征表示问题,提出一种混合结构的分层特征表示方法,这种混合结构结合了具有表示能力的词袋结构和学习适应性的深度分层结构。首先利用基于梯度的HOG局部描述符提取局部特征,再通过一个由空间聚集受限玻尔兹曼机(RBM)组成的深度分层编码方法进行编码。对于每个编码层,利用稀疏性和选择性正则化进行无监督受限玻尔兹曼机学习,再应用监督微调来增强分类任务中视觉特征表示,采用最大池化和空间金字塔方法得到高层图像特征表示。最后采用线性支持向量机进行行人识别,提取深度分层特征遮挡等与目标无关部分自然分离,有效提高了后续识别的准确性。针对最大池化方法的局限性,本文在此基础上采用正负最大池化方法进行行人识别。正负最大池化方法克服了最大池化方法中编码系数非负的问题,使得识别准确率进一步提高,但实时性依然未能有效解决。最后总结了全文的研究工作,指出行人识别所面临的问题和难点,并对未来需要完善的相关问题进行了展望。
其他文献
合成孔径雷达(Synthetic aperture radar,SAR)是遥感技术发展的一大成就,由于其自身独特的优势和巨大的应用价值,得到了广大遥感领域研究者的关注和重视。由于合成孔径雷达技
三维人脸建模一直以来都是计算机视觉领域研究的热点,随着科学技术的不断发展,三维人脸建模方法更是多种多样。大部分三维人脸建模方法在采集人脸信息时,都需要人脸以固定的
近年来,随着存储需求的不断扩张以及存储成本的居高不下,外包存储的应用已经变得越来越普遍。现在,用户可以以相对较低的成本将大量数据存储在多台异地服务器上。越来越多的
三维(Three dimension,3D)视频是正在兴起的一种媒体形式,并处于蓬勃发展的阶段。相比于传统的二维视频,三维视频能提供所观察物体的深度信息,从而使用户产生立体视觉的体验,
快速跳频(FFH)技术作为一种重要的通信抗干扰技术在军事和商业上都有很广泛的应用。分集合并技术是FFH系统的关键技术之一,分集合并可以提高FFH系统的抗干扰性能、抗衰落性能
空时编码作为多输入多输出传输系统中主要使用的编码方式,近年来得到了广泛的重视,成为了研究的热点。而随着通信系统的迅速发展以及信道环境的复杂化,获取精确的信道状态信
迭代式发展并延续人类的智慧是人工智能的基本出发点,也是它对人类最有意义的一点。在人工智能的“智能”方向上,大量的研究成果使得机器在智能的某些方面甚至超过了人类。但
无线多跳网络具有无基站,无中心控制,网络节点随意移动等特点。Geocast多播协议(基于位置信息多播协议)是一种基于方向性投递的无线多播路由协议,具有数据冗余度低,时延小等
跳频通信技术由于其保密性较强和优越的抗干扰能力,出现了跳频收发信机在各国军事领域的广泛应用。拥有更高跳速,更高传输速率的跳频收发信机将是未来的发展方向。目前,因为
差错控制编码技术是现代通信技术中的关键技术之一,在移动通信、数字电视、计算机存储等数据通信系统中得到了广泛应用。在信道条件恶劣的情况中,常采用纠错能力更强的级联编解