基于深层结构学习的视频人脸识别

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sunchine0415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断发展,互联网中的视频数据呈指数增长,视频数据已经成为人们获取信息的重要来源之一。在需要大量人机交互的领域中获取的人脸信息更为人们所关注,如何通过这些人脸信息获取人物身份具有很大的应用价值。人脸识别主要包括人脸检测以及人脸分类,本课题中使用了基于肤色和动态阈值的方式对视频帧图像进行了预处理,能比较精确的将肤色从图中分割出来。本课题的重点主要集中在人脸分类方面,使用了深度结构用于人脸分类。使用深度结构用于人脸分类具有重要的意义,深度结构的提出目的就是为了模拟人脑的思维识别过程,是一种“泛脑层次网络系统”,通过层层递进的方式,逐步寻找图像中的像素点的关系,将其逐层关系聚合,逐步获取关系线段,关系轮廓,以至于最顶层的关系对象,通过该深层逐步训练过程,深度结构能获取更为精确的特征提取结果,再通过“联想”的方式对该提取的特征进行分类。本课题的主要设计思想来源:在视频人脸识别过程中,DBN深度结构虽然能很好的将不同的人脸图像进行区分,但是DBN在其权值初始化的时候,权值具有“指向性”,是有偏见的,当经过层层的训练之后,训练得到的特征也是具有“偏见性”的,考察该偏见性对于分类效果的影响就是本课题所关注的。基于深度结构的人脸分类识别包括两部分,特征提取部分和分类部分,在第一部分本课题主要使用了三种结构用于提取特征,DBN结构,深度MLP和DBM结构,这三种结构从严格意义上都属于反馈神经网络的范畴,都是由单独的子模块堆叠而成的,在特征提取时,先进行单个子模块的训练,训练完毕后,开始堆叠第二个模块,同时使用前一个模块提取的特征用于下一个模块的输入,进行第二层模块的训练,层层叠加,然后得到需要的特征。分类部分本课题使用了两种结构,一种是BP前馈神经网络,一种是RBM分类。这里的BP神经网络与传统的BP神经网络略显不同,使用了共轭梯度算法。对于RBM分类,不仅可以用于特征提取方面,也可以使用该结构用于分类,其训练过程与一般的RBM有所不同。本课题构建了两种神经网络结构用于人脸识别任务,并用于与DBN网络和BP网络的对比。
其他文献
由于多元时间序列流广泛的存在于工业生产过程、商业活动和自然科学等领域中,因此,研究多元时间序列流中的知识挖掘是很有意义的。对多元时间序列流知识挖掘的一个重要的研究方
在网络应用范围越来越广,网络服务越来越便利的情况下,网络安全是人们不得不面对的一个难题。网络中的各种资源和重要信息无时不受到各种不安全因素的威胁。最近一次黑客的大
本文以空间GPS 数据接收及其定轨应用为背景,开展GPS 辅助处理单元的开发和研制以及地面检测系统研制工作。本文首先调研了GPS 相关的基础知识,对GPS 辅助处理单元的软硬件需
企业信息化的进程的正在加快,伴随着底端控制层的日益成熟,以及高端ERP的逐步完善,人们开始认识到,要实现真正浑然一体的企业信息化系统,介于中间层的部分变得至关重要。作为企业
本文对噪音条件下的语音识别进行三个方面的实验研究,提出适合在噪音条件下进行识别的算法。针对通常谱熵法只能在15dB环境下工作的特点,本文提出谱平坦度法,可以在0dB的恶劣环
边缘提取对图像处理的其他方面例如图像分割、纹理分析、物体模式识别等有重要的意义。传统常用的边缘提取方法是面向局部信息的,这些方法的主要优点是简单易用,效果直观。但是
随着Internet技术与多媒体技术的飞速发展,多媒体通信逐渐成为人们进行信息交流的重要手段,人们可以通过网络交流各种信息,进行网上贸易等。由于图像信息相比其他信息具有直
随着计算机网络技术的迅猛发展和广泛应用,特别是Internet的快速普及,促进了计算机与互联网科技的不断创新与升级。网络设施和资源对于国家企业和个人的重要性在日益增强,它在不
随着计算机技术,特别是Internet技术的发展,在许多行业、单位或机构部门内部都逐步实现了业务、信息的计算机化管理。但是各个机构、单位或部门内部由于业务和功能归属不同,因此
随着计算机网络在我国的日益普及,基于网络的应用日益丰富,网络管理工作也显得越来越重要。网络管理的内容十分丰富,有故障管理、计费管理、配置管理、性能管理、安全管理5