标准自然教室中的人脸表情识别研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:guosheng_741
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,基于视频流点播或直播的E-Learning作为一种新的教育方式应运而生。E-Learning打破了传统学习方式中时空的限制,使得学习者随时随地都可以进行学习。同时,随着模式识别、数据分析、信息检索等各种领域理论在E-learning实践中的应用,E-learning的个性化、智能化、交互性等特点给学习者带来了更好的学习体验。作为基于视频流的E-Learning模式的原始数据,E-Learning中的教室也就是标准自然教室和传统教室有着很多不同,应当提供更多的功能和服务,如激光笔手写系统、语音识别、学生表情识别系统等。本文通过对人脸检测、人脸表情特征提取、表情分类、PTZ摄像头控制等的研究,提出了一种结合小波变换和增强方差率的改进局部二元模式的表情识别算法,并通过JAFFE库上的实验证明了该方法的有效性。在此算法的基础上本文设计并实现了一个标准自然教室中的人脸表情识别原型系统。本文的主要工作如下:1)研究并比较了常用的人脸表情识别算法的优缺点。2)提出了人脸2D模型和根据眼睛位置的人脸对齐。为了减小姿势对识别结果的影响,本文提出根据眼睛位置对图像进行适当的旋转来实现人脸对齐。3)提出了结合小波变换的增强LBP特征。传统的LBP在识别率上有待提高,本文提出对原始图像进行小波分解后的四幅系数重构图像提取LBP特征,达到特征增强的目标。4)提出了将增强方差率应用于特征选取以减小计算量提高实时性,选取原始特征集的区分度大的特征子集作为表情识别的特征集。5)在JAFFE人脸表情库上进行实验设计及结果分析。本文通过SVM在JAFFE人脸表情库上做了试验,并和传统LBP的实验结果作了对比分析,验证了改进算法的有效性。6)实现了SNC中的人脸表情识别的原型系统。本文提出了在SNC中搭建人脸表情识别系统所需的软硬件环境,讨论了可旋转缩放的PTZ摄像头并设计了该系统的框架和模块,实现了原型系统并介绍了主要的C++类及其相互关系并在实际的实验过程中针对若干难点提出了自己的解决方案。本论文工作得到了国家863项目“基于情境感知的多通道融合交互模型与关键技术”(项目编号:2007AA01Z157)的支持,并申请相关专利2项和论文若干。
其他文献
聚类是数据挖掘中一项重要的研究课题,在数据挖掘、模式识别、统计数据分析、自然语言理解等领域都有广泛的应用前景。聚类评价指标对衡量一个聚类的优劣有着重要作用,聚类评价
近年来,服务工作流迅速发展,它是工作流、Web服务、网格等多种技术分支交叉结合而来的一种新兴技术。尤其在科学工作流发展的今天,要求工作流具有更强的动态性及数据共享能力。
近年来,天然气作为一种优质高效的能源和重要的有机化工原料,在世界能源结构中越来越受到重视。在我国石油需求量日益增加的情况下,大力发展天然气能源,改善我国的能源结构,已成为
近些年,随着移动互联网技术的发展,移动便携设备的开发使用已然成为主流。在有害生物图像自动识别方面,各种PC端的果蝇识别软件被很好的研究利用。但是,基于移动便携设备如手
近年来,新一代高通量DNA测序技术的快速发展,给人类研究基因组学和转录组学提供了巨大的技术支持,取得前所未有的成就。基于新一代测序技术的RNA-seq技术,正快速取代传统基因
视频点播服务简称VOD服务,它是随着有线数字电视、计算机网络和计算机应用技术的发展而兴起的一种实时的、双向的、交互的数字电视服务。在数字电视领域,它的出现主要是为了改
Job-shop调度问题是生产调度领域的一个热点、难点,是许多实际生产调度问题的典型调度简化模型,是一类典型的NP-hard问题,对它的研究具有重要的理论意义和应用价值。 针对以
随着移动计算技术的发展,移动计算系统开始逐渐走进人们的生活。在很多移动计算系统中,事务具有实时性要求,如移动股票交易系统、导航/定位系统等。但是由于移动通信网络具有
P2P直播流媒体业务在近年来得到了较为广泛的应用,随着业务种类和用户规模的日益增长,如何对当前的P2P直播流媒体系统进行性能优化,降低系统开销及提升用户体验成为重要的研
文本聚类在文本挖掘和信息检索系统中发挥着重要的作用。这种技术可以改善检索性能、提供导航/浏览机制、发现相似文本等。因此,文本聚类已成为一种处理和研究文本的重要技术