论文部分内容阅读
随着信息技术的快速发展,基于视频流点播或直播的E-Learning作为一种新的教育方式应运而生。E-Learning打破了传统学习方式中时空的限制,使得学习者随时随地都可以进行学习。同时,随着模式识别、数据分析、信息检索等各种领域理论在E-learning实践中的应用,E-learning的个性化、智能化、交互性等特点给学习者带来了更好的学习体验。作为基于视频流的E-Learning模式的原始数据,E-Learning中的教室也就是标准自然教室和传统教室有着很多不同,应当提供更多的功能和服务,如激光笔手写系统、语音识别、学生表情识别系统等。本文通过对人脸检测、人脸表情特征提取、表情分类、PTZ摄像头控制等的研究,提出了一种结合小波变换和增强方差率的改进局部二元模式的表情识别算法,并通过JAFFE库上的实验证明了该方法的有效性。在此算法的基础上本文设计并实现了一个标准自然教室中的人脸表情识别原型系统。本文的主要工作如下:1)研究并比较了常用的人脸表情识别算法的优缺点。2)提出了人脸2D模型和根据眼睛位置的人脸对齐。为了减小姿势对识别结果的影响,本文提出根据眼睛位置对图像进行适当的旋转来实现人脸对齐。3)提出了结合小波变换的增强LBP特征。传统的LBP在识别率上有待提高,本文提出对原始图像进行小波分解后的四幅系数重构图像提取LBP特征,达到特征增强的目标。4)提出了将增强方差率应用于特征选取以减小计算量提高实时性,选取原始特征集的区分度大的特征子集作为表情识别的特征集。5)在JAFFE人脸表情库上进行实验设计及结果分析。本文通过SVM在JAFFE人脸表情库上做了试验,并和传统LBP的实验结果作了对比分析,验证了改进算法的有效性。6)实现了SNC中的人脸表情识别的原型系统。本文提出了在SNC中搭建人脸表情识别系统所需的软硬件环境,讨论了可旋转缩放的PTZ摄像头并设计了该系统的框架和模块,实现了原型系统并介绍了主要的C++类及其相互关系并在实际的实验过程中针对若干难点提出了自己的解决方案。本论文工作得到了国家863项目“基于情境感知的多通道融合交互模型与关键技术”(项目编号:2007AA01Z157)的支持,并申请相关专利2项和论文若干。