论文部分内容阅读
随着计算机信息处理能力的增强和表现形式的多样化,人机交互界面正逐渐由单一的图形用户界面GUI朝着具有高交互性和多模态性的感知用户界面(PUIs)发展。视觉通道承载了大量的交互信息,单独使用或是与其他感知模态相结合,均能向人机交互提供重要的线索,因此基于视觉的交互技术VBIs是感知用户界面技术的重要子领域,具有广泛的应用价值。面部表情传达了人际交往中的大部分信息,而且这些信息几乎都是不可由其它信息表达方式所替代的,因此表情分析作为视觉交互的一个关键线索,成为视觉交互的主要研究课题之一,并且表情分析在各种视觉系统中都有重要的应用,如心理学研究的辅助工具、视频会议、人脸合成、情感计算、智能人机接口等。
本文主要研究了面向视觉交互的表情分析技术,针对视觉交互的高实时性和强鲁棒性要求,提出了一个基于几何特征的表情分析方案,研究了人脸检测、面部特征点自动定位,特征点跟踪和表情分类等各个关键环节,论文的主要成果体现在以下三个方面:
第一、研究了面部特征点定位技术,根据视觉交互对实时性的要求,本文选用几何特征作为表情分类的特征。为了能够自动提取几何特征点,采用主动形状模型(ASM)进行特征点提取,但是传统的ASM方法依赖于初始化的情况、局部灰度模型的建立以及搜索策略的选择。本文针对人脸表情图像中表情变化的特点,提出了改进ASM的方法,有效提高了面部特征点定位的精度。
第二、研究了面部几何特征点跟踪技术。分析了KLT特征点跟踪算法和基于ASM模型的特征点跟踪算法的优缺点,将KLT特征点跟踪算法与人脸特征点定位的ASM方法结合起来,提出了视频中人脸特征点跟踪的一种混合模型.该模型使用KLT算法预测人脸特征点的位置,充分利用了帧间的相关信息,提高了跟踪的速度.通过ASM纹理和形状的约束,在提高跟踪精度的同时增强了整个算法的鲁棒性,最后通过实验验证了本方法的有效性。
第三、提出了基于LSVM的表情分类方法。为了提高基于视频序列的表情识别精度,本文在KNN-SVM算法的基础上提出局部SⅧ(LSVM)分类机制并将其用于视频序列中的表情分类,对于一个待分类的几何特征样本,首先在训练集中寻找该样本的k个近邻样本,然后使用这k个近邻样本训练集成了近邻信息的SⅧ分类器进行表情分类,在Cohn-Kanade数据库中的对比实验表明该分类器有效提高了表情分类的精度。