论文部分内容阅读
随着“渐冻症”、“卢伽雷氏症”患者的生活受到社会广泛关注,辅助生活设备的研究也成为了人们关切的重点之一。由于常规的交互方式不能满足病患使用需求,使用视线控制成为了人机交互的首选方案。而这一方法的核心就在于视线估计技术的研究与应用。视线估计,是计算视线方向、注视点位置的过程。作为一种高效的、非接触式的人机交互方法,在各领域都具备极大发展潜力。当前基于表观的视线估计方法逐步成为该技术的重点突破方向,但仍旧面临算法结构复杂多样、模型准确度不高的问题。本文设计了一套图像采集与视线估计系统,利用笔记本电脑自带的相机采集图像,经预处理后使用改进的卷积神经网络(Convolutional Neural Network,CNN)建立并训练视线估计模型,最终输出注视点位置。具体完成工作如下:1.基于改进AdaBoost算法的人脸检测算法。为在保证准确性的同时提高人脸检测的时效性,利用肤色空间的稳定性进行肤色分割,去除背景区域,降低人脸检测的特征扫描时间,提升检测的实时性。实验结果表明,优化后的人脸检测时间效率明显提高。2.基于人脸特征点的头部姿态估计方法。本文首先使用受限制的局部模型(Constrained Local Model,CLM)获取人脸特征点,之后使用灵活模型的方法计算头部姿态。基于CLM的方法首先需要建立形状模型和图像块模型用于搜索;搜索过程通过对响应图的响应策略进行优化,获取接近最优解的结果。基于灵活模型的姿态估计则是通过计算特征点与三维模型在平面投影的变化来估计头部姿态。3.基于浅层残差网络的视线估计算法。为了提高算法的性能,使用残差块改进传统的LeNet-5结构,提高特征提取能力的同时降低训练难度。使用MPIIGaze公开数据集和按本文方法采集的本地数据集进行的实验结果表明,改进的浅层残差网络模型的准确度明显提升,与传统Le Net-5结构训练的模型相比,改进后的网络结构准确度分别提升了11.4和15%,验证了算法改进的有效性。综上,本文在研究视线估计工作流程与相关算法的基础上,基于简单硬件环境,建立了基于CNN算法的视线估计系统,同时使用浅层残差网络改进算法,在公开数据集和本地数据集的实验都验证了改进的效果。