论文部分内容阅读
随着计算机技术的快速发展,传统的人机交互已逐渐不能满足人们日益增长的交互需求。基于摄像的非接触式视线跟踪技术具有很大潜力成为新一代人机交互的主流方法,使人机交互技术发生革命性的发展,同时其算法上的不成熟为我们提供了很大的研究空间。本论文主要对基于摄像的非接触式视线跟踪技术中的眼动特征提取和视线识别两部分关键内容进行研究,提出了一种快速准确鲁棒的眼动特征提取方法及两种不同的可克服头部运动的视线识别算法:(1)针对现有眼动特征提取方法难以满足速度、准确率和鲁棒性要求的问题,本文根据眼睛图像在红外光源条件下的特性,首先采用基于红外光源条件下的眼睛分类器提取眼睛区域,然后使用二值化模板匹配算法定位瞳孔区域,最后利用凸包、椭圆拟合、点模式匹配等算法实时、精确地提取瞳孔中心和角膜反射斑点中心。(2)针对传统瞳孔角膜反射向量法缺乏容许头部运动的能力的问题,本文提出了可克服头部运动的瞳孔角膜反射向量视线识别算法。在该算法中,首先利用了四个角膜反射光斑中心和瞳孔中心构成瞳孔角膜反射向量,然后采用了基于多初始映射方程回归的映射模型把该向量映射到人眼注视点上。(3)从利用显示屏在角膜上的反射图像求解人眼注视点的角度出发,本文提出了一个基于图像变换的视线识别算法。在该算法中,利用了显示屏平面上的八个红外光源与对应的角膜反射斑点之间的图像变换把显示屏平面映射到角膜平面上得到显示屏的反射图像,然后根据该反射图像与瞳孔中心的位置关系来检测人眼在显示屏上的注视点。实验结果证明本文的眼动特征提取方法处理速度达到60帧/秒,精度达到0.12像素,非常好地满足了基于摄像的视线跟踪系统的要求,当头部在16cm×10cm×14cm(深×高×宽)区间内运动时,本文的两种视线识别算法定位精度都约为1度视线角度,在这两种方法中,基于图像变换的视线识别算法的精度更高,但同时它需要更复杂的硬件结构。对比现今的二维的基于摄像的非接触式视线跟踪技术,本文的两种视线识别算法在允许头部运动的同时精度都达到了领先水平,较好地解决了二维视线跟踪系统精度不高及头部受限的问题。