论文部分内容阅读
随着视频与图像处理技术的发展,基于摄像头的视线估计技术作为人机交互领域的一个重要分支受到了广泛关注。传统的视线估计技术大多采用瞳孔角膜反射向量法,因为它具有良好的用户体验和较高的估计精度,但由于需要额外辅助光源,同时用户在使用过程中必须保持头部静止,而且随着头部的运动,该方法的估计精度会急剧下降,因此没有得到广泛普及。为了减少额外辅助设备和提高系统对头部运动的适应性,本文介绍的瞳孔眼角向量法以传统的瞳孔角膜反射向量法的实现原理为基础,选择内眼角为参考点,根据瞳孔中心与内眼角点的相对位置计算用户的注视点。由于瞳孔眼角向量法的精度随着头部运动将会大幅度下降,针对注视点的横坐标,本文提出了一种基于2D模型的新的视线估计方法:模型拟合法。该方法基于人机交互过程中眼球与屏幕的空间位置关系,建立了一个简化的模拟人眼视线运动的2D坐标模型。此外,模型拟合法通过系统标定初始化的误差拟合模块能够补偿由于模型简化造成的误差,从而达到提高视线估计精度的目的。本文设计了一系列实验,用于比较在使用模型拟合法前后,瞳孔眼角向量法的估计精度。在实验过程中,用户分别被要求在不同的头部偏移范围内和在不同的位置上注视屏幕上一些指定点,摄像头拍摄用户注视各个点时的脸部图像,每一幅图像都采用手工标定的方式提取特征点坐标。对于注视点的横坐标,分别采用瞳孔眼角向量法与模型拟合法进行计算,而纵坐标则采用瞳孔眼角向量法计算。实验结果表明,对于注视点的横坐标,在头部偏移幅度较小时,本文提出的模型拟合法的估计精度稍好于瞳孔眼角向量法;而在头部偏移幅度稍大时,模型拟合法的估计精度也比瞳孔眼角向量法具有更好的稳定性。最后,本文从多个方面综合比较了两种方法的优劣,并且分析了模型拟合法误差产生的原因,为下一阶段的研究指明了方向。