论文部分内容阅读
眼睛是人类从周围世界中获取信息的重要器官,也是反映人们心理活动的窗口。信息加工在很大程度上依赖于视觉,约有80%~90%的外界信息是通过人的眼睛获得的。从视觉获取的信息不仅数量多,而且真实可靠。因此,视线计算和注视点跟踪技术在医学治疗、心理学研究和人机交互等与人的视觉相关的领域有着非常广泛的应用。
国内外目前已有的视线计算方法很多,其中Wang等人提出的“单圆”算法硬件配置相对简单。在该方法的基础上,本文提出了一种基于透视投影下圆-椭圆三维映射关系的视线计算新方法。由于一般情况下眼睛的虹膜为一个圆,我们将虹膜平面的法线向量作为视线方向,视线向量可以根据虹膜在图像平面中的投影椭圆参数计算得到,且该向量为相机焦距的函数。对于未标定的图像,相机的焦距未知,为确定正确的视线方向,我们提出了三个向量共面的约束条件。我们认为,当人们注视某一固定目标时,两眼的视线向量以及左右虹膜中心点连线的向量应该是共面的。分别提取眼睛图像中左右虹膜的边缘并拟合为椭圆,根据透视投影下圆-椭圆的三维映射关系,将三个向量共面作为视线计算的约束条件,可以同时计算得到实际的视线向量和相机的焦距值。
虹膜边缘特征点提取的精度将直接影响椭圆拟合的精度,最终也必将影响视线向量计算的精度。本文将虹膜边缘特征点的提取分为两步,以尽可能多的提取出虹膜的边缘象素点,提高最终椭圆拟合的精度。首先,通过迭代的最佳阈值法分割眼睛图像并使用形态学边缘检测算子提取分割后图像的边缘,再用Hough变换提取边缘图像中虹膜的有效边缘象素点,并通过最小二乘法拟合为椭圆;然后,在此基础上通过射线法进一步提取虹膜剩余部分的边缘象素点。最后对前两步得到的椭圆参数进行进一步优化,以提高拟合后椭圆的精度。
分别通过模拟数据与实际眼睛图像进行实验,分析了本文提出的视线计算方法的可行性与鲁棒性,以及本文给出的视线计算方法的视线向量与注视点计算的误差情况。实验的结果比较理想,充分证明了本文提出的视线计算方法的可行性。
与Wang等人的方法相比,本文提出的视线计算方法不需要计算眼角以及眼球中心点的三维坐标,不需要已知虹膜半径的精确大小,另外也不需要已知相机的焦距值。可以允许相机的焦距及相机与用户的距离自由改变。