基于2D模型的视线追踪算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:aizhuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视线为人眼的注视方向,一般认为人的视线方向就是其注意力方向,因此视线检测在人类行为学方面有一定的研究意义。同时视线还可以作为计算机的一种有效的输入手段,所以视线追踪技术在人机交互、助残、驾驶员疲劳检测和辅助驾驶等方面存在着巨大的应用潜力。  本文主要研究低分辨率下(30万像素左右)的基于机器视觉的2D视线检测模型,核心内容主要包括眼部特征提取和视线估计两部分。  眼部特征特征提取主要包括两个特征:虹膜中心坐标和内眼角点坐标。其中虹膜中心需要每帧提取一次,内眼角点坐标只需隔几帧取一次。整个特征提取包括三部分:(1)虹膜定位;(2)虹膜跟踪;(3)内眼角点检测。其中虹膜定位主要用于跟踪时虹膜初模板的提取和跟踪目标丢失时目标模板的复位,通过虹膜与巩膜的灰度值差异进行虹膜定位。虹膜跟踪采用改进的Camshift跟踪算法实现,利用虹膜在脸部区域特有的颜色特征和形状大小实现跟踪。内眼角点检测在虹膜中心确定的基础上,根据虹膜中心的位置预估计出一个内眼角点区域,然后在该区域里进行Harris角点检测,最终利用内眼角点特殊的几何位置完成定位。  视线估计部分分为视线粗估计和视线精确定位两部分。通过研究虹膜中心、内眼角点位置与视线方向的关系提出一种视野散点模型,利用该模型可对视线进行粗估计。视线的精确定位是利用待测视线与标定视线之间的角度关系建立几何模型,同时根据粗定位结果对该模型估计的结果加入不同的误差补偿系数,最终定位出视线落点的准确位置。实验证明,通过粗估计和精确估计两次定位出的视线落点具有较好的鲁棒性与准确性,平均误差精度为2°左右。  为了验证本文算法的有效性,设计与实现了视线追踪系统的应用软件平台,分别在实验室平台和模拟驾驶舱进行了验证。通过在不同外界环境下,不同的试验者多次验证,搭建的软件平台实现了虹膜定位、虹膜跟踪、内眼角点定位和视线估计等功能,并且通过可视化的方式对整个视线追踪的过程进行了展示。实验结果表明,本文的算法在不同的外界环境,不同试验者及不同的测试距离都表现较好的鲁棒性与准确性。
其他文献
该文研究了浮动汇率制度下汇率的决定和预报问题.这顶研究不仅为未来预测新汇率制度下人民币汇率的走势奠定了基础,而且对目前涉外部门预测外汇汇率的走势有一定的参考价值.
初始对准在很大程度上决定了系统的工作精度和快速反应能力,是惯性导航系统的一项关键技术。静态情况下,一般采用传统的对准方案实现惯导系统的初始对准,即利用加速度计和陀螺仪
该文首次在中国提出了用遗传算法解决火电机组精确模型的经济调度问题,并对遗传算法应用于火电机组经济调度问题做了深入的研究,提出了用N-1法选取初始变量构成遗传算法的初
月面巡视器在执行月面巡视勘察任务过程中是处于未知的、非结构化的环境中,需要通过视觉系统感知周围地形环境,建立地图模型,并据此进行路径规划完成障碍物规避,确保巡视勘察过程
学位
学位
学位
学位
学位
随着时代的变迁和技术的进步,人们已不满足于用键盘和鼠标对计算机进行操作,因此人机交互技术就成为了当下的研究热门,而手势交互就是其中最受关注的一个方向。手是人体最为灵活