基于2D模型的视线估计方法的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:lanaya0903
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频与图像处理技术的发展,基于摄像头的视线估计技术作为人机交互领域的一个重要分支受到了广泛关注。传统的视线估计技术大多采用瞳孔角膜反射向量法,因为它具有良好的用户体验和较高的估计精度,但由于需要额外辅助光源,同时用户在使用过程中必须保持头部静止,而且随着头部的运动,该方法的估计精度会急剧下降,因此没有得到广泛普及。为了减少额外辅助设备和提高系统对头部运动的适应性,本文介绍的瞳孔眼角向量法以传统的瞳孔角膜反射向量法的实现原理为基础,选择内眼角为参考点,根据瞳孔中心与内眼角点的相对位置计算用户的注视点。由于瞳孔眼角向量法的精度随着头部运动将会大幅度下降,针对注视点的横坐标,本文提出了一种基于2D模型的新的视线估计方法:模型拟合法。该方法基于人机交互过程中眼球与屏幕的空间位置关系,建立了一个简化的模拟人眼视线运动的2D坐标模型。此外,模型拟合法通过系统标定初始化的误差拟合模块能够补偿由于模型简化造成的误差,从而达到提高视线估计精度的目的。本文设计了一系列实验,用于比较在使用模型拟合法前后,瞳孔眼角向量法的估计精度。在实验过程中,用户分别被要求在不同的头部偏移范围内和在不同的位置上注视屏幕上一些指定点,摄像头拍摄用户注视各个点时的脸部图像,每一幅图像都采用手工标定的方式提取特征点坐标。对于注视点的横坐标,分别采用瞳孔眼角向量法与模型拟合法进行计算,而纵坐标则采用瞳孔眼角向量法计算。实验结果表明,对于注视点的横坐标,在头部偏移幅度较小时,本文提出的模型拟合法的估计精度稍好于瞳孔眼角向量法;而在头部偏移幅度稍大时,模型拟合法的估计精度也比瞳孔眼角向量法具有更好的稳定性。最后,本文从多个方面综合比较了两种方法的优劣,并且分析了模型拟合法误差产生的原因,为下一阶段的研究指明了方向。
其他文献
随着互联网技术的高速发展和大数据时代的来临,数据呈爆炸式增长,如何对这些数据进行智能分析和自动处理,高效地挖掘出潜在的有使用价值和社会竞争力的信息就显得愈发重要。
在当今这个信息时代,随着计算机技术突飞猛进的发展,各种智能化机器也走进了人们生产生活的各个方面,致使人们渴望与机器之间的交流能像人与人之间的交流一样自然流畅。这种
随着软件的广泛应用,特别是软件在尖端领域的应用,软件的可靠性成为一个非常重要的问题。软件的可靠性主要取决于软件开发的方法与过程,同时,又取决于软件系统的测试与验证。UML
由于Internet上数据具有异质性和多样性的特征,导致同一个领域中不同网站的结构也有很大差别,因此,用户要从Web上逐渐增多的海量数据中找到自己感兴趣的信息变得日益困难。目
随着经济全球化步伐不断加快,金融领域洗钱活动日益猖獗,并对国家经济稳定造成巨大危害,目前引起国际社会的广泛关注。洗钱势必助长走私、贩毒、贪污腐败、恐怖活动等,严重威胁全
近年来,随着web信息资源的快速增长,通用搜索引擎存在无法检索所有页面的问题,也不能满足人们日益增长的个性化服务需要,因此各类适应特定人群需要的主题搜索引擎应运而生。
随着计算机及网络技术的发展,网络环境下的案例教学是目前国内外研究的热点。在网络环境下,案例作为案例教学系统中的关键资源,它是前人对特定领域知识经验的总结。不同学科
三维表面重构是计算机视觉领域中一个至关重要的经典问题,是进行图像理解和三维目标识别的关键技术之一,它架起了机器自动完成从客观实体到抽象感知的桥梁,使得利用其来自动
视频车牌检测技术是智能交通领域中研究的热点问题,它作为机器视觉及模式识别研究领域里长期关注的一个重要课题,具有极高的学术研究价值和重要的实际应用价值。同时,Adaboost算
在通信技术和网络技术飞速发展的今天,企业收集、传递、整理信息的途径越来越多,效率要求越来越高,传统传真的机械传真机收发方式已经无法满足企业信息化的要求。本文结合某