视频图像序列内的视线跟踪研究

来源 :武汉理工大学 | 被引量 : 6次 | 上传用户:bgnjqw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
眼睛是感知世界的重要器官,视线方向可以反映人们感兴趣的点。视线跟踪技术可以检测出人类眼睛的注视方向,得出兴趣点。随着电子技术的不断发展,关于视线研究技术的研究越来越多,一些视线跟踪系统已经应用于人机交互领域。随着研究的不断深入,视线跟踪技术在网络的可用性、广告、包装设计和汽车工程等领域也会有很大的发展空间。但是现有的视线跟踪技术有限,视线跟踪系统存在跟踪精度较低、限制头部运动、干扰性大的缺点。针对上述问题,论文对序列内的视线跟踪技术进行了研究,减小了对使用者头部的限制,提高了系统的准确度和稳定性。论文的主要工作成果如下:(1)把头部姿态估计方法与二维视线跟踪方法结合,利用头部姿态参数校正用于视线估计的面部特征点间的位置距离,减小因头部发生转动给视线跟踪算法带来的误差。该方法既不需要辅助设备固定头部,又提高了视线跟踪的准确度。(2)对用于视线跟踪的头部姿态估计算法进行了研究,提出了一种三维头部姿态估计方法。在该算法中,把头部看作圆柱体,头部的转动可以看作是圆柱体的旋转。通过不断变换姿态参数,使得当前的面部纹理与参照纹理相符合,此时的参数即为当前图像的头部姿态参数。利用视频图像帧间头部图像变化较小的特点,利用前一帧图像的头部纹理估计下一帧图像头部的姿态,减少了计算量,提高了计算精度。(3)在边缘定位方法中对亚像素技术进行了深入的研究。在视线跟踪过程中,利用亚像素技术定位面部特征点(虹膜中心和外眼角)的亚像素位置;根据检测得到的虹膜亚像素级边缘点,利用椭圆拟合方法精确定位虹膜亚像素中心点。该方法减小因二维面部图像特征点定位不够精确给视线方向估计带来的误差,提高了视线跟踪的准确度。(4)采用简单的头部几何模型,提前采集眼睛位于屏幕固定位置时的面部特征点,根据这些特征点组成的向量与视线方向之间的对应关系,估计当前头部图像中校正后的特征点向量的视线方向。该方法计算简单且能够准确估计视线方向,使序列内视线跟踪系统能够满足实时性要求。实现了视频序列内视线跟踪系统,验证了系统的准确度和稳定性。
其他文献
Internet上面的信息数量与日俱增,使得互联网的使用者已经很难以地址栏输入地址或简单的导航网站等方式准确、有效地找到所需内容。搜索引擎的出现给这个问题提供一个有效的解
当今世界,科学技术飞速发展,信息技术日新月异。随着网络技术快速发展和在教育中的广泛应用,针对网站和网络设备的监控已经成为网络发展中必然产物。如何选择一个适合的监控
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)是一种流行的主题模型算法。它对每篇文本以及文本中每个单词进行主题层次上的聚类,将高维稀疏的文本单词矩阵分解成两个相对
随着信息技术的普及和深入应用,企事业已将大量以各种形式存在的关于顾客、产品开发和协作知识等的信息存储于内部的信息管理系统中;同时因特网上也出现了大量企事业感兴趣的
在机器学习领域的分类问题中,对于待分类的样例,当我们用于判断其类别的属性个数很多时,用传统的分类算法建立分类器,消耗较多的计算机时间和空间。近年来,研究学者们对数据
深度强化学习是机器学习领域中一个新的研究热点。它以一种通用的形式将深度学习的感知能力与强化学习的决策能力相结合,并通过端对端的方式学习从原始输入到动作输出的一个映
编译器是嵌入式系统研发的基础,快速实现特定硬件平台的嵌入式系统编译器可以大大缩短嵌入式系统研发周期。目前研究人员主要采用GCC编译器后端移植方法来生成嵌入式系统编译
针对目前的规则引擎集成方式没有很好的解决系统中多规则引擎的灵活管理以及不同规则库的管理工作的不足,给出了一套基于Web的规则引擎的集成方案。规则引擎集成平台的设计分
命名实体识别(Named Entity Recognition,简称NER),作为自然语言处理任务中一项基础性工作,已经被广泛地应用在一些语言处理领域中,如信息检索、信息抽取和机器翻译等。国外
集成学习是机器学习领域的热点研究之一。它主要是通过某种组合方式将多个学习器的分类结果融合到一起,从而提高集成学习的泛化能力,避免过拟合现象。集成学习应用很广泛,目