【摘 要】
:
大量的社会心理学研究表示,视线通常在注意力分析和人际交流中扮演着重要角色。经过30多年的研究,研究人员提出了多种视线估计解决方案,也产生了具有高精度的商用系统。然而,大多数商用系统需要侵入式的专用硬件且使用场景受限。因此,低成本、非侵入式且适用于任何头部姿态的视线估计算法成为当前的主要研究方向。本文在彩色图像的基础上加入深度图像提高头部姿态估计的准确度、加入红外图像增加算法的适用范围,故提出了一种
论文部分内容阅读
大量的社会心理学研究表示,视线通常在注意力分析和人际交流中扮演着重要角色。经过30多年的研究,研究人员提出了多种视线估计解决方案,也产生了具有高精度的商用系统。然而,大多数商用系统需要侵入式的专用硬件且使用场景受限。因此,低成本、非侵入式且适用于任何头部姿态的视线估计算法成为当前的主要研究方向。本文在彩色图像的基础上加入深度图像提高头部姿态估计的准确度、加入红外图像增加算法的适用范围,故提出了一种面向多数据源进行视线估计的方法。面向多数据源的视线估计是根据采集的深度图像、彩色图像和红外图像进行头部姿态估计和瞳孔定位,从而进行视线估计。视线估计的基础是准确的头部姿态与瞳孔位置,因此头部姿态估计与瞳孔定位为本文的研究重点。针对头部姿态估计问题,将基于几何的方法与基于学习的方法相结合进行头部姿态估计。在人脸检测和人脸对齐的基础上,提取彩色图像或红外图像的几何特征和深度图像的局部区域深度特征,再结合深度块的法线和曲率特征,构成特征向量组;然后使用随机森林的方法进行训练;最后,所有决策树进行投票,对得到的头部姿态高斯分布估计进行阈值过滤,进一步提高模型预测的准确度。针对瞳孔定位问题,在不同的数据源图像中采用不同的方法进行瞳孔定位。在彩色图像中,使用基于变形模板的方法进行瞳孔定位;在红外图像中,根据相机位置的不同,可以将图像分为亮瞳图像和暗瞳图像,分别在两种图像中使用不同的基于像素特征的图像处理方法进行瞳孔定位。针对视线估计问题,使用坐标变换法,通过分析头部姿态造成的全局视线偏移和瞳孔位置导致的局部视线偏移,将其全局方向与局部方向相结合进行坐标系变换,估计世界坐标系中的视线方向。综上所述,在研究视线估计当前算法和相关流程的基础上,通过提供的实验平台实现了提出的面向多数据源的视线估计算法,该方法经过在公开数据集和本地数据集上验证,在保证实时性能的前提下,可以较好的提高视线估计的准确性。
其他文献
随着通信网络和智能手机的不断发展,移动支付已成为人们日常生活中交易的主流方式之一,使人们的生活更加便捷。目前,支付宝、微信加入了人脸识别支付和指纹识别支付等单模认证支付方式,使得支付环境得到了加强。但是人脸指纹等单模特征识别仍然存在着一些弊端。例如:单模生物特征在光照、表情变换等复杂环境下识别效果会受到影响,并且还容易被不法分子伪造。为了解决这些弊端,进一步提高安全性能和识别性能,一种非常具有潜力
近年来,随着无线通信技术、定位技术的不断发展,智能终端设备广泛普及,人们的生活方式和工作方式越来越多的依赖于移动终端设备,使得目前基于位置的服务(Location-based Service,LBS)日益盛行。用户使用LBS服务时需要依托移动设备将自身位置发送给位置服务提供商以获取相应的位置服务。然而,LBS在赋予社会大众巨大便利的同时,个人位置信息也时常遭到泄露。当用户的位置信息遭到恶意攻击者攻
近年来物联网(Internet of Things,Io Ts)的发展日新月异,而作为物联网的核心技术之一,射频识别(Radio Frequency Identification,RFID)技术已被广泛应用到诸多领域,如物流追踪、仓库管理、交通运输、商品零售等,并取得了巨大经济效益。比如在仓库管理系统中,需要实时监测某些贵重物品,防止其丢失以造成巨大的损失。而在RFID系统中,丢失货物的检测则可以
随着计算机视觉的不断发展,视频摘要技术已经广泛应用于人们生活的方方面面。目前,计算机硬件的性能不断提升,日常生活中产生的视频数据急剧增加,为基于海量数据研究的视频摘要提供了良好的机遇。视频摘要是指通过对视频结构和内容的分析提取出有代表性的部分,再以某种方式组合成概要,它能充分表达视频的主要内容。算法研究中,特征的描述能力不足易造成关键内容检测不当,使摘要效果变差。而且视频摘要的选取需要满足不同用户
进程间通信是操作系统功能中的重要组成部分。操作系统内核提供进程间通信功能,并为用户进程提供接口,用户进程通过系统调用,可依据需求,采用不同的进程间通信机制完成信息的发送、接收。本文阐述基于Intel体系结构的操作系统原型FishOS内核中进程间通信模块的设计与实现,详细说明如何实现本地进程间通信功能以及异地进程间通信功能。本课题在Linux环境下实现了基于FAT32文件系统的自启动系统引导程序、键
进入21世纪以来,物联网(Internet of Things,Io Ts)技术发展迅速,在许多领域得到广泛应用。例如物联网在智能物流、智能交通、智能建筑、环境监测等方面的应用,取得了重大突破,极大的影响了人们的生产和生活方式,提高了生产力,使人类社会更加智能、高效。无线射频识别(Radio Frequency Identification,RFID)技术是物联网技术的核心支撑技术,RFID技术的
随着物联网的快速发展,数据融合技术已被广泛用于处理物联网环境中产生的大量数据。数据融合是物联网多源信息综合处理的一项新技术,它能将来自某一目标的多源信息提取、处理、分析、综合多传感时空上的冗余或者互补信息,从而生成比单一信源更精确、更完全的估计和决策。物联网环境中的数据融合需要收集和处理具有混合时间特征的各种数据,包括实时和非实时数据。目前数据融合的大多数研究都是关于数据处理方面的,但是数据融合需
随着数字油田与油田物联网的高速发展,油田生产过程中各类生产数据得到了有效存储,这些数据真实可靠的记录了油井状况,具有非常高的真实性和研究价值,有效分析并利用这些数据可以更好的指导油气生产和战略决策。目前油田在数据处理方面存在分析方法单一、相关技术人才不足、缺乏对大数据挖掘全生命周期的管理支持、数据分析操作过于复杂并缺乏灵活性等问题,因此油田迫切需要智能大数据处理平台实现油田数据的灵活处理。为解决上
随着计算机技术的迅速发展,计算机视觉可处理的数据量不断增大,三维模型被广泛地应用于各个领域。近年来,手机人脸解锁技术已全面普及,二维人脸信息的获取技术已相对成熟,三维人脸重建成为计算机图形图像领域的一大研究热点。当前,很多研究者使用人脸的二维图像特征结合三维形变模型(3D Morphable model,3DMM)的方法进行人脸三维重建,其中大部分都是针对单张二维图像进行重建,由于多角度信息的缺失
近年来,随着计算机技术及网络技术的发展,XML格式的数据呈爆炸式增长,对XML进行查询日益受到关注。对XML数据进行查询主要有两种查询方式:结构化查询及关键字查询。其中,关键字查询简便,用户体验良好,受到用户的青睐。最近几年,针对XML数据查询方面的工作集中在对XML数据进行关键字查询方面。其中,查询效率是各位专家学者的重点研究内容。为了提高关键字查询的效率,设计了一种基于预留区间值的查询算法。该