基于深度学习的手机移动端视线跟踪算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wjsj123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视线跟踪技术是计算机视觉领域中的重要课题,伴随着高性能图像采集和计算设备的出现以及图像处理分析的相关算法的不断涌现,视线跟踪技术已经逐渐走入我们日常生活中的各个领域。将视线跟踪技术用于人机交互领域中,不仅可以改变传统的人机交互模式,给用户带来全新、高效的使用体验,还可以给四肢行动存在障碍的用户带来极大的方便。然而,传统的视线跟踪技术往往要依靠眼动跟踪仪等其他的硬件设备,不仅造价昂贵,还会给使用者带来一定的不便。本课题以使用iPhone手机过程中的人机交互为例,尝试将深度学习技术应用于视线跟踪任务中,使得用户可以不借助眼动跟踪仪等其他的硬件设备,仅依靠手机前置摄像头拍摄到的用户操作手机照片的图片,利用纯软件的方式预测用户视线在手机屏幕上的聚焦位置,从而实现用眼睛代替手指进行触屏操作。首先,本文介绍了卷积神经网络的基本理论。卷积神经网络由标准神经网络演变而来,采用卷积运算实现层间连接,可以显著降低计算成本,满足信号局部特征提取的要求,在计算机视觉领域获得了广泛的应用。其次,综合考虑实时性和准确性因素,采用方向梯度直方图特征和级联的梯度提升回归树算法进行用户人脸和人眼的分割定位以及眨眼检测,完成眨眼检测、人脸检测与人眼定位模块的设计,为视线聚焦点预测提供输入信息。再次,采用深度卷积神经网络进行视线聚焦点模块的设计。本课题中,我们分别尝试了多输入基于回归的视线聚焦点预测方法,多输入基于分类的视线聚焦点预测方法和单输入端到端的视线聚焦点预测方法。网络结构方面分别采用了基于AlexNet的网络架构和带有batchNormalization的残差神经网络架构,可以比较准确、快速的预测出用户视线在手机屏幕上的聚焦位置,从而在理论上实现眼睛代替手指进行手机触屏的功能。最后,对本课题中尝试过的视线跟踪预测方法的实时性和准确性进行比较,并讨论了提升算法性能的策略。
其他文献
介绍了一种新型锂盐二氟草酸硼酸锂(LiODFB)的基本性质和制备进展,以及在锂离子电池应用中的基本特性.使用LiODFB电解液的电池电化学性能优良、对电极材料相容性较好、与其他
以沪深A股上市公司为样本研究媒体监督、董事会结构对高管薪酬的影响。研究表明,随着媒体对上市公司关注程度的提高,上市公司高管的薪酬也会相应提高。但当负面报道的占比提
石墨烯复合材料具有不同的结构和组成,包括石墨烯/聚合物、石墨烯/金属、石墨烯/金属氧化物等二元复合材料以及石墨烯/无机材料/聚合物三元复合材料。它们优异的物理和化学性
研究目的在于优化设计钢纤维高强混凝土配合比。研究中为了得到钢纤高强维混凝土最优配合比,采用探索试验研究分析钢纤维高强混凝土配合比,通过正交试验方法,研究分析钢纤维
联轴器作为机械传动系统中的一种重要部件,一直广泛应用在工业领域的各个角落。随着永磁体材料技术的不断发展,磁力联轴器以其非接触式传动、软启动、无污染、低噪音等性能特
在光学显微镜和扫描电子显微镜下观察了国产萝藦科牛奶菜族11属28种植物叶表皮的外表面和内表面形态特征.该族植物叶片上表皮细胞通常呈多边形,垂周壁平直或近平直;角质层有
<正>党的十九大报告提出要实施"乡村振兴"战略,按照产业兴旺、生态宜居、乡风文明、治理有效、生活富裕的总要求,加快推进农业农村现代化,浙江省委省政府提出全省要统筹推进"
<正>地处陕西的华县皮影,造型特点非常独特,其形象质朴单纯特征明显,线条凝练概括生动而有气韵,装饰精巧细致丰富而不拖沓。在造型的刻画与表现方面华县皮影吸取了陕西剪纸和
2016年5月5日,国家体育总局发布《体育发展“十三五”规划》,提出拓展全民健身活动的广度和深度扶持推广武术、太极拳、健身气功等民族民俗民间传统运动项目。我们可以通过竞
经颅多普勒是一种利用超声波的多普勒效应检测颅内各主要血管及其分支的血流动力学参数的脑血管疾病检测方法,被广泛应用于医学临床监护和检测。传统经颅多普勒超声检测仪体