论文部分内容阅读
近年来计算机视觉在越来越多的领域取得了进展,智能硬件中集成的视觉算法正在深刻地改变着我们的生活。全世界约有2.53亿视障人士[1],由于视觉受损,他们的日常生活面临很多不便,传统的助盲手段,如盲杖和导盲犬等,仅能提供有限的帮助。出行、社交、学习、工作等各方面的困难使得他们迫切希望有一款辅助出行、帮助他们感受世界的智能设备。听声辨人是视障人士判断周围人身份的主要手段,但这种方式只在近距离下有效,而且在嘈杂的环境中,依靠声音进行人物身份辨认会变得更加困难。近年来人脸识别技术取得了很快的发展,然而其在实际自然场景中的应用仍然面临诸多需要解决的问题。人脸的姿态、光照、分辨率等因素要求算法具有更高的环境适应性;人脸识别模型的训练样本的获取需要更少的人为干预;随着新类别人脸的出现,识别模型需要能够自动更新;智能便携式设备中的人脸识别还需要考虑实时性。本文结合人脸识别技术的研究现状,研究非限制条件下的人脸识别技术,并将其应用于盲人辅助设备中,为视障人士提供周围人物感知和人物身份辨别的帮助。本文首先总结了目前人脸识别技术的发展现状,尤其是非限制条件下和用于盲人视觉辅助的人脸识别。其次,梳理了和人脸识别相关的机器学习算法。在此基础上,本文针对人脸识别系统需要人工干预准备训练数据集的限制条件,提出了人脸跟踪和自动预分类算法,可以在非人工干预的情况下由算法自动生成训练数据库,并通过和视障用户交互的方式获取真实标签。本文将基于人脸关键点和三维人脸模型的人脸图像矫正算法应用于训练样本的预处理,减小类间样本差异,并在实际场景中的人脸图片上实验了算法的表现,提高了识别准确率。针对计算资源有限并且有实时性要求的盲人辅助设备,本文提出了三种人脸识别(分类)算法,并对既有人脸数据库和实际场景中的人脸分别进行了实验。本文还介绍了将图像数据获取、人脸检测、人脸矫正和人脸分类结合在一起的人脸识别系统的多线程程序框架。本文最后对当前人脸识别系统进行了总结,对未来的发展方向作出展望。