非限制条件下的人脸识别技术研究及其在盲人辅助中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yangtianmei01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来计算机视觉在越来越多的领域取得了进展,智能硬件中集成的视觉算法正在深刻地改变着我们的生活。全世界约有2.53亿视障人士[1],由于视觉受损,他们的日常生活面临很多不便,传统的助盲手段,如盲杖和导盲犬等,仅能提供有限的帮助。出行、社交、学习、工作等各方面的困难使得他们迫切希望有一款辅助出行、帮助他们感受世界的智能设备。听声辨人是视障人士判断周围人身份的主要手段,但这种方式只在近距离下有效,而且在嘈杂的环境中,依靠声音进行人物身份辨认会变得更加困难。近年来人脸识别技术取得了很快的发展,然而其在实际自然场景中的应用仍然面临诸多需要解决的问题。人脸的姿态、光照、分辨率等因素要求算法具有更高的环境适应性;人脸识别模型的训练样本的获取需要更少的人为干预;随着新类别人脸的出现,识别模型需要能够自动更新;智能便携式设备中的人脸识别还需要考虑实时性。本文结合人脸识别技术的研究现状,研究非限制条件下的人脸识别技术,并将其应用于盲人辅助设备中,为视障人士提供周围人物感知和人物身份辨别的帮助。本文首先总结了目前人脸识别技术的发展现状,尤其是非限制条件下和用于盲人视觉辅助的人脸识别。其次,梳理了和人脸识别相关的机器学习算法。在此基础上,本文针对人脸识别系统需要人工干预准备训练数据集的限制条件,提出了人脸跟踪和自动预分类算法,可以在非人工干预的情况下由算法自动生成训练数据库,并通过和视障用户交互的方式获取真实标签。本文将基于人脸关键点和三维人脸模型的人脸图像矫正算法应用于训练样本的预处理,减小类间样本差异,并在实际场景中的人脸图片上实验了算法的表现,提高了识别准确率。针对计算资源有限并且有实时性要求的盲人辅助设备,本文提出了三种人脸识别(分类)算法,并对既有人脸数据库和实际场景中的人脸分别进行了实验。本文还介绍了将图像数据获取、人脸检测、人脸矫正和人脸分类结合在一起的人脸识别系统的多线程程序框架。本文最后对当前人脸识别系统进行了总结,对未来的发展方向作出展望。
其他文献
中医作为中国传统医学,当前正经历着前所未有的变革,其命运也面临兴亡的转折。中医是否是“伪科学”而需要被废除,中医的特殊地位是否要动摇,以及我们应该如何对待传统与现代碰撞
袁锦翔同志在《外语教学与研究》1987年第3期著文,以古庄同志的一则译文为例,论证了古氏译文是一种新的翻译文体并冠之为。阐译”之名.笔者认真地拜读了该则译文的原文后觉得,袁
《在旷野上》是穆旦四十年代初期的作品,诗篇以祈求死神给予宁静为结束。分析全诗,可以发现,诗中洋溢着对“过去的彷徨的日子”的怀念,暗含着对“美丽的真理”的怀疑,对秩序的无可
上帝存在与恶的问题是中世纪哲学重要问题之一。恶的问题通常被用作反驳上帝存在的理由,而应对这一诘难,为上帝存在的信仰作辩护的理论,就是神正论。圣托马斯·阿奎那在《论
为对中国健康老年人全血比粘度参数值的统一标准的制定提供科学依据,笔者收集了中国各地用毛细管法测定的健康老年人全血比粘度参考值,并对其与地理因素的关系进行了研究,发现海
张东荪是早期在中国宣传介绍社会主义的重要人物之一,他关于中国社会主义问题的思考经历了由简单反对或者激情信仰的主观表态阶段进而到理性认知、求真务实的科学理解阶段的进
本人通过临床实践,运用中西医结合方法治疗流行性出血热,在短期内恢复脏腑功能,缩短疗程,获得一定的疗效,现整理报道如下.
实验利用电子鼻,结合感官评价和理化指标,采用主成分和聚类分析等统计学方法,对5种知名品牌的东坡肘子进行加热前后特征风味变化分析。结果表明:加热前,四川地区的3个样品和江南地
目前对各种原因引起的骨不连和骨缺损仍缺乏理想的治疗方法,较为常用的方法是自体骨移植,但存在着来源受限,影响供区功能、增加手术痛苦及感染等缺点,使临床应用受到一定的限
本文从被叙述者(黑孩)和叙述者这两个方面分析了《透明的红萝卜》中的"沉默",认为沉默既是小说的一种整体性审美境界,也是一种叙事策略,并体现了作者把握世界的一贯角度。在