基于多尺度图像的算法研究及其在低分辨率人脸识别中的应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:WAIN154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自上个世纪六十年代,人脸识别初次在数字图像处理领域中崭露头角,已走过长达半个世纪的发展之路,识别研究也从单一的仿真环境到适应多种多样的复杂环境、也从简单且光照充足无变化的正脸图像到多种表情变化,大年龄跨度以及多重遮挡的人脸。虽然发展至今,在特定的约束环境下,现有诸多人脸识别算法可以取得优秀的识别效果,但若应用至实际生活中,剥离设定好的特定环境,面对现实生活中的低分辨率人脸往往识别性能不够理想。本文针对的研究对象即是此种情境下的非传统人脸图像。现有的解决低分辨率人脸识别的方法主要有二。其一是超分辨率增强,通过增强低分辨率人脸图像达到与高分辨率维度匹配的目的。其二是简单直接地对低分辨率人脸图像进行特征提取,获取有效面部信息。有诸多较为成熟的高分辨率特征提取方法,故基于此基础,本文采用已取得不错结果的方法进行分析和改进,并结合多尺度空间理论,将其在低分辨率人脸图像上进行应用。本文的主要工作如下:1、基于融合高斯金字塔特征的低分辨率人脸识别算法的研究。本文受多尺度空间表达思想的启发,为进一步攻克低分辨率人脸图像的识别和验证难点,取多种对应的特征提取方法与高斯图像金字塔相结合,提出一种融合低分辨率人脸图像局部和全局信息的特征提取方法。首先,通过对人脸图像进行分解,建立高斯图像金字塔,来满足构造多尺度表达空间的目的;其次,利用不同的特征提取方式得到金字塔中各层图像的关键特征信息,其中底层使用局部二值模式方法,中间层运用一组Gabor滤波,顶层运用HOG提取边缘信息获得HOG特征谱,三层特征谱融合构成特征融合金字塔;最后,将获得的特征向量通过分类器进行决策融合,来完成整个低分辨率人脸图像识别过程。2、基于多尺度特征级融合的低分辨率人脸识别算法的研究。在已有研究基上,为进一步提高低分辨率人脸识别的性能,提出一种基于多尺度特征级融合的低分辨率人脸识别算法。首先,对低质量人脸图像并行使用两种特征提取方法,分别是获取全局信息的多尺度二值模式和兼具局部信息和边缘纹理信息的GHOG;然后将获得的人脸特征图通过二维经验模式分解的逆变换,得到具有补充面部特征的特征级融合图像。最后,通过将融合图像投入至一定数量的分类器中进行训练来实现筛选过程,得到分类效率良好的分类器,同时使用多尺度融合投票法完成决策层的集成过程,以此获得识别结果。本文在AR、CMU-PIE、YALE、ORL、FERET等人脸数据库中设计多种仿真实验以及与其他针对性算法的对比实验。经实验证明,本文提出算法研究对低分辨率人脸数据相较识别准确率更优越。
其他文献
随着我国汽车保有量的不断增加,城市停车难问题日益凸显,AGV智能停车库作为缓解停车难问题的新型解决方案,受到了越来越多的关注。在AGV智能停车库中,主要依靠停车AGV来运输车辆,因此AGV的路径规划与协同调度策略的好坏直接关系到停车库能否稳定高效地运行。本文以AGV智能停车库作为研究背景,主要研究AGV的路径规划算法与多AGV协同调度策略,同时为了提高系统的运行效率,对AGV电池充电问题与停车位资
行为识别是人工智能与计算机视觉领域最具挑战性的研究方向之一,在人机交互,医疗健康,智慧安防以及智能机器人等领域有着广泛的应用。行为识别技术的核心是通过聚合视频片段中每帧的预测信息从而实现视频级预测。尽管针对每帧图像的分类技术已经取得了很大的成功,但从二维图像的分类扩展到三维视频的识别仍然有一定的困难。因为从二维图像扩展到三维视频不仅因为计算复杂度的巨大提升,更需要捕捉视频中不同帧之间的时空上下文关
随着在线社交网络的蓬勃发展,越来越多的人喜欢在互联网上以文字的形式表达自己的情感,例如用户可以对已购买的产品进行评价、对外卖订单给出点评、在微博等网站上发表自己对某件事情的看法等等。而对这些包含大量情感、态度、观点的文本进行情感倾向分析已经成为自然语言处理领域的一个非常热门的研究方向,具有实际的商业价值以及学术研究意义。以往的情感分析研究多为篇章级或句子级,即把整段文本归纳为一种情绪,这种研究已经
图像配准是医学影像处理中常用的技术,大量应用于医学的各个领域,包括病灶检测,疾病诊断,手术规划,手术导航和疗效评估等。随着多种医学影像技术的蓬勃发展,从反映解剖结构的形态学成像到反映器官组织的功能性成像,不同模态的医学影像从不同的角度承载着丰富的医学诊断信息,将多种模态的图像进行融合处理,能够为临床治疗提供丰富的功能互补信息。而多种模态的图像融合的基础是将这些图像进行配准。因此,多模态医学镜像的配
我国很多关于书法学习的教材和论著都是从二维平面的角度出发,将书法笔迹看作一幅静止不变的平面图像,但实际上书法笔迹是通过书写运动形成的运动轨迹。运笔速度和书写压力都是笔迹变化的最基本因素之一,也是常见的书写指标,可以用来衡量书法临摹时的相似程度。但是在传统的书法教学模式当中,普遍使用的都是手把手模式,也就是学生在观察并记忆教师书写时的力度、速度、布局及节奏等示范之后,再反复在字帖上进行临摹的学习方式
三维成像技术在当代社会应用广泛,在信息和生命科学领域中尤为突出。物体的三维信息对于人们正确认识和探知其结构、三维形貌等具有重要意义。随着近年科学技术水平的飞速发展,人们对提取物体三维信息的能力的需求也日益增长。现代三维成像也逐步向着高分辨、记录彩色图像、动态成像的趋势不断发展,对传统三维成像技术不断提出了新的挑战。近年来,人们相继开发出许多全新的三维成像技术,其中包括全息术、激光扫描共聚焦显微镜、
图像分割作为目标分析与识别、目标跟踪等高级图像处理操作的一项基础且关键的步骤,其分割结果的好坏直接影响后续处理操作。现有的图像分割算法可根据人工参与与否,将其分为交互式分割和自动分割。前者由于其良好的分割性能,得到了广泛的应用。但当面对的图像数据量较大时,相应的需要消耗更多的人力且较费时,无法满足实际需求。近年来,基于视觉显著区域检测算法的研究取得了不错的成果,许多研究人员将其与已有图像分割算法结
视频多目标跟踪主要利用视频上下文信息,对多个目标的外观信息和运动信息建模,实现对目标运动状态的预测和更新,并标记出目标轨迹。视频多目标跟踪涉及了深度学习、机器学习、最优化算法等多个方面的理论知识。随着计算机硬件和数学理论的发展,各种视频多目标跟踪系统纷纷实现,尤其广泛应用于行为识别、交通监控、智能驾驶、人机交互和无人机监控等,在视频目标跟踪领域的深度和广度上有着不同程度的应用。本文围绕随机有限集在
针对目前自然场景图像中的文本检测存在的问题,本文对自然场景图像中的文本检测方法进行研究。本文设计了基于卷积神经网络的端到端的文本检测框架,实现提高文本检测精度、降低检测模型复杂度的目的。本文的主要研究内容如下:1.基于自适应特征选择和尺度损失函数的文本检测方法。日常生活中的文本非常多样化,并且存在许多杂乱的背景,为了解决这些问题,本文提出了一种自适应特征选择的神经网络。这个网络由两个部分组成,第一
近年来伴随各类社交与电子商务平台迅速发展,网络上用户生成内容出现爆炸式的增长。用户在社交平台与电商平台发表的评论中,包含了大量的文本信息,往往从多个方面反映了其对某些事件或者商品的情感倾向。分析这些包含情感极性的信息,能够有效帮助商家改进产品和改善服务,供政府相关部门了解舆论情况,以制定相应政策,同时也能让其他用户了解事件的社会评价。文档级情感分析方法能够获取整个文本的情感极性,但难以感知文本中不