基于深度卷积神经网络及HMAX模型的人脸年龄分类方法

来源 :东华大学 | 被引量 : 3次 | 上传用户:xuru69
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸作为人最显著的生物特征之一,包括丰富的个人信息。这些信息除了可用于身份认证和识别外,还可用于人脸年龄分类等应用,特别是可以将年龄及分布特征用于人机交互和商业智能等应用中,因此人脸年龄分类研究具有重要的科学研究意义和实际应用价值。在提取人脸年龄信息过程中,传统神经网络及SVM分类方法会受到复杂的非线性因素的影响,例如个体的基因差异、居住环境、健康情况和种族差别等因素。为了克服这些因素的影响,本文首先基于HMAX模型通过人脸图像预处理,仿大脑皮层特征提取和SVM对人脸年龄进行了有效地分类;然后基于深度卷积神经网络,利用卷积神经网络局部感知、权重共享和平移不变等特点,通过一系列的卷积、池化、全连接和归一化层等方法,进一步提高了人脸年龄分类的准确率。本文的主要研究内容包括:(1)提出基于HMAX模型的人脸分类方法。首先使用主动形状模型提取其中的人脸特征,之后为了减小平移、尺度和旋转的影响,需要做人脸归一化,在此基础上,使用HMAX模型提取C1-S特征,最后使用SVM对特征进行人脸年龄分类。(2)提出基于深度卷积神经网络的人脸年龄分类。首先深度卷积神经网络依赖于大量的训练数据,在原始人脸图像数量偏少的情况下,需要对人脸图像进行扩增。本文提出了分类性能比较好的深度卷积神经网络结构,通过对人脸图像进行多次实验,分别选择对网络性能有较大影响的激活函数、合理的归一化层数和Dropout保留概率。通过获取的最优化参数对人脸图像进行训练,获得了更好的分类性能。本文提出的基于深度卷积神经网络及HMAX模型的人脸年龄分类算法在FG-NET人脸数据测试集上均达到了比较好的准确率,能完成不同标准的人脸年龄分类任务,可有效地应用在安防、人机交互和娱乐影音等领域。
其他文献
三维可视媒体(图像与视频)因为其震撼的立体效果和极具冲击的感官体验正变得越来越受欢迎。面对当今各种各样的终端显示设备,当图像与视频的分辨率与显示屏不相符时,如何使之
多视点视频系统能够在解码端提供多个视角观看视频,给观看者带来真实感和沉浸感。由于传输带宽的限制,不可能采集密集视点的视频,因此需要虚拟视点绘制技术。在编码端传输少
在互联网快速发展和大数据的大背景下,大众的视觉体验效果得到了飞速的提升。3D视频会议系统、3D导航、3D医疗等先进技术给大众带来极大的便利同时,也不可避免地带来一些问题
多媒体信息技术的发展带动着三维视频、多视点视频、自由视点视频的应用。多视点彩色加深度(Mul-tiview Video plus Depth,MVD)的视频格式在实现自由视点视频的过程中被较为
当前高校贫困生工作在经济发展和制度创新的背景下不断变化发展,研究成果的理论性和系统性明显增强,但真正意义上的管理学研究成果不到10%的比例,并且还是在“教育理论和教育
互联网是随着时代发展产生的新型信息交流工具,如今已经进入了我们学习生活中的方方面面。与此同时网络上可交流的平台越来越多,在这些平台中各种各样的评论性文本也呈爆发式
现实应用中数据的不确定性广泛存在,如位置信息服务,传感器网络和医疗诊断。产生不确定数据的原因包括了测量不准确、网络延迟、过时数据、错误样本和隐私保护。完成传统的分
长期以来,宗教报道都是新闻报道的重要组成部分。作为中国共产党中央委员会机关报的《人民日报》,它是我们党和政府宣传国家政策方针的主要新闻媒体,其宗教报道也是宣传我国
随着科学技术的不断发展和普及,电视栏目和电视节目越来越多,但是蒙古族青年生活状态有关的蒙语电视栏目却有着普遍减少的现象。尤其对我区蒙古语卫视来说,专门针对青年话题
近年来随着服务机器人的快速发展,智能化已成为必然趋势,自主导航作为机器人智能化的重要指标,要求机器人拥有识别周围环境并定位的能力。但是实际生活中机器人所面对的环境