论文部分内容阅读
随着智能设备的飞速发展,人脸年龄估计技术对安全监控、产品推荐、人机交互、商业营销等多个方面有重要意义。但是人脸的老化是一种肉眼无法发现其过程的缓慢变化,相比其他人类生物特征,更容易受到人体内外的不定因素干扰。正是这些因素给研究人脸年龄估计带来了巨大的困难和挑战。年龄作为一种特殊的生物特征,若简单地将年龄估计问题看作分类问题或回归问题会忽略年龄的有序信息;若将年龄按固定区间长度划分为多个不重叠的年龄组,就会造成年龄组之间的界限模糊性问题,这都影响年龄估计模型的精度。本文基于对现有的人脸年龄算法的研究,提出了多卷积神经网络方法和逐级分类网络方法,由此实现两个年龄估计模型。对于年龄的有序性问题,本文使用多个卷积神经网络将人脸年龄估计问题转化为多个二分类子问题来解决。子问题是对输入的人脸图像进行判断是否大于预设年龄,最后把所有子问题的结果融合后得到年龄预测值。每个基础卷积神经网络利用有序年龄标签在整个训练数据集上学习相应的年龄特征,该方法变相地扩大了训练集,防止模型过拟合。所有基础卷积神经网络参数都由一个预训练后的卷积神经网络进行初始化,有效减少模型训练的时间。实验表明,基于多卷积神经网络的人脸年龄估计模型的结果优于常用人脸年龄估计模型,说明考虑年龄有序性对年龄估计模型的性能有一定帮助。同时,基础卷积神经网络学习到的年龄特征能更有效地表达人脸年龄信息。针对年龄分组的界限模糊性问题,本文提出逐级分类网络的人脸年龄估计模型。根据输入图像来动态地移动或缩放年龄分组的范围可以有效地解决界限模糊性问题,同时也考虑到年龄的连续性。逐级分类网络方法采用从粗到细的分类策略对人脸图像进行年龄分组,每一级网络都是对上一级年龄范围的进一步分类。逐级分类策略使神经网络模型只需要少量的参数,减少模型的规模,大大缩短训练时间。实验表明,逐级分类网络的人脸年龄估计模型与复杂的模型相比,精度虽有所下降但内存消耗很低;与其他紧凑的模型相比,模型规模更小,精度明显提升,更适合移动平台和嵌入式平台使用。