基于卷积神经网络的静态图像人脸表情分类技术研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:jinying5322446
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情包含着丰富的情感信息,在人们的日常交流中占据着重要地位。随着计算机技术的快速发展,人们迫切希望计算机能够确切地模拟人类的行为模式,进而提升现有智能化体验。人脸表情识别技术作为计算机辨别人类表情状态的重要手段具有广阔的应用前景,被广泛应用于个性化推荐、远程教育、医学辅助、驾驶辅助、智慧城市、人机交互等领域。近年来,随着人工智能的发展,表情识别成为了计算机视觉领域的研究热点,吸引了大量研究学者的关注。利用深度学习中的卷积神经网络,识别静态图像的人脸表情是本文的主要研究内容,具体工作如下:1.针对传统机器学习方法中,过多地对原始图像进行预处理、图像增强,以及数据样本不足对表情识别的影响,文中保留了FER2013数据集和CK+数据集的原始信息,并对训练集中每张表情图像进行四角和中心裁剪,然后再水平翻转操作达到扩充数据样本的目的。2.针对传统机器学习中人工提取特征复杂度高,以及浅层卷积神经网络对于表情特征提取不充分的问题,排除太深的网络易造成计算资源浪费及过分提取表情特征的嫌疑,选择了VGGNet-19GP和ResNet网络。VGGNet-19GP来自于对VGGNet-19的改进,对最后一层卷积学到的深度描述子分别进行最大和平均的全局池化,然后分别做L2规范化,将两支得到的特征级联经过一个全连接层达到分类的目的。实验过程中两网络均使用了ReLU激活函数和随机梯度下降训练算法,以及加入了Dropout机制防止过拟合策略。最终VGGNet-19GP和ResNet-18网络在FER2013数据集上分别实现了71.848%和72.271%的平均准确率,在CK+数据集上实现了91.107%和92.845%的平均准确率。3.针对单卷积神经网络进行表情识别过程中特征提取单一会造成最终表情分类准确率不高的问题,借鉴集成学习的思想,提出了一种基于集成卷积神经网络的面部表情识别新方法。方法对VGGNet-19GP模型和ResNet-18模型进行集成,构建了集成网络EnsembleNet模型。该模型利用了两个网络的输出,保存了双网络FC层之后的7类表情能量值的特征向量进行级联成新的特征向量,通过获取新向量中的最大值返回其索引作为表情的预测值完成对表情的分类。通过实验研究发现采用加权平均的集成策略,对VGGNet-19GP和ResNet-18分别设置0.47和0.53的权值时实验效果最好。在FER2013和CK+数据集上分别获得了73.854%和97.611%的平均准确率,达到了分类准确度高、泛化能力强的研究目的。
其他文献
《山楂树之恋》在"回归文艺"、讲述"史上最干净的爱情"的承诺中,等着坐收丰厚的票房。然后,张艺谋只讲述了一段简单的被切割的爱情碎片。没有心灵的冲突和挣扎,未经世事的洗
近年来,我国室外大气颗粒污染污染问题日益突出,人体可吸入颗粒物(PM10、PM2.5)已成为许多城市的主要污染物。大量的流行病学研究显示颗粒物的暴露浓度与人体疾病的发生率和
近年来,随着科技的进步,蓝宝石晶片在LED照明、电子行业等领域的应用越来越广泛。蓝宝石晶片的制备通常需要对蓝宝石晶锭进行线切割,由于金刚丝的直径与所得晶片厚度相差不大
随着计划生育相关政策的不断完善,我国的计划生育工作也逐渐朝着法制化、规范化方向发展。就我国目前的现状而言,第一代独生子女陆续进入生育阶段,这就使得计划生育工作又逐
介绍了珠钢电炉CSP工艺下生产低碳高强度汽车梁用钢板ZJ510L的生产工艺,试验研究了薄板坯连铸连轧生产低碳高强度汽车梁用钢板ZJ510L显微组织和力学性能特征,并分析了ZJ510L
第一部分构建基于13-MRNA模型预测膀胱癌疾病进展和预后目的:目前尚缺乏可靠的标准来评价非肌肉浸润性膀胱癌的进展风险。本研究的目的是寻找基于基因表达谱的潜在生物学标志
矿产资源基地是矿业经济的主要载体,能够统筹矿产资源集中勘查开发、保证矿物原料高效生产利用和促进下游产业集聚,从而保障国家矿产资源的安全供应。然而,我国矿产资源基地
<正>王宗炎先生曾说过:"语言是表达思想的手段。思想不合逻辑,语言就不可理解,思想有逻辑性,语言就顺理成章。"要想写出一篇条理清晰、论证严谨而又有说服力的议论文,就要求
自2006年第一部《乡村爱情》播出以来,其剧集系列在很大范围内引发了收视热潮,赢得了相当的声誉。其以农村生活为背景的题材定位,贴近生活、贴近百姓,反映了当下新农村人们的
本文结合法学教育的情况对案例教学的含义做了阐述,指出案例教学法的利弊,指出法学教育中应当结合实际情况,对其加以灵活运用。