自然场景下的人脸检测及表情识别算法研究

来源 :北京交通大学 | 被引量 : 8次 | 上传用户:hewei83221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,人们对于其人机交互设计也提出了更高的要求,人们渴望获得更加“拟人化”的人工智能助手,希望其能够正确的认知用户的情感并做出积极且准确的反馈。人脸表情识别便是实现这一目标的关键环节之一。针对实际应用环境的人脸表情识别是当下研究的难点所在,其主要原因在于人脸图像获取过程中受到光照、姿态、遮挡物等情况影响,导致传统方法进行特征设计检测和识别精度难以提升。随着大数据带来的海量数据支持以及深度学习理论的日趋成熟,特别是卷积神经网络在模式识别领域的应用,为人脸表情检测和识别提供了新的思路和方法。本文以实现自然场景下的人脸检测及表情识别为目标,采用目前机器视觉领域常用的卷积神经网络,实现了复杂自然场景下的人脸目标检测算法和人脸表情分类算法。本文主要工作包括以下两个部分:1.实现了基于深度学习目标检测技术的自然场景下人脸检测。研究对比了目前深度学习领域较为前沿的Faster-RCNN、YOLO、SSD三种目标检测网络,采用Wider Face数据库16106幅样本进行人脸目标检测训练,并将SFEW数据库1000幅样本作为测试集。实验结果显示,Faster-RCNN和SSD在测试集上均取得了 100%的检测精度,YOLO检测速度更快但是检测精度稍差,为此,本文采用Faster-RCNN实现对人脸表情区域的分割。2.实现了基于卷积神经网络的自然场景下人脸表情识别。本文从以下几个方面实现人脸表情识别网络模型的训练及优化:首先,对比了目前常用的4种经典卷积神经网络结构,针对训练样本数量不足导致的模型过拟合问题,采用了数据增强扩展训练数据量并通过迁移学习的方式进行训练策略优化,实验结果显示VGGNet-16模型识别效果最好;然后,分析了不同样本类别的识别率不均衡问题及其产生的原因,采用了一种加权的损失函数对网络进行优化,实验结果显示模型的整体识别率稍有下降,但各类别间识别率不均衡问题有所改善;之后,采用了网络剪枝的方式压缩网络模型,通过提升了网络稀疏性抑制过拟合,再训练后模型识别率进一步提升;最后,采用了 3种VGGNet网络模型集成的方式,进一步提升了对人脸表情目标的识别率。本文针对实验采用的SFEW数据库,分别从单个网络模型和多网络集成的方面提高了人脸表情的识别率。实验结果表明了论文工作的有效性。
其他文献
一个博士在田间漫步,看见一位老农在插秧,秧苗插得非常整齐。博士觉得老农很不简单,上前问到:“老大爷,您怎么插得这样整齐呢?”
别鲁乌图铜矿床位于内蒙古自治区。区内构造岩浆活动强烈,矿体主要产于石炭系上统阿木山组二段变质粉砂岩与板岩互层层位中。矿床成因类型为岩浆期后高中温热液充填交代型脉
正如LCD显示器的选购不能照搬CRT显示器的经验一样.其日常使用也与CRT显示器不同。针对LCD显示器自身的薄弱环节,读者很有必要在使用上加以注意,这样不但能够充分发挥LCD的性能,
毫无疑问,HTPC是PC家电化历程上的一个重要的里程碑,它有以下几大要素可胜任家电化需求:
科学家曾做过一个有趣的实验。
在这里.我要展现给大家的是两款古老的声卡——创新的Sound Blaster 16 Value以及AWE64 Gold。
菜菜最近迷上了“户外运动”,其实也就是周末骑上自行车到郊区去玩,甚是惬意,美中不足的是山路太多,下坡容易上坡难。每次菜菜都给累得够呛,不过同寝室的大雄倒是轻松自得,跟没事儿
今年夏天,所有人的目光都被热火的巨头联盟吸引,同时,也再一次将目光停留在“3”这个数字上。历数NBA历史上的"三巨头",好像没有一个组合能比目前我们看到的这支更拉风,尽管詹姆斯在加入球队时的发言非常谦虚:“我们会成为一支真正优秀的球队。”    迈克尔·乔丹    斯科特·皮蓬    丹尼斯·罗德曼    芝加哥公牛    给现在球迷留下印象最深的估计还是公牛的三人组,而如今的热火三人组也要以他们