人脸表情识别的Capsule模型研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lmx1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在日常生活中,人们主要通过人脸表情来传递心理情感信息。人脸表情识别是利用构建的模型来识别人脸表情,并通过表情判断心理情感。基于深度学习的人脸表情识别在人机交互和医疗等领域得到广泛关注和重点研究,也取得了很大的进展。深度学习中的卷积神经网络对人脸表情有较好的特征提取能力,但在空间信息的提取能力方面表现不足。本文构建了基于Capsule的人脸表情识别模型,该模型主要分为三部分:提取基础特征的2-4层的卷积层,对实体特征进行表示并分类的Capsule层以及进一步优化网络的解码器结构。本文的模型利用Capsule来表征人脸表情实体,可以更好的提取人脸表情图像中的空间信息。针对本文构建的Capsule的人脸表情识别模型,本文做了两方面的优化研究。一方面是本文研究了卷积层对Capsule最终表征人脸表情实体的影响,由于不同卷积层提取的特征不同,生成原始的Capsule也不同,导致模型对人脸表情的识别性能有所差异。另一方面是本文研究了解码器对本文模型的影响。本文研究了两种方法来构建人脸表情识别的解码器,一种是基于全连接构建的解码器,另一种是基于反卷积构建的解码器。解码器是通过重构图像来优化模型,对模型进行正则化处理,防止过拟合。在本文构建的模型中,卷积层运用了Re LU激活函数,加快了模型的训练速度。为了验证模型的有效性,在人脸表情的公共数据集上进行了实验,结果表明:1.不同的卷积层对实验结果有影响,3层卷积层构建的人脸表情识别模型效果最优。2.从模型在公共数据集上的实验结果来看,基于反卷积构建的解码器是优于基于全连接构建的解码器的。3.本文构建的FERCaps-3-De模型实验结果比现有的几种算法表现更优,其准确率在CK+上达到了98.2%,在JAFFE上达到了88.3%。
其他文献
伴随着遥感技术的不断发展,遥感影像的应用越来越广泛,对影像质量的要求也越来越高,但在实际拍摄时会有很多外在因素影响数据质量,其中大气云雾的.影响最大,云雾噪声不仅仅影
随着科技的快速发展,人们的生活已经走进智能信息化时代,图像数据的获取也随着各类图像获取设备的普及而变得愈加简单便捷。庞大的数据量和复杂的数据类型促使人们更加倾向于
光载无线通信(Radio over Fiber,RoF)作为一种传输高频无线信号廉价且有效的传输技术,在5G通信中备受工业界以及诸多研究者的关注。其中,数字射频光载无线(Digital Radio over Fiber,D-RoF)技术在基站中加入了数模转换模块,增加了基站的处理功能,将射频模拟带通信号转换成数字信号调制到光纤传输系统中传输。D-RoF技术的优势在于数字光纤链路性能比较稳定,非线性
人体复杂行为识别是可穿戴和移动计算中的重要问题,使用手机进行人体复杂行为识别对于观察用户日常行为有着重要意义。目前大多数研究都集中在识别简单活动上(行走、跑步、端
国际上普遍认为,物流作为新兴的服务业,具有广阔的发展前景和增值功能。它对于有效提高整个社会的资源配置效率以及提升国家的经济运行质量、效益和动力有着举足轻重的作用。
随着科学技术的发展和人类文明的进步,现代工程实际对结构动力学问题的解决提出了越来越严格的要求。在这一进程中,结构动力学和其他学科不断渗透交叉,衍生出了许多新的研究领域,例如结构振动控制、参数识别、载荷识别、诊断预测、故障诊断和损伤识别等;对于上述领域的研究,结构的响应信息至关重要,结构动态响应重构技术便是通过结构测量处的信息重构得到结构未测量处的信息,其在许多工程领域中都有重要的实际意义和应用前景
SAR因其具有全天候、全天时和覆盖面积大等优点,在地球遥感领域受到了极大的关注,近些年来发展迅猛。随着SAR技术的发展,应用场景的不断扩大,获取的SAR图像数量与质量均有了
风电叶片是风力涡轮机关键核心部件之一,它对风力涡轮机的效率和运行安全尤为重要。光纤布拉格光栅(Fibber Bragg grating,FBG)传感器具有灵敏度高、抗腐蚀、抗电磁干扰、波
视觉追踪是计算机视觉领域中的一个重要研究方向,广泛应用于人机交互、工业机器人、视频监控、智能交通等领域。随着人工智能的发展和视频设备的普及,对视觉追踪的研究变得日
室内定位是基于位置服务的技术基础,对人类生活产生日益显著的影响。如何对室内人员进行实时,廉价,灵活便捷,精度高的室内定位已成为当前的研究热点和难点。本文首先介绍基于