基于VR情景遮挡人脸图像复原的表情识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ljc1007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,虚拟现实(Virtual Reality,VR)技术在智能医疗领域的应用被广泛关注,尤其是抑郁症的诊疗。VR设备通过分析使用者观看刺激材料后的面部表情,获得场景与心理的对应关系,进行抑郁症的诊断,进而在虚拟环境中进行沉浸式引导治疗。传统的视觉表情识别方案无法对被VR设备遮挡的人脸图像进行表情识别,故现有VR设备大多采用肌电传感器采集面部肌肉运动产生的电信号分析表情类别。然而额外的传感器会给佩戴者带来不舒适的体验,并且传感器采样点有限,造成表情识别准确率不高。因此,针对VR智能医疗等对使用者表情信息需求度很高的场景,以及现有VR设备通过肌电信号分析表情类别的不足,本文提出了一种基于人脸复原的表情识别算法,将问题分解为VR情景遮挡人脸图像的复原和复原人脸图像的表情识别两个子问题,以准确识别被VR设备所遮挡的人脸面部表情。本文的研究工作概括如下:1.提出一种VR情景遮挡人脸图像数据集的生成方法,使用多任务级联卷积网络(MTCNN)对VGGFace2人脸数据集进行人脸检测、人脸对齐及裁剪,Dlib机器学习库检测68个人脸特征点并使用仿射变换模拟穿戴VR设备,构建11000组VR设备遮挡的人脸图像数据,其中10000组作为训练集,1000组作为测试集。2.借鉴图像翻译的思路,设计一种人脸复原神经网络模型,将遮挡人脸图像和参考人脸图像在通道维度连接在一起作为输入,使用ResNet-50提取人脸特征向量并引入身份(ID)损失。复原后的人脸图像效果逼真,平均峰值信噪比(PSNR)为23.20,平均结构相似性(SSIM)为0.79,同时人脸身份特征得到大幅度保留,使用FaceNet计算复原人脸与真实无遮挡人脸(groundtruth)的平均相似度距离为0.6873,复原人脸与参考人脸的平均相似度距离为0.8307。3.基于已有模型设计一种适合小数据集基于帧的表情识别神经网络模型,采用10折交叉验证在标准CK+数据集达到98.8%的识别率,在复原CK+数据集达到94.8%的识别率。采用标准数据集预训练,复原人脸数据集微调(fine-tuning)的方法,将复原后CK+数据集的表情识别率提高到97.8%。通过表情7分类的混淆矩阵,分析误识别原因,并验证了表情识别模型与人脸复原模型结合使用的有效性及应用前景。
其他文献
为了获得高功率、高光束质量相干光纤激光输出,设计了一种双端输出的光纤激光器。两路光纤激光器尾端通过反射率为85%的光纤布拉格光栅连接,有一定的相互关联,利用角锥反射器
近年来,长三角地区专业市场不断兴建集聚,已取得了诸多令人瞩目的成就,但在投资环境、消费人群及市场营销等方面仍然有较大局限.本文以浙江省桐乡市为例,探讨新兴专业市场现
<正>最后我们来到坐落在融安县南部大石山中的东起乡崖脚村铜板屯。翻过山坳,眼前让人一亮,春日里的铜板屯,满山的李子花、油菜花渐次开放,整个村屯淹没在花海中,宛如一派世
目的观察血府逐瘀汤合用复方甲氧那明胶囊治疗肺心病的临床疗效。方法将120例患者随机分为两组,治疗组80例以血府逐瘀汤合用复方甲氧那明胶囊治疗,对照组40例予复方甲氧那明胶
民间教育补偿是促进教育公平不可或缺的重要途径。我国民间教育补偿的法定组织类型有两种:公募基金组织与非公募基金组织。目前,民间教育补偿在组织化、专业化和制度化等方面尚
贵州省上市公司发展较快,在贵州经济中的地位不断提高,但整体上存在数量少、规模小、产业分布狭窄、经营两极分化、后备资源缺乏等问题。随着金融改革进程的日益加快,证券市场将
以《晋陕蒙能源基地(东胜-准格尔矿区)矿区环境地质问题专题调查》课题为基础.选取东胜矿区典型区水环境调查与许价部分,论述了矿山地质环境问题调查中水体质量的评价方法和思路.
随着临床左氧氟沙星应用范围的扩大,有关其不良反应的报道也逐渐增多。为了解左氧氟沙星致过敏性休克的特点,为临床安全合理用药提供依据,查阅了1998~2008年国内相关文献,对左
灾后社会重建是一个长期复杂的过程,需要各方合力。来自灾区群众的本土志愿者,是灾后社会重建的重要内源力。本土志愿者队伍的培育,有利于发掘当地资源,带动受灾群众参与灾后重建
根据《联合国海洋法公约》,国际海底区域及其资源是人类的共同继承财产。随着海洋科技的不断进步,人类开发和利用国际海底区域的海洋活动不断增多,区域环境污染和生态破坏日