复合余弦增强损失的多视角表情识别及姿态估计研究

来源 :长安大学 | 被引量 : 0次 | 上传用户:dotnetgroup
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着模式识别和人工智能的发展,多视角面部表情识别及姿态估计成为了计算机视觉领域研究的重点,主要应用在人机交互、临床医学、视频监控等领域。近年来,人脸表情识别主要研究数据库正面图像,并取得了不错的成绩,但对具有复杂环境和背景、多姿态的面部图像识别效果不佳。因此,在复杂背景下搭建泛化性好、鲁棒性强的多视角表情识别模型具有很大价值,其中面部姿态在表情识别过程中充当重要角色,而这也对人机交互具有重要意义。目前,对于多视角表情识别主要应用模型分步完成,尽管泛化性有不错的效果,但整体模型结构较大、步骤繁琐、实用性较差。综上,本文提出复合余弦增强损失的多视角表情识别及姿态估计网络,实现表情及姿态同步识别,解决复杂环境下识别率不佳和分步模型较大等问题。本文实现多视角面部表情识别及姿态估计。首先,搭建多分类识别的深度网络框架;其次,以卷积神经网络(Convolutional Neural Network,CNN)为基础,结合现有高性能深度网络结构,自主设计用于多视角表情识别及姿态估计(Convolutional Neural Network for Multi-view Facial Expression Recognition and Pose Estimation,M-EPCnet)的端到端多分类模型。然后,针对传统Softmax损失下深度网络训练效果和识别性能不佳等问题,引入角度空间下的余弦损失对特征进行描述。其中,加入类间角度裕度参数和超球面缩放因子,以训练出具有高类内紧性、低类内差异的模型分类器,进一步提高多分类识别效果。再者,通过二分类可视化例子对改进的余弦增强损失(Cosine Enhancement Loss,Cos EL)的几何意义进行解释,进一步推导多分类的情况。最后,采用自适应调节学习率的优化方式对网络进行训练,使其损失变化更加平缓,同时提高模型性能。在不同数据库上对多分类模型进行实验分析,结果表明本文模型在CK+库上识别准确率高达99.06%,在BU-3DFE、Multi-PIE库上表情识别率分别为87.98%、85.77%,姿态估计率为99.07%、85.95%,与现有方法相比,本文模型具有很好的性能,从而验证本文方法的特征有效性和模型泛化性。因此,本文模型不仅结构新颖,而且实现表情、姿态同步识别,也能达到同类型方法的效果,尤其在多视角复杂人脸中具有一定的优势。
其他文献
机载激光雷达是集激光测距、全球定位系统(GNSS)和惯性导航三种技术为一体的三维直接探测技术,是当今社会最具发展潜力的地理空间信息获取技术之一,可以主动快速地获取地表密集三维点云数据、反射率、纹理等信息,弥补了传统测量、航空摄影测量等技术手段存在的不足。面对海量点云数据,如何有效提取建筑物,剔除植被、路灯、公路等与建筑物无关的点云数据,为城市测绘、智慧城市建设等领域提供基础数据,是人们最为关注,也
国家确立的战略性新兴产业中的生物医学、可穿戴电子设备等多个领域对于微/介观尺度的聚合物基周期性表面微结构有着广泛需求,其制造问题也一直备受关注。课题组提出的利用声表面波激励下光敏液膜表面的毛细波变形结合紫外光固化的微结构阵列的“声模”微成形制造方法,具有制造周期短、无需使用实体模具等优点,成为聚合物基微结构阵列制造的新途径。然而,当前尚缺乏关于聚合物基微结构阵列的声模成形制造机理分析与局域化成形研
基于光辐射力的光镊技术是利用光与物质相互作用产生的光势阱效应,在微纳尺度上操纵微粒和进行微小力学测量的一门技术。目前,光镊技术具有纳米级位移和飞牛量级的测量精度,
随着移动互联网技术的快速发展和智能终端设备的普及,基于位置的服务(Location based Service,LBS)已成为最受欢迎的移动互联网服务之一。各种各样的位置服务为人们生活带来
目的:探讨Child-Pugh分级联合ICG(Indocyanine green吲哚菁绿)测定、残肝体积测量对于被诊断为肝细胞癌合并有肝纤维化的病人,在围手术期内发生肝功能失代偿事件的预测价值。
自改革开放后,我国钢铁行业一直快速发展。目前,我国已经成为钢铁产能大国。近几年来看,我国钢铁市场的产能扩大,市场供给大于需求,所以厂商们都纷纷把目光投向了国外市场,由
在研究人类的遗传病时,全基因组关联分析(GWAS)是一种常见的分析方法。该方法一般通过识别高密度的的分子标记,对上百万甚至上千万个单核苷酸进行多态性标记(SNP),再通过考察SNP与特定疾病的关系来筛选出致病基因。目前,GWAS已经帮助科学家筛选出Ⅰ型糖尿病、Ⅱ型糖尿病、冠心病等多种复杂遗传的基因位点。由于高通量测序技术的诞生,该测序技术使得测序成本与第一代相比大幅下降,低廉的成本激发了人类对超高
导学案是经教师集体研究、个人备课、再集体研讨制定的,以新课程标准为指导、以素质教育要求为目标编写的一种学习方案。导学案主要用于引导学生自主学习、培养学生自主学习能力,提高学生的课堂参与率,提高课堂的教学效率,形成比较融洽的师生互动。2017年海南省开始全面的执行新课标,对英语阅读教学提出语言知识学习、语言技能发展、文化意识形成和学习策略运用的四大要求,同时导学案在全国运用已经有十几年的时间,在诸多
随着无线通信和低功耗嵌入式技术的发展,智能可穿戴设备正逐渐进入人们的日常生活。传统的智能设备在一定程度上都存在续航时间短的问题,而传统的智能穿戴设备只能在电源附近完成充电,并且充电时间较长,严重影响了使用者的体验。本论文提出一种采集人体运动产生的机械能的方法,为解决可穿戴设备续航短的问题提供一种可行的方法。为了达到采集人体运动机械能,并给低功耗可穿戴设备供能的目的,本文提出了一种新型结构的压电-电
随着我国经济实力迅速提升,建设高压大容量电力网络系统,发展大规模、远距离输电,提高电力输送容量,增强供电可靠性,改善电能质量,必然需提高电力电子装置变换电压等级。模块化多电平变换器具有模块化、可冗余、输出波形质量好等特点,在柔性直流输电领域应用广泛。随着电压等级不断提升,变换器子模块数量会大量增加,不仅使系统增添大量硬件,需耗费大量运算资源,调制复杂度随着MMC子模块数量增加而上升,并且难以实现变