基于卷积神经网络的视频人脸表情识别

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:wjief
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情识别是人工智能的重要分支,也是保证人机友好交互、计算机智能化的重要手段之一。它具有重要的理论研究意义和商业应用价值,近年来吸引大量的学者和研究机构投入到其研究中。本文对视频人脸表情识别中预处理阶段进行了分析与研究,具体工作如下:(1)针对视频序列中的中性表情帧干扰模型训练和表情识别的问题,本文对动态时间规整算法进行改进,提出一种滑动窗口动态时间规整算法(Sliding Window Dynamic Time Warping,SWDTW)来自动选取视频表情明显序列,并提出了一种结合动态时间规整和卷积神经网络的视频表情识别方法。该方法首先通过人脸检测算法截取表情视频中人脸正面帧,其次用梯度方向直方图特征计算两个序列帧之间的代价矩阵,并在代价矩阵上增加滑动窗口机制,然后根据所有窗口的平均距离最小值来定位表情视频中的全局最优序列,最后利用卷积神经网络对选取的视频帧进行分类。实验结果表明,该方法可以解决人脸表情图像受环境等因素影响较大和传统特征提取过程中存在过多人为干预的问题,有效地提高视频人脸表情分析的自动化程度和识别率。(2)鉴于2D卷积神经网络不能提取时间维度信息,将3D卷积神经网络应用到视频表情序列识别中,并针对样本量较少和类别不均衡问题,提出了一种结合数据增强和3D卷积神经网络的视频人脸表情识别方法。该方法首先通过对表情变化较敏感的眼部区域添加高斯噪声,来扩大表情之间的差异性,然后对数据量较少的表情类别样本进行几何变换,以解决样本不平衡问题。最后采用3D卷积神经网络对扩充后的人脸表情图像序列进行无监督学习和面部表情识别。在MMI和CK+(Extended Cohn-Kanade)表情库上实验结果表明,所采取的数据扩充方法可以有效解决神经网络中的过拟合问题,在增强模型鲁棒性的同时进一步提高视频表情识别效果。
其他文献
从特斯拉发布电动汽车,到推出储能产品,再到此次发布会上展出的太阳能瓦片新产品,无不看出马斯克要将清洁能源革命进行到底的决心。未来,随着各个国家对能源结构变革的致力推
随着早间电视新闻节目的发展,早间时段已经逐渐成为电视荧屏的另一个黄金时段。如何做好早间电视新闻节目?根本出路在于创新,包括"内容的创新"、"形式的创新"和"传播渠道的创新"。随
本文对比分析了贵州两所高校学生在接受英语论说文社会认知教学模式前后所写议论文的语步特征。结果显示,新教学模式下学生在立场宣示语步、立场支撑语步及次语步的使用方式
<正>当今世界竞争,说到底就是人才的竞争。全国各地纷纷出台相应政策措施,发起"人才争夺战",医院在激烈的医疗行业竞争环境下,如何稳定人才队伍、降低人才流失风险、强化医院
相信很多玩 DC 的朋友都和笔者一样,既爱好上了摄影,而又无奈囊中羞涩。在没有丰厚收入前提下,还是希望尽量利用好现有的消费级数码相机来发挥剩余价值。而在这些以实用或者
期刊
目的:通过观察中药联合拔毒祛瘀通络膏治疗糖尿病足(痰瘀阻络挟热毒证)的临床疗效观察,并对其有效性和安全性做出客观的分析与评价,为临床提供安全有效的治疗糖尿病足的新方法、新思路。方法:对于前来就诊患者(参与试验患者大部分来源于长春中医药大学附属医院内分泌代谢病科)进行筛选,根据纳入及排除标准等,选择符合条件的患者(63例)进入本试验,采用临床随机分组,分为对照组32例(因依从性差脱落2例),治疗组3
针对目前传统人脸表情识别算法存在特征提取复杂、表情识别率低等问题,提出一种基于混合注意力机制的ResNet人脸表情识别方法。该方法把通道注意力模块和空间注意力模块组成
研究了单供应商与单制造商的供应链订货问题,考虑不确定的需求和提前期,引入缺货补偿参数,建立了供应商主导的协同订货模型.对不能及时供货时供应商与制造商之间的收益补偿问题进
从体裁分析理论的视角,对比分析国内外光学类权威学术期刊论文摘要发现,国内外学术论文摘要中均普遍存在非常规语步模式。在非常规语步模式的使用总量方面,两者并不存在明显
伴随着信息、网络技术的不断发展,科技水平的不断提高,尤其是互联网的飞速发展,网络销售的概念开始被更多的企业所接受。在现实生活中我们可以发现越来越多的制造商、零售商