基于深度可分卷积神经网络的实时人脸表情和性别识别

来源 :计算机应用 | 被引量 : 0次 | 上传用户:qq1036191963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前普通卷积神经网络在表情和性别识别任务中出现的训练过程复杂、耗时过长、实时性差等问题。提出一种深度可分卷积神经网络的实时人脸表情和性别识别模型。首先,利用多任务级联卷积网络(Multi-task convolutional neural network,MTCNN)可对不同尺度输入图像进行人脸检测,并利用核相关滤波(Kernelized correlation fiters,KCF)对检测到的人脸位置进行跟踪进而提高检测速度。然后,设置不同尺度卷积核的瓶颈层,用通道合并的特征融合方式形成核卷积单元,以具有残差块和可分卷积单元的深度可分卷积神经网络提取多样化特征,并减少参数数量,轻量化模型结构。使用实时启用的反向传播可视化来揭示权重动态的变化并评估了学习的特征。最后,将表情识别和性别识别两个网络并联融合,实现表情和性别的实时识别。实验结果表明,所用网络模型在FER-2013数据集上取得73.8%的识别率;在CK+数据集上的识别率达到96%;在IMDB数据集中性别分类的准确率达到96%;模型整体处理帧率达到70帧/s。与结合支持向量机的全连接卷积神经网络方法比,有着1.5倍的提升。因此针对数量、分辨率、大小等差异较大的数据集,该网络模型检测快,训练时间短,特征提取简单,具有较高的识别率和实时性。
其他文献
[背景/目的]乙肝病毒(HBV)是肝病毒科的一种嗜肝DNA病毒,全球约3.5亿人感染乙肝。尽管目前疫苗接种非常安全、有效,但发展中国家慢性HBV感染率仍较高,HBV病毒的感染可导致多
弓形虫(Toxoplasma gondii)是一种机会致病性原虫,可以引起世界性的人兽共患寄生虫病。弓形虫病主要有三种感染途径:经口感染,血液感染和胎盘感染。弓形虫速殖子可以广泛入侵
主动红外摄像机和被动红外摄像机是夜视监控的重要产品,但二者在工作原理以及应用范围等方面有很大的不同,本文对主动和被动红外摄像机的原理及其应用进行介绍。
女权 ,是指女子在社会上应享有的权利。几千年的封建社会中 ,男权一统天下 ,对女性实行愚化政策 ,使得一些即使有优越的成才条件的女子也甘愿以男子为中心。而李清照却能在她
针对涤纶短纤维后加工拉伸工序,在采用杜邦工艺实际生产时的4个关键控制要素,拉伸温度、拉伸速度、拉伸倍数分配、拉伸点等,对产品的断裂强度、断裂伸长、缠辊次数等品质指标
随着碳纳米材料的快速发展与广泛应用,它将不可避免地进入环境.为了探讨碳纳米材料与环境有机污染物共存下的生态风险,研究了胶体富勒烯nC60与菲共存时对水稻发芽、生长和生
通过在Jacob假定下推导储水率与多孔弹性介质的物理力学常参数之间的联系,发现储水率的骨架弹性贡献部分为与时间无关的常数.进一步推导发现地面沉降与地下水头降深之间具有
长期以来,学界对苗族史诗的分类模糊不清,或以"苗族古歌"概而论之,或借用别的民族史诗分类方法来套在苗族的史诗分类上,无法反映出苗族史诗分类的科学性。从已经出版和抢救记
现代医学认为,脑卒中是指脑局部血液循环障碍所致的神经功能缺损综合征。中医认为半身不遂、口舌歪斜、偏身麻木等症状是"中风"后的表现[1]。在中风之后,大脑的控制信号不能
元素汞(Hg0)是最具危害的环境污染物之一,如何高效控制其排放已成为大气污染控制领域又一大难点问题。光催化剂二氧化钛(TiO2)因其高效的低温催化性能而被用于Hg0的脱除,但反应温