基于特征融合与深度学习的表情识别技术研究

来源 :北京建筑大学 | 被引量 : 0次 | 上传用户:CYQWWL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的快速发展,人脸表情识别的重要性也愈发明显,其在安全驾驶、智能人机交互、案件侦测、游戏革新等领域有广阔应用空间,已经成为了研究热点。传统的表情识别方法特征提取复杂,受环境影响大,识别精度低;深度学习的表情识别方法提取的特征表达能力不足,识别精度不够高,模型参数量大。本文基于特征融合与深度学习对人脸表情识别方法进行研究,主要研究内容如下:1.模型提取的特征好坏直接影响表情识别效果,针对不同表情数据类别间的特征差异度小,网络提取的特征缺乏针对性的问题,提出一种在数据预处理阶段增强图像特征信息的方法。通过局部二值模式与离散余弦变换分别获取表情图像的局部特征和全局特征,把两组特征加权融合后重组数据集,增强面部表情相关特征信息,减少冗余信息的干扰;把增强后的数据集通过残差网络进行分类识别,使模型提取到的特征表达能力更强。相比于原表情数据,在JAFFE数据集上识别率增长了0.45%,而在CK+上减小了2.02%,该方法的有效性和实用性有待提高,需进一步研究改进。2.针对现有的卷积神经网络模型算法特征提取能力不足、识别精度不高、模型参数量大的问题,提出了一种融入注意力的残差网络人脸表情识别方法。首先通过特征融合方法对卷积块注意力模块进行了改进,提升了其对表情关键特征的增强能力;将改进后的注意力模型融入残差网络,在模型特征提取阶段先增强判别性表情特征表达,再通过卷积层去提取表情特征,提升了模型特征提取性能。通过实验对比,在网络中融入注意力后,模型以较小模型参数量的增加有效提升了表情识别率;卷积块注意力模块改进后,其模型识别效果和稳定性也得到了进一步提高,在FER2013和CK+数据集上分别提升了2.68%和6.06%的识别率,证明了该方法的有效性。3.通过对注意力机制的进一步研究,针对当前注意力模型参数量大,性能不佳的问题,构建超轻量级的双池化通道注意力模型。模型采用一维卷积方式捕获跨通道交互信息,利用双通路特征向量相加融合的方法增强性能,优化了通道重要度权重获取方法。实验表明,模型融入残差网络后,以可忽略不计的参数增加量在CK+和JAFFE上提升了4.14%和6.07%的识别效果,验证了该通道注意力模型的有效性。通过该通道注意力模型结合空间注意力构建超轻量级双注意力模型,通过加入捷径连接稳定模型性能。与改进版的卷积块注意力模块相比,在模型融入网络后的参数量减少了近3M,在表情识别性能上保持稳定并小有提升。
其他文献
学位
学位
我国改革开放以来,政府强调的区域发展战略、提速城镇化建设工作进程、人口迁移等变化导致犯罪情况复杂,国内频发型犯罪案件(例如:抢劫盗窃、冲突纠纷、刑事损害等)整体呈现出“高发低破”的态势,给国家带来人力、财力、物力等多方面的不必要损失,严重影响社会正常秩序。频发型犯罪本身作为一种普遍的社会现象,在时空中的分布并不是随机的,而是在其发展过程中表现出一定的历史规律性。“日常活动理论”指出,犯罪活动总是与
结构的损伤、疲劳、断裂和破坏是在土木、水工、交通、航天、航空、机械等领域经常遇到并且尚未得到很好解决的难题。其中材料的应力应变求解都是基于经典的连续介质力学和热力学理论进行的。经典弹塑性理论的基本假设之一是Saint-Venant变形协调条件。物质微元在受力变形过程中要满足Saint-Venant变形协调方程。物质变形的协调性是由物质的连续性所决定的,它假定物质没有出现位错、旋错等缺陷。然而,对于
医院地区往往是交通拥堵常发地带,核心矛盾在于有限空间难以满足不断增长的私人车就诊出行需求。创建适宜的医院周边慢行环境引导公众出行逐渐向绿色出行方式转变,是解决医院周边交通问题的路径之一。本次研究构建医院周边出行环境服务水平评价体系,采用视频摄像和问卷调查方法开展评价,并设计绿色就医出行意向调研问卷,探究周边建成环境与就医出行行为意向之间的影响机理,得出医院周边慢行交通出行体系配置及优化方向,并提出
防屈曲支撑框架(Buckling-restrained brace frame,简称BRBF)结构是高效的抗侧结构体系,但高层BRBF结构斜向BRB分解产生的轴力累积于底柱,易造成底柱破坏。摇摆结构体系是一种放松上部结构与基础间约束或构件间约束,使接触面处仅受压而不受拉,确保结构在地震作用下可以抬起,并通过回复机制复位形成摇摆行为的新型结构体系。结合BRBF和摇摆结构特点,在BRBF底柱安装摇摆柱
城市典型地物要素是城市规划、建设和管理中的重要基础地理信息,可以为城市土地利用调查、城市精细化管理、空间规划等提供基础数据支持。目前,深度学习技术已经广泛应用于基于遥感影像的城市建筑物、道路等地物要素的提取,其中,输入卷积网络模型用以训练的地物要素样本则是决定基于深度学习的信息提取成败的关键因素之一。国产高分卫星的迅速发展为基于高分影像的地物要素的提取提供了更多可用的数据资源。针对目前基于国产GF
近年来,我国市政给水管道基础设施发展迅速,但管道发生破坏和泄漏的情况仍很严重,漏水率一直处于一个较高的水平。给水管道泄漏会导致水资源浪费、经济损失以及存在潜在的污染风险。源于低压管道微小泄漏孔的微小、低压的慢性泄漏,长期不被注意且难以发现,因此,对给水管道慢性泄漏的及时准确检测和定位,对解决管道泄漏问题具有重要的实际意义。根据实际管道搭建了管道仿真模型,模拟了在不同流速、压力、泄漏孔径时,泄漏管道
文创产品指的是基于文化创意,经设计和制造加工形成的一种实体化的具有文化内涵的产品,同时,大多数有影响力、得到广泛传播的文创产品,往往有着比较深刻地精神消费特性,由此满足大众精神层面的需求。全程创意生产观这一理念的提出,是建立在文创产品不断发展和创新的基础之上的,其指的是从生命全程视角对文创产品的价值开发和设计进行审读,通过巧妙地整合创意元素,并适当添加场景、故事等的空间素材或时间素材,赋予产品更深
学位