基于视频信息的情绪感知系统的研究与实现

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:shadowyin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉一直都是非常火热的学科,情绪感知一直是该学科研究的重点,而解决情绪感知问题就是解决情绪识别问题。随着深度学习的发展,越来越多先进的理论和技术相继提出,也使得人脸的情绪识别效果越来越明显。目前,人脸情绪识别的方向主要有基于静态图片的学习预测和基于视频流的学习预测。本文是基于视频流的情绪识别,视频流对于静态图片来说数据量更大,影响因素更多,所以采用深度学习的方法进行学习预测能有效的完成任务。本论文通过搭建一个深度学习模型,再通过训练好的模型搭建一个基于Web服务的视频流情绪识别系统。本文主要内容包括:(1)介绍本论文所采用的深度学习网络,论述相关的深度学习模型理论知识,从BP算法到神经网络,再由基本的神经网络到本论文采用的卷积神经网络、循环神经网络以及3D卷积神经网络,延伸讲解LSTM网络。分析它们的应用场景与不足,介绍卷积神经网络的下采样层、核函数,LSTM的变种模型和记忆细胞等相关重要概念。(2)本论文通过音频分离技术将视频流分离出图片帧序列和音频信息。针对图片帧序列通过人脸检测模块和人脸过滤模块得到有效的面部图片,再提取出有效数据,一方面采用卷积神经网络与LSTM构建一个网络学习模型,另一方面构建单个3D卷积神经网络模型,并在原来的网络基础上对人脸检测与音频的情绪识别进行了改进。最终将改进后的模型用于训练,训练好后在AFEW(Acted Facial Expressions In The Wild)数据库上进行实验,获得了58.91%的准确率。(3)最后,通过上述的模型搭建一个基于Web服务的视频流情绪检测系统。介绍系统的流程与相关模块的功能,包括文件的上传、音频分离、人脸检测等后端功能模块。提供HTML页面用于用户访问与检测结果的显示,介绍不同页面的作用。在后台中利用消息队列实现消息订阅功能,介绍订阅结构,并利用该功能为系统提供异步处理能力与一定的解耦能力。为系统提供速度调节、优先队列机制,提高系统的处理效率。对于该系统进行基于视频流的情绪识别的测验,包括现有的数据库和摄像头采集后的数据,都能满足要求的准确率。
其他文献
<正> 1993年2季度,随着国家宏观调控措施的贯彻落实,城乡居民储蓄存款由降转升,货币供应量高增长势头得到抑制,金融形势趋于缓和。存在的突出问题是:现金投放过多,企业存款增
本文探讨枫树岛手斧文化操作链前期步骤,即石核石片或重型工具“水平去薄技术平面”技术学分析。对大型石制品制作工序、与欧洲阿舍利(mode2)文化对比研究有重要意义。
对中国小皮伞属(Marasmius Fr.)真菌进行了整理、修订,对有关分类学问题进行了简要讨论。文献记载我国该属有141个名称,分布于29个省区。其中,有效名称103个(包括96种、6变种和1变型
蛛网膜下腔出血指颅内血管破裂血液直接或通过脑室注入脑软膜和蛛网膜下腔之间,并出现一系列临床症状和体征。本文结合我院1986年6月至1998年3月收入院的72例老年蛛网膜下腔
2010年底,高检院部署开展了“对行政执法机关移送涉嫌犯罪专项监督活动”,我省检察机关以此为契机,全面启动行政执法与刑事司法相衔接(以下简称“两法衔接”)工作,结合工作实际,采取
【正】"不了解一个字一个词的意义和情味,单靠翻字典是不够的。必须在日常生活中随时留意,得到真正的经验,对于语言文字才会有正确丰富的了解力,才会有灵敏的感觉。"(叶圣陶
随着城市发展,生态环境破坏,大量有害生物侵入,给深圳湾红树林湿地造成严重威胁。综述了深圳湾湿地红树林有害生物的危害现状和发展趋势,并提出相应的综合防控措施。
【正】走进中小学课堂,合作学习似乎成为一种时尚,但调查发现,小组合作学习流于形式的较多。在教学中,教师大都采用分组的形式,让学生讨论、合作,且无论什么样的课都采用,过
企业核心竞争力由多种关键要素所构成,文化力是其中要素之一,但并非任何一种企业文化都能形成企业核心竞争力。本文辩证地分析何种形式的企业文化可能构成企业核心竞争力。
【正】语文十一册第三单元是以真情为专题安排教学内容的,本组课文如一首首心灵之歌,唱出了动听的爱的旋律,唱出了人间真情。小说《穷人》赞美了穷苦渔民桑娜与丈夫的善良;