视频驱动的动态情感分析

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 4次 | 上传用户:liongliong600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能、计算机视觉和人脸相关技术的快速发展,智能机器人在各领域的广泛使用,人们希望计算机拥有人一样的情感,理解人类意图的渴望越来越强烈。人脸表情作为人类最重要的生物信号和情感信号,在人机交互、医疗诊断、机器人制造、侦查审讯等领域有重要的应用价值。如何精准理解人脸表情,自然引起人工智能研究者的广泛关注。传统的表情识别方法主要基于手工设计的特征,近年来深度学习技术快速发展,基于深度学习的识别算法成为表情识别任务的主流方法。视频表情识别任务主要关心如何融合视频帧音频等模态得到视频级表情特征。之前的研究方法未考虑视频帧的重要程度,基于此本论文提出基于注意力机制的表情识别框架,能赋予不明显的表情帧较低的权重,明显的表情帧较高的权重,从而得到鲁棒的视频级表情特征。本方法在CK+数据上达到99.69%的准确率,取得目前最好的识别效果。在AFEW上取得51.181%的准确率,接近最好的结果。近几年来,多模态表情识别领域进步飞快,2011至今举办的AVEC国际情感识别竞赛主要关注音频模态、视频模态的情感识别能力和两种模态融合方法。2013年举办至今的EmotiW国际情感识别竞赛主要关注真实场景挑战下情感识别的能力。本论文提出一个多模态表情识别框架在EmotiW2018比赛视频表情识别任务取得第九名,高出BaseLine17%。让计算机学会表情分类需要大量数据,且数据要反应场景的复杂条件。目前表情数据主要来源于实验室采集的表情和电影剪辑出的表情数据。实验室采集的表情缺乏真实场景的光照,遮挡和姿态条件,表情不够丰富,而且大规模采集的成本高。电影剪辑的表情数据,虽然包含复杂的背景信息,但过于夸张与生活的表情不同。基于此本论文建立大规模、标注可靠、反应真实场景的表情数据库。标注表情数据库会面临主观偏向的问题,不同表情数据库之间的差异会更大。因此设计算法减少数据标注主观性影响,是我们今后的研究方向之一。此外标注AUs的成本很高,所以这类的表情数据较少。如何利用图片表情数据提高AUs检测的性能是我们下一步的研究重点。
其他文献
动物谚语及其反谚语在交际活动中扮演着多重角色。本文总结了动物反谚语的构成规律,从语用学的角度探讨动物谚语及其反谚语在交际活动中的语用功能,旨在帮助英语学习者真正理
为评估大跨度单层空间网格结构的连续性倒塌动力效应,并确定此类结构静力分析时所采用的荷载动力放大系数,构建了单层空间网格结构抗连续性倒塌的单自由度子结构模型,推导出
<正>肝硬化门静脉高压并发食管胃静脉曲张破裂出血(esophageal gastric variceal bleeding,EVB)是临床常见的危急症之一。尽管近10年来药物及内镜治疗成绩显著,但其6周内病死
近年来,随着用药种类和不合理用药的日益增多,药物性肝损伤(DILI)发病率及病死率日益增高。DILI发病机制复杂,可能涉及药物的直接肝毒性作用、免疫介导性的肝损伤、线粒体损
在实验室建成了10kg/h的固体热载体新法干馏连续实验装置。在此装置上进行了粉末状的桦甸和茂名油页岩、平庄、黄县、先锋、昌宁和罗茨等褐煤试验研究。油页岩干馏温度为500
波音787飞机是美国波音公司推出的最新型号的民航飞机,该机集多种新技术于一体。由于大量采用新技术,使该型飞机在航线短停维护时与其他波音系列飞机存在不少差异,需要维护人
<正> 一、煤液化的概述 (一)煤液化的必要性七十年代初期整个资本主义世界发生了石油危机的问题,使一些工业发达的国家对煤液化成为石油的课题又被重视起来。对我国来说,由于
本文从项目化管理的内涵解读入手,阐述了项目化管理在大学生志愿服务活动中的实施步骤、实践意义以及实施注意事项,以期推进大学生志愿服务事业的健康发展。
主要讨论了固定矫治器应用中釉质脱矿的可能危险因素,认为唾液的酸碱度、唾液的缓冲能力、微生物、酸蚀剂及口腔卫生维护都能对釉质脱矿产生一定的影响,其中酸蚀时间与操作及