结合心理学和深度学习模型的图像情感分析方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:LINGBAOLAOLI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的逐步兴起,随着多媒体技术的高速发展,图像已经成为日常生活中人们表达自我和理解他人的重要媒介。目前,大多数计算机视觉任务都集中在教会机器像人类一样“看”,很少关注机器如何才能像人类一样“感受”,而认识人类情感是通向强人工智能的必经之路。由此,图像情感分析应运而生,主要目的是理解人类对不同视觉信息产生的情感体验。作为计算机视觉领域的重要课题,图像情感分析的进展将会推动相关领域的研究(如图像美学质量评价、风格化图像描述生成等),也会为相关应用带来积极影响(如舆情监测、意见挖掘、心理疾病诊疗等)。近年来,得益于深度学习模型强大的表征能力,图像情感分析方法的性能得到了显著提升。然而,现有方法大多集中在设计一个通用的网络来预测情感,很少关注图像情感特有的心理学先验信息。情感是人类的高级认知过程,图像情感分析也因而极具挑战,更需要不同学科知识的交叉融合。鉴于此,本文结合心理学模型和深度学习模型,设计网络模拟人类情感认知过程,针对抽象性、歧义性和主观性三大挑战,对图像情感分析问题进行深入研究,并提出相应解决算法。概括起来,本文取得的研究成果主要包括以下四个方面:1.提出了一种基于多激励感知的图像情感分类方法。现有基于深度学习的图像情感分类方法虽然取得了优越的性能,但是其中大多数做法都是对整幅情感图像直接提取通用特征,并没有考虑到人类认知中情感唤起这一特有过程。针对这一问题,受到“激励-机体-反馈”心理学模型启发,本文提出了多激励感知网络模拟情感唤起过程,用于解决图像情感分析抽象性这一挑战。基于心理学相关研究,本文选取颜色、物体和人脸作为情感激励,并设计三个特定网络有针对性地从不同的激励中提取情感特征。除此以外,本文设计了一种层级交叉熵损失,用于区分简单负样本和困难负样本。该方法在图像情感分类常用数据集上的表现始终优于现有方法,可视化结果也证明了多种激励在情感唤起过程中的重要性。2.提出了一个场景-物体关联推理网络用于图像情感分类。近来,图像情感分类方法逐步由全局转向局部,希望从细节中捕获更多情感线索。然而,不论全局还是局部,将特征不加关联地直接映射到情感类标上,都是低估了情感的抽象性。针对这一问题,受到心理学研究的启发,本文提出了一个场景-物体关联推理网络,试图从物体-物体、物体-场景的关联中推断情感,用于解决图像情感分析抽象性这一挑战。具体而言,本文首先基于语义概念和视觉特征搭建起情感图,并利用图卷积神经网络对该图进行关联推理,得到了情感增强的物体特征。为了进一步关联物体与场景,本文设计了一种基于场景的注意力机制,利用场景特征引导物体特征进行融合。在图像情感分类常用数据集上,该方法始终保持优异的性能,对情感物体概念和情感物体区域的可视化进一步证实了物体、场景和情感之间的强相关性。此外,本文方法被推广应用到了相关领域的潜在数据集中,并取得了不错的效果。3.提出了一种环状结构的表征方法用于图像情感分布学习。大部分图像情感分析的研究都集中在单类标情感分类任务上,然而在现实中,用类标分布来描述一幅图像的情感更加合理。由此,不少研究者转而研究图像情感分布。与一般的类标分布任务不同,情感类标之间存在内在联系。针对这一问题,基于Mikels心理学模型,本文提出了一种环状结构的表征方法来描述任意一种情感分布,旨在消除情感类别间的歧义性。首先,本文构建了一个情感圆环,可以将任意情感状态映射为其上的一个情感向量,并在该向量上定义了三种属性(极性、类别、强度)和两种特性(可加性、相似性)。此外,本文设计了渐进环状损失,用于由粗到细地约束情感向量。该方法在多项指标上的表现始终优于现有最优图像情感分布学习方法,对渐进环状损失的消融实验也证实了其中各部分设计的有效性。4.提出了一种基于主观性驱动的图像情感分布学习方法。现有方法大多从整体的角度来预测图像情感分布。然而,情感是主观的,不同个体面对同一张图像时可能会产生不同的情感,而情感分布正是由不同个体投票产生的有差异性的情感描述。针对这一问题,基于“对象-评估-情感”心理学模型,本文提出了主观性评估-匹配网络模拟人群情感投票过程,用于解决图像情感分析中主观性这一挑战。该网络主要包含两个阶段:主观性评估和主观性匹配。在主观性评估网络中,为了保留每个个体独特的情感体验,本文结合注意力机制建立情感记忆模块,并设计主观性损失确保不同个体间情感体验的差异性。主观性匹配网络主要由匹配损失构成,旨在将有序的个体预测值与无序的情感标注值实现一一匹配,该问题被建模为一个二分图匹配问题并通过匈牙利算法找到了最优解。在图像情感分布常用数据集的多项指标上,本文方法始终保持优异性能,对不同个体情感记忆的可视化实验进一步证实了主观性对于图像情感研究的重要意义。综上,本文结合心理学和深度学习模型,对图像情感分析问题进行探究,提出了四种模型。第一个模型从多种激励的融合中预测情感。第二个模型在此基础上进一步实现了场景-物体的关联推理,是从孤立到关联的过程。前两个模型研究的问题是图像情感分类,主要解决的挑战是抽象性。第三个模型通过建立环状结构来更好地进行情感表征,目的是消除歧义性。第四个模型从主观性角度模拟了人群情感投票过程,主要解决了主观性挑战。后两个模型研究的问题是图像情感分布学习。总结来说,本文的四个模型是从孤立到关联,从分类到分布,从共性到个性。
其他文献
随着人工智能技术在近些年的飞速发展,以深度神经网络为核心的人工智能模型在各种领域被广泛部署,如图像识别、自动驾驶、语音识别、文本识别、视频处理等。然而,深度神经网络的模型却容易受到对抗样本的攻击,攻击者在输入中加入一些人眼不易察觉的轻微扰动,却可以使模型以较高的置信度输出错误的预测结果。对抗样本的发现使得人们对深度神经网络应用的安全性产生忧虑。为了更好地将其应用于实际场景中,针对深度神经网络的鲁棒
学位
<正>襄阳东津新区第二实验小学将劳动教育作为学校发展的抓手,从打造校园劳动文化、开发劳动实践课程、建设劳动实践基地三方面不断探索,走出一条特色教育发展之路。一、打造以劳动为主题的校园文化校园环境建设是育人的重要途径,在校园环境建设中融入劳动教育可让学生置身其中,时刻受到熏陶,从思想上树立劳动意识。
期刊
智能无人系统与物联网、智能制造和智慧交通的深度融合发展,成为经济社会新的增长点,如何充分释放智能无人系统感知数据的效能,成为一个重要的问题。借助于移动边缘计算范式中的计算卸载技术,智能无人系统能够高效地完成大规模感知数据的计算任务。然而,智能无人系统所处无线网络的开放性、不稳定性为攻击者窃取智能无人系统隐私提供了便利。通过综合采用信道监听、逆强化学习等手段,攻击者利用基于深度强化学习的卸载方案中存
学位
随着互联网的高速发展,网络与人们的生活也逐渐密不可分,越来越多的企业依靠互联网出现,相应的也迎来了新的机遇与挑战。而电商行业在国家政策的影响下,也得到了空前的发展,现已逐渐渗透到大众的生活中,可电商毕竟是新兴行业,虽说前景一片大好,但电商企业的盈利模式可复制程度高且行业内竞争激烈,在这一背景下,能否准确识别出电商企业的财务风险并对其进行有效控制就显得尤为重要。本文选取P企业为研究对象,以财务风险管
学位
随着全球经济一体化进程的不断推进,全球能源危机的加剧,我国石油企业面临着严峻的挑战,可持续发展的压力和阻力不断增大。近年来,全球各国都掀起了以简化税制和降低税率为中心的税改来提升本国的竞争力。2020年伊始,一方面由于新冠疫情不断的扩张,导致全球经济发展停滞,对我国的经济也造成巨大打击,为恢复我国经济发展,国家出台了一系列优惠政策,企业在法律允许的前提下灵活运用税收优惠政策来使自身利益最大化;另一
学位
随着全球经济的快速发展,人们对能源的需求也日益增加,但由于传统化石燃料的不可再生性以及在使用过程中带来的环境污染等问题,开发新能源已经迫在眉睫。而逆变器作为风能、太阳能、燃料电池等新能源系统的重要组成部分,在能量转换和能量传递过程中起着举足轻重的作用。由于传统电压型逆变器具有输出电压只能低于输入电压、同一桥臂的开关器件不允许有直通等缺陷,在应用中具有一定的局限性。因此,本课题设计了一种数字型Z源逆
学位
车牌识别作为车辆管理和交通运输的重要手段,其创新和发展形势一直处于前进的状态中,车牌的定位和检测效率直接影响着交通管理水平。现实生活中,车牌并非只处于单一背景下,在车牌识别过程中车牌往往会处于恶劣天气、光照过强过弱以及车牌倾斜角度大等干扰环境,这些干扰因素增加了车牌识别工作的难度。本文为了提高在干扰环境下车牌识别的效率,引入深度学习的方法,在训练集中增加干扰环境下的样本数据,基于卷积神经网络实现车
学位
2022年2月24日,住建部再次为房地产发展定调,在“房住不炒”的主基调下,因时制宜给出了政策方向。事实上,相关部门的多次表态,既体现出行业出现的阶段性问题需要解决,又相当于再度明确房地产“支柱产业”地位不变。在“十四五”规划中又重提房地产定位,稳定地价、房价和预期,加强房地产金融调控,发挥住房税收调节作用。此外,还提出加大财税、金融支持力度。房地产行业受不断地调控政策以及新冠肺炎疫情的影响,不少
学位
随着我国油气资源开发的不断深入,井筒完整性问题层出不穷导致减产甚至严重事故发生。目前单一的探测方法,难以对井筒完整性多个所需的探测目标做出精准的评价。采用声波探测方法和瞬变电磁探测方法分别对测取水泥环状态与套管信息,可为井筒完整性评价提供重要依据。为了提高测井效率,单次下井就可以获取多个目标的探测信息,设计了声波电磁复合式的井筒完整性检测系统。首先基于瞬变电磁法探测原理和声波法水泥胶结质量检测原理
学位
增量学习是人工智能领域的重要研究方向之一,旨在让模型在不重复学习先前数据的情况下持续学习多个任务。随着人工智能技术的快速发展,增量学习逐渐成为智能算法应用在实际场景中的驱动力,引起工业界和学术界的广泛关注。虽然增量学习已经取得了长足进步,智能算法能够以较小的计算和内存代价持续学习多个任务并取得较好的结果,但在实际场景的应用方面仍然面临诸多需要解决的理论问题和关键技术,如增量学习中固有的灾难性遗忘问
学位