基于多特征描述的双模式学习图像情感识别

来源 :云南大学 | 被引量 : 0次 | 上传用户:ly110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的情感识别是一项复杂并具有挑战性的研究课题,现在通常将图像情感识别应用于人机交互,舆情分析等方面。如何跨越图像特征和人类情感之间的鸿沟是本课题的主要研究问题。本论文在卷积神经网络的基础上提出了一种基于多特征表达的双模式学习图像情感识别算法。该算法中利用多特征描述算法提取更为丰富、充足的图像特征来描述图像的情感,同时辅助双模式学习网络来学习不同特征之间的关联,以此来弥补图像的低层基础特征和高层语义信息之间的鸿沟,从而达到跨越图像特征和人类情感之间鸿沟的目的。论文的主要工作如下:1、新的图像情感数据集的建立缺少干净的标记情感图像数据是现在图像情感识别中面临的严峻考验。本文利用关键字从Flickr网站中获取了积极的和消极的两种情感极性的图像数据。利用半监督学习的方法对获得的图像数据进行分类,从而获得具有准确标签的图像数据。2、数据的清洗不管是在使用本文建立的图像情感数据集,还是使用现存公用的图像情感数据集,由于标注过程中图像和对应标签之间相关程度不容易度量的原因,图像情感数据集中还存在图像和对应标签弱相关的问题。本文采用渐进神经网络(PCNN)对图像数据进行清洗,挑选出与标签相关性较强的图像数据。3、图像的多特征描述图像特征在计算机视觉研究领域内是用来描述图像的最有效方式,对于图像情感而言,越为丰富的图像特征能够从更全面的角度描述图像的情感。在本文研究中发现,图像的情感与众多因素有关。首先,图像的前景信息包含图像的目标信息,可以提供高级的语义信息。其次,图像的背景部分因为缺少了图像目标,可以提供一些低层的基础特征,例如颜色,纹理,形状等特征。本文提出的多特征描述算法利用不同深度的卷积神经网络分别提取图像的不同层次的特征来丰富用于描述图像情感的特征。4、弥补图像和情感鸿沟丰富的图像特征是用于描述图像情感的一种基础方式,但是人类情感更加主观,往往需要对这些图像特征进行组合分析后才能理解一幅图像的情感,因此,在图像的特征和人类情感之间还存在巨大的鸿沟需要跨越。本文提出一种双模式学习网络,模拟人类能够同时分析两幅图像的机制,学习不同图像及特征之间的相似点和不同点,以此来弥补低层基础特征和高层语义信息之间的鸿沟。通过学习不同等级特征和信息之间的加强特征,能够有效地提升图像情感识别效果,建立图像特征和人类情感之间的关系。论文通过以上四个方面进行研究。实验结果在本文建立的图像情感数据集,Twitter2 数据集,ArtPhoto数据集以及Flickr_LDL数据集上验证PCNN网络能够有效筛选出和标签强相关的图像数据,多特征描述算法提供的更为丰富的特征描述有效地改善使用单一特征描述图像情感的问题,双模式学习网络能够帮助建立图像特征和图像情感间的关系。通过以上的算法和方法,能够有效提高图像情感识别的准确率。
其他文献
目前社会及学术界对单身现象的认知呈现一种性别对立的二元结构态势,即认为男性单身主要分布在社会底层农村社区,以被动型单身为主;女性单身主要分布于城市社会,以主动型单身为主。大理州鹤庆县彝族支系“白依人”社区所呈现的“女性单身”现象对此二元结构认知模式提出了质疑,因此对白依人单身现象的研究有助于突破我国当前对“单身现象”已经固化的认知局限,对科学的审视我国“单身现象”具有重要意义价值。此外学术界对于单
随着固态盘(Solid State Drive,SSD)应用的普及,其正在逐步替代磁盘成为主要的存储设备,与此同时,基于固态盘的全闪存阵列系统(Redundant Array of Independent SSDs,RAIS)也被广泛应用。然而,RAIS5上严重的小写问题,包括读改写和重构写,不但严重影响阵列小写性能,还导致阵列级别的校验块和数据块损耗不均,进而影响全闪存阵列的可靠性。针对小写请求
糖尿病性视网膜病变(Diabetic Retinopathy,DR)作为糖尿病的主要并发症之一,如不进行及时诊断和治疗,可能会导致视力障碍和失明。通过定期眼科检查和及时治疗,可以减少DR患者
近几年随着深度学习算法的深入研究,特别是在人脸识别和智能驾驶等领域落地,深度学习算法及其应用已逐渐成为现实生活中不可或缺的一部分。在保证一定检测速度的条件下,神经
随着信息社会的快速发展,单一功能的Web API己越来越无法应对复杂的业务需求,Mashup通过集成多种功能的API来满足业务需求,已经成为应对当前挑战的重要手段之一和推动API经济繁荣的重要驱动力。面向Mashup的API推荐研究旨在依据应用开发需求,有针对性地推荐API组合,从而为开发者提供技术支持,提升开发效率。近年来,WebAPI生态系统积累了大量可用于增强API推荐模型的知识,但目前在这
传统基于磁盘的存储系统由于具有机械部件,在性能上很难满足大数据时代应用对存储系统的需求。随着存储技术的迅速发展,一系列读写速度比磁盘更快的新型存储器开始出现,如基于闪存的固态盘(Solid State Drive,SSD)、非易失内存(Non-Volatile Memory,NVM)等。然而,现有基于磁盘的系统软件并没有考虑到固态盘和非易失内存的自身特性,如果直接用在固态盘和非易失内存上无法充分发
禁毒社会组织是统述性的话语概念,主要服务对象是出戒毒所后或未达强制收治条件的社区戒毒社区康复吸戒毒人员;主要工作内容是通过毒品预防、心理干预、宣传教育、就业扶持、
上世纪九十年代,随着互联网时代的开启,世界经济的全球化进程突飞猛进。国际上众多大型企业开始了全球化的战略布局,中小型企业也不局限于狭小的地理空间。自此,现代化企业的创新模式与战略受到新的挑战。在这三十年左右的进程中,不但企业的创新实践高歌猛进,关于创新的理论也得到了深远的发展。“分布式创新”(Distributed Innovation)作为一种新兴的技术创新战略模式,调和了企业扩张的需求和资源的
随着科学技术的发展,各种可穿戴智能设备和便携式移动设备的普及,群智感知技术具有广泛应用。在群智感知中,感知平台收集到大量的个体行为数据供研究人员进行个体行为识别技
行人比对是计算机视觉领域中重要的课题。在这篇论文中,我们处理了由于摄像头视角变化或者行人姿态变化所产生的空间错位问题。我们首先设计了一个迭代更新的算法来学习出一致性结构,该一致性结构中包含了目标摄像头组所采集到的行人图片小块之间的匹配概率。学习得到的一致性结构不但能够捕捉到摄像头组的空间一致性模式,而且可以处理行人图片之间的视角和姿态变化。我们同样引入了一个基于约束的全局匹配过程,这个匹配过程在一