图像情感感知的计算与应用研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:cai_yankun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学、多媒体技术以及社交网络的迅速发展,图像、视频等多媒体内容的规模呈指数式爆炸增长,处理和理解这些多媒体内容的需求日益增强。相对于底层视觉特征层,人们只能够感知和理解图像、视频的高层语义层,包括认知层和情感层。以往对图像内容分析的工作主要集中在理解图像的认知层,即描述图像的真实内容,如物体检测与识别。然而,公众对数字摄影技术的广泛使用及对图像情感表达的强烈需求,使得对图像最高语义层—情感层的分析变得越来越迫切。对图像情感层的分析,简称图像情感计算,主要目的是理解观察者看完图像后所引起的情感反应。图像情感计算的发展主要受到两大挑战的制约:一个是情感鸿沟,即“可度量的信号属性即特征与人感知该信号所期望产生的情感之间的不一致性”;另一个是人类情感感知与评估的主观性,即“由于文化背景、教育程度、社交上下文等多种因素的影响,不同观察者对同一幅图像的情感感知是主观的、不同的”。本文针对图像情感计算中的上述问题进行研究,基于艺术学相关理论,期望提取更具有判别力更容易理解的情感特征;利用社交媒体数据进行以用户为中心的个性化情感预测,探索社交媒体中影响情感感知的因素;对图像情感的分布进行建模,预测一幅图像在多位观察者中所诱发情感的分布情况;研究图像情感在计算机视觉、多媒体技术等领域的应用。具体地,本文的研究内容和主要贡献分为以下四个方面:首先,根据艺术理论的相关研究,本文提出了一种基于艺术原理的中层图像情感特征,对以图像为中心的大众化情感进行预测。艺术理论由艺术元素和艺术原理组成:艺术元素是构成艺术作品的基本元素,包括颜色、纹理等;艺术原理是用来对艺术元素进行组织与排列的规则和工具,包括平衡、强调等。现有的工作主要提取基于艺术元素的底层特征对图像的情感进行识别。这些特征容易受到组织规则的影响,并且它们与情感之间的关系很微弱。因此,艺术元素必须通过艺术原理组织排列成有意义的区域与图像,来表达特定的语义与情感。本文系统地学习、表示并实现了基于艺术原理的特征,将量化后的艺术原理串联成情感特征,用来对图像情感进行分类与回归。在Abstract、 ArtPhoto三个数据集上的实验证明了艺术原理特征的有效性。其次,利用社交媒体上的数据,本文提出了一种以用户为中心的个性化情感预测方法,首次对图像情感感知的主观性进行评价。现有的图像情感数据集都是以图像为中心的,以预测图像情感的大众化情感为目的,并且图像数量很少,不能用于个性化的情感分析。本文构造了一个基于Flickr的个性化图像情感感知的大规模数据集,命名为Image-Emotion-Social-Net (IESN),包含100多万张图像和大约8000个用户。社交网络中多种因素可以影响个性化的情感感知:视觉内容、社交上下文、时间演变、地理位置等。本文提出了迭代多任务超图学习方法对这些因素进行联合建模,并且设计了一个学习算法,实现自动优化。实验结果表明,综合考虑多种因素可以有效地提高个性化情感预测的准确率。再次,本文提出了一种以图像为中心的对图像情感的概率分布进行预测的方法,从新的角度对图像情感进行建模。在Abstract以及IESN数据集上的统计发现,尽管图像情感感知呈现出个性化的特点,但整体上也服从一定的分布。基于这一观察,本文提出了基于共享稀疏学习的方法对图像情感的概率分布进行预测,并且使用迭代重加权最小二乘进行优化。对应于离散情感和维度情感两种表示方法,本文对图像情感的离散概率分布和连续概率分布都进行了处理。此外,本文介绍了多种baseline算法。实验结果表明,共享稀疏学习取得了最优的性能。最后,本文实现了图像情感在计算机视觉与多媒体技术领域的多个应用。一个是基于多图学习的情感图像检索,与传统的基于内容的图像检索不同,本文使用多图学习的方法从情感的角度对图像进行检索,并且在3D物体检索上进行了扩充;一个是基于观察者情感分析的视频分类与推荐,提出了使用观察者观看视频时表情的变化来对视频进行分析;一个是基于情感的图像配乐,为输入图像配置表达相似情感的音乐,这可以使图像更加生动,并且带领用户进入图像想要表达的世界。通过上述研究,本文对图像情感计算的各个层面进行了深入的探索,为图像情感计算所面临的关键问题提供了切实有效的解决方案。结果表明:通过引入艺术学等相关学科的研究,可以提取出更具有判别力且容易理解的特征,从而提高图像情感识别的准确率;社交媒体中图像情感的感知是个性化的,并且受到时间演变、社交上下文等多种因素的影响,综合考虑这些因素可以显著提高情感预测的性能;从概率分布的角度对图像情感进行建模,是对个性化情感与大众化情感的折中,更符合实际情况,更具有实际意义。
其他文献
医学图像配准技术是医学图像处理的基础,在医学信息融合、肿瘤生长监测、图像引导手术治疗及放疗计划制定等方面发挥着重要的作用。医学图像配准可以将各种互补的信息融合在
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
分析了传统的三维建模方法在液压支架设计中的不足,结合ProTE骨架建模和液压支架自身结构的特点,总结出一套适用于液压支架设计的骨架建模方法。并以一掩护式液压支架为例,介绍
工程质量检测中的混凝土检测方案,一直在应用破坏性的检测.虽然检测结果比较权威,但在一定程度上影响了工程的进度,需要重新修建.这样一来,在某种程度上影响了整个工程的发展
随着人们物质水平及生活水平不断的提升,自动售货机出现在商场、车站、学校、医院等场所,并进行24 h不间断服务。该文采用PLC对自动售货机系统进行设计,系统主要包含投币、饮
巴彦淖尔市田家炳外国语学校是根据2008年巴彦淖尔市政府第六次常务会议决议,在河套大学附属实验中学和市田家炳实验中学(原临河铁中)的基础上整合组建的一所具有外语特色的公
大数据在为社会发展带来新机遇的同时,也引发了个人隐私安全的保护问题。因此,需要通过把保障大数据健康发展与保护个人隐私安全相结合、加强行业自律建设与健全行业标准相结
本文介绍了间歇式沥青混合料搅拌设备配料系统的组成、指标要求以及标定和校准方法,并举例说明校准数据的计算和分析方法.
<正> 国家教育部有关负责人指出:“要正确处理‘减负’与培养学生顽强意志,刻苦学习精神关系。‘减负’要学生获得更多主动发展、培养创新和实践能力的空间,培养学生刻苦钻研
镇水神物是指古人赋予神化观念、用来镇压水害的器物.古代镇水神物种类主要有犀牛和铁牛类、神兽类、神人类、兵器类、塔楼类等.古代遗留下来的镇水神物都是珍贵的水文化遗产