基于层次化语义信息的视觉美感质量评估

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lqzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉美感质量评估是计算机视觉领域中非常具有挑战性的问题之一。视觉美感质量评估研究是一项高层语义理解任务,涉及到多个学科的交叉,具有重要的理论价值。视觉美感质量评估的最终目标是希望计算机能够像人类一样对图像的美感质量进行感知、分析和决策,其在图像检索、图像增强、机器情感等很多领域也有着广泛的应用前景。在过去的十几年里,美感质量评估研究得到了快速地发展,但是由于图像的美感质量是一个非常主观的视觉属性,至今仍然是一个具有极大挑战性的研究热点。美感质量评估的过程中通常伴随着图像中层次化语义信息的理解。在本文中,我们利用层次化语义信息,沿着从无到有,从粗到细的研究思路,对美感质量评估中的特征表达和建模等难点问题进行了深入研究,提出了有效的美感质量评估方法,并进一步将其应用于图像自动裁剪问题。  本文围绕视觉美感质量评估问题开展了以下工作:  1.提出了一种基于深度回归模型的视觉美感质量评估方法。由于美感质量是图像的一个主观性很强的属性,所以现有手工设计的美感特征会存在考虑不全面及很难量化等问题。因此,我们提出了利用深度卷积神经网络来自动学习图像的美感特征。此外,之前大部分方法通常将图像美感质量评估问题建模为一个简化的二分类问题。为了模拟人类视觉系统对图像美感质量的打分过程,我们将此建模为一个回归问题,来预测连续的美感分数。该方法能够弥补传统特征表达能力不足和分类模型在提供美感质量信息过于简单的缺陷。  2.提出了一种基于层次化的视觉美感质量评估方法。大多数现有评估方法同等地对待处理所有图像,而没有考虑到图像内容、类型或者空间布局的多样性等问题。考虑到不同空间布局的图像有不同的美感评价标准,我们在设计美感质量评估方法时,首先在空间布局层次上将所有图像分成三种不同的类型,即“场景”类别、“物体”类别和“纹理”类别,然后在模型层次上,对不同类型的图片使用不同的深度卷积神经网络自动学习各自的美感特征,同时进行质量评估模型的训练。该方法除了取得较好的结果,而且由于模型充分利用了图像到在空间布局上的层次化信息,可以有效地减弱图像本身的多样性所带来的影响。  3.提出了一种基于语义信息的视觉美感质量评估方法。现有研究发现人类在评估图像的美感质量时,往往会同时理解到该幅图像所包含的语义内容信息。我们提出利用语义识别任务来联合学习美感特征表达,即构建一个多任务的深度卷积神经网络同时学习美感评估和语义识别的任务。与上一方法相比,该方法考虑到更细化的层次化图像语义信息,此外,为了探究美感评估任务和语义识别任务的关系,我们在该网络中加入了美感任务与语义识别任务之间的相关性约束,同时还提出了一种任务间平衡的策略进行优化求解。实验表明语义任务的辅助很大程度上增强了美感特征的表达能力,取得了很好的结果,同时也探究了美感任务和不同语义任务之间的差异,增加了美感分析的可解释性。  4.在前面三种图像美感质量评估方法的基础上,我们尝试将美感质量评估应用于图像自动裁剪研究。图像自动裁剪的目的是去掉不想要的区域,保留高美感质量区域,从而增强图像的构图和美感质量。其本质也是一种美感质量评估,即评估同一幅图像中不同区域的美感质量。在前面研究的基础上,我们提出了一种基于美感响应图的图像自动裁剪方法。在方法中,我们提出了一种美感响应图,其可以显示有区分力的影响美感质量区域。基于美感响应图和梯度能量图,我们建立了构图模型学习图像的构图规则,还提出了美感保留模型以最大程度的保留图像的美感质量。实验表明了所提出方法的有效性。此外,鉴于图像自动裁剪研究领域只有较少的公开数据库,而且还存在着数据量较少等问题。数据库的缺乏严重影响了问题的发现和有效方法的提出。因此,我们构建了一个较大规模数据集,来改善图像自动裁剪领域缺少大规模数据集的问题。同时,我们还对数据库进行了的详细分析,并给出相应的实验基准。
其他文献
集成起动发电系统(ISG)是将传统汽车中的起动机和发电机二者合而为一,该系统使汽车节油、减排、发动机控制及能源管理等方面都有本质的提升,是国际公认未来汽车部件的必然发
基于图像的三维重建是计算机视觉领域中一个重要的研究主题,分层三维重建是三维重建中的一种重要的方法。分层三维重建首先从图像匹配点得到射影重建,然后由射影重建提升为仿射
传统人工神经网络,尤其是深度学习(Deep Learning,DL)所代表的人工神经网络(Artifitial Neural Networks,ANN)在进行模式识别任务时,强调通过定义损失函数,并通过数据的不断迭代训
移动机器人的自主导航是其实现智能化的关键技术,但在复杂室内环境下传统的导航方法通常会受到有限的感知能力、较低的定位精度、严重的外界干扰等因素的限制。无线传感器网络
伴随现场总线、工业以太网技术的发展,工业控制网络已经朝着无线技术的方向发展,工业无线技术已经备受工业控制领域的青睐。但由于工业控制网络对数据传输的实时性和确定性要
学位
IPSec(IPSecurity)是一组协议的集合,为网络上传输的数据提供机密性、完整性和可认证性的保护。目前,网络中的关键节点如路由器、防火墙都支持IPSec协议。但由于IPSec协议的
随着全球一体化进程的加快,物流供应链的优化与整合业已成为影响企业竞争力的一大因素。第四方物流(the 4th Party Logistics,简称4PL)的提出正是顺应了这一需求。第四方物流
随着弹道导弹防御系统的不断发展,弹道导弹的突防面临严峻的考验。再入机动弹头(Maneuvering Reentry Warhead,MRW)变轨突防技术是弹道导弹最重要的突防技术之一。与航天飞机和通
气动技术由风动技术和液压技术演变而来,其动力介质采用的是空气,由于其环保,低能源消耗,结构简单,使用寿命长,价格低廉等优点,越来越受到人们的重视,在各种生产中应用越趋广泛。然而
学位
无人机,指无机载作业人员即可飞行的一类飞行器。因为无人机生存能力强,效费比高,使用方便,功能多样,能有效降低战争中人员伤亡而受到广泛重视,目前各国都在竞相发展无人机技
学位