论文部分内容阅读
随着信息技术的飞速发展,数字图像日益成为人们生活中重要的组成部分。无论是数码照片、游戏动漫、还是最近兴起的3D电影,图像不断地以各种形式进行数字化的呈现。在这其中,数字图像,特别是计算机生成图像(简称CG)的视觉真实感(visual realism)既是影响人类感知的关键因素,也是评价各类图像质量的重要标准。因此,对数字图像视觉真实感程度进行研究成为多个领域亟待解决的问题。数字图像视觉真实感是指一幅图像同它对应的自然场景相比,图像引起的人类视觉反馈和自然场景所引起的人类视觉反馈的相似程度。它是影响人们感知的重要的图像高层属性,与人类认知视觉、认知心理学等多个领域密切相关。对它的研究将在多个领域产生十分重要的现实意义,例如,视觉真实感可以作为计算机生成图像的质量评价标准,或者用来控制计算机游戏的真实度。视觉真实感同样可以用于基于语义的图像检索和图像取证。尽管目前在多个领域对数字图像视觉真实感均有提及,但是每个领域的相关研究均具有特定的局限性,目前还没有形成一个系统的数字图像视觉真实感评价指标体系,也没有成熟的视觉真实感图像数据库。对数字图像视觉真实感的客观的、系统的评价技术也有待于进一步的完善。本论文在前人的研究工作基础上,同时采用自底向上的图像属性研究和自顶向下的人类感知实验方法,围绕若干关键问题,开展了相关研究工作。本文的主要贡献有以下几点:1.针对数字图像视觉真实感研究,建立了两个真实感数据库。其一是具有1260组CG图像和照片的人脸真实感数据库,其二是具有1260组CG图形和照片的普通场景数据库,并将建成的普通场景视觉真实感数据库在网上进行发布,以期成为一个可扩展的数字图像视觉真实感标准数据库。2.结合心理学,建立了人脸图像视觉真实感的经验感知模型。并进一步将对人脸真实度感知的研究扩展到普通场景的真实感研究上,建立了普通场景图像真实感感知经验模型。3.结合人类认知特点,研究适用于图像视觉真实感的评价特征,提出了图像真实感评价的主客观指标,并对提出的指标进行了理论分析。4.提出了基于人类认知的视觉真实感自动评价算法,并将算法的性能与目前常用的其他算法进行比较。实验结果表明,本文提出的算法比其他现有的算法更加接近人们感知。本文的创新之处主要有以下几个方面:1.对视觉真实感进行系统的分析和建模,并提出了主客观指标:本文通过一系列的心理物理实验与数据分析,提出影响人们对图像真实感感知的四个主要因素:图像自然度,图像熟悉程度,图像语义和图像美感。同时,本文进一步将这四个高层图像属性用计算机能够处理的图像特征来表征,实现了基于人类认知的数字图像视觉真实感的客观评价。2.将多个学科领域的研究方法和研究成果有机结合,用于视觉真实感的研究与分析:视觉真实感是一个较为主观的概念,它与人类认知科学、心理学等多个学科有着千丝万缕的联系。因此,对视觉真实感的研究是一个跨领域的研究,有其特有的难度。文章从认知科学的角度出发,合理地引入心理学的实验设计与信号检测论分析方法,同时采用统计学中的方差分析与假设检验对数据进行分析,并结合计算机科学中的机器学习,实现视觉真实感的自动评价。3.建立了量化的图像视觉真实感数据库:虽然目前各领域对视觉真实感都有零星分散的相关研究,但没有形成一个完整的研究体系。例如在计算机图形学领域,对计算机图形的真实感主要集中在有参考的评价,对图形的内容也局限于几种特定的场景。又如在计算机视觉领域,目前相关的主要研究在于对图像类型的区分,缺乏对图像真实度的定量分析。本文正是基于对相关领域研究现状和存在的问题的分析基础上,提出建立量化的图像视觉真实感数据库,为实现视觉真实感定量分析打下基础。