论文部分内容阅读
近年来随着中国画图像数字化的迅猛发展,有关中国画图像数字博物馆或数字图书馆的建立以及管理出现越来越迫切的需求,尤其是对中国画图像的处理技术成为了亟待解决问题中的关键,对中国画图像的低层特征提取、数据压缩、中国画图像语义自动标注、检索以及自动分类等的研究越来越广泛。困难之处:一是由于“语义鸿沟”的存在,在国画图像分类领域单纯利用低层全局视觉特征很难达到良好的分类效果;二是与自然场景图像不同,国画图像的特点是“以形写神”,其语义信息更加抽象和丰富,因此自然图像中常用的低层视觉特征描述子在中国画图像上的应用受到一定的限制。论文工作主要研究面向感知的中国画图像语义分类算法,主要创新点及其算法原理和实验效果如下。1.在中国画图像语义显著区域提取上,提出了一种基于低秩矩阵分解理论的图像显著区域提取算法。算法的原理是从低秩矩阵分解理论的角度出发,将图像的语义内容划分为显著部分和非显著部分。矩阵的非显著部分(即背景和干扰物)由于其内容的高冗余性,因此理论上可以对应为一个低秩结构,而显著目标具有一个或者多个特征的高差异性,因此可以对应为一个稀疏成分。以此提取出图像中的显著区域,并为满足进一步图像语义标注提供有效的表示模式。基于所提算法的显著图与其他七种算法比较结果.在目前MIT和Bruce两个眼动数据库以及MSRA数据库上给出所提出算法的实验结果:算法在低熵图像中性能较好,提出算法明显优于其他方法,提出的算法与人类视觉注意过程更一致。2.在基于语义类别的中国画图像分类方面,提出了一种基于语义视觉词包模型的中国画图像语义分类算法。算法的原理是:首先针对中国画图像的特点,利用简单的空间网格布局将输入的中国画图像划分为规则的图像子区域,并针对每个子区域在图像的每个颜色通道上提取尺度不变特征变换(Scale Invariant Feature Transform, SIFT)描述子,并将各通道的SIFT描述子线性融合构成Color-SIFT描述子,以描述中国画图像每个子区域的颜色-形状特征;其次,将自然图像场景中层表示中的视觉词包模型(Bag-of-Words, BOW)表示机制引入到中国画图像的语义表示中。针对自底向上的机制,提出一种简单有效的视觉注意力机制计算模型分析图像的显著性信息;而针对自顶向下的机制,基于中国画图像的语义类别标签,算法融入有监督学习策略,通过统计视觉单词在每个语义类别中的出现频度来对视觉单词进行语义加权,进而构建类别相关视觉单词出现频率直方图。最后,采用支持向量机分类器在所构建的中国画图像数据库上实现基于语义视觉词包模型的中国画图像分类算法。实验表明,在算法的总体性能方面,本算法在三类中国画图像语义分类的性能达到74.4%。3.在基于结构化信息的中国画图像分类方面,提出了一种多任务联合稀疏表示的中国画图像分类算法。中国画具有较为丰富的结构信息。据此提出了中国画图像结构化分析算法。其原理是:首先将一幅中国画图像分解成画主体、题跋、留白以及印章四个部分,然后根据每个部分的视觉和创作特点,提取了一系列特有的颜色和纹理特征,最后,引入多任务联合稀疏表示模型,将四个部分的特征进行了有效地融合,并对其进行分类。通过在大量的中国画图像集上的实验表明,所提出的结构分析算法能有效地对画图像进行结构分解,而基于多任务联合稀疏表示的分类策略性能也优于基于全局的分类方法。