论文部分内容阅读
矢量量化作为一种高效的数据压缩技术在数字通信、多媒体信息处理等诸多领域得到了广泛的应用。图像、视频、音频等多媒体数据具有数据量大、时空冗余度高的特点。采用矢量量化技术能够减少各种冗余,并在给定的失真条件下以较少的比特数表达和重建原始多媒体内容。
矢量量化一直与图像处理有紧密的结合。矢量量化技术最初被应用于图像压缩编码。随着图像检索研究的兴起,矢量量化作为一种图像特征提取手段开始被应用于图像检索。随着信息安全研究的兴起,近年来又出现了一批以矢量量化编码为基础的图像水印和图像隐写算法。
本论文在介绍了矢量量化的基本原理,并总结了矢量量化在图像处理中的应用现状之后,将其应用延伸至图像彩色化、图像艺术风格学习以及图像语义检索三个问题上。具体地,本论文的研究成果包括以下几点。
第一,提出了基于色度块量化的图像彩色化算法。该算法利用人眼的彩色视觉特性,对图像的色度信息进行分块及量化处理,并采用半监督学习方法根据用户手绘的示范色求解出各色度块的量化值。该算法在保证彩色化视觉效果的同时有效地提高了彩色化效率。
第二,提出了基于局部线性嵌入的图像色彩传递算法。该算法将模板图像和目标图像分割成块,利用这些图像块在一个假设的流形空间上的关系,采用局部线性嵌入算法将模板图像的色彩信息传递至目标图像中。
第三,提出了基于码书替换的矢量量化方法。该方法突破了传统矢量量化技术在编、解码端使用相同码书的做法,人为构造不相同但是具有内在关联的两个码书,分别用于编码和解码步骤。码书替换方法灵活性强,可应用于多种问题的解决,具有较大的应用价值。
第四,提出了基于码书替换的图像色彩传递算法。待着色的目标图像经过灰度码书的编码以及彩色码书的解码后即可实现色彩的传递。该算法以码书替换方法为基础,继承了图像矢量量化编码技术简单高效的特点,有效地降低了色彩传递所需的计算时间。
第五,提出了基于码书替换的图像艺术风格学习算法。目标图像经过原始码书的编码以及风格码书的解码后即完成了风格的转变。该算法同样以码书替换方法为基础,具有简单高效的特点。实验表明,该方法尤其适用于以“面”状特征为主要表现形式的风格类型。
第六,提出了基于矢量量化的图像语义快速标注与检索方法。该方法引入了图像特征码书与图像关键字码书两个码书。标注步骤通过基于码书替换的矢量量化编、解码完成,检索步骤则通过两步反查找操作完成。该算法利用了矢量量化方法引入的索引结构,一方面避免在图像库中大量重复存储相同的关键字,另一方面缩小了关键字匹配的搜索范围。本论文进一步提出了改进算法,在特征码书与关键字码书联合生成的过程中,引入对关键字出现频率的计算。从而实现对检索结果进行排序,提高用户利用检索结果的效率。