论文部分内容阅读
近年来,随着多媒体技术及Internet的迅速发展,Internet上的图像资源日益丰富,传统的基于文本检索已经不能满足对这些图像资源进行管理和检索的需要,基于图像视觉特征的CBIR(基于内容的图像检索)技术应运而生。经过一段时间的发展,涌现了许多成型的实验或商业CBIR系统,CBIR技术已开始应用到许多重大研究项目中,成为目前的研究热点之一。
所有的CBIR系统都是基于图像的视觉特征来进行相似性匹配的,CBIR系统目前面临的主要问题大多和特征有关。包括特征的选择和提取、多维数据库索引、语义图像检索等等。本文中作者主要针对CBIR中特征的选择和提取进行研究。
图像的视觉特征多种多样,作者选取了其中最有代表性的色彩、纹理、形状和空间关系(布局)特征,加以具体的研究和分析。在此基础上,作者开发了一个CBIR原型系统,实现了这几种特征的提取,并在设计和实验的过程中对提取算法作了改进和完善。作者通过提取图像的色彩直方图和色彩重心来代表图像的色彩特征,通过Gabor滤波法(见3.2节)来提取图像的纹理特征,通过提取几何不变矩的方法提取图像中物体的形状特征,最后利用了在图像中划分子块的方法提取了图像的色彩布局特征。
通过提取过程获得的图像特征使用特征向量的形式存储在特征库中,通过多维索引的方式提高查询的效率。文中还讨论了利用特征向量计算图像相似性时用到的距离算法,并给出了结合多种特征进行复合查询的方法。接下来结合实际检索的结果和一些知名的实验对各种特征进行综合的比较和评价。最后对文中所做的研究工作作出了总结,提出了进一步的研究方向。
本文的主要贡献是对CBIR系统中的特征提取技术进行了深入的研究,在此基础上实现并改进了CBIR中使用到的主要特征的提取,为CBIR系统的完善和发展开辟了一条道路。文中使用的原型系统由于使用简单和良好的可扩展性,可以直接运用到相关的实际应用中去。