论文部分内容阅读
随着多媒体和互联网技术的不断发展,越来越多的图像是以嵌套在web文件上的形式存在,web图像的数量和种类也在日益的增多。从这些海量的图像中找到自己想要的图像是越来越困难,但是web文件本身就包含了不少嵌套图像的高级抽象语义信息,并且web图像也是普通图像,它本身也包含一些丰富的内容特征语义,如何充分地利用web图像的这些信息,来提高web图像检索的性能是研究的热点之一。 论文首先分析了web图像文本的全文索引加剧了模糊性,针对这个问题而提出了用改进的方法来提取web图像的中文文本信息来缓解这种模糊性的问题,并用实验的结果来说明了改进的文本提取方法确实对中文标注的模糊性问题起到了一定的缓解作用;然后根据web图像本身的颜色特征信息以及图像颜色语义信息的分布情况,提出了用两种新的图像分割的方式来提取图像的颜色特征向量,并用实验的结果来表明综合这两种新的图像分割方式确实提高了图像检索的性能;最后用前两部分研究的成果对图像的两种语义进行了初步的融合,实验数据表明初步融合的检索性能比不融合的检索性能要有所提高。在最后一部分中还综合考虑了在初步融合分类的基础上图像之间相关性的理论,在相关性理论的基础上和人工干预下对图像进一步地排除、过滤和合并,接着用图像的纹理和目标形状特征对分类。