论文部分内容阅读
基于内容的图像检索是一个综合了数学、电子学、计算机科学、人工智能、模式识别等各门学科的研究领域,是一个前景十分广阔而重要的应用领域。其主要思想是根据基于图像视觉内容的特征如颜色、纹理、形状和空间分布等信息,提取图像的特征向量作为索引进行相似性检索。商标是商品的一个重要标识,代表了商品的质量与生产厂家的信誉,在市场经济中起着重要的作用,而基于内容的图像检索技术在商标图像领域得到了广泛的应用,商标图像检索实际上是图像检索的一个子问题。本文对现有的基于内容的商标图像检索方法进行了分析,提出了一种新的商标图像检索方法,并设计开发了一个基于文本和内容的商标图像检索系统。针对二值商标图像单色的特点,一般利用形状特征对其进行检索。关于形状的统计值,可以用矩特征来表示。在图像处理中,矩可以作为一个重要的特征来表示物体,据此特征来对图像进行检索等操作。本文对基于形状特征(Hu不变矩、Legendre矩、Zernike矩、伪Zernike矩)和模糊方向特征图像检索的多种方法进行了实验对比。用PVR指数作为图像检索性能评价准则。结果表明,在基于形状特征的检索中,Legendre矩、Zernike矩和伪Zernike矩的检索性能优于Hu矩;基于模糊方向特征检索的效果优于Hu矩;在相同维数下,伪Zernike矩的检索效果最好。随着矩阶数和特征维数的增加,虽然加强了图像的描述能力,但同时也带来了信息冗余和维数灾难等问题,加上高阶矩比低阶矩受噪声的影响大,因而并不是矩的阶数越高,检索的效果越好。通过实验,我们探讨了Legendre矩、Zernike矩、伪Zernike矩和模糊方向特征的最佳维数。由于利用单个特征进行图像检索,未必有足够多的区别性信息,为了进行最佳的检索,当有众多特征使用时,可以将多个特征进行融合,我们提出融合多个特征的新方法来进行检索,并通过本文实现的商标图像检索系统进行了实验,对比实验证明该方法的检索效果优于单个特征的检索。因为图像检索系统的最终用户是人,因此通过交互手段来捕获人对图像内容的理解是相当重要的。在系统中增加文本信息,即增加用户对图像的理解进行检索,实验证明,基于文本和内容的检索效果是最符合人眼的视觉感受的。