论文部分内容阅读
Logo作为企业的一种重要标志,在查询带有Logo标志的企业信息时,Logo识别将发挥重要作用。尤其是,随着数字化信息技术的发展,人们可以利用智能手机等移动设备随时随地获取一张Logo图像,并希望通过Logo图像获取相关企业的信息,因此Logo图像的识别就显得愈加重要。而在实际应用中,Logo总是被图像的其他内容所包围,直接利用带有Logo的图像来检索相关信息时,结果往往不太令人满意。因此,本文提出一种基于图像的多类型的特征检测Logo区域、并进一步基于图像检索技术实现Logo识别的方法。首先,在一个带有类标签的Logo图像数据集里,经过对Logo图像归一化处理后,提取所有Logo图像的多种类型的特征,基于这些特征训练一个分类器。实验分析了不同类型的特征以及特征的维度对分类准确率、召回率以及,值的影响,确定了构建Logo分类器时特征组合及其维度的最佳选择;第二,对于一幅带有未知Logo的图像,对其进行随机切割,然后将得到的每一个图像区域块,利用训练得到的分类器对其进行测试,选择具有最大分类成绩的区域作为Logo区域。一个实验实例表明了该方法能够有效地检测到包含在其它图像内容中的Logo区域:最后,应用基于内容的图像检索技术,将检测到的Logo区域块与数据集中带标签的Logo进行相似性匹配。考虑到Logo自身具有固定结构的特点,本文提出了一种新的基于空间信息的相似度计算方法:将Logo分割成一系列很小的单元块,利用词袋模型,通过计算同一个视觉词汇在不同单元块内的相对位移,得到一系列具有相同长度的词语,基于此计算两个Logo图像之间的相似度。并将该检索方法与其他几种基于的图像检索方法进行比较。实验讨论了不同参数选择对检索结果的影响,表明了该方法的有效性,并且验证了利用一些空间信息来对Logo进行检索可以取得较好的效果。