基于图像分类及检索的Logo识别技术的研究与实现

来源 :东北大学 | 被引量 : 4次 | 上传用户:harryhexiaoer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Logo作为企业的一种重要标志,在查询带有Logo标志的企业信息时,Logo识别将发挥重要作用。尤其是,随着数字化信息技术的发展,人们可以利用智能手机等移动设备随时随地获取一张Logo图像,并希望通过Logo图像获取相关企业的信息,因此Logo图像的识别就显得愈加重要。而在实际应用中,Logo总是被图像的其他内容所包围,直接利用带有Logo的图像来检索相关信息时,结果往往不太令人满意。因此,本文提出一种基于图像的多类型的特征检测Logo区域、并进一步基于图像检索技术实现Logo识别的方法。首先,在一个带有类标签的Logo图像数据集里,经过对Logo图像归一化处理后,提取所有Logo图像的多种类型的特征,基于这些特征训练一个分类器。实验分析了不同类型的特征以及特征的维度对分类准确率、召回率以及,值的影响,确定了构建Logo分类器时特征组合及其维度的最佳选择;第二,对于一幅带有未知Logo的图像,对其进行随机切割,然后将得到的每一个图像区域块,利用训练得到的分类器对其进行测试,选择具有最大分类成绩的区域作为Logo区域。一个实验实例表明了该方法能够有效地检测到包含在其它图像内容中的Logo区域:最后,应用基于内容的图像检索技术,将检测到的Logo区域块与数据集中带标签的Logo进行相似性匹配。考虑到Logo自身具有固定结构的特点,本文提出了一种新的基于空间信息的相似度计算方法:将Logo分割成一系列很小的单元块,利用词袋模型,通过计算同一个视觉词汇在不同单元块内的相对位移,得到一系列具有相同长度的词语,基于此计算两个Logo图像之间的相似度。并将该检索方法与其他几种基于的图像检索方法进行比较。实验讨论了不同参数选择对检索结果的影响,表明了该方法的有效性,并且验证了利用一些空间信息来对Logo进行检索可以取得较好的效果。
其他文献
运营车辆智能排班问题是公交车辆智能调度需要解决的典型问题之一.它可以描述为:通过某种智能化的算法,在有限的算法步骤内,找出所有满足约束条件的排班方案中的最优方案或者
本文在总结了当前研究现状的基础上,针对802.11标准和802.16标准两种典型的无线网络技术,对无线网络MAC层的公平性,优先级支持以及协议实现方法展开分析和讨论。主要研究工作和
  数字图像处理是一门新兴的学科,它广泛地应用于生物医学工程、遥感航天、通信、工业、军事公安等领域,并取得了巨大的经济效益与社会效益。但同时,由于数字图像处理涉及的数
  本文的主要工作是以Web服务为应用背景,研究Web服务集成中的若干关键技术,研究了Web服务集成中的若干关键技术,提出了一种基于agent的Web服务集成框架。  本文构建了一个W
分形理论(Fractal Theory)是图像压缩中使用的一种新理论,它以压缩比高和解码速度快等优点,受到广泛的重视并得到了充分的发展。本文将分形理论和小波变换结合起来,提出一种
随着软件工程和软件设计理论和方法的不断发展,现代软件产品的制作逐渐向自动化发展。这要求使用面向重用的软件工程方法来面向软件系统族进行软件组件的制作,形成特定的软件
如何在分布式环境下实现异构数据的交换,是当前研究的热点问题,虽然己有多种实现跨网络数据交换的技术。但这些技术对运用于松散耦合、地域分布环境均存在这样或那样的问题,共有
  本文主要讨论了一种易于扩展的协议测试环境的设计,以及在此基础上实现的路由协议测试系统,详细阅读与路由协议相关的文档,分析、归纳路由协议的特点;对路由协议一致性测试
本文对Web门户技术的企业应用集成进行了研究。文章分析了中小企业对应用集成的需求,设计并实现了一个基于J2EE技术、Web技术、轻量级的企业门户框架,使开发人员能够在此基础上
近年来,随着人们对消费电子产品的性能需求日益增强,嵌入式处理器也在飞速发展,多核处理器已经问世。但是嵌入式浏览器的排版布局引擎仍然是传统的单线程架构,在多核处理器上没有