自然场景中的商标检测与识别技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:tomlibu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机、多媒体及网络技术的迅猛发展,以及各种压缩技术和大容量存储技术的不断出现,形象生动、表现力强、信息量大的多媒体资源逐渐成为人们获取信息的重要来源。同时,移动智能设备技术的飞快发展,为这些信息的传播和共享提供了便捷的途径,数字化的图像和视频已成为人们日常生活中重要的信息记录媒体。在数字化浪潮的推动下,互联网上的广告类型也逐步从单一的文本方式转变为以图像、动画、视频等多媒体资源为主的表现方式。这些广告的宣传往往以商标为中心,通过商标发布商品信息,推介商品,突出醒目,简明易记,借助商标这种特定标记吸引消费者的注意力,加深对商品的印象。商品吸引了消费者,消费者借助商标选择商品,商标的作用便显而易见。因此,商标中承载着图像和视频的高层语义信息,成为理解图像视频内容的重要线索。然而随着网络广告数量的不断增加,违规广告、虚假广告逐渐进入了人们的视野,商标的盗用、篡改、侵权等事件也时有发生,这些都影响了国家的经济发展以及人民的合法利益,对数字图像中的商标进行检测并识别成为一个迫切的现实需要,这将会成为保护商标注册人以及消费者的有力保障,对于维护网络市场公平竞争秩序,保障网络市场健康快速发展具有重要意义,为我国网络市场主体身份识别验证、网络市场在线巡查等监管手段提供技术支撑。  前人的许多研究集中检测出现在文档图像中的商标,这种图像中的商标背景简单,受到的干扰少。然而,自然场景中的商标由于受到形变、遮挡、光照等影响,使得这种情况的商标检测相比文档图像有更大的挑战性。本文主要针对自然场景图片,研究并解决商标检测与识别技术中存在的相关难点及问题,并将研究工作的成果应用到网络广告内容监控管理、信息安全监控、图像及视频分析、检索、分类中,实现网络广告的分类管理以及检测其中是否含有违法或违规图标和标识。本文的主要工作及创新点如下:  1)大规模商标图片及测试图片数据库的建设数据库作为任何研究工作的基础都是十分必要和重要的,然而现阶段公开发布的商标数据库中商标种类较少,图片数量也不够充足,因此我们结合本文研究目标,在已有数据库的基础上,构建了大规模商标检测识别数据库。我们从互联网上搜集各行各业品牌的商标共计约15000种,同时也搜集了含有奥运、百度、百事等40个商标的图片,共3988张,每张图片中含有一个或几个商标,且有光照、形变、尺度、遮挡等等的影响。该库特色在于其商标库中商标样式丰富、数量庞大,包含各种文字、图形、字母、数字、三维标志和颜色组合的图形,这些都是对前人数据库较好的补充和完善。该库的建设将使得大规模商标检测识别工作的研究更加具有针对性、目的性以及挑战性,同时也为检测识别的性能评价提供基础支持。  2)基于空间连通域预定位的特定商标快速检测识别针对自然场景下特定商标检测识别问题,利用商标是由一些颜色连通域按照一定的空间关系构成这个特点,本文提出了一种基于空间连通域预定位的快速商标检测算法,可以高效准确地实现任意大小待测图片中的商标检测。该算法主要由两大块构成,首先是用一种新的表示方法“空间连通域描述子”(SCCD)来描述商标的空间结构,这个描述子由连通域预测模型和有效连通域像素分布直方图构成。其次,基于这种描述子,提出了一种预定位算法,保证尽可能准确地获得可能的商标位置,之后对这些位置利用基于内容的特征进行商标匹配。实验结果表明该算法相比传统算法能够在很大程度上加速商标检测,同时给出商标的准确位置。该算法可以应用到复杂场景下的特定商标检测识别、敏感及违法图标检测识别中。  3)基于商标连通域聚合性及差异性的视频图片商标检测识别针对大规模商标库下视频图片的快速商标检测识别问题,本文提出了一种基于商标连通域聚合性及差异性的检测识别算法,可以实现简单场景下,不依赖特定商标的检测,同时利用分类索引提高识别准确度。该算法主要由两大块构成,首先,对于商标检测,我们分析了待测图片中商标连通域的聚合特性,提出一套与商标样式无关的商标定位算法,获取图片中可能的商标区域。其次,对于商标识别,根据商标之间的差异性,提出了一套商标库分类体系,可以将商标库分为多个子商标库。对于待匹配区域,我们选择对应的子商标库及索引进行匹配,使得识别更有针对性。该算法在商标检测识别数据库中的视频广告图片上进行了测试,实验结果表明它可以实现大规模商标库下快速准确的商标检测识别。该算法可以应用到视频广告的快速商标检测识别中。  4)基于稳定区域估计及商标密度的大规模自然场景图片商标检测识别针对大规模商标库下的自然场景图片快速商标检测识别问题,本文提出了基于稳定区域估计及商标密度的检测识别算法。该算法包括两部分:基于商标区域稳定性的快速商标位置估计算法和基于商标密度的个性化商标匹配识别算法。在第一部分中,本文将最大稳定极值区域检测与选择性搜索相结合,提出了一套与商标类别无关的快速商标位置估计算法。在第二部分中,本方分析了各种商标的多样性和差异性,创新性地提出了一个商标密度的概念,作为每个商标的语义信息。之后结合它给出了个性化匹配策略,并与视觉词典模型融合,实现大尺度的商标识别。在这两块工作基础上,本章给出了大规模商标库下的商标检测识别框架。实验结果表明,本文提出的算法一方面可以在线性时间内,不依赖特定商标,以较少数目给出待测图像中可能的商标区域。另一方面可以更加全面准确地识别各种复杂度的商标,更有针对性的获取每次匹配的相似度,保证了待测区域的准确识别分类。该框架使得大规模场景下的实时商标检测识别成为了可能。  5)网络广告在线追踪与监控服务支撑平台参与设计并实现了网络广告在线追踪与监控服务支撑平台,该平台可以对网络上发布的各种媒体形式的广告进行追踪采集,并对所采集的广告进行内容识别、行业分类和合法性判别,实现网络广告的有效监管。本文提出的商标检测识别的关键技术已成功应用于系统中,实现了网络广告分类、违规内容监控。  总的说来,本文在大规模尺度下自然场景中的商标检测识别技术方面做出了有益的研究工作。  
其他文献
第一章是绪论,主要介绍模糊控制理论和神经网络等方面的理论知识及最新成果.第二章是控制过程对象建模,该章是论文的重点和观点.通过对模糊神经网络的结构和几种学习算法的介
纳米通道单分子检测技术由于其快速、低成本、无需标记等优势而受到广泛关注和发展。这一技术的原理是待测分析物在外加电场的驱动下穿越纳米通道时的占位效应改变了通道阻抗
该文首先介绍超声波时差流量测量的工作原理,对该方法中参数与测量误差的关系进行了分析,得出了一些有意义的结论.随后,该文就超声波时差流量测量的一种新方法-多脉冲测量方
文章首先给出了汽车装配车间生产计划与调度集成优化系统的体系结构、运行模式和集成方法.为解决快速调度仿真问题,提出用扩展随机高级判断Petri网对装配线进行建模,给出该网
智能仪表是自动化仪表的发展方向.随着工业生产自动化要求的不断提高,组建更大规模复杂自动控制系统的需求日益迫切.因此,研究组建智能仪表集散控制系统的相关技术,对自动化
对于一些复杂的非线性系统,很多控制相关的中间变量都无法直接测量,从而影响了非线性过程的监测。非线性滤波技术的适时出现,解决了化工生产工艺过程中间变量难以测量的问题,并得
该论文主要研究了经济管理系统复杂性的分数维度量,经济混沌时序的相空间重构技术、建模和预测技术及控制方法,最后该文研究了运用BDS统计量的非线性检验方法.
该文首先对太空杯用材料作简单介绍,说明正确选材的重要经济意义.太空杯用材料的优与劣,是一对既有差异又有共维(这里的维是指价值),且处于两极,是有中介过渡性的模糊概念.这
超视距空战是随着飞机武器系统的发展而出现的一种新的空战方式.采用这种空战方式有利于发挥装备的优势,达到打击敌人,保全自己的目的.因此,研究与之相应的火力控制系统对提
该文的研究工作是在国家计委"九五"科技攻关项目《基于人机交互全流程生产计划系统研究与开发》的资助下展开的.结合该项目要求,该针对抚顺特殊钢有限公司(以下简称抚钢)新流