基于深度学习的现实场景Logo检测方法的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:revire
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的高速发展,Logo检测在商品图像检索、体育赛事赞助、营销活动评估以及知识产权保护等领域表现出了巨大的商业价值。而现实场景中Logo的种类、样式和位置的多样性,对Logo检测技术提出了较大的挑战。深度学习为Logo检测的研究提供了新思路,在Logo图像数据量足够大的前提下,深度学习技术使得研究人员只需设计合适的算法模型,即可快速检测出Logo的位置和种类。本文提出了一种基于深度学习的现实场景Logo检测方法。首先,筛选和提取图像中与Logo实例相关性最强的区域作为Logo上下文,训练Logo上下文判别网络,然后生成图像中适合Logo出现的位置,结合Logo特征优化方案,合成现实场景Logo图片,作为训练数据训练多尺度区域建议Logo检测模型,用于检测现实场景中的Logo。本文设计的Logo检测方法包括:Logo上下文区域选择、现实场景Logo图片合成、多尺度区域建议Logo检测算法设计、Logo检测模型训练以及结果分析五个步骤。其中,研究的重点是现实场景Logo图片合成方法和Logo检测算法的设计。本文提出了基于Logo上下文选择的数据扩充方法,该方法通过训练Logo上下文判别网络,能够自动判别图片适合Logo出现的位置,结合Logo特征优化方案,能够快速合成图片,解决了公开Logo数据集数据不足以及现有图像合成方法会误导模型的问题。在模型设计上,本文提出了多尺度区域建议Logo检测算法,在Faster RCNN的基础上使用ResNet卷积结构优化图像特征,同时利用特征金字塔多尺度区域建议机制和双线性插值算法提高模型对小尺度Logo实例的检测准确率。改进后的算法在仅使用公开数据集图片和使用合成图片扩充训练集两种情况下,分别得到了 85.8%和90.3%的AP@0.5值。最后,本文将改进模型应用在Logo检测系统中,证明了本文设计的现实场景Logo检测方法具有较强的应用性。
其他文献
2015年2月27日,在中央全面深化改革领导小组第十次会议上,习近平总书记首次提出“让人民群众有更多获得感”。至此,“获得感”一词进入公众视野之中,也逐渐成为一项新的衡量社会发展、人民幸福的标准。教育部党组积极落实相关精神,明确提出要“打一场提高高校思想政治理论课质量和水平的攻坚战,切实增强大学生对思想政治理论课的获得感”。党和国家对于大学生思想政治理论课获得感的高度关注是高校思想政治理论课教学改
《中华日报》创刊于1932年4月11日,终刊于1945年8月21日,在上海发行时间长达13年之久。自成立之始,《中华日报》即是汪精卫的机关报,着力宣扬汪派的言行。汪精卫投敌后,《中
企业竞争情报系统的本质是一个复杂自适应系统。我国著名情报学家包昌火指出,企业竞争情报系统作为竞争情报工作的组织保障和物质基础,是企业信息化的重要内容。然而,Web2.0环境的动态性、不确定性以及新兴的技术工具为企业竞争情报系统提出了新的挑战和要求,使其结构、机制与要素发生变化,复杂性升级。目前,国内外对于Web2.0下企业竞争情报系统的研究较少,尤其缺少以复杂系统视角对于企业竞争情报系统绩效影响因
β型钛合金具有高比强度、良好的冷成型性和耐蚀性,在航空航天飞行器结构件方面具有良好的应用前景。但随着我国航空航天事业的高速发展,钛合金结构件的强韧性需要进一步加强,因此开发新型高强韧钛合金成为必要需求。本文根据合金设计准则、经验参数、电子参数等设计了三种β型钛合金,分别为Ti-V-Mo-Cr-Fe-Al(1#)、Ti-V-Mo-Cr-Zr-Al(2#)和Ti-Mo-Al-O(3#)合金。三种合金的
淮南煤田位于华北板块南缘,经历多旋回分阶段的地质构造运动,发育大量褶皱和断裂,地质构造条件极为复杂,由于构造对地下水系统的控制作用,使水文地质条件变得尤为复杂,而探明研究区构造发育特征和水文地质条件,分析构造对地下水系统的控制作用,并以此探寻构造控水的规律性,有助于矿区煤层安全开采工作的有的放矢和顺利开展。本文以淮南煤田张集矿区为研究对象,运用系统理论的思维方式,首先对研究区所处区域地质构造与水文
量词是现代汉语区别于古代汉语的一个重要特征,是区别于印欧语系的显著特征,同时它也是汉语学习者较难理解和掌握的词类之一。在教材编排中如何合理呈现,在实际教学中采取何种方式让学习者掌握并灵活运用,我们在不断完善和精进。本文从两套晚清代表性的汉语教材(来华传教士鲍康宁编写的《英华合璧》和外交官威妥玛编写的《语言自迩集》)中挖掘可参考价值。基于前人对汉语量词的研究和量词教学的现状考察,我们对晚清量词及其教
发酵特性优异的菌种和具有活性成分的原料是酿醋工业的两大核心。苦荞含有丰富的营养成分,且富含类黄酮类活性化合物。本论文主要研究内容是分离、筛选获得发酵性能优异的菌种,以苦荞为原料发酵酿造食醋,优化发酵工艺并对苦荞醋进行活性分析。主要研究目的是使制得的苦荞醋不仅拥有传统的食醋功能,而且保留苦荞的营养和活性成分。结论如下:1)以筛选高产酸、发酵特性较强醋酸菌为出发点,从陕西民间醋醅中分离出3株优势醋酸菌
随着遥感观测技术的不断发展,越来越多的应用场景逐步引入遥感信息的辅助。目标检测问题是遥感信息分析中的关键一环。不同于分类问题,目标检测需要区分出地物的具体类别,同时给出具体的位置信息,因此更具挑战。本文以高分辨率遥感图像中的飞机目标检测任务为例,结合迁移学习对遥感图像目标检测算法展开研究。具体的研究内容包括以下几个方面:首先,对迁移学习的基础理论及本文涉及的相关知识进行分析。目前对迁移学习的核心研
本文面向未来卫星通信网络,研究软件定义网络、网络功能虚拟化、光突发交换等新兴技术,研究内容构成完整卫星通信流量工程解决方案。具体包含以下方面:SDN卫星网络组网架构设计、基于随机相位屏的大气信道建模仿真、ACM和多站点策略联合对抗信道衰减策略、多优先级业务均衡和节点流量均衡的双轮询策略。主要研究工作如下:(1)研究了可以应用于卫星网络的SDN、NFV等新兴范例,然后提出了基于SDN的弹性卫星网络与
无人机目前已广泛应用于航空遥感等高精度航拍领域中,但因为无人机姿态易受多种外界因素影响,会使得航拍质量下降。针对这个问题,提出用应用三轴增稳云台来提高无人机的航拍质量,本文针对多旋翼无人机三轴增稳云台的增稳控制方法进行了研究。论文详细分析了三轴云台的姿态描述和数学模型,提出了有效提高三轴云台稳定控制精度的控制算法。论文的主要内容:首先,对三轴增稳云台的姿态描述、运动学和动力学模型,以及电机模型进行