自然场景图像文本检测方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:jianrui02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像中的文字包含了丰富的高层语义信息,能够帮助计算机更为准确地理解图像内容。图像中的文本信息在语言翻译、自动驾驶、图像检索、人机交互、增强现实等应用中有重要作用。由于图像背景干扰、光照和视角变化等因素,场景图像中的文本检测和识别都是模式识别领域的难题。  本文研究基于连通域的场景文本检测方法,提出了一种平面化的最大稳定极值区域方法。该方法能够在不需要训练的情况下,有效快速削减大量重复的最大稳定极值区域,以提高场景文本检测的速度和准确率。在ICDAR2013鲁棒阅读数据集上,我们的方法能够削减70%冗余的最大稳定极值区域,并且相比传统的最大稳定极值区域,程序运行速度能提升接近一倍。  和其他的方法作比较,我们的方法仅需要对文本和非文本连通区域训练分类器,所需的训练样本较少,不需要太长的训练时间。对最大稳定极值区域的削减极大地降低了计算复杂度,提升了运行效率。实验结果亦能达到当前最前沿的方法的性能,表明了该方法的有效性。
其他文献
该文首先介绍了微生物发酵的历史、对于人类的意义,接着分析了微生物发酵的原理、特点、流程和工艺,并针对发酵过程中反应器内的温度、溶氧浓度等条件对于发酵过程的影响,提
无线传感器网络(Wireless Sensor Network,WSN)的出现加速了物理世界与虚拟信息世界融合的实现,并深刻改变着人类感知世界的方式,使其成为继互联网后,又一引领信息产业革命的热点
本文根据交流电机的统一理论,针对无刷双馈电机,利用三相电机与两相电机的等效性和磁势不变原理以及坐标变换的方法,详尽地推导了无刷双馈电机的实用数学模型,并利用MATLAB/S
由于Internet网络用户数目的增长以及多媒体网络应用的广泛使用,未来网络流量将呈爆炸式的增长趋势.随着网络流量持续的增长,Internet若要想继续提供较好的服务,必须同时保持
随着城市化的发展,交通问题日益严重,交通堵塞和交通事故频发.这种情况下以电子技术,通信技术和图像处理技术为核心技术的智能交通系统应运而生.目前各国都在积极致力于本国
网格技术是伴随着互联网技术而迅速发展起来的,专门针对复杂科学计算的新型计算模式。文章的第一部分论述了网格的基本概念、网格的体系结构以及网格的使用模式这些网格的基本
足球机器人比赛为研究者提供了进行相关技术研究的标准平台,是一个具有标志性和挑战性的学术课题,加之趣味性和参与性,得到了全球众多学者和机器人爱好者的广泛关注,是近些年
随着各类无人机广泛投入实际应用,其可靠性与智能化的重要性也日益提升,而各类故障是影响无人机可靠性的主要原因,各类约束是限制无人机智能化的关键因素。本文将以提升无人机的
阀控式免维护铅酸蓄电池作为一种经典的电力蓄能设备,在风力发电、太阳能发电迅猛发展和电动力交通工具广泛普及的今天,它以其低廉的价格和优越的性能依然受到广大用户的欢迎和喜爱。然而,像其它类型的蓄能电池一样,其本身的电化学性质决定了它还是一种相对娇气的设备。使用中若不注意,很容易受到各种不必要的损伤,从而降低设备性能缩短使用寿命甚至引发意外灾害。据统计,在铅酸蓄电池使用过程中最容易出问题的往往在于其充电
该论文首先综述了当前非线性系统辨识的研究现状,然后介绍了基于Volterra级数模型的非线性系统辨识及故障诊断的研究进展.并对基于非线性频谱分析的非线性故障诊断方法的基本