自然场景图像文本定位方法及应用的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xrf1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像是指人们通过相机、摄像机等器材在自然环境中拍摄的图像,自然场景图像中的文本定位即对这类图像中出现的路牌、车牌、布告板、提示牌、广告等载体上出现的文字进行检测和定位。该课题可应用于导盲、导航、智能交通、信息检索等领域,具有广阔的应用空间和重要的研究意义。如何快速、有效地从复杂图像中提取文本已成为受到关注的热点问题。在研究和对比已有算法的基础上,本文对场景图像文本定位的一些关键环节提出了新的思路和方法。在文本图像的分割方面,研究并改进了在图像分割方面具有良好的生物学依据的脉冲耦合神经网络,使其能够快速完成图像的三值分割,较好的适应了场景图像的复杂光照条件。实现了脉冲耦合神经网络中的多个参数基于图像自身的特征自动选取,避免了传统算法中人为设置参数,且分割效果对参数敏感的问题。在将字符连通分量连结构造为文本区域方面,提出了基于相似连通分量直线拟合的构造方法。将连通分量按照其中心位置映射为二维平面上的点,依据宽、高、位置等因素定义了连通分量间的相似度,并按相似度进行相似点集的划分。吸取随机抽样一致性的部分思想,在各相似点集中构造直线,从而实现文本行的分离。该算法对不同尺寸的文本适应度高,较好地解决了倾斜且相邻较近的两文本行中字符的文本行划分问题。在文本特征提取方面,研究了英文字符的笔画特性,描述了单侧边缘对二值字符的“擦除”作用,并在此基础上提出一项新的文本特征——“微小位移覆盖率”。该特征提取过程简单,在非文本块的过滤应用中取得了较好的效果。此外,对文本定位算法在移动终端上的应用做了探索,在Android操作系统上实现了基于MVC架构模式的文本定位应用程序的编写。
其他文献
本文以GPS接收机为例,主要研究了全球导航卫星系统(Global NavigationSatellite System)软件接收机基带关键技术捕获与跟踪,其目的是使接收机产生的本地载波频率与扩频码的码相位
人体检测是近年来计算机视觉和模式识别领域的研究热点,它在智能视频监控人机交互车辆辅助驾驶等方面有着广泛的应用前景目前基于人体检测的种种算法相继被提出,但由于场景的
由于资源日渐枯竭,人们将目光移向了人类尚不太了解的海洋,尝试开采丰富的海洋资源,而在此过程中会伴随着大量数据的产生,比如水面舰艇航行数据、海上气象数据、海底地形地貌数据
雾天环境下获得的图像和视频,存在清晰度差、对比度低、颜色失真等严重的退化现象,直接影响和限制了户外视觉系统的作用。因此改善雾天退化图像和视频的质量,降低雾霾等天气
本论文首先分析了Android移动终端操作系统和国内外激光雷达的研究现状,提出了基于Android平台的激光雷达控制软件的设计与开发。本论文论述了在Android系统下通过USB接口芯片
超级电容器具备功率密度高、比容量高、充放电时间短、循环稳定性好等特点,在国家防务、载人航天、信息技术、仪器制造等行业拥有很大的发展潜力。但能量密度较低,是超级电容器面临的主要问题。电极是超级电容器最重要的组成之一,对其储电性能起着决定性作用。提高电极电学特性的方法主要有使用比表面积较大的纳米结构电极以及将不同活性物质合成复合电极。本文主要研究了TiO_2纳米管的生长条件,探索了向纳米管中沉积NiO
语音作为一种包含说话内容和情感状态的复杂信号,是人类进行交流和表达情感的有效形式。语音情感识别是计算机通过提取并分析情感语音的特征参数从而判别情感类别的一种信息处
在电子化进程加速、信息网络快速普及的大环境下,移动通信已被大家熟悉和广泛使用,并已成为计算机通信科学领域的研究热点。作为Internet不可或缺的一部分,Adhoc(Mobile Ad Hoc N
随着自主机器人的发展,如何让机器人“看懂”外部世界是很多学者研究的内容。机器人可以通过视觉系统与外界环境进行交互。信息处理单元是视觉系统中较为关键的一部分,当实时性
随着移动设备的兼容性及处理能力的提升,其承担的任务越来越多样化,也因此涉及到更多的个人隐私信息。传统的基于数字密码或九宫格图案的身份鉴别方式安全性较低,容易被偷窥