基于特征空间的旋转多字体文字识别

来源 :长安大学 | 被引量 : 8次 | 上传用户:klzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机、多媒体以及通讯技术的飞速发展,以图像为主的多媒体信息迅速成为重要的信息传递媒介,而且图像中的文字包含了重要的语义信息,比如图像中道路指示牌上的指示文字和地图上的地方名,均能指示出与此相关的地理位置信息,而书籍封面图像中的标题作者、产品包装图像上的产品名称等能够说明图像中的主体内容。准确提取和识别图像中的信息可应用于图像检索系统、车辆自动导航系统、视觉障碍辅助设备、手机辅助功能系统等领域中。因此准确提取和识别图像中的文字成了信息智能化处理的前沿课题,且具有广泛的应用意义。针对现行文字识别系统中,由于不同设备获取的分辨率不同的图像,其文字识别率也大不相同,图像分辨率较低或图片倾斜时识别率便大幅降低,而且有的文字识别系统还受到文本字体种类以及文字位置的限制。本文将针对存在旋转的、多字体文字的识别进行相对应的研究与论证,提出基于特征空间的文字识别方法,以改善文字识别的识别效果,提高文字识别的鲁棒性,使其能够更好地在机器视觉领域得到应用。基于特征空间法的文字识别方法与传统文字识别方法的主要区别在于特征提取及分类判别方法有所不同。基于特征空间的文字识别,首先,根据主成分分析提取文字特征,建立文字的特征空间并确定文字的运动轨迹;其次,通过改进的近邻法比较待测文字特征与轨迹的相似度,以实现字符分类,从而并识别出文字及其对应的旋转角度。最后,通过借助于GCC软件进行仿真验证与代表OCR识别潮流的汉王OCR识别软件对比,通过实验得出基于特征空间的文字识别方法在识别旋转的多种字体的文字有较好的效果。
其他文献
随着网络、计算机以及多媒体技术的快速发展,越来越多的信息以图像作为介质进行传递和保存。对于这些生活和工作中所出现的大量图像数据,如何准确、快速地提取图像特征并检索
随着互联网的发展,电信网的业务种类不断翻新,业务容量正逐年增长,使电信市场对网络资源、网络带宽、业务配置及性能升级展开了激烈的竞争。因此,电信运营商采取有效的手段来提高
电磁层析成像(Electromagnetic Tomography),简称EMT,是20世纪90年代发展起来的一种基于电磁感应原理的过程成像技术。它具有非侵入,非接触及无危害的优点,并且能够同时获得
注吹一体机作为塑料成型过程的专用设备,近年来在国内得到了迅速的发展。然而,国内注吹一体机所使用的控制系统大部分是以传统PLC加计算机或计算机加控制板卡的方式,生产过程
运载火箭是最主要的航天运载工具,也是一个复杂的大系统。随着计算机仿真技术的飞速发展,针对航空航天复杂大系统如飞机、飞船、运载火箭的仿真研究取得了很大的进展。为解决
永磁同步电机伺服系统在工业、农业和航天等领域应用十分广泛,由于其作为一种新型的交流伺服系统比直流电机伺服系统具有明显的优势,在很多场合已经取代了直流电机成为伺服系统
光子晶体作为当今比较新颖的研究课题,利用其禁带和局域特性可以设计性能优良的光学元件,其中基于光子晶体结构设计制作的光学传感器具有体积小、信号响应速度快、检测灵敏度高、抗电磁干扰能力强等优点,已成为光学传感领域研究的热点问题。本文从光子晶体基本特性出发,与表面等离子型传感器相结合,设计了含金属插层的光子晶体结构,进而引入石墨烯材料对其进行优化,并对折射率传感特性进行分析,为光子晶体传感器的研究提供了
压电换能器是声波测井仪器的关键部件,用于发射和接受声波信号。在测井仪器中,压电换能器通常是配对使用的。试验表明,只有当配对使用的压电换能器具有相同的谐振频率和频带
目前许多国家非常重视电动汽车或者混合动力汽车的研制和发展,国内一些城市已将电动大客车批量生产并用于公交系统。但是在世界范围内,发展电动汽车还存在几项关键性技术没有被攻破,动力电池能量管理是其中一个很重要的研究课题。在动力电池能量管理系统中,电池的荷电状态(SOC)是最为关键的一个状态量,反映了电池的剩余电量从而为驾驶员提供续航里程的重要信息。本文的主要任务就是对电动汽车用铅酸电池的SOC估算方法进
导航定位是自主移动机器人技术体系中一个非常重要的研究内容,受到了国内外学者的广泛关注。本文围绕自主移动机器人的实际使用环境及其对导航定位精度的要求,开展了理论与实际
学位