自然图像中文字语种辨识方法的研究

来源 :延边大学 | 被引量 : 0次 | 上传用户:sorry314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然图像中文字语种辨识是基于内容的图像检索和多语种OCR (Optical Character Recognition)系统开发领域的一个重要研究方向。随着信息技术的发展,如何在海量的存储图像中检索出包含所希望文字语种的图像具有重要的研究意义和广泛的应用价值。但是,如何在海量的数据中实现快速准确的检索,仍然是目前图像检索领域中需要解决的问题。目前的OCR系统大都只能识别某个特定的文字语种。在国际化交流频繁的今天,文本图像或自然图像等多媒体文件如果包含的是多语种文字,那么现有的文字识别系统将失去其有效性。自然图像中的文字在数量、字体、大小、覆盖面积、文字之间的间隔等方面存在多样性,因此,现有的文本图像的语种辨识方法对上述问题缺少灵活性。为解决此问题,本学位论文提出了基于文字边缘密集性、文字排列规则和主成分分析的文字语种辨识方法。首先,根据图像中文字本身具有的排列规则和文字相对图像背景边缘密集度高等特征,提出了基于文字边缘密集性和文字排列规则的文本检测算法。该算法采用Sobel梯度算子检测图像边缘,计算图像边缘的密集度,再使用形态学图像处理方法进行预处理,然后通过文字排列的先验条件检测文本区域。其次,提出了一种基于PCA (Principle Component Analysis)的语种辨识方法。该方法对朝汉英3种文字构建的文字样本,利用PCA方法构造相应的文字特征空间,根据欧式距离和KL (Kullback-Leibler)距离度量待辨识文字和映射到特征空间的重构文字之间的相似性,从而辨识文字语种。最后,综合上述文本检测方法和文字语种辨识方法,设计了自然图像中文字语种辨识算法。实验结果表明,含有朝鲜语、汉语和英语3个语种的自然图像中,本文提出的基于文字边缘密集性和文字排列规则的文本检测方法获得了88.36%的检测率;另外,基于主成分分析方法的文字语种辨识方法获得了87.37%的辨识率,有效地解决了多语种自然图像中的文字语种辨识问题,验证了本学位论文所提出方法的有效性与可行性。
其他文献
无线传感器网络的数据链路层和物理层通常采用低功率低数据率的IEEE 802.15.4标准,其节点由能量极为有限的电池供电,网络一旦部署后更换电池比较困难。因此,节点通常采用低功
视频稳定技术是计算机图像视频处理技术领域一项十分重要的研究课题,被广泛地应用到目标跟踪、监控系统、个人视频处理软件等领域。随着摄像器材的普及,视频稳定技术成为当今
国际传播学会(International Communication Association)是一个对研究、教学、通讯等各方面感兴趣的学者的学术联盟。国际传播学会建于50多年前,是美国新闻工作者的组织,目
本文针对传统从系统角度和任务角度保护资源的访问控制模型所存在的问题,以Web服务访问控制为基础,引入了特征的概念,并用特征作为模型的访问客体,对访问控制领域进行了特征建模,
在当前的网络管理系统中,性能管理作为其中的一个重要组成部分,一直是网络管理的研究热点。在传统的网络性能管理中一直是以网络中的设备作为主要被管理的对象,但是网络设备的正
伴随着计算机网络规模的不断扩展,涌现出了多种多样对网络服务质量QoS(Quality of Service)要求较高的应用。现有的QoS管理方案仅能够提供因特网数据平面上的服务质量控制,无
以数字媒体共享为主的P2P应用占据了大量的互联网带宽,影响了其它应用的服务质量,也损害了网络服务提供商的利益。因此,识别因特网中的 P2P流已经成为当前网络管理势在必行的
信息时代网络的作用越来越重要,越来越多的人希望有一个廉价实用、简单方便和具有良好可扩展性的网络实验环境来学习和研究网络,因此计算机网络仿真应运而生。本文主要讨论了
随着集群系统的发展,集群的规模日益增大,结构愈趋复杂,使得集群管理系统不仅要具有节点自动发现、设备集中管理、可视化界面及系统状态监测等功能,还需要使系统具有强大的通
随着计算机和网络技术的飞速发展,使得多媒体信息的交流达到了前所未有的深度和广度。然而,多媒体信息在传输过程中会遭受各类无意或有意的篡改攻击,这使得人们对数字媒体(数字