论文部分内容阅读
自然图像中文字语种辨识是基于内容的图像检索和多语种OCR (Optical Character Recognition)系统开发领域的一个重要研究方向。随着信息技术的发展,如何在海量的存储图像中检索出包含所希望文字语种的图像具有重要的研究意义和广泛的应用价值。但是,如何在海量的数据中实现快速准确的检索,仍然是目前图像检索领域中需要解决的问题。目前的OCR系统大都只能识别某个特定的文字语种。在国际化交流频繁的今天,文本图像或自然图像等多媒体文件如果包含的是多语种文字,那么现有的文字识别系统将失去其有效性。自然图像中的文字在数量、字体、大小、覆盖面积、文字之间的间隔等方面存在多样性,因此,现有的文本图像的语种辨识方法对上述问题缺少灵活性。为解决此问题,本学位论文提出了基于文字边缘密集性、文字排列规则和主成分分析的文字语种辨识方法。首先,根据图像中文字本身具有的排列规则和文字相对图像背景边缘密集度高等特征,提出了基于文字边缘密集性和文字排列规则的文本检测算法。该算法采用Sobel梯度算子检测图像边缘,计算图像边缘的密集度,再使用形态学图像处理方法进行预处理,然后通过文字排列的先验条件检测文本区域。其次,提出了一种基于PCA (Principle Component Analysis)的语种辨识方法。该方法对朝汉英3种文字构建的文字样本,利用PCA方法构造相应的文字特征空间,根据欧式距离和KL (Kullback-Leibler)距离度量待辨识文字和映射到特征空间的重构文字之间的相似性,从而辨识文字语种。最后,综合上述文本检测方法和文字语种辨识方法,设计了自然图像中文字语种辨识算法。实验结果表明,含有朝鲜语、汉语和英语3个语种的自然图像中,本文提出的基于文字边缘密集性和文字排列规则的文本检测方法获得了88.36%的检测率;另外,基于主成分分析方法的文字语种辨识方法获得了87.37%的辨识率,有效地解决了多语种自然图像中的文字语种辨识问题,验证了本学位论文所提出方法的有效性与可行性。