论文部分内容阅读
伴随着通信技术与信息处理技术的迅猛发展,越来越多的纸质文档通过数字采集设备转换成文本图像,从而使文本图像数据能够快捷的在网络、卫星、传真通信信道中传输,因此,文本图像已逐渐成一个重要的信息来源。但是,现有的文本图像处理系统自动化程度低,且通用性不高,无法满足文本图像处理广泛性与实时性的要求。因此,研究如何对文本图像进行分析与处理,以便高效、快捷的获取文本图像的信息,是一项十分有意义的研究课题。本文在总结已有研究成果的基础上对文本图像的识别检索、预处理、版面分析和表格图像识别展开研究。所做的主要工作如下:1.依据图像的灰度分布和结构特征差异,对基于图像信息度量的文本图像识别检索算法进行改进,构造一种基于信息度量与Radon变换的文本图像识别检索算法。该算法综合利用文本图像与连续色调图像的灰度分布与结构特征差异进行文本图像的识别检索。实验结果表明,所构造算法可有效降低文本图像识别检索的误识率。2.对基于Hough变换的文本图像倾斜检测算法进行改进,给出一种基于多分辨率Hough变换的文本图像倾斜检测算法,该算法通过对不同分辨率的图像进行不同精度的Hough变换,获得文本图像倾角值。实验结果表明,所给算法能够在确保检测精度的同时,大幅提高倾斜检测的速度。3.提出一种基于连通域的版面分割算法,该算法结合数学形态学、区域生长等方法对文本图像进行分割,对各式矩形版面分割效果良好。综合文本图像区域识别已有的研究成果,提出一种基于空间域特征的版面分类算法,该算法提取分割所得区域的各类空间域特征,并使用支持向量机作为分类工具,将版面区域分为文本、表格、图形和图像四类。实验结果表明,所提算法能较准确地识别不同区域,具有较强的实用性。4.从文本图像分类的角度出发,提出一种基于框线投影特征和点特征的表格图像识别算法。该算法将版面分割与表格区域识别相结合,通过提取版面分割所得区域的框线投影特征和点特征,使用支持向量机作为分类工具将版面区域分为表格区域与非表格区域,并以文本图像中是否含有表格区域以及表格区域面积占版面有效面积的比例为依据将文本图像分为表格图像与非表格图像。经实验验证,该方法具有识别准确率高,实用性强等优点。