文本图像的几何畸变校正技术研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:xilotola
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在使用扫描仪或数码相机获得文本图像时,由于文本表面倾斜、弯曲或人为操作时产生的拍摄视角的倾斜等原因,使所得到的文本图像存在几何畸变,这些畸变对文字处理软件如OCR 识别、数字文档版面分析等的识别和分析工作带来极大的困难,可能会导致这些软件根本无法识别该文本图像。因此,必须对变形文本图像进行必要的校正。目前,已经有很多几何畸变校正的方法应用于畸变的文本图像。但是这些方法都是针对某一种或两种几何变形有效,而没有绝对通用的算法,需要对不同变形类型的图像采取不同的有效校正算法。
   为实现几何畸变文本图像的自动校正和批量处理,论文在讨论文本图像二值化、去噪技术的基础上,重点对文本图像几何畸变的自动检测及分类的方法进行研究。提出了基于数学形态学理论与曲线拟合方法的自动检测和分类方法,实现对文本图像几何畸变的自动检测并对其畸变类型进行分类,为后续的几何畸变自动校正奠定了基础。然后论文分别针对倾斜变形、透视变形和扭曲变形三种典型畸变文本图像,在对现有的校正算法原理、性能及适用范围进行分析的基础上进行了研究,并提出了一些改进方法。
   在Matlab 环境中对文本图像几何畸变自动检测及分类算法进行了验证,试验结果表明该算法能有效检测和识别文本图像的几何畸变及其类型,检测识别率达到96[%]以上,尤其是对扭曲变形的文本图像识别率很高。且该算法实现简单,计算量小,并具有较强的鲁棒性。然后通过试验比较文本图像校正前后的OCR 文字识别率,分别对三种变形文本图像几何校正算法的改进算法进行了验证。结果表明,与原有算法相比,改进算法所得校正图像的OCR 识别率不低于原有算法,但所用时间降低,基本满足实时性要求。在数字化和信息化的现代,该文本图像几何畸变自动校正系统具有广阔的应用前景。
其他文献
期刊
期刊
期刊
期刊
期刊
期刊
期刊
报纸
报纸
期刊