论文部分内容阅读
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,图像的校正处理方法研究变得越来越有必要。文中,首先采用文本域分割将文本分割为多个连通域,每个连通域包含一个字,标记出连通域的上、下、左、右边界,通过这些边界的联系检测出文本行;其次根据文本行首个连通域检测出校正基准线;最后根据校正基线和垂直位移距离分别对文字进行位移而得到校正后的图像,从而可以被光学字符识别软件识别。