论文部分内容阅读
鉴于页面版面复杂,提出了一种基于页面前景和最小二乘法的倾斜校正方法.该方法用特定的模式描述页面前景像素,利用模式粗分类分离页面中可能有的图像、图形和表格,通过合并余下的模式得到最大的文字模式结构体,依据该结构体所含基线特征点用最小二乘法拟合出基线方向即页面倾斜方向.实验表明该方法是有效的,速度快,它得到的模式结构体可以继续用来做版面分析.