论文部分内容阅读
印刷文献信息采集处理是文本信息处理应用 ,特别是数字化图书馆建设中十分繁重而又必须从事的工作 .由于目前广泛使用的字符光学识别系统 (OCR)无法对具有偏斜角度的扫描文本图象进行自动加工处理 ,所以需要大量的人工介入 ,即以手工方法纠正图象偏斜 .因为无法有效地进行扫描文本集的批量处理 ,所以难以提高处理效率 .针对这一问题 ,在讨论文本图象轮廓投影性质的基础上 ,利用其相关系数与文本偏斜角的统计依赖关系 ,构造了一种用于文本图象的自动偏斜纠正方法 .