论文部分内容阅读
版面分割是OCR(光学字符识别 )系统的重要组成部分 ,在将印刷文档转换为电子文档的过程中是必不可少的。该文对基于连通域的版面分割方法进行研究 ,首先用动态聚类法选取模糊阈值 ;然后对文档图像进行模糊处理 ,形成大的连通区域 ;再根据连通域的位置关系等分割出文档的各个分栏。实验表明 ,该方法对于简单的矩形版面及复杂的版面 ,例如 ,非Manhattan版面等都能较好地分割。