论文部分内容阅读
版面分析是文档数字化中的关键问题。本文首先将版面分析算法分为两类:基于形状的和基于纹理的,然后提出了一个基于多层次基元的版面分析模型,根据此模型,版面分析问题被简化为计算每个层次上的最佳基元划分。我们提出了连接强度和多层次可信度的概念并描述了一个基于多层次可信度的自底向上的算法。此算法具有很强的适应性,可以处理各种类型的样张。实验表明了算法的有效性。