论文部分内容阅读
提出了一种光学公式识别与分析的新方法,在公式符号提取与识别中采用RL(Run_length)特征以提高识别率。采用二层连通区域搜索算法提取公式符号的图像,其中第一层为基于RL特征的符号提取,得到复合符号的整体连通区域;第二层为传统搜索方法,进一步确定这些复合符号中包含的单一符号。设计了专门的公式符号识别器,对公式符号进行识别;根据符号间的语义信息和几何关系得到公式的逻辑结构;最终表达为公式结构树。在对印刷文献中所含公式的识别实验中取得了较好的效果,表明该方法具有良好的应用前景。