论文部分内容阅读
二维表格是一种很常见的文档形式,由于其表达信息高度精炼,具有简明、规范、便于填写和处理等优点,被应用于信息领域的各个方面。因此提供一种表格自动处理系统非常具有现实意义。表格一般由一些有一定约束关系的横、竖线,印刷体字符,手写体字符等组成,而表格线的快速、准确提取是表格自动处理的关键。本文实现了一个将表格框线提取,表格图像存储到关系数据库,进而由关系数据模型转换成XML文档的实际应用系统。本文实现的系统可应用于同一页纸上有多个表格的处理。对于表格图像的识别,还提出了一种改进的基于数学形态学的表格框线识别方法。