论文部分内容阅读
为了快速、准确地识别出文档图片中存在的表格,为表格信息提取提供表格图像数据,为表格内容的语义分割打下基础。本文首先使用OpenCV图像处理工具对包含表格的文档图片进行预处理,再采用Labelme标注工具对图片中的表格位置进行标注;其次,把图片数据集按照4:1比例分为表格识别模型训练数据集和模型验证数据集;最后,借助Tensorflow深度学习工具,采用Faster-RCNN目标检测框架对表格识别模型进行训练,并用验证数据集对训练好的模型进行验证实验。实验结果表明,基于Faster-RCNN算法的表格