论文部分内容阅读
表格检测是文档分析中的非文本内容检测部分的重要任务,表格检测的高准确率是提高文本检测准确性的必要条件。本研究提出了一种基于深度学习的文档图像分析的表格检测方法。该方法采用级联R-FCN(基于区域的全卷积网络)框架,首先检测出文档图像的公式区域并移除;然后在无公式的文档图像中,检测提取表格与图区域,最后通过参数调节筛选出最终的文档图像表格区域。该方法在ICDAR2017CompetitiononPageObjectDetection数据集上IoU(交叉重合区域)为0.8时,AP值和F1值相应为0.85