乌金体藏文文档版面分析与识别系统

来源 :西北民族大学 | 被引量 : 0次 | 上传用户:a591393620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乌金体是一种常用的藏文字体,它不仅出现于日常使用的各类藏文文档中,也存在于记载着中华民族优秀文化的古籍文献里。在信息化时代的大背景下,利用计算机技术对乌金体文档图像进行自动分析与识别具有一定的实际应用价值与现实意义。传统的图像处理与模式识别算法可以稳定高效地对印刷体藏文文档二值图的版面布局进行分析与提取,并给出相应图像的文字识别结果。然而,对比度低、背景斑驳、光照不均及版面复杂的藏文古籍文档图像而言,其二值化、版面分析与识别仍然存在一定挑战。本文利用传统算法和深度学习技术对印刷体藏文文档图像与藏文古籍文档图像展开研究,主要内容包括:(1)乌金印刷体藏文文档图像的分析与识别。利用传统二值化算法,分割图像中的文字与背景,结合霍夫变换与连通域分析等技术获取该类文档图像中不同字丁的位置信息;改进神经网络分类模型识别印刷体藏文字丁图像,该方法在降低模型参数量的同时正确率达到99.77%。(2)乌金体藏文古籍文档图像的分析与识别。针对古籍中字迹模糊而导致在图像二值化时笔画出现假性粘连问题,设计了简单有效的放缩策略。该策略可通过即插即用的方式融入到以U-Net为基础的二值化算法模型中,缓解假性粘连现象。实验表明,该方法提升了大约2%的pseudo-FM指标,在测试集上达97.73%。公开数据集上的实验也进一步验证了所提出方法的通用性。在深入分析了《甘珠尔》藏文古籍文档图像的特点后,准确、动态、高效地完成细粒度版面分析数据集的构建,并创新使用基于SOLOv2的算法完成“子行级别”的版面分析,得到边缘准确的文本串图像实例。对比实验表明所提出方法的平均精确率达到72.2%,较以往算法有明显提升,在一定程度上证明了无锚框设计网络在版面分析任务中的优越性。最后,提出了不限制输入尺寸的端到端识别模型TSVi T,同时给出应对过长文本串识别率低的叠瓦识别策略。TSVi T在测试集上的识别正确率较先前算法有小幅提升,达84.47%。(3)乌金体藏文文档版面分析与识别系统的设计与实现。遵循模块化思想构建“高内聚、低耦合”的软件系统架构,利用Py QT5、Open CV、Pytorch实现界面美观、扩展性好的版面分析与识别系统。软件测试结果表明,所设计和实现的软件系统,其文档图像二值化、版面分析与识别等功能具备稳定运行的能力,可以满足实际使用的需求。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
学位
学位