基于深度学习的古籍文字识别和检测

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:niqing813
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自古以来,人们创造了许多知识的财富,古籍文献是这些财富的重要载体。为了更好地利用和保护这些古籍文献,将它们进行数字化是一个即高效又重要的方式,而古籍文献数字化又离不开对文献中的文字进行识别和定位。古籍文献中的文字识别可以认为是光学字符识别(OCR)的一个分支,虽然OCR已经是一个相对比较成熟的研究课题,但是古籍文献中的OCR仍然面临着各种挑战,包括类别数较多、字迹模糊、书写方式多样和背景复杂等等。与古籍文献中的文字识别深受关注不同,古籍文献中的文字检测被研究得并不多,然而,将文献扫描图中的文字准确定位出来对古籍文献的相关研究也有着重要意义。目前,基于深度学习的方法在计算机视觉各个研究领域都取得了较好的效果,但是将其应用于古籍文献中的文字识别与检测任务上却不多。于是,本文针对以上任务,基于一个全新的数据集,灵活使用深度神经网络,实现了古籍文献中的文字识别以及文字准确定位,此外,还利用强化学习对单字进行更精准的位置调整。具体而言,本文的工作内容和创新主要包括以下三个方面:1、针对古籍文献中的文字识别问题,在仅有页面级别标注信息的训练数据时,使用卷积神经网络进行文本行级别的文字识别,并设计了一种门结构对梯度进行自适应地过滤,降低了“错误标注”样本对模型训练效果的影响,使用该结构能将识别错误率降低35%以上。2、针对古籍文献中汉字的精准检测,我们提出了一种识别指导检测的全新框架,该框架由两个卷积神经网络组成:基于识别指导的候选区域生成网络,该网络负责提供文本图像上的语义信息来辅助检测网络;以及检测网络,该网络利用所提供的语义信息准确定位每个文字。实验结果表明,相比于目前主流的目标检测和自然场景文本检测算法,我们提出的框架能够在参数大大减少的情况下实现相当甚至更好的性能。3、为了得到文字更精确的位置,本文结合主流的检测框架以及强化学习中的深度Q-learning算法,对古籍文献中文字的检测结果进行自动化微调。本文实现并验证了使用强化学习来获得古籍文献中更精确文字检测结果的可行性。
其他文献
北美地区油气资源丰富,褶皱冲断带(FTB)及含油气盆地数量多。在搜集前人资料基础上进行综合研究,对研究区内FTB以及三个重点区域的褶皱冲断带及盆地的构造演化、沉积演化特点
随着航空货运在我国经济生产生活中的作用越来越重要,货舱货物装载系统的机械化、自动化和智能化成为一种不可逆转的趋势,由此产生的装载系统及其关键部件的可维护性需求也愈发明显。货舱货物装载系统包含了各种电子、机械子系统及关键部件,系统复杂度较高,出现故障的可能性也就相应增加,且故障一旦发生,就可能引起连锁反应导致系统拓机,甚至形成破坏性后果,从而造成不必要的经济损失。PDU是装载系统中的动力驱动单元,在
PZT陶瓷是一种应用最为广泛的压电陶瓷材料。采用传统固相烧结制备PZT陶瓷需高温条件及长时间的保温过程,在此过程中Pb挥发严重,使得PZT陶瓷的化学计量比发生偏离,并严重污染环境和生产设备。为解决Pb挥发的问题,有效且可行的方法是降低PZT陶瓷的烧结温度和烧结时间。另外,KNN陶瓷是近年来发展出的一种新型无铅压电陶瓷材料。由于高温时碱金属K、Na的挥发,使得采用传统固相烧结方法难以制备致密的KNN
背景和目的滑膜软骨瘤病是一种少见的异常增殖性疾病,常累及关节滑膜和滑囊、腱鞘组织。本课题目的是探讨利用漂浮体位前后联合入路踝关节镜技术治疗滑膜软骨瘤病的临床疗效
多孔纳米材料因其表面或内部含有通道、孔洞和缝隙等结构,故具有高孔隙率、高吸附、高表面活性、高比表面积等优良特性,在化学工程、电子工程、环境科学、生物医药和能源等方面显示出巨大的应用前景。本文采用不同的静电纺丝方法制备了不同结构的聚乳酸(PLA)/茶多酚(TPs)多孔纳米纤维,表征了溶剂比、溶质浓度、溶液浓度和纺丝速度等纺丝工艺参数对纤维形貌和结构的影响,并研究了其在吸附性能、抗菌性能及药物缓释性能
未利用地开发在兰州新区城市建设、招商引资、产业调整等方面发挥了重要的作用。近年来,通过对低丘缓坡未利用地的开发利用,有效地缓解了新增建设用地指标紧缺与各业发展对建
随着更有效的支气管扩张药的出现 ,近年来 ,茶碱的应用已显著减少。但由于该药还在继续使用 ,用药过量事件仍有发生。作者对大量茶碱中毒的病人进行前瞻性分析 ,以进一步确定
进行工业结构调整、加快产业结构优化升级,是石家庄市党的九代会的要求,也是转变经济发展方式,促进经济全面协调可持续发展的需要。当前石家庄市的工业结构优化升级的重点应
氯霉素(Chloramphenicol,CAP),作为一种广谱类抗生素,广泛应用于食用动物的饲料中。然而,长期使用氯霉素,会对人体的骨髓造血系统和神经系统等造成损害。因此,对人体的健康而
本文主要是在非对称损失函数Linex损失下研究指数分布参数、指数-泊松分布参数以及对数正态分布参数的Bayes估计及性质。本文第一部分首先简要介绍了经典统计方法中的参数估