基于深度学习的西夏文古籍文献识别研究与实现

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:krist2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
西夏文古籍文献作为记载西夏王朝的资料,已成为研究少数民族古籍的重要载体,及时准确的识别并翻译西夏文字,有助于推进西夏学研究具有举足轻重的意义。此外,随着深度学习的蓬勃发展,神经网络具有自动提取文字特征并且识别效率高等优势,逐渐成为了文本识别的重要手段。然而,现有的西夏文古籍文献中存在字体相似度高,识别准确率较低,同时识别模型参数量大的问题。因此,针对上述问题,本文以自制的西夏文数据集为基础,采用深度学习算法进行文本检测和文本识别研究。本文研究的主要内容如下:(1)针对西夏文古籍文献标注困难,传统检测算法效果欠佳的问题,采用一种基于迁移学习的CRAFT西夏文文本检测模型。根据CTW-1500中文数据集得到预训练的CRAFT文本检测模型,进而将该模型应用于自制的西夏文数据集。实验结果表明,与传统的检测算法相比,基于迁移学习的CRAFT检测模型在西夏文数据集中有着较好的检测效果。(2)针对传统的卷积神经网络参数量大和西夏文字识别准确率低的问题,提出一种基于DS-CBAM-DenseNet的西夏文字识别模型。首先,本文采用DenseNet模型为基础,并在该模型中用深度可分离卷积代替传统卷积,可以大幅度减少模型参数量;然后,在该模型中融合注意力(CBAM)模块,使得该模型能够抑制背景信息,让模型更关注西夏文字笔画特征,从而有效提高该模型的识别准确率;最后通过实验结果表明,在单个西夏文字识别中,DS-CBAM-DenseNet网络模型在大幅度减少参数量的同时,还保持着较高的识别精度。
其他文献
BN纳米单层,一种蜂窝状二维纳米材料,由于其质量轻、比表面积大、耐热、抗氧化性强等诸多优异性能,在新兴纳米材料领域受到广泛关注。本文基于密度泛函理论框架下的第一性原理计算方法,系统地研究了完整BN纳米单层、缺陷BN纳米单层和金属修饰缺陷BN纳米单层的结构、电子特性和储氢性能。主要得到以下结果:(1)系统地研究了完整和缺陷BN纳米单层的结构和电子特性。研究结果表明,完整BN纳米单层为无磁性宽带隙半导
学位
近年来,计算机视觉算法在户外视觉系统得到了快速发展。然而,在各种户外视觉系统应用场景中,恶劣天气常常会降低拍摄图像质量,影响系统性能。下雨是最频繁的恶劣天气之一,雨纹、雨滴或雨雾会导致获取的图像背景被遮挡或模糊不清,严重影响了户外视觉系统的应用和相关图像处理算法的性能。因此,检测和去除图像中的雨纹、雨滴或雨雾是计算机底层视觉任务亟待解决的重要问题,对目标检测识别、分割和监控等高级视觉技术的提高具有
学位
随着“双碳”目标的确立,构建以新能源为主体的新型电力系统已经成为能源行业的重要发展方向。作为现阶段发展速度最快、应用最为广泛的清洁能源技术之一,光伏发电必将获得更为广阔的发展空间。作为发展大规模光伏发电产业具有特殊优势的荒漠化地区,大气气溶胶浓度高,大量小颗粒物会沉积在光伏板表面,严重影响光伏系统的正常运行,甚至影响其使用寿命。同时,这类地区夏季辐射强、光伏板温度过高,给光伏发电带来了一定的负面影
学位
碳纳米管的发现和石墨烯的合成标志着低维维材料正式问世。相比于块状材料,其具有独特的结构特征和优良的物理特性,已经引起研究人员广泛的关注。随着越来越多的二维材料在实验上成功合成,第一性原理计算为二维材料的探索和预测提供了理论基础。其中,Ⅲ-Ⅴ(Ⅵ)族化合物材料性质优异,可以广泛地应用到电子器件、光电探测、太阳能和催化等领域。因此,在设计微纳米光电器件时,探究低维纳米材料的光电性质十分关键。基于密度泛
学位
Ⅲ-Ⅴ族窄带隙半导体GaSb以其优异的光电性能在红外探测和热光伏电池等领域有着广阔的应用前景。然而受本征材料的禁带宽度限制,GaSb半导体的光谱响应范围较小,带隙尽可能低的GaSb可应用于低频波段相关的光学器件中。本文用第一性原理方法实施研究,主要研究了应变及4d过渡族金属(Transition Metal,TM,本文中TM=Ru、Rh、Pd)掺杂对GaSb电子结构和光学性质的影响,通过能带结构和
学位
自20世纪初,金属与电介质相邻界面上的表面等离激元(SPP)引起学者普遍关注。Ebbesen团队于1998发现了金属亚波长孔阵列上出现的异常光学透射(EOT)现象,并用SPP解释该现象的物理机理,此后SPP的研究备受研究者青睐。异常透射除了有较多的应用潜能外,还存在诸多,甚至相互矛盾的物理成因解释,因此亚波长孔阵列出现的异常透射现象成为研究热点。到目前为止,关于促成异常透射现象的物理机制,被广泛认
学位
钠离子电池因与锂离子电池有着相似的工作原理而备受各界关注。作为钠离子电池的重要功能组成部分,正极材料是决定钠离子电池整体性能的关键因素之一。在众多正极材料中,P2型层状锰基氧化物因具有理论比容量大、结构稳定性高和毒性低等优点成为最具应用前景的钠离子电池正极材料之一。然而,在Na+脱出/嵌入过程中,Jahn-Teller效应、多相不可逆转变、电解液分解等问题,导致晶体结构稳定性和电化学性能严重恶化。
学位
从视频估计人体3D运动姿态和形状是计算机视觉和图形领域的一项具有挑战性的任务,准确且时间一致的人体建模对于一些广泛的应用至关重要,包括角色动画、理解人类社会行为和AR/VR界面。从单目视频序列中准确捕捉人体运动仍然具有挑战性,并且捕捉到的人体运动的时间一致性对建模质量有很大的影响。当试图从一系列视频图像中定位人体姿态的3D参数时,由于背景变化、摄像机移动和灯光变化,人体的姿势和形状往往会随着时间的
学位
工程设计和自然科学以及社会经济的很多问题都可以描述为最优化问题,使用高精度求解算法对最优化问题进行求解一直是研究的热点和难点。作为一种群智能优化算法,鲸鱼优化算法具有优良的全局寻优能力,而且相对于经典粒子群优化算法,它具有计算简单、拥有较少的参数等优点,而在众多不同的领域应用较为宽泛。但是,基本鲸鱼优化算法在处理复杂的优化问题时仍然存在收敛速度慢、计算精度低、易陷入局部最优等问题。针对这些问题,本
学位
医学影像分割是医学影像分析的核心任务,随着计算机技术及人工智能的发展与普及,医学影像分割潜在的应用价值受到了广泛的关注,脊柱分割作为医学影像分割中一个重要的方向,在临床实践中,退行性脊柱疾病方面的治疗更多的还是依赖于医生的经验,虽然现有的脊柱分割方法在无偏且数据集数量较大的条件下表现良好,但是在真实条件下,由于影像数据收集难度较大及收集过程中病人个体因素,导致不同脊柱类别样本数量不均衡,进而限制了
学位