朝鲜语古籍文字检测与分割方法的研究与应用

来源 :延边大学 | 被引量 : 0次 | 上传用户:ruqianwusan3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
朝鲜语古籍是记录朝鲜族数千年发展历程中有关历史、政治、文化等信息的重要载体。先进的古籍文字检测方法和技术可以促进朝鲜语古籍文本图像的再生性修复、文字识别等古籍数字化相关环节。目前国内有关汉语、藏语、蒙古语以及彝语等古籍文字检测和数字化工作成果显著,但是朝鲜语古籍的数字化进程严重滞后,有关朝鲜语古籍文字检测方法的研究文献非常少。朝鲜语古籍文字检测面临着各种挑战,一是混排的汉语和朝鲜语的字体形状、书写规则、排版形式等方面存在差异,二是不同文字的文字尺寸差异较大以及朝鲜语古籍文献具有手写体特点,三是古籍可能出现的破损、模糊等退化现象。为此,本文提出了一种针对朝鲜语古籍文字检测的HRCenter Net改进模型,并在此模型上设计和实现了朝鲜语古籍文字检测与分割原型系统。首先,针对朝鲜语古籍图像中字符的精准检测问题,本文通过在HRCenter Net的残差结构中引入了Involution算子,提高HRCenter Net基线模型对文字全局特征的提取能力。在此基础上,为评估不同分辨率通道的重要性引入了通道注意力机制ECA(Efficient Channel Attention)。这样,构建的基于Involution算子和ECA的IENeck模块既可以通过注意力自动学习每个通道的重要程度,也可以通过Involution算子提高模型的局部感受野。然后,本文通过实验验证引入IENeck模块来获得更精准朝鲜语古籍文字检测结果的可行性。其次,为解决朝鲜语古籍标注数据集不足的问题,将汉语古籍数据集上的预训练模型迁移到朝鲜语古籍文字检测的任务中。引入迁移学习的主要依据是朝鲜语和汉语文字都是方块文字,尽管汉字是象形文字,而朝鲜语文字是字母文字,但是两种文字具有一定的结构相似性,因此预训练模型源域提取的文字结构特征迁移到朝鲜语文字检测的目标域中,有助于改善目标域模型的性能,而不会出现负迁移。朝鲜语古籍文字检测实验结果表明,在IOU阈值分别取0.7和0.8时,引入IENeck模型的查准率、查全率和F1指标明显优于基线模型和其他典型的目标检测模型。在进一步采用迁移学习预训练模型后,检测模型性能指标得到了显著改善,且阈值越高模型的改善程度越好。另外,汉语古籍文字检测实验结果也表明,IENeck模块的引入提高了汉语古籍文字检测的准确率。综合以上实验结果,本文提出的朝鲜语古籍文字检测方法可以准确地检测文字边界位置,满足朝鲜语古籍文字检测任务要求。设计和实现的朝鲜语古籍文字检测与分割原型系统,核心技术采用本文提出的改进HRCenter Net模型。系统设计的主要模块满足实际应用的基本功能需求,系统测试结果表明原型系统可以实现对朝鲜语古籍文字的检测与分割,具有较好的实用和推广价值。
其他文献
目的:应用经颅多普勒超声(Transcranial dopplersonography,TCD)观察大脑中动脉(Middle cerebral artery,MCA)狭窄患者微栓子信号(Microembolic signals,MES),探讨微栓子信号与大脑中动脉的狭窄及其诱发的缺血性脑卒中的相关性,为缺血性脑血管病的发生与发展提供临床数据。方法:首先,将符合纳入标准的研究对象分为经头部核磁共振成
学位
聚氨酯注浆加固材料在煤矿井下使用过程中需保证其力学强度及降低材料注浆过程的反应温度,因而针对添加阻燃剂和通过化学反应以改变材料结构的阻燃改性方法研究极其重要。为了有效提升聚氨酯加固材料力学性能和阻燃性能,在聚氨酯加固材料B组分中引入异氰酸酯和扩链剂预聚工艺,有效合成MDI-TMP加成物,从而整体提高硬段交联程度。通过红外光谱、万能力学试验机和热重、凝胶渗透色谱研究预聚温度对MDI-50型聚氨酯加固
期刊
现阶段,细菌耐药性问题日益严峻,而耐药菌近年来在全球范围内迅速而广泛地传播,导致新型抗耐药药物的研发面临着严峻考验。据不完全统计,地球上存在着500多万种真菌,大约300多种会导致人类患病,其中有20-25种真菌会经常导致疾病的发生。真菌感染发生在世界人口的四分之一以上,但真菌感染造成的巨大负担被低估了。大多数真菌感染是浅表的,易于治疗。然而,真菌也会引起与超过50%的死亡率相关的侵袭性疾病,估计
学位
目的:研究马克斯克鲁维酵母发酵人参对NPPA基因敲除鼠的血压调节作用及其降压机制的初步探讨。方法:实验分为:C57BL/6野生型小鼠组、NPPA纯合子基因敲除鼠(NPPA-/-)组、NPPA杂合子基因敲除鼠(NPPA-/+)+高盐高脂饮食组(均喂养2周),每组12只。每组小鼠再分为马克斯克鲁维酵母发酵人参冻干粉灌胃组和普通人参冻干粉灌胃组,每组6只。每组小鼠灌胃前2周开始每日上午7时测量血压、测定
学位
低龄儿童龋病具有患病率高、发病时间早的特点。目前我国低龄儿童的口腔健康状况问题突出,亟待解决。龋病是口腔内多种微生物共同作用的结果,是口腔微生态平衡被破坏的一种病理表现。研究牙菌斑生物膜和唾液中口腔微生物群落在特异性位点、随龋病发生发展和治疗前后菌群多样性和结构变化,将有助于我们从微观水平上发现龋病相关核心微生物组,寻找龋病相关生物标志物,并为龋病的监测和预防提供敏感快速、特异的指标。本文将针对这
期刊
目的:探讨在慢性肾脏病(Chronic kidney disease,CKD)非透析患者体内成纤维细胞生长因子-23(Fibroblast growth factor-23,FGF23)、Klotho蛋白(Klotho)含量与矿物质代谢异常及左心室肥厚(Left ventricular hypertrophy,LVH)的关系。方法:选取2021年2月至2021年8月就诊于延边大学附属医院并明确诊断
学位
目的:龋齿以及其他口腔问题在低龄儿童中具有较高的发病率,与口腔管理不当有非常密切的关系,本次研究对我院日托班入园前儿童进行口腔保健管理模式,并分析这种方式的应用效果。方法:选取本院2019年1月至2020年12月日托班入园前的120例0~3岁低龄儿童为研究对象,根据口腔保健管理模式的不同分为对照组和观察组,各60例。对照组儿童采用常规管理模式,观察组儿童采用强化口腔保健管理模式,比较两种模式的应用
期刊
<正>意大利裔的美国演员阿尔·帕西诺在影片《闻香识女人》中扮演了双目失明的弗兰克中校。弗兰克中校是曾经的英雄、总统的幕僚,但双目失明后自暴自弃,决定最后一次享受生活然后自尽。他成功饰演这一角色并凭借该片表演获得第65届奥斯卡金像奖最佳男主角和第50届金球奖最佳男主角。他向来不走保守路线,喜欢更具挑战性的角色,把每一次表演都当作是第一次表演。一、电影表演中被忽视的“表情动作”阿尔·帕西诺在影片中贡献
期刊
现如今深度学习技术已经应用到了各个领域中,在计算机视觉领域中已经占据了主导地位。图像识别是计算机视觉领域的基础任务,大多数视觉任务都需要根据图像识别的结果来进行下一步操作,所以对图像识别的研究尤为重要。近几年我国进入大数据时代,随时随地都会产生海量的图像数据,如果可以得到充分利用,将大大推动基于图像识别的深度学习技术的发展。但是,现在的深度学习技术主要使用标记数据进行训练,除了少量人工标记的数据外
学位
问题式教学是用“问题”整合教学内容,以问题为纽带,引导学生运用地理思维方式进行情境问题探究解决的一种教学方式。本文以“交通运输方式和布局变化的影响”为例,围绕创设问题情境、设计问题链、迁移运用等内容,探寻更好地培养学生地理学科核心素养的路径。
期刊