基于多尺度特征融合的东巴文识别研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:apple2008zxffxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中国云南省丽江市生活着一个古老的民族——纳西族,在历史的长河中,纳西族人以其智慧与勇气孕育出了具有独特味道的东巴文化,这对中国古文化的发展影响深远。东巴象形文字,作为东巴文化的代表之一,其主要由纳西族历代东巴所使用,因此又称东巴文。目前,能识读东巴文的人越来越少,东巴文面临无人识读的境遇,东巴文的数字化建设迫在眉睫。高效且准确的东巴文识别研究作为东巴文数字化建设中的关键一环,其具有极其重要的历史价值和文化价值。论文提出一种基于多尺度特征融合的东巴文识别模型,与其他识别模型相比的优势在于,该模型充分考虑了东巴文中存在大量相似文字,以及自然场景下的不可控因素对识别带来的影响,以此为动机对Res Net34模型进行改进,使模型具有较高的识别准确率和较强的鲁棒性。论文主要工作包括以下方面:(1)整理构造东巴文相关数据集。经查阅,目前并没有正式的东巴文相关数据集被公开,论文利用东巴古籍《创世纪》以及东巴文输入法(电子东巴)收集整理后构造数据集。最终获得三个数据集,包括:普通文字数据集DB1424,相似文字数据集DBS20,自然场景文字数据集CDB1。数据集DBS20使用训练好的孪生网络检测相似文字的相似性,使数据集更具可信性。(2)提出基于多尺度特征融合的东巴文识别模型。东巴文存在诸多的相似文字,若单一使用现有的识别模型进行识别,相似文字的存在会严重的影响识别效率。此外,由于东巴文字形带有浓厚的图画特点,具有较为明显的形状特征,考虑将具有更多结构信息的HOG(Histogram of Oriented Gradients)特征融入识别模型。论文针对以上情况提出了一种基于多尺度特征融合的东巴文识别模型。识别模型以Res Net34为基础网络,将网络输出的浅层结构特征与深层语义特征,和提取到的HOG特征进行融合,构成的多尺度融合特征作为分类器的输入,并输出结果。使用多尺度特征融合的识别模型能学习更多细节特征,具有更强的特征学习能力。(3)设计开发移动端东巴文拍照识别APP,简称“东巴通”。由于类似的OCR系统,多以汉字、英语或其他语言为主,目前并没有此类古文字OCR系统出现,因此,设计开发“东巴通”具有较强的适用性和必要性。基于上述东巴文识别模型和方法,论文设计开发的“东巴通”,能够实现将不认识的东巴文手机拍照上传至后台服务器,服务器接收移动端传入的东巴文图片后,使用识别模型进行识别处理,而后将识别结果返回移动端,并展示在用户界面供用户参考。
其他文献
多院区发展是公立医院借资源要素扩展增强发展动能的主动调整,如何将优势资源转化为多院区高质量发展的领跑力,核心在于功能学科定位的差异化,重点在于运营管理的一体化、技术服务的同质化、资源业务的协同化。中山大学肿瘤防治中心以病患需求为中心,以延伸式管理体系、同质化医疗品质和差异化发展策略为抓手的多院区高质量发展管理实践,实现了规模与效益的统筹兼顾、发展速度和服务质量的协调平衡。在此基础上,全文探讨了一个
<正>肿瘤在本质上属于基因病,遗传、各种环境的致癌因素以协同或序贯的方式引起DNA损害,激活原癌基因和(或)灭活肿瘤抑制基因,引起肿瘤[1]。近年来,在一系列因素的共同作用和影响下,肿瘤发病率在全世界范围内呈现持续上升趋势,成为影响人们身心健康、生命安全的重要疾病。数据调查资料显示,恶性肿瘤已居于我国城市居民死亡原因的第一位,农村居民死亡原因的第二位[2]。基于此,如何进一步提高肿瘤防治效果是未来
期刊
背景与目的:心脑血管疾病是人类健康的头号杀手,动脉粥样硬化(atherosclerosis,AS)是心脑血管疾病的共同病理基础,AS的有效防治对减少心脑血管疾病发病率具有重要意义。脂代谢紊乱是AS的主要病理基础,近期发现肠道菌群与AS、高脂血症等慢性疾病密切相关。定心方Ⅲ号方(Dingxin Recipe Ⅲ,DXR Ⅲ)是治疗AS的经验方,文献研究发现其主要成分包括栀子苷、丹参素、阿魏酸(Fer
学位
1931年“九一八”事变的爆发极大地影响了中国政治的发展,同时对中美关系的发展也产生了重大影响。美国的中国形象的发展变化与中美关系的变化密不可分。1931到1949年成为中美关系史上,同时也是美国的中国形象建构史一段特殊的历史时期,曾被美国史学研究者T·克里斯托弗·杰斯普森(T.G.Jespersen)称为中美关系“辉煌的18年”。本文的重点是从“形象”的视角考察1931-1949年间林语堂创作的
学位
学位
学位
建立了二维超高效液相色谱-四极杆/飞行时间质谱法(2D-UPLC-Q/TOF-MS)对替考拉宁组分分离和杂质结构解析的分析方法,有效地解决了流动相中含不挥发性磷酸盐的色谱系统不适用于液相色谱-质谱快速鉴定替考拉宁杂质的难题。一维超高效液相色谱以Octadecyl silica (ODS) hypersil色谱柱(250 mm×4.6 mm, 5μm)进行色谱分离,以3.0 g/L磷酸二氢钠溶液(p