基于卷积神经网络的东巴文字分类与识别

来源 :云南大学 | 被引量 : 0次 | 上传用户:matrix521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符识别是集模式识别、图像处理和文字处理技术相结合的一种技术,是人工智能和模式识别领域一个重要的分支。通过多年的研究和探索,字符识别在英、德、拉丁语等西方文字和汉字的识别研究中已取得令人满意的结果。东巴文字作为唯一仍在使用的象形文字,具有独特的历史价值和丰富的文化内涵,但对东巴文字的分类识别工作起步较晚,研究还不够深入。字符识别领域内经常采用特征提取法加分类器的传统方法进行研究,这种方法依靠具体算法来提取文字特征,提取特征算法针对性太强,泛化性差。卷积神经网络的出现将特征提取简单化,网络能够从海量数据中自动提取到有效特征,因此在字符识别领域的研究迅速取得了巨大的进展。本文结合图像处理和数据增强,提出基于卷积神经网络的东巴文字分类与识别的方法。本文所做的工作如下:(1)针对东巴文字数据集较少的问题,首先结合东巴古籍和东巴文字输入法构造原始数据集;然后通过二值化、字符分割和归一化等图像预处理,将图像拆分成便于研究的单个东巴文字;最后运用数据增强的方法,利用衍射变换和噪声抖动等对原始数据集进行了扩充,将原始数据集从956张扩充至30592张。(2)针对人工构造的东巴文字数据集,采用四种不同卷积神经网络(ResNet-18,VGGNet,AlexNet,LeNet)在东巴文字上的分类进行比较性研究。通过实验发现在ResNet-18网络在东巴文字分类问题上取得了较好的分类精度,并通过加入预训练网络、改变优化器等改进措施进一步提高了网络性能,最终达到92.3%的分类准确率。(3)在研究东巴文字语义识别过程中,由于东巴文字样本数量少,语义类别多,采用单例学习的方法,并设计孪生网络,将变换后的形状特征和词向量比较,协同进行东巴文字语义识别。实验结果表明,该网络在东巴文字数据集上取得85.6%的识别准确率。综上,本文人工构造了东巴文字数据集,将卷积神经网络运用于东巴文字分类和识别研究,并取得了较好的分类及识别准确率。对于东巴文字保护和传承起到积极作用,同时为其他少数民族文字识别问题提供借鉴意义。
其他文献
元代汪古部的农牧业技术内蒙古文物考古研究所盖山林内蒙古农牧学院农经系盖志毅汪古部是从唐末到明初长期活动于今内蒙古大青山南北的一个部族。元代是汪古部的鼎盛时期。其
随着科技的进步与发展,数字图像也越来越普及,随之各种功能强大的图像编辑软件也应运而生,诸如Adobe Photoshop、PortraitPro Studio Max、美图秀秀、GIMP和Snapseed等,给人们提供了很多便利,照片持有者对一些人脸数字图像进行编辑和修改也就变得轻而易举。经过编辑和修改后的数字图像可以变得赏心悦目,描绘出的完美的身材和无瑕疵皮肤的人物图像也给人带来视觉上的享受体验
一个债转股项目的成功不仅在于债权转化为股权,实施机构顺利退出并实现盈利才是债转股项目真正成功的体现。债转股项目中股东退出的各种理论及实践方式具有一定可行性,但也必
自身免疫性溶血性贫血(AIHA)是由于机体产生抗自身红细胞的抗体,使红细胞加速破坏而导致的一种贫血。同时又由于这种抗红细胞自身抗体存在着类型的差别,而型别又与疾病的严重度
随着机器人技术的迅猛发展,水下机器人应用于海洋勘测和海上搜救的案例越来越多,为实现近海特定生物跟踪调查和近海自主搜索救援等任务,本课题组提出了一种小型两栖球形机器
近几年,上市公司业绩增速整体放缓,商业银行不良贷款率持续上升。新经济形势下,中央再次推出债转股,实施这一政策既为商业银行带来积极影响,但也存在一些弊端。商业银行必须
本文以随笔“女性的第三世界”(“The Third World orld of Women”于1973年发表在“党派评论”上)为目标文本,笔者运用翻译文体论指导翻译实践、思考并探索本篇随笔的翻译策
目的通过对耐碳青霉烯类肺炎克雷伯菌(carbapenem-resistant Klebsiella pneumoniae,CRKP)和非耐碳青霉烯类肺炎克雷伯菌的分离结果和耐药性分析,为临床提供合理治疗方案。方
对再生混凝土梁进行受弯性能试验后发现,当再生粗骨料(RCA)取代率(质量分数)为40%,70%和100%时,再生混凝土梁极限承载力较普通混凝土梁分别降低了1.5%,4.1%和10.6%;随着再生
党的十九大报告中提出乡村振兴战略,并将乡村振兴战略纳入实现两个“百年计划”的七大战略之一。乡村振兴战略是党和国家解决农业农村农民问题的总抓手,产业兴旺和产业振兴是