基于优化分割与提取的西夏古籍文字识别研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:hb9527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,人工智能的理论及技术日益成熟,应用领域也在不断扩大。本文将人工智能技术应用于古籍文献的保护,使其在古籍文献保护中发挥出应有的作用。计算机字符识别(OCR)是人工智能识别西夏文字的常用方法,其基于人工智能算法来识别文字符号的数字影像,将其转换为数字文本,达到可识别的目的。本文以西夏文字古籍金光明最胜王经卷一为例,研究应用先进人工智能领域的热点算法实现对研究对象的自动识别。西夏文字是仿照汉字制造而成,其字形相比汉字更为相近且笔画繁多,以会意字居多,象形字很少。在识别过程中,存在的难点有:1.西夏文字的字符集较大、结构复杂、字符之间相似度极高;2.手写的西夏文字粘连严重,图像分割更加困难。在研究过程中,借鉴了汉字的识别方法不断提高基于人工智能技术的西夏文字识别的识别率。本文所做具体工作有:1、介绍了西夏文字的研究背景、古籍信息化保护的意义以及国内外研究现状;2、对古籍图像作预处理及古籍图像分割,其中包括:古籍图像二值化、数学形态学处理,以及边缘检测和连通域分析算法相结合的古籍图像分割;3、对分割后的西夏字符采用三线性插值算法作方向梯度直方图的特征提取;4、基于三类分类器(SVM、RF、K-NN)的西夏文字直方图特征的识别作比较,得出本文实验识别率最高的算法。
其他文献
全日制和非全日制研究生纳入统一招生,要求坚持统一标准,保证同等质量.非全日制研究生学习形式灵活,思想呈现特殊和复杂性,面对招生并轨机制这一新形势需要切实加强非全日制
目前,我们国家通常使用静载荷试验法对基桩实施检测,此法是一类最稳妥的办法,不过有些桩设计的承载量特别大,其体积巨大,重量巨大,对该类桩进行检测,所用到的检测装置,不但价格高昂,而且较为沉重,需要较长的时间方能检测完毕,需要较大占地面积,在对一些特别的施工地以及重量较大的桩实施承载力检测时,很难达到要求,如今此类检测就很难适应于云南省的实际情况,此时,应用桩承载力自平衡检测法则能够很好的克服这一难题
BACKGROUND Isolated splenic metastasis is a rare clinical entity.Multiple metastases in the spleen after radical colon resection in a patient who subsequently u
从档案工作实践出发,探讨了新时期高校档案编研工作存在的问题和解决方法,指出高校档案信息资源的开发关键在编研,阐明了编研工作的质量和效率取决干编研工作人员的综合素质等因
剖析我国计划经济体制时期和转入市场经济体制时期培养竞技体育后备人才机制的不同特质,指出竞技体育后备人才培养在转型期国家、集体、个人三方利益分化加剧、协调各层次利益
本文阐述《大学英语精读》在教学过程中,课文的题目对课文内容的引导作用与地位,以及对课文写作的意义。
BACKGROUND D-dimer,a soluble degradation product of cross-linked fibrin,is commonly used as an important marker for the diagnosis of disseminated intravascular
随着经济全球化和生产国际化的不断增强,加工贸易成为世界一种普遍的贸易方式。在“一带一路”倡议的助推下,经过40多年的发展,我国的加工贸易取得了较大成功。在看到成绩的同时,我们应该深刻地认识到我国的加工贸易仍然存在产品附加值低、产业上下链发展不平衡、对国外的依赖重等问题。由于经济全球化进程加快,我国低成本劳动力的优势逐渐削弱,OEM的问题不断凸显。虽然我国的企业在生产成本上具有优势,但是仍然需要学习
市场竞争加剧和顾客需求多样化加剧了供需的不平衡,并由此导致了缺货与滞销并存,造成顾客满意度的降低和顾客群体的流失。现有库存充足可以提高顾客满意率,不会发生缺货损失,
BACKGROUND Data regarding the neuroradiology features of the West Nile virus neuroinvasive disease(WNV NID)is rather scarce.To contribute to the knowledge of th