西夏文字光学识别研究

来源 :宁夏大学 | 被引量 : 0次 | 上传用户:lisong459
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字识别是集模式识别、图像处理与文字处理技术于一体的一种新技术,是模式识别和人工智能领域的一个研究方向.目前,西方文字和汉字的印刷体识别经过了多年的探索和实践,已经走向了实用化.西夏文字是记录古代西夏主体民族-党项族的语言和文字,是研究西夏文化的重要手段.西夏文字识别可以广泛应用于西夏文字信息处理的各个领域,如新闻出版印刷业、古籍资料的整理和研究、西夏文字数字图书馆等.为了更好的进行西夏文字处理,急需开发西夏文字识别软件,将西夏文字资料及图书输入到计算机中保存起来,以方便学习和研究.   本文围绕手西夏文字识别研究的难点,从西夏文献图片的预处理、弹性网格划分、笔画方向分解特征和Gabor特征的提取以及Bayes分类方法四个方面对西夏文字识别进行了综合的研究,主要工作包括:   1、西夏文献图片预处理:对西夏文字文字图片进行二值化、去除噪声、细化等预处理,并对西夏文献中的西夏文字按照书写方法实现了单字的切分.   2、西夏文字的弹性网格划分方法:对西夏文字划分各种弹性网格,以最大限度的消除西夏文献中文字书写各异、手写风格等引起的旋转变形、伸缩变形、笔画位置不稳定等问题.   3、西夏文字特征提取:根据西夏文字的特点及笔划分布的统计特征,对西夏文字进行横竖撇捺四方向的分解,对分解后的各分向量的像素在弹性网格上进行统计而提取特征,并使用LDA方法压缩提取特征以提高识别的性能.   4、Bayes分类方法分类西夏文字:讨论了使用欧氏距离、街区距离、带偏差的欧式距离等距离测度方式下Bayes分类西夏文字,实验证明使用了带有二阶统计特征的距离测度方式可以提高西夏文字识别率.
其他文献
目前,大部分高校行政管理工作水平还停留在各自为政、手工化操作阶段,缺乏一个统一的、信息化的办公平台。而一个学校的行政管理水平间接地影响其教育教学水平,所以,开发出一套专
本文分析了织物染色配色的意义和方法,将数学建模思想引入织物染色配色过程,并在此基础上研究了基于织物染色的计算机配色模型的求解方法。在织物染色配色领域中,计算机技术
随着计算机和网络技术的不断发展,信息化已经深入到社会发展的方方面面。在企业方面,将原有的业务体系信息化网络化已经成为一个非常迫切的问题。杭州市公共交通集团有限公司的单车核算系统就是在这样的背景下提出并研发成功的。该系统在现有的几个信息化管理系统的基础上,整合了相关的数据,实现了对单车,线路,车队,营运公司,集团公司的成本核算和利润的综合统计,为领导层提供了公司运营财务状况的详尽信息。本文在实现了单
从20世纪50年代GIS(Geographic Information System)系统起源以来,经过四、五十年的发展,伴随着计算机科学的日新月异和网络的不断普及,GIS系统也逐步走向了网络平台。随着We
二十世纪九十年代以来,随着运动捕获技术的兴起及运动捕获设备的发展,大量的具有较强真实感的人体运动捕获数据被生成并广泛地应用于计算机动画制作的各个领域:游戏、影视、
随着无线通信技术的持续发展和手机功能的不断增强,手机电视已经成为无线通信技术领域的一个新兴热点。DVB-IPDC作为满足手机电视商用需求的一个重要标准,在全球业界具有非常广
开展月球探测工作是我国迈出航天深空探测第一步的重大举措。实现月球探测将会使我国将实现深空探测零的突破。在真实应用月球探测方案之前,如若使用可视化仿真技术对其方案
早期的经典关系数据库理论,在数据库应用中发挥了巨大的作用。随着数据库理论的深入研究和发展,人们将经典关系数据库理论推广与改革得到了非经典关系数据库理论。非经典关系
随着企业的信息化建设以及网络的发展和普及,大量的异构数据源应运而生。为了更好地利用这些资源,人们迫切需要解决这些异构数据源的集成问题。异构数据源集成的主要任务就是屏
领域工程是实现系统化软件复用的关键技术,它为特定领域建立可复用的软件资产,并提供了复用这些软件资产的机制和方法。论文基于领域工程的研究方法,对网络评审进行了领域分