手写维吾尔文字识别若干关键技术研究

来源 :西安电子科技大学 | 被引量 : 13次 | 上传用户:sdrtgwdrtwertwert
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相比拉丁字母、汉字等文字,目前对自然草体文字如阿拉伯文、维吾尔文的手写识别研究相对较少。本文研究脱机和联机手写维吾尔文字识别方法,包括字符识别、字符分割和单词识别等几个关键性技术。针对维吾尔128类字符,提出基于部件分解和融合的手写字符识别算法。首先构建手写维吾尔部件库和字符的部件字典,将字符分解为主体、附加和点三类部件,并结合连笔分析获得较鲁棒性的部件描述;其次,针对各类部件的不同特点设计相应的特征抽取和分类器,通过部件匹配来检测和辨识相似字间的微小差异;为减轻手写字符拓扑变形造成的干扰,对联机部件提取一种统计特征即时分方向特征;最后,对多个部件的分类输出进行融合,获得字符识别结果。提出字符识别的多部件自适应融合策略。提出一种实时的融合系数计算方法,利用部件匹配测度分布来估计其权重,以实现部件的自适应融合。提出基于加权和、基于朴素贝叶斯模型、以及基于改进D-S证据理论的部件融合算法。对比实验证实,基于改进D-S证据理论的融合算法能够克服加权和融合鉴别能力较弱、以及贝叶斯融合对噪声过于敏感等缺点,有效提升了字符识别算法的识别率和稳定性。针对维吾尔词书写粘连和手写笔画漂移等问题,提出基于多信息加权融合路径寻优的字符分割算法。首先,提出基于主体切分和附加聚类的字段过分割算法,并通过字段模糊匹配获得鲁棒的字根序列描述;然后,建立匹配位置高斯模型来估算字段匹配信息,以抑制笔画漂移造成的干扰;最后,构建字符序列二阶Markov语言模型,并基于Bayes准则提出单词后验概率的多信息加权融合计算方法,综合字段匹配、字符识别和语义信息,对字段匹配及字根合并的路径进行寻优,以最佳分割路径得到字符分割结果。提出一个结合反馈结构和字段分析的手写维吾尔单词识别系统。为克服顺序结构中的错误累积问题,该系统构建反馈结构,通过对字段形态错误、字符识别错误和单词匹配错误三种反馈信息的估计和响应,来控制字符分割和单词识别的结果。首先,过分割单词图像得到主体和附加字段序列;其次,根据反馈信息设计字段合并策略,以获得最优的字符分割序列;然后,利用字符分割时所获取的结构信息,设计多级混合维吾尔字符分类算法,以提升字符识别准确性;最后,提出双层动态时间规整算法,通过字符序列匹配获得单词识别结果。
其他文献
运用网络调查法、文献调查法和统计分析法对加拿大公共图书馆特色数据库的数量、来源、主题、类型等内容进行研究,分析得出加拿大公共图书馆特色数据库具有以馆际合作和外购
随着近些年电子信息和数据的爆炸性增长,数据去重和差量压缩作为有效检测和消除大规模备份系统中冗余数据的关键技术,获得了越来越多的关注。相对于传统的哈弗曼编码和字典编
文章从青海省生态旅游业的现状入手,以SWOT分析为依据,分析青海省生态旅游产业的优劣势及面临的机遇和威胁,进而提出青海生态旅游业发展的对策建议,由此希望提升青海生态旅游
视频图像序列中运动目标的检测、跟踪与识别是当前计算机视觉领域的研究热点,目标的检测与跟踪是为了准确地从背景中找到目标,从而为目标的识别与行为分析提供更加精炼、准确
企业在当前时代的发展当中,要想获得最大的经济效益,必然离不开全面的预算管理以及相关的控制措施,在ERP系统环境下,为了提高企业全面预算管理的实际效用,有待于建立完善的预
研究了承受复杂载荷结构危险工况选择及其变形和应力计算的策略,开发了相应的计算机程序,并以WY—501液压挖掘机底座结构为例进行了成功的应用。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:研究血清白介素及血小板活化指标与脑梗死的关系。方法:选取于本院进行诊治的58例脑梗死患者为观察组,同时选取同期的58例健康人员为对照组,将两组研究对象的血清白介素
以北戴河为例,从海滨旅游度假区季节性供求特征入手,分析了突出的季节性供求矛盾对海滨旅游度假区发展的影响,提出解决海滨旅游度假区季节性供求矛盾的主要措施.
课堂是学习知识与获取能力的场所,课堂倾听习惯、技能、素养可影响学习效率,如果课堂中认真倾听的学生寥寥无几,则难以维持课堂纪律及获得预期教学效果。在小学语文课堂中应