【摘 要】
:
大多数少数民族地区的语言及文字信息化发展相对滞后是我国的现状,傣族地区也不例外,而目前联机手写体新傣文字符识别的研究相较于汉字、维吾尔字符和藏文字符等识别研究少之
论文部分内容阅读
大多数少数民族地区的语言及文字信息化发展相对滞后是我国的现状,傣族地区也不例外,而目前联机手写体新傣文字符识别的研究相较于汉字、维吾尔字符和藏文字符等识别研究少之又少。研究联机手写体新傣文字符识别技术有利于加快傣族文字信息化进程和对传统文化的继承与保护。本文的主要工作包括新傣文字符样本采集、预处理、代表性特征的提取以及研究了两种联机手写体新傣文字符识别的方法,分别是支持向量机(SVM)和在线随机森林(ORF)算法。在预处理阶段,本文主要采用了三点平滑算法、归一化处理、插值运算和重采样。在对联机手写体新傣文字符预处理结束后需要进行特征提取,它是字符识别中的关键一步,本文主要提取了字符笔画数目特征、始点和终点向量特征、附加笔画位置特征、始点与终点的象限特征、字符外接矩形的宽高比特征、起笔和收笔的方向特征,字符的八方向链码特征,直线相交特征和二值图像粗网格特征,共计9种120维有效特征。使用这些特征分别对支持向量机和在线随机森林算法进行训练分类模型和识别测试,最终的实验结果是:采用Libsvm实现支持向量机算法的识别正确率可以达到89.476%,采用在线随机森林算法的识别正确率为87.857%,说明这两种算法在联机手写体新傣文字符识别中是有效的。本文最后还针对SVM分类模型,对特征集进行了优化,提升了SVM分类器的识别效率。联机手写体新傣文字符识别还处于探索阶段,本文仅对两种识别方法进行了探索,为联机手写体新傣文识别进一步的研究提供参考。后期还需要对其进行改进和完善。
其他文献
江苏电网是我国东部地区负荷需求电量最大的省份之一。投建锡盟——泰州特高压直流输电线路,不仅可以向江苏供应电量,也可以合理使用内蒙古清洁能源,促进新能源发展。由于送端系统距离华北主网较远,因此,华北主网对送端电网的支撑能力较弱。本文依托于国网总部《提升直流输电控制系统机电暂态仿真能力的建模研究与开发》的科技项目,研究直流系统的工作原理、直流系统的负荷特性以及提出优化低压限流控制环节对提高送端系统稳定
股份合作制企业是我国国有中小型企业和集体企业改制过程中劳动群众独创的一种新型企业组织形式.股份合作制企业的股权由职工个人股、职工集体股、法人股构成,其中职工个人股
社会的发展越来越快,国家也越来越重视节能减排,建筑能耗的很大占比都来自于空调系统,因此空调系统的绿色发展,对我国绿色可持续发展之路具有重要的实际意义。目前我国的建筑
目的通过扩散加权(diffusion weighted imaging,DWI)和扩散张量成像(diffusion tensor imaging,DTI)技术,分析轻微型肝性脑病(minimal hepatic encephalopathy,MHE)患者部分脑区脑功能改变,探究其与血氨值、神经心理测试评分及肝功能Child-Pugh分级的相关性,探讨DWI和DTI在MHE患者临床诊断中的应用价值,
目的探讨两种治疗方案治疗呼吸机相关性肺炎的疗效及护理。方法将30例呼吸机相关性肺炎患者随机分为治疗组和对照组各15例。两组均给予抗生素抗感染,治疗组静脉推注联合雾化
近年来,徐州矿务集团机械厂党委围绕企业新一轮创业发展目标,不断探索新形势下的基层党建之路,精心打造一支能征善战的党员创业队伍,带动了全厂职工进行了新一轮创业,有力推
提出一种针对电子商务网站商品列表页数据记录的自动抽取方法。该方法根据商品记录的特点,通过商品记录中商品的文本、图片以及布局等节点类型信息计算节点对应的值,依据节点
提出考虑资源约束的产品开发过程仿真模型。该模型考虑产品开发过程中的返工迭代以及资源约束,根据任务信息控制能力确定任务资源分配的优先级,相对于Cooper提出的资源分配方式