一个手写印刷体汉字识别实验系统

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:xybcn960
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在充分考察了手写汉字和中国大汉字集特点的基础上,提出了一组用于手写印刷体汉字识别的分类特征,它们是长笔划分布类型、各类笔划的数目、交叉点数目和折点数目。利用这组特征进行匹配就可直接识别出GB2312—80汉字集中的绝大部分汉字,再通过一个基于知识的推理过程即可进一步识别出已被分成类组的少数剩余汉字,这种将统计分类与基于知识的推理识别相结合的两级识别方法具有较高的效率。一个适应性较强的汉字笔划和特征点抽取方法也被设计,它是SLSA方法的改进,与机器学习功能相配合,大大提高了特征抽取的正确率。我们根据上述
其他文献
机译知识获取是机器翻译系统研究中一个至关重要又极难解决的问题。目前多数机译系统的知识库都是由人工静态建立的,系统不能自行对其进行扩充。本文介绍了一个智能机译系统I
当今时代进行电视台新闻节目的创新显得非常有必要,因为电视台新闻节目存在着模式单一、内容扁平化等问题,需要电视台借助创新电视台新闻策划模式、明确节目定位、全方位提升
阐述装备制造业在国民经济中的地位和作用;分析我国装备制造业的现状;探讨在面临国际经济危机的形势下,充分利用我国政府四万亿拉动内需的投资计划,振兴装备制造业的发展思路.
针对部分三线表设计存在的栏目逻辑混乱、层次不清等情况,结合三线表的构成要素,给出一些优化编制三线表的建议.
一、TDMA设备发射信号特征TDMA是数字移动通信系统的一种时分多路工作的技术体制,TDMA发射信号不同于普通FM和AM信号.为了具体起见,本文结合GSM系统加以说明.GSM是欧洲数字移
以铁岭师专教职工为研究对象,调查其健康素质的总体现状,依椐健康自测的基础数据进行生理、心理、社会健康研究,对教职工的健康素质现状进行分析,提出干预对策,为教职工的健康服务