基于笔划合并和动态规划的联机汉字切分算法

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:chuhai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
联机手写汉字识别已从单字识别走向多字,乃至整篇文档的识别,字符的正确切分很大程度上决定了系统的性能。为了提高系统对整页文档的切分识别性能,该文提出了一种联机手写汉字的切分算法。通过基于规则的笔划合并将单个笔划合并成字符块,在此基础上,采用动态规划算法,利用字符块的长宽比、大小、间距以及识别信息,寻找出最优的切分路径。同时,对于手写汉字的任意性,提出了一种对汉字外接矩形框进行裁减的调整算法,使外接框并不包含整个汉字。实验证明,该文所提出的算法对于字数较多的多行样本以及存在字符相互粘连的情况,都有着很好的效果。
其他文献
创新教育是知识经济时代对教育提出的客观要求,是全面实施素质教育、改变我国落后教育现状的需要,是教育改革发展的趋势。探讨创新教育的内涵及其英语专业创新教育模式具有十
"红色经典"是中国20世纪50年代至60年代以革命为主题的文化生产。"红色经典"文化在中国的传播,几乎运用了所有的媒介手段和艺术样式,包括小说、广播、戏剧、影视、绘画、音乐
目的 为了获得较高的地中海拟无枝酸菌的转化率,进行了电转化条件的优化。方法 以大肠埃希菌.拟无枝酸菌穿梭质粒pULVKl-Am为载体,地中海拟无枝酸菌为受体菌,考察了收集菌体时
目前人工神经网络(ANN)应用中所遇到的挑战之一就是如何针对特定问题确定相应网络。基于进化算法和局部搜索算法两类策略的特点和不足,文中提出了混合剪枝算法HAP(HybridAlgo
为解决手写数字串中的粘连问题,提出了一种基于识别的粘连手写数字串切分系统。该系统通过外轮廓分析和投影分析,找出相应的候选切分线。利用候选切分线对数字串过切分,过切
为了提高联机手写汉字模型的空间结构描述能力和识别性能,从汉字的笔段关系出发,提出一种新的联机手写汉字模型,该文称之为属性关系Markov模型(ARHMM)。ARHMM以经典Markov模
由于我国特殊的政治、经济等环境,很多上市公司都存在着大股东通过关联交易活动来转移上市公司资源、侵占中小股东利益的现象,严重干扰了上市公司的正常运营,导致公司质量不
2007年下半年以来,美国经济中最引人注目的事件有两个,一个是美元贬值加速,另一个是次贷危机的爆发。由于全球化条件下世界各国经济的紧密相连,以及美国作为世界头号经济强国的地
2012年11月,财政部发布了《行政事业单位内部控制规范(试行)》,该规范将于2014年1月1日起施行。行政事业单位的内部控制在当今社会越来越受到各界的关注。本文针对我国行政事
目的针对常规反演方法应用于岩土工程参数反演时搜索效率低、计算量大的缺点,提出了基于改进Nelder-Mead算法的有限元优化反分析法,为工程所需的计算参数提供参考.方法基于混