联机无约束手写汉字文本行识别

被引量 : 0次 | 上传用户：muzhe8835

【摘要】

：

随着iPhone,iPad,andriod智能手机等针对个人的手持设备的流行,无约束文本行输入方式将得到越来越广阔的应用。然而,联机无约束手写汉字文本行识别是目前手写字符识别领域,甚

【作者】

：

严汉羽

【发表日期】

：

2011年期

【关键词】

：

手写汉字识别手写文本行识别预切分联机无约束手写汉字文本行数据库

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着iPhone,iPad,andriod智能手机等针对个人的手持设备的流行,无约束文本行输入方式将得到越来越广阔的应用。然而,联机无约束手写汉字文本行识别是目前手写字符识别领域,甚至模式识别领域的一大难题。与单字或词组手写字符识别相比,它具有一下几个特点:(1)汉字字符类别繁多,结构复杂;中文的句子更是复杂多样,大大提高了文本行识别的难度(2)文本行识别的对象为一行中文句子的笔画序列,其中可能包含几个到几十个字符,因此无法对其进行整体识别,需要直接或者间接对其进行切分。(3)待识别的字符是在无约束的情况下书写的,所以无论是单字的形状还是文本行的位置关系都难于确定。(4)目前可用的联机无约束数据汉字文本行数据库较少,这就给文本行识别带来更多的困难。针对这些难题,本文做了大量的数据库建设工作和文本行识别研究工作,主要包括:针对联机无约束手写汉字文本行数据库匮乏的情况,为了更好地支持联机手写汉字文本行识别,本文规划设计采集了联机无约束汉字文本行数据库——SCUT-COUCH Textline_NU。当前版本的SCUT-COUCH Textline_NU包含8,809文本行(其中4,183通过触屏LCD采集,3,996行通过数字笔采集)共159,866个字符。超过157个书写者采集。所有文本行采用随机分析的方法选自《人民日报》语料。该数据库的建立为联机无约束手写文本行识别研究提供数据基础。针对手写文本行的识别研究,本文提出一种基于过切分和语意分析的联机无约束手写汉字文本行识别方法。在切分上本提出了一种结合拐点检测、连笔拆分和笔画整合的过切分方法,将文本行过切分成一系列字符部件。同时,本文对过切分的字符部件采用基于动态规划的最优候选组合路径提取方法得到候选切分组合路径。在文本行识别上,本文提出一种基于语意分析的方法,以贝叶斯公式为基础推导出一种结合单字识别信息,上下文语意信息的概率分析模型。利用该模型对候选识别输出进行评价得出最优识别结果。实验表明,本文的过切分方法在中科院联机文本行数据库:CASIA-OLHWDB2.0得较高的过切分准确率(96.31%),较好的过切分有效率(55.1%)。在识别实验中,本文在SCUT-COUCH Textline_NU数据库和中科院联机文本行数据库下进行实验,分别获得56.41%和61.32%的文本行识别率。识别结果表明本文文本行识别方法取得较好结果。总之,联机无约束汉字文本行识别是一个综合性的研究课题,涉及到模式识别和自然语言理解等学科的知识。该课题不但对于未来手写字符识别有重要的研究理论意义,同时对未来掌上设备的书写输入方式有着重要的实用价值。

其他文献

辩证看待干部调整中的“隐形台阶”

<正>"隐形台阶"这一概念,在传统的理论界一直是被否定、被抨击的对象。理论界普遍认为,它的存在延长了干部的成长周期,不利于干部的脱颖而出;助长了论资

期刊

领导班子社会管理职能

基于安全组播的认证服务的设计与实现

伴随着网络技术的快速发展,互联网对点对多点的网络通信技术的需求也越来越迫切,如:网络电话、视频点播、网络会议等。组播技术正是解决这种网络需求的一种高效网络传输方案

学位

安全组播虚电路接入控制密钥管理

北京城市空间发展和土地利用——伦敦经验启示(英文)

Beijing is facing a huge challenge to manage the growth of its built-up area whilst also retaining both productive arable land and land for conservation purpose

期刊

BeijingLondonland-use planningGreen BeltNew Towns

把握“五个关系” 选准用好干部

<正>为政之要,首在用人。新修订的《党政领导干部选拔任用工作条例》(以下简称《条例》)作为干部选拔任用工作的总章程,通篇贯穿辩证唯物主义和历史唯物主义世界观、方法论。

期刊

群众公认领导班子

北京旧城斜街形成原因考

主要通过对相关文献、地图、碑刻资料的分析 ,结合前人的成果 ,对北京旧城斜街的形成提出三点看法 :1 )因湖泊面积缩小 ,形状变化 ,原来的湖岸变成斜街。 2 )街道本身即在旧

期刊

北京旧城斜街

重载车辆排气引射抽尘器设计

利用发动机废气能量的通风散热除尘技术,考虑到动力舱空间限制的制约,为某型重载车辆优选设计了一种排气抽尘引射器.利用流体动力学数值仿真技术进行数值模拟计算,探讨引射器

期刊

排气引射重载车辆引射系数

乌梅丸加减治疗慢性腹泻36例

期刊

慢性腹泻乌梅丸寒热错杂虚实互见苦甘酸辛

浅析供电企业定编定员

随着电力企业制度改革的深入,科学合理地定编定员是供电企业制度完善的基础管理工作,因此,本文通过介绍定编定员的概念与方法,针对供电企业定编定员存在的问题,提出了供电企

期刊

供电企业定编定员

长江三峡链子崖危岩体防治锚固工程方案

地质灾害治理在我国方兴未艾。数十年来，链子崖危岩体的研究与治理工程举世关注。本文应用地质工程理论与方法，对链子崖危岩体治理进行了研究，并进行了危岩体预应力锚索加固工程

期刊

链子崖地质灾害防治锚固工程预应力锚索地质工程

蒲辅周论治脾胃的经验

<正> 浦辅周是我国现代著名的中医学家。他毕生勤奋治学,学风严谨,对祖国医学造诣既深且博,精于内、妇、儿科,从医70余年,积累了丰富的临床经验。本文参阅《蒲辅周医疗经验》

期刊

胃气为本消补兼施顾护脾胃

联机无约束手写汉字文本行识别

与本文相关的学术论文