日文名片识别与信息分类

来源 :大连海事大学 | 被引量 : 4次 | 上传用户:lfwvb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
名片包含了一个人的许多有用信息,人们初次见面彼此交换名片已经成为相当普遍的行为。随着个人拥有名片的数量的不断增长,如何保存与管理名片愈发显得重要。名片根据其语言类型的不同大致可以分为两类:双语混排名片和单语名片,日文名片属于双语混排名片。对于日文名片识别模块来说,首先要解决的问题就是双语混排识别的问题,而日英混排识别问题也是亟待解决的印刷体文字识别问题之一。本文应用适当干预的日英OCR系统集成原则,集成OCR系统识别日文名片。为了最大限度的提高信息的识别率,建立了统计方法和规则相结合的混合语言模型,实现了一个日文名片识别后处理模块。在信息分类模块,应用数据结构中的二叉树查询理论并且结合日义名片的特点,不仅快速的进行了信息分类而且高效的纠正了行切分模块无法解决的错误。 全文共分五个部分,第一部分介绍本课题的实用价值和课题意义,并简述日文名片识别系统的整体模块设计方案。第二部分简要介绍本系统的名片预处理模块与自动行切分模块的实现方法。第三部分详细介绍本系统的识别模块的实现方法。第四部分详细介绍本系统的信息分类模块的实现方法。第五部分总结了本人的主要工作,并且提出了下一阶段的工作展望。
其他文献
目的:探讨糖尿病足愈合的影响因素及应当采取的护理干预措施,以降低发病率及致残率。方法:选取2012年至2014年在我院就诊的28例糖尿病足患者,观察糖尿病足愈合的情况及影响愈合的
目的:研究早期康复护理对改善中风偏瘫患者肢体功能的应用效果。方法:本文主要选取我院2014年8月~2015年2月收治的中风偏瘫患者40例为研究对象,随机分为观察组与对照组2组,观察组
目的:探究人文关怀在宫外孕护理中的效果。方法选取我院2015年3月~2016年3月收治的62例宫外孕患者,经随机平行的方式,分成观察组和对照组,各31例。观察组实行人文关怀护理干预,对
目的:探析白血病患者PICC护理中PDCA护理管理的临床效果。方法:选取我院收治的白血病化疗114例患者为研究资料,按照入院时间顺序的先后分两组,每组57例。在所有患者中,予以对照组
无线网络中的分组调度器在分组数据到达网络节点时,对到达的各种业务的数据包进行排队、分配无线资源,如Walsh码、时隙和频率等,以满足网络系统的不同性能要求。本文以cdma20
相干信号的波达方向估计是阵列信号处理的一个重要的研究方向。本文在学习和研究已有的波达方向估计算法的基础上,主要进行的研究和创新点如下:首先,本文介绍了传统的信号波
随着无线网络和医疗传感器的发展,无线医疗系统的发展特别迅猛,在为病人提供各种医疗服务的同时,也为病人和医生都带来了极大的便利。随着物质文明的不断发展,精神文明也不甘
随着计算机技术和网络技术的迅猛发展,计算机系统已经从独立的主机发展到复杂的、互联的开放式系统,这种情况导致计算机及网络的入侵问题越来越突出。入侵检测技术作为一种有
本论文丰要是研究混浊水海域沉底雷或者掩埋雷探测中声信号的检测方法问题。在混浊水海域,由于海水中含有大量的泥沙、藻类以及浮游生物,因而海水的声吸收系数比一般纯净水要
本课题主要研究了多值二元序列偶的最佳性,同时提出了一类新的区组设计——广义相对差集偶,从而为研究最佳多值二元序列偶提供了理论依据和新的研究方法。  本文对国内外