基于模糊推理的日文名片识别后处理研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:dudulee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代社会中,名片作为一种简单、美观的个人信息载体使用的越来越频繁.名片的大量使用在给人们带来便利的同时,也带来了一些问题,大量名片的存储、查询、输入等问题都需要解决.现在的便携式个人数字设备如PDA,笔记本电脑等都可以有效解决名片的存储和查询问题,但是大量名片如何输入到数字设备的问题一直没有得到很好的解决,现有的名片自动录入系统都存在着一定的不足.该文以模糊理论为基础,主要研究了日文名片识别后处理的相关算法.针对名片识别信息的特点,该文对模糊推理的基本推理规则模型进行了扩展,提出了一种带噪声系数的加权推理模型,并为名片中的各个信息种类设计了相应的模糊集合和隶属函数.以此为基础提出了在名片识别后处理中应用模糊推理的一种新方法,该方法利用名片图像经过OCR识别得到的文本信息和候选文本信息进行文本内容分析;通过保留OCR过程中的图像切分参数获得文本的位置信息,从而进行版面分析,在分析中均采用模糊推理的方法,并提出一种新的模糊运算的交型算子.最后综合内容分析和版面分析的结果得到最终的信息分类结果.研究了对OCR识别结果在后处理中的纠错,包括姓名、电话、地址等信息以及OCR识别过程中图像错误切分的纠错.其中重点研究了名片上地址信息的纠错,提出了一种基于模糊匹配的地址信息匹配算法.此外还介绍了一个使用以上算法的实用系统的设计和实现.包括完成图像识别和后处理的动态链接库(C++语言实现)和使用该动态链接库的WebService(C#语言实现).该文最后分析了实验系统的测试数据,并把测试结果与一些现有名片系统的测试结果进行了比较.
其他文献
多Agent系统(Multi-Agent System,MAS)是分布式人工智能重要的研究领域,多Agent系统协商是多Agent系统的核心研究内容之一.该文结合我们承担的国防预研项目"分布式专家系统环
近年来,随着计算机技术、信息技术和系统技术的飞速发展,计算机仿真的应用领域不断拓宽,国民经济发展特别是军事需求的强大推动,促使计算机仿真在理论和实践两方面都走上了快速发
随着生物科学技术和计算机科学技术的迅猛发展,生物信息学已经成为一门崭新的学科而悄然兴起并日益发展.在生物信息学中,序列分析,即从核酸和蛋白质序列出发,分析序列中表达
虚拟空间会议系统是多媒体会议系统的终极形式,在虚拟空间会议系统中,所有的与会者将其虚拟替身合成到具有空间感、真实感的虚拟会议空间中,实现与会者之间自然的交互与协作。现
乳腺癌是危害人类健康的恶性疾病之一.目前,早期检查和早期治疗仍是提高乳腺癌治愈率的关键.其中乳腺X光检查是最常用和最可靠的检查方法.然而由于乳腺X光片图像中癌症的特征
该文针对视频水印的特点(对视频质量影响小、对编码效率改变少、实时性、抗帧操作的鲁棒性等)展开研究,实现了一个实时可行的视频水印系统.论文的具体研究内容包括:1.该文阐
在信息时代的今天,随着数据量的快速增长,如何从海量数据中高效地挖掘出有用的信息变得越来越重要。空间co-location模式表示在空间中存在若干空间特征,不同特征间的实例在空间
数据挖掘从产生时起,就是面向应用的.但是在实际生活中,存在许多模糊现象不能简单地用传统理论精确地刻画,如何表示和处理这些现象是数据挖掘研究中的重要问题.本文从实际应
随着信息技术的发展和全球化世界市场竞争环境的形成,企业之间的竞争也由过去的局部竞争演变为跨行业,全球范围内的竞争.企业越来越需要结合信息技术的先进制造技术的支撑.ER
Primary-Backups机制是设计容错计算机系统的重要方法,Primary-Backups机制的研究对于容错计算机系统的研制具有重要的理论和实践意义.该文系统性的研究如何把Primary-Backup