孟加拉信封图像的语言辨别和邮政编码定位

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:wlh0089
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信函自动分拣是机器视觉技术的应用,是邮政自动化的一个重要环节,它直接决定了邮政是否能够实现自动化,是否能满足日益增加的信件处理需求。信函自动分拣涉及到很多机器视觉技术和图像处理技术,包括图像的采集、文本图像分析、版面分析、模式识别等。本论文面对如此背景和需求驱动,针对实际应用——中国邮政承担的孟加拉信函分拣系统的需求,提出了孟加拉信封图像的邮政编码定位技术,包括基于边缘特征分析的框内定位和基于质心、蓄水池等特征的框外目标地址块中的邮政编码定位。山于孟加拉是一个多语言国家,英文和孟加拉文,而不同语言对应的数字也不同,因此分割出邮政编码图像后进行OCR识别之前还需要进行信封的语言辨别。基于这种背景和需求,本文提出了一种基于连通元轮廓分析的能够有效区分英文/孟加拉文的语言辨别技术。本论文首先从系统的角度介绍了孟加拉信函分拣机的整个流程和孟加拉信封图像处理系统的各个模块。接着,讲述信封图像的预处理技术,提出一种基于改进的边缘检测方法的邮框的定位分割方法,并从邮框中分割出邮政编码。然后,根据版面分析的一些方法从信封图像从提取出目标地址块,并从所得到的目标地址块中进行邮政编码的定位分割,同时提出一种基于蓄水池、连通元质心等特征的粘连数字的分割方法。最后,分析了目前语言辨别领域中已提出的一些语言辨别的方法及其优缺点,并提出了一种新的能最有效地辨别孟加拉信封语言的语言辨别方法。
其他文献
Internet的高速发展导致了信息成数量级的增长。海量的信息在极大丰富人们的生活的同时,也给Internet的用户带来了很大的困扰。人们在面对泛滥的信息时无所适从,陷入了信息过
项目级现金流(Cash Flow)是指工程项目资金的流入和流出,贯穿于项目的每个活动,决定了项目的价值创造,而净现值(Net present Value,NPV)能全面反映调度过程中发生的现金流入和流
基于移动代理的入侵检测系统因其所具有的动态、灵活、自适应的系统结构以及良好的协同性和扩展性等优点使其成为入侵检测领域的一个研究热点。目前已经有许多实验性的基于移
双语翻译是跨语言文化交流的桥梁,双语词典是双语翻译的重要工具,也是外语学习研究的重要资源。由于词典编纂工作一直以来都是耗时耗力的大工程,加上中英两种语言发展速度较快,大
人口领域的信息化建设是电子政务建设的重要内容,也是解决人口这一影响人类可持续发展问题的基础,人口是社会的主体,各业务领域的信息系统最终需要人口信息系统的支持。传统
受软件危机影响,人们越来越关注软件系统的开发效率和开发成本。随着软件规模的不断扩大,对于软件开发方法的研究,从只集中于单个产品转移到集中于一个产品族的设计与生产;从只集
无线AdHoc网络指的是由若干带有无线收发信机的节点构成的一个无中心的、多跳的、自组织的对等式通信网络,它可以不依赖预先存在的网络基础设施而快速展开,自适应的组网,各节点
随着无线网络技术的发展,彩信已经成为目前社会交流娱乐的一种主要方式。2006年是中国移动公司的彩信业务推广年。一个彩信用户定制业务是否成功主要决定于SP和彩信中心关于
近年来,随着实时多媒体数据的业务量不断增大,人们对网络在带宽、性能、覆盖范围等方面的需求的日益提高。面对这些新的挑战,IEEE 802.16无线城域网技术以其经济便捷、运行维
目前在无线网络环境中,移动IP是众多支持主机移动的方法中较受到研究者青睐的,然而在移动IP中依然存在一些问题没有很好地解决,如三角路由就是一个突出的问题。在这篇论文中,我们