跨平台OCR引擎的设计与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户：lili123456li

【摘要】

：

作为人工智能的重要方向,OCR技术发展至今已较为成熟,并在各个行业中取得了较为广泛的应用。OCR的应用领域已经逐渐从大型企业和政府机构扩展到了各类企业和大众的同常工作中

【作者】

：

李海波

【机构】

：

南开大学

【出处】

：

南开大学

【发表日期】

：

2008年期

【关键词】

：

跨平台系统 OCR 嵌入式移植

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为人工智能的重要方向,OCR技术发展至今已较为成熟,并在各个行业中取得了较为广泛的应用。OCR的应用领域已经逐渐从大型企业和政府机构扩展到了各类企业和大众的同常工作中。而伴随着计算机技术的飞速发展,人们开始大量使用各种架构和操作系统的计算机和手持设备提高其工作效率和生活质量。并期望OCR技术能够应用于这些平台上。如何设计实现具有高度跨平台性能的OCR引擎以减少平台间移植的工作量,同时使该引擎具有较高的识别率和较少的资源使用量即成为OCR技术应用有待解决的重要问题之一。跨平台OCR引擎的难点在于各个平台之间具有较大的平台差异,包括硬件相关的性能,操作和操作系统相关的系统调用和处理流程的不同。这些差异进而引起了引擎调试,测试方法的不同。本文在对比了各个平台之间软硬件差异,在现有OCR技术基础上设计实现了具有高度跨平台性能的OCR引擎。主要的工作如下：其一,分析了各个平台和系统之间差异,设计并实现了适用于跨平台OCR引擎的系统结构。该系统结构提供了一个具有高度跨平台,可伸缩的灵活的OCR引擎框架。基于该框架,OCR引擎能够快速移植到其它平台,并能够方便地添加相应功能模块并更改其算法。其二,针对平台间软硬件接口的差异,提出了对这些接口的封装和抽象方法。真实案例表明该封装抽象方法能够较大程度上避免或减小不同平台接口差异对引擎的影响。其三,对不同平台之间的调试,测试方法的共性和差异进行了具体分析,在一定程度上整合了相应的调试,测试方法。其四,针对手持设备资源的资源限制问题,改进了传统OCR引擎内存管理和图像预处理方法。使用三个完全不同的平台组合对系统进行评测表明该跨平台OCR引擎具有较好的伸缩性和跨平台性。

其他文献

改进的模糊聚类算法在入侵检测中的应用研究

当前信息化技术的高速发展给人们的日常生活带来极大的便捷。一方面互联互通的互联网所具备的开放特性在很大程度上方便了各种信息资源的共享,开创并且拓宽了共享资源的途径;

学位

入侵检测数据挖掘聚类分析FCM算法朴素贝叶斯

基于论坛数据的问答挖掘

论坛中含有大量有价值的、由用户讨论生成的数据,从中可挖掘出大量的问答数据,而这些数据可进一步用于改善问答系统的性能、扩充聊天机器人的知识库等。本文研究从论坛中挖掘

学位

论坛数据问答挖掘信息抽取标记序列模式基于图的排序

Hidden Web上的自动信息抽取

互联网中蕴含着大量可用的信息,但其中越来越多的内容需要通过填写HTML表单的方式才能获得。从用户和数据管理的角度来看,这是合理的,但是对于收集网络信息的自动化工具来说,

学位

Hidden Web自动信息抽取自动信息搜索信息过滤搜索引擎数据挖掘

基于Agent和数据挖掘的旅游突发事件预测预警研究

随着国内旅游规模和范围的逐渐扩大，旅游产业已成为许多地区的支柱产业。旅游业的发展极大地依赖于外部环境的稳定，各种突发事件可能促使旅游业产生突发性危机。本文依托国家自

学位

数据挖掘Agent技术旅游突发事件预测预警

网络钓鱼防范体系与技术研究

随着计算机网络的发展,在线金融服务得到了广泛的应用。然而互联网本身缺乏有效的控制策略,致使安全问题频发,网络钓鱼(Web Phishing)就是其中之一。网络钓鱼又称为网络仿冒,

学位

网络钓鱼网络仿冒在线金融金融安全图像分割网页分割网络安全

低速电动汽车锂电池SOC算法研究及应用

随着汽车工业的迅猛发展,带来的环境污染问题也越来越严重。电动汽车作为节能环保的代表受到广大人民的青睐。其中,低速电动汽车因经济性能好、充电方便等优势脱颖而出。本课

学位

低速电动汽车锂电池SOC估算电池管理系统扩展卡尔曼滤波

基于内容识别的智能导游系统研究

随着国民经济的持续增长，旅游行业正在迅猛发展，越来越多的人选择在闲暇的时候进行旅游。随着互联网技术的不断发展，互联网上的关于旅游的信息也越来越多。如何利用互联网上的信

学位

内容识别智能导游系统旅游行业互联网技术旅游信息搜索引擎图像识别文本分类

一种基于J2EE的新分布式多层架构——针对大数据量和复杂计算强度

随着多层应用的崛起,应用交付的变异越来越多,数据规模飞速增长,对计算机计算能力要求越来越高,新技术新思想不断出现,这些问题都对现存的架构提出了新的要求。针对这些问题,

学位

J2EE分布式多层架构Web ServiceMVC框架动态负载均衡

DeepWeb查询接口模式匹配与查询结果语义标注研究

整个Web的规模和资源正在不断扩大、深化，其中Web数据库资源难以通过传统搜索引擎索引到，所以被称之为“DeepWeb”，其蕴含的信息量更大、质量更高、结构化程度更高、主题更专一

学位

模式匹配语义标注启发式信息查询接口搜索引擎Web数据库

基于Chord的P2P模型在VoIP系统中的研究与设计

随着Internet的发展，客户端的不断增加，基于C/S模型的VoIP系统可扩展性差、单点失效的缺点日益显现出来。P2P因其各节点完全对等和网络自组织性等原因而具有高可伸缩性和高可靠

学位

P2P模型VoIP系统C/S模型Chord算法可伸缩性

跨平台OCR引擎的设计与实现

与本文相关的学术论文