基于屏幕显示的非文本文字的文本化技术研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:kevin_dai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着教育信息化工程在全国范围内的迅速推进,迈进信息化大门的教育系统对信息的需求是惊人的,特别是一线教师有了更广阔的学习资源和交流空间,而这些信息主要以网页、电子书、数码相机拍摄下来的图片资料、视频等形式存在。  在详细研究字符识别和获取屏幕图像的基础上,开发并设计了这套基于屏幕的文字识别系统。主要研究如下:  其一,本文利用图像识别技术对采集到的文字图像进行识别,它不仅可以处理磁盘中已经存在的图像,还可以实时的抓取看到的有用的文字图像,然后再根据字符识别的需要,系统在对获取的图像经过二值化、字符切分、归一化等处理后,主要使用网格特征和交叉点特征相结合进行特征提取,并建立相应的字符标准特征库。  其二,对于干扰较多、字号不同以及中英文混排的情况下引起的不能准确分割字符等问题,提出了一种改进方法:基于字符周期及识别反馈文字分割方法。在此方法中,对于行与行之间出现污点等干扰情况,采用了基于连通区域合并的行切分算法,从而更为准确的完成了文本图像的行分割;对于长标点、宽标点等干扰,采用了基于字符间距周期的字符分割算法,成功实现了对连通区域类型的判定,对于左右结构的文字则采用基于识别的字符部件合并算法。实验证实,该方法的字符分割准确率优于传统的基于投影的分割算法。  最后,设计开发了一个通用性较强的字符识别软件框架,还增加了抓图功能,让使用者可以随时把喜欢的内容捕抓下来进行识别。
其他文献
密码算法是信息安全领域的重要研究内容,算法的安全性由诸多因素决定,包括算法自身的数学特性以及实现安全性等。近年来,基于实现的算法攻击获得了广泛关注并已成为研究热点之一
在开放、动态的网络环境中,分布式软件呈现出规模庞大、松散聚合、行为复杂等特点,分布式软件自身的特点、复杂多变的网络环境以及用户需求的不断更变,需要对其进行动态的适
本文重点对超图划分和空间填充曲线两类方法进行比较研究。在大规模科学计算中,并行计算效率提升的一个关键在于将数据进行剖分,分配到相应处理器中,以及对处理器中的数据进行动
作为一种无需预设设备支持的无线移动网络,移动自组网的研究越来越多地得到人们的关注,特别是对网络性能有重要影响的路由协议的研究。由于移动自组网中的节点采用电池一类的可
软件测试是伴随软件开发全过程的重要活动。测试管理帮助企业制定软件测试流程,管理测试人员,规范测试运行,分析测试结果,是保证软件测试质量的主要手段。   软件测试模型是软
本文介绍了移动计算领域一个较为年轻的新课题——位置相关数据。位置相关数据是一种向移动用户提供即时、即点信息服务的技术。通过位置相关服务用户在移动过程中可以获得与
流程企业生产过程反映了企业的工艺路线、资源配置及其制造能力,生产过程的稳定运行影响着产品生命周期的各个阶段,因此进行生产过程的实时监控非常必要。生产过程中的大量装置
InfiniBand(IB)是I/O技术领域的一种新型体系结构,提供具有低延迟、高带宽特性的RDMA传输方式,为提高集群通信性能提供了支持。当前在Java应用程序中使用构建于InfiniBand网络
推荐系统通过预测用户的信息需求,向用户推荐其需要的资源(商品、电影等)。主流的推荐算法利用用户对资源的评分信息和资源的内容信息进行推荐,但很多应用场景还包含其他重要信息
二元关系框架被证明可以应用在许多日常生活偏好关系处理中。本文提出使用二元关系框架来表示偏好的方法。这里的偏好指的是严格偏序的二元关系。偏好框架可以表示有限偏好关