【摘 要】
:
视障阅读器是一种可供那些有读写困难或其他学习障碍,以及因为弱视、失明等原因很难或者无法阅读印刷文字的特殊人群使用的嵌入式的试听转换装置。主要采用OCR技术和语音合成
论文部分内容阅读
视障阅读器是一种可供那些有读写困难或其他学习障碍,以及因为弱视、失明等原因很难或者无法阅读印刷文字的特殊人群使用的嵌入式的试听转换装置。主要采用OCR技术和语音合成技术,可以将报纸、杂志等印刷体文字转换为语音进行输出。借助此装置视觉障碍者可以“阅读”普通印刷的纸质书籍。本文主要研究视障阅读器的版面的倾斜校正和版面分析两部分。倾斜校正和版面分析是很重要的环节,分析的结果直接关系到后面的字符识别效果。 在倾斜校正环节,原有的基于Hough变换的倾斜校正算法抗干扰性强,具有较高的倾斜估算精度,但是它是对图像中的每个像素进行运算,因此运算量很大,速度很慢。因此本文提出了基于Hough变换的自动搜索文本域的倾斜校正算法,本算法首先从要分析的版面中分割出若干适当的小型区域,然后提取里面的足够大的文本区域,对得到的文本区域进行倾斜校正,获得倾斜角,最后对整个版面进行倾斜校正。本算法只是对分割出来的小型区域进行基于Hough变换的倾斜检测,时间耗费平均大约只有原来的27%,提高了实时性。 在版面分析方面,本文利用基于数学形态学和递归投影法相结合的方法进行分析。首先利用数学形态学对版面进行操作把版面划分成若干大块的区域,然后利用递归投影法对得到的区域继续进行划分,得到其中的文本域和图像域等各种属性。相比于一般基于连通域的方法,此方法在保证准确率的同时,时间减少了近1/2。
其他文献
本论文根据ZigBee无线传感器网络项目的要求,以TinyOS嵌入式操作系统为软件平台,设计并实现了基于树状拓扑结构的Zigbee协议栈。论文介绍了当前无线传感器网络的研究进展和Zigb
随着计算机网络和多媒体技术的飞速发展,多媒体产品的复制和传播变得更加便捷,因而,如何保护多媒体信息的安全受到广泛的重视,数字视频水印技术更是成为国际上研究的热点。在H.26
随着计算机软件技术的发展,越来越多的企业应用软件来解决自己的核心问题。但是在软件长期持续的运行过程中,系统资源会由于运行错误的不断积累而逐渐耗尽,导致系统性能持续
随着计算机技术和网络技术的不断发展,网络安全问题受到越来越多的关注。传统的安全技术已经不能满足人们对网络安全的要求,入侵检测技术作为一种新型的积极主动的防御技术应
本文针对一个C/C++程序静态安全检查工具,设计并实现了基于自动机的安全检查机制,该机制可以使工具的使用者在外部自定义安全规则,动态地解析安全规则来检查源代码中存在的安全
汉语语义分析是自然语言处理的核心技术之一,也是对汉语的深层理解。汉语语义分析效果的提高对于信息检索和机器翻译都具有推动作用。随着科技的发展,术语也不断涌现,所以对
随着我国铁路建设的发展,列车运行不断提速,列车密度日益增大,随之而来的是维修管理及防护工作的难度愈来愈大。由于西部铁路网不够完善,线路沿线环境条件比较恶劣,技术人员
当前,建设统一的多业务IP承载网,取代已往多种业务、多种体制的电信网络,从而实现统一承载、统一运营、统一管理、统一维护,以便降低运营成本,提高业务部署的灵活性和盈利能力,已经
随着计算机技术在社会各领域的广泛应用,计算机已经成为人们生活不可缺少的重要组成部分。计算机语音更由于其简单、直接、易于为人们所接受的特点融入到人类社会的许多领域
为了提高突发事件救援工作的效率,使伤亡人数达到最小,财产损失达到最少,首要的任务就是给灾区提供救援物资。然而,由于突发事件具有突发性、非例行性、不确定等非常规特点,