相机拍摄的二值文字图像倾斜角度的检出方法

来源 :扬州大学 | 被引量 : 0次 | 上传用户:zhou101302
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对图像中文字进行提取的字符识别技术是图像处理中的一个重要应用,文字的识别率与扫描图像的质量有很大的关系,目前一般都是通过平板扫描仪得到目标图像。近年来,高处理能力、低价位、便携的数码摄像设备给文本图像的获取增加了新的手段。这些数码摄像设备能够便捷地从厚书、脆弱易碎的历史文献、场景中捕捉文字图像,这种获取文字图像的方式比使用平板扫描仪更为便捷。便携数码拍摄设备拍摄的图像和平板扫描仪得到的图像相比很不规则,存在很多的失真。为了提高识别率,在文字识别前需要对图像进行预处理。预处理中的一个重要环节是对图像进行倾斜矫正,找出文字的倾斜角度。本文提出了通过点旋转的短线段进行全角度扫描以获得黑色像素分布的新方法,能快速寻找出文本图像中文字行的倾斜角度。因为根据文字行的倾斜角度找出水平消失点,获得整个文本图像的失真情况,从而用投影变换方法纠正图像。本研究先对原始图像进行预处理,把原始图像转换成二值图像,再进行矩阵行列变换处理,转换成新的图像。然后对新图像按像素坐标进行分块,在每块区域设定一个初始点,用一根短线段穿过初始点,进行旋转扫描,对旋转过的角度进行黑色像素计算,建立旋转的角度和黑色像素数值对应关系直方图,明确黑色像素分布情况。根据黑色像素的分布情况,查找出文字行间空白,再在文字行间空白旋转线段找出文字行的倾斜角度。可以根据由多个文字行的倾斜角度,找出文字行水平消失点。本文研究的创新之处在于:(1)对经典的根据文字流向找出文字行间空白的方法进行了改进,采用了单像素宽度的线段扫描法,在行间距极其狭窄的情况下,也能找到文字行倾斜角度。(2)本方法不需要提前假设未失真文本图像形状,也能够得到正确结果。(3)不管文字图像是否全部摄入图中,还是部分摄入图中,本方法都可以检测出正确的文字行倾斜角度。(4)本方法根据点与文本之间的位置关系,设定点的移动距离,大大节省了移动点的次数,减少了大量的计算,节省了计算时间,提高了检出效率。本方法解决了现在研究中出现的一些问题:(1)倾斜角较大时不能保证校正精度;(2)空间复杂度很高,计算量较大;(3)拍摄时必须把文档的页边全部摄入图内才能矫正;(4)当文字行间距极狭窄时无法检测等。多组图像样本测试表明,本方法检出率高且高效。
其他文献
论文首先提出了基于互满正交设计的差分空时分组码(Amicable-orthogonal-design-based Differential Space-Time Block Code,ADSTBC).将差分Alamouti空时分组码(Differential
该文详细介绍了传输流再复用器硬件和软件系统的设计与实现.该系统支持对四路SPI或ASI接口的TS流和一路净数据流的实时再复用,其性能达到或超过国内外同期产品,能适应各种不
作为一种无线移动网络,路由协议是其重要的组成部分,也是研究的热点问题.该文的目的就是要通过网络仿真软件OPNET对Ad hoc网络的几种主要类型的路由协议(前向路由、后向路由
该文着重研究了软件无线电数字中频处理技术的理论基础,关键技术,分析数字中频处理技术的一些技术难点,结合在综合通信演示系统中的仿真实现进行深入的研究.最后对该文的工作
WCDMA是第三代移动通信系统中最具竞争力的标准之一。在移动台低速运动的信道环境中,信道长时间处于深衰落。同时在CDMA系统中由于所有的用户均使用相同的频带,用户之间彼此
近几年来,视频编码的研究集中在两个方面,一是低比特率编码,二是基于对象的视频编码。对于前者,人们研究的重点在于提高编码图像的客观质量;后者更侧重于为多媒体业务(如视频会议
期刊
期刊
可见光通信(Visible Light Communication,VLC)有效解决了无线电频谱紧缺的问题,同时具有抗电磁干扰能力强、保密性好、频段无需申请、设备简单以及易于安装等优点。可见光通
该文作者在研究生期间对移动网络相关协议及其测试、服务质量及其测试作了较深入的研究,并作为研究与开发人员之一,参与了网络测试仪表以及移动网络通信质量检测系统的研发工