基于直线拟合的文本倾斜检测算法

来源 :计算机应用研究 | 被引量 : 21次 | 上传用户:xxm181512619
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本扫描输入的过程中,文本图像不可避免地会发生倾斜,而布局分析及字符识别算法对页面倾斜十分敏感,因此倾斜检测和校正是文档分析预处理中的重要环节。提出了一个基于直线拟合的倾斜检测方法,它对文本图像二值化、分块,进行Fourier变换获得Fourier光谱,提取Fourier光谱中反映倾斜角的特征点,然后对特征点进行拟合处理,最后获得页面倾斜角。实验结果表明,该方法能够精确检测文本的倾斜角度,并且不受文本布局、行间距以及字体的影响。
其他文献
互联网上的海量信息中包含和反映了人们的观点和舆论倾向。从网上相关信息中抽取出人们的主观意向如消费者的购买倾向、政治观点等已成为了Web研究的热点。提出了几种适用于实时抽取网上舆论观点的算法,主要描述了各算法分析观点的原理及分类过程。
由于信道带宽的要求,图像传输要减少传输量,因此图像发送端先以块为单位对图像进行划分,然后利用离散余弦变换(DCT),由于人眼的低通特性,首先利用小波变换将图像中的高频分量识别出来,然后按照一定的规则主动丢弃部分块的低频分量,同时在图像接收端通过图像重建技术再对丢弃的图像数据进行恢复,从而再现原图像。
回顾了机器视觉中的各种摄像机定标方法,对各种方法进行介绍、分析,并提出了定标方法的发展方向的新思路。
介绍了一种以Sybase的应用服务器Jaguar CTS为平台,从C/S两层应用到多层及W eb数据库应用的实现技术,对多层结构数据库应用开发进行了研究探讨,论述了应用服务器相应的程序开发特性。
为了促进工厂数据跨平台、跨层次交换的要求,OPC基金会制定并发布了基于Web服务技术的OPCXMLDA接口规范。通过设计并实现的OPCXMLDA中间层网关,可以完成对现有的基于OPCCOM接口规范的工业数据的XML化工作,很方便地实现了现存的基于COM技术的OPCDA服务器的升级,使得这两种接口可以和谐地共存。
研究JPEG 2000标准中系数位平面编码的硬件实现问题,提出一种适合ASIC实现的结构,在保证编码速度的前提下,最大限度减小了片内小波系数缓存量,解决了扫描过程中如何对系数状态字进行读写的问题,大大减少了系统访问系数状态字的频率。设计中幅度细通道和清理通道并行工作,使编码时间比传统非并行工作减少30%以上。在FPGA上对设计进行了仿真验证。
利用基于身份的公钥系统和(t,n)门限密码,实现一个Ad hoc网络的信任模型。在该信任模型中,系统私钥由所有节点共享,任意t个节点一起来完成可信中心的功能,为任意节点生成私钥。并且,无需权威机构来进行初始化,在系统私钥保持不变的前提下,节点拥有的部分系统私钥和门限t的值可以随时更新。该信任模型满足Ad hoc网络拓扑结构经常变化和移动节点资源受限的特性,可以用于建立一个安全的Ad hoc网络。
应用对称密码、非对称密码技术和组件思想构建安全组件,在安全组件的基础上构建保护W eb数据传输的安全模型,这种安全模型具有易维护和易扩展的优点。在这种安全模型下通过XML能够构建平台独立的具有数据传输和存储安全的应用集成系统,该模型可用于解决基于W eb服务的电子商务、电子政务等应用集成环境的安全问题。
安装ArcIMS时,需要根据客户端的访问量以及服务器端的数据处理量选择Web服务器和ArcIMS应用服务器连接器,并将Output和Servlet目录设定在服务器相应的位置。所开发的农田地理信息系统软件可以快速完成基于Web的地图显示、属性查询、缓冲区分析等功能,实现了农田地理信息的远程发布。
通过对WebGIS的三种处理模型的分析,根据GIS系统的特点,提出了用XML实现三层网络结构的WebGIS系统模型。该模型具有减少网络流量、更有利于检索、可从多种不同的数据源集成数据、开放性、可扩充性、可重用性等特点。