图像文本的版面分析与理解

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:magi9999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类阅读载体由纸质载体向电子化的方向转化以及电子辅助阅读工具的出现将是人类未来阅读发展方向的必然。现有的大部分研究基本都是外文图像的分析,国内对于图像版面分析和理解技术的起步较晚,对于中文汉字图像的研究还较少,此外目前算法普遍存在的分割精度不高,算法速度较慢的情况。对于图像中的表格等版面内对象的识别率也较低。在版面理解过程中排版的主观性影响很大,导致理解处理后的逻辑关系混乱,对于复杂版面的版面理解也是一直是一个棘手的问题。仍然需要大量的研究提高目前版面处理算法的准确度和处理性能。  针对上述版面处理技术的状况,本文首先简要介绍了目前较为常用的文档处理技术。在文档版面分析部分,归纳总结了目前所需要解决的问题。并在此基础上提出了一种改进的基于连通域的版面分割算法。该算法从文档图像版面的整体信息出发,在基于连通域的版面分割算法上增加了字区域扩展部分,提高了连通阈值的准确度,从而使后续的连通域形成和文本块的分割效果都有所提高,减少了阈值分析错误导致的连通错误的情况。通过试验证明该算法对于目前的各种类型的文档图像处理效果都优于原有算法的处理效果。  在文档版面理解部分,本文提出了一种基于层次规则的文档图像理解算法。以图像中的直线或较大空白间隔等作为文档排版中的逻辑区域的标识来对文档图像进行层次切分,将文档图像逐层分割成多个独立的逻辑区域,以去除不同逻辑区域之间的逻辑误差,提高文本理解的准确性。通过试验证明,该算法对于多种版面都有较好的逻辑理解效果。但对于特别复杂的文档图像,理解精度仍需要进一步提高。
其他文献
随着信息技术的迅速发展和现代教育需求的增长,E-learning(Electronic learning)逐渐成为人们生活中重要的学习方式。E-learning具有良好的交互性和较小的时空约束性,它能够不受
目标跟踪是计算机视觉和模式识别领域当前的研究热点问题之一,并且在诸如智能导航、自动监控、军事防御、人机交互等方面有着广泛的实际应用。虽然目标跟踪经过几十年的发展
第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)考虑到互联网和传统运营商的融合,引入了IP多媒体子系统(IP Multimedia Subsystem,IMS)作为核心网的发展方向
由于技术的发展以及成本的降低,基因组测序在孟德尔遗传疾病,复杂疾病,以及癌症基因检测中得到了运用,并产生了海量的测序数据。这些数据对研究疾病的致病机制、疾病的临床诊
基于位置的服务(Location Based Service, LBS)是根据用户的位置信息提供服务的一种移动通信应用服务。在给用户带来便利的同时,现有LBS的工作机制也使得用户面临个人信息,甚
在当今信息化世界中,中文信息处理技术已经在各个领域中得到了广泛的应用。本文主要对中文分词算法中的基于分词词典机制的最大匹配算法进行研究讨论。由于中文语法语义复杂导
在飞速发展的交流调速系统中,交流变频电机作为主要的拖动方式已逐渐占据主导地位,在生产实践中的应用越来越广泛。而在采用了绝缘栅双极型晶体管(IGBT)器件的脉冲宽度调制(PWM)型变频器后,变频电机却出现了寿命问题,其中变频电机用漆包线耐电晕性能是制约其寿命的一个重要方面,这时就需要特定的测试仪器能够有效检测漆包线耐电晕的性能。在深入研究漆包线耐电晕测试相关技术的基础上,本文采用了IGBT的H桥技术
产品评论挖掘就是从用户发表的评论中挖掘出产品特征、用户观点,并判断观点极性,为生产、营销商家和潜在的用户提供参考。通过对提取出的产品特征进行分析,发现用户对产品特征粒
安全协议分析和验证在信息安全领域占有重要地位。目前,安全协议形式化方法分析和验证主要集中在对实用性较差的安全协议抽象规范分析和验证方面,对注重实用性的安全协议代码分
图像分割是计算机视觉与图像处理领域的重要研究课题,其变分方法可集成多种因素以提高分割的自动化程度,但传统变分模型计算效率较低等缺点制约了该方法的工程应用。本论文针对