印刷表格文本分析识别系统的研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:Dustin65928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了一个印刷表格文本分析识别系统。提出了表格特征点分析方法。在表格图象处理的基础上,对表格线进行了分析,在考虑表格线和字符块粘连的情况下提取字符块,判别汉字串和数英串后分别识别,生成表格。实验表明本方法的有效性。
其他文献
CTS是一个针对以“语法-结构”为大纲,结合功能法教学的教学策略实现的汉语教学系统。本文详细描述了CTS的课件库组织结构和对象管理机构的管理模型,并在此基础上介绍了CTS的设计与实现。
在计算语言学中,知识作为句法分析的数据支持起着重要的作用,如何利用计算机从现实世界中获取知识一直是人工智能领域探讨的重要课题,本文描述了如何从语料库这一客观真实数据资
依存语法通过分析语言单位内成分之间的依存关系揭示其句法的结构。本文针对从短语到句群的各级单位内部的各种依存关系展开讨论。提出依存关系普遍存在于各级单位之中,初步建
在综合考虑数据库查询这一特殊性的基础上,根据查询语句中词汇对数据查询不同贡献程度分级建立分词词典.然后提出了分步--正向单扫描的分词方法(DSWS),并对该分词方法的时间复杂度进行了
本文,归纳蒙古文字特殊性和分析现有蒙古文系统后,指出建立具备通用处理功能,又与西文,汉字兼容的蒙古文信息处理系统的关键,在于内部码体系结构的建立上,然后,对几种内部码体系结构
本文统计分析:1.藏字的字长和构词频度;2.藏字的声母和韵母结构方式及频度;3.藏字的位置字符及结构方式。通过统计分析,从藏字结构方式的量和位置字符的量手度量揭示其质的面貌,为藏文研
第一是政企不分。政企不分是旧体制的本质特征,是一系列深层次矛盾的焦点,因此是建立市场经济体制面临的首要课题和最大的难点。目前,能源部门政企分开进展迟缓,关键在于政府
本研究以国家"大众创新,万众创业"为背景,借高校大力改革之势,育社会所需实干之人才。以吉林农业大学鹅研大学生创新创业协会为例,将产学研合理衔接,创新创业教育与专业教育
本文主要讨论了曲线轮字形缩放与还原中两个重要的技术问题,首先描述了一个新的用于提高还原速度的快速封闭区域填充算法,然后,给出了一个笔划缩放误差调整技术,它可保持缩放字形
在许多文字识别系统中,字符切分是预处理阶段的一部分,其目的是从文本图象中分离出字母图象。而后才能针对切后的每个字母进行识别。