线宽阈值法去除表格框线

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:descendant_of_shang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字线交叠是表格处理中经常遇到的问题,它严重干扰了字符识别。本文提出一种基于线宽信息的表格框线去除算法—线宽阈值法。字符内采用较小的阈值去除框线,字符间采用较大的阈值,使本方法具有很好的抗噪声能力。针对数字与框线交叠的特殊情况,本文提出并比较了两种利用先验知识的方法:启发式先验知识法和识别反馈法。增值税发票的识别实验结果表明,本算法能使字线交叠情况下数字的识别率与字线不交叠的情况相当。
其他文献
本文以民勤沙区4种典型防风固沙林为研究对象,基于文献综述和专家咨询等方法构建评价指标体系,运用层次分析法获得各评价指标权重,利用改进的生态系统健康指数模型(HI)计算防
文章通过分析我国高校视觉传达设计专业发展的现状,针对存在问题寻找适合我国应用型本科院校发展此专业的方法——以创办特色化的专业为办学思路,使学校与社会的专业对接,并
为加强学生对于建筑空间的认知,学习建筑空间序列的创作手法,将中国古代建筑群体、中国古典园林与当代极少主义建筑作为空间分析经典案例,引入建筑空间序列的教学当中。指出"
近年来,我们在官兵中开展了徒手心肺复苏普及活动,取得了较好效果。现将我们的做法报告如下。1加强组织领导将普及徒手心肺复苏纳入部队卫生防病日程,由团卫生防病工作领导小
<正>8月31日,中央纪委、监察部、国务院国资委在京召开规范中央企业负责人职务消费座谈会。中央纪委副书记、监察部部长、国家预防腐败局局长马出席会议并讲话。她强调,规范
运用混沌蚁群算法进行图像的边缘检测是针对混沌蚁群算法具有随机性、遍历性、正反馈性,通过更新信息素矩阵来计算图像阈值,从而获得图像边缘信息,能够更全面、迅速地找到图
在系统总结了土木工程材料课程具有内容庞杂、概念多、逻辑性较差等特点的基础上,提出了土木工程材料课程课堂教学方法更新策略,以调动学生学习的主动性和积极性,激发学生的
本文通过分析传统汉字的结构模型所具有的优缺点,提出了建立脱机手写汉字统计模型的理论框架;并利用PCA技术发现大量数据规律性的能力,提出了一种基于PCA技术的脱机手写汉字
为了实现工程教育与国际接轨,工程伦理教育逐渐被中国工程教育界所重视,在中国开展工程伦理教育势在必行。因此,结合现实条件和课程特点探索实现工程伦理教育的适宜形式是非
在文档电子化的文本自动分析、理解和识别过程中,除了有关文档内容的字符识别外,还必须解决字体识别问题.字体识别不仅是版面分析、理解和恢复的重要依据,还有助于实现高性能