面向公式识别的PDF图像预处理研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:bladehit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的发展,信息数量不断膨胀。如何快速地获取所需要的信息,是当今社会人们的迫切需求之一。鉴于此,本文进行了一些面向公式识别的PDF图像预处理研究工作,为今后的PDF图像公式识别及检索奠定基础。首先,对PDF文件进行解析,从中获取PDF图像文件;其次,对提取出的PDF图像进行过滤和分类,根据图像宽、高等阈值对小图像进行过滤,根据真彩色图像的颜色信息、灰度图像的灰度直方图信息和二值图像的黑色像素点分布信息对图像进行分类,最终获取可以进行字符识别的文本图像;最后,对PDF图像及公式区域进行预处理操作,主要包括根据笔画宽度判断低分辨率图像并通过放大和腐蚀对其进行图像增强;根据公式特殊字符外接圆与其它连通域的距离关系对公式区域进行定位后检测公式中含有直线型符号的最长直线倾斜角度对公式区域进行倾斜校正;根据公式特点对公式区域进行去噪等工作。实验表明,所提出的方法有利于提高PDF图像公式识别的准确率。
其他文献
春季正是北方地区引进种羊的大好时期,同时又是羊焦虫病的流行季节,生产中羊群引进后暴发焦虫病的情况时有发生,造成巨大经济损失。现就本病发生情况做一介绍,供大家参考。
声调范畴习得是指学习者是否混淆不同的声调,本研究对马来留学生自由表达时57个录音样本中汉语语流的发音表现进行考察,发现:(1)其声调混淆的偏误率约为5.3%。(2)在本科二年
简要介绍了1998年汛后,我院在灾后重建工程中,应用于堤防工程的主要新技术及其特点、应用范围和主要机械设备。
小麦种植区的生态环境及年际差异,导致了同一品种小麦在不同生态区和不同年份的品质差异较大,对面粉品质的稳定性有很大的影响.为了进一步了解面包小麦在不同生态环境下的变
在阐述虚实融合视频压缩基本思想的基础上,对虚实融合视频压缩技术流程进行描述.针对虚实融合视频压缩方法提出评价因子,在此基础上构建压缩效果评价模型.实验结果表明,时间
针对工程实际中耐磨蚀混凝土修补材料存在的问题,试验研究了复掺LY-1、LY-2和S.F配制的高性能混凝土的力学性能、变形性能和耐冲磨性能。成果说明,通过适当比例复掺LY-1、LY-
精准脱贫是硬骨头硬任务,来不得水分、务不得虚功。唯有把贫困群众放在心上,把脱贫职责扛在肩上,把脱贫任务抓在手上,冲在第一线,干在最前沿,才能做好表率、凝聚人心、振奋士气,才能
报纸
1.作业调控小麦制粉厂需要调控的制粉作业以其重要程度的顺序有研磨、清粉和筛分.这些作业的效果对保持制粉厂的流量平衡,最终产品面粉的质量和出品率有关键性的影响.
期刊
一、磨粉机的更新换代辊式磨粉机已具有近200年的发展历史.早在20世纪初期,复式磨粉机的基本功能已经齐备,具有较完善的喂料、轧距调节和离合闸的功能.近百年来,磨粉机的基本
期刊
初中的体育课堂要进行教学改革,新课程的开发可以增加教学的多样性,使体育课堂变得丰富多彩。花样跳绳是一个很好的体育项目,在初中的课堂上引进此项目有助于培养学生的体育