基于EmguCV的文档图像预处理研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户：wffg0907

【摘要】

：

【作者】

：

隋清圣

【出处】

：

成都理工大学

【发表日期】

：

2019年01期

【关键词】

：

文档图像二值化倾斜校正相机水印去除 EmguCV

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

日常生活中,为了文档保存和交流的方便,人们经常需要将纸质的文档数字化,对文档进行数字化的方式一般是通过扫描仪扫描或者相机拍照的方式,这种方式获取的带有文档信息的图片即文档图像。目前市面上常用的文档图像处理软件在对文档图像进行二值化处理时用的算法是基于全局阈值的方法,对于光照均匀的文档图像其处理效果正常,但是对于存在光照不均匀的文档图像时会出现大块的黑色区域或者白色区域。文档图像在获取时经常会由于采集设备、文档自身保存状况以及后期的二值化处理步骤而存在噪声,噪声会影响文档图像使用者的视觉感观。此外在获取文档图像时由于文档与采集设备之间的角度偏移会导致拍摄出来的文档图像具有倾斜形变,发生倾斜形变的文档图像会影响视觉观感以及OCR识别的准确率。近年来随着智能手机厂家在其手机拍摄后的照片上面添加了相机水印,手机拍摄到的文档图像也会具有相机水印,相机水印的存在会干扰后期的OCR识别准确率。针对这些问题,需要对文档图像进行二值化、滤波、倾斜校正以及相机水印去除等一系列预处理工作,主要工作如下:1)基于EmguCV(Emgu Computer Vision),利用C#开发了一款文档图像预处理软件,能够对文档图像进行二值化、滤波、倾斜校正以及相机水印去除等处理。2)在开发的文档图像预处理软件中,对存在光照不均匀现象的文档图像进行二值化处理时,使用Niblack二值化方法可以避免使用Otsu方法进行处理时存在的大片的黑色或者白色区域,总体而言开发的文档图像预处理软件取得的二值化效果比市面上常用的文档图像处理软件二值化的效果好。3)在开发的文档图像预处理软件中,提供滤波功能,能够对文档图像的噪声进行处理,尤其是借助于形态学滤波能够处理利用Niblack法二值化后产生的噪声。4)针对文档图像的倾斜校正,采用文本行外接矩形来获取倾斜角度从而进行校正。该方法首先对文档图像进行二值化,然后进行颜色反转,再借助于形态学操作获取文本行的矩形状的长条,进而获取所有文本行长条的外接矩形,获取最长的外接矩形,求得外接矩形的倾斜角度,从而对文档图像进行旋转,该方法的校正效果可以满足文档图像倾斜校正的要求,针对中文文档图像的倾斜校正由于中文上下高度基本一致,效果比基于最小二乘法的倾斜校正更好。5)针对文档图像中存在的相机水印,首先分析了相机水印的特点,通过不同阈值下的二值化效果对比,得到最佳的阈值,然后对相机水印进行二值化处理,最后借助于常用的图像修复算法——FMM算法对相机水印进行去除,去除效果很好,基本上不会对OCR识别带来字符干扰。

其他文献

“人民代表大会:国家权力机关”教学设计

<正>一、教学目标1.通过课堂教学,提升学生的政治责任感,树立中国特色社会主义的道路自信、制度自信和理论自信,培育学生的政治认同核心素养;通过带领学生走访身边的全国人大

期刊

人民代表大会:国家权力机关人民代表大会制度核心素养公共参与全国人大代表全国人民代表大会政治认同教学设计

划痕形状对圆柱滚子润滑性能的影响

为研究划痕对滚子润滑性能的影响,采用数值分析的方法研究了不同形状的表面划痕对圆柱滚子润滑性能的影响,分析了划痕宽度和深度对油膜压力、厚度的影响规律。结果表明,不同

期刊

润滑性能圆柱滚子表面划痕

国际条约在英国国内法解释中的作用

在国际法渊源体系中,国际条约是最重要的渊源之一。在国际条约与英国国内法关系的问题上英国表现为"二元论"。英国作为普通法国家,更注重实践、判例而非单纯理论问题。文章以

期刊

国际条约英国国内法解释

“城市修补”视角下合肥老城生活性街道共享设计策略研究

随着我国城镇化进程的不断加快,人们逐渐对城市街道所承载的交通性提出较高的要求,弱化了对街道生活空间的保护。在街道的建设中也愈发缺少对城市居民的慢行出行与交往等需求

学位

生活性街道城市修补合肥老城区街道共享性

基于机器学习的大规模光网络性能监测和资源分配技术研究

云计算、边缘计算、物联网、虚拟现实、人工智能和5G等新技术的出现导致网络数据爆发式增长。作为网络数据传输最重要的基础设施之一,光网络也一直面临着高带宽和低时延的发

学位

光路传输质量预测机器学习遗传算法路由与波长分配算法动态带宽分配算法

电针配合中药超声雾化治疗干眼症的临床疗效观察

目的：临床观察电针配合中药超声雾化治疗干眼症的疗效。方法：随机将45例干眼症患者分为治疗组和对照组,分别检测治疗前后的观察指标（泪膜破裂时间BUT、泪液分泌试验SIt和角膜荧

期刊

电针中药超声雾化干眼症

超声波协同酶交联改善花生蛋白凝胶性的研究

我国花生资源丰富,目前大多用于制油。由传统制油方式获得的饼粕中花生蛋白变性严重,难以被提取利用,造成了花生蛋白资源的极大浪费。由于天然的花生蛋白凝胶性较差,从而限制

学位

花生蛋白凝胶超声波:转谷氨酰胺酶复合改性结构

无抗性标记自主发光鲍曼不动杆菌的构建及怡莱霉素E的药效学研究

鲍曼不动杆菌(Acinetobacter baumannii,Ab)属于革兰氏阴性菌,是引起医院感染的重要病原菌。近年来耐药Ab出现的比率不断上升,公众对此产生关注。本研究首次将Tn7转座子与dif序列结合,一步法成功构建出一种无抗性标记的自主发光鲍曼不动杆菌(unmarked autoluminescent Ab,UAlAb),其基因组中含有能表达自主发光蛋白的基因luxCDABE,不需添加任何

学位

鲍曼不动杆菌自主发光Tn7dif序列Xer位点特异性重组怡莱霉素E

科协党员干部应增强八项本领提升八种能力

<正>习近平总书记在党的十九大报告中指出,领导十三亿多人的社会主义大国,我们党既要政治过硬,也要本领高强,并向全党提出了增强八项本领的要求。中国特色社会主义进入新时代

期刊

习近平总书记科协工作科协组织党内政治生态正风肃纪党的团结统一党内政治生活消极腐败精神懈怠执政考验

步进式热处理炉燃烧控制系统设计

本文通过对几种燃烧控制方式的分析比较,设计一种较为理想的步进式热处理炉燃烧控制系统,并对燃烧过程中的炉膛氧含量、炉压的控制进行进行分析、设计。使炉膛的燃烧控制能够

期刊

比例控制串级控制双交叉限幅控制燃烧效率

基于EmguCV的文档图像预处理研究

其他学术论文