基于神经网络的文档图像矫正系统的研究和设计

来源 :重庆大学 | 被引量 : 0次 | 上传用户:fugoolisk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于科技发展迅速,以及手机的普及,移动摄像头数量也随之剧增。通常大多数人都会采用简便快捷的拍照的方式对文档进行记录,因此会产生大量随意拍摄的文档图像。该类文档图像存在以下缺点:(1)由于物理文档本身存在一定的扭曲或变形,或者光线等原因,导致手机拍照效果不好。(2)为了将整个文档包含于拍摄的照片中,手机拍摄的照片通常包含一些周围的边界区域。(3)由于拍摄条件限制,手机拍摄的照片可能会存在一定的倾斜。以上因素都会导致该类文档图像在用以进行例如文字识别,相似度比较等后续操作时难以达到理想效果。本文主要是针对上述的问题2和问题3的研究,通过语义分割的方法将文档像中的文档区域分割出来,然后应用图像后处理方法将文档区域进行矫正。目前有大量的语义分割算法,不同的算法在不同的任务场景中表现也不一样。在语义分割阶段本文使用了文档图像分割领域效果较好的Pagenet以及在医学图像中取得较好效果的U-net进行分割,对比分割效果,并加以后处理方法提取文档图像的边界四边形,并使用投影变换对其进行矫正。该领域目前缺乏统一的黄金数据集,以及评价指标,因此实验中训练网络时使用的是自己构建的两个数据集。由于任务不同,本文也对神经网络中的一些细节做出调整,使得神经网络能更加适应本文的任务。本文的创新点在于在文档图像矫正中引入语义分割的方法,将新的损失函数应用在神经网络当中,并添加不同的后处理方式提取文档的边界四边形。
其他文献
心血管疾病是近年来威胁人们生命健康的主要慢性疾病之一。心血管疾病患者在早期发病时往往伴随有心律失常的症状,通过心电信号尽早发现心律失常症状可以有效预防心血管疾病
图像分割作为计算机视觉的基础,同时也是图像分析和图像理解的重要前提,但同样也是一个经典难题。图像分割通过赋予每个像素不同的类别标签来使得相同类别标签的像素具有相似
肿瘤细胞和肿瘤组织中持续性高表达的HSP90在其发生、维持、存活能力提高、增殖和转移等过程中扮演关键角色,HSP90作为信号传导通路多重阻断抗肿瘤药物靶标,有着广阔的临床应
基于位置的服务在运行过程中记录了大量用户移动轨迹数据,这些数据不仅包括了用户移动的位置和时间,还包含了丰富的用户活动产生的语义信息,具有时空依赖性与语义性。随着移
自然界中存在各种各样的颗粒系统,例如,火山爆发时,大量火山灰颗粒被气流带到大气层中,并随后在气流作用下扩散运动;沙尘暴的发生,源于干旱、沙漠地区的地表的大量沙尘颗粒在
本文试图论述柏拉图《蒂迈欧篇》中的“容器”(Receptacle)概念,“容器”作为柏拉图的第三种东西(The third kind),使理念(模型)的影像呈现于其中,同时它被比喻为“母亲”而生成物理世界中的可感事物。“容器”在创造宇宙的第二个原因——必然性——中具有重要的地位,但“容器”却在文本中没有确定的定义。柏拉图认为它逃脱逻各斯的捕捉,它需要靠不纯粹的理智(bastard reasonin
传统的人工监测方式和红外感应方式的人流密度监控系统由于人力的巨大成本和技术精度低等种种弊端无法应用于更多场景已被市场逐渐淘汰。基于视频处理的人流密度监控系统虽然
随着脑机接口技术的发展,基于脑电的情绪识别受到了广大研究者的青睐和重视。脑电情绪识别的研究为人工智能领域的发展注入了新的活力。本文针对脑电信号中眼电伪迹去除和模
花生是国际广泛栽培种植的油料作物和经济作物,是油脂和蛋白质的主要来源。近年来,伴随人们物质条件的不断丰富,花生油的需求比重持续加大,花生产业蒸蒸日上。人们对健康重视程度的加强,也要求花生品种既要有高的含油量,又要有好的品质,脂肪酸则是影响花生品质和油脂营养的重要成分。因此如何增加花生油中有益脂肪酸的比重,是全世界花生品种改良的重点。对花生含油量、蛋白质和脂肪酸等品质性状的相关QTL加以分析,可作为
合理分布供电系统中的无功功率是一种保证系统安全、可靠以及经济运行的前提条件,同时,合理的分布无功功率也可以有效的降低系统有功功率损耗以及提升电压质量。因此,本文为