基于边缘协同深度网络的降晰文本图像复原方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:fy9876
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字作为表达人类思想和情感的符号,在日常生活中处处可见。因此,以文本信息作为主体内容的文本图像也十分常见。在真实场景中拍摄的文本图像,经常因为分辨率不足以及相机抖动、失焦等多种因素,造成图像严重降晰,即清晰度大大下降,视觉效果模糊。针对多种退化因素的降晰文本图像复原方法研究是重要的也是必要的。然而,近年来,文本图像复原研究大多只针对单一的降晰因素。本文研究了针对单张低分辨率和抖动/失焦模糊的降晰文本图像进行复原的方法。通过建模和分析文本图像的降晰过程,本文发现,在降晰文本图像的复原方法研究中,高频信息具有非常重要的角色,应该得到重视。图像梯度编码了图像大部分的高频信息。通过观察本文还发现,与自然图像相比,文本图像的梯度分布更趋于均匀,往往在多个方向上都存在较强的梯度,能够较多地覆盖二维频谱,有助于复原降晰文本图像。本文的主要工作可以概括为以下三点:第一,通过展开图像复原中常用的?0范数正则化模型,本文提出了一种有效的边缘协同机制,该机制充分利用了高频信息的重要性和文本图像的梯度特性,以不同的方式来分别处理图像的低频和高频信息,通过高频预测和边缘协作复原两个子过程的迭代来不断地改进对真实边缘图和清晰文本图像的预测;第二,结合?0范数正则化模型和深度学习技术,本文提出了边缘协同模块,将边缘协同机制引入到深度神经网络中,构建了一种有效的边缘协同深度网络用于复原降晰文本图像;第三,本文构建了一个高质量的大型文本图像数据集,该数据集具有复杂多样的文本图像类型,能为其他降晰文本图像复原方法的研究提供数据支撑。本文在现有的公开文档图像数据集、新建的复杂文本图像数据集,以及真实文本图像上进行了大量实验,通过峰值信噪比、结构相似性指数、光学字符识别准确率和视觉效果的对比,验证了所提出的边缘协同深度网络在降晰文本图像复原中的有效性和优势。
其他文献
近年来,深度学习发展迅速,在理论上取得了许多突破,并且广泛应用于各个领域,例如,股票市场预测、天气预报、医学诊断、语音识别、图像分类。优化作为深度学习的重要组成部分,引起了研究学者的广泛关注。随着数据量的指数增长和模型复杂性的增加,深度学习中的优化方法面临着越来越多的挑战,各个领域的研究学者们相继提出了许多改进深度学习的优化方法。目前主流的优化算法是基于梯度的,收敛速度较快。但是,当优化场景包含多
学位
篮球已成为越来越多人喜爱的运动项目。然而如何锻炼篮球运动所需要的核心力量,是当前很多人不太了解的知识。因而科学有效提升篮球爱好者的核心力量,才能不断提升练球运动技能。因此本文从篮球运动核心力量训练中存在的问题出发,探析相应的解决方法,以期为篮球训练带来一定的参考价值。
期刊
近年来随着信息技术快速发展,互联网在各个行业大放异彩。“互联网+”对传统各个行业都产生了巨大影响。对于医疗行业,“互联网+”已然产生了巨大影响,并由此催生了医疗健康信息化行业。此次研究的意义主要表现在四个方面,第一,根据卫宁健康公司的发展现状,了解公司目前的对手。第二,结合公司的发展状况,制定相应的转型策略,增强竞争水平。第三,帮助卫宁健康公司更好的了解自身的优势,掌握自身的缺点。第四,提出的战略
学位
聚合物电解质由于其比表面积大、灵活性高且与电极的相容性好等优势,在电池中的应用一直是研究者们关注的热点。但由于聚合物电解质的离子电导率低和电化学稳定性差等缺点阻碍了其进一步的实际应用,因此需要对其进行改性和处理。本文以聚甲基丙烯酸甲酯(PMMA)为聚合物基体,采用无溶剂的制备过程以及不同的改性方法制备了两种基于离子液体的聚合物电解质,分别应用于锂离子电池和双离子电池体系,并且分析和探讨了聚合物电解
学位
电化学发光(Electrochemiluminescence,ECL)是一种检测灵敏度高、操作成本低、应用范围广的技术,在分析检测领域内极具发展潜力。目前,ECL传感器的发光材料以钌基分子为主。随着材料科学的发展,越来越多的新型发光体展现出了卓越的ECL性能,但是一些固有缺陷,如疏水性、溶剂依赖和聚集诱导猝灭等问题,极大限制了这些材料在ECL传感方面的应用。双极电极(Bipolar Electro
学位
随着社交媒体与信息技术的发展,海量的多模态数据广泛分布于互联网中,人们亟需一种能够跨越数据模态间差异的检索方法来满足他们日益增长的检索需求。因此,跨模态检索成为了近几年的一大研究热点。为了跨越不同模态间的异构鸿沟以及语义鸿沟,跨模态检索方法需要为多模态数据学习公共表达并将它们共同投影到公共空间中以进行相似性度量。而现有的大部分无监督跨模态检索方法都忽略了多模态数据的本质,对多模态数据的公共表达缺乏
学位
2014年之前,《预算法》限制了地方政府举债,各地的融资平台随之兴起,承担着为地方政府筹集资金的功能,导致地方政府隐性债务不明且规模庞大。为规范地方债的管理,2014年国家修订《预算法》,并且发文赋予省级地方政府进行适度举债的权限。针对没有收益的公益性项目,由地方政府发行一般债券进行融资,以一般公共预算收入偿还。针对有一定收益的公益性项目,由地方政府发行专项债券融资,以对应的政府性基金或专项收入偿
学位
在无约束的环境下拍摄的人脸图像,往往会遭受一种或者多种的图像退化效果,导致人脸图像在视觉上遭受破坏,并且可能影响人脸识别等场景的使用效果。基于深度学习的人脸图像复原研究是最近非常流行的方向。然而,许多最近的方法存在着两个局限性:(1)许多最近的人脸图像复原方法聚焦在复原单一退化效果的图像,遇到多种退化效果出现时,往往不能够很好的应对,导致复原后的人脸图像视觉效果不佳;(2)绝大多数人脸图像复原方法
学位
伴随着我国GDP的不断增长,居民可支配收入的不断上升,满足物质需求之后,国人开始更多的关注如何实现资产的持续增值,于是越来越多的人开始把眼光投向高速发展的中国资本市场。家装行业是我国传统发展行业,近年来受到国家对房地产行业的严格管控、精装修住房政策推进、旧改政策、以及消费升级等多类因素扰动,该行业发生了巨大的变化,同行业内的公司开始朝不同方向发展。本文将通过理论及数据相结合的方式对目标行业进行分析
学位
沪港通以及深港通是我国资本市场开放的重要一步,自2014年11月17日内地证监会和香港证监会联合宣布沪港通政策正式实施以来,我国资本市场快速发展,对外开放程度逐渐扩大,在这些良性影响下,中国证监会进一步加大了资本市场开放,于2016年12月5日宣布深港通正式开通。深港通在沪港通政策的基础上加大了开放力度,标的股票更多样化。减小了对于资本的限制条件,更大程度上刺激了境外资本进入A股市场的热情。由于深
学位