基于特征学习的图像离焦模糊检测研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:hhz20091
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像离焦模糊检测致力于检测出数字图像中的离焦模糊区域和聚焦清晰区域,是一种像素级二分类任务,在图像质量评估、图像恢复等计算机视觉领域有着广泛应用。近年来,深度学习技术高速发展,其在离焦模糊检测领域也取得了极大成就。尽管如此,离焦模糊检测依然存在一系列问题,包括难以精准捕获目标区域边缘细节、难以正确区分同质清晰区域、难以检测清晰背景等。一方面,现存的方法一般仅关注离焦模糊图像的单一区域(清晰区域或者模糊区域)到相应真值的映射模型,而本文认为离焦模糊图像的清晰区域和模糊区域均包含对检测有益的信息。因此,本文提出双向互补学习网络,引入互补真值同时学习清晰区域和模糊区域到真值和互补真值的映射模型;双向学习原始图像的浅层级特征和深层级特征;信息补充、逐步重建精细的离焦模糊映射图以尝试解决难以精准捕获目标区域边缘细节和难以正确区分同质清晰区域等问题。另一方面,鉴于离焦模糊检测任务的真值一般由不完整的语义信息组成的特点,大多数现存的方法比较偏向于关注图像的浅层级信息而不太重视图像的深层级的语义、上下文信息。本文则认为图像的浅层级信息与深层级信息对于离焦模糊检测同等重要,因此提出特征均衡学习网络,均衡地融合和学习原始图像的多层级特征,以尝试解决难以检测清晰背景等问题。本文的创新性和主要工作可以总结为以下两点:(1)针对难以精准捕获目标区域边缘细节、难以正确区分同质清晰区域等问题,本文提出了双向互补学习网络。双向互补学习网络引入互补真值,以此同时学习清晰区域和模糊区域的互补特征,互补不足;同时分别建立了浅层解码子网和深层解码子网,双向学习原始图像的多层级特征,生成成对互补特征图;最后逐层融合成对的互补特征图,循环修正,生成最终高质量精细的检测结果。(2)针对难以检测离焦模糊图像存在的清晰背景等问题,本文提出了特征均衡学习网络。特征均衡学习网络以图像中间层级特征为中心建立解码输出支路,对称均衡地融合原始图像的多层级特征;同时利用提出的多尺度残差卷积模块循环地校正中间预测误差,微调中间层级预测图。通过特征均衡学习,无论图像的清晰目标与前景耦合还是与背景耦合,提出的网络都能获得高质量精细且鲁棒的检测结果。
其他文献
三角晶格稀土化合物因其特殊的晶格结构很容易产生几何阻挫,由于几何阻挫会导致材料中丰富的物理性质,故研究这类材料对于解决凝聚态物理领域许多的基本问题有着重要意义。另外,稀土原子磁矩较大,可能具有较好的磁制冷性能。本研究中使用助熔剂法成功生长出了具有三角晶格的α-DyGa3和NdAuA14Ge2的单晶,使用X射线衍射(XRD)表征了单晶化合物的结构,利用扫描电子显微镜的能谱仪(EDS)确定了单晶化合物
学位
电子元器件热管理问题日益严重,强化微尺度传热能有效地解决目前的难题。相变热管是指使用内部工质的气液相转变来传导热能,其传热效率远高于传统材料,同时具备导热性能好,等温性好,热流方向可逆、换热效果好等优点。研究不同条件下热管内工质温度的变化,在工程应用以及科学研究领域具有重要的价值。进行实验研究不能及时准确的掌控热管内工质温度的变化情况,现存的宏观数值模型不能模拟研究微尺度热管的换热过程等缺陷。格子
学位
汽车保有量日益增加,停车难问题日显突出,近年来常以停车共享的方式优化整合停车资源,充分发挥已有供给效能。然而一方面对共享停车研究的可行性多从宏观的、定性的角度出发,从微观的、精细化的停车需求时变特性的角度揭示动态互补机制的研究较少;另一方面,对于共享停车配置的思路不少,但在配置中多只考虑一种因素,对将多种影响因素一并考虑,即这种较为符合实际的研究更为稀缺;此外,针对共享停车效果评价的研究较少且评价
学位
受制于钠离子较大的离子半径和质量等问题,钠离子电池的发展仍面临着许多阻碍,设计合成低成本、高性能并能稳定快速脱/嵌钠离子的正负极材料是将来实现钠离子电池商业化的关键。铁基材料因其理论容量高,资源丰富及安全性好等特性,被视为一类很有应用潜力的电极材料;然而,固有的低电导率、缓慢的电荷转移动力学及电化学过程中不可避免的体积效应等问题,导致铁基电极材料储钠表现不理想。因此,针对上述问题,本文致力于铁基电
学位
专利数据中蕴藏着大量高质量高价值的信息,如何从专利数据中挖掘出有价值的知识,即专利分析研究,成为一个研究热点话题。专利数据库中包括着专利文档、专利转让、发明人和权利人等海量信息。研究专利数据对个人、企业都有着重要的意义。企业可以对专利文献中的海量信息进行加工整合,从中挖掘出对于企业经营活动有价值的信息,如挖掘潜在竞争对手、预测技术演化等。专利数据的结构复杂,包含着大量的数据类型和关系类型。传统的专
学位
井下三维点云数据是建立数字化、信息化、智慧化、安全化矿山的重要基础信息,也是矿山开采、回填、绿化环保等日常工作的重要基础数据。由于井下采空区的点云数据质量好坏会直接影响矿量储量计算、开采规划、采场回填、采空区动态监测等。因此,需要对点云数据进行去噪、配准、建模等处理,以提高点云数据的质量和利用效率。特别是将多测站扫描的数据配准到一起,从而获得完整的采空区信息,然后将该信息转化为曲面实体模型,便于数
学位
科学技术的进步为开发高适应性、机动性和灵活性的机器人提供了可能。高性能机器人能够代替人类开展日常和工业性活动,因而,其需求也随之增长。相较于地面作业的机器人,爬壁机器人作为一种适用于各种非结构和高危环境的特种机器人,有着特殊的任务需求和设计要求。野生动物的爬行、奔跑和跳跃给这类机器人的设计带来了众多灵感。作为仿生设计的一种,带有钩爪的柔性足式结构不仅让爬壁机器人与墙面的接触和分离机理更为简单,还能
学位
目的:核桃是新疆地区的主要园艺产业之一,主要以干果来实现其经济价值。因此,核桃正常的开花结果就显得尤为重要。研究核桃成花,对其品种改良及稳产增效具有重要意义。前人研究表明,miR164通过介导NAC基因对花器官原基和分生组织的形成发育发挥调控作用,同时,NAC转录因子在影响雄蕊数量及花器官发育过程中发挥调控作用。为更清晰的了解核桃成花过程的分子机理,探究miR164与NAC家族对核桃成花过程的调控
学位
<正>1引言“圆的周长”是初中数学的重要内容,在过去教学中已经有广泛的探索.大多数“圆的周长”教学课例均以“绕绳法”、“滚动法”来测量“圆的周长”,较少发现基于数学史运用“折纸法”来重构式地探究“割圆术”的过程,运用Excel来辅助统计、分析测量数据等类似教学案例.这一教学能够聚焦培育学生数学抽象、逻辑推理、直观想象、数据分析等核心素养,具有可学性、新颖性.
期刊
探索大脑活动和理解认知机制一直是神经科学的主要研究热点之一,从脑影像数据中解读人脑的认知状态是脑功能特性研究的常用方式,功能磁共振成像(functional Magnetic Resonance Imaging,fMRI)作为一种非侵入性的全脑神经成像方法,为解码大脑功能活动提供了有效手段。近几年来,得益于深度神经网络在多个领域显示出的优越性能,深度学习已被广泛应用于fMRI脑解码研究。然而,目前
学位