图像和视频超分辨率的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:quchaolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像和视频的超分辨率(Super-Resolution,SR)算法研究是计算机视觉领域的一个重要问题,它能恢复原始数据由于远距离传输、压缩等造成的数据分辨率损失。通过对低分辨率数据的超分辨率重建,可以获得高分辨率的数据内容,极大改善视觉效果。在多媒体时代,图像和视频是我们日常接触最多的数据,为了提升降质数据的视觉效果,产业界以及学术界都致力于利用大数据的优势发展新型的超分辨率算法。得益于深度学习的快速发展,利用卷积神经网络构建深度模型被广泛地运用在最新的超分辨率算法中。相对于传统的基于手工特征的算法,基于卷积神经网络的超分辨率模型摆脱了复杂的调参过程,仅仅需要输入数据就能恢复出更优的细节特征,具有很强的可适应性。虽然卷积神经网络的引入为SR算法带来显著的收益,但由于深度学习模型动态推理能力差,算法复杂度高,注意力机制不清晰等问题依然有待解决,如何更加高效地提升超分辨率模型的运行效率和效果仍面临着巨大的挑战。本论文以深度学习的超分辨率模型为基础,针对现有算法面临的问题,从卷积神经网络的注意力机制,模型轻量化,真实场景的可适应性,三维卷积的应用这个四个角度出发对超分辨率模型理论和方法进行深入研究,主要贡献总结如下:(1)从卷积神经网络的注意力机制角度出发,本论文为超分辨率模型设计出一种新颖的核注意力模块。通过在运行中动态选择合适的卷积核,该机制使网络能够根据不同尺度的输入内容动态调整卷积核感受野的大小。在此基础上,本论文使用残差连接和组连接的方式对多个核注意模块进行叠加,形成了一种新的超分辨率模型,它能对不同接受域下的信息进行筛选,以此学习到更多有区别的表达。因此,本论文所提出的模型对多尺度特征更加敏感,通过预先定义上采样模块,使得单个网络能够同时处理多个尺度的超分辨率任务。本论文还综合对比了其它具有代表性的注意力机制,比如通道注意力机制和空间注意力机制,显示出本论文提出的基于核注意力机制的优越性,并在一定程度上为超分辨率模型的结构设计提供了可解释性。(2)从模型轻量化的角度出发,本论文设计出一个新颖的轻量级图像超分辨率模型,名字叫渐进式特征融合网络。为了充分利用特征图,本论文提出了一种新的渐进式注意力块作为网络的主要组成块。该模块采用多个具有像素注意力的并行连接路径,它能显著提高各层的感受野范围,从而帮助网络提取到图像中有用的信息和学习到更有鉴别性的特征表示。此外,在该网络中,本论文还利用多尺度的像素注意力机制构建出简洁高效的上采样模块。以上所有模块都保证了网络可以从注意力机制中受益,同时其自身又足够轻量级。在此基础上,本论文还提出了一种基于余弦退火学习的训练策略,它能训练出更具表达能力的模型,在不改变模型结构的情况下提高复原图像的质量。(3)从真实的应用场景出发,构建可适应卫星遥感图像的超分辨率模型。当前,超分辨率模型在真实场景下的可适应性研究是目前的难点问题。针对遥感图像的超分辨率重建,本论文提出了一种新型的混合高阶注意力网络。该网络由两部分组成:用于特征提取的浅层网络和用于细节恢复的具有高阶注意力机制的深层网络。在浅层网络中,本论文在所有跳转连接中用通道加权拼接代替元素级加法,这大大促进了信息流动。在深度网络中,不同于传统的一阶统计(空间或通道注意力),本论文设计出新颖的高阶注意力模块来恢复丢失的细节。最后,本论文引入了频率感知连接来集成浅层和深层网络。实验证明,本论文所提出的方法在遥感图像超分辨率上能提供当前最好的性能。(4)从三维卷积的角度出发,研究针对视频超分辨率模型的高效算法。与以往的基于光流的运动补偿方法不同,本论文提供了一种利用卷积分解原理实现的高效三维卷积模块来捕捉帧间依赖。在分解后,用三组一维的卷积核代替了传统的三维卷积核,从而使模型在保持较小运算量的同时充分利用输入图像序列的时空信息。此外,本论文还提出了一种新颖的动态多分支网络,它在特征融合阶段采用新颖的动态重建策略,使网络能从多个分支中自适应地确定时间相关的最佳信息。不同于简单的特征相加或者拼接,该动态策略能极大提升视频超分辨率的性能。
其他文献
随着移动互联网的兴起,不同功能的在线社交网络平台得到了蓬勃发展,为了充分利用这些平台的功能,人们逐渐习惯同时使用多个在线社交网络服务。这种多社交网络行为以及网络间重叠用户的存在为原本孤立的平台构建了逻辑上的联系,社交网络研究内容逐渐从传统的单一网络向多网络结合转变和发展。由于各种原因,多个平台间的信息通常缺少显式的关联关系,这种稀疏的显式关系导致了平台间的信息隔离,针对该问题,本文对跨社交网络的信
学位
借鉴了昆虫毛发感知系统敏感机理的微机电(Micro-electro-mechanical system,MEMS)仿生毛发传感器是一种典型的多功能、小型化的新型传感器,可以实现对于空气流速、加速度、声音、振动等信号的检测,有望广泛应用于微自主系统的流速感知、运动控制、环境识别等智能传感领域。区别于传统的电容式、压电式或者压阻式敏感机理,本文首次将基于模态局部化效应的弱耦合谐振器应用于仿生毛发传感器
学位
深空探测作为人类太空探索的重要活动之一,是人类认识自己、认识宇宙最直接的方式。而100天文单位的太阳系边际探测作为当前人类的深空探测中距离最远的一类型任务,一直是国际空间科学研究的前沿领域。而在探测任务中,地面如何在如此遥远的距离上、如此微弱的信号下对航天器距离、速度和角度等参数测量,如何在长达数十年的任务周期中提高任务成功率,如何在单次任务中尽可能实现多的科学探测任务,都是在我国未来的100天文
学位
在日常生活中,常常采用生物特征识别技术保护个人隐私和信息安全。指静脉识别技术依靠手指掌侧浅静脉进行身份识别,具有安全性高、活体识别、精度高等优点,是生物特征识别领域的研究热点。针对现有传统的基于特征提取以及基于机器学习的手指静脉识别模型的不足,本论文以手指静脉图像为研究对象,以深度学习技术、度量学习技术为理论基础,利用深度度量学习方法、深度生成模型以及增量学习方法对指静脉图像识别问题展开研究,并通
学位
人类科技的繁荣带来电子技术的发展和航空航天的进步,导致日常生活因为使用更多的电子产品和空间通信,从而更容易受到日地之间空间环境的影响。因为地基望远镜比空间望远镜更易于安装和维护,且更加稳定,所以目前最常用的太阳望远镜都是地基的。地基望远镜系统的天文观测由于大气湍流的存在导致光波的严重波前畸变,直接观测成像的分辨力远远达不到所期望的望远镜理论衍射极限。当从地球观测太阳时,这些影响尤其严重。自适应光学
学位
抖动作为衡量数据传输稳定性和可靠性的核心指标,在超大规模集成电路(Integrated Circuits,ICs)、高速串行链路(High-speed Serial Links,HSSLs)以及云计算(Cloud Computing)的测试分析中发挥重要作用。随着数字技术的飞速发展,抖动测试、分析和定位等相关技术的研究已经滞后于数字系统工作速率的快速提升。抖动分析建模技术已经逐渐成为高速数字系统设
学位
随着社会发展对清洁能源需求的提高,特别是个人便携式电子设备和电动汽车数量需求的快速增长,发展新型电化学储能设备受到了人们极大的关注。其中,钠离子电池因丰富的钠源储量,以及与锂相似的物理化学性质,被广泛认为是未来最有潜力的电网级能量存储与转换设备。然而,与传统的锂离子电池相比,有关钠离子电池的深入研究还处于起步阶段。尤其是,至关重要的电极材料在钠离子电池中的微结构与相演变行为,离子传输的动力学过程,
学位
声学多普勒测流技术是一种在水下利用声波测量水体流速等特性的遥测技术。由于具有不干扰水流场、测量速度快、测量精度高、测量参数多和测量成本低等诸多优势,声学多普勒测流技术被广泛应用于海洋、江河、湖泊和沟渠等多种环境的水体测量。由于测流环境具有多样性、时变性和复杂性,为在多种环境中实现高性能测量,需要赋予测流仪器适应环境的能力。本文以提高声学多普勒测流仪器的环境适应性为目标,分析了几种典型环境因素对测流
学位
关系抽取是自动从文本序列中检测和识别出实体之间语义关系的任务。该任务是知识工程中知识获取的核心基础技术,能够赋予人工智能更精准的知识理解能力。知识获取依赖于人类知识载体之一的海量文本数据,而这些文本数据随着信息的爆炸式增长被快速淹没在信息浪潮中。因此,挖掘这些文本数据中所蕴含的知识,既是自然语言处理的理论需求,也是人类文明传承的现实需要。目前,基于深度学习的自然语言处理技术在关系抽取领域已经取得长
学位
风力发电作为一种低碳清洁的可再生能源发电方式,有着广阔的发展前景。目前,风力发电机正朝着永磁直驱与单机大容量的方向发展。本文面向大型永磁直驱风力发电机,研究新型低空间谐波模块化分数槽绕组,可促进大型风力发电机模块化设计技术水平的提升,因此具有重要的理论意义与工程应用价值。本文首先详细研究了传统多相对称交流绕组的磁动势构成,建立了多相对称交流绕组的磁动势谐波分析方法。据此提出了一种新型低空间谐波模块
学位