融合注意力机制的图像超分辨率算法及应用研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:niubisile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像超分辨率(Super-Resolution,SR)是一种将低分辨率图像(Low-Resolution,LR)处理为高分辨率图像(High-Resolution,HR)的技术,旨在提升图像的像素密度,并且在一定程度上还原图像中的细节。超分辨率算法对人类世界产生的影响极其深远,其应用场景十分广泛,包括卫星成像、医学成像、视频监控、自动驾驶等诸多领域。同时,随着近年来深度学习的发展以及人们对于图像质量要求的提高,图像超分辨率逐渐成为计算机视觉领域的热门研究课题。然而,图像超分辨率重建是一个经典的反问题。早期的算法着重于研究基于插值的方法,其执行效率高,算法实现简单,但存在较大的瓶颈。为更好的解决这一问题,大量基于学习的方法被提了出来,用于学习低分辨率图像到高分辨率图像的映射。同时,深度学习的发展更是给超分辨率的研究前景带来了更多可能性。本文的主要内容如下:(1)通常使用的通道注意力机制忽略空间层面上的信息,这样的注意力机制会使网络在学习的过程中自适应选择的范围受限。同时发现,多数网络训练时所使用的损失函数对高频信息和低频信息的关注程度相同,这阻碍了网络对于高频信息的学习。因此,提出了一种基于区域级通道注意力的图像超分辨率算法。区域级通道注意力机制(Region-level Channel Attention,RCA)可以使网络对不同空间区域上的通道分配不同的注意力。同时还提出了一种高频关注损失,提高网络对高频细节的关注程度。通过一系列实验验证了此部分所提方法的有效性,同时该方法生成的图片相比起其他对比算法具有更好的视觉效果,并且具有更优的客观指标。(2)生成对抗网络在超分辨率领域已经得到了广泛的应用,通过使用对抗训练方式得到的超分辨率模型生成的图像结果虽然可以在视觉上有很大的提升,但是在语义上与原始图像通常存在较大的出入。于是在损失函数上设计了一种结构保留损失,使网络在训练的过程中更加关注其结构信息。另外,在设计的生成网络中使用了宽通道激活的方式,使网络的浅层信息可以最大程度的传递到后续的深层网络中。同时也引入了感知损失,使生成的结果更加细致化。实验结果表明,相较于对比算法,该算法的生成结果可以在保证图像视觉效果的同时缓解失真的情况。
其他文献
论文针对目前乘坐扶梯经常出现的事故和危险行为,使用图像处理方法对扶梯上携带宠物、推车、抱小孩、攀爬等异常行为进行实时检测预警,在此基础上开发出智能监控系统,对扶梯场景进行实时检测分析和在线报警,保护乘客安全。论文主要进行了以下几个方面的研究:第一,针对扶梯入口、出口出现的快速运动导致的目标运动模糊问题,提出基于生成对抗网络的去运动模糊算法。使用生成对抗网络对模糊图片进行重构,以降低运动模糊的影响。
在当今社会的各个领域中,智能化是未来发展的大趋势;生活中的各类物联网产品、汽车飞机的无人驾驶技术、雷达系统、设备结构监测、基础建筑的安全检测以及工业生产自动化及其机器人系统都需要更加智能的感知技术;这就对传感器的感知精度和速度提出了更高的要求,且需要覆盖范围更广、覆盖密度更高的传感器网络。以工业生产中智能机器人为例,智能机器人需要代替人类在极端的环境下进行大量的危险性高、重复率高、难度大以及长时间
近年来,工业以太网技术促进了工业控制系统(Industrial Control System,ICS)和信息技术(Information Technology,IT)网络的集成,使得ICS信息化程度不断加深。信息网络集成虽然提高了系统生产效率,但也带来了更多新的信息安全问题。同时系统中设备节点数量众多且拓扑结构呈现分布式的趋势,传统中心化信息控制的方式中的性能瓶颈和安全问题将会日益明显。就关键基础
表面等离子体共振(SPR)传感器是一种免标记、高灵敏的光学传感器,它的原理是当入射光引起金属与介质界面的SPR时,可获得与共振波长一一对应的介质折射率。目前商用的SPR传感器均为棱镜耦合型,虽然灵敏度很高,但体积庞大,价格昂贵。随着纳米制备工艺的成熟和人们对传感器小型化的迫切需求,光栅耦合型SPR传感器应运而生。目前的光栅耦合型SPR传感器存在灵敏度较低,无法检测不透明溶液的问题,这限制了此类传感
随着车辆数量日益增多,道路交通问题密切影响着日常生活。交通监管部门需要通过视频数据实时监控路况信息。无人机技术的快速发展,使从空中视角获得数据成为可能。无人机能提供更加广阔灵活的视角,包含更多的信息,同时也能胜任长距离监控。在无人机场景下通过图像和视频对车辆目标进行跟踪,也有望成为交通监控的新方式。无人机视角下跟踪场景不够稳定,目标容易产生大幅度的形变,也可能被环境所遮挡。无人机的硬件平台也决定了
基于视觉的微小振动放大技术是一种通过处理图像时空信息,放大微小但重要变化的技术。机器视觉振动放大技术被用来揭示肉眼难以察觉微小变化,在工程结构模态识别、医疗心率检测,故障损伤检测等领域有重要价值。论文对视频微小振动放大技术进行详细的分析和研究,从多角度对微小振动放大算法进行优化,并将优化后的算法应用于非接触式心率检测,具有较好的工程应用价值。论文针对微小振动视频中存在大运动干扰,导致视频放大结果出
自NB-IoT(Narrow-Band Internet of Things,窄带物联网)技术提出以来,各项技术标准逐步得到完善,当前已经成为低功耗广域物联网中最具潜力的技术之一。在与各领域逐渐实现深度融合的过程中,NB-IoT设备将被大规模部署,考虑到NB-IoT系统的180KHz有限频谱资源,海量设备接入时将有可能发生资源竞争现象,使系统出现接入拥塞,从而导致网络接入量降低、资源浪费等问题。因
人脸表情识别是一项极具挑战的模式识别任务,在例如医学研究、交通安全、公共安防、刑侦审讯、影视娱乐等领域有重要的现实意义。对于可预见的未来世界中的高效人机交互,正确快速的识别用户表情也是一项必不可少的技术。近十年来,表情识别的研究进度突飞猛进,从小数据的室内研究转向了具有更大数据量的室外研究,研究方法也从传统方法变革为深度学习方法。深度表情识别的主要难点有以下几点:缺乏有效训练数据、存在大量表情无关
聚类是在无标记的条件下将数据分组,从而发现数据的天然结构的一种技术。聚类在数据分析中扮演了重要的角色,它可以发现数据的潜在结构、对数据进行自然分组或压缩,是人工智能的重要分支之一。2019年,Nie Feiping等人在ACM SIGKDD上提出了指定k个聚类的多均值聚类算法(a multiple-means clustering method with specified K clusters,
行人检测作为计算机视觉研究领域的一项关键技术,在智能监控、车辆辅助驾驶、运动分析与人机交互等领域有广泛的应用价值。但由于姿态、穿着、尺度、光线的变化以及相互遮挡等复杂场景的影响,行人检测仍是一个有挑战性的问题。融合多个特征能加强人体特征表达、提升行人检测算法性能。本文针对多特征融合、候选区域的提取、行人尺度多样性等问题以及行人检测算法的应用进行了研究,主要研究工作如下:(1)针对结合方向梯度直方图