基于深度学习的超分辨率重构轻量化研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:sksliuxin6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是信息的载体,图像的质量就是信息的质量,而超分辨率重构则是一种能够改善图像质量的技术,该技术在卫星遥感、监控图像、医疗诊断、生物识别等各项领域中都有着广泛的应用,具有很强的研究价值和应用价值。而随着深度学习在超分辨率重构领域的广泛使用,重构精度相比传统方法已经得到了质的飞跃。但目前的超分辨率重构模型存在着参数量大、推理速度慢等问题,阻碍了超分辨率重构技术应用于实际生活当中,因此,研究轻量化的超分辨率重构模型迫在眉睫。本文针对以上问题,提出了以下两种轻量化的超分辨率重构算法:(1)基于像素注意力的超分辨率重构轻量化算法。常规的通道注意力和空间注意力不适用于低级计算机视觉任务,像素注意力又缺乏上下文信息且计算复杂度较高。针对该问题,本文设计了一种低维像素注意力,使得权重矩阵可以在低维空间中完成计算,减少了计算复杂度,增加了感受野,能够有效增强模型的精度。经典的稠密连接中使用通道拼接的方式进行特征重用,导致模块参数量和计算量较大。针对该问题,本文提出了使用元素加法替换通道拼接,剔除了用于通道压缩的冗余卷积层,极大地减少了稠密连接的参数量和计算量。基于这两种改进,本文构建了一种残差稠密注意力网络,结合残差连接、稠密连接和低维像素注意力的优点,仅用较少的参数量就取得了良好的重构效果。(2)基于蒸馏连接的超分辨率重构轻量化算法。常规的轻量化模型往往对卷积操作进行分解,使得模型操作步骤增加,导致推理速度较慢。针对该问题,本文提出了一种蒸馏连接,将浅层特征进行特征重用,充分利用每个卷积层提取到的特征信息进行融合,提高信息总量,使得模块仅用少量的卷积层即可提取到丰富的特征信息,减少操作步骤,加快运行速度。常用的全局残差结构对模型的精度提升有限。针对该问题,本文引入全局融合结构,将每个模块的输出特征信息融合起来,充分利用多级特征,提高了最终的重构质量。基于这两种改进,本文构建了一种残差蒸馏注意力网络,结合残差连接、蒸馏连接、低维像素注意力和全局融合结构的优点,使得模型参数量少、计算量小、内存占用低、推理速度快且精度高。
其他文献
动作识别作为计算机视觉中重要的组成部分,几十年来得到了广泛的研究。人体动作识别技术已广泛应用于智慧安防、人机交互、虚拟现实和机器人技术等领域。得益于骨架数据在动态环境和复杂背景下的鲁棒性,近来涌现了许多基于骨架数据的动作识别算法。受限于深度学习网络的结构,卷积神经网络(CNNs)适合处理网格式数据,循环神经网络(RNNs)擅长建模序列数据,而为非结构化数据而提出的图神经网络(GNNs)成为了处理骨
学位
随着智能/辅助/自动驾驶技术的飞速发展,当前汽车配备大量传感器,拥有强大的感知、存储和通信能力,其中出租车、滴滴等智能网联汽车具有城市覆盖规模大和粒度细、以及可用的空闲时间充足等优点,从而为实现智慧城市大规模、细粒度、低成本的感知提供重要机会。因此,本文以智能网联汽车为研究对象,重点研究面向大规模智慧城市的群车感知(Vehicular Crowd-sensing)的三大核心关键问题,即如何激励汽车
学位
由于人工智能算法的迅速发展,卷积神经网络(Convolutional Neural Networks,CNN)模型通过专用硬件加速平台逐渐应用于嵌入式等环境,但是需要设计相应的深度学习编译器才能充分发挥出硬件的性能。目前国内对面向CNN专用加速器的深度学习编译器的研究还比较少,模型在部署方面还存在很多挑战。首先,随着CNN算法的发展,跨层次跳跃连接(Skip Connect)等复杂网络结构层出不穷
学位
近年来,强化学习算法已经广泛应用于实际应用中,解决决策与控制等复杂问题,如自动控制、电子游戏、机器人、智能电网和推荐系统等。但是,大多数强化学习方法从零知识状态开始训练一个智能体,需要庞大的数据、时间和计算资源。同时,在现实应用中,学习的计算成本随着任务的复杂度呈指数增加。因此,设计高效的强化学习算法,减少对数据及计算资源的依赖一直是强化学习中最具挑战性的问题之一。一种可行的方法是利用从相关任务中
学位
近年来,人们对利用注意力机制从历史行为中获取用户兴趣的深度兴趣模型给予了广泛的关注。然而,目前大多数结合注意力机制的模型只考虑用户行为的顺序,忽略了用户历史行为的时间因素。对于下一项推荐任务,这里有以下三个观察结果:(1)用户的个性化兴趣与用户历史行为的时间因素有关;(2)用户的个性化兴趣是动态发展的,而不是静态的,一成不变的;(3)用户的短期兴趣在下一项预测/推荐中起重要作用。这些结果也与人们的
学位
计算机断层成像(Computed Tomography,CT)具备快速生成高分辨率人体组织图像的特点,是医学诊断中广泛使用的一种成像方式。然而,过量的辐射暴露会增加患癌风险。虽然降低辐射剂量可极大限度地降低健康风险,但也会导致CT图像中存在过多噪声和伪影。因此,如何在低辐射剂量条件下获取高质量CT图像是一个具有重要意义的课题。近年来,卷积神经网络促使低剂量CT图像去噪研究取得了突破性进展,但相关研
学位
准确的交通流量预测能够为居民提供出行引导,帮助交管部门更加科学的管理道路网络,引导市政部门的道路建设,使人们的生活更加便利。然而交通流数据受到多种因素的影响,这些因素互相作用带来了交通流数据复杂的时空相关性,导致在对交通流数据建模的困难。针对交通流量预测问题,本文提出了两个基于动态图卷积和注意力机制的交通流量预测模型,并在Pe MSD4和Pe MSD8两个真实世界交通数据集上相对于11个不同的基准
学位
下颌运动是人完成咀嚼、吞咽、语言、表情等口腔功能活动的外在表现形式,一直以来都是口腔医学研究的重要领域。由于颞下颌关节、咀嚼肌群、牙齿咬合接触等需要协调工作才能保证下颌运动正常,在口腔治疗中,为了避免下颌运动与牙齿咬合失调,需要在术前进行准确的记录和模拟下颌运动轨迹。铰链轴在下颌运动中起到重要作用,是下颌运动中控制开闭口运动的转动轴,位于下颌髁突重心连线附近。现有方法采用机械牙合架描点标记的方式进
学位
随着互联网的普及和大数据的快速发展,涌现了海量的文本数据,如何从这些杂乱、无结构的文本数据中提取出有价值的信息,引起了学者们的广泛关注。关系三元组抽取作为自然语言处理重要的任务之一,其目的是从无标注的文本数据中抽取出知识事实,对知识图谱的构建、文本摘要、智能问答、推荐系统等领域起着关键的作用。现已有大量的关系三元组抽取方法被提出并取得了很好的效果,但这些方法仍然有许多不足。基于这些方法,本文的主要
学位
智能交通系统的应用在缓解交通拥堵等问题上取得了显著效果,准确的交通预测是智能交通系统的关键。随着物联网技术在交通领域的广泛应用,采集的交通数据越来越丰富和精细化,数据驱动的交通预测已成为产业界和学术界关注的焦点。然而,交通数据具有高度的非线性和复杂的动态时空相关性,准确的交通预测特别是长期预测仍是一个难题。现有模型通常是学习从路网生成的固定图来捕获空间相关性,面临着以下局限:(1)难以有效捕获随时
学位