基于注意力机制的图像分割和增强技术研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:jumglezhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,深度学习已被广泛应用于图像处理和计算机视觉领域的相关研究中。早期的深度学习方法通常着眼于基于图像的局部特征对目标任务进行建模,对特征之间关联的关注较少。近年来,注意力机制走入研究者的视野并逐渐成为相关研究中的重要工具。基于注意力机制的深度学习方法通常在深度模型中引入特征关联结构,从而在模型学习过程中实现对目标任务相关特征的增强和无关特征的抑制,进而获得更优的目标任务深度模型。本文在前人研究的基础上,就基于注意力机制的图像分割和图像增强深度建模技术展开研究,主要内容如下:(1)提出一种基于标签敏感注意力机制的医学图像分割深度建模方法。现有基于注意力机制的深度学习方法通常在深度模型中构建局部特征之间无差别的关联结构,但在图像分割任务中,局部特征之间的关联应是标签敏感的,即相同标签的图像区域局部特征相关度较高而不同标签图像区域局部特征差异较大。有鉴于此,本文在构建深度分割模型时,首先对图像局部特征之间的特征关联进行建模,并提出一种三元组损失用来指导网络优化过程,增强同标签特征相关性和不同标签特征的差异性,随后将所学习的特征相关性嵌入U-Net分割网络,进而实现分割性能的提升。此外,所设计的网络还进一步考虑了分割目标的尺度变化,在U-Net的每一个模块采用多尺度的感知结构,丰富了特征编码的上下文信息。在多个医学图像数据集上的分割结果显示,实验提出的方法同先进的医学图像分割方法对比,能在多个指标和分割结果上取得不错的表现。(2)提出一种基于注意力门控机制的红外低光图像融合增强方法。现有的图像增强方法通常基于低光图像直接展开,当图像中存在被极低光遮蔽的局部区域时,难以获得满意的效果。有鉴于此,本文在进行深度图像增强建模时引入红外图像,为图像增强提供更丰富的输入特征,避免了极低光情况下产生的图像信息缺失问题;同时引入注意力门控机制构筑特征选择通道进行特征筛选,增强图像显著性特征并抑制无关特征,从而实现低光图像的有效增强。具体的网络结构主体采用生成对抗网络,其中生成网络包括侧边特征融合模块,用于提取多尺度的红外和低光图像特征,并采用注意力门控模块对提取的特征进行筛选。为优化网络设计了多维度的损失函数,包括图像像素级的内容损失、全局和局部的对抗损失以及特征权重损失,从多个维度衡量图像增强的质量,确保图像的训练和优化。本文方法在多个公开数据集上进行测试,在SSIM、PSNR、MSE等指标上同几种目前流行的低光增强方法相比,取得了更好的表现。
其他文献
网络作为一种非欧式数据结构在现实世界中非常常见,例如表示论文之间引用关系的引文网络,表征用户之间的关系的社交网络,生物学中蛋白质分子网络等。近些年,深度学习由于其优异的特征提取性能成为了热门研究课题,而基于图深度神经网络的网络表示学习方法也逐渐成为图分析研究领域的主流方法。其中基于图自编码器的无监督网络表示学习方法是非常一种经典且常见的方法。当前基于图自编码器的方法通常只有一个解码器和一个编码器,
学位
在现实世界中,许多人在互联网上分享照片、文本等不同种类的信息,这些数据可以被标记多个标签。利用好这些数据,寻找到可用标签和数据之间的关系,可以指导人们更好地学习、工作。传统的多标签学习任务就是学习一个有效的模型,为未知数据赋予多个标签。通常,在训练集中,一个样本标注多个标签,并且所有标注的标签都是精确的。然而,精准标注大规模样本是困难的,一般在标注时,由于疏忽,标注者往往会将一些样本无关的标签分配
学位
传统的药物研发是一个长时间、高投资和高风险的过程。随着医学技术的发展,人们对疾病的发生机制有了越来越清晰地认识,对药物的需求也在不断增加。传统的药物研发方法已经很难满足人们的需求,人们需要一种新的药物研发方法。药物重定位是一种为已有药物寻找新的适应症的方法,可以显著地加快研发进程、减少研发费用和降低研发风险,受到了越来越多的关注。此外,随着计算机技术和高通量测序技术的发展,研究人员能够从多种来源获
学位
随着众包系统的发展以及众包概念的普及,许多研究领域所需的大量标记数据离不开众包应用的发展,很多无法通过机器智能完成的任务转而通过外包的方式交由网络在线用户完成。同时,作为一种人工智能的方式参与到了机器计算,众包标注帮助越来越多的基于监督学习的应用程序,以相对低的成本获得大量的标记数据,这加快了数据的更新和模型迭代的速度。然而,标注者的质量无法得到保证,从而使得利用众包标注数据建立的模型面临挑战。因
学位
目前生物特征识别技术在多个领域得到广泛应用,生物特征信息的安全性问题日渐凸显。为权衡生物特征识别与生物特征信息安全的关系,提出可撤销生物特征模板保护算法,需同时具备不可逆性、可撤销性、不可链接性和性能保持四个要求。可撤销模板保护是对生物特征使用不可逆的单向函数转换后再进行匹配,输入的原始生物特征形式不同对转换算法有较大影响。因此,本文对可撤销生物特征模板保护算法进行研究,具体如下:(1)针对二进制
学位
专利是知识产权中一种重要的知识资源,不仅能够充分反映科研创新成果的研究内容,而且还蕴藏着许多技术创新的发展趋势。专利分类是专利信息管理和专利知识挖掘的一项基本任务,旨在给专利标注一个或者多个类别标签,对专利检索、专利诉讼风险预测、专利质量评估具有重要意义。通常,专利由审查员或领域专家手动划分到多个类别。但是,随着科学技术领域的快速发展,近年来全球专利申请数量呈现快速增长趋势,并且技术领域之间交叉现
学位
双目立体视觉是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。立体匹配作为双目立体视觉中的一个重点问题,其目标是从不同视点图像中找到匹配的对应点。当前,大多数学者对立体匹配的研究主要是针对可见光图像,尽管取得了较大的研究进展,但可见光图像对光线敏感,在复杂场景和环境下图像传递的信息质量会受到较大的影响,极大地限制了立体匹配
学位
目标跟踪作为计算机视觉研究领域的重要课题之一,目前在智能机器人、道路视频监控以及军事国防等领域被广泛引用,且越来越受到研究者的重视。作为目标跟踪的一个研究分支,RGBT(可见光-热红外)目标跟踪旨在结合可见光与热红外图像进行目标跟踪,得益于热红外与可见光数据的互补性,也逐渐引起了学者们的广泛关注。然而,该研究领域缺乏一个大规模评测数据集,极大地限制了深度跟踪器的训练以及跟踪算法的评测。此外,由于跟
学位
尽管生成对抗网络迄今取得了显著的成功,但将其应用于解决现实世界的问题仍然是一个重大挑战。在真实的交通监控场景中,生成多样化颜色的货车或轿车图像而不改变车牌等纹理细节这一任务,条件图像生成很难通过控制颜色属性来改变生成结果。图像风格转换的生成结果不可避免地会呈现色斑,且不能在特定区域进行颜色风格转换。甚至是最新的解耦表征学习也不能将颜色单独解耦出来,控制除颜色之外的其它因素保持不变。为了解决这个问题
学位
约束多目标优化问题(CMOPs)广泛存在于许多现实应用中,如常见的背包问题,车辆路径优化问题,投资组合优化问题等。进化计算是一种具有高度鲁棒性和适用性的全局优化方法,能够有效处理传统优化算法难以解决的复杂问题,因而被广泛的应用于求解约束多目标优化问题。但是许多进化算法在处理具有复杂约束的CMOPs时面临着找不到可行解或仅能找到局部最优解的困难。复杂约束优化问题可行域的可行域具有狭小、离散、不规则的
学位