基于深度学习的图像语义分割方法及应用研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:lvy_yvl2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割是近年来计算机视觉领域的热门研究方向,实质是对图像中不同的像素点进行类别划分,以达到计算机自主识别物体的目的。该研究在机器人自主感知、遥感影像处理、医疗、自动驾驶、视频监控等方面有着广泛的应用。在大数据时代,海量图像数据的分析处理对语义分割方法研发提出了新的迫切需求。但是,图像数据的构成复杂,图像中包含不同尺度,轮廓复杂的物体,现有的语义分割方法难以高度概括性的表达多类物体的语义特征,预测结果中常存在小目标丢失、物体轮廓不完整、目标误匹配等问题。针对上述问题,本文以多尺度特征融合为指导思想,结合多尺度特征提取、注意力机制、特征融合等方法,以提高图像分类精度为目标,开展如下研究:(1)针对图像语义分割分类中,存在小目标丢失、物体轮廓缺失等问题,提出一种基于注意力机制与特征融合的双路径语义分割网络(Double Paths Feature Fusion Network,DPF-Net)。该网络主要进行了以下工作:一是使用Res2Net作为特征提取的主干网络,多尺度地融合残差模块的不同细粒度特征,提高网络的图像识别能力;二是在低层特征的提取部分加入了位置注意力模块,提高通道之间的相关性,解决分割物体轮廓缺失的问题;三是在特征融合的部分加入了自适应金字塔池化模块,融合多尺度特征,解决预测结果中小目标物体缺失的问题。通过以上方法对模型的分割精度起到积极的效果。通过实验,本文提出的模型在PASCAL VOC数据集上分割精度达到79.5%的平均交并比(Mean Intersection over Union,MIo U),验证了本方法的有效性。(2)虽然DPF-Net在一定程度上解决了图像语义分割中小目标与分割物体轮廓的问题,但在实际场景中语义分割网络对于实时性也有硬性要求,因此提出了一种基于改进BiSeNet的实时语义分割网络。首先使用改进的轻量级特征提取网络Res Net-18作为主干网络以简化模型架构,额外加入一个空间特征分支保证提取模型的空间细节;其次使用双边特征融合模块(Double Feature Fusion Module,DFFM)融合两个分支的特征,生成预测结果。通过实验,本文提出的模型在Cityscapes数据集上分割精度达到了70.3%的MIo U与63的帧率(Frames Per Second,FPS),满足实时性语义分割模型的速度与精度要求。(3)为了检验本文提出模型的泛化结果,自建校园内数据集验证DPF-Net的泛化效果;采用Cam Vid数据集与自建街景数据集验证基于改进BiSeNet的实时语义分割网络的泛化效果。
其他文献
“虚拟偶像”主要指融合人工智能技术、语音合成技术、虚拟现实技术、计算机图形等建构的“拟真人”偶像,掌握持续学习能力,能够“学习”海量数据中隐含模式,包括文本、声音、图片、视频等,能够在虚拟场景或者现实场景进行偶像活动但是并无实体的存在。元宇宙概念的走红,互联网大厂、资本等各界力量会更快驱动整个虚拟世界的底层建设,比如区块链、云引擎、云服务器的成熟,均会给“虚拟偶像”的发展带来技术上的红利。人工智能
学位
行政协议作为新型的行政手段以其灵活的姿态和独有的魅力在行政活动中发挥着至关重要的作用,但理论上的僵硬与实践上的生动之强烈反差,不得不引发我们对行政协议的研究和关注。从行政协议的诞生开始,关于行政协议属性争议便此起彼伏,以此展开的关于行政协议范围、效力认定、审查标准等争论可谓是数不胜数。2015年新的《行政诉讼法》颁布后,行政协议争议被纳入行政诉讼范围,又一次将行政协议推向了“风口浪尖”。但在这些浩
学位
随着模拟集成电路技术的发展,便携式电子设备和新能源汽车在日常生活中越来越普遍,提高电能利用率能有效延长设备工作时间。BUCK DC/DC变换器芯片不仅能为设备提供稳定电压,还具有较高的电能转换效率。随着设备使用场景复杂度增加,对BUCK变换器的转换效率、输入电压范围、输出电流能力要求也越来越高,因此选择合适控制和调制模式是BUCK变换器设计的重要步骤。通过分析变换器的使用场合和多种控制方式的优缺点
学位
本文主要研究了一种8-氨基喹啉衍生物C-5、C-6位的双甲氧基化的反应。该反应在醋酸碘苯(PIDA)的氧化下,在廉价易得的醇类混合溶剂中高温下反应,实现了 8-氨基喹啉衍生物的双官能团化。该反应体系操作简单,不需要额外的酸碱添加剂,且具有较好的区域选择性。该反应体系具有良好的官能团兼容性,一些含有常见的给电子基团和吸电子基团的底物均可以获得中等至良好的产率。当反应体系中加入2,6-二叔丁基-4-甲
学位
背景:遗传性血液病临床上表现为血细胞功能障碍或遗传性骨髓衰竭综合征,异基因造血干细胞移植(allogeneic hematopoietic stem cell transplantation,allo-HSCT)是恢复正常造血功能的一种治疗选择。近年来,后置环磷酰胺预处理方案的单倍体骨髓移植(haploidentical bone marrow transplantation,haplo-BMT)
学位
生物活性物质主要包括活性氧物种(ROS)、活性氮物种(RNS)和活性硫物种(RSS)等,它们的水平异常会导致生物机体氧化还原状态的失衡,进而会诱发一系列疾病。荧光探针因具有灵敏度高、特异性强、无侵袭性和时空分辨率高等优点,已成为检测生物活性物种的有力工具。因此,设计合成新型荧光探针并用于检测生物活性物种的水平,对于疾病的早期诊断和病理发展过程研究具有重要科学意义。本论文针对活性分子过氧亚硝基阴离子
学位
手性α-氨基-γ-丁内酯是一类具有生物活性的杂环化合物,普遍存在于许多重要的药物分子和天然产物中,例如γ-羟基氨基酸,群体感应调节分子,和丝氨酸蛋白酶抑制剂。对于α-氨基-γ-丁内酯的对映选择性合成,化学工作者成功报道了以下几种方法,包括氨基酸衍生物的环化反应以及有机和生物催化相结合的策略和酶催化的aldol加成串联转氨基反应,然而,迄今为止,大多数成果只是合成具有一个或两个手性中心的α-氨基-γ
学位
随着1-萘胺衍生物和含氰基类芳香化合物在药物、天然产物中的广泛应用,将氰基引入到芳烃化合物中成为了较为热点的话题。本文开发了一种钌催化的1-萘胺衍生物与AIBN的C4-H的氰基烷氧基化的反应。该反应使用三氯化钌水合物作为催化剂,用商业廉价易得的偶氮二异丁腈(AIBN)为氰丙基来源,在乙腈溶剂中氧气氛围下,80℃反应12小时,首次制备出C4位氰基烷氧基取代的1-萘胺衍生物。该反应对吡啶甲酰萘胺C4位
学位
碳碳双键断裂反应在有机合成中常被用于构建结构复杂的分子。除了在实验室和工业生产中被广泛应用的烯烃复分解反应,碳碳双键断裂反应还成功应用于合成羰基和含氮化合物。许多过渡金属催化碳碳双键断裂反应被开发出来。然而,非过渡金属参与的碳碳双键断裂反应相对较少。吡啶并[2,1-b]喹唑啉酮是一类结构独特的化合物,其广泛存在于天然产物及药物或生物活性分子中,具有抗菌、抗肿瘤、抗过敏、抗阿尔兹海默症等活性。目前合
学位
学位