基于深度学习的语义分割算法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:jackzeng6699
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是计算机视觉的核心任务之一,其目的是对输入图像的每个像素进行有效地分类。近年来,深度学习是影响计算机领域最为深远的技术。在深度学习的帮助下,图像语义分割任务在自动驾驶、生物医学、现实增强等领域获得了诸多成果。相比于图像分类和目标检测,语义分割能提供更丰富的图像语义信息。然而目前基于深度学习的语义分割存在诸多问题。首先语义分割数据集难以制作,存在训练困难、制作成本高的问题;其次大部分算法的计算量和网络参数巨大,导致其无法应用于计算资源有限的移动设备中,限制了语义分割的发展;再者,诸多算法没有充分地利用计算平台的硬件资源来加速程序运行速度。因此本文主要围绕这三方面进行研究和优化。主要内容和创新如下:1.训练高效。通过对已有弱监督算法的详细分析,本文提出了 RGrad-CAM算法。该算法利用图像分类级标签对网络进行训练并输出热力图,实现了高效的网络训练,大大降低了训练成本。同时对算法进行细致的可视化分析,从热力图、特征图和梯度图三个方面全面探讨算法提升的本质。RGrad-CAM通过增强部分特征图的权重,提高了最终热力图的精准度。在PASCAL VOC数据集上的分割测试结果显示,RGrad-CAM的mIoU指标比CAM算法提高了 3%,其它指标也全面优于CAM。2.模型高效。本文基于编解码结构提出了高效语义分割网络EEDNet。EEDNet采用MobileNet作为网络的编码器;利用注意力机制实现特征的高效提取和降维,减小了模型的整体计算量;充分利用编码器的分类结果,其丰富的上下文信息协助分割,从而提高分割准确率;高层特征图协助低层特征图恢复其空间语义信息,同时多层特征图在网络中得到了有效地融合。多个标准数据集的实验测试结果表明,EEDNet在分割准确率和效率之间实现了非常好的平衡。3.推理高效。在算法时间和空间复杂度不变的情况下,本文充分利用计算机体系结构去优化程序运行效率。采用低精度在内存布局和计算效率上的优势,加速程序运行速度。利用现有的GPU引擎加速网络推理。实验结果表明,在不影响结果准确率的情况下,低精度能显著地加快网络推理速度,是个非常有价值的工程优化方案。
其他文献
绝响百年重开台颐和园里的德和园大戏楼“重整旗鼓”今年"五四"青年节,北京市青年京剧团在颐和园德和园大戏楼出演。德和园的最后一次演出是1908年。在绝响百年之后,由北京青年京剧团
近年来,受益于通信、大数据及云计算等技术的成熟应用,“互联网+”已在民生、经济、政务等方面被广泛普及;但随着信息技术不断发展,难以计数的网络设备、应用以及爆发膨胀的
为了解决专用音乐播放芯片只能一次性烧录、播放内容不可变的缺点,提出采用Proteus仿真软件实现调试过程的解决方案。
目的:探讨早期引导心身综合康复锻炼在膝关节置换术患者中的应用方法及效果。方法:将137例行膝关节置换术患者随机分为传统康复组67例和早期引导组70例,传统康复组给予传统康
目的:分析主动脉夹层患者发病及诊治过程,了解主动脉夹层发病特点,观察主动脉夹层的早期诊断对于主动脉夹层患者预后的影响。方法:对94例主动脉夹层确诊患者进行回顾性分析,
论述海南岛以旅游业为先导,并以开发和实业经营为基础,不论旅游业和实业、商贸、都要面向海内外。面向国内是基础、走向海外是发展方向、海南旅游的投资开发要发挥集聚效应,在地
通过对潘玉良生活的时代及其个人经历的分析,研究其彩墨画的产生背景与特点,以其一幅代表作为例分析画面的题材、表达方式、绘制手法。潘玉良的彩墨画有着不可磨灭的西方文化
一、问题的提出口算的特点是简便迅速。它不仅在日常生活和生产中有广泛的使用价值,在数学学习中也起着重要作用。因为任何一道四则计算题都是由若干道基本口算题组成的,如4
目的:观察慢性心力衰竭患者病程中尿酸水平变化的规律,探讨其临床意义。方法:130例慢性心力衰竭患者作为研究对象(心力衰竭组),入院后第2天清晨及病情改善出院前空腹测定血清
<正>随着所谓"石油帮"、"秘书帮"、"山西帮"等一个个权利场腐败团伙的垮台,表明中央高调反腐行动只有进行时。就在此时,习近平总书记一系列抨击官场"圈子文化"的重要论述得以
期刊