基于深度神经网络的图像检测与分割算法研究

被引量 : 0次 | 上传用户:java_flash
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉在智能自动化的发展上扮演了关键性的角色,尤其是其中的目标检测与图像分割,在人脸身份识别、安防监控、图像美化及自动驾驶等领域的研发中都起到了至关重要的作用。深度学习技术近年来在众多传统领域都取得了瞩目的效果,其代表之一,卷积神经网络促进了计算机视觉任务整体的效果提升。通过对大量数据集的特征提取和学习,网络结构能自主地完成参数调整,从而实现包括检测和分割在内的众多任务。经过学术界的不断探索,基于卷积神经网络的目标检测和图像分割的研究不断深入,如YOLO和Mask R-CNN等优秀的算法也相继投入使用,并持续改进提高。本文通过对目标检测算法YOLO和实例分割算法Mask R-CNN进行研究,并对实际应用中出现的问题进行分析,采用修改网络结构、算法流程及调整参数等方式改进使用效果。本文的主要工作内容如下:(1)通过对YOLO算法的初始检测框尺寸生成规则、框重叠度量、损失函数以及网络结构等进行解析,分析了可能造成算法精度损失的原因以及针对不同情况适应能力下降的原因,并提出了相应的解决方法。针对初始检测框尺寸生成的规则和框重叠度量方式存在的缺陷,使用新的度量手段进行实验和效果对比;通过使用误差变化率替代误差值的方式,更新检测框宽高损失函数,使其对不同大小的目标具有更好的适应性;对网络的部分结构流程也做了相应的改进以增加算法的灵活性。通过实验,对比改进前后的效果,验证了改进的有效性。(2)针对Mask R-CNN的应用问题,建立了以四种手表零件为目标的微小零件实例分割数据集,并通过结合先验信息,调整单张训练图像的Anchor、Ro I数量和FPN的特征层选择规则,优化Mask R-CNN在该数据集上的分割效果。同时,对分割过程中出现的两种导致检测框过多的问题,提出了基于NMS改进的Io MANMS和新的损失函数来加以解决。通过实验,证实上述改进使Mask R-CNN在微小零件数据集上的分割表现得到了提升。
其他文献
征地拆迁作为土地储备的一项重要程序,是城市建设与发展过程中的一项重要工作,涉及国家和人民群众等诸多利益相关者,日益受到各地领导的关注和群众的关心。与此同时,征地拆迁项目实施过程中面临征拆主体责任意识淡薄、管理能力欠缺、信息公开制度不完善、补偿金挪用、拨付不及时等多种问题,各级政府越来越重视对征地拆迁项目的监督管理。跟踪审计因其介入的及时性、审查内容的广泛性、监督的持续性得到广泛采用。当前我国对于征
本文研究了一种新型的真空-微波解冻方法,并针对从解冻时间、真空度、样品形状、样品在微波中放置的位置以及解冻过程中有无辅助翻转等因素来优化真空-微波解冻方法的相关参数。结果表明,在解冻过程中,真空环境能极大降低猪里脊中心及表面温度。研究表明约500g左右的猪里脊,真空-微波解冻的时间在2min~2.5min左右的解冻效果较优;辅助翻转可以帮助猪里脊更好的解冻,有效防止表面熟化。此外,猪里脊的形状和厚
党的十九大报告提出实施乡村振兴战略,要坚持农业农村优先发展,加快推进农业农村现代化。农业龙头企业作为一种新型农业经营主体一直是支撑和推动农村地区经济发展的核心骨干力量,以农业龙头企业为引领的农业全产业链,是将广大中小农户融入到现代农业发展中来的有效手段之一。近年来,安徽省积极推进产业化经营,把培育壮大龙头企业作为推进农业现代化经营的重要举措。因此,科学评估安徽省农业龙头企业绩效,对优化农业产业结构
目的:近年来较多研究显示抗核抗体(Antinuclear antibodies,ANA)可导致不良妊娠结局,尤其是与反复妊娠丢失(Recurrent pregnancy loss,RPL)显著相关,ANA阳性时常常合并抗SSA抗体(Anti-sjogren’s syndrome A antibody)阳性,而抗SSA抗体对妊娠的影响还存在一些争议。本研究主要探讨抗SSA抗体对抗核抗体阳性孕产妇妊娠
并购是企业扩大市场份额、实现战略转型的重要途径。随着我国经济体制改革稳步发展,如何进一步激发并购市场的活力是备受关注的问题。然而,国内相对匮乏的并购支付方式却无法与并购市场的活跃相匹配。仅依靠现金、股份及两者组合的支付方式往往不能满足并购双方的利益需求,甚至可能会带来较高的风险。支付手段单一的特点是制约我国企业并购交易的一大障碍,日益庞大的并购规模和交易需要对于支付工具的设计及具体应用存在迫切的现
科学技术的发展为军事领域提供了极大的支持,雷达对抗作战作为军事战争中的重要部分,其发展的重要性不容置疑。雷达的作战水平取决于其以干扰效能为主的诸多指标,对作战装备和战术指挥方面有着重大的影响。如何高效准确地对雷达的干扰效能进行评估,成为提升雷达对抗实力的关键。针对雷达干扰方式、对抗场景、对抗组织模式、干扰效能评估准则和指标体系等复杂性问题,本文从计算软件实现方法研究的角度,提出了一种新的干扰效能评
铅是具有神经毒性的环境污染物,可以通过消化道、呼吸道和皮肤等途径进入人体,并通过血液循环分布至全身,最终在人体各个系统组织器官中长期蓄积。铅中毒可造成人体多系统和器官的损害,对神经系统毒性作用尤为突出,中枢神经系统中,大脑皮层、海马回和小脑是铅毒性作用的主要靶组织,铅暴露可减低突触数量和可塑性,影响受体和酶特性,通道和神经递质释放,引起神经胶质细胞活化和神经元凋亡。脑电图是记录脑部神经元活动的电生
《普通高中数学课程标准(2017年版)》明确提出高中数学课程要以学生发展为本,贯彻立德树人根本任务,培养研究探索精神与创新意识,提升数学学科核心素养。直观想象是发现和提出问题、分析和解决问题的重要能力,是探求和建立理论思维、开展数学逻辑推理、形成抽象构造的重要思想依据,在数学教学过程中直观想象素养可以帮助学生更有效地分析问题,学生直观想象素养水平的高低对学生的数学学习和思维形成举足轻重。基于此,本
随着红外成像技术的飞速发展,现如今该技术已广泛应用于国防军事与民用工业等领域,但由于红外成像系统自身的硬件缺陷与自然环境的干扰导致获取到的红外图像质量差,视觉效果不佳,所以需要对此低质量红外图像进行增强处理。基于图像分层的红外图像增强方法结合了多种处理方法的优势且能有效改善图像的视觉效果,因此越来越多的研究学者们开始研究图像分层增强方法。该方法利用了保边滤波算法将原始图像分解为背景分量与细节分量,
庄家商贾大院浓缩了临清中州古城丰富的文脉元素,其大院布局合理、形制多样、建筑风格融合南北文化、细部构件雕刻精致,称得上是宝贵的文化遗产。现如今,庄家大院被现代社会的高楼大厦所埋藏,加上自身年久衰败、保护不周等原因形成文脉价值的丢失,所以应该保护利用,使其适应时代实现再生。本文研究的重点是挖掘并延续庄家大院的显隐性文脉价值,进而焕发原有的空间活力。首先,提出选题来源,由此引出文脉传承用于商贾大院的保