基于增强深度学习的目标检测

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:helloclare
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域的一个基本且重要的研究方向。其主要目的是识别图像中的所有物体并定位它们的位置。作为图像理解和计算机视觉的基石,目标检测成为解决高级复杂视觉任务的基础解决方案。近年来,随着深度学习的飞速发展,目标检测技术已经取得了巨大的突破。目前,目标检测已广泛应用于许多领域,例如:图像分割、场景理解、目标跟踪、图像描述、事件检测、自动驾驶、智能监控和医学图像分析等。然而,尽管目标检测领域的研究已经取得了重大突破,但是现有算法在某些应用场景中的识别精度仍然较低,特别是在复杂场景和小目标检测中。在现实生活中,目标可能会出现等比例缩放,且在剧烈变化的光照、遮挡等条件下,可能进一步增加目标检测的难度。本文针对复杂场景中的目标检测进行了一系列创新研究,并基于现有的目标检测算法,提出了多种新颖的方法来提高目标检测的性能。本论文的主要贡献概括如下:针对识别精度低和目标细微特征的提取问题,本文提出了一种基于深度卷积神经网络的特征融合方法,通过引入逆卷积层,采用多尺度全特征融合策略,提高了目标检测的准确性。为了提取不同层的特征以增强预测层的目标检测的特征图谱表示,在获得不同尺度的特征图谱的同时,该模型也将细微特征从浅层传输到深层,语义特征也通过这种方式从浅层往深层次传递。新生成的特征图谱既包含目标的细微特征又包含丰富的语义特征,该策略保留了目标的感受野且能够避免目标(特别是小目标)感受野的缺失,这就使得该模型在检测小目标时置信度较高,解决了当前目标检测研究中小型目标检测精度不高的问题。大量的实验结果表明,该方法通过融合不同层次的特征,提高了目标检测的性能,特别是针对小型目标的检测。当图像中存在不同大小的目标时,为了提取和学习更好的特征,解决召回率低、定位错误等问题,本文构造了一个具有卷积核大小为1×1的卷积层、空间金字塔池化层和均方损失的Inception模型,损失函数用于优化目标的所属类别和目标边界位置。Inception有助于加深和拓宽网络结构,因为不同尺度的卷积核是并行连接的,可以提取更有效的多尺度特征。因为卷积神经网络需要输入固定大小的图像,所以模型添加了一个空间金字塔池化层,该层能够将任意尺寸或任意比例的图像处理为固定尺寸的图像,并且能够提取不同规模的池化特征。这些目标边框的大小与图像大小成正比,因此无论图像大小如何,边框的数量都是固定的,这不仅提高了网络性能,而且还避免了重复计算卷积特征,大大减少了计算时间。实验结果表明,该方法可以大大减少目标的丢失率,并减少识别和检测中的错误。针对精度低的问题,同时为了提取目标的判别特征,提出了一种判别特征学习技术。在该方法中,以端到端的方式实现了深度卷积神经网络的三元组嵌入结构,该结构可以提高识别精度并增强复杂场景下各种目标类别中正负的分类。所提出的框架学习了从图像到广义欧氏距离的映射,其中距离直接对应于目标相似性的度量。这样便降低了类内和类间的变化,从而以较低的计算成本实现了高精度的目标检测。大量的实验证明了该方法的有效性,此外,该方法还很好地解决了小型目标检测的问题。
其他文献
为了丰富肉松制品的种类,本研究以猪瘦肉为原料,配以适当的辅料,在加工中添加一定的啤酒进行煮制,经过制松、搓松、烘烤等工艺制作成的干肉制品。通过试验改善了肉松的风味,增加其营养成分,扩大消费市场和消费空间。结果表明:肉与啤酒的比例1∶3、盐的添加量6%、煮制时间110min为啤酒肉松的最优工艺。
当今世界各国之间的经济往来愈发密切,尤其是处于全球经济一体化趋势下,世界各国电子商务及物流产业都在发展中获得了技术及动力支持,实现了转型升级。我国的跨境电商也在增速发展,形成了对国家经济全面发展的助推力,在电子商务运行中,必然需要物流产业的同步协调,跨境物流是跨境电商持续完善及发展的必要保障。基于此,应以产业融合视角为切入点,加快推动跨境电商及物流产业链的融合发展。
在这个经济迅速增长的时代,我国的冶金自动化技术发展的越来越快,技术在不断突破,冶金需求也在不断地增长,对于一些冶金企业来说前景大好。但是,我国冶金自动化技术的发展仍然存在问题,制约了工业的发展。对此,冶金企业必须加强自动化技术的开发和应用,为企业发展打下坚实的基础。
新型冠状病毒肺炎(COVID-19)是一种急性呼吸道传染病,由严重急性呼吸综合征冠状病毒2(SARS-CoV-2)感染所引发。其传播迅速、致病性强,以发热、乏力、干咳为主要表现。临床上以中医理论为指导,发挥中医药整体调节的优势,联合现代医学先进诊疗手段,对新冠肺炎治疗起到了积极的作用。肠道微生态平衡是机体内环境稳定的重要保障因素,有研究表明,新冠肺炎的发生发展与肠道微生态紊乱及机体免疫功能下降息息
为了满足测量与仪器领域的重大发展的需求,本文研究的主题受到了广大科学家和研究人员的高度重视。现代系统的设计必须紧随发展的步伐,并找到新的算法,具有低成本的设计,低成本的材料和高性能以适应不同的应用,这是一个重要和热点问题。本文着重于调整激光在通用系统以及作为特例的燃烧系统的光路。在这样的系统,我们需要纠正光路的角度偏差。本文的技术是基于高性能控制的设计模型与可接受的误差。这类系统是非线性系统,所以
批次过程在现代智能制造工业中占据重要地位,用于生产具有高附加值的精细化产品,其产品质量在很大程度上取决于控制系统跟踪参考轨迹的精度。批次过程在有限时间区间内重复运行,而迭代学习控制能够通过学习历史运行数据修正当前控制输入,达到沿批次不断提高跟踪精度的目的,因而成为当今批次过程控制的主流方法。迭代学习控制是典型的一维控制算法,控制律只沿迭代轴更新,在时域上采用开环控制结构。因此,迭代学习控制不具备实
自抗扰控制(Active disturbance rejection control,ADRC)因其对系统“总扰动”的自发估计和抑制能力使其逐渐受到越来越多研究者的关注,同时由于其在工业领域的成功应用展现了其广泛的应用前景,但其理论研究还有待进一步加强。本文从线性自抗扰控制(Linear ADRC,LADRC)设计、分析及参数整定这一课题出发,主要对二阶自抗扰控制参数整定、针对延迟系统改进自抗扰控
软件度量数据库的复杂性使得缺陷数据集和无缺陷数据集模块难以区分,而从数据模型的发展过程来看,软件度量数据集对于度量数据的预处理至关重要,旨在提高机器预测模型数据集精度和性能。在计算领域,研究人员的关注主要集中在软件数据集模型中存在的缺陷数量,由于易变形数据集与准确性有着密不可分的关系,研究人员的主要目的是快速识别和纠正软件中存在的易变形缺陷。目前,世界上最大的科技公司也有自己的一致性注册方案,解决
梯级水库作为开发与利用水能资源这一清洁可再生能源的重要工程措施,通过对一段时期内入库径流实施有计划调蓄,梯级水库可实现洪旱灾害的防范抵御、水电企业的效益增长、电网的安全稳定运行、生态环境的保护修复等多方面重大任务。并且近年来我国出台了一系列清洁能源消纳的鼓励政策,水能资源支持的水电行业已成为我国能源结构转变的关键。目前随着乌江、雅砻江、金沙江等十三大水电基地建设的逐步完成,我国各个流域内梯级水库系
布里渊光时域反射(BOTDR)分布式光纤传感系统具有结构简单和单端测量等优点,能够实现温度和应变的大范围、同时测量,在大型建筑和设备的健康状态监测和故障诊断领域展现出独特的优势并得到了越来越多的关注和研究。然而,由于BOTDR传感系统性能指标相互制约,使其仍无法满足很多应用场合中对测量精度和测量时间的要求。针对BOTDR传感系统的性能优化问题,本文在深入研究BOTDR传感系统特性的基础上,分析系统