基于机器视觉的复杂背景目标检测算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:qqqqqqwer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉中的一项基础研究任务,试图解决图片中什么目标在哪里的问题,而复杂背景下的目标检测则进一步强调了此任务下场景、环境的多样性和困难性。目前,各种目标检测算法众多,并且已在自动驾驶、安防等领域得到了良好的落地应用,然而,应用越广对算法的可靠性要求也越高,但算法模型从大量的公共数据集中所学的特征分布并不能完全涵盖生活实际场景,在面临目标重叠拥挤、尺度的变化、光线变化等问题时,算法的性能受到极大挑战,部分原本训练良好的模型一时难以做出正确的决策,结果轻则危及财产,重则危害生命。针对复杂背景下的目标检测问题,本文从深度学习卷积神经网络的角度进行了研究,主要的成果如下:1.对CenterNet目标检测算法的热度图生成定义了新的规则。从以中心关键点检测的原理出发拟合出目标框像素点的置信度超平面,指导热度图生成,在拥挤重叠环境下,较明显的提升了原算法的检测指标。2.提出基于多核最大值滤波的,可以使用于以关键点预测的检测模型的后处理方法,一定程度上缓减了CenterNet模型在应对大尺度目标对象时重复检测的问题,算法直接在GPU上完成后处理,几乎不带来额外计算量。3.基于概率分布预测的思想,修改CenterNet模型的宽高回归任务的目标,并增加分支融合模块,辅助热度图的收敛。从概率的分布上积分出结果,在因重叠、模糊、视角等带来的模糊边界问题下,一定程度上提高了模型的预测稳定性,且融合分支一定程度上提高了轻量模型的收敛能力。4.从数据增强的角度,分析并通过实验研究了不同的增强方法对模型泛化所带来的提升,提高在复杂场景下的检测精度和鲁棒性。
其他文献
随着物联网技术的发展,万物互联变成现实。车联网作为物联网的一个重要分支,在安全驾驶、电子不停车收费系统(ETC)、智慧城市等方面发挥着重要的作用。为了保证上述应用的实施,越来越多的天线安装在汽车上。当天线安装在汽车上时,天线的辐射方向图将会受汽车的影响而发生变化,因此快速获取安装辐射方向图对于指导天线在汽车上的布局优化至关重要。若通过全波仿真求解天线的安装辐射方向图将会花费很长的计算时间,其次,出
会议的组织及实施在电力系统中是极为常见的事情,邮件及电话通知、纸质材料打印、手签签到表、大屏投影等传统手段依然是支持电力系统种类会议的重要手段。电力系统一直将信息化与智能化作为生产及管理中一个重要的支撑手段用来提升生产及管理的效率,因此通过一套较为便捷的会议管理系统软件来支撑电力系统的各类会议是非常必要的。本论文实现了一套基于Android平台的会议管理系统软件,从前期的需求调研到系统的设计、系统
近年来大尺寸高性能复合材料凭借优秀的性能在航空航天领域的使用比例大幅度提升,因此针对大尺寸航天复合材料缺陷的非接触无损检测技术研发具有重大意义。本文结合大尺寸复合材料原位、外场、整体缺陷的检测需求,运用红外热波成像技术对复合材料在热激励下温度场变化信息进行采集,得到红外图像序列,根据红外图像序列中的温度的变化特性与检测需求,最终实现了对大尺寸复合材料完整检测结果的呈现并实现缺陷的定量检测。在此基础
目标跟踪是一种要求定位并持续跟踪视频片段中的目标的计算机视觉任务,由于在交通、医疗、安防等多个领域存在难以替代的应用价值,自诞生以来便广泛得到研究人员的关注。经过长期发展,目前主流目标跟踪算法可划分为两类:基于相关滤波的算法和基于深度学习的算法。前者兼顾优秀的运行效率和跟踪效果,后者则得益于神经网络强大的可塑性和海量训练数据,不断取得越来越瞩目的成绩。这两类算法均存在巨大的发展空间,同时也互相取长
随着红外小目标跟踪在国防军事、民用安全领域的应用深入,航迹关联技术备受挑战。空中平台导弹发射会产生航迹分裂,导弹命中空中目标会导致航迹合并,空中飞行物近距离接触后分离会产生航迹交叉。因此,研究红外背景下的多目标航迹关联技术具有重要的现实意义。目前,现有航迹算法存在多处不足,其一,存在维度爆炸问题;其二,航迹交叉重叠时易关联错误;其三,大多数算法不适合航迹分裂、航迹合并等特殊航迹关联类型。近些年来,
随着大数据时代的到来,传统的向量或矩阵的数据表示方法已经不能满足对目标各个属性进行完整的表达的需求。张量,作为向量和矩阵在高阶空间的拓展,一经出现便引起了广泛的关注。如果张量的每一阶都代表了目标的某一种属性,那么张量就可以自然而然地将目标的各个属性进行完整地表达。然而,因其数据量会随着阶数的增加呈指数增长,如何处理庞大的张量数据又成了一个难题。张量链分解算法可以将高阶张量分解为若干低阶张量的外积,
计算机仿真软件是产品创新和工业装备的核心技术之一,不仅对工业生产产生着巨大的影响,还在军工装备的研发和国防事业中发挥着举足轻重的作用,计算机仿真软件的发展水平可以反映一个国家的工业技术水平。针对电子科技大学计算机仿真技术实验室开发的有着自主知识产权的微波器件仿真软件MTSS后处理模块不够完善没有动画效果,不能直观展示模型的运动状态,不能实时观察正在仿真运行与仿真分析后模型的相应属性的动态变化规律问
糖尿病视网膜病变(diabetic retinopathy,DR)是糖尿病最主要的并发症之一,在早期发现DR并对其进行针对性治疗,对保护患者的视力极为重要。本文基于彩色眼底图像与荧光造影图像,对眼底图像的各类生理结构的分割与多类型DR病变的检测进行了研究。实现病变的检测后,依据图像中出现病变的类型对DR进行分级,实现了高性能的DR病变检测与分级辅助诊断系统,主要研究内容如下。(1)采用了一种基于形
实现人和计算机使用自然语言进行交互,是自然语言处理领域的一项重要工作。随着人工智能技术的发展,尤其是深度神经网络的广泛应用,构建基于开放领域的对话系统已经越来越受到人们的关注。互联网的快速的发展,累积了大量对话数据,使得由数据驱动的对话模型成为可能。目前的对话任务,大多仍然在生成式任务的大框架之下,而生成式任务一般都是序列到序列的。端到端的编码器-解码器模型是用于解决序列到序列任务的重要机制,对编
目标跟踪是计算机视觉的一个重要分支,在现代科技社会建设中起着举足轻重的作用,而红外场景下的目标跟踪常常应用在军事场景中,利用红外探测技术可以提前发现并锁定敌人的军事目标。本论文中的多目标密集场景下的红外成像视觉跟踪技术,要求对多个红外目标进行跟踪,且目标往往呈现为红外弱小状态,缺乏显著的颜色、纹理以及形状特征,而在跟踪中目标特征的提取十分关键,因此弱小目标的特征表示是小目标跟踪中的一大难题。另一方