基于深度学习的目标检测应用研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:yu964230
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,基于深度学习的目标检测算法模型在网络精度和计算速度上都得到了不断提升。然而在某些特定场景中,仅依赖于彩色相机获取的图像信息和二维目标检测算法并不能满足实际应用的需求。在工业生产生活中,对于无色无味、不规则漏气漏液的检测十分重要,但彩色相机很难捕捉到特征信息,因此基于红外图像的检测算法尤为必要。随着机器人技术的不断发展,科技人员开始利用移动机器人进行空间探索,而对于机器人周围环境的地形感知可以帮助机器人识别目标获取周围信息,对感兴趣目标的空间定位可以帮助它进行下一步的探索。同时,在自动驾驶领域,二维的目标检测算法局限于二维特征,而基于深度学习的三维目标检测算法可以直接从点云信息中提取特征,获取场景中行人车辆等目标的空间信息。针对以上三个实际应用场景,本文围绕深度学习目标检测方法,分别利用红外图像、彩色图像、点云等数据,提出了针对性的解决方法。具体的研究内容如下:(1)针对漏气漏液检测问题,本文提出了一种基于红外图像的漏气漏液检测方法。首先通过红外热成像仪捕捉目标红外信息,利用红外成像系统采集红外图像数据。针对红外图像信噪比低、特征不明显等特点,使用开闭操作和图像增强算法抑制背景噪声,增强红外图像的细节特征。检测网络使用MS COCO数据集预先训练好的权重文件作为初始化参数,使用聚类算法获取锚矩形框的先验知识,基于YOLO v4网络改进其中的部分特征提取模块和特征融合模块从而提高算法准确率,满足了系统对模型的检测速度和精度的要求,从而解决了对于漏气漏液目标的检测问题。(2)针对地形检测和空间定位问题,本文提出了一种基于RGB-D数据的地形检测与空间定位方法,利用彩色图像进行语义分割和实例分割,利用深度相机获取的深度信息完成对特定目标的空间定位。首先提出了一种基于循环一致性对抗网络的地形语义分割算法,其次使用基于Mask R-CNN算法实现地形的实例分割。最后,将深度相机和彩色相机投影到3D空间进行空间对齐,获取得到分割后特定目标实例地形的点云信息并计算其空间位置,同时提出使用下采样和基于统计学的噪声点云过滤方法提高定位的准确性。(3)针对三维目标检测问题,本文提出了一种基于图像和点云数据的目标检测算法。首先,对于点云数据的获取问题,除了上文中使用的深度相机进行投影,本文同样研究了基于深度学习的双目立体匹配算法,使用双目图像生成伪点云。其次在基于二维目标检测网络的基础上,使用了基于视锥体点云检测网络的三维目标检测算法提取检测框对应的点云语义特征,完成对目标的三维检测。综上,本文主要研究基于深度学习的目标检测技术的具体应用。围绕基于深度学习的目标检测算法,依托实际应用项目和背景,利用红外、双目等不同传感器数据,并结合深度学习相关算法,提出对应的解决方案。通过自采数据集或公开数据集进行实验,验证了算法的有效性,解决了目标检测算法在相关实际场景中的应用问题。
其他文献
随着信息技术及互联网环境的不断发展,随之而来的信息过载问题亟待解决,常见的数据稀疏以及冷启动问题都在一定程度上影响了推荐质量。现有的大部分推荐算法更偏向于物品信息的考虑,而往往忽略了用户信息,同时更加侧重于挖掘用户与物品之间的静态相关性,但忽略了随着时间的推进而导致的用户兴趣的衰减以及偏好的动态变化,从而无法实现理想的效果。为了解决以上问题,本文提出了基于双端知识图的用户偏好推荐模型,主要研究内容
学位
近年来,针对综合能源系统的信息物理协同攻击事件时有发生,严重影响了系统的安全经济运行,因此考虑信息物理协同攻击的攻防策略对综合能源系统优化调度的影响具有重要意义。本文针对气-电混联综合能源系统,研究了攻击者视角下计及负荷重分配攻击与破坏供能网络的物理攻击协同的最优攻击策略,以及防御者视角下计及系统备用容量和替代负荷的最优防御策略。主要内容如下:(1)研究不计攻击的气-电混联系统优化调度策略本文采用
学位
为了降低生产成本、监测过程状态、提高生产效率、优化产品质量,工业过程中关键质量变量的实时测量与预测十分重要。对于复杂的工业生产环境,以及硬件传感器无法或难以测量关键质量变量的问题,软测量方法通过构造以过程变量为输入,质量变量为输出的估计模型,间接估计预测关键质量变量。由于其易于开发、配置灵活、响应速度快等优点,在学术上和工业上得到了迅速地发展和有效的实践。本文的主要研究内容如下:(1)针对工业过程
学位
针对大尺度结构进行损伤的监测与安全评估,及时地确定安全隐患,组建一套面向于大型结构的损伤诊断系统尤为重要。大尺度结构即为大型工程结构,由于使用范围广泛,材料面积大,在大型工程结构上进行损伤监测不仅使监测设备繁琐,而且信号的处理难度更加困难。本文研究主要是针对大型复合材料板损伤的情况下,从Lamb损伤监测机理方面入手,设计最简三角稀疏阵列并且提取Lamb波在典型损伤上的多特征参数,利用机器学习建立损
学位
近年来,由于人工智能和互联网技术的迅速发展,单个智能体已经不能解决大规模、复杂和不确定信息的现实问题。因此,多智能体分布式协同控制成为控制领域热点关注的课题。由于通信时滞和量化噪声等复杂通信因素的影响,多智能体系统的协同控制设计的难度极具增大。因此,复杂通信环境下的多智能体系统的分布式协同控制引起了广泛关注。本文研究了具有连边乘性不确定的连续和离散多智能体系统鲁棒一致性和具有通信时滞不确定的二阶严
学位
微流控光学透镜具有可灵活调节焦距、能在一微型芯片中同时实现微流控分析和光学检测、简化透镜尺寸等特点,所以目前它在光学相关领域得到了广泛的关注和研究。其中,具有双界面的微流控光学透镜,由于其双界面的曲率均可按照需求进行独立调节,并伴随有大的光焦度的改变,具有重要的研究意义。本课题采用组合形式,基于介电润湿力、介电泳力、纵向梯度静电力三种不同的驱动力,实现双凸型微流控光学透镜,并对透镜的相关性能进行分
学位
如今出现了很多网上房屋租赁应用,但目前的互联网房屋租赁应用还存在着一些典型的问题:目前的房屋租赁应用仍然是一个中心化的系统,系统所有的数据都被其控制,存在着信息不对称的问题;房屋租赁数据的真实性有待提高,目前仍然存在着很多虚假房源的情况。因此如何实现房屋租赁应用的去中心化管理以及提高房源数据的真实性是目前需要解决的问题。区块链的去中心化以及防篡改特性为房屋租赁应用提供了新的设计思路。为了真正实现去
学位
情绪识别是计算机视觉领域近几年来研究较多的课题。目前的研究成果主要集中在仅基于面部表情的情绪识别或仅基于身体动作的情绪识别方面,但这些单模态的情绪识别算法泛化能力并不强,并且准确率也存在提高的空间。为了提高情绪识别的准确率,本文对基于多模态特征融合的视频中人物情绪识别算法进行研究,重点研究如何综合运用面部表情特征和身体动作特征来进行视频中人物情绪的识别。首先,以提高情绪识别的准确率为目标,设计了一
学位
随着信息系统的广泛应用,数据系统内的数据同步问题日益突出。如何以安全高效的方式实现系统内的数据同步,已成为企业广泛关注的问题。为了增强数据的连通性,减少“信息孤岛”问题,数据同步显得尤为重要。同时,目前的研究往往集中在数据传输过程,而普遍忽略了数据同步后的验证模式。对于数据是否被篡改、敏感信息是否泄露、数据完整性等问题的忽视,导致了完整同步链的潜在缺陷。本课题针对现有数据系统同步方案中的缺陷,利用
学位
数据密集型工作流的任务之间需要传输大量的数据并进行复杂的计算,这就要求运行该工作流的计算资源计算能力强、存储量大,但单一的计算资源一般满足不了数据密集型工作流的运行需求,往往需要将数据密集型工作流中的任务部署在云环境中不同的数据中心,而相关任务分布在不同数据中心产生的大量数据传输,对工作流的执行费用和执行时间均产生了较大影响,只有合理的调度方法才能尽可能的减少传输量,从而降低执行费用和时间。现有静
学位