基于卷积神经网络的目标检测方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:SHAWSHAW11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测的任务是在图像数据中对可变数量的目标进行分类和定位。随着技术的不断进步以及智能化的发展,目标检测成为了计算机视觉领域的难点和热点问题,并在智慧课堂、自动驾驶、无人超市、快递的智能分拣、智能医疗以及智能服务机器人等领域得到了广泛的应用。目标检测根据所使用的方法类型,可以分为传统的目标检测方法和基于卷积神经网络的目标检测方法。虽然基于卷积神经网络的目标检测方法相对传统的目标检测方法对于目标的检测取得了更好的成果,但是仍存在定位偏差以及漏检和误检问题。本文在基于卷积神经网络的目标检测方法研究的基础上,通过对聚类方法以及非极大值抑制算法进行改进,从而提高目标检测模型的定位精度与检测准确度。本文的主要工作有:首先,针对目标的定位偏差问题,提出了新的anchor聚类方法,IOU-K-means++。通过对基于卷积神经网络的Yolov3目标检测模型的研究与分析,了解到在目标定位中,使用anchor对目标检测模型的定位提供先验知识,发现由于原模型中K-means聚类方法得到的anchor对于标注数据的拟合性能较差,使得目标检测模型定位精度较差。算法选用聚类更加准确稳定的K-means++,并结合目标检测anchor计算的实际情况和聚类数据类型,采用IOU距离替换欧氏距离作为聚类性能的度量标准实现。实验结果表明,通过IOU-K-means++计算得到的anchor对于标注数据有更高的拟合性,并且对于目标的定位相对更加精确。其次,针对目标的漏检和误检问题,提出SF-NMS算法。通过对目标检测后处理阶段中的非极大值抑制算法的研究,发现所使用的贪心非极大值抑制算法,在对重复的目标框进行处理时,只是通过单一的阈值直接将目标框进行删除,存在漏检的问题。考虑到IOU大于阈值时,也存在属于真实目标框的可能性。算法结合Greedy NMS和soft NMS算法,通过增加双阈值进行分段惩罚的方法,较好的平衡了NMS和soft NMS的漏检和复检问题。最后,本文采用PASCAL VOC2012数据集对本文所提出的算法在YOLOv3目标检测模型上进行实验验证,并将实验的结果与原模型进行了定性和定量的分析。
其他文献
人体行为识别是计算机视觉中的一项重要任务。在家庭服务机器人研究领域,人和机器人之间的交互极其重要,机器人必须能够对人体的行为进行准确分类,才能更好地为人类提供更加精准、高水平的服务。早期的行为识别算法都是针对彩色图像序列进行的,随着廉价的深度传感器和实时的骨架估计算法的出现,基于骨架的行为识别引起了很多学者的关注。利用骨架数据不仅可以改善光照变化和视点变化的问题,而且可以忽略由于衣着、肤色、发型等
学位
互联网的迅速发展促进了电子商务系统的丰富化和多样化,要每个功能都进行重新开发会大大降低系统版本迭代的效率,因此具有各种功能的API(Application Programming Interface)的使用成为了流行趋势。本课题以API的基本研究为基础,构建了电子商务系统API模型,对电子商务系统中API的使用有一定的意义。首先,描述了课题的研究背景和意义,对API技术现状和产业界API现状进行分
学位
随着Android智能手机的快速发展和普及,基于Android系统的设备数量和软件数量也呈爆炸性增长。相比较Apple公司的IOS系统,开源的Android系统更容易受到攻击,恶意代码可以轻易的注入并攻击移动端。目前在检测Android恶意应用领域的研究工作主要在于如何更好的提取Android应用的特征,在这些特征中利用语义特征对恶意行为进行判断的方法最为可靠。为了更精准的提取应用的语义特征,本文
学位
目前恶意用户对推荐系统的攻击由个体攻击逐渐趋向于群组攻击。相对个体攻击而言,群组攻击对推荐系统产生的危害更大。因此,如何有效检测群组攻击成为推荐系统中亟待解决的安全问题。为了检测推荐系统中的群组攻击,研究人员提出了基于有监督和无监督学习的检测方法。然而,有监督检测方法需要标记训练样本,因此只能检测已知类型攻击。无监督检测方法不需要标记训练样本,但是需要一定的先验知识。针对这些局限,本文研究基于图嵌
学位
蛋白质中存在的分子空腔对蛋白质的功能有极为重要的影响,因此对分子空腔的研究也是蛋白质结构与功能研究的重要组成成分。蛋白质中分子空腔的变化会给蛋白质的结构带来影响,蛋白质的功能又与蛋白质的结构息息相关。因此对分子空腔的变化模式以及影响其变化的因素的研究具有重要意义。本文根据分子空腔数据变化复杂、数据量大的特点,对分子空腔的表示形式,分子空腔间相似性比较方法进行探索。并基于此对分子空腔的变化模式进行了
学位
近两年人工智能的兴起,语音智能聊天机器人成了各行各业追捧的对象,其中具有较强领域性的任务型对话系统被广泛应用,例如银行的智能助手、医院的导诊机器人、移动通讯的业务办理机器人等,都体现了对任务型人机对话系统日益俱增的需求。人机对话系统的自然语言理解模块是人机对话系统中的一项重要工作,此模块包括意图识别和语义槽填充,其中意图识别的准确性直接影响用户对系统的体验感,也就是用户是否能得到系统反馈的合理信息
学位
社交网络是信息化时代下的一个重要产物,并且网络中的数据每天以指数形式增长,如何有效分析并处理好这些数据,是社交网络中研究的内容,而影响力最大化则是其中的一个重要研究方向。影响力最大化涉及到日常生活中的各个方面,例如:产品推广,信息安全,网络搜索等,在现实生活中,是否达到影响力最大化通常与成本预算有关。因此,基于成本预算影响下的最大化具有重要的研究意义,本文通过研究影响力最大算法和信息传播模型,结合
学位
力触觉人机交互在医疗仿真、航空航天等领域都有着广泛的应用,如何保证力触觉交互过程的实时性和精确性是该交互研究领域中的两大难题。在现有的研究成果中,依然存在着实时性差、精确性低的问题,尤其是针对弹性体的研究还有很大的欠缺。为此,本文系统分析了计算机力触觉交互的发展历史以及近年来国内外的研究成果,选取弹性体为研究对象,通过对交互过程的物体建模阶段、碰撞检测阶段、碰撞响应阶段以及触力觉和视觉的输出阶段进
学位
随着无人机技术的发展,无人机航拍图像也作为一种新的图像应用到了目标检测领域。无人机航拍图像中的车辆和行人检测对于智能交通的研究和发展起着积极的作用。深度学习方法是时下研究目标检测的热门方法之一,与传统的目标检测方法相比具有很大的优势,因此本文选用了基于深度学习的目标检测算法对无人机航拍图像中的车辆和行人检测进行研究。首先,针对航拍目标尺度较小,遮挡严重,场景复杂,检测需满足实时性的问题,提出一个改
学位
随着液晶显示技术的高速发展,国家对于平板显示产业也越来越重视。基于此背景,显示器产业的市场前景被一致看好,而作为显示器重要材料的稀土抛光粉的需求量也逐年增多。T公司着眼于市场潮流的发展,决定新建一条3000t/a高性能稀土抛光粉生产线,在技术上引进国外先进成套技术,内部吸收消化,满足日益扩大的市场需求。但是,项目的实施和运营,是否能够取得预期的发展目标,投资回报的比例如何,项目的实施结果未来给予T
学位