基于深度神经网络的目标检测

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lifeng58
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域的基本任务之一。它在安防监控、无人驾驶、人机交互等领域有着广泛的应用。本文研究和分析了现有的基于深度神经网络的目标检测算法的优点与不足。针对目标检测中的不足之处,本文提出了两个目标检测算法。目标检测的性能效果依赖于置信度、目标框和实例分割结果。本文通过改善置信度,来获得更好的目标检测性能。本文回顾并讨论了目标检测中置信度的重要性,并从三个方面提出了一个改进目标检测置信度的新框架:(1)我们训练一个IoU(Intersection over Union)估测网络模块,预测每个感兴趣区域目标框与真值目标框之间的IoU,并将预测的IoU用于改善置信度以区分目标框的质量;(2)我们将分类网络分支解耦为前景/背景分类和类别分类,避免分类时每个类别与大量的负样本竞争;(3)我们提出了交错执行目标框分支和置信度相关的网络分支,以减轻特征不对齐的问题。实验表明,利用改进后的置信度,该算法能够在具有挑战性的MSCOCO数据集上稳定地提高检测算法的性能。目标检测在航空图像上的应用正在成为计算机视觉领域中的一个研究热点,本文也针对航空图像设计了目标检测算法。由于复杂的背景,目标朝向任意,目标小及高输入分辨率等因素,航空图像目标检测是一个非常具有挑战性的任务。本文针对高输入分辨率的航空图像设计了合适的训练推理机制,使用了合适的采样方法和数据增强方法来高效处理航空图像输入分辨率高、目标小以及大部分区域为背景的问题,有效地提高了高分辨率航空图像的训练效率和检测精度。与以往的直接回归角度的方法不同,本文提出了利用分割任务来预测旋转目标框的方向,这样更容易训练,检测结果也更准确。本文进行了大量的实验来验证该算法的有效性,该方法在非常具有挑战性的航空图像数据集DOTA上实现了最先进的性能。
其他文献
强夯是一种具有节能环保优点的地基处理方法,随着强夯法在城镇地基处理施工中的推行,强夯施工所面临的振动与填料问题也在放大。寻求新型经济合理的强夯施工隔振方式,以及探
“绿水青山就是金山银山”理念是习近平生态文明思想的重要组成部分,具有深刻的哲学内涵,本文利用代表“绿水青山”和“金山银山”的生态与经济指标聚类分析了中国1666个县(
非物质文化遗产保护是新时代博物馆功能的重要体现,博物馆通过其收藏、保存、研究、展示、教育和传播等技术,深入探寻非遗事项的社会功能、文化内涵以及传承、创新与应用,以
海德姆和斯诺一起奔赴陕北1933年11月,23岁的乔治·海德姆来到上海,那时他刚刚从瑞士日内瓦医学院毕业并取得博士学位。作为一个美籍黎巴嫩人,海德姆1910年出生于有“水牛城
文本识别及其相关问题一直都是计算机视觉领域的热点与难点,其技术已普遍应用于语言翻译、辅助驾驶、地理定位、图像检索等诸多方面,早在几十年前科研工作者们就开始了相关研
目的:探讨加速康复外科围手术期护理在胃癌患者中的应用。方法:抽选我院2017年1月至2019年1月行胃癌术后患者30例,随机将患者分为对照组(15例,常规围手术期护理)和护理组(15
场景文本作为计算机视觉领域最为活跃的研究对象之一,现实生活中许多应用技术都与其密切相关,比如自动翻译、盲人导读、车牌识别等。当前,文档类文本的识别精度已高达99%,而
近年来我国的经济飞速地发展,金融市场也随之发生了巨变,利率市场化等政策实施以后,银行竞争越来越激烈,同时展开了人才争夺大战。中小城市商业银行而言,由于受区域限制且缺乏有效的绩效管理机制吸引和留住人才,人员流失十分严重。要赢得这场战争,需要经过多方面的改革,而绩效考核改革则是改革的重中之重。前台柜员岗位是银行中最基础最常见的岗位,是银行开展各项业务、正常运转的保障力量。科学的绩效考核制度不仅可以激发
<正>党的十九大指出,中国特色社会主义进入了新时代。党的十九大报告明确了全面建设社会主义现代化国家及其战略安排,确定了从2020年到本世纪中叶的两个阶段安排,将在全面建
会议
<正>在人们的日常经验中,所见卡车司机基本上都是男性,女性卡车司机少之又少。无论从全球的范围还是从历史的脉络来看,卡车司机都是一个男性化的传统蓝领工作。这些进入公路