基于深度学习的目标检测算法的研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:zc81065442
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉的主要任务之一,其任务是给出图像中目标的类别和目标的位置坐标。近年来,随着深度学习的快速发展,使用卷积神经网络来进行目标检测已经成为趋势,并且基于卷积神经网络的目标检测能达到较高的检测精度和较快的检测速度。但是由于目标多尺度以及遮挡等问题,使得目标检测依然是一项具有挑战性的任务。本文主要针对两个问题进行研究,一个是多尺度的目标检测,另一个是小目标和被遮挡目标的检测。为了解决多尺度的目标检测问题,本文提出了三种多尺度目标检测方法。(1)本文实现了基于VGG16的特征金字塔目标检测方法,然后在该方法的基础上添加三个额外的下采样层,实现了改进的特征金字塔目标检测方法;(2)本文对卷积层的级联方式进行了研究,最终提出了一种阶内聚合的特征金字塔方法;(3)本文将阶内聚合方法与特征金字塔方法进行融合,并且添加规范化层,提升训练的速度,最终实现了优化的多尺度目标检测方法。为了解决小目标和被遮挡目标的问题,本文对上下文信息模块进行了研究,提出了两种上下文信息模块。(1)多分支上下文模块:通过使用1×1,3×3和5×5三个不同卷积核大小的卷积分支来增强特征的感受野;(2)ROI上下文模块:通过扩张目标候选框获得上下文区域,用于辅助第二阶段目标的分类和回归。本文在KITTI数据集上测试了提出的所有方法,并在PASCAL VOC 0712数据集上测试了部分方法。实验表明,本文提出的方法能够提升目标的检测准确率,最终在KITTI Moderate数据集上达到88.19%的检测准确率,在PASCAL VOC 0712上也提升了0.7%。
其他文献
本研究基于仿生构建原则,选择类似细胞膜粘弹性特征的液晶态软物质--羟丙基纤维素酯类液晶作为细胞模型体系的基础材料,设计、构建力学性能及表面特性类似于ECM且具有良好细胞亲和性的液晶细胞基底模型,诱导干细胞成骨分化。通过系统探索液晶基底与干细胞的相互作用,理解基底粘弹性和表面特性的改变对干细胞行为及功能的影响。本文首先通过改变液晶化合物结构中刚性/柔性部分组构制备一系列弹性模量可调的液晶基底(C_n
江苏省泰州市教育局二零一二年启动实施了泰州市教育转型发展“163”行动计划,推出具有地方特色的中小学微课资源平台“江苏泰微课”(以下简称“泰微课”)。当前泰州地区约有近三十万学生在使用此平台,平台的推出受到了包括教师、学生和家长的普遍欢迎,但在使用中也发现尚存在各方面的问题,这些问题制约了平台的进一步发展。对于中学生泰微课平台的使用现状、影响因素及所面临的问题等目前尚缺乏系统调查和分析,本研究即希
水利项目是国民经济的基础设施和基础产业,关系着国计民生。因此,水利工程一般属于政府投资项目,通过政府采购流程选择相关方参与工程项目建设。对于规模大、投资多、工期长、技术复杂的水利工程项目,建设单位作为统筹管理协调者,要保证项目的顺利实施,而在项目管理过程中,沟通管理贯穿始终,关系着项目的成败。当前BIM技术的应用在建筑行业日趋盛行,信息技术的发展使人们不断探索云计算的应用,以此为启发,研究沟通管理
随着城市化进程的推进,越来越来的钢筋水泥建筑物出现在众人的视野中,面对城市化建设的需求,建筑工程的高度不断在突破,由于建筑物高度越高,所需要承受的力度更大,采用的钢筋
自有噪信道编码定理在1948年提出以来,信道编码的研究学者一直在尝试设计出一种信道容量可以达到香农极限的独特的信道编码方式。随着信道编码理论的飞速发展,LDPC码和Turbo码已成为编码领域的主流解决方案,并广泛用于各种通信系统中。然而,从理论上讲,这些编码方法的信道容量还没有严格达到香农极限。极化码最初由Erdal Arikan提出,在拥有较低的计算复杂度的同时,也是唯一一种可以被严格数学证明能
当前,随着我国财政收支规模迅速扩大,人民民主监督的意识不断提高,政府预算体系建设以及财政资金的使用安排,越来越成为社会关注的焦点。把政府所有的收入和支出纳入预决算管
随着各类网络应用的不断发展以及数据量的不断激增,静态、中心化的软件定义光网络控制模式无论从安全角度还是效率角度都不再能适应新型网络需求。因此,更为高效安全的网络控制技术成为了业界广泛关注的研究重点。传统的控制安全技术通常依赖于防火墙的阻隔作用,但被动防御的方法并不能百分百阻断各种层出不穷的网络攻击。另外,当前网络的资源复杂性使得单一资源优化容易使资源分配陷入局部最优解,资源利用效率也随之降低。区块
随着互联网经济的快速发展,作为电子商务中的“最后一片蓝海”,诸多企业开始纷纷涉足生鲜农产品电子商务领域。然而,在其蓬勃发展的同时,却受到来自多方面的压力,一方面是为保证高新鲜度的生鲜农产品而付出的高额保鲜成本和产品流通过程中的高额损耗成本;另一方面是消费者的多样化需求与满意度偏好对生鲜电商带来的影响。基于此,为了能更好的提高消费者网购生鲜农产品满意度,扩大市场占有率,实现利润最大化,本文在考虑消费
在人工智能技术急速更新与迭代的背景下,人工智能司法决策工具逐渐得到推广应用。本文首先介绍了人工智能技术的特点,考察了技术在我国和美国司法决策领域的应用现状。指出在弱人工智能的时代,技术仅仅处于辅助侦查、决策的工具地位,尚且不能替代法官独立进行裁判。目前,人工智能司法决策工具主要经由下列路径得以应用:类案推送功能帮助法官自动获取相似案件的判决文书;量刑预测功能帮助法官在合理区间内获得量刑结果;偏离预
破产理论是保险风险理论中的核心内容之一.预测保险公司在有限或无限时间内的破产概率,可帮助保险公司更好地检查偿付能力以及管控其金融业务的风险.然而随着保险公司的业务和经济全球化发展,经典的风险模型已经不再能够满足保险公司的业务需求,结合当今经济环境,考虑利率等随机因素的影响是不时之需.本文主要基于保险风险与金融风险相依的条件下,研究离散时间模型破产概率的渐近表示,而我们的核心问题是在于分析探讨保险风