多尺度通用目标检测技术研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:toughlee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能深度学习技术的研究与应用,基于深度学习的目标检测技术快速发展,在现代生活的各个领域得到了广泛应用。目标检测任务作为计算机视觉的基本问题之一,构成了许多其它计算机视觉任务的基础,具有重要的现实意义和广阔的应用前景。目前,基于深度学习的目标检测算法主要分为两种:两阶段目标检测算法和一阶段目标检测算法。然而,在现实场景中目标对象通常是复杂多样的,目标检测模型需要检测出不同尺度的目标,例如小、中、大目标,但多尺度目标检测依旧是目标检测领域的难点。通用目标指的是在日常自然场景下的常见目标而非特定场景的目标,具有更大的适用性。因此,本文针对多尺度通用目标检测问题,在经典算法Faster R-CNN和RetinaNet的基础上,对这两种算法存在的问题进行针对性改进,提升其在多尺度通用目标上的检测性能。本文的主要工作如下:(1)通过深入剖析Faster R-CNN算法和RetinaNet算法的原理及过程,构建基于两阶段的Faster R-CNN目标检测基线系统和基于一阶段的RetinaNet目标检测基线系统,采用通用目标检测领域常用的MS COCO和PASCAL VOC数据集来进行实验测试和可视化展示,以分析归纳这两种算法存在的缺陷。实验结果表明,Faster R-CNN算法的特征提取与融合效果较差,导致对多尺度目标的检测精度较低。RetinaNet算法在特征提取与融合过程中容易丢失多尺度目标的特征信息,同时边界框回归不够准确。(2)针对Faster R-CNN算法存在的多尺度特征表示与检测任务不匹配问题,提出了一种多尺度特征增强的改进型Faster R-CNN算法。该算法首先在深度残差网络引入可切换空洞卷积,进一步增强特征提取效果;然后,在特征融合模块引入involution卷积,进一步增强特征融合效果。实验结果表明,与Faster R-CNN算法相比,本文提出的算法在MS COCO和PASCAL VOC数据集上的平均精度分别提高了5.5%和2.2%。其中,在COCO测试集上,小、中、大目标检测精度分别提高了3.0%、5.5%、8.8%。(3)针对RetinaNet算法存在的难以充分提取与融合不同阶段特征及边界框回归不够准确的问题,提出了一种多阶段特征表征与边界框联合优化的RetinaNet算法。该算法首先在深度残差网络中引入多光谱通道注意力,以更好地捕获特征原有的丰富信息;然后,将路径聚合操作与特征融合操作相结合,设计了多尺度特征融合模块,以更好地融合不同阶段的特征;最后,在边界框回归过程中引入完全交并比损失函数,以实现更快更准确的回归。实验结果表明,与RetinaNet算法相比,本文提出的算法在MS COCO和PASCAL VOC数据集上的平均精度分别提高了2.1%和1.1%。其中,在COCO测试集上,小、中、大目标检测精度分别提高了1.5%、2.3%、2.3%。
其他文献
改革开放以来,我国各地区政府把工业园区建设作为拉动区域经济增长的新引擎,工业园区的数量也逐年增多。截止到2019年,我国的工业园区数量已经增至2543个。工业园区的蓬勃发展给我国带来经济效益的同时,也带来了众多环境问题,严重影响了生态平衡。由于工业园区内工业企业较为集中,工业生产伴随着大量的能源消耗,也会向环境排放大量的大气污染物,严重影响园区及周边空气质量。建设生态工业园区,提高工业园区的生态效
学位
水体中的有机污染物和重金属因其高毒性和难降解等问题日益引起人们的关注。半导体光催化技术在太阳光激发下可以产生大量活性自由基,如·O2-和·OH等,在去除水体污染物领域显示了良好的应用前景。石墨相氮化碳(g-C3N4,CN)是一种层状非金属聚合物光催化材料,因其具有合适带隙(2.7 eV)、制备方法简单、成本低、稳定性好等优点而备受关注。然而,单纯的CN光吸收范围窄且光生载流子复合率高,限制了其实际
学位
电容去离子技术(Capacitive deionization,CDI)是一种新兴的海水淡化技术,其脱盐性能极大程度上取决于电极材料本身的性质,目前所使用的电极材料主要包括:活性炭、碳气凝胶、碳纳米管、石墨烯、插层材料,金属有机框架材料(Metal-Organic Frameworks,MOFs)等。MOFs 衍生碳是以 MOFs 为模板或前驱体经高温碳化后衍生的材料,具有结构多样、孔隙发达、比表
学位
基于监控视频的目标识别技术已经逐渐普及并应用于生活的方方面面。随着监控设备性能的日益提升,监控视频的质量,如分辨率、帧率也不断提高。上述现状直接导致监控视频数据量急剧增长,促使基于视频分析的计算复杂度持续增加,给有限的硬件资源带来了巨大压力,最终导致计算延迟大幅度提高,难以完成实时性任务。以智能交通领域为例,其对监控视频分析处理的需求日益增加,例如异常车辆识别、行驶速度估计等,同时分析算法的实时性
学位
杂化金属卤化物是一类由有机阳离子和金属卤化物阴离子通过分子间相互作用组装而成的材料,由于其丰富的晶体结构和优异的光电性能,在近几年内一直是光学和电学研究领域的前沿材料。通常,可以通过选择不同的有机阳离子和卤化物阴离子来调节杂化物的结构和性质。其中,缺电子的紫精阳离子能够接受来自电子给体的单电子而形成紫精自由基,从而实现颜色的可逆变化,因此被广泛用于构建光/电/热致变色材料。基于以上考虑,本论文设计
学位
为关怀、激励基层干部职工,党和政府先后出台了多项政策法规,其中职务与职级并行是重要政策措施之一。2014年12月,中央深改组审议通过《关于县以下机关建立公务员职务与职级并行制度的意见》,公务员经济待遇的主要影响因素从职务转为职级,2019年6月《公务员职务与职级并行规定》正式实施,职务与职级并行全面推开,这些政策的实施,一定程度上提高了基层工资待遇,拓宽了干部晋升渠道,激励公务员更加担当作为。本文
学位
小檗碱是一种从中药黄连中分离出的一种生物碱,因在水中的溶解度较小,从而限制了其在制药行业中的应用。本文采用将小檗碱与可生物降解的有机酸相结合形成药物盐的方法,来改善小檗碱的理化性质,提高小檗碱的生物利用度。这些药物盐作为潜在的药物,为使其在制药行业中有良好的应用前景,了解它们的理化性质及其与生物小分子间的相互作用是十分有必要的。本文设计合成了五种以小檗碱为阳离子的药物盐,即小檗碱-正辛酸([BBR
学位
硼烷(borane)一般是指由硼和氢组成的硼氢化物(borohydrides)及其衍生物。自1912年Stock首次报道了硼烷以来,硼烷以其不同寻常的多中心成键方式和广泛的应用领域引起了硼化学家的极大兴趣。从二十世纪五十年代开始,硼化学家们对多面体硼烷的合成、性质以及应用逐渐有了系统的认识。尤其是近些年来掀起的对BNCT的研究热潮,迫切的需要硼化学家们开发新的合成多种功能化的多面体硼烷的方法。在多
学位
对外直接投资始终是国际商务领域关注的焦点,而具体投资区位是企业实行国际化战略、实现“走出去”时面临的首要问题。在中国,企业的对外直接投资并非仅仅流向制度质量比中国更好的国家和地区,而是存在向制度风险更高的地区“嵌入”的现象,但这其中的原因并没有得到很好的解释。根据“高阶梯队理论”,企业的经营决策结果会受到管理层背景特征、认知、价值观的影响。已有文献从东道国层面以及企业整体资源层面对企业对外投资区位
学位
耐火砖是一种可用于建造各种热工设备和熔炉的高温建筑材料。在其生产过程中,工艺水平和操作不当会造成缺角、缺棱、凹坑、凸起等表面缺陷,这类缺陷不仅影响了该材料的使用寿命与安全性,还会对耐火砖的生产质量和经济效益带来巨大影响。目前,耐火砖表面质量检测仍主要依靠传统的人工检测方式完成,存在产品抽检率低、检测准确率低、成本高、自动化程度低等问题,且受人工经验和主观因素影响较大,不能满足现代生产的需求。由于耐
学位