基于区域卷积神经网络的物体检测方法的研究与改进

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:chywei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机的普及以及互联网的发展,图像以极快的速度产生出来。要对图像进行智能化的分析和理解,就要对其中包含的物体进行检测。物体检测一直是计算机视觉领域的研究热点。近年来,深度学习尤其是卷积神经网络的进步大大推动了物体检测的发展。目前一种可行的、效果较好的物体检测方法就是区域卷积神经网络(R-CNN)方法。该方法首先提取若干最有可能包含物体的候选区域,接着使用CNN对其提取特征,最后每类训练一个分类器对这些区域进行分类。Faster R-CNN是R-CNN系列方法不断改进的结果,使整个物体检测流程成为了端到端的过程,然而目前在检测精度上还有很大的提升空间。本文研究分析了Faster R-CNN方法的基本流程和原理。考虑到特征提取对于该方法的重要性,使用表达能力更强的残差网络(ResNet)替换了Faster R-CNN方法的VGG16网络作为后续改进的基准。本文通过可视化分析卷积神经网络不同层输出的特征,发现低层次的特征可以与高层次的特征互为补充。在此基础上我们提出了一种多层特征合并策略。采用卷积层对低层次的特征进行“下采样”到与高层次特征相同大小,然后使用连接层将两者合并起来。这样可以获得对原始图像更有效的特征表达。针对Faster R-CNN方法只利用区域特征进行分类和定位的情况,我们实现了一个上下文学习结构。采用感兴趣区域池化层提取全图的上下文特征,并与区域特征合并,用于物体的分类和定位。针对Faster R-CNN方法在后处理时只保留每类相交大于一定阈值的结果中置信度最高的包围框的情况,我们引入了包围框优化策略。将被删除包围框提供的位置信息加以考虑,对最终的包围框以置信度为权值进行投票。本文主要使用Pascal VOC公开数据集进行实验。实验结果验证了本文改进后的区域卷积神经网络方法能够有效地提高物体检测精度。在VOC2007和VOC2012上的平均精度均值(mAP)分别为78.4%和75.4%。最后在ImageNet大型数据集上进行了一定的测试,平均精度均值为53.8%。
其他文献
沈秉廉是我国近现代著名音乐家,在音乐创作、音乐教育和外国歌曲编译诸方面作出了开创性贡献。取中国近现代音乐史的研究视角,以沈秉廉创作的儿童歌舞剧《五蝴蝶在花园里》为
随着科研、生产对网络和数据支持的依赖逐步加强,网络信息安全和保密是一个至关重要的问题。网络的安全措施应能全方位地针对各种不同的威胁,确保网络信息的保密性、完整性和可
应急救援是城镇事故、灾难防范屏障的最后一层,施救效果的好坏直接影响着突发事件对城镇造成的人员伤亡、财产损失的程度。作为消防队、医疗队等应急救援队伍的空间容区,合规
近些年,随着环境污染形势的逐年加剧,各环保燃料亦随之涌现,其中以天然气作为国内外学者的研究重点,燃气和蒸汽相结合的热电联产为最优选择之一。本文研究了分析热经济性的方
<正>2019年4月2日,随着冈比亚议会的批准,非洲大陆自由贸易区(AfricanContinental FreeTradeArea,AfCFTA,以下简称"非洲自贸区")正式生效,这标志着非洲经济一体化进程又向前
<正>近日,随着全国"扫黄打非"办公室的介入,一些电商平台的"涉黄涉暴"现象受到查处。有关电商平台宣称紧急排查并关闭涉事店铺、下架违规商品,而一些媒体指出,"涉黄涉暴"属于
玉树通天河流域岩画内容丰富、题材广泛,以牦牛图像数量最多,牦牛图像是最具本土风格的图像类型。文章通过图像学分析,将牦牛图像分为3个类型,并根据相关资料确定了每种类型
国家经济迅猛发展,国际局势风云变化,面对着西方资本主义价值观的渗透,我国国民的意识形态教育显得尤为重要。习近平同志在十九大报告中要加强党对意识形态工作的领导。思想
目的调查该院N1护士文化照护能力,分析存在问题探讨解决方法。方法选择该院临床各科室2016年N1护士50名作为调查对象,采用霍苗设计的文化照护能力调查表,在该院2016年N1护士
许明月,1963年2月9日生于安徽省桐城县,先后在华东政法学院、西南政法学院和中国社会科学院研究生院学习,获得了法学学士、硕士和博士学位;现任《现代法学》、《西南政法大学学报