基于卷积神经网络的图像目标检测方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhouxubo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像目标检测是计算机视觉信息处理的基本问题,是行为理解、场景分类和视频内容检索等其他高级复杂视觉问题的基础,具有学术研究与实践应用的双重意义。论文针对目前图像目标检测中的技术难点问题,研究基于多层次特征融合区域生成网络的候选区域获取方法,解决复杂背景干扰问题;研究多尺度自适应特征提取方法,解决人工特征设计难以及目标多尺度问题;研究多任务回归器的设计方法,解决图像目标检测中待检测目标难分类的问题。论文主要工作如下:在候选区域提取层面上,待检测目标图像存在复杂背景和无关信息干扰问题,论文采用基于多层次特征融合的区域生成网络(multi-level feature fusion region proposals network,MFF-RPN)模型对待检测目标图像进行候选区域的提取,通过对模型提取到的底层特征进行平均池化操作以及对模型提取到的高层特征进行反卷积操作,将底层特征和高层特征保持在相同的分辨率下。然后通过局部响应归一化将底层特征和高层特征压缩至同一特征空间下。最终将传统区域生成网络分类层和检测层前加入感兴趣区域(region of interest,ROI)池化层和全连接层,提取更细致的区域特征,获取少量精致的候选区域,剔除复杂背景和无关信息的干扰。在特征提取层面上,由于待检测图像中目标距离、光照条件的不同造成传统人工特征难以设计,论文针对此问题构建一种多尺度卷积神经网络模型,在网络中构建不同尺度的卷积层,即在底层卷积层设置较小的卷积核,提取更多底层位置细节信息,在高层卷积层设置较大卷积核,提取待检测目标全局类别模式特征,最终连接ROI池化层将待检测目标整体特征映射至同一特征图中,构造多尺度特征,自动获取待检测图像的复杂抽象特征,有效解决待检测图像目标检测特征难提取的问题。在分类检测层面上,论文提出一种多任务分类回归器,将候选框特征提取,目标分类和检测任务统一在深度学习框架下,建立一种图像目标特征与目标分类检测模式之间的复杂映射机制,并利用非极大抑制方法获取最终得分较高的目标检测区域,提高分类器分类精度,同时校正卷积神经网络提取有效特征的能力,解决图像目标难分类检测问题。论文在PASCAL VOC2007、VOC2012两个数据库展开验证实验,通过与其他文献的实验结果对比,说明论文所提的基于卷积神经网络的图像目标检测方法能够有效提升检测精度,实现图像目标检测。
其他文献
北京海策工程咨询有限公司成立于1999年10月,是中国水利工程协会常务理事单位、北京市水利工程协会理事单位、北京市工程咨询协会会员单位、北京水土保持学会会员单位。
随着中国城镇化的不断发展,人口老龄化程度正呈现加剧上升趋势,需要进行身体和心理康复的人群不断增多,采用信息技术辅助康复过程具有重要的现实意义。综述了虚拟现实技术在
为了解决高维数据流降维处理中对实时性要求较高的问题,提出了一种基于Johnson—Lindenstrauss转换的数据流降维方法,并论证了在异步数据流情况下该方法的有效性。该方法通过一
目的了解本地区少女妈妈的临床特征,为降低少女妈妈的发生率提供依据。方法回顾性分析2011年1月1日至2015年12月31日在海南省第二人民医院住院分娩的19岁以下少女妈妈及其婴
为了减少片上多核处理器(Clip multi-processor,CMP)末级共享Cache中的干扰,根据应用程序的存储访问频率特性,提出了一种基于替换算法的可重用数据预测机制。当末级共享Cache的
针对水电站施工期科技管理较难的问题,项目业主采取了有力保障措施,确保了观音岩水电站施工期科技项目有序开展,为加快工程进度及节约投资提供了技术支撑,科技管理成果显著。
人类基因组计划的实施产生了大量的基因数据,如何利用这些数据是后基因时代生物学研究的主要内容.结构基因组学就是利用这些数据和计算机模拟技术建立模型来为人类服务.介绍
本文介绍了双频识别声呐水下影像监测系统的工作原理,对通过仿射变换特征图像配准法对数据进行处理得到清晰整体图像的核心技术进行了分析论证;并通过系统在三河闸水下结构损坏
一个人的科学素养表现如何,在很大程度上影响其问题解决能力、经济收入及生活方式,并进而影响整个社会的技术进步与民主发展。基于PISA2015数据对中国北京、上海、江苏、广东
校园网络资源的快速增长在校园网内却形成了一个个信息“孤岛”,给共享及管理网络资源带来了很大困难;分析了校园网资源使用存在的问题,提出了一种基于网格技术的校园网资源共享