基于弱监督深度学习的目标检测方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:zhangyongqiangis250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是当前计算机视觉领域最基本也最具挑战性的研究课题之一。目标检测在机器人导航、智能视频监控和工业检测等领域有着广泛的应用,也为人脸识别与检测、目标跟踪和行人重识别等研究方向提供基础支撑。近年来,随着深度卷积神经网络的兴起和标注数据量的大幅增加,基于深度卷积神经网络的目标检测取得了较之传统方法更佳的性能。现今的基于深度卷积神经网络的目标检测面临着两个问题:其一是训练神经网络模型需要海量的标注数据,这些数据的获取和标注费时费力;其二是目标检测的数据集存在较为严重的类间数量不平衡问题,这对目标检测的精度有较大影响。针对目标检测存在的问题,我们着手研究基于深度卷积神经网络和弱监督学习的目标检测方法,重点在于挖掘和利用弱监督信息来提升在标注数据有限情况下的目标检测精度。本文提出了两种结合卷积神经网络和弱监督学习来提升目标检测精度的方法,具体内容如下:(1)提出了一种基于中心点监督的目标尺度估计方法。当前基于边界框的强监督目标检测方法虽然能获得较高检测精度,但是其需要人工标注大量的边界框。此外,基于图像级标签的弱监督目标检测方法虽然节省了标注成本,但是其检测精度往往较差。针对现阶段目标检测存在的问题,所提出方法使用中心点作为监督信息,结合卷积神经网络特征可视化来估计目标的尺度,并生成伪边界框来训练目标检测网络。在PASCAL VOC 2007和PASCAL VOC 2012目标检测数据集上,所提出方法取得了比基于图像级标签监督的方法和基于中心点监督的方法更高的检测精度。值得注意的是,所提出方法只使用了中心点作为监督信息,为此能在检测精度和数据标注成本之间取得较好的平衡。(2)提出了一种基于弱监督语义分割的数据集增强方法。目标检测数据集中存在类间不平衡问题。目前的一些解决方法存在提升精度有限、容易过拟合的问题,还有一些方法使用掩膜增强数据,而人工标注掩膜费时费力。针对这些问题,所提出方法使用边界框作为监督信息来训练弱监督语义分割网络,并将弱监督语义分割网络生成的掩膜用于增强数据集。所提出方法能有效地降低目标检测数据集的不平衡率,同时提升数据集的多样性。所提出方法在PASCAL VOC 2007和PASCAL VOC 2012目标检测数据集上都取得了相对于其他前沿方法更高的检测精度。
其他文献
“先授权后提供服务”是网络平台注册的基本模式,网络平台经营者往往无法单独提供服务,消费者进行必要的授权是网络平台经营者提供服务的前提,因而这一模式具有合理性。但在大数据分析的技术加持下,个人信息、知识产权等授权条款的经济价值被逐步放大,网络平台经营者受利益最大化的驱使倾向于在网络用户协议中索取更多授权,甚至借助网络用户协议不可协商修改的特点和自身优势地位强制消费者进行不合理的授权,并超出了网络平台
包商银行作为内蒙古自治区成立最早的股份制商业银行,自成立起获得诸多荣誉,同时也被银监会评定为首批风险最小的七家城商行之一,但却在2019年5月24日被银保监会以出现严重信用风险为由接管一年。所以,正确全面的认识和合理规避自身存在的信用风险对包商银行具有非常重要的意义。本文采取案例研究方法,以包商银行作为研究对象。着重研究包商银行信用风险管理现状,同时采用蒙特卡罗模拟法预测2019年包商银行的信用风
整体型催化剂因其具有较低的流动阻力和优异的传热性能而受到广泛关注。整体型催化剂的结构对其催化剂性能具有较大影响。为此,本研究设计了 3种不同结构的整体性催化剂,使用计算流体力学(computational fluid dynamics,CFD)的方法系统研究了催化剂的结构对其性能的影响。具体研究内容和结果如下:首先,使用3D打印技术,制备了 3种不同结构(蜂窝结构、金刚石结构和松质骨结构)的整体型
目前,再制造引起国内外学者的广泛研究,关于双寡头垄断市场结构下厂商再制造决策的研究涉及较少,再制造与二手市场相结合的市场结构还属于研究盲点。由于再制造不仅需要考虑新品的定价,同时也涉及了再制造品与旧品的定价问题,面临的运作环境更加复杂,给厂商的高效运作和管理带来极大的挑战。本文采用博弈理论,研究了存在二手市场时,双寡头垄断市场结构下厂商的再制造决策问题,主要内容如下:一、市场地位低的厂商再制造决策
学位
五大连池拥有大陆上保存完整、分布集中、形态典型、种类齐全的新老期火山地貌,具有独特的火山森林生态特征,是研究原生演替与火山森林生态系统等诸多科学问题难得的理想场所。白桦是我国东北地区温带阔叶和阔叶混交林的主要阳性树种,在火山熔岩台地(H1)、熔岩孤丘(H2)和山口湖(H3)这三种异质生境,即受火山喷发影响程度逐渐减弱的生境中的共有物种,并形成大面积的优势群落,在五大连池火山原生演替过程中扮演着不可
对于采用房柱法进行资源开采的矿山,采场的稳定关系到矿石的产出和作业人员的安全,在保证采场稳定的同时获得最大的回采率需要对采场结构进行精细的设计。为优化某钨矿的房柱法采场结构参数,通过现场调查和室内试验确定了该矿的岩体力学参数,建立了采场顶板-矿柱体系力学模型,获得了最优的采场结构参数,采用数值模拟方法验证了该采场结构参数可应用于现场。基于上述研究,获得的主要研究成果如下:(1)对取自该钨矿的岩石样
自2011年“智慧城市”的概念提出至今,经历9年左右的智能、智慧的变革创新,全球已全面进入智慧时代。目前,世界各地都在促进传统城市智能化科技化的发展,我国也将城市智能化发展视为城市未来的发展方向。智慧小区作为城市智能化发展的排头兵,其重要性毋庸赘述。智慧小区的打造,少不了高度信息化的小区物业管理。但是目前,很多小区还在使用传统的物业管理模式或者功能单一的物业管理信息系统,导致物业管理和物业服务严重
随着知识经济的来临,企业的竞争优势由规模、劳动力向知识、创新转变,面对更加复杂多变、充满不确定性的市场环境,企业需要迅速成长、及时调整甚至勇于变革,才有可能在市场中生存下来、发展起来,而这之中,有效的领导力往往被看作组织成长、变革和再生最重要的关键因素之一。A公司处于互联网+医疗的新行业,在新的背景下,提出“更加关注领导力”的组织要求。本文以A公司中层管理者为研究对象,通过对其领导力水平的调研与分
足球视频事件检测是体育视频分析领域的重难点,自动并准确定位出足球视频中的精彩事件对视频检索、精彩集锦和视频摘要的生成以及辅助球队分析等具有重要意义。近年来,基于深度学习的方法在足球视频事件检测上取得了一定的进展,但对于事件的高层语义学习仍不够充分,检测结果有待提高。以直接射门的任意球射门事件(简称为任意球射门事件)为研究对象,深入分析任意球射门事件的特点,提出了足球规则与深度学习相结合的事件检测模