基于多示例弱监督学习的目标检测方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:a341104361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机视觉领域中的目标检测理论和应用得到了越来越多的关注。随着科技的进步,运用目标检测技术所诞生的产品目前也越来越多的出现在我们的生活当中,给我们的生活提供了很多的便利,但是目标检测在训练阶段是要消耗巨大的人力物力来对图片进行标注的,弱监督目标检测也就进入了人们的视野,目前主流的弱监督目标检测方法是多示例学习以及使用端到端方法的检测器,但是还是有不足的地方,多示例弱监督学习的目标检测还有一个无法避免的问题,那就是非凸性问题。基于端到端检测器这种方法有两个缺点:一个是无法充分利用上下文信息对提案进行分类;另一个是最可能会检测到对象的部分,而不是整个对象。因此,为了使端到端检测器能够有效利用上下文信息对提案进行分类,针对会存在检测结果只能检测到对象的部分以及弱监督目标检测的非凸性问题,本文主要改进如下:(1)针对无法有效利用上下文信息对提案进行分类提出了提案完整性评分网络(SSNet),本文使用平均像素填充图像中的提案区域然后将整个图像放入SSNet。对象处理的图像中包含的区域越多,输出的网络得分越高。本文通过判断基于SSNet输出分数的提案的完整度和紧密度,从而可以有效的对不同的提案进行分类。另外,针对可能检测到对象的部分,而不是整个对象的问题,本文将回归框模块引入到现有的弱监督目标检测网络的PCL中。该模块的作用是修改与基本事实的不同的提案。而且还将回归框模块引入到本文提出的SSNet中使其更加准确。最后,通过多组对比实验验证此方法的有效性。(2)针对多示例弱监督学习的目标检测中的非凸性问题,本文提出了在线提案集生成(OAG)算法,旨在缓解非凸性问题,在训练过程中,训练网络的性能会有所不同。这影响此训练网络中在线PGT的质量。提案基于低质量PGT的抽样可能会删除许多积极的提案,并且破坏训练过程。为解决此问题,提出了动态提案约束(DPC)。DPC能够确定不同的提案抽样策略到目前的训练状态本文定义训练状态θ。通过调整θ值,找到最优θ值。最后通过实验验证此方法的有效性。
其他文献
以硅(Si)材料为基础的工业半导体取得了前所未有的进步,然而其较小的带隙无法满足半导体器件在高压、高频、高功率以及短波长发光和探测等方面的需求。贝塔-氧化镓(β-Ga2O3)作为一种新型超宽禁带(UWBG)半导体,凭借其4.9 e V的超宽禁带、8 MV/cm的高击穿场强和较高的电子饱和漂移速度等优势受到了越来越多的关注。近年来,国内外关于β-Ga2O3基场效应晶体管(FET)器件的报道层出不穷,
随着压电器件在高温环境中的广泛应用,同时具有高压电性能和高居里温度的压电陶瓷材料受到了极大的关注。本研究通过将具有较小容忍因子的铁电体Pb(In1/2Nb1/2)O3(PIN)与电学性能良好的Pb Hf O3-Pb Ti O3(PHT)铁电体固溶,构成一种新型三元压电陶瓷Pb(In,Nb)O3-Pb(Hf,Ti)O3(PIN-PHT),通过理论计算并结合三元相图预测准同型相界区域,提出能够实现性能
在未来几年内,煤炭在我国的能源体系中仍然处于主体能源地位。煤矿井下综掘工作面的自动化可以大幅提高生产效率。目前,我国井下综掘工作普遍以悬臂式掘进机单巷掘进为主,因此悬臂式掘进机位姿检测是综掘工作面自动化的基础和前提。只有获取稳定可靠的掘进机实时位姿,才能够在此基础上进行综掘工作面自动化、智能化改造工作。本文提出一种基于机器视觉和倾角传感器的悬臂式掘进机位姿检测方法,针对位姿参数求解、激光标靶参数优
核电已经成为我国现代能源体系中的重要组成部分,对国民经济发展和提升装备制造水平具有重大意义。近年来,随着“华龙一号”等标志性核电装备的发展与成熟,我国核电机组规模已经位居世界第二,核电自主技术发展已达到国际先进水平,然而,我国核电企业的决策数据存在多源异构等特点,难以保证决策数据的质量,导致数据融合、认知、分析、挖掘不充分,另一方面,通用决策工具和决策构件存在功能单一、不系统、不完备等问题,导致决
互联网大数据的技术发展为人们提供了在线购物、网络会议等多种线上服务。全球超过40亿的互联网用户在享受便利的同时,产生了大规模的数据集。相关企业或人员可以较为容易地获取海量数据。但是,目前大部分企业数据都分散在各个部门或各个业务线的业务系统上,存在数据不一致的问题,如何呈现数据并挖掘这些数据的潜在价值成为一个难题。近年来,数据仓库、联机分析处理(online analytical processin
航天星载设备、航空机载设备,除了追求较高的计算能力外,器件可靠性也是系统设计必须考虑的重要因素之一。现场可编程逻辑阵列(Field Programmable Gate Array,FPGA)作为一种高集成度的半定制集成电路设备,具有并行度高、功耗低,计算速度快和成本低的特点,能够显著提升星载、机载设备的计算能力,但长时间的高温、高辐射工作环境带来的片上电路老化问题严重影响着设备的可靠性,必须有针对
在全世界范围内,脑中风的死亡率仅次于心脏病已成为第二大致死因素,全球每年大约有1500万人患有缺血性中风,颅内动脉粥样硬化是造成脑卒中的重要因素。医学断层成像技术是重建人体三维组织信息的重要手段,磁共振成像广泛应用于颅内动脉血管诊断,其具有高分辨率和多序列的特性,能够清晰地区分不同组织的结构。在磁共振图像中对脑血管标记在临床医学中应用十分广泛,是进一步获得血管信息的首要步骤。研究发现,颅内动脉血管
近年来,深度学习技术在目标检测领域取得了显著的突破,并催生了许多视觉场景理解的任务。其中,场景图(物体表示节点,物体间的关系表示边)由于其强大的语义表示能力一直是计算机视觉领域的研究热点。与图像相比,场景图具有更加抽象的结构化的语义表征能力,具有处理其他视觉任务的潜力。它不仅可以为基础的识别任务提供上下文线索,而且还为解决高层次的视觉理解问题提供更有价值的替代方案,包括图像字幕,视觉问答,基于内容
近年来,云计算作为一种价格便宜且可扩展性强的计算模式,越来越受到企业和个人的青睐。随着云数据中心规模的不断扩大,导致其资源利用不均衡,能耗浪费严重。为了能实现云数据中心计算资源的动态调度,虚拟机迁移技术变得至关重要。传统的虚拟机迁移会根据主机负载的高低进行判断,判断的结论为“迁移”或“不迁移”。这种二支决策方式忽略了主机负载具有动态变化的特征,容易产生过度迁移的现象。而三支决策是对传统二支决策的优
随着脑和神经系统研究的深入发展,小脑学习与记忆的神经机制逐渐被人们所了解。最新研究表明,浦肯野细胞是小脑皮质的唯一输出神经元,它在感觉感知、运动控制中扮演重要角色。然而目前关于浦肯野细胞在小脑信息处理中的作用尚不完全清楚。因此,本文开展小脑浦肯野细胞复杂尖峰响应机制研究,主要内容包括:(1)首先论文在现有浦肯野细胞生理实验数据的基础上,结合多种细胞复杂尖峰响应波形,提出一种复杂尖峰识别提取方法。此