基于自学习机制的弱监督目标检测算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:qiaoweizhuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的发展和大规模目标检测数据集的出现,目标检测算法在性能上取得了显著的进步。然而,在大规模数据集上进行精确标注是一项经济成本和时间成本都很高的工作,每个不同的应用场景都需要标注特定的数据集,这导致了不同应用场景下的目标检测算法之间存在着较高的数据壁垒,繁重的数据标注工作已经逐渐成为了目标检测技术进一步发展的瓶颈。因此,对数据标注依赖更小的弱监督目标检测算法成为了学术界的一个重点研究方向。但是,弱监督目标检测算法目前依旧面临许多困难和挑战,如监督信息不完全的跨数据集目标检测算法的性能受伪标签质量的约束,监督信息不确切的弱监督目标检测算法因训练过程没有目标的位置和数量信息,导致算法定位能力差、易收敛到图片中的显著物体等问题。本文针对上述问题,从提升自学习过程中的监督质量和增加自学习过程中的监督途径两方面出发对弱监督目标检测算法展开深入研究:针对跨数据集目标检测算法的性能受到训练过程中产生的伪标签质量约束的问题,本文提出一种基于动态监督框架的跨数据集目标检测算法。该算法基于不同训练方式得到的检测模型所拥有的不同特性,针对性地提升自学习过程中产生的伪标签的召回率和准确率。通过实验分析验证,经过多次对伪标签的针对性优化,其质量能得到全面提升,进而提升了跨数据集目标检测算法的性能。针对监督信息不确切的弱监督目标检测算法定位效果差的问题,本文提出一种基于空间似然投票的弱监督目标检测算法。该算法结合所有目标候选区域的分类得分信息和空间位置信息,在每次训练迭代过程中在线计算产生空间似然图,空间似然图反映了各类别物体出现在每个位置的概率。通过在空间似然图中挖掘物体位置信息用于候选区域重分类和重定位的训练,提升弱监督目标检测算法的检测性能。针对监督信息不确切的弱监督目标检测算法易收敛到图片中的显著物体和显著区域的问题,本文提出一种基于自适应搜索与自知识蒸馏的弱监督目标检测算法。自适应搜索算法根据空间似然图的统计信息和似然值分布特征自适应地在图片中搜索潜在物体,产生更加全面和准确的监督信息指导检测算法的分类和回归训练。自知识蒸馏模块则在特征优化层面利用算法自身产生的空间似然图作为反馈信息指导算法的特征提取过程,鼓励该算法提取更多的物体上下文信息,而非着眼于物体的显著区域。该算法在PASCAL VOC 2007、PASCAL VOC2012以及MS-COCO数据集上的准确率均值分别达到57.2%,54.0%和27.3%。
其他文献
缺血性中风引起的上肢运动功能障碍严重影响患者生活质量,目前常用的临床康复手段,如机械辅助康复、经颅神经调控等,对中风后运动康复的效果不甚理想。运动神经假体技术作为一种新兴的康复手段已经被证明,不仅可以有效改善由脊髓损伤或脑损伤引起的上下肢运动功能障碍,而且可以影响神经可塑性,但该技术在中风康复的研究尚处起步阶段。当前神经假体技术在中风康复应用中面临几个主要问题:如何选择合适的刺激反馈位点及刺激模式
学位
放射治疗是癌症的主要治疗方式之一,覆盖约70%的癌症患者,其局部性治疗方式与医学影像密切相关。当前医学影像被用于实现放疗图像引导以及制定放疗计划和评估放疗疗效。改进放疗图像引导精度和放疗疗效评估方法是精准放疗发展的重要方向。锥束CT是最常用的放疗图像引导方式之一,但其扫描时间长,易受呼吸运动影响,难以实现动态引导。传统四维锥束CT成像技术受制于现有成像算法和硬件,在临床上难以进一步推广。当前放疗中
学位
经颅电刺激是无创调控大脑的一种重要手段,对于认识脑、保护脑有重要的科学意义和临床应用价值。已有研究表明,经颅电刺激在人脑中产生的电场分布是影响其调控效果的重要因素,但由于难以获取经颅电刺激的在体实测数据,不同干预参数下经颅电刺激在脑内产生的电场分布特性依旧不清楚,其生物物理学特性还有待研究。目前不同刺激参数下脑内的电场分布主要通过电场仿真模型来预测,但模型的预测性能并未得到充分评估与验证,此外,如
学位
深部脑刺激(deep brain stimulation,DBS)已经在神经性运动障碍如帕金森病中取得良好疗效,并在其他脑神经系统疾病的治疗中展现光明前景。DBS通常采用高频脉冲刺激(high frequency stimulation,HFS),刺激模式较为单一,其时间模式和刺激波形具有很大的设计空间,亟待进一步开发以提高DBS疗效并拓展其应用。而且,HFS的作用机制仍不明确,限制了DBS快速发
学位
哺乳动物具有灵敏的味觉感受系统,能够特异性识别和检测各种味觉物质。味觉受体作为味觉感受器通常在口腔的味蕾中表达,因此能够识别酸、甜、苦、咸和鲜等五种味道。近年来,味觉受体在非味觉组织中的分布和生理功能研究取得了重大进展,在呼吸道、消化道、心脏、大脑等组织都有表达,其作用也不仅仅局限于感知味道,研究显示味觉受体可能成为疾病治疗的新靶点。本论文将表达味觉受体的组织或细胞作为敏感元件,利用微纳传感器作为
学位
人体生物电信号(心电、脑电、眼电等)的采集广泛应用于医院监测、家庭监护等过程中,为评价心脏、脑、睡眠等功能提供重要依据。生物电信号通常采用一次性湿电极采集,然而一次性湿电极存在皮肤过敏、粘贴不方便、不可重复使用、耗材消耗量大、连续使用时间有限等缺点,航天等特因环境下需要重复使用、低侵扰的电极。近年来,各种织物干电极被用来实现穿戴式心电检测,使用该类电极时不需要涂抹导电膏,体验舒适、可穿戴,可洗、可
学位
在临床上,预后通常指基于患者本身的临床或非临床特征对其在未来某段时间内某结局发生的概率进行估算。准确的预后可以帮助医生了解患者的病情发展趋势和后果,辅助医生做出更好的决策,具有重要意义。预后研究包含四个主题:总体预后研究、预后因素研究、预后模型研究和干预效果研究。近年来,电子病历数据的大量积累和机器学习的快速发展为预后研究带来了新的方法,尤其是对于预后模型和干预效果研究。本论文主要对基于电子病历的
学位
语言理解是高度复杂的信息加工问题,涉及对语言物理载体的感知、词汇加工以及句法、语义加工等多个加工阶段;本论文聚焦于语言理解的感知编码阶段。语言的感知编码机制与语言物理载体的性质密切相关:语音感知需要大脑实时编码转瞬即逝的语音听觉特征;而阅读过程中大脑可以通过调节眼动,较为灵活地分配注视时间和顺序。本论文在高生态效度的语篇理解场景下,分别利用脑电和眼动实验研究语音感知和阅读过程,构建了能够解释语音脑
学位
全球气温持续升高引起极端气候事件频发,影响着人类活动以及各个产业的发展。我国包含四个干湿区,降水等值线很好的区分了不同区域的气候特征。为了更准确的应对未来不同区域可能的极端气候事件,了解不同降水量等值线上过去的气候变化特征、驱动机制以及预测未来气候变化变得十分重要。树轮宽度为历史气候变化研究以及气候重建中应用最为广泛的指标之一,树轮密度则可以弥补树轮宽度指标对古气候重建的一些不足,更全面的指示过去
学位
全球不同地质载体如黄土、石笋、冰芯、湖泊和深海沉积等,揭示更新世气候呈显著的轨道-亚轨道尺度波动,但变化的周期和幅度却有较大差异,其原因有待深入研究。位于亚洲季风区关键地带的渭河盆地堆积了深厚的新生代河湖相沉积,是研究轨道-亚轨道尺度气候变化的良好载体。本文以盆地内西安凹陷户县正庄村获取的风尘-湖相沉积岩心为研究对象,开展粒度和磁化率分析,结合岩性和测井参数变化,重建了渭河盆地1.8 Ma以来的气
学位