【摘 要】
:
图像是人类获取信息的重要途径,基于深度神经网络的自动化图像理解算法取得了飞速发展,并且在智能监控、自动驾驶、智慧医疗等领域发挥了重要作用。然而基于深度学习的图像模型通常需要大量、高质量的标注数据进行强监督训练,这在实际场景中难以满足。在数量的角度上,在某些领域收集以及标注大量数据成本较高,比如珍稀动植物数据的收集、医疗图像数据的标注等。在质量的角度上,标注数据的分布不均、标注错误已经训练和测试场景
论文部分内容阅读
图像是人类获取信息的重要途径,基于深度神经网络的自动化图像理解算法取得了飞速发展,并且在智能监控、自动驾驶、智慧医疗等领域发挥了重要作用。然而基于深度学习的图像模型通常需要大量、高质量的标注数据进行强监督训练,这在实际场景中难以满足。在数量的角度上,在某些领域收集以及标注大量数据成本较高,比如珍稀动植物数据的收集、医疗图像数据的标注等。在质量的角度上,标注数据的分布不均、标注错误已经训练和测试场景不一致导致的数据域差异都会影响模型的优化。典型的有监督图像理解模型在面对数据受限场景时会出现收敛速度慢且精度不佳、训练机制不匹配、泛化能力差等问题。提高图像理解模型在数据受限时的性能是学术界和工业界共同关注的问题。针对该问题,本文立足数据受限的场景,从减少对高质量标注数据的依赖出发,结合数据分布不均、数据量少、当前任务没有标注数据和没有任何标注数据等场景,探讨低标注模式下的图像理解方法研究。本文主要包含的研究内容和创新点包括:1.针对标注数据分布不均的场景,本文提出了一个通用的基于训练数据和当前任务的样本加权范式:样本的训练权重是由其分类和定位的不确定性决定的。本文提出的方法自动从分类和定位任务中学习样本权重,因此减少了手工设计加权规则的代价。本文提出的方法可以应用到任意基于区域的目标检测模型上,具有良好的扩展能力。本文提出的方法在两个目标检测数据集上取得了显著的准确率提升,并且没有增加推理的时间成本。2.针对标注数据较少的场景,本文提出一种基于融合上下文信息的图像识别算法。该算法主要创新点是在目前通用的卷积神经网络中引入记忆模块,并提出通过预测卷积神经网络参数的方式融合上下文信息。记忆模块用于融合整个训练集的信息,并保持类间的差异性和同类样本内的多样性。记忆模块中的信息用于增强训练集中每个样本的特征,从而得到更具有区分力的特征。此外本文提出了动态类别数和样本数的训练策略,在两个小样本图像识别评测基准上相比基准模型有明显的准确率提升,并且取得了更好的泛化性。3.针对当前任务没有任何标注数据的场景,本文提出一种基于平均教师模型的跨域学习算法。针对目标检测任务中图像的复杂性和样本的多样性,本文提出了再区域级别约束教师模型和学生模型输出结果的一致性。同时在对图内的检测目标进行关系建模的基础上,提出了关系图间一致性约束和关系图内一致性约束实现多层次的一致性约束。在不同天气状况下和虚拟图像到真实图像的域迁移任务上取得了更高的模型准确率。4.针对没有标注数据的场景,本文提出一种基于联合对比学习的新范式用于从无标注图像中学习特征表达。本文提出的方法通过最小化正样本对之间的距离并且最大化负样本对之间的距离优化网络参数。为了将多个正样本对之间的关系引入模型优化中,本文提出同时优化多个正样本对之间的距离,并进一步得到优化无穷多个正样本对的损失函数。在包括图像分类、检测、分割、关键点识别等任务上,本文提出的方法取得了明显准确率提升,并且接近全监督场景下的准确率。整体而言,本文的从标注数据量逐渐减小的角度展开。本文从标注数据量充足但存在分布不均等质量问题的场景出发,进一步研究当前任务训练数据较少、当前任务没有训练数据和没有任何训练数据的场景。从研究方法的角度出发,本文针对数据分布不均和数据较少的场景,采用挖掘样本间关系,提高有效样本的相对权重以及增强图像特征表达的方向展开研究。针对没有当前任务数据和没有任何标注数据的场景,本文从提高模型对输入扰动的鲁棒性出发,提高模型在不同数据域以及不同任务上的泛化能力。
其他文献
TiAl合金具有低的密度、高的弹性模量和优异的高温性能,是一类在航空、航天领域具有应用前景的轻型高温结构材料。然而,TiAl合金在800℃以上生成的是TiO2和A12O3的混合氧化膜。该混合氧化膜疏松多孔且极易发生剥落,无法阻挡氧的侵蚀。因此,TiAl合金在高温环境下应用时需施加防护涂层提高其抗氧化性能。扩散Al涂层在高温下表面生成以Al2O3为主的氧化膜,可以阻挡氧的进一步侵蚀,在一定程度上提高
589nm超窄带钠荧光激光雷达系统能够高精度探测中间层顶区域(80-105km)的钠原子数密度,大气温度和风场,对于研究该区域大气动力学具有重要的价值。但是,目前常见的染料脉冲式窄带钠测温测风激光雷达系统,由于其体积和功耗较大,操作复杂且不稳定,因此仅适合在实验室条件下部署。尽管最新的全固态超窄带脉冲钠激光雷达解决了系统全固态和运行稳定性的问题,但是由于其系统复杂且功耗大,很难在短期内实现小型化。
稀土元素的能级结构及成键能力对开发稀土功能材料在光、电、磁等领域的应用具有重要作用。由于其独特的配位作用,稀土元素可与多种生物分子实现配位,例如羟基酸、氨基酸、多肽、蛋白质以及DNA等,形成具有特定功能的高性能稀土生物杂化材料。其中,小分子手性Ω-羟基酸在化学合成领域获得广泛关注。然而,由于α-羟基酸存在多种手性结构,在材料合成中展现出结构引导的化学活性差异性。因此,对α-羟基酸的手性进行高效的识
火箭发动机的喷管是极其关键的部件,选择何种材料制备喷管将直接关系到发动机的使用性能。随着国内外航天技术的迅猛发展,迫切需要开发能在极端恶劣环境下工作的超高温材料。Cf/SiC复合材料和Pt基超高温合金是制备喷管的两种重要候选材料。一方面,Cf/SiC复合材料以其密度低、比强度高和耐高温等优异性能成为候选材料之一,但由于Cf/SiC复合材料的本征脆性及加工制造复杂大尺寸结构件较为困难,其作为喷管材料
液滴的蒸发是科学研究和工业应用中常见的现象,被广泛的应用于喷墨打印、喷雾冷却、材料制备、疾病检测等领域,目前广泛流行的新型冠状病毒的传播,也取决于液滴的蒸发过程。液滴的蒸发是典型的多物理场耦合的过程,目前的研究主要集中于少数参数对于液滴蒸发过程的影响规律,且研究结果并不统一,特别是基板上固着液滴的蒸发规律。因此,本论文以不同性质基板上的液滴蒸发为研究对象,利用理论分析方法,建立液滴蒸发过程中多物理
钙钛矿太阳能电池(PSCs)自2009年被报道以来,在近十几年间经历了迅猛的发展,实验室报道的单结电池的能量转换效率(PCE)由最初的3.9%发展到如今经过认证的25.7%。其中,反式钙钛矿太阳能电池由于其能量转换效率高、可忽略的滞后效应和制备成本低等优势获得了广泛的关注。然而,反式钙钛矿太阳能电池器件中不同界面间的电荷传输势垒和晶界处的缺陷等仍然是阻碍其性能提升的主要因素。目前提高器件性能的主要
在过去的十几年里,拓扑态和拓扑材料的发现,重塑了人们对物理和材料的理解。第一性原理计算通过对拓扑材料真实体系的预言,在连接拓扑物理学理论和实验研究方面发挥了重要作用。在拓扑材料中,受到全局对称性保护的拓扑表面态或者边缘态具有零质量、高迁移率、缺陷容限以及近乎无耗散等输运特性。因此,人们对拓扑材料功能性的应用探索方面越来越感兴趣,包括可用于容错拓扑量子计算的拓扑超导体的实现、自旋电子学中新一代的技术
由于空间条件的限制,埋地管道与高压输电线路或电气化铁路在许多地方并行或交叉铺设,使得埋地管道受到交流电(Alternating Current,AC)干扰的风险日益增大。AC腐蚀、微生物腐蚀和应力腐蚀已成为埋地管道腐蚀失效的重要形式,并引起各国研究者的广泛研究。然而,在研究过程中常常会忽略多因素之间的相互作用,针对交流电和微生物共同作用下埋地管线钢应力腐蚀行为的研究少有报道。本文通过建立AC腐蚀模
高温超导体在超导态时具有零电阻性,且超导体陶瓷材料具有低导热系数。聚变堆超导磁体采用高温超导电流引线进行电力传输将显著降低其低温系统的热负荷,降低装置运行费用。中国聚变工程试验堆(CFETR)装置的100kA高温超导电流引线是目前世界上最大载流的高温超导电流引线,具有高载流、低漏热、长失冷安全时间等特性。本文介绍CFETR高温超导电流引线的优化设计与研究,主要内容包括:(1)调研国内外万安级大载流
论文评价一直是科学计量学领域的一个重要研究内容。近年来学术论文一直以惊人的数量增长,如何有效的评估学术论文成为一个关键问题。学术评价往往在评价科研绩效以及分配学术资源等方面具有重大意义。通过更加细致和全面的评价指标,有利于提高我国科研人员的学术实力,为一些重大科研工作推荐优秀人才。目前比较受关注的评价指标,如同行评议、影响因子和引用计数等存在许多局限性,忽视了对论文本身的关注。引用计数并不能全面而