【摘 要】
:
随着互联网技术的高速发展,图像数据在种类、数量等方面呈现爆炸性的增长趋势,大规模图像数据推动了深度学习技术在计算机视觉领域的发展。然而,在实际应用中由专家精确标注的数据成本高昂且难以获取,借助自动化工具标注以及“众包”标注的方式逐渐成为获取大规模图像标签的主流,这些低成本的标注方式会不可避免地产生错误标签即噪声标签。在图像分类领域,噪声标签会对分类器产生负面的影响,如降低分类器的预测性能,增加模型
论文部分内容阅读
随着互联网技术的高速发展,图像数据在种类、数量等方面呈现爆炸性的增长趋势,大规模图像数据推动了深度学习技术在计算机视觉领域的发展。然而,在实际应用中由专家精确标注的数据成本高昂且难以获取,借助自动化工具标注以及“众包”标注的方式逐渐成为获取大规模图像标签的主流,这些低成本的标注方式会不可避免地产生错误标签即噪声标签。在图像分类领域,噪声标签会对分类器产生负面的影响,如降低分类器的预测性能,增加模型的复杂度等。在大规模数据集中噪声标签问题的影响更为严重,研究表明深度神经网络对数据的过拟合倾向会使它们轻易地拟合噪声标签。针对这一问题,本论文旨在研究含有噪声标签图像的分类任务,主要的研究工作和研究成果概括如下:1.提出了一种基于自监督学习的噪声标签过滤算法,现有的图像分类任务中,采用样本选择算法对噪声数据进行处理是一种简单有效的方式。样本选择算法的主要目的是从数据中挑选小损失的样本作为干净样本指导模型进行分类任务的学习。但这种方法会将困难样本视为噪声样本,困难样本可以提升模型的分类性能及鲁棒性。针对目前样本选择算法中存在的问题,本文使用均值教师模型和自监督学习技术在模型判定为噪声的数据中挖掘潜在的困难样本,生成困难样本的伪标签并用其指导模型学习图像分类任务。实验表明,本文所提的基于自监督学习的噪声标签过滤算法能够有效地抵抗噪声标签数据的影响,挖掘潜在噪声中的困难样本能够进一步提升模型的分类性能,且模型的抗噪鲁棒性达到了其他先进噪声标签过滤算法的效果。2.提出了一种基于深度度量学习的噪声标签过滤算法,深度度量学习模型的目的是减小特征空间中同类样本的距离,增大异类样本的距离。本文提出了一种基于深度度量学习的噪声标签过滤算法,噪声标签数据是同一类别数据内部的异常点,通过同类数据特征之间的相似度可以进行噪声数据的判断。在基于记忆库的深度度量学习算法的基础上,提出了一种基于样本相似度的噪声标签样本选择方法,该方法通过计算样本与同类样本数据之间的相似度,判定样本是否为干净的数据样本,并从潜在的噪声标签数据中挖掘出模型不易区分的困难样本。通过构造干净样本和困难样本的正负样本对,并引入有监督对比损失来指导深度度量学习模型的训练。实验表明,本文所提的基于深度度量学习的噪声标签过滤算法能够有效地挑选干净样本,构造困难样本的正负样本对能够进一步提升模型的分类能力,模型的抗噪鲁棒性优于当前基于深度度量学习的噪声标签过滤算法。
其他文献
近年来,随着云计算等相关技术被工业界广泛使用,公有云上的数据安全问题成为了一大研究热点。用户的银行交易信息、收入情况、医疗记录等隐私信息在云服务器上有可能被窃取、利用。为了彻底解决云端数据库数据不可信问题,全密文数据库应运而生。在数据传送、查询并返回给客户端的全过程中,服务器无法解密密文,从而有效保证了数据安全性。纯软件密文数据库通常需要借助密码学的相关加密算法实现密文查询运算,如使用顺序可见加密
医学成像技术是将疑似病变部位与电磁场等介质相互作用,把疑似病变部位的组织形态以图像的形式展现出来的技术,医生能够根据医学图像直观地验证自己的判断,了解病变程度。磁共振成像凭借独到的优势在影像检查中的应用越来越广泛,高分辨率磁共振成像是医生进行准确诊断和后续疾病精准治疗的基础。然而,高质量的磁共振成像通常伴随着长时间的采集、患者的不适和资金的耗费等问题,因此,在不改变硬件配置或增加扫描时间的情况下,
随着5G技术(5th Generation Mobile Networks,5G)和物联网技术(Internet of Things,Io T)的飞速发展,通信-感知-计算融合技术已成为新一代通信系统发展的新愿景。随处部署的Wi-Fi设备可通过简单方式获取信道状态信息(Channel State Information,CSI),由于CSI可以细粒度地描述室内环境中电磁波的多径传播情况,目前其已被
拷贝数变异指由基因组发生重排而引起基因组大片段的拷贝数增加或减少。它是一种最常见的结构变异,是癌症的重要致病因素之一。拷贝数变异可通过单样本、多样本或配对样本进行检测。其中,配对样本检测可以直接聚焦于与癌症相关的体细胞拷贝数变异,对研究癌症的发生原因、发展机制及靶向药物治疗具有重大意义。第二代测序技术提供了大量的基因组数据信息,然而因其测序数据的读长较短、复杂度较高等特点也为相关研究带来了极大的挑
以Tor路由网络为代表的匿名系统在保护用户隐私的同时也逐步成为了一些网络空间中不法分子的藏匿场所和工作空间,给网络监管带来了很大压力。尤其在国内环境中因为防火长城的存在需要额外使用以SSR为代表的代理才能正常访问Tor匿名网络,这又进一步给Tor网络流量加了一层混淆外壳,使得对其检测与识别变得尤为困难。为了便于网络监管部门对国内Tor网络访问情况进行一定的监管和取证,需要行之有效的针对基于SSR的
作为一项计算机视觉领域在现实生活中的重要应用,行人重识别问题因为日益增长的智能监控领域的需要而得到越来越广泛的关注。当前,基于有监督学习的行人重识别任务已经能够取得超越人类的识别效果,但是仍然有以下两个严重的问题阻碍着这项技术的实际应用:首先是低光照场景下,仅基于可见光图像的训练不足以让模型得到可靠的结果,这大大限制了行人重识别技术的应用范围;其次是大规模的模型训练需要海量的数据和标注,这极大地增
超过三个目标的多目标优化问题(MOPs)称为超多目标优化问题(Ma OPs)。基于分解的MOEA(MOEA/D)将多目标问题通过预设的一组权重向量分解成一系列单目标子问题并同时优化,在求解具有规则帕累托前沿(PF)的MOPs问题时具有明显的优势,成为了解决MOPs的一种主流方法。然而,MOEA/D对于复杂前沿的Ma OPs,得到的解集分布极不均匀且距离真实的PF较远,导致其收敛性和多样性都较差。为
数学形态学作为一种高效的数字图像处理工具,在边缘检测、特征识别、分割、滤波等多个领域均有应用和发展。其核心思想是利用结构元素作为目标对象来提取和分析图像中的几何图形,以达到识别和简化图像数据的目的。然而,随着彩色图像处理需求的增加,传统彩色形态学忽略像素通道关联性和局部相关性,导致在形态运算中产生噪声、破坏图像拓补结构、处理效果受限于结构元素窗口尺寸等一系列问题逐渐显现。因此,本文利用矩阵关系和运
数字图像处理技术是指在计算机软件或各种硬件处理器平台上进行图像处理的技术。伴随信息时代的跨越式发展,数字图像处理技术及其相关应用深刻影响与变革着人们的生产生活方式,与此同时人们对数字图像处理系统高效性、实时性和高清性的需求也随之水涨船高,仅通过软件平台来实现图像处理算法已经很难满足现实需求,因此在硬件加速平台上设计实现相关图像处理技术成为了目前的研究热点。相比于传统的CPU处理数字图像,FPGA具
图像匹配目的在于处理不同视角或不同手段获取到的两幅甚至多幅图像,并从中识别出结构、纹理、特征等相似的部分,以便于后续对图像进一步处理。然而,受获取图像的设备、时间、角度等因素影响,获取到的图像的光照条件可能存在严重的不一致性,其中图像中欠曝或过曝区域会丢失大量的纹理、结构、和像素值变化信息,导致在这种情况下很难提取到三维空间中属于相同位置的大量特征以确保匹配精度。本文研究了复杂光照条件下如何提升基