带噪声标签图像分类问题研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:raincy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习与计算机视觉技术的发展,图像分类已经在生产生活中得到了广泛的应用。近些年,如垃圾分类、商品识别、人脸支付等AI应用给人们的生活带来了极大的便捷,这些应用的发展得益于海量带标签的图像数据集。然而,数据集标签的质量直接影响了模型的泛化性能和分类精度。因此如何利用这些带有错误标签的图像数据集,设计鲁棒性强、精度高的模型就显得尤为重要。关于带噪声标签图像分类问题,本论文主要研究工作分为以下三点:(一)设计一种基于噪声检测的带噪声标签图像分类方法。该方法将噪声检测方法与鲁棒损失函数方法进行结合,通过修改噪声检测框架的部分损失函数来减少噪声检测算法“漏检误检”对实验的影响。同时通过实验,进一步说明了噪声率越低,分类效果越好的结论是狭隘的,分类精度受到噪声率以及噪声分布的共同影响。(二)设计一种基于协同学习的带噪声标签图像分类方法。该方法利用两个网络共同学习,通过利用带噪声标签图像在训练过程中先记忆干净数据再记忆噪声数据的特点,来进行样本选择。同时将被选择的样本交给对等网络,该网络利用鲁棒损失函数或标签平滑正则化计算损失,最后输出数据接收方的网络模型。(三)我们在三个具有代表性的图像分类数据集MNIST、CIFAR-10、CIFAR-100上测试本文提出的两个方法。实验结果表明,本文所提的将鲁棒损失函数与噪声检测结合的方法在解决带噪声标签图像分类问题上优于其他方法,其中在数据集为CIFAR-100,噪声率为60%,噪声类型为均匀噪声的条件下,在测试集上本文方法比直接使用鲁棒损失函数的方法分类精度提升9.32%,比直接使用噪声检测的方法分类精度提升3.17%。本文所提基于协同学习的方法,相比于各类常用的鲁棒损失函数方法而言,一方面提升了分类精度,另一方面也降低了模型过拟合的程度,其中在数据集为CIFAR-10,噪声率为45%,噪声类型为非均匀噪声的条件下,本文方法相比于最先进的鲁棒损失函数而言提升了5.41%。同时在MNIST与CIFAR-10的均匀噪声上,优于当前先进的Co-teaching协同学习方法。
其他文献
当运动电荷掠过周期结构的表面,会在结构表面感应出表面电流,产生向外辐射的散射波,这一现象被称为Smith-Purcell辐射。近几年,超表面由于其亚波长周期,厚度远小于波长等特性,通过合理的设计超表面的单元结构图形,将超表面与SmithPurcell辐射相结合,能够对辐射波的幅值、相位、极化方式等进行调控。本论文主要解决了电子束速度改变的情况下,辐射波方向和频率随着电子束速度的改变而任意变化问题,
学位
形式化方法是一种严格建立在数学基础上,对计算机软、硬系统进行规约、建模、验证和分析的方法。作为形式化方法的主要内容之一,形式规约可以对系统和其满足的属性进行规约。安全性和活性作为一类系统需要满足的基础属性,是确保系统安全性与可靠性的重要因素。随着软、硬件系统的日益庞大,许多量化的行为特征在开发时设计在系统中,所以仅用定性技术不足以对系统的行为进行精确的评估。将经典的形式规约与模糊逻辑相结合可以有效
学位
近年来移动通信经历了五代的发展,从其发展的历程不难发现,移动通信朝着高频段和大带宽趋势发展,此外,用户对多业务的需求迫使通信标准也在持续增加。在5G这个万物互联的新时代中,射频前端作为与外界通信的重要枢纽,在通信系统中起到重要作用。与传统由多链路组成的兼容多通信标准的射频前端电路相比,能兼容多通信标准的宽带射频前端电路,在小型化和低成本方面具有明显的优势。因此,研究兼容多通信标准的宽带射频前端电路
学位
哈希算法将任意输入长度的消息,经过多轮变换得到一个固定长度的消息摘要值,其在数字签名、数据完整性检验,冗余校验等多方面均有着重要的应用。为了更好地抵抗量子计算攻击,基于大尺寸输入置换的哈希算法应运而生。这些大置换部件通常采用多个非线性密码S盒来构建,因此这些密码S盒的代数性质与哈希算法的安全性息息相关。如何快速评估输入尺寸为16比特及以上的大尺寸密码S盒的代数性质是目前的研究难点之一。进一步地,如
学位
表面等离激元(SPPs)将光波束缚在比其波长小得多的区域,可以突破衍射极限,具有独特的表面局域和近场增强特性,为大规模微结构器件设计提供了一条途径,已成为现代纳米光电领域研究的热点。在众多新颖SPPs现象中,基于等离子体纳米结构的Fano共振凭借其尖锐的非对称光谱线型和对环境介质的高度敏感特性,在纳米光学元件和生物化学传感器等方面的应用具有优势。随着微纳米加工技术的发展,传感器正朝着高灵敏度、检测
学位
哈希学习(又称二进制码编码学习)将高维数据点编码为二进制码,从而有效地利用汉明空间逼近原始的高维度量空间,实现大规模多媒体数据快速检索。实际应用中,通常要求搜索引擎对在线图像流数据进行索引,在线哈希算法应运而生。因此,研究对在线流数据进行哈希编码的在线哈希算法,提高图像检索模型的学习效率和准确率,具有十分重要的科研和工程意义。但到目前为止,在线哈希仍然是一个开放的问题,主要挑战在于很难在模型准确率
学位
与国外公募REITs侧重投资市场化的商业地产相比,我国首批公募REITs主要投向地产属性相对较弱、运营稳定、风险较小的领域,有力助推了基础设施的发展。国企可借助公募REITs盘活优质资产、降低资产负债率、提升运营能力;投资者可在做好相关风险分析的前提下,通过公募REITs实现分散化、稳健化的资产配置。为促进REITs市场更好地发展,未来应在深化公募REITs注册制、增强市场流动性和提高税收优惠方面
期刊
近年来,随着网络的快速发展,互联网上的视频数据越来越多,视频检索算法也遇到了许多新的问题。为了能够高效准确地检索出目标视频,视频哈希算法受到了广泛的关注。然而,大多数现有的监督视频哈希算法基于成对相似性或三元关系设计哈希函数,并专注于局部信息,这导致算法的学习效率较低。本文算法从全局角度出发,使得相似的视频收敛到相同的哈希码,不相似的视频则映射到不同的二值码,以此生成更具判别性的哈希码。本文的主要
学位
图像描述是一项将图像与文本相结合的任务,主要目的是利用计算机自动生成图像对应的描述性语句。在视力缺陷人群辅助系统、信息检索和智能交通等领域有广泛的应用。目前较为成熟的图像描述模型都是采用有监督的方法,这种方法受限于高昂的人工成本,无监督方法的兴起为图像描述提供了一种新的思路。本文借鉴无监督方法的思想,融合深度学习相关技术对图像描述任务进行研究,主要工作如下:第一,提出基于生成对抗方法的快速无监督图
学位
基于Web of Science和中国知网数据库,运用CiteSpace知识图谱可视化方法,分析国内外生态风险评价的研究进展。结果表明:(1)1990—2020年国内外生态风险评价研究文献数量均快速增长,其中国内文献数量增长更快;(2)国内外文献作者及研究机构之间基本形成合作网络体系,中国科学院的发文量在国际位于领先地位;(3)关键词和关键词聚类可视化分析表明生态风险评价研究长期聚焦在水环境、重金
期刊