【摘 要】
:
近年来,监督学习在各个领域都得到了广泛的应用,但此类算法需要大量具有高质量标签的训练样本组成的大规模训练数据集,且其效果严重依赖于样本的标签质量,然而创建这些具有高质量标签的大规模数据集往往既昂贵又耗时。为节省人力物力,提出了使用网络爬虫、众包等方法来完成对数据的收集工作。但是,这些方法获取的数据往往存在大量的标签噪声,而标签噪声会对网络的训练带来很多负面的影响。因此,对标签噪声处理方法的研究,有
论文部分内容阅读
近年来,监督学习在各个领域都得到了广泛的应用,但此类算法需要大量具有高质量标签的训练样本组成的大规模训练数据集,且其效果严重依赖于样本的标签质量,然而创建这些具有高质量标签的大规模数据集往往既昂贵又耗时。为节省人力物力,提出了使用网络爬虫、众包等方法来完成对数据的收集工作。但是,这些方法获取的数据往往存在大量的标签噪声,而标签噪声会对网络的训练带来很多负面的影响。因此,对标签噪声处理方法的研究,有助于推广机器学习工程应用和降低机器学习的成本。本文重点研究了对含有标签噪声的图像的分类,主要研究内容如下:(1)研究了基于课程学习的不准确监督学习方法。首先研究了使用k NN算法将含噪声标签的数据集中的样本按照具有准确标签的概率进行排序的方法,提出了基于k NN算法的课程学习方法,然后对K-means聚类算法中初始化中心点的选取方法进行改进,研究了基于改进K-means聚类算法的课程学习方法。(2)研究了基于网络参数和样本标签联合优化的不准确监督学习方法。首先提出了网络参数和样本标签的联合优化,然后研究了网络参数和硬标签的联合优化以及网络参数和软标签的联合优化两种方法的主要步骤和损失函数的设置。(3)在新生儿疼痛表情数据库和CIFAR-10数据集上分别对基于课程学习的不准确监督学习方法和基于网络参数和样本标签联合优化的不准确监督学习方法进行评估。实验结果表明,在新生儿疼痛表情数据集上,基于k NN算法的课程学习方法取得了78.5%的测试准确率。在CIFAR-10数据集上,通过添加随机标签噪声和类相关标签噪声进行实验,网络参数和软标签的联合优化方法在各个噪声标签率下均取得了最好的测试准确率。
其他文献
本文以沉积岩石学、层序地层学为指导,结合前人的地质认识及研究成果,综合运用岩心资料、测井资料、薄片资料和其他地质资料对银额盆地石炭-二叠系层序地层和沉积相发育特征
1考察情况介绍1.1英国羊业的概况英国的大部分羔羊肉产自于英格兰,是世界上第五大羊肉生产国和第三大羊肉出口国。在英国国土面积上有53%的面积是用于养羊的草场资源,由于气
党的十九大报告明确指出,创新是引领发展的第一动力,是建设现代化经济体系的战略支撑。近年来,城市之间的竞争逐渐向群体演化,创新要素高度集中的城市群不单是国家参与国际经
本文将英买2井区断裂体系与整个塔北地区统一起来,根据区域构造特征分析对断裂体系进行重新梳理和解释,对新解释断裂进行断裂平剖特征分析,对研究区断裂特征进行精细描述,同
海洋面积广阔、资源丰富,是未来开发的热点。十八大明确提出了“建设海洋强国,大力加强海军建设”的目标。十九大则进一步要求落实海洋战略,同时论述了现代海洋开发体系构建方案。随着海洋经济开发与“深蓝”计划的不断推进,长时间远海作业已成常态,舰队或远洋平台在远离岸基面临的一个最关键的问题便是物资的补充。针对两船并靠补充物资,吊放集装箱时容易发生碰撞这一问题,本文提出了利用多组双目相机结合人工标志点进行集装
新疆焉耆盆地博斯腾湖周缘主要发育河流、三角洲、冲积扇、扇三角洲、滩坝、风成沙丘及湖泊等多种现代沉积相类型。对其开展现代沉积的研究工作,可以揭示小型山间盆地内单物
2015年中国证券市场发生罕见的“股灾”,从2015年6月15日到9月15日,跌幅超过50%的股票超过1500只,投资者损失惨重,大批的投资者由于杠杆过高导致被强制平仓,同样剧烈的股票市场波动在国外发达市场也屡见不鲜。由此,引发了笔者对A股股票价格波动率的影响因素的关注。这一研究有利于回答我国目前资本市场暴涨暴跌的原因,对我国股票市场制度建设有一定的意义,为监管部门和政策制定者提供建设性意见。根据
对信用风险进行管理是目前信用消费的一个重要课题,信用风险模型则是一个管理信用风险的重要工具。而之前对信用评分模型的研究大多集中在对信用评分指标体系以及信用评分模型上,较少有人关注信用评分的样本集对模型表现的影响,但用于建立模型的样本集是信用评分模型的基础,所以样本集对于模型的准确性也是至关重要的。本文将重点放在信用评分的样本集上,讨论在信用评分中样本数据集的特征,并分析在此类样本集上建立的模型可能
我国证券市场在发展过程中一直伴随着较为严重的股价“同涨同跌”现象,根据国外成熟资本市场经验,完备的卖空机制有助于改善股价中的企业特质信息含量,降低股价同步性。2010年,融资融券制度被正式引入我国证券市场,旨在通过“融券通道”打破我国证券市场长期以来的“单边市”格局,以及通过“融资通道”活跃市场交易,促进多空双方信息在股价中的充分融合,提高股价信息含量以及市场定价效率。但与此同时,自两融业务试点以
随着科技的进步,涌现出了越来越多的复杂系统,产生的相关数据呈直线增长,这些数据对复杂网络的研究也起到了推动作用。链路预测是复杂网络的一个重要研究方向,主要解决的是如何通过已知的数据及其之间的相互作用关系,预测那些已经存在但尚未被观测到的数据、未来可能出现的数据和一些虚假的数据。随着链路预测的研究成果广泛应用于各个领域,如何提高链路预测精度成为了首要问题。本文将以网络中节点之间的相似性为重点,主要研