基于多粒度的标签噪声检测方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:SongSan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域中,对数据进行准确分类是一个重要的步骤,类别分得越精准,得到的结果就越有价值。分类算法旨在从标签已知的样本中提取隐含知识,从而创建一个被称为分类器的模型,以预测标签未知样本的类别。分类准确率受到构建分类器的样本影响,然而,现实世界中的数据集普遍含有标签噪声,标签噪声会使分类器的泛化能力下降、增加分类器复杂度以及造成频率失真,因此要想达到良好的分类效果,需要对标签噪声进行处理。本文通过运用多粒度思想,提出了两种基于多粒度的标签噪声检测方法,并进行了实验以证明它们的有效性。最后将这两种方法集成到了基于多粒度的标签噪声检测系统之中。本文的具体工作总结如下:第一,受相对密度方法启发,提出了基于多粒度的相对密度噪声检测方法。首先定义了更简洁高效的质心相对密度方法,分别计算每个样本到其同类质心和异类质心的距离,即可求出质心相对密度值,优化了算法的运行时间。其次,利用聚类的粒化技术将粒计算引入到质心相对密度方法中,从整体上考察了样本是否为标签噪声。实验表明该方法可以有效检测小数据集中的标签噪声。第二,受随机空间划分启发,提出了基于多粒度的随机空间划分噪声检测方法。首先建立了节点带标签的完全随机树,并且在随机空间划分后的结果中,运用多粒度思想,将叶子节点与其父节点看作子粒度空间和父粒度空间,利用两个空间信息比较分析了样本所属类别,从整体上考察了样本是否为标签噪声。实验表明该方法可以有效检测标签噪声。第三,设计并实现了一个基于多粒度的标签噪声检测系统。系统界面简洁、操作简单,便于专业人员参考。
其他文献
随着我国高速铁路基础设施建设的不断完善,高速铁路总里程已达到2.9万公里,大中城市基本都连接高速铁路路网,高速铁路路网的逐步完善对民航的发展产生了很大的冲击,导致民航班次减少和客运量减少,民航运营商不断调整产品策略与高速铁路争夺客流量。由于高速铁路与民航的技术特性不同,导致在不同运距下旅客收益和客运量不同,在不同运距下高速铁路与民航会采取不同的产品策略来提高旅客收益和客运量,因此高速铁路在不同运距
MQTT通信协议广泛应用于物联网中,但是该协议并未采取任何措施来保证数据在传输及存储处理两方面的安全性,存在着巨大的数据安全风险。而随着用户量的不断增大,这个安全问题
极光是空间能量粒子与大气相互作用而产生的重要光辐射现象,是空间环境监测和空间天气预报中重要的参数,极光光谱涵盖了真空紫外、紫外、可见、近红外甚至更长的波段,但由于
传统的无线网络缺乏应对困难环境下的网络连接中断的处理方案,网络连接中断时,网络的性能会出现显著的下降。机会网络是一种不依赖源节点与目的节点之间的完整路径,通过节点
目的:通过检测不同证型湿疮病患者外周血EOS水平、血清IgE水平、病情严重程度,探究不同证型湿疮病及其严重程度与患者外周血EOS水平、血清IgE水平相关性。为兰州地区对不同辨证分型湿疮病患者提供更有针对性的生活指导,以预防该病发生,以及为外周血IgE、EOS在不同证型湿疮病检测中的评估作用提供一定理论依据及数据支持。方法:收集解放军联勤保障部队第九四〇医院及安宁分院、甘肃省肿瘤医院、甘肃省中医院、
中国传统木雕以工艺美术和民间美术介绍虽然早已有之,但学术界对于中国现当代雕塑中出现的美术院校中的木雕艺术创作少有关照。本文将研究范畴限定在现当代的国内美术院校的木雕艺术创作这一话题。对各个历史阶段雕塑家的造型语言、材料语言的推进做出梳理,以及形成这种语言特征的成因。探讨木雕艺术创作在美术院校中的传播与演变。论文首先针对传统木雕行业在近代由于社会结构的变革发生断层,西方美术学院以系统写实的教育体系引
目的:观察中药“脊髓康”能否更好的促进颈椎骨折术后患者的神经功能恢复,同时探讨“脊髓康”促进神经功用恢复的机制。方法:选取自2014年1月至2018年1月前来本院脊柱二区就诊的颈椎骨折合并神经损伤患者41例,随机分为观察组与对照组,每组21例,观察组予行颈椎前路内定术,术后予口服中药“脊髓康”,对照组予行颈椎前路内固定术,术后予口服甲钴胺片。其中观察组21例,对照组20例,术后随访3个月,按照Fr
射频集成电路(Analog integrated circuit,Analog-IC),是Analog-IC的重要分支,对射频电信号进行处理,并将其转化为电磁波进行发送,广泛应用于无线物联网,手机通信等领域。目
目的:探讨G蛋白信号调节蛋白2(G-protein-signaling modulator 2,GPSM2)在CD133~+胰腺癌干细胞亚群和CD133~-胰腺癌细胞亚群中的差异表达。研究GPSM2下调表达对CD133~+胰腺癌
1912年至1928年北洋政府统治时期,由于绥远政局动荡不安,都统更换频繁,军队呈现出旗属军队、驻防军队、客军复杂交叉并存的状态,导致土默特旗军费支出出现收支差距悬殊的情况。土默特历史档案中对军费相关问题的记载比较详细,本论文以土默特左旗档案馆北洋政府时期的40余件军费支出历史档案为史料基础,辅以《绥远通志稿》《土默特誌》等地方志书,对土默特地区驻军演变以及军队内部管理问题进行研究,并着重对土默特