基于标签空间相关性的改进分类器链算法

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:shibalian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
区别于传统单标签学习问题,多标签学习中每个样本可同时与多个标签相关联。在多标签分类过程中,合理使用标签空间相关性可显著提升多标签分类精度。其中链式多标签算法作为一类高阶关联性算法,具备结构简单,基分类器选择灵活,有效利用标签关联性等优点,另一方面其仍存在初始标签链序列随机性较大,分类效果不稳定,无法有效应对大规模多标签数据集等缺陷。基于此,本文提出了一种基于标签空间相关性的改进分类器链算法,用于处理大规模多标签学习的特征选择和标签链序列优化。同时,结合标签空间降维与改进多标签分类器链算法的优势,本文提出了一种基于LSCC的标签空间降维算法。本文主要研究内容如下:1.链式多标签学习算法假设位于位置k的标签只和前k-1个标签相关联,实际上随机初始化的标签链一般不满足该假设。基于此,提出一种基于标签空间相关性的改进分类器链算法。首先,自定义距离公式,通过聚类完成标签空间划分;随后,将链式多标签算法的核心假设转化为标签与标签簇中心点距离的远近,从而得到每个局部标签链的近似最优顺序。在5个不同领域下的12个多标签数据集和3种不同类型基分类器设定下的实验表明,相较于现有算法LSCC在分类精度和计算复杂度这两大指标上均有较优的表现。2.为了进一步提高链式多标签算法对大规模多标签数据集的适应能力,在基于聚类的标签空间划分基础上,本文提出一种基于局部标签类簇互信息的特征选择。利用单个特征与局部类簇所有标签的关联性之和来刻画特征重要性,并针对每个标签簇选取top-k个特征作为其差异性局部特征子群。其有效降低了算法时间复杂度并在一定程度上避免了无关特征干扰。3.提出了一种基于LSCC的标签空间降维算法,其分别从标签编码,模型训练,隐标签解码三个部分优化了标签空间降维算法的流程。其有效减少了多标签分类任务耗时,提升了改进分类器链算法对大规模多标签数据集的适应能力,在确保分类精度的前提下,极大的提升了算法的运行效率。同时,本文基于Spark并行计算框架实现了该算法,其充分利用了内存计算的优势,具有较大的现实意义。
其他文献
六硝基六氮杂异伍兹烷(HNIW,CL-20)是当今世界综合性能最好的单质炸药,在推进剂、混合炸药、发射药等领域有广阔的应用前景。CL-20传统合成工艺需要将HBIW进行两次氢解制得最佳硝化前体TAIW,两次氢解均需用到昂贵的钯催化剂,成本高且反应路线长,探索非苄基取代的六氮杂异伍兹烷的合成及经济廉价的CL-20合成新工艺具有重要意义。本文基于新法搭笼路线,分别以1-萘甲胺、2-萘甲胺、2-呋喃甲胺
随着信息技术的快速发展,社会生产中产生的数据呈爆炸式增长,如何从这些海量的数据中智能高效地进行知识发现已经成为人工智能领域中的研究热点。如何处理不确定信息并从中挖掘出有价值的知识,是知识发现中面临的一个关键问题。粗糙集理论作为处理不确定性问题的一种有效的数学工具,由于在处理不确定性问题时无需提供除数据本身以外的任何先验知识,近年来已经成为了处理不确定信息的重要方法。粗糙集模型的上、下近似集在描述不
随着经济的快速发展,网络正在我们生活中扮演着重要的角色,与我们的生活息息相关,给我们的生活带来了极大的便利。但与此同时,网络规模的不断增大,网络所面临的威胁也逐年增
选择性激光熔化(Selective Laser Melting,SLM)是近年迅速发展起来的一种增材制造技术,它能够直接成形具有复杂结构且致密度超过99%的金属工件,具有广泛的应用前景。在SLM加
大部分数鱼类是变温动物,寒冷压力对于鱼类的生长以及生殖等重要过程都具有重大的影响,鱼类冷适应机制一直以来都是研究的热点。环境温度变化具有即时性的特点,传统遗传学无法很好地解释短时间内产生的冷适应性状,这就需要通过表观遗传学进行分析研究。鱼类作为真核生物,其细胞核内的染色质高级结构具有复杂且高度动态化的特点。根据环境压力变化,在较短的时间内调控基因的表达,产生有利的性状,能够帮助生物快速适应环境,获
基于稀疏SLAM(Simultaneous Localization And Mapping)框架的三维信息估计技术,在三维重建,路径规划、增强/虚拟现实等领域都具有重要的研究意义与应用价值。然而,目前系统
本文通过在火花塞顶置式定容燃烧弹中添加扰流装置,实现了加速氢-空预混火焰燃烧进程,同时研究了扰流装置的结构参数和初始条件对氢气-空气预混燃烧特性的影响规律。首先,分
随着“工业4.0”、“互联网+”和“大数据”的迅速发展,网络信息呈爆炸式增长,如何从浩如烟海的互联网数据中抽取有价值的信息是当前研究的热点。信息抽取的主要目的是从海量
在智能化时代,计算机视觉技术解决了机器“看”世界的问题,作为计算机与世界沟通的桥梁,目标跟踪技术是搭建该桥梁的核心技术之一。当前,目标跟踪技术在视觉导航系统、智能视
本文研究了美国篮球联盟(NBA)中代理理论的动态性,并发现团队经理将报酬作为工具来减轻其代理成本。我使用两种不同的方法来衡量绩效,即传统的和分析的,并发现两者与团队收益