一种基于子空间分解和判别分析的多标签分类算法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lyan4321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签分类是指当单个样本数据可以同时属于多个类别时,为测试数据找到对应正确的多个类别标签的过程。作为机器学习领域中前沿的研究课题之一,多标签分类在文档归类、图片标注、医疗诊断等领域都有着广泛的应用。由于多标签分类问题是传统分类问题的更一般化的形式,且多标签分类问题的复杂度随着标签个数的增长而呈指数函数的形式增长,目前多标签分类问题中还有很多难以解决的挑战和困难。因此,多标签分类算法具有重要的研究意义和价值。目前,大多数的多标签分类算法都是从分析标签相关性的角度出发,这些算法普遍具有以下不足:(1)低阶的算法忽略了部分标签之间的相关信息,导致在遇到强相关的多标签数据时算法性能会显著下降;(2)高阶的算法复杂度会随着标签个数的增长而呈指数函数的形式急剧增长,使多标签分类问题的求解过程变得异常困难。本文针对上述多标签分类算法存在的普遍问题,利用子空间分解和线性判别分析的方法构建了一种同时满足判别性和一致性要求的多标签分类模型。主要的研究工作如下:1、基于多标签数据是来自各个标签分量的组合的观察事实,利用子空间分解的方法,将多标签数据分解成各个标签子空间分量叠加和的形式,分离了多标签分类问题中的标签相关性,解决了多标签分类算法复杂度会随标签个数增大而呈指数函数的形式增长的困难。2、在各个子空间上,利用线性判别分析的方法统计出各个类别上的判别信息,建立了同时满足判别性和一致性要求的多标签分类模型。依据多组变量循环迭代的原则,推导出各个变量的梯度,设计出循环迭代梯度下降的求解算法,实现了模型的求解。3、根据多标签分类算法的目的,对本文所提出的数学模型进一步抽象,将其推广到更一般的形式,给出了相应的数学描述。同时,设计了严密合理的实验,在多个数据库上验证了本文所提出的多标签分类算法的有效性。
其他文献
目前,有关柴油机方面的能源消耗和有害尾气排放量程逐年递加趋势,这造成了我国石油短缺,同时极大的危害环境。加之,我国柴油机排放法规越来越严格,要实现欧IV以上的排放标准,
卫星通信有着信道时变的特点,因此需要采用自适应传输技术,而长往返时延的特点使得自适应技术的设计变得非常困难。本文采用基于无速率码和增量冗余混合自动请求重传(IR-HARQ
光子晶体光纤是一种在光纤轴向方向上具有周期性微结构气孔阵列的光纤,灵活设计其结构便能实现无休止单模传输、高非线性、高双折射、可控色散、大模场面积等普通光纤无法实
雷达信号处理硬件板卡是雷达系统的重要组成部分,可以高速实时采样单脉冲雷达中频回波信号,测量单或多运动目标距离和运动速度,并将运动目标的相关参数传给火控系统,实现自动目标
IEEE协议组织于2013年启动了对新一代无线局域网标准IEEE 802.11ax的研究,旨在提高密集部署场景下的频谱效率和网络吞吐率。为了达到以上目标,IEEE802.11ax将在物理层中引入O
视觉是人类最高级的感知器官,而图像是人类视觉感知外界事物、传达各种信息的常用方法之一。随着信息技术的飞速发展,人类对图像处理进行的相关研究越来越多。图像配准是图像
随着无线频谱的日益紧张,干扰已成为未来无线通信的一个瓶颈性问题,干扰管理的迫切性显得尤为突出。传统的干扰管理方法存在着频谱效率低或干扰受限的缺陷,干扰对齐作为一种
目前P2P技术应用越来越广泛,但该应用最主要的问题是消耗大量网络带宽,并带来版权、安全和垃圾信息等问题。因此必须对P2P流量进行监控和管理以提高网络服务的性能。在该监控
混沌是非线性科学研究的中心内容之一。长期以来,由于混沌系统自身的极端复杂性,人们一直认为混沌系统是不可控制的,更不用说去利用混沌系统了。但由于电子技术的迅速发展,特
声源定位技术是利用声学与电子装置接收并处理声信号以确定声源位置的一种技术。由于声音具有不受视线和能见度影响的特性,声定位技术作为一种重要的军事侦查手段,可用于探测