利用标记相关性的多标记学习算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:babyface_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多标记学习中,每个对象用一个特征向量表示,它可以属于一个或多个类别标记,标记之间存在相互依赖性。多标记学习的任务就是为每个测试对象预测一个或多个适合的类别标记。多标记学习是当前机器学习领域的一个研究热点,已经引起了学者的广泛关注。在过去的十几年里,多标记学习得到了广泛的应用,例如文档分类、图像标注、视频标注、社交网络、音乐情感分类等。但随着互联网技术的发展,数据的规模越来越大,维度越来越高,给传统的多标记学习算法提出了严峻的挑战。本文对多标记分类和特征选择算法进行研究,主要工作包括:  1.提出一种简单有效的基于最近邻算法的贝叶斯模型LPLC(multi-label classi-fication by exploiting Local positive and negative Pairwise Label Correlation),建模局部标记正负相关性。以往的多标记学习算法大多利用全局的标记相关性来建模分类器,并且没有显式的建模标记间负相关性。实验结果显示出LPLC比全局化利用标记关系的方法有更强的泛化性能,且显示了建模标记间的负相关性的有效性。  2.提出为每个类别标记学习一个类属特征表示,并在此基础上建立多标记分类算法LLSF(Learning Label-Specific Features for multi-label classification)。以往基于BR(Binary Relevance)框架的多标记学习算法不同,我们的算法在每个类别标记的二类分类器中使用该类别特有的类属特征表示作为输入,它由对该类别具有强判别力的类属特征构成。实验显示出每个类别标记只由原始特征集合中的部分特征所决定,并且标记对之间的相关性大小和它们所共享的特征数之间存在一定的一致性。LLSF学得的类属特征表示还可以用于现有基于BR框架的多标记学习算法,提高算法的效率和性能。  3.提出建模高阶类别相关性多标记学习算法LLSF-DL(Learning Label-Specific Features and class-Dependent Labels for multi-label classification)。高阶算法主要挖掘类别标记间的依赖结构关系,然后据此来依次训练不同类别的分类器,算法性能受限于错误传播和冗余的类别依赖关系。在LLSF的基础上对其进行改进以建模高阶类别相关性,学习类属特征的同时再学习有效的类别依赖结构,进而减小类别信息的错误传播对分类器性能的影响。实验结果显示出LLSF-DL性能优于LLSF,并且具有更高的稳定性。  4.提出一种联合特征选择和多标记分类的方法JFSC(Joint Feature Selection and Classification for multi-label learning),它可以同时用于多标记分类和特征选择。与现有多标记学习算法不同的是,我们首先学习每个类别私有的类属特征以及相关类别之间共同共享的特征,然后在学习到的低维数据表示上建立多标记分类模型。同时,JFSC算法主要引入线性判别分析的思想,进一步增强每个类别的类属特征表示的判别力,期望在每个类别标记的类属特征空间中正负例样本具有较好的可分性。实验结果显示出JFSC在多标记分类和特征选择方面都具有较强的泛化性能。
其他文献
该文研究了国内外软件Agent技术发展的现状,探讨了软件Agent构造的各种方法以及存在的问题.然后,借用了生物组织学的概念,提出了软件细胞、软件基因和软件碱基对的概念,并基
本文以崭新的思想构建了一个汉语句子分析模型.该模型是基于算符优先文法理论的.它把一个句子的分析过程抽象成一个隐含了操作符的算符表达式的计算过程.其模型包括三部分:汉
该文通过对网络管理数据库的构成研究,给出了网络管理性能事务构成方法,给出了基于SNMP的MIB库中与性能有关的性能属性的详细描述.在分析了传统AI在网络管理中应用和充分研究
本文将首先介绍已有的非真实感绘制实现技术,特别是针对三维物体的显示算法,并且分析三维物体非真实感绘制算法需要克服的几方面问题.进而针对由简单多边形网格模型组成的三
该文通过移动代理系统中恶意主机问题的进行了深入探讨,对恶意主机攻击的特点进行了分析和研究,进而提出了基于PKI设施的主机间双向认证的解决方案.通过主机间的双向认证可以
作为CAD系统国际工业标准之一的NURBS曲线曲面在计算机辅助几何设计(CAGD),计算机图形学(CG)和几何造型(GM)等应用领域中都具有非常重要的作用.随着这种几何模型的广泛应用,
软交换是基于IP/ATM技术的新技术,能够满足语音,视频,数据,多媒体等多种业务的要求,能够灵活地支持各种新业务的开发和应用,是传统的电路交换网向分组网过渡的关键技术.软交
随着计算机技术的发展,嵌入式系统在生产和生活中扮演着越来越重要的角色,我们在家用电器、医疗卫生、生产生活等各个方面都能看到嵌入式系统的影子,它们正推动着社会的进步.
该文通过对基于Strand空间模型的安全协议分析方法的研究,提出了用于提高安全协议分析效率的改进的状态空间简化技术.在协议分析过程中,将一般的状态空间简化技术与剪枝定理
随着互联网的飞速发展,作为网络资源的主要载体网站的发展也极为迅速。随之而来的基于WEB的网络综合管理系统也得到了广泛地应用,它们提供多种网络服务,为各种领域提供了方便、