论文部分内容阅读
当前互联网中存在着大量包含多种语义信息的对象,传统的的单标记学习框架已经难以有效的去处理这些多义性对象,多标记学习框架则可以很好的处理这些多义性对象因而吸引了诸多研究者的关注,在多标记学习中,分类问题是当前研究者探讨的热点话题。不同于单标记分类,多标记分类问题的输出空间对应的是多个标记,同时标记之间可能也存在一些隐含的相关关系,如果能充分利用好标记之间的相关性,对于提升算法的分类性能将会有很大帮助,例如一些多标记分类方法通过构造链式分类器或堆叠式分类器以利用标记之间的高阶相关性,但这些方法在测试阶段可能会存在标记预测误差传播的问题。另外在多标记分类任务中,特征是描述数据集中不同数据对象的重要参考,然而冗余或不相关的特征不仅会增加运算成本,还会影响算法的分类性能。本文围绕多标记分类中待解决的问题,所做的主要研究工作如下:提出了一种基于类属特征和依赖标记的多标记分类算法,该算法通过7)1稀疏正则项构造稀疏的类属特征系数矩阵和依赖标记系数矩阵,类属特征的构造可选择出每个类别标记最具判别性的特征子集,依赖标记则可以反映标记之间的全局相关性,同时结合标记局部相关性概念,通过流形正则项约束模型的系数矩阵以限制标记输出,算法采用加速梯度下降法来求解目标函数。在测试阶段预测标记可根据求解得到的类属特征系数矩阵和依赖标记系数矩阵获得,而无需使用额外分类器,从而降低因使用外部分类器导致的误差传播问题对算法分类性能的影响。在实验阶段,使用不同规模的数据集对比所提算法与其它多标记分类算法的分类性能,根据在不同评价指标上的评估结果和后续的算法性能检验结果来验证所提算法分类性能的优越性。