论文部分内容阅读
随着计算机技术和机器学习的发展,越来越多的实际应用涉及到多标记问题,如图像标注和个性化推荐等。在多标记问题中,一个示例可以与多个标记相关或同时属于多个类别,它与传统分类问题有着明显的不同。由于示例可以同时属于多个类别,标记之间的标记关系变得丰富,多标记学习的研究也更加复杂。随着实际应用中多标记应用需求的增加,越来越多的研究人员着力于多标记学习的研究。多标记学习已经成为目前机器学习研究的热点之一,虽然已经取得了很大的进展,但是仍面临一些挑战。例如现有的多标记学习算法对标记关系的利用不够充分;在训练样本较少的半监督多标记学习问题中,不能将标记关系扩展到大量的未知训练样本,以及如何将多标记学习应用到实际问题中。本文围绕上述几个方面展开研究。首先,现有的校准标记排序算法对于二阶相关性信息的利用仅限于分类器的构造,导致其在标记投票的过程中出现无法区分标记重要性的问题。针对这一问题,提出基于标记关系矩阵的改进校准标记排序算法。该算法通过计算标记的关系矩阵并将其作为权重加入到投票过程中,以区分标记的重要性,得到更加合理的投票结果,最终获得更加准确的相关标记集,以此提升算法的泛化能力。然后,针对基于未知样本的归纳式多标记分类算法中存在的没有完整利用标记二阶相关性的问题,提出基于二阶标记相关性的改进半监督多标记学习算法。该算法首先将与标记对相关的二分类器作为新的多标记基分类器;然后定义一种新的关于未知样本错分率的计算方法,通过两两标记对的组合将二阶标记关系信息加入到错分率的计算过程中,使得未知样本错分率的计算更加精准,以此更加有效地利用未知样本。最后,将基于标记关系矩阵的改进校准排序算法应用到雷达工作模式分类问题中。针对雷达工作模式分类中各工作模式的特征参数重叠严重,采用多分类方法容易造成各模式区分度不高、分类准确率较低等问题,提出雷达工作模式的多标记及多视图组合分类方法。该方法分为两个阶段:基于多标记学习的雷达工作模式分类和基于时间序列多视图的雷达工作模式分类。在第一阶段,利用模糊理论将关于雷达的多分类样本多标记化,形成多标记数据集,并且结合基于标记关系矩阵的改进校准排序算法完成训练和预测。在第二阶段,通过雷达工作模式的历史数据对工作模式进行分类。最终将两阶段的分类结果通过加权求和进行融合,以此提高雷达工作模式分类的准确率。