论文部分内容阅读
针对多示例多标签学习中可能会出现标签缺失问题、类属属性问题、标签关系问题以及示例关系问题。本文首先从多标签学习的角度探索标签缺失问题、接着从多示例学习的角度探索示例关系问题,最后综合前两个问题并结合类属属性问题以及标签缺失问题提出一种基于邻域共识的多示例多标签算法NC-MIML(Multi-Instance Multi-Label Base on Neighborhood Consensus)。本文主要工作及创新点如下:(1)为解决标签关系问题,本文从多标签学习角度分析并提出一种基于引力模型的改进多标签算法IMLDGM(Improved Multi-Label algorithm based on Data Gravity Model),IMLDGM算法在基于引力模型的多标签学习算法基础上,考虑到数据粒子质量与引力大小的关系以及标签的正、负相关性。通过仿真实验的结果表明,标签关系是影响着分类器最终分类的效果的。(2)为解决示例关系问题,本文从多示例学习的角度分析并提出一种基于邻域共识的多示例算法NC-mi Graph(Neighborhood Consensus-mi Graph),NC-mi Graph主要是将每个包内示例的邻域共识(即近邻集合)考虑到示例原始的特征空间中,再通过构建亲和力矩阵来探索示例之间的关系。通过仿真实验的结果表明,是否考虑到示例之间的关系以及示例的邻域共识对于分类器最后的分类效果也是存在一定的影响性。(3)针对多示例多标签学习问题,在前两个研究工作的基础上提出一种基于邻域共识的多示例多标签算法NC-MIML:NC-MIML算法主要是首先通过NC-mi Graph算法的思想将多示例多标签数据转化为单示例多标签数据,接着利用一种标签正、负相关性来补全不完整的标签矩阵,从而找出最有意义的类属属性。通过仿真实验的结果表明,NC-MIML同比其他多示例多标签算法而言,其最终分类的效果是优于对比算法并具有一定的竞争力。