论文部分内容阅读
作为标准分类问题的延伸,层级分类问题利用预先定义好的标记层级结构,来提高分类的效果,其在图像分类、文本分类等领域均有广泛应用。在过去的十多年中,层级分类问题吸引了众多研究者的关注,并已出现许多优秀的层级分类算法。但是,现有的算法缺乏对层级分类问题中两个方面的研究:1.层级分类中的小数据问题;2.无序标记和有序标记层级分类问题的特性不同,需针对其特性设计专门的算法。对于第一个方面,小数据问题是指层级分类中局部模块的训练样本不足,且越靠近底部,样本越少。先前的工作直接在局部模块上训练分类器。由于小数据问题,局部分类器容易过拟合,这也成为层级分类的一个主要瓶颈。对于第二个方面,在分类问题中,标记空间可分为无序标记空间和有序标记空间两种类型。层级结构是在标记空间上进行构造的,可以根据标记空间是否有序,将层级分类问题细分为无序标记层级分类问题和有序标记层级分类问题。无序标记层级分类问题和有序标记层级分类问题具有不同的特性,需要针对每种问题设计专门的算法。先前的层级分类算法忽略了两者的差异,导致算法不能很好地适应无序标记层级分类和有序标记层级分类两种问题。本文的目标是针对上述层级分类问题中的两个方面展开研究,并提出相应的解决方法。本文的主要贡献包括:1.针对层级分类中的小数据问题,论文认为局部模块中的标记之间存在相关性,且不同局部模块中标记的相关程度不同。论文由此提出了基于标记分布的层级分类算法,其核心思想是使用标记分布来表示标记之间的相关性,使得真实标记和其兄弟标记都能够为示例提供监督信息;2.针对无序标记层级分类问题和有序标记层级分类问题的差异,论文分别为每种问题设计了基于标记分布的层级分类算法,使算法能够与问题特性相适应。本文共分为六章。第一章主要介绍层级分类和标记分布学习的概念、研究现状以及本文的研究内容;第二章详细介绍标记分布学习问题以及已有的算法和评价方法;第三章详细介绍层级分类问题以及已有的算法和评价方法;第四章介绍使用标记分布解决无序标记层级分类问题;第五章介绍使用标记分布解决有序标记层级分类问题;第六章对全文工作进行总结。