基于标记分布的层级分类研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:x1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为标准分类问题的延伸,层级分类问题利用预先定义好的标记层级结构,来提高分类的效果,其在图像分类、文本分类等领域均有广泛应用。在过去的十多年中,层级分类问题吸引了众多研究者的关注,并已出现许多优秀的层级分类算法。但是,现有的算法缺乏对层级分类问题中两个方面的研究:1.层级分类中的小数据问题;2.无序标记和有序标记层级分类问题的特性不同,需针对其特性设计专门的算法。对于第一个方面,小数据问题是指层级分类中局部模块的训练样本不足,且越靠近底部,样本越少。先前的工作直接在局部模块上训练分类器。由于小数据问题,局部分类器容易过拟合,这也成为层级分类的一个主要瓶颈。对于第二个方面,在分类问题中,标记空间可分为无序标记空间和有序标记空间两种类型。层级结构是在标记空间上进行构造的,可以根据标记空间是否有序,将层级分类问题细分为无序标记层级分类问题和有序标记层级分类问题。无序标记层级分类问题和有序标记层级分类问题具有不同的特性,需要针对每种问题设计专门的算法。先前的层级分类算法忽略了两者的差异,导致算法不能很好地适应无序标记层级分类和有序标记层级分类两种问题。本文的目标是针对上述层级分类问题中的两个方面展开研究,并提出相应的解决方法。本文的主要贡献包括:1.针对层级分类中的小数据问题,论文认为局部模块中的标记之间存在相关性,且不同局部模块中标记的相关程度不同。论文由此提出了基于标记分布的层级分类算法,其核心思想是使用标记分布来表示标记之间的相关性,使得真实标记和其兄弟标记都能够为示例提供监督信息;2.针对无序标记层级分类问题和有序标记层级分类问题的差异,论文分别为每种问题设计了基于标记分布的层级分类算法,使算法能够与问题特性相适应。本文共分为六章。第一章主要介绍层级分类和标记分布学习的概念、研究现状以及本文的研究内容;第二章详细介绍标记分布学习问题以及已有的算法和评价方法;第三章详细介绍层级分类问题以及已有的算法和评价方法;第四章介绍使用标记分布解决无序标记层级分类问题;第五章介绍使用标记分布解决有序标记层级分类问题;第六章对全文工作进行总结。
其他文献
能源危机和环境污染已经成为人类社会发展面临的的主要问题。利用光催化技术产生氢气并降解有机污染物,是解决能源和环境问题的有效途径。受启发于自然界中树叶的良好捕光结
[背景]结直肠癌(Colorectal cancer,CRC)是一种常见的消化道恶性肿瘤,我国结直肠癌的发病率位于各种恶性肿瘤中的第四位,死亡率位于第五位,而且有逐年上升的趋势,严重威胁着
我叫崔广兴,是山西省屯留县路村乡官庄村人。1993年,毕业于长治师范学校民师班,现任官庄小学校长。当初考入长治师范时,我的奋斗目标是通过住师范,能成为一个有知识会教书的
会议
随着工业发展,大量的含铜废水排放到环境中,严重影响了水生动植物的生存环境,对人类的健康也构成严重威胁。在各种处理含铜废水的方法中,吸附法因为操作简单、无二次污染、成
玉门市地处甘肃省西北部,河西走廊西部,南北靠山,东西临近沙漠带,常年受沙尘天气影响;同时本地石油、矿产资源丰富,分布有炼油炼化、煤化工、电力、水泥等重污染企业,人为源
经过三十余年的快速发展,中国的经济建设取得了辉煌的成就,人民收入水平快速增长。但同时我们也观察到,经济社会发展中也存在着一些问题,城乡居民收入差距随着经济增长而快速
近年来,我国经济正以一个相对较快的速度迅速发展,同时社会改革也在向着更深入、更全面的方向发展。我国商业银行相对来说发展时间仍然较短,因此缺乏足够的经验积累,同时由于
氢气由于燃烧热值高、清洁且反应后产物是水等优点引起了人们的广泛关注,但它的制备、运输与储存仍然面临很多问题。硼烷氨(NH3BH3)因其含氢量高(19.6 wt%)、常温稳定、易于运输
滤波技术作为系统状态估计方法可以应用到非线性、非高斯系统领域。粒子滤波运行效率的一个关键参数是粒子数量。算法运行使用的粒子数量越多,滤波器得到的分布越接近真实分布,然而计算成本会随着粒子数量增加而剧增。所以需要合理选择一定数量的粒子提高滤波运行效率。另外,目前粒子滤波重采样方法是解决粒子退化问题的一种重要技术方法,重采样方法能在一定程度缓解粒子退化,然而也会引起粒子多样性降低的问题。针对如何提高粒
经济全球化与一体化是当前世界经济发展的基本趋势,国家之间的经济依存度日益提高。近年来中国经济快速发展的同时,中国对外贸易也逐渐上升。2014年,中国是美国的第二大贸易