【摘 要】
:
在多标签分类问题中,每个样本同时对应多个标签构成的标签集合。多标签分类问题与传统的分类问题最主要的不同在于传统的分类是假设标签之间两两互斥,而多标签分类中标签之间
论文部分内容阅读
在多标签分类问题中,每个样本同时对应多个标签构成的标签集合。多标签分类问题与传统的分类问题最主要的不同在于传统的分类是假设标签之间两两互斥,而多标签分类中标签之间是相关的。很显然,在实际应用中,多标签分类学习更具有一般性。由于多标签分类中标签之间是相关的,那么有效地利用标签相关关系能够提高分类性能。在目前大部分利用标签相关性的方法中,常把标签作为树型或者图结构来挖掘标签共存相关性。然而在很多实际问题中,标签之间并没有如此结构。另外这些方法不能准确地描述数据集中某些标签组合隐含的互不共存的关系。本文提出了一种新的基于标签相关性的多标签研究方法,基本思想是基于欧式距离度量方法找到标签之间的距离信息,用标签之间的距离来描述标签集合中某些隐含的标签互不共存关系。并且在现有的多标签算法中加入这种标签互斥关系的思想,得到多个较好性能的改进算法。本文主要研究内容如下:1.设计了改进的RAKEL(RAndomk-labELsets)算法。在RAKEL算法中,随机性地从标签集合中选择标签构造新的标签子集学习相应的单标签分类器,这种方法并没有充分利用标签之间的关系。本文针对这一缺点,在构造标签子集时,选择互不共存的标签组合来构造相应的训练集。实验表明,改进后的算法分类性能提升。2.设计了改进的CC(Classifier Chains)算法:在CC算法中,分类器中链式标签的顺序是随机的,也没有充分地利用标签之间的关系。基于此,本文提出在构建标签顺序的过程中,引入标签的互斥关系,强化标签之间的联系,提高CC算法的泛化能力。实验表明,改进后的方法分类性能提升。
其他文献
描述逻辑作为一种知识表示的有效机制,已经成为构建形式化本体知识库的重要逻辑基础。基于描述逻辑的本体知识库被广泛地应用在智能体间的通信、异构信息源的集成、语义Web等
人体肤色检测已应用于如手势识别、数据库人物检索、网络敏感信息过滤等诸多领域。因而,设计一套有效并且性能稳定的肤色检测方法成为计算机视觉领域的一大研究热点。为了满
随着P2P技术的日渐成熟,越来越多的网络应用都使用了P2P技术,特别是在文件共享领域与流媒体播放领域,P2P技术的使用发挥到了极致。然而正是由于这种技术的出现,P2P流量占据了很大
随着云计算和大数据时代的到来,电子数据的存储量呈几何级增长。同时,近年来自然灾害和人为事故的频发导致数据中心存储设备损坏,给许多数据中心造成不小的损失,企业、高校、
随着计算机软件技术的发展,软件产品的应用功能和系统结构日趋庞大和复杂,软件测试过程中产生的运行剖面越来越多,这给计算机软件开发后期的软件可靠性测试工作带来巨大的挑
教学管理工作是学校办学的重要工作之一,随着计算机技术和网络技术的发展,教学管理工作也从传统的手工处理解脱出来,采用现代化的办公自动化系统--教学管理系统来完成。教学
JXTA是用来解决P2P(Peer-to-Peer)对等计算的分布式网络计算平台,也是一个为P2P应用程序和服务提供标准协议的开放式资源项目。JXTA是juxtapose:并列)的缩写,这不仅说明网络中
钢结构节点设计是钢结构设计的重难点,采用传统的CAD(Computer Aided Design,计算机辅助设计)技术,很难灵活地进行钢结构节点设计。为此,将虚拟装配引入到钢结构节点设计中,
无线传感器网络是由部署在监测区域内大量的、廉价的、具有感知能力的微型传感器节点形成的一个多跳自组织网络。随着它的广泛应用和产业化实现,其安全问题日益突出。本文首
近年来词的分布式表示与组合模型在自然语言处理领域中取得了诸多突破性的成果。词的分布式表示使用实值向量对词进行建模,可以从无标记语料库学到词的语法和语义信息,而组合