面向标记相关性和标记增强的多标记学习研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:srsyzjks
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记学习已成为机器学习的热门研究领域。在多标记学习任务中,标记相关性和标记增强作为两个重要的研究方向,吸引了众多学者的关注。本文针对这两个研究方向目前存在的不足展开了研究,具体研究内容和研究意义如下:标记相关性:Binaryrelevance(BR)是最广泛使用的多标记学习方法。BR通过针对每个标记构建一个二分类器,从而将多标记学习问题转换为一组二分类问题。BR简单直观,但是在构建模型过程中缺乏对标记相关性的利用。为了解决这个问题,Dependent binary relevance(DBR)和其他算法通过在训练时将其他的标记视为额外的特征作为分类器的输入以引入标记相关性。因为每个标记有其最相关的标记子集,这些算法可能只能找到多标记学习的次优解。因此,本文提出一种名为 SMLS(Stacking model with labe l selection for multi-label learning)的两层堆栈式算法用以发掘恰当的标记相关性。在第一层,SMLS首先以BR的形式构建一组二分类器。在第二层,SMLS针对每个标记找到其对应的特定标记子集,并将其扩展到特征空间。通过在扩展后的特征空间上训练得到第二层的二分类器。在大量基准数据集上的实验表明,SMLS取得了优异的分类性能。和DBR相比,SMLS不仅在时间上更加高效,而且鲁棒性更强。标记增强:大多数多标记学习算法将每个标记视为逻辑型。但是在现实生活中,逻辑型标记无法描述该标记对于样本的重要性。标记增强过程的目的在于通过将逻辑型标记转换为数值型标记,从而向学习系统提供更多的信息。近年来,学者们提出了许多标记增强算法。尽管这些算法在重建数值型标记的任务中取得了一定的效果,但是在重建过程中,标记信息并没有得到很好的利用。因此,本文提出了一种能够同时利用特征信息和标记信息的名为AGLEML(Adaptive graph based label enhancement for multi-label learning)的多标记增强算法。首先,AGLEML同时学习了拓扑结构和数值型标记,并在此过程中同时利用了标记信息和特征信息。随后,AGLEML 在 Multi-output support vector regression(MSVR)的基础上设计了预测模型。在大量基准数据集上的实验表明,AGLEML取得了优异的分类性能,同时能够有效地从多标记数据中重建标记重要性。
其他文献
在互联网信息技术快速发展的背景下,网络游戏直播行业已经跃身为带动网络经济发展的重点产业之一,不仅催发了巨大的经济和社会效益,同时也带来了法律层面的一系列问题。一方面,相关的法律在解决类似问题时存在很强的滞后性,导致用目前的法律解决类似问题存在一定的困难;另一方面,理论界和实务界对一些可以适用的法律规定理解不一致,导致如何对网络游戏直播侵权案件进行保护仍然存在较大的争议。从以往的经验上看,著作权的保
学位
在解决执行难问题上,我国理论界与与实务界均提出了各种解决方案。在民事执行中建立第三人代为履行制度是解决执行难的一个重要手段,然而我国在该方面的法律基础较为薄弱,不足以支撑起我国的实践,与我国台湾地区以及其他大陆法系国家的立法相比差距颇大。在具体执行中,第三人出现代为履行的情况,不可避免的会出现难以认定的情况,这是由于制度本身含义缺乏清晰的认定,另一方面是程序法上相关法律规定较少所造成的。从实体法入
学位
船舶作为一种常见的海上交通工具,承担着各种复杂的任务。因为船舶机械结构复杂,并且船舶在海面上航行时,船的航行速度、装载量并非一成不变,这些因素给确定船舶精确的运动数学模型带来了很大难度。因此,在船舶模型参数不确定的情况下,如何设计鲁棒性能控制器使船舶能够平稳运行,并且具有良好的动态性能,将是一个具有挑战性的问题。本文主要考虑航速、负载变化对船舶航向控制的影响。船舶在航行过程中,航行速度,装载量变化
学位
高超声速飞行器作为21世纪航空航天领域的技术制高点,其发展将为航空航天技术带来革命性突破,高超声速飞行器所需的动力装置——组合循环动力发动机的研究是能否实现高超声速飞行的关键。为了实现不同组合推进装置工作在各自最佳的适用范围内,获得最优的推进效果,各种组合循环动力发动机被相继提出。其中以涡喷发动机为主要特征的涡轮基组合循环发动机因良好的工程应用前景受到航空领域的广泛重视。多通道涡轮引射冲压组合发动
学位
聚类集成往往能够将多个基聚类器的划分集成为准确率更高、更鲁棒的聚类结果。目前已经有一些工作将问题聚焦在评估基划分质量并按不同的权值集成基划分以达到更好的效果上。然而,目前的研究还存在一些不足:首先,这些方法倾向于将每个基聚类结果或基聚类结果内部的团簇视为加权的基本单元,而忽略了样本级别的局部集成的多样性。其次,现有的方法大多以加权的方式依据单个独立的基聚类器的划分或团簇的质量评估权值,没有考虑基聚
学位
针对SISO系统性能评价,Harris性能评价方法以最小方差作为性能评价基准,可以通过FCOR算法进行MV基准的估计,仅需时延的先验知识及闭环状态下的常规运行数据,即可以获得控制系统的性能评价。上述优点使得以MV为基准的性能评价方法逐渐流行起来,在实际工业生产中获得了最广泛的应用。然而,在工业现场中存在着大量复杂的确定性干扰,如阶跃、正弦、方波和锯齿波等,基于平稳信号假设条件下的常规FCOR算法中
学位
2020年伊始,我国武汉市爆发了新型冠状病毒引发的肺炎疫情,并迅速席卷全国,形成突发公共卫生事件,对人民的生命健康造成巨大威胁。在应对突发公共卫生事件的过程中,行政机关不可避免的利用公民个人信息进行疫情防控工作,主要表现在收集和公开两种行为。行政机关通过收集公民个人信息,第一时间追踪可能有感染风险的公民,制作疫情通报,以维护公共利益。但是,行政机关在利用公民个人信息应对突发公共卫生事件的过程中,暴
学位
随着“人工智能和实体经济深度融合”的主题的提出,这意味着人工智能产业将作为创新型国家建设目标的重要组成部分得以发展。现如今,人工智能已经融入了各行各业并得以广泛应用,并且具有一定的自主性和不可预测性。以人工智能技术为代表的无人驾驶汽车在未来逐渐取代传统汽车将成为大势所趋。但是在目前的阶段,无人驾驶汽车仍然无法避免日常生活中发生的各类交通事故。一旦无人驾驶车辆发生道路交通事故,如何评估赔偿责任也成为
学位
机械臂是制造业的重要组成部分,被广泛应用于各种各样的工业领域。目前市面上机械臂的工作都是采用人工示教的方式来实现,虽然这种方法已经很成熟,但存在费时费力、自动化程度低、应用场景单一等诸多问题。近年来,工业产品快速更新换代,传统的人工示教方法已经显得力不从心。因此,机械臂运动规划用于解决机械臂自主避障问题成为目前的研究重点。传统的运动规划算法随着维度的增加,其计算量会呈指数增长,不适用于具有多自由度
学位
近些年来,多智能体分布式协同控制的研究越来越受到广泛的关注,其中分布式优化由于在分布式机器学习及分布式计算中存在巨大的应用前景,逐渐成为分布式协同控制领域的焦点问题。基于多智能体系统的分布式优化的目标是通过智能体的个体计算和与其相邻智能体的局部通信,获得系统全局目标函数的最优解。本文利用图论、矩阵论、概率论以及李雅普诺夫稳定性判据等相关理论与数学工具,研究了存在通信丢包情况下的连续时间多智能体系统
学位