基于样本相关性的多标记学习算法及应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:hwj67712233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的单标记学习只是用来解决对象的单义性问题,即一个示例仅仅与一个标记相关。然而,现实生活中的对象往往具有多义性,一个示例可能同时与多个标记相关,已有的单标记学习并不能很好地解决该类问题。因此,多标记学习框架被提出来处理该问题。为了提升学习性能,多数研究人员对如何挖掘更多的额外信息加入到模型的训练中进行研究,样本相关性的挖掘与利用在多标记学习中一直是一个核心内容。基于此,本文通过挖掘和利用样本相关性对多标记学习方法展开进一步研究。第一,本文提出一种基于样本局部相似性的多标记学习算法。目前现有的多标记学习方法在利用样本相关性时,都是从全局的角度去计算两个样本的相似性,然后所有的标记共享该相似性,但是这样不符合现实而且会误导模型对于某些标记的预测。在本文中,提出了一种基于样本局部相似性的多标记学习算法。在多标记学习中,决定每个标记的往往只是一部分特征,并且每个标记对应的特征子集可能不同,那么样本在不同标记上所对应的相似性也可能会不同,本文中称其为样本局部相似性,在此基础上构造样本局部相似性矩阵并将其加入到最终多标记学习模型的训练中,可以为训练过程提供更全面且精确的样本相关性信息。为了检验所提算法的有效性,在多个领域上的多标记数据集进行了大量的实验,并与多个多标记学习算法进行对比,实验结果表明提出的算法在性能上有明显的优越性。第二,本文提出一种基于多标记学习的特权标记增强学习算法,将多标记学习应用于标记增强领域,在应用过程中隐式的利用了样本之间的相关性。在标记增强学习中,由于标记增强学习任务是从多标记数据集的逻辑标记恢复隐含的标记分布值,但逻辑标记包含的语义信息相对于标记分布值更简单,在转换过程中,样本相关性的利用尤其重要,在本文中,利用多标记学习为标记增强学习生成额外信息,该额外信息又称为特权信息,这是一种隐式利用样本相关性的方式,能够减少手动化构造引入的不必要的噪声和信息损失。最后应用LUPI框架利用该特权信息构造最终的标记增强模型。在实验部分,在标记分布数据集进行了广泛实验,与目前多个标记增强算法进行对比,实验结果表明本文提出算法的有效性。第三,本文实现了一个基于已提出的多标记学习算法的图像语义标注系统。目前,图像语义标注具有广泛的应用场景,在传统的图像语义标记方法中每次只能识别出一种语义信息,这并不能满足现实生活的需求。一张图像往往包含丰富的语义信息,而人们往往想同时获得这些语义信息,利用多标记学习算法可以解决该问题。目前多标记学习在图像语义标注方面虽然得到了广泛应用,但是现有的多标记学习算法并没有考虑到图像之间的局部相似性,这对图像语义标注非常重要,因此,我们利用本文中提出的基于样本局部相似性的多标记学习算法实现了一个图像语义信息标注系统。
其他文献
Riclin是本实验室从土壤杆菌Agrobacterium sp.ZCC3656产物中分离出的一种新型水溶性琥珀酰聚糖,由葡萄糖、半乳糖、琥珀酸酯和丙酮酸组成,摩尔比为7.8:1.0:0.9:1.1。前期研究表明其具有降低胆固醇、降血糖等生物学活性,此外研究发现其具有良好的免疫调节活性,提示Riclin可能在保护机体抗感染方面发挥一定作用。本研究通过构建体内和体外单增李斯特菌感染模型,研究Ricl
学位
火箭炮是现代战争的一种重要武器在装备,在战场上能够执行多种作战任务,具有广泛的战术应用价值。随着部队人员流动和装备更新,士兵对火箭炮认知不足,导致出现故障后难以解决。随着计算机技术和图形技术的发展,增强现实技术被越来越多的应用到实践当中,本文研究了增强现实在火箭炮维修中的应用,对火箭炮的维修保养提供一种新的解决思路。首先分析目前的火箭炮维修流程,找出其中薄弱环节,提出基于增强现实的火箭炮维修辅助系
随着我国东南近海风电资源的大规模开发,海上风电装机容量快速上升。由于东南沿海经常发生台风灾害,台风过程中海上风电可能会因物理故障或风速过大而大规模停运。随着海上风电渗透率在局部电网中占比不断增加,大规模风电停运会严重影响电网的安全运行。为此有必要对台风灾害下海上风电停机风险进行评估,并对高风险场景进行预防控制。现有风险评估研究中主要针对陆上风电运行研究,未综合考虑台风灾害下海上风电各部件故障概率、
学位
城市交通是城市的命脉所在。城市经济发展,居民安全保障都离不开交通。随着经济的发展和技术的进步,整个城市的生活节奏加快,人口流动增大,而轨道交通方便、廉价、快捷、准时的优点,无可避免地成为城市,尤其是核心城市的主要通勤方式。随着中国城市化进程的加快,许多二三线城市开始兴建地铁,中国地铁总里程数达到了5700公里以上,是2010年的4倍。地铁不仅仅需要满足最基本的载客的需要,也更需要满足人性、舒适,美
高超音速的可燃气流,在障碍物作用下,可形成驻定于障碍物的斜爆轰,据此原理设计的推进系统称为驻定爆轰发动机。该发动机具有结构简单、无附加点火源、噪音小等优点,因而受到国内外广泛的关注。当斜爆轰波满足一定的条件时,才能驻定在障碍物的表面,该条件称为驻定窗口,驻定窗口的大小反映了斜爆轰波驻定难易程度。本文对斜劈诱导的斜爆轰波前后建立质量、动量和能量守恒方程,考虑了氢气-空气多组分的平衡成分,推导了驻定斜
随着云计算和互联网技术的发展,网络中信息数据呈爆发式增长,用户难以从海量数据中发现自己需要的信息。在此背景下推荐系统应运而生,然而传统的协同过滤推荐存在着冷启动、数据稀疏性等问题。为解决这些问题,本文针对推荐系统做了以下的研究工作:(1)提出了一种基于知识图谱的LSH-CF推荐算法,通过融入物品语义信息解决数据稀疏性问题,从而提高推荐准确率。此外为解决用户相似度计算中的大数据问题,采用局部敏感哈希
学位
最近几年,越来越多的人开始重视并研究分形.分形积分函数Box维数的估计就是其中一个研究方向.众多学者感兴趣于这个研究方向,他们对此做了大量研究并得到许多有趣的结论.本文基于前人的研究,估计两类分形积分函数的Box维数.首先,给出有关Riemann-Liouville分数阶积分的Grüss型不等式的一般形式.其次,估计闭区间上的α-H(?)lder连续函数f(t)及其v阶Weyl分数阶积分W-vf(