非平衡化标记补全的多标记学习及其应用

来源 :安庆师范大学 | 被引量 : 0次 | 上传用户:xgdiban
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记学习是处理真实世界具有丰富语义对象的主要学习框架之一。在人工智能、机器学习等方面应用广泛。在多标记学习中,示例具有多种标记属性,而这些标记间存在局部或者全局的相关性。显然合理利用标记间的这种关系可以获得额外的分类信息,这有利于提高多标记学习系统的性能。在真实世界中,样本的标记数通常远小于未标记数,否则示例的多义性将失去意义。但不可否认的是未知标记中也可能包含了大量有价值信息。目前很多考虑标记相关性学习算法都是假定标记间相关性是对称的,然而标记间关系并非一定对称。基于以上考虑,本文展开研究,主要工作如下:(1)目前众多的研究者通常直接将标签置信度矩阵作为先验知识直接加入到分类模型中,并没有考虑未标注先验知识对标签集质量的影响。基于此提出一种非平衡化标记补全的核极限学习机多标记学习算法:首先使用信息熵计算标记之间的相关关系得到标记置信度矩阵,然后利用非平衡参数方法对基础的标记置信度矩阵进行改进,构建出一个非平衡的标记补全矩阵,最后为了学习获得更加准确的标记置信度矩阵,将非平衡化的标记补全矩阵与核极限学习机进行联合学习,依此来解决多标记分类问题。(2)针对近邻空间的标记相关性问题,利用近邻空间中元素的相关性提升近邻标记空间的质量,提出一种近邻标记空间的非平衡化标记补全算法:首先利用标记之间的信息熵来衡量标记之间关系的强弱,进而获得基础标记置信度矩阵;然后利用提出的非平衡标记置信度矩阵计算方法,获得包含更多信息的非平衡标记置信度矩阵;接下来度量样本在特征空间中的相似度,得到k个近邻标记空间样本,再利用非平衡标记置信度矩阵计算得到近邻标记空间的标记补全矩阵,最后利用极限学习机作为线性分类器进行分类。(3)考虑样本特征空间信息进行重构,增强特征空间的样本联系的同时引入标记相关性信息,提出一种结合均值漂移和非平衡化标记补全的多标记学习算法:首先利用均值漂移聚类方法将特征空间中特征间的信息进行重构;接着利用标记之间的信息熵来衡量标记之间关系的强弱,进而获得基础标记置信度矩阵;然后利用提出的非平衡标记置信度矩阵计算方法,获得包含更多信息的非平衡化标记补全矩阵;最后利用重构的特征空间与非平衡化的标记补全矩阵构成新的训练集,根据新的训练集采用已有的线性分类器进行预测。
其他文献
针对某油气田原轻烃回收工艺存在的设备数量较多、综合能耗较大等问题,基于该油田开采的油气进站压力较高的特性,利用主流的膨胀深冷分离法对该油气田原“辅冷+DHX”工艺进行
农业是国民经济的基础产业,“农业、农村、农民”问题始终是关系实现现代化和全面建设小康社会的重大问题,我国能否实现现代化和实现全面小康社会,关键看农业是否实现了现代
野菊花为菊科(compositae)植物野菊Chrysanthemum indicum L.的头状花序,是我国的传统中药,作为常用中药收载于中国药典(2005版)。其性凉,味苦、辛,归肝、心经,具有清热解毒、消
铁系釉是以铁元素为主要着色剂的陶瓷釉,它是最早出现的陶瓷色釉品种。铁系釉的发明和使用改变了中国陶瓷发展史的进程,并且绵延几千年,写下了灿烂辉煌的篇章。本课题从陶瓷
针对目前蔬菜生产过程中过量施用化学肥料以致导致了一系列不良影响以及单位产量黄瓜养分吸收量研究相对滞后的实际情况,本试验在前人研究结论的基础上,以设施黄瓜为试验材料
收养问题是包含人身关系和财产关系在内的一系列的民事问题。收养关系的建立对于收养人和被收养人来说都有着非同寻常的意义。在重大的自然灾难发生之后,往往会出现大量的收
新疆地处欧亚大陆腹地,远离海洋,气候干旱,水资源对该区的发展具有重要的战略意义。水资源的短缺是制约新疆经济社会发展最主要的因素之一,对主导区域经济的农业和区域生态环
以服务为导向的联邦检索系统,采用基于开放标准和协议的数据集成技术,较好地解决了已有联邦检索系统数据集成的一些技术瓶颈,实现了数据的实际集成,提高了系统数据集成的质量。本
女性时尚杂志的办刊灵魂是“时尚”,本文认为时尚与流行不同,并在表现形式、表现群体和表现层次上比流行有所拔高。社会学家H.布卢默认为时尚是一种流行的或被接受的风格,往
目的探讨护理管理在基层院内感染预防控制管理工作中的应用效果。方法选取该院2017年6月—2018年6月80例四肢开放性骨折或损伤患者,根据入院时间分为观察组(循证护理管理)与