基于关联性与维度优化的多标签分类算法研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:landingyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代发展,产生了海量多类型、低密度、高维度、结构复杂的数据,当中有一类数据引起广泛关注——多标签数据。目前许多分类算法是处理单标签分类,而对于多标签的样本数据,则须利用多标签分类算法,解决多标签样本数据的分类问题以及排序问题。本文综合应用了标签与标签之间相关性优化策略、拉普拉斯矩阵正则化策略和基于非负矩阵分解的损失函数合理性策略,研究提出了基于拉普拉斯正则化极限学习机的多标签分类算法(ML-Lap-RELM)和基于投影梯度非负矩阵分解的多标签分类算法(ML-PGNMF),并设计实现了基于标签矩阵的音乐推荐系统。主要研究内容和成果如下:1.利用流形正则化极限学习机的方式由计算样点间的相似度矩阵,结合Lap-ELM计算权重矩阵的策略,并对拉普拉斯矩阵执行正则化,提出基于拉普拉斯正则化极限学习机的多标签分类算法(ML-Lap-RELM)。实验将使用六种多标签分类的评价指标,首先在不同参数条件下寻找分类效果最佳的参数,再与其他多标签分类算法对比验证其更优。实例分析与实验结果共同表明ML-LapRELM算法具有可行性,数据标签划分效果更好。2.针对NMF收敛性能较差的问题,本文使用交替计算结果使得最终结果尽可能地逼近真实结果,提出了基于投影梯度非负矩阵分解的多标签分类算法(ML-PGNMF)。通过PGNMF对原始矩阵分解后使用ML-Lap-RELM算法对高维数据进行多标签分类,验证算法的有效性。通过高维度多标签数据集上与其它降维算法进行对比,验证了ML-PGNMF算法有效可行,其分解矩阵更具可靠性、高效性。3.开发基于标签矩阵的音乐推荐系统,实现了用户模块、音乐播放模块、个性化推荐模块、管理员模块等功能模块,将算法操作进行合理划分,并有效地管理数据。本文研究贡献:通过标签关联性优化提出基于拉普拉斯正则化极限学习机的多标签分类算法;通过特征信息损失函数提出基于投影梯度非负矩阵分解的多标签分类算法;开发基于标签矩阵的音乐推荐系统。
其他文献
溶解性有机质(DOM)广泛分布于土壤和水环境中,是土壤和水环境中的重要组成部分,能够和重金属以及有机污染物结合,改变有机污染物和重金属的迁移转化性能。在湿地环境中,淹水后土壤和沉积物中DOM的释放是水体中DOM的重要来源,探明沉积物DOM的释放特性和DOM与重金属的结合机制,对于湖泊沉积物重金属污染治理具有重大意义。本文以鄱阳湖湿地沉积物为研究对象,采用静态模拟实验,结合三维荧光光谱探讨了不同溶解
学位
沉水植物作为浅水湖泊重要的初级生产者,在维持湖泊清水稳态和生物多样性中发挥着重要的作用。随着湖泊富营养化,大量沉水植物群落消失甚至衰退,湖泊从清水稳态转变为浊水稳态,水生态系统功能和结构受损。然而,在湖泊富营养化过程中沉水植物群落衰退的过程和机制仍没有完全认识清楚。近年来,众多研究表明动物牧食是影响沉水植物丰度一个重要因素,但极少有研究评估动物牧食在富营养湖泊内沉水植物群落的衰退中的作用。我国处于
学位
清醒俯卧位通气是在意识清醒患者中使用的一种辅助体位通气方式。清醒俯卧位通气能够显著改善急性呼吸窘迫综合征患者的氧合指数,降低气管插管率、病死率等。该文介绍了清醒俯卧位通气的定义、适应证、禁忌证、启动与终止时机、重点监测内容、并发症的预防与处理,并对应用过程中存在的护理难点进行总结并提出建议,以期为清醒俯卧位通气患者的护理提供参考依据,改善患者临床结局。
期刊
随着互联网金融的发展,私人资本获得了更多的投资渠道,市场可以更方便地获得大量融资。但基于各个公司资质的参差不齐再加上监管体制的不健全,为非法集资提供了良好的滋生环境。如果通过金融数据分析,识别非法集资行为,是当前维护金融秩序,保障投资人权益和金融行业健康发展的挑战性议题。在非法集资的研究领域中,目前学者大多是在法律层面对非法集资的定义和如何预防,在人工智能方面,虽然金融安全也是较为火热的研究领域,
学位
多相光助-芬顿技术是均相芬顿技术的继承和发展,是处理高浓度有机废水最具发展潜力的污水处理技术之一。废旧磷酸铁锂中无法高值化利用的磷酸铁有望成为一种低成本、无污染、循环性能优良的铁源。苯醌类化合物在可见光激发下会产生光生水合电子,利用此特性可以促进磷酸铁表面FeⅢ/FeⅡ之间的转换,最终达到对目标污染物高效降解的目的。本文比较了可见光下苯醌类化合物诱导均相芬顿降解橙Ⅱ的影响,探讨了可见光下苯醌类化合
学位
按照发热元件的不同对加热电缆进行分类介绍,从加热电缆的研究进展、应用现状和市场现状等方面对目前加热电缆的发展进行了概述。对国内外现行加热电缆标准进行了整理,按照适用范围对其进行分类,并分析了国内外加热电缆的标准在制定中存在的一些差距(引用文献69篇)。
期刊
赣南地区钨矿资源丰富,开采历史悠久,被誉为“世界钨都”。钨矿的长期开采,导致重金属污染严重,对当地生态环境和居民的健康构成潜在风险。本研究以江西省赣南大余-崇义地区某钨矿区为研究区域,采集土壤样品188件及水稻样品20件,测定土壤和水稻籽实中7种重金属(Cd、Hg、Pb、As、Cr、Cu和Zn)含量,分析研究范围内的土壤重金属污染特征并评估重金属可能造成的污染风险和健康风险。研究结果如下:研究区域
学位
多通道测光巡天望远镜(Multi-channel Photometric Survey Telescope,Mephisto)是一台较大通光口径(1.6米)、较大视场(3.14平方度)的巡天望远镜。基于望远镜像质控制、镜筒设计等综合因素的考虑,Mephisto采用了主镜焦比为1.3的快焦比设计,因此副镜对失调具有很高的灵敏度。为了保证并维持Mephisto的高分辨成像,需要通过多个边缘视场的曲率波
学位
近年来,无线体域网(Wireless Body Area Network,WBAN)逐渐成为国际上重要的研究热点,并广泛应用于金融领域,医疗领域,通信领域等。特别是医疗领域,由于无线体域网需要传输与用户相关的生理特征数据,因此,如何保证用户的个人隐私是当下亟需研究的问题之一。此外,现有的无线体域网大部分基于中心化系统架构,该架构会导致单点故障等问题,因此,一个安全的系统架构对于医疗数据的安全性也很
学位
哑语是聋哑人群体在日常生活中主要交流方式之一,在聋哑人群体间扮演着重要的角色。随着深度学习的快速发展,越来越多的学者致力于哑语识别技术研究,来解决聋哑人之间及聋哑人与正常人之间交流困难的问题。然而关于动态哑语识别领域仍然有一些问题尚待解决。(1)哑语单词是通过一系列复杂变化的手势来描述,这些手势之间具有相似性并存在一定的冗余;而且目前主流的哑语识别网络模型的参数量很庞大,导致模型很复杂,难以实现轻
学位