基于偏最小二乘回归的多标签分类算法研究

被引量 : 0次 | 上传用户:zq0453
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,随着计算机硬件和软件技术的快速发展,不断涌现出大量功能强大且价格合理的数据存储介质。数据存储能力的极大提升推动了数据库技术的快速发展。大量的数据库系统被用来管理大容量存储介质上的海量数据。但由于缺乏有效的管理工具,隐藏在这些海量数据背后的有用知识却不能被人们所发现和利用。为了有效地将这些知识用于科学研究、欺诈检测、生产管理、市场分析、工程规划等领域,从海量数据中发现这些知识的工具——数据挖掘技术得到了蓬勃的兴起和发展。分类是数据挖掘中进行数据分析的一个重要研究方向。它从预先定义的数据类中得出一个分类模型来预测未分类的数据。在传统的分类中,每个样本仅有一个标签,它们属于单标签分类。然而在许多实际应用中,每个样本同时拥有几个不同的标签,这些属于多标签分类。近年来,由于多标签数据的普遍存在和广泛的应用价值,越来越多的研究者对其产生了浓厚的兴趣。随着多标签分类问题研究的不断深入,人们将各种不同的学习方法应用到多标签分类问题中,提出了大量的多标签分类学习算法,解决了实际应用中的很多不同问题。例如,在多元统计分析中,典型相关分析是研究两组多维变量之间相互关系的一种技术,它已经成功地应用到多标签分类问题中。同样地,在多元统计分析中,偏最小二乘回归具有多元线性回归和主成分分析的优点,它也能够通过一组多维变量预测另一组多维变量。偏最小二乘回归通过最小二乘回归拓展而来,在化学领域得到了最初的应用。近年来,偏最小二乘回归在经济、水利、环保和电力等领域都得到了广泛的应用,并取得了良好的效果。在分类问题中,偏最小二乘回归作为降维方法与其它方法相结合进行过分类,也直接作过单标签分类方法。但偏最小二乘回归还未直接应用于多标签分类问题中。本文研究基于偏最小二乘回归的多标签分类问题,主要研究内容包括:(1)由于偏最小二乘回归能够将两组多维变量相关联,并能通过一组多维自变量预测另一组多维因变量,因而将偏最小二乘回归方法与多标签分类相结合,提出基于偏最小二乘回归的多标签分类算法。首先,基于非线性迭代偏最小二乘算法构建偏最小二乘回归模型;然后,根据多标签分类的特点,将训练集中的训练数据通过偏最小二乘回归得到一个多标签分类模型,再通过这个多标签分类模型对测试集中的测试数据进行多标签分类。(2)将基于偏最小二乘回归的多标签分类算法在现实中的多标签数据集上进行仿真实验。在实验的过程中,将该多标签分类算法与其它的多标签分类算法进行对比,以验证其良好的多标签分类性能。在对比的过程中,采用十字交叉验证法进行验证,并采用多标签分类的性能评价准则对实验结果进行评价。实验结果表明基于偏最小二乘回归的多标签分类算法在多标签分类性能上明显优于其它的多标签分类算法。
其他文献
草菇炒山药主料:草菇300克,山药300克,黑木耳100克。调料:食盐适量,葱适量,植物油适量,生粉适量。做法:1.草菇清洗干净后对半切。2.黑木耳提前浸泡好,山药在火上烤一下后冲洗
在新能源汽车逐渐走进人们生活且市场日趋成熟化的道路上,车辆将会需要数量多且种类不同的能源补充方式,所以建立一个能整合多种能源补充的服务体系是十分必要的。本文将多种
目的探讨脾多肽注射液对手术老年直肠癌患者术后淋巴细胞亚型的影响。方法前瞻性的收集2016年1月至2017年12月就诊于山西省肿瘤医院结直肠外科的老年直肠癌患者(65周岁及以上
<正>党的十八大报告提出,要坚持走中国特色军民融合式发展路子。中央军委颁布的《全面建设现代后勤纲要》明确提出要"构建军民结合的军事物流体系"。"军民结合的军事物流体系
1猪胃溃疡的危害1.1胃溃疡的存在会影响母猪对饲料中营养物质的吸收利用,影响母猪的健康状况,造成母猪背毛粗乱。体况瘦弱,发育不良,抗病力减弱,发情不正常,泌乳不足等现象,同时影响
本文以国家级绿茶良种福鼎大白茶为对照(CK),对浙江茶区引进四川茶区的茶树品种中茶108、中茶302和中茶102的茶树的生长势、物候期、芽叶性状、品质生化成分含量及组分、含氟
紫甘薯是甘薯中的新型特有品种,除了具有普通甘薯的营养成分外,还富含花色苷等生物活性物质。本文利用两种优质紫甘薯(越南紫薯和日本紫薯王)酿制发酵型紫甘薯酒,并对其花色
利用电子鼻技术和固相微萃取结合气相色谱-质谱检测技术法检测对比分析紫薯酸奶与普通酸奶的挥发性物质。研究表明:利用电子鼻检测并进行主成分分析可以有效地区分紫薯酸奶和
改革开放30年来,社会经济文化快速发展的同时,人们的饮酒习惯和饮酒方式发生了变化,饮酒也更加注重文明与健康。为了满足人们的生活需求,在食用酒精质量与产量不断提高的前提下,纯