基于标签关联关系的多标签特征选择方法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:flyrat1997
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鉴于特征选择方法在传统的单标签学习领域的成功应用,研究学者们也开始研究和拓展可以有效应用在多标签数据集上的特征选择方法,可以剔除冗余和无关的特征,保留与标签集合最相关的特征。在多标签学习中,大多数的特征选择方法忽略了标签间的关联关系,而是把整个标签集合看成一个整体,从而根据特征与整体标签的相关性选择出最终的特征子集,然而,忽略标签间的关联关系可能会导致最终选择的特征子集包含一些冗余的特征,遗漏一些重要的特征。所以,如何充分考虑标签间的关联关系,之后充分结合考虑标签间的关系和特征间的关系得到一个紧凑的特征子集,是多标签学习中一个值得研究的问题。模糊粗糙集理论是一种处理数据中包含的信息的不精确、近似性和模糊性的理论工具,具有明显的优势。本文借助模糊粗糙集理论提出了两个多标签特征选择方法:基于关联规则的多标签特征选择方法(Multi-label feature selection method based on association rules,MLFS_AR);基于谱聚类的多标签特征选择方法(Multi-label feature selection method based on spectral clustering,MLFS_SC)。首先,MLFS_AR和MLFS_SC都优先考虑了标签间的关联关系,将标签集合中相关性强的标签分到一个信息颗粒里。其次,使用得到的标签间的关联信息,借助模糊粗糙集理论,再结合最大相关最小冗余原则定义了新的特征评价函数。在特征选择过程中,MLFS_AR和MLFS_SC根据新定义的特征评价函数分别得到针对每个信息颗粒按特征重要性降序排序的特征集合,之后再分别从得到的特征集合中选取特征子集,最后按照特征融合策略将选取的特征子集取并集得到最终的特征子集。本文针对提出的两个多标签特征选择方法使用真实数据集进行了系统的实验。具体地,以五个多标签数据集为研究对象,选取了四个经典的多标签特征选择方法作为对比方法,根据在四个常用的多标签评价指标上的表现证明了所提出的两种多标签特征选择方法MLFS_AR和MLFS_SC的有效性。根据最终的实验结果综合分析,MLFS_AR和MLFS_SC具备一定自身优势。
其他文献
软件质量保证活动是软件开发过程中的重要环节。为了在保证软件质量的同时最小化测试成本,软件缺陷预测技术成为了软件工程领域的研究热点。基于被测软件实体大小的不同,缺陷预测技术主要分为粗粒度缺陷预测(文件、模块或者包)和细粒度缺陷预测(变更)。变更级缺陷预测是在开发者提交代码时,预测本次提交的代码变化是否存在缺陷的技术,又称为即时(Just-In-Time)缺陷预测。相比于粗粒度缺陷预测,即时缺陷预测技
学位
海洋蕴藏着巨大的资源,引起了全世界人们对海洋的探索。但是由于强烈的光吸收和散射,不同波长的光会以不同速率发生衰减,使得在水下获取的图像存在颜色失真,对比度低,可见性明显下降的特征。因此,一些在水下活动的探索面临着极大的困难。如何获得清晰的水下图像,成为了目前一项极具挑战性的任务。围绕这一任务,水下图像增强技术得到快速发展,包括基于传统的方法和基于网络的方法。其中传统方法过于依赖模型,参数求解要求严
学位
在计算机视觉中,语义分割作为一个经典的研究方向,其任务是对图像分配像素级标签。在深度学习思想的影响下,语义分割技术发展迅速,在视频监控,自动驾驶等领域发挥着潜在的作用。而现有的语义分割方法通过构建复杂的模型,尽管达到了高精度的要求,但是存在复杂模型参数多,分割速度较慢的问题,无法达到很好的实时性。而在语义分割的实际应用中,通常需要处理一些高分辨率图像,如何更好地保持实时性和准确性显然是一个极其重要
学位
行为识别是指通过部署在环境中的传感器或可穿戴设备收集足够多的带标记数据来构建准确的分类模型。但带标记数据的收集一般费事、费力、且价格昂贵。怎样减少数据标记的代价引起学者们的广泛关注。近年来,有研究者提出可以使用迁移学习方法,从已知环境向目标环境传递知识,以减少数据标注的代价,但还存在一定问题:(1)以往的研究方法大多需要使用少量目标域带标记数据,以寻找两个域数据之间的联系。这类方法使用带标记的目标
学位
离群点检测又称为异常值检测,在近些年作为数据挖掘技术的重要组成部分,离群点检测方法在许多领域都有着广泛的应用。离群点的集合是数据集中的一类特殊子集,它占比小且与其他大多数数据的产生机制不同。离群点检测主要用于从大量信息数据中发现离群数据。事实上,数据集中离群点所占的比例很小,但大多现有的基于密度的离群点检测方法在检测期间需要对所有数据都进行离群度的计算,这大大降低了算法的效率。此外,数据对象密度分
学位
报纸
本文运用文献资料法等研究方法,围绕体教融合的发展与演变进程、青少年体质健康发展现状与问题进行分析,提出体教融合促进青少年发展的策略。
期刊
老年持续高热验案1则吴贤仁陈××,女,86岁,汕头市人,1992年7月12日初诊。持续高热39℃以上达20余天。患者体肥胖,自觉后背部、脘腹、足心内热,烦躁,夜睡不安,不思饮食,乏力,大便秘结,间有少许干咳,尿频急。曾用中草药施治,拟方白虎汤加减未能...
期刊
2020年9月,国家体育总局和教育部印发了《关于深化体教融合促进青少年健康发展的意见》,标志着体教融合发展进入新时期。本文主要运用文献资料法、逻辑分析法等研究方法,总结了青少年体育竞赛融合3大功能定位:带动青少年体质健康、学校体育工作和人的全面发展。同时,我国青少年体育竞赛融合面临着诉求背离、系统隔阂和参赛壁垒等实然困境。基于此,本文提出我国青少年体育竞赛融合的应然路向:以奥林匹克思想为共同指向,
期刊
苍耳蠹虫治愈掌中疔并发高热1例熊晓刚(江西省德安县中医院330400)关键词掌中疔,高热,中医药治疗,苍耳蠹虫姜某某,女,23岁,农民.1990年10月15R初诊。患者左手掌中生疗发热已两周(体温39℃~39.5℃),曾肌注青霉素,效果不显,肿痛日剧...
期刊