【摘 要】
:
针对传统单标签特征选择算法不能直接应用于多标签数据的问题,提出一种多标签特征选择算法——MMLRF算法.在ReliefF的基础上,MML-RF算法提出新的类内最近邻样本查找方式,并结
【机 构】
:
广东工业大学计算机学院,广东南方报业传媒集团有限公司,广东省科技创新监测研究中心
【基金项目】
:
国家自然科学基金资助项目(61572144);广东省科技计划项目(2013B091300009,2014B070706007,2017B030307002)
论文部分内容阅读
针对传统单标签特征选择算法不能直接应用于多标签数据的问题,提出一种多标签特征选择算法——MMLRF算法.在ReliefF的基础上,MML-RF算法提出新的类内最近邻样本查找方式,并结合多标签的贡献值改进特征权值的计算方法,能很好地适应多标签数据的特点;同时为了减少特征冗余,MML-RF算法以互信息作为特征冗余度量方式,提出一种去冗余方法,能够得到更小的特征子集.实验表明,MML-RF多标签特征选择算法得到的特征子集规模较小,且在多标签数据集上具有很好的分类效果,能够提升多标签学习和数据挖掘工作的效率.
其他文献
国际联合委员会(JCI)在医院评审中关于医疗文书的书写有较明确的规定, 护理病历作为医疗文书的重要组成部分,它的真实性、完整性和统一性不仅反映在护理病历的书写质量上,更是
<正>本文从当今国内外智慧城市建设大发展形势出发,提出每个城市应在具体条件下,确定具有自身特点的智慧城市建设之路。本文介绍了从"智慧南京"到"人的现代化"南京规划的提升
目的:了解全省医疗服务情况,旨在全面了解全省医疗卫生机构的服务情况,为医疗卫生行政部门领导决策提供依据。方法:对国家卫生计生统计信息网络直报系统医疗服务情况进行分析。
从对产品生命周期功能阶段划分着手,应用IDEFO语言建立了产品全生命周期信息管理系统的总体功能模型;提出终端信息建模原理与方法,给出系统模块细化原则和信息传递原则,应用IDEF1
司马迁曾将自己的著史宗旨明确概括为“究天人之际 ,通古今之变 ,成一家之言” ,而他在贯彻这一宗旨时 ,又表现出明显的道家思想倾向。在“究天人之际”时 ,司马迁以道家的天
本文认为,我国现行车险市场上存在的无序竞争等实际问题的重要根源之一,在于车损险保险金额的确定方式存在严重的不合理性.只有按照可保利益原则的要求,把车辆本身的实际价值
野马河-大雪山断裂位于青藏高原东北缘祁连山西端,处于NEE向的阿尔金断裂向NW向的祁连山断裂转换的部位,是1条全新世活动断裂,全长170km。依据断裂几何学和活动特征可把该断裂分为3段,即肃北段
混合式教学是当前高校信息化教学改革的一种重要教学方式。在国内外混合式教学相关研究基础上,提出了混合式教学中学习者知识建构支持策略。通过采用单组前后测准实验研究,结
针对《浅谈维吾尔语词义的变化》一文中存在的问题,对词义演变的有关学术概念进行了梳理、明确,并对该文中出现的语义学理论和维吾尔词词义分析中的错误予以纠正,指出应加强当前
空调作为现代社会高品质生活的重要标志之一,其噪声越来越受到人们的重视。如何降低空调噪声已经成为各大空调企业及研究机构的研究热点。本文采用传统的覆盖法、近场测试法、