多标签特征选择及分类器链算法的研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:guoerxong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着机器学习领域的迅速发展,分类问题作为机器学习领域一个重要问题得到广泛研究和应用。分类问题通常指单标签分类,即将未知实例划分到单一类别中,然而现实世界中的许多应用场景是多标签的,即实例同时归于多个类别之中。多标签分类最早应用于文本分类中,现在已在图像标注、音乐情感分类、生物信息学、信息检索等多个场景得到研究和应用。多标签特征选择算法和分类算法是多标签研究领域的两个重要部分,由于多标签的特性使得特征选择算法相较单标签特征选择更为复杂,而现在已有的多标签分类算法仍有很大的改进空间。本文对多标签特征选择算法和多标签分类算法两方面进行研究,主要工作如下:(1)提出了基于遗传算法和最大相关最小冗余的多标签特征选择算法(MLFS-GM)。MLFS-GM算法基于遗传算法和最大相关最小冗余策略:考虑标签之间的相关性,特征之间的冗余性以及特征与标签之间的相关性,用信息论中的互信息建模相关性和冗余性,从而给出遗传算法的特征集适应度函数。在多个多标签公开数据集上的实验表明,本文算法在绝大多数评价指标上优于同样基于遗传算法的GA-ML-CFS算法和采用信息增益建模标签与特征相关性的MLFSIE 算法。(2)对于传统分类器链方法中错误传递和链序随机生成的问题,提出了基于标签集划分和贪心策略的多标签分类器链算法(CC-LPGS)。CC-LPGS算法由两步构成,首先根据互信息建模标签之间的相关性,运用对称不确定性构造标签集的相关性图及相关性矩阵,进而应用NJW谱聚类算法对标签集进行聚类划分。其次对于每个划分的标签子集,采用贪心搜索策略迭代生成该标签子集的完整分类器链。将训练集随机划分为构建集和评价集两个部分,构建集用于训练候选分类器子链,评价集用于评价候选分类器子链性能,每次选择评分最高的分类器加入分类器子链中,迭代地生成完整分类器链。在多个数据集上的实验表明,CC-LPGS算法在各多标签评价指标上均优于传统的分类器链算法,在部分指标上优于其他多标签分类器算法。
其他文献
Totally 150 individuals of 1-day-old Guangxi Jinling partridges were randomly divided into five groups,30 chickens each group. Chickens in control group were fe
随着社会经济飞速发展,汽车数量也在逐渐的增加,这样的情况导致了我国交通行业的飞速发展。交通行业的发展为交通系统的完善提供了物质基础,通过计算机采集交通信息,能够有效
随着中国航空工业的快速发展,中航工业对企业研发项目基础建设配套设施和维护的投入逐年加大。建设项目周期长、规模大、资金投入多、效益直接体现,受到企业管理层高度重视。
文章以广西防城港防城区二桥梁板桥维修加固工程为例,介绍了采用粘贴碳纤维布进行板式梁桥梁板加固的关键技术及施工工艺,充分利用了碳纤维布这种新型复合材料的轻质、抗拉强
文章基于对隧道塌方成因及各种类型塌方处治方法的总结,分析了依托工程冒顶塌方的成因,提出了地表与洞内相结合的处治设计方案,为公路隧道塌方处治提供参考。
目的:探讨不同阶梯浓度的庆大霉素明胶海绵浆治疗顽固性梅尼埃病的临床意义。方法对7例诊断为顽固性梅尼埃病患者并经过常规鼓室注射庆大霉素治疗无效后,通过鼓室内多次注入不
唐警古道也叫馒头岭(古)驿道,即今天的214国道,是我国古代历史上一条非常著名的交通大道,也是唐代以来中原内地去往青海、西藏乃至尼泊尔、印度等国的必经之路。著名的文成公主远
本文从聚羧酸减水剂合成设计的角度,研究了AMPS和HEA不同摩尔比,对聚羧酸减水剂性能的影响。同时对比了聚羧酸减水剂和萘系减水剂在混凝土强度、收缩率、抗硫酸盐侵蚀方面的
描述了改进的用于监测高压设备的电流传感器,根据传感器的等效电路模型,针对在线监测的穿心式传感器,研究了如何改进其频率性能,提高频率带宽的方法。通过传感器电子电路的分析和
美国市场是我国重要的纺织品服装出口市场,因此,及时了解、研究美国市场的准入规则,有利于扩大我国纺织品的出口份额.概括介绍了美国部分纺织品相关组织、法规及内容、质量标