基于最大间隔的多标记特征选择算法

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:woaiwojiaren5210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标记学习问题中每个样本可以同时和多个标记相关联,因此比传统的单标记学习有更广的应用空间,并受到越来越多研究者的关注。然而,多标记学习依旧存在着维度灾难、噪音特征多等问题,亟需与之相应的多标记特征选择算法。虽然传统的特征选择算法已经得到了深入的研究,但大多数传统的特征选择算法无法直接应用于多标记学习中:一方面是因为它们通常针对单一标记设计特征评价准则,而多标记学习需要同时针对多个标记进行优化;另一方面是因为多标记学习中不同标记之间存在一定的关联信息,通常需要建模以找出并利用这些信息。在本文中,我们首先通过经典的多标记学习算法总结出多标记学习算法的一般框架,之后提出一种多标记数据样本相似性的度量方法,继而将传统单标记问题中的谱特征选择框架应用至多标记学习领域。此外,我们还提出了一种基于最大间隔的多标记特征选择算法。改进后的谱特征选择算法和所提出的基于最大间隔的多标记特征选择算法,均通过样本相似度将特征空间和标记空间的信息进行融合,既能够利用标记之间的关联信息,又独立于具体的分类算法或问题转化策略。在现实世界数据集上表现出了优异的性能,验证了我们的观点。
其他文献
随着互联网的高速发展,网络信息爆炸式增长,于此相比,互联网中的知识却相当匮乏。在此背景下,基于Web2.0的各种交互式百科知识网站应运而生并发展壮大,为用户提供了大量的有
在一个大规模分布式系统中,为了能够减少失效节点所造成的计算损失,基于卷回恢复的容错技术得到了广泛使用,其中具有代表性的如检查点技术。在设计检查点协议过程中一个关键问题
随着信息社会的发展,拥有海量数据的复杂网络不断出现,如何从这些网络中挖掘出有价值的信息是一个十分艰巨的任务。链接预测是数据挖掘领域的重要分支,也是社会网络分析的关
随着互联网的迅速发展和广泛普及,在很大程度上改变了人们的生活方式,人们不仅被动接受信息,还能与外界进行交互。互联网逐渐成为一种交互式媒体,更多的人通过博客B、BS等网
本文在分析国内外超声诊断仪市场现状后,提出一种基于ARM9的便携式B超仪器设计方案,旨在满足特殊医疗环境下对超声诊断仪的需求。   论文首先分析超声诊断仪的基本原理和结
学位
高清化和智能化是视频监控系统发展的趋势,也是衡量系统优劣的重要标准。高清化主要反映在分辨率上,而智能化主要体现在后期的视频处理上。本文从系统架构设计与实现的角度提
在未来的网络发展中,无线网络将演变成一种支持全IP、基于多种无线网络接入技术的无缝融合异构网络,它们在覆盖范围、接入能力等方面各不相同,没有一种单一的网络可以在带宽
集成无线通信、嵌入式计算、传感器和分布式信息处理技术的无线传感器网络已经成为当前信息网络研究的热点,随着廉价的CMOS摄像头及微型麦克风的出现,以及人们对图像、音频和
对于一种逻辑(?),它在一类结构C上的模型检测问题是询问一个给定的(?)语句在一个给定的C结构中是否成立。核化是一个在设计固定参数算法中广泛应用的技术。核是一个从输入实
目前,图像编辑软件的广泛应用已经导致了许多非法的数字图像使用。在这种情况下,急需开发相关的计算机技术来验证数字图像的完整性,从而阻止对数字图像的恶意伪造。图像哈希是一
学位