基于标记间相关性的多标记分类算法

来源 :中南大学 | 被引量 : 0次 | 上传用户:xxxx000456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,多标记分类方法的应用也越来越广泛,现有的多标记算法一般没有充分学习标记之间的相关信息,而标记之间的信息对提高算法的分类性能很有帮助,所以有必要对多标记学习中标记相关性进行深入研究。MLkNN算法在多标记分类算法中拥有良好的性能,但其由于没有考查标记之间的相关性,因而算法性能还有进一步提升空间。本文将对MLkNN算法的后验概率公式进行改进,使其融合多标记之间相关信息,形成算法MRkNN。预先对数据集聚类,在聚类形成后的簇上再使用MRkNN算法进行预测,实验结果证明聚类后考查标记相关性的方法较大地提升了算法的准确率。KNN分类算法并不要求得出显式的规则,KNN算法一般较其他的分类算法有较高的分类准确率。鉴于KNN算法在分类上的优势,非条件类标之间相关性促进效果较小,以及条件类标相关性考查较复杂。本文提出一种基于K近邻分布条件下考察标记相关性的算法。在不同的k近邻的分布情况下,类标之间表现出不同的相关程度。实验证明在k近邻分布条件下学习多标记之间的相关性拥有比MLkNN算法更好的算法性能;并对不同的k取值对算法性能的影响进行了分析得出不同的数据集最优的K的选择是不同的,不同的算法受k值影响不同。本文对条件标记相关性和局部标记相关性的研究为多标记学习中的标记相关性考查方法提供了有益的思路。
其他文献
对等(P2P)计算是近年来兴起的一种重要网络计算技术,在很多领域都有着大量的研究与应用。随着P2P网络的不断发展,用户对P2P网络中资源的有效性、即时性及传输效率都有了更高
人们在传统搜索引擎上所用到的关键字搜索技术发展成熟,是当今最流行的搜索方式。但是用户输入关键字,搜索自己想要的东西,想表达的意思仅仅用几个关键词并不能完全表达清楚,
作为一种新型的计算模式,云计算正逐渐成为信息产业的最新发展趋势。云计算以其易扩展、按需使用、按使用付费的特点迅速吸引了大量的用户。通过使用云计算,用户不仅降低了在IT
近年来,随着信息化的高速发展,图像处理以及应用日益广泛,然而由此产生的问题也随之而来,比如图像的去噪和对图像质量的评价都是研究者们研究的重要课题。图像在采集、压缩、转换
无线传感器网络负责感知、采集、处理和监控环境数据,但是容易受限于资源。压缩感知理论表明,通过求解最优化问题,稀疏信号可以从少量的非自适应线性投影中得到高概率的精确恢复
如今,智能手机行业飞速发展,尤其是Android智能手机更是得到了广泛普及,成为人们重要的交流工具。但是Android智能手机上恶意软件泛滥,给用户的信息安全带来巨大的威胁。软件检测
随着信息技术的迅猛发展,海量数据日益增长,传统的信号处理模式已经越来越不能够适应这种局面,信号处理能力也受到了极大的挑战。压缩感知理论应运而生。压缩感知理论能够从
随着Web2.0的不断发展,用户之间的互动成为网络新的发展趋势。社区问答系统为用户的交互提供了便利的平台,这使得社区问答系统必须拥有庞大的知识数据库并能对新提交问题做出
随着云计算技术越来越多地应用到信息产业的各个领域,对云环境下多种异构资源进行监测和管理日益重要。云计算平台具有虚拟性、层次性以及动态性等特点,相比其它大规模分布式网
随着电子管理系统的高速发展,每天都有大量的商业经营数据产生,运用数据挖掘算法从这些经营数据中提取商业信息变得越来越有价值。  根据历史交易数据,将商品按照利润相关的某