代价敏感特征选择的两种算法研究

来源 :闽南师范大学 | 被引量 : 0次 | 上传用户：qxd986319

【摘要】

：

随着互联网技术的快速发展,在实际应用中出现了大量复杂的数据,这些数据往往带有多个标签类别。因此,从这些复杂的数据中获取有用数据就要付出更多的金钱、时间,资源等代价。

【作者】

：

王晓鹏

【机构】

：

闽南师范大学

【出处】

：

闽南师范大学

【发表日期】

：

2016年期

【关键词】

：

特征选择非负矩阵分解多标签学习代价敏感学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的快速发展,在实际应用中出现了大量复杂的数据,这些数据往往带有多个标签类别。因此,从这些复杂的数据中获取有用数据就要付出更多的金钱、时间,资源等代价。所以,如何在有限的代价下,从高维的、多标签的数据中获取最有效的信息,已成为数据挖掘研究的热门问题。近年来出现的代价敏感学习在数据挖掘中起到了巨大的作用,而代价敏感特征选择又是代价敏感学习中一个比较典型的问题,其目标是在选取最优子集的过程中,要尽量减少测试代价、误分类代价或总代价。针对这一问题,学者们提出了启发式搜索算法,智能优化算法和很多其它优化算法,但是通常这些算法只收敛于局部最优或者其运行效率也不尽人意。非负矩阵分解方法和多标签学习理论能有效地处理海量的数据,己成为高维数据降维分析领域的重要研究方向。因此,本文在对现有非负矩阵分解算法、多标签学习理论和代价敏感学习深入分析和研究的基础上,通过将非负矩阵分解应用于代价敏感特征选择之中,多标签学习与代价敏感相结合,提出了基于非负矩阵分解的代价敏感特征选择算法和多标签背景下的代价敏感特征选择算法。本文将从以下两方面进行研究:一、针对代价敏感学习的特征选择问题,本文提出了基于非负矩阵分解的测试代价敏感特征选择方法。首先利用随机机制产生一批初始代价解,形成代价矩阵。其次在此基础上定义了基于矩阵分解的融合近似质量,并设计了测试代价的适应度函数。最后借助迭代算法进行问题的求解,筛选出最优特征子集。实验结果表明该算法在大数据集上运行的性能良好,获得具有较低测试代价的特征子集。二、基于单标签背景下代价敏感特征选择模型,本文进行了单标签学习与多标签学习之间的转化,并提出了多标签代价敏感特征选择算法。这一算法通过赋予较大权重给代价较高的样本,从而提高代价较高类别样本的预测准确性并选择出最优特征子集,最终达到降低总代价的目的。

其他文献

幂等元集满足恒等式的富足半群

在半群代数理论中，正则半群及其于类的研究一直是半群理论的一个主流领域随着半群理论的发展，广义正则半群及其子类成为半群研究的一个重要方面.由于幂等元集的性质对半群的结

学位

半群代数富足半群拟C-半群幂等元集

几个包含Smarandache函数的方程的求解

数论，在数学学科中占据了非常重要的地位，而著名的Srnarandache问题是数论研究中十分重要的问题，它是由美籍罗马尼亚数学家Florentin Srnandache教授首先提出的.他在1993年出版

学位

Srnarandache函数欧拉函数伪Srnarandache无平方因子函数伪Srnarandache函数正整数解

书画名家庆贺《企业文明》创办30周年

期刊

企业文明书画名家

基于贝叶斯网的石油管道腐蚀研究

不确定性问题一直是人工智能领域研究的焦点,在不确定性环境下进行推理和决策日益受到人们的关注。贝叶斯网将概率论和图论有机结合,是一种自然、紧凑的联合概率分布的图形表

学位

贝叶斯网人工智能有向无圈图结构学习参数学习K2算法

广义基-仿紧空间类的若干研究

本文在文[14]和[15]的基础上对广义基-仿紧空间类进行了系统地研究。得到了基-中紧空间，基-亚紧空间，强基-仿紧空间及强基-可数仿紧空间等四种空间的一些新的刻画定理及相关性

学位

广义基-仿紧空间基-中紧空间基-亚紧空间强基-仿紧空间强基-可数仿紧空间

趣味田径教学法在大专体育教学中的运用

在教学及学习过程中,对课程的兴趣有助于学生效果以及身体素质、心理素质的提升,体育教学兴趣的提升对于学生成长意义重大.本文简述了趣味田径的概念,明确了现阶段大专体育教

期刊

趣味田径大专体育教学应用

型F的右适当半群

本学位论文研究了F-型的右适当半群的性质及其结构，全文共分为四章。第一章，引言和初步知识。第二章，通过引入F-pair的概念给出了F-型的右适当半群的构造方法。第三

学位

右适当半群F-型覆盖左消去幺半群构造方法

基于跳扩散过程末离时的信用风险模型研究

本文基于经典的结构化违约模型，假定公司资产符合跳扩散过程，用此过程对一特定边界αt的末离时来确定违约时间，并给出相应定价公式和蒙特卡罗模拟算法，然后给出对于随机返回率、

学位

信用风险结构化违约模型跳扩散过程末离时随机返回率随机利率蒙特卡罗模拟

Wishart随机波动率模型的极值期权定价

对期权进行合理的定价一直是金融界的核心课题之一,而期权定价模型是研究期权定价问题最常用也最重要的方法.最早的期权定价模型为经典的Black-Scholes期权定价模型.该定价模型中,假设标的资产收益率服从对数正态分布且其瞬时波动率为常数,然而大量的实证结果证实该定价模型不符合实际市场的运动行为特征,具有极大的局限性,尤其是瞬时波动率在实际中不可观测.于是改进Black-Scholes期权定价模型势

学位

一种针对稀有类支持向量机的新算法

支持向量机方法是流行的数据分类方法.但支持向量机方法对稀有类的分类能力不强.本文将介绍一种基于支持向量机方法的稀有点类分类方法一-针对稀有类数据的多超平面支持向量

学位

支持向量机超平面稀有类核分类

代价敏感特征选择的两种算法研究

与本文相关的学术论文