混合型数据的代价敏感学习方法

来源 :闽南师范大学 | 被引量 : 0次 | 上传用户：xiaoyao984

【摘要】

：

随着计算机技术的广泛应用,人类社会产生数据的速度急剧增加,大量有用信息被隐藏在海量数据中。数据挖掘则是人们提取这些信息,进而获得知识的重要技术。从大量的现实数据中

【作者】

：

范安静

【机构】

：

闽南师范大学

【出处】

：

闽南师范大学

【发表日期】

：

2016年期

【关键词】

：

粒计算代价敏感学习属性约简属性选择

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机技术的广泛应用,人类社会产生数据的速度急剧增加,大量有用信息被隐藏在海量数据中。数据挖掘则是人们提取这些信息,进而获得知识的重要技术。从大量的现实数据中挖掘隐藏在其中有用信息的过程即为数据挖掘。事实上,它们已经被成功应用到科学研究、工程、银行和医疗等各个行业,并且正在发挥着越来越重要的作用。粗糙集理论(Rough set theory)作为一种处理不确定信息的新型数学工具由Pawlak于1982年提出。粗糙集理论吸引了世界范围内许多研究者和实践者的关注。近年来,粗糙集理论及实际应用都取得了长足的发展。粗糙集理论已被成功地应用于很多领域,尤其是在机器学习和数据挖掘。目前经典粗糙集已成功处理符号型的数据,邻域粗糙集成功处理数值型的数据。同时还产生了覆盖粗糙集、决策粗糙集等诸多理论分支并成为粒计算三大理论之一。代价敏感学习是数据挖掘中十大具有挑战性问题之一。代价是在数据获取或数据处理的过程中产生的,是数据不可分割的一部分。测试代价是在进行测试时获得每条测试的属性值所付出的价值。误分类代价即为把属于一类的记录划分为另一类时需要支付的代价。代价敏感学习通过权衡测试代价和误分类代价,使得所采取的行为的代价最小或产生最优决策行为。在数据挖掘和机器学习领域,代价敏感学习既是热点问题,也是难点问题。在现实应用中,所需处理的数据多为混合了符号型数据和数值型数据的混合型数据。已有的方法在处理混合型数据的代价敏感属性选择问题时,常将不同类型的数据处理成一种类型的数据。例如,将混合型数据中的符号型数据归一化为数值型数据或将数值型的数据离散化成符号型数据。但是,这样处理混合型数据会造成数据本身信息丢失,导致属性选择的测试代价和误分类代价增加。因此,研究混合型数据的代价敏感学习无论就知识发现的理论研究,还是许多领域的应用需求都具有重要的价值。本文主要研究数据值域为混合型数据的代价敏感学习。本文的研究内容主要分为两部分:第一部分详细研究了混合型数据的测试代价敏感属性约简问题。一方面,我们提出一个改进的人工蜂群算法来解决符号型数据上的测试代价敏感属性约简问题。实验结果表明,我们所改进的算法的实验结果在很大程度上比已有的算法优越。另一方面,我们提出自适应邻域和基于自适应邻域的算法解决混合型数据上的测试代价敏感属性约简问题。实验结果表明,我们所改进的算法的实验结果在很大程度上比已有的算法优越。第二部分主要研究了混合型数据的代价敏感属性选择问题。代价敏感属性选择问题是考虑测试代价和误分类代价属性选择问题。基于自适应邻域模型,我们提出基于自适应代价属性选择算法解决混合型数据集的代价敏感属性选择问题。实验结果表明,我们所改进的算法的实验结果在很大程度上比已有的算法优越。

其他文献

几类分数阶微分方程边值问题的解的存在性

学位

基于非线性概率的一些大偏差结果及金融保险中的应用

大偏差理论是概率论的极限理论中极富成果的一个分支，它处理和中心极限定理不同的另一类极限问题，是大数定律的精密化.在数理统计、分析和物理中都有重要的应用，它的理论溯源于K

学位

金融保险极限理论大偏差理论非线性概率保险模型

高阶滞后差分方程渐近性态分析

差分方程是对客观世界中事物发展演化的数学描述之一．在许多情况下，尤其是当今计算机科学和技术迅速发展的推动下，关于时间变元的采样和测量往往是离散的．因此，差分方程成为一些学

学位

滞后差分方程特征方程渐近稳定有理型方程特征根法

基于斜矩阵和形态学的多进Haar小波

小波变换是一个时间和频率的局域变换,能有效的从信号中提取信息,在图像压缩,图像去噪,图像融合、模式识别等众多领域中获得了广泛的应用。但是小波分析作为一种线性信号的分

学位

小波变换形态小波非线性多进制小波Haar小波斜变换Walsh变换纹理分类

素环和半素环上的导子与中心化子

自从E.C.Posner提出了素环上的导子和中心化子的问题并给出了著名的Pos-ner定理以来，人们在素环、半素环以及其理想、Lie理想等子集上用不同的方法推广和完善了导子和中心化子

学位

抽象代数半素环中心化子左导子

矩阵形式的素理想回避引理

素理想回避引理是交换代数的一个简单而又非常有用的引理，它可以叙述如下：设R是交换环，P1,P2,…,Ps是环R的素理想，I,J是环R的理想。如果I(≤)J,I(≤)P1,I(≤)P2,…,I(≤)Ps,则存

学位

交换代数矩阵结构自由分解回避引理

超立方体和蜂窝矩形环托中的圈和路嵌入

图的嵌入问题是衡量一个互连网络的中心问题之一，它的重要性在于我们可以将关于客图的已有算法应用到主图中．环和线性阵列由于通信成本低廉，因而是并行处理和分布计算中的两个基

学位

超立方体蜂窝矩形环托图嵌入路嵌入网络拓扑结构

关于高职环境艺术设计专业利用移动通讯设施进行“建筑装饰材料”课程考核的改革尝试

针对信息时代智能手机等移动通讯设施成为了人们手足般不可缺少之工具,充分遵循了学习者认知规律及学习心理的变化,采用了移动通讯设施进行“建筑装饰材料”课程考核的改革尝

期刊

课程考核移动终端

神经内科教学查房中病案导学式教学法的运用探讨

伴随当前教育教学改革的持续深入,怎样优化、改进、完善教学方法,是培养综合实用型医学人才,最快、最好达成教学目标的关键所在.

期刊

神经内科教学查房病案导学式教学法运用

关于新疆焉耆县对“花儿”传承保护工作的调查

新疆焉耆县是“花儿”的故乡,“花儿”文化源远流长.多年来,焉耆县认真开展新疆“花儿”的传承保护工作,通过多方面的努力,“花儿”这种具有浓郁特色的民族民间艺术,被更多的

期刊

焉耆县花儿传承保护调查

混合型数据的代价敏感学习方法

与本文相关的学术论文