一种基于信息论的决策表连续属性离散化算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户：pengxianwei1986

【摘要】

：

连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法，在该算法中，首先将信息熵用作判断标准，从候选断点集中选择合适的

【作者】

：

岳海亮闫德勤

【机构】

：

辽宁师范大学计算机与信息技术学院

【出处】

：

计算机科学

【发表日期】

：

2010年4期

【关键词】

：

连续属性离散化决策表信息熵不一致率 Discretization Decision table Information entropy Inconsi

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法，在该算法中，首先将信息熵用作判断标准，从候选断点集中选择合适的断点，然后删除一些冗余的断点来优化离散结果，在删除过程中为了尽可能保证决策表分类能力不变，使用不一致率对该过程进行控制。最后选取多组实验数据，使用当前流行的分类算法——支持向量机（SVM）对离散化后的数据进行分类预测，并与其它离散算法进行对比，结果表明本算法是有效的。

其他文献

基于OCC模型的E-learning系统情感建模

根据OCC模型理论，提出一种在e-learning系统中基于认知评价的学生情感识别模型。采用模糊推理方法实现学生对学习事件的期望度推理，并通过构建动态贝叶斯网络对所构建的模型进

期刊

OCC模型认知评价动态贝叶斯网络情感缺失情感建模OCC model Cognition appraisal Dynamic Bayesian netw

万维网资源质量模式挖掘技术分析

基于万维网（Web）的商务智能和决策系统成功的关键是遴选并使用万维网上的高质量信息。由于Web资源具有高动态性、高自主性、数据海量、信息类型多样，以及应用要求不同等特点，造成

期刊

Web资源质量质量模式挖掘元数据管理质量评测方法Web source quality Quality pattern mining Metadata

一种不依赖于协商策略的信任协商协议

自动信任协商为开放环境中希望进行资源共享或业务协作的陌生双方提供了一种灵活的信任建立方法。然而现有自动信任协商系统之间不具备可互相操作性,首要原因是缺少一个统一

期刊

自动信任协商协商协议协商策略可互操作性Automated trust negotiation Negotiation protocol Negoti

对博弈解概念认知和理性条件的逻辑分析

在博弈求解中参与者被假定为理性的，即总是追求其最大期望效用。但这一理性假设在博弈论中没有一个很清晰的形式定义，通常是把主体间对理性的相互认识假设为公共知识（common kno

期刊

理性算法共知识公开宣告Rationality Algorithm Common knowledge Public announcement

求解非正定核Huber—SVR的SMO算法

通过运用SMO分解思想和支持向量回归机SVR模型的约束条件，将SVR模型的求解问题转化成一系列的给定区间内抛物线的最小值求解问题，对于非正定核而言由于只改变其中部分抛物线的

期刊

非正定核核方法SMO算法支持向量回归机Non-positive kernel Kernel method SMO algorithm SVR

OFDM协作通信中基于子载波映射的自适应传输策略

在放大转发的OFDM协作通信网络中,由于第一跳传输（源节点到中继节点）与第二跳传输（中继节点到目的节点）的信道存在独立性,因此合适的子载波映射策略可以有效地提高信道容量,但存

期刊

协作通信正交频分复用子载波映射Cooperative communication Orthogonal frequency division multi

基于在线聚类和检测成本的移动自组网异常检测

移动自组网具有无线信道、动态拓扑、缺乏基础设施和节点资源受限等特点,更易受到安全威胁,且无法部署复杂的安全协议和算法。为了有效检测移动自组网中的异常访问行为,提出

期刊

移动自组网在线聚类检测成本异常检测Mobile ad hoc networks Online clustering Detective cost

一种基于信息论的决策表连续属性离散化算法

与本文相关的学术论文