一种基于信息论的决策表连续属性离散化算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:pengxianwei1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连续属性离散化方法对后续阶段的机器学习和数据挖掘过程有着重要的意义。提出一种新的针对决策表的离散化算法,在该算法中,首先将信息熵用作判断标准,从候选断点集中选择合适的断点,然后删除一些冗余的断点来优化离散结果,在删除过程中为了尽可能保证决策表分类能力不变,使用不一致率对该过程进行控制。最后选取多组实验数据,使用当前流行的分类算法——支持向量机(SVM)对离散化后的数据进行分类预测,并与其它离散算法进行对比,结果表明本算法是有效的。
其他文献
根据OCC模型理论,提出一种在e-learning系统中基于认知评价的学生情感识别模型。采用模糊推理方法实现学生对学习事件的期望度推理,并通过构建动态贝叶斯网络对所构建的模型进
基于万维网(Web)的商务智能和决策系统成功的关键是遴选并使用万维网上的高质量信息。由于Web资源具有高动态性、高自主性、数据海量、信息类型多样,以及应用要求不同等特点,造成
自动信任协商为开放环境中希望进行资源共享或业务协作的陌生双方提供了一种灵活的信任建立方法。然而现有自动信任协商系统之间不具备可互相操作性,首要原因是缺少一个统一
在博弈求解中参与者被假定为理性的,即总是追求其最大期望效用。但这一理性假设在博弈论中没有一个很清晰的形式定义,通常是把主体间对理性的相互认识假设为公共知识(common kno
通过运用SMO分解思想和支持向量回归机SVR模型的约束条件,将SVR模型的求解问题转化成一系列的给定区间内抛物线的最小值求解问题,对于非正定核而言由于只改变其中部分抛物线的
在放大转发的OFDM协作通信网络中,由于第一跳传输(源节点到中继节点)与第二跳传输(中继节点到目的节点)的信道存在独立性,因此合适的子载波映射策略可以有效地提高信道容量,但存
移动自组网具有无线信道、动态拓扑、缺乏基础设施和节点资源受限等特点,更易受到安全威胁,且无法部署复杂的安全协议和算法。为了有效检测移动自组网中的异常访问行为,提出