决策树分类算法C4.5中连续属性过程处理的改进

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:liongliong436
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树分类算法C4.5是数据挖掘中最常用、最经典的分类算法。但是C4.5算法也存在一些不足之处,针对C4.5算法处理连续属性比较耗时的特点,本文对连续的处理过程进行改进,以提高算法的计算效率。改进的C4.5算法与原C4.5算法相比,在构造决策树时具有相同的准确率和更高的计算速度。
其他文献
针对传统三通道RGB相机在光源光谱已知条件下不能完全恢复物体表面光谱反射率的缺点,本文构造一套多光谱成像阵列相机系统。该阵列相机采用12个大恒DH-HV1300FM型相机,且11个
现行的多数网络教学系统在学生按需学习和"因材施教"上存在局限性,本文用PSO和K均值的混合分类算法对传统的网络教学系统进行改进,根据获取的用户基本信息和兴趣特征进行聚类,
针对已有恶意代码检测技术存在不足,研究恶意代码网络传播行为,提取相应行为特征,在此基础上提出基于行为的分布式恶意代码检测技术,并进行NS-2仿真实验。实验结果表明该方法
T—SQL在实现一些复杂字符串操作时是比较困难的,由于在SQL Server中集成了CLR,可以使用C#语言开发程序来解决字符串操作问题。本文对CLR在SQL Server中的应用做了基本的阐述,详
针对FDM(Fast Distributed Association Rules Mining)可能会出现全局频繁项集丢失的问题,引入双射空间的思想和标识位,提出一种DS-CFDM(Double space-Fast Distributed associa
讨论如何通过串口通信实现手机内部信息的读、写、删,主要运用于手机的电话本、日历、文件和短信等内容。给出系统的框架设计和实现,通过串口实现手机信息的读、写、删等操作
多跳双环网络是一种较为可靠的网络拓扑结构。本文分析这种网络在1~2个节点故障的情况下,正常节点之间互相通信的能力。指出它与网络节点数、跳跃距离有关,建立各种不同情况
企业社会责任(Corporate Social Responsibility,CSR)的延展力量空前迅速发展,至今已达到一个新的颠峰期,成为企业界在面对全球潮流时必须重视的议题,因此企业领导人应从企业的
头相关传输函数(Head Related Transfer Function,HRTF)描述了在自由场情况下,点声源到人耳鼓膜处的传输过程,其中包含有重要的声源定位信息。本文搭建HRTF测量与实验环境,设计和实现一个HRTF数据库,数据库包含中国人平均头模BHead210 481个空间方位的头相关脉冲响应(Head Related Impulse Response)数据。进行主观定位判听实验,比较
对OpenCores上的OpenRISC1200项目(简称OR1200)的统计发现,条件编译指令的使用高达714次,嵌入在条件编译指令间的代码占代码总量的61.60%。条件编译在硬件开发中被大量使用,但