决策树分类算法的研究及应用

被引量 : 10次 | 上传用户:wolf12066
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘领域研究的重要课题。常用的分类模型有决策树、神经网络、遗传算法、粗糙集等。本文主要研究决策树ID3算法及其改进算法。首先阐述了决策树的相关理论,并对几种典型的决策树算法进行了分析比较。然后,针对ID3算法存在的不足,提出了基于属性优先关联度的ID3算法(AID3),实验证明AID3算法加快了决策树的构建速度,同时也克服了ID3算法往往偏向于选择取值较多的属性的缺点,随着数据规模的增大,决策树的分类性能也越来越好。最后,探讨了AID3算法在人力资源管理中的实际应用,结果分析进一步表明AI
其他文献
药物虚拟筛选是采用分子对接技术,针对某一靶标的结构,通过分子模拟的方式在化合物库中寻找与靶标结合较好的小分子,预测小分子的生理活性。当突发性传染病爆发时,能否迅速找出可用于治疗新型急性传染病的候选药物至关重要。目前地球上约有3500万已知结构药物化合物分子,在个人计算机上,完成针对单一蛋白靶标的所有筛选工作需要十几年,即使在天河二号超级计算机上使用目前的高通量方法,依然需要数十天。因此,必须开发出
蓝牙无线通信协议的设备连接机制是通过设备发现实现的。蓝牙设备发现机制的性能直接影响着蓝牙无线通信的效率。本文首先讨论了蓝牙设备连接机制的基本原理,分析了蓝牙无线设
随着计算机视觉、人工智能和思维科学领域的不断发展,数字图像处理的研究和应用正在向更高、更深、更广的层次迈进。图像分割作为模式识别、目标跟踪、图像理解和机器视觉等
随着半导体技术和无线通信技术的不断发展,出现了多种短距离无线通信技术,如HomeRF、IrDA、BlueTooth以及ZigBee等。无线通信技术和网络技术的结合,形成无线网络技术,出现了无线
仿真系统初始化程序往往需要在对系统初始化需求和想定数据组织进行明确理解的基础上开发,而目前系统初始化需求和想定数据组织均缺乏统一规范的描述,初始化变量与想定数据间
工作流技术一直是计算机应用领域的一个研究热点。随着分布式计算技术和高速网络技术的飞速发展,现代企业的信息资源越来越表现出一种异构、分布、松散耦合的特点。在这样的技
PDM(PDM:Product Data Management)是一门用来管理所有与产品相关信息(包括零件信息、配置、文档、CAD文件、结构、权限信息等)和所有与产品相关过程(包括过程定义和管理)的技
SOA对现代软件开发模式产生了深远的影响,它通过服务的发布、发现以及绑定等机制为其他的应用程序提供服务。SOA具有松散耦合、粗粒度、互操作性等优点。通过采用SOA架构的设
随着网络的发展,信息呈几何级增长,而网络信息资源的载体多种多样,加上所处的平台及其使用的语言和标准并不一致这就给各个领域信息资源的管理和使用带来了诸多困难。人们面
回归测试的主要目标是在程序修改后,通过在原有测试用例集中选取部分或全部可用用例,只对修改的部分重新测试。这样既可提高测试效率,又能达到与完全测试相同的测试覆盖。回归测