基于轨检车检测数据的决策树分类算法的研究与应用

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:naonao6521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)是从大量数据中发现潜在规律、提取有用知识的方法和技术。近年来,数据挖掘受到了普遍关注,已经成为信息系统和计算机科学领域研究中最活跃的部分。 数据挖掘技术从一开始就是面向应用的。目前,在很多领域,数据挖掘都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售等领域。但数据挖掘技术应用于轨检车检测数据分析领域,目前研究较少。铁路线路检测产生了大量的轨检车检测数据,期待对其进行挖掘,找出其中潜在的规律,以对未来的数据进行分析与预测。因此,本文以真实的轨检车检测数据为例,阐述轨检车检测数据分析的意义、现状及存在的不合理点,具体提出利用数据挖掘分类算法对庞大的轨检车检测数据进行分析与预测的改进设想。 分类算法最知名的是决策树方法(Decision Tree),决策树是用于分类的一种树结构。其中的每个内部节点(internal node)代表对某个属性的一次测试,一条边代表一个测试结果,叶子(leaf)代表某个类(class)或者类的分布(class distribution),最上面的节点是根节点。决策树分类法由于其分类效率高、速度快、可理解性强、简洁性好等优点,在海量数据环境中应用最为广泛。 本文全面介绍了决策树分类算法的研究现状和研究热点,重点分析了ID3算法和C4.5算法。在此基础上提出了一种改进算法QC4.5,该算法在分析C4.5法实现的时间复杂度与空间复杂度的基础上,针对其对连续型属性的处理提出了两种改进方案,在决策树递归生成过程中,根据属性值的特点选择最优的方案来计算属性的信息增益。通过实验数据表明,QC4.5的执行效率优于C4.5,证明了算法的可行性。 另外,本文在深入研究决策树分类算法的基础上,并结合轨检车检测数据分类的需要,开发了一个轨检车检测数据分类系统,可以作为一个通用的数据挖掘平台应用于各个领域。
其他文献
微小型仿生机器人发展的基本要求是系统轻便、多自由度、运动灵活、控制简单,传统的电磁驱动及传动方式,如电机加齿轮等方式结构复杂,很难满足这一要求。智能材料驱动为人们提供
学位
目前计算机网络面临着很大的安全风险和威胁,但当前安全评估理论的匮乏,导致实际中很多安全评估规范性差且效率低,这就要求建立科学有效的安全评价体系。而目前大部分的安全
本文通过对荣华二采区10
期刊
车辆牌照自动识别系统是现代智能交通管理的重要组成部分,可用于各级各类车辆管理场所。与传统的车辆管理方法相比,它大大地提高了管理效率与水平,节省了人力、物力,实现了车辆管
随着高速铁路的迅猛发展,对铁路供电的安全性和可靠性提出了更高的要求。本文从客运专线电力贯通线路的特点和电力电缆线路故障定位研究现状出发,对客运专线电力贯通线路的故障测距方法进行了研究。分析了电力电缆贯通线路的故障行波暂态特征,根据行波零模和线模分量的传播特性,确定了采用线模分量进行故障测距。对单端行波测距法和双端行波测距法的原理和存在的问题做了详细分析,通过比选并结合客运专线电力电缆贯通线路的特点
羊焦虫病是由泰勒科的山羊泰勒焦虫引起的血液原虫病.rn1 流行特点rn主要感染4月龄以上的羊只,纯种小尾寒羊比本地土种羊易感,无性别差异;集中发生于春秋两季,其它季节呈零星
期刊
梯级水电站群联合发电优化调度是水电能源科学与系统科学交叉发展的前沿研究领域之一,受到了学术界和工程界的共同关注。受水文气象、调度方式、用水需求、电网负荷及径流来水
基于网络的多媒体通信广泛应用于社会生活的众多领域。图像和视频的海量信息,给存储容量、传输信道的带宽以及计算机的处理速度带来了极大压力。这就需要在保证重建的视频图
当前,体制改革后的电力企业面临的竞争压力日益增大,集智能化与复杂化于一体的供电系统及其组成设备日常维护要求不断增高,相应的维修支出也已成为供电企业的一项重要支出。因此,着力提升电力系统设备检修效率、节省系统运行维护支出,对于保证电力稳定运行、缩减电力公司年底开支有着重要意义。其中,继电保护装置在维持电力系统安全可靠运行方面地位十分突出,因而必须重视对这类设备的检修维护工作。在此背景下,本文首先总结