基于决策树算法的研究及其在煤层底板突水中的应用

被引量 : 6次 | 上传用户:wangking88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我国,水害事故频繁发生,严重威胁人们的生命财产安全。而煤层底板突水现象是事故中最常见的一种,它是由多种因素综合作用的结果,情况复杂,以往的预测方法很难解决此问题。本文将煤层底板突水预测问题归纳为数据挖掘分类问题,引入决策树分类算法。决策树算法是一种简单、易懂、有效的分类方法,已经在各行各业得到了广泛的应用。尽管目前的决策树算法发展的已经较为成熟,但还有需要改进的地方:一方面,分类精度还需进一步提升;另一方面,不能很好的处理非平衡数据集。本文针对存在的问题,展开对决策树算法的研究,首先通过UCI数据集对基于优化算法建立的分类模型进行实验论证,最后将其应用于实际的煤层底板突水预测中。本文的主要创新点如下:(1)提出一种基于C4.5与CART算法建立混合节点分裂算法的分类模型。对比研究几种常见的决策树算法之间的差异及内在联系,设计一种基于C4.5与CART算法建立混合节点分裂算法的分类模型,实验结果表明,改进的分类模型的分类精度较传统的C4.5与CART算法建立的分类模型有一定程度的提高,但是幅度不大。(2)提出一种基于根节点信息的多决策树分类模型。为了更大程度的提高分类预测模型的分类精度,鉴于根节点的属性选择对于构建整个决策树的重要性,本文将每个分裂属性分别作为根节点建立n(分裂属性的个数)棵决策树,形成一种多决策树的分类器。利用UCI数据集进行分类器性能测试,实验表明,其分类精度较单棵决策树有很大的提升。(3)设计了一种基于代价敏感的决策树算法分类模型。在实际应用中少数类的误判往往会带来巨大的代价,传统决策树对非平衡数据进行分类时往往出现少数类分类困难的问题。为了减少由于数据的不平衡性带来的少数类分类误差,本文引入代价敏感理论。在进行构建决策树时,将误分类代价引入节点分裂函数中,建立综合考虑属性信息和误分类代价的代价敏感决策树,并利用不同评价指标对其进行性能评价。实验结果表明,其在保证整体分类精度和多数类分类精度较高的基础上,大大提高了少数类的分类精度,从而获得具有性能较好的决策树分类预测模型。(4)将基于代价敏感决策树算法应用于煤层底板突水预测中。本文分别采用经典的C4.5与CART算法建立突水预测模型,与基于代价敏感建立的模型进行实验,对比三种算法的准确率、真实正类率、真实负类率、G-mean值、F-measure值。实验结果表明,基于代价敏感的决策树算法与传统的决策树算法相比,有很大的优势,这对实际的煤矿防治水有很大的意义。
其他文献
探讨了虚拟制造技术的意义,介绍了Pro/E、Ansys和Adams 3种软件的功能和用途,并采用Pro/E建立增压机工作装置参数化实体模型,以此为基础,建立运动学模型,对工作装置进行运动
<正>各医疗机构:为使各家机构及伦理委员会收集、保存的文档资料,能符合GCP的基本要求,保证临床试验顺利进行,同时为满足新形势下的要求或结合部分机构的特色,本会药物临床试
劳动争议处理制度是一项重要的劳动者权利司法救济途径,这一制度在实践中面临着诸多挑战和问题。文章在对西方国家劳动争议处理制度的先进经验进行借鉴的基础上,结合我国劳动争
目前全世界有20亿以上的人受到寄生虫感染。在发展中国家,特别是在热带和亚热带地区,这种感染非常普遍,以蛔虫最多。估计有12亿人感染蛔虫,约占世界人口的1/4。钩虫有美洲钩
<正> 我国淡水渔业的主要养殖对象——鲢、鳙均能直接以浮游植物为食,浮游植物的生产量与鱼产量密切相关。众所周知,用个数或生物量所表示的浮游植物现存量(Standing crop或S
<正> 自1985~1990年深圳市共报告发生脊髓灰质炎14例,其中1985年报告1例,发病率0.14/10万,1986年6例,发病率0.75/10万,病死1例,死亡率0.12/10万,1987及1988年无病例,1989年5例
本文研究了剪切型钢纤维对快硬硫铝酸盐水泥混凝土工作性及力学性能的影响。在此基础上,通过外加剂调节,配制出可施工时间30min,初始坍落度120mm、常温2h抗压强度25MPa以上的
目的建立PCR快速扩增程序和体系,并对其技术指标进行验证。方法运用快速扩增酶Fast Start与DNA TyperTM15 plus primer mix组合并优化建立快速扩增体系,对50份静脉血卡和35份
云南发展民族节庆旅游具有天然优势和重要意义。云南发展民族节庆旅游可以更好地提升云南旅游形象、带动云南外向型经济的发展、丰富群众生活,构建云南和谐社会、弘扬民族文
目的:了解我院抗糖尿病药的使用情况与趋势,为临床合理用药提供参考。方法:采用销售金额排序法和限定日剂量(DDD)法对2009—2011年我院抗糖尿病药数据进行统计分析。结果:抗