基于层次分类的决策树算法研究

来源 :西安石油大学 | 被引量 : 0次 | 上传用户:chrisl0708
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据技术日益发展成熟的背景下,互联网产生的庞大数据不利于人们高效率识别其中存在的有效信息,数据挖掘可以对海量数据进行分析,从而获得数据中对人们有价值的部分。决策树算法在数据挖掘领域中应用广泛,但是当数据中存在模糊性等不确定性信息且标签具有层次结构时,现有的决策树算法首先难以处理数据中的不确定性信息,其次在处理层次分类中标签具有层次结构的数据时,一般选取层次结构的某一层标签去分类数据,这会导致当分类准确率高时,标签不具体;标签具体时,分类准确率低,无法有效做到在分类准确率尽可能高的情况下,层次标签也尽可能具体。基于上述背景,本文主要做了如下研究:对于数据集中的连续值属性,使用Kohonen特征映射算法完成对数据的离散化处理,并使用三角模糊隶属函数对数据进行模糊化处理,形成模糊数据,更恰当的表达出概念属性之间的重叠关系。基于层次熵的思想介绍了基于层次标签数据的决策树算法,针对含有模糊性等不确定性信息的数据,本文将此算法进一步扩展到模糊决策树,提出了层次模糊决策树算法。结论表明,两种算法都能有效的平衡分类准确率和标签精度。针对模糊决策树关键参数通常按经验给定的问题,本文将改进的粒子群算法和层次模糊决策树结合,优化了模糊决策树的重要参数。通过实验从分类准确率、适应度值和规则数量进行比较后,说明了算法的有效性。将一种模糊规则约简算法引入基于改进粒子群的层次模糊决策树优化算法中,对模型生成的模糊规则做进一步约简,进一步提高了模型的分类效率和性能。综上,针对层次分类中标签具有层次结构这一情况,本文提出一种层次模糊决策树算法对其进行处理,并进一步将此算法和改进的粒子群算法相结合,用于模糊决策树参数的优化,最后使用一种模糊规则约简算法对生成的模糊规则进行约简。通过在两个UCI公开数据集上的实验验证了本文所提算法的有效性。
其他文献
无人机的自主着陆是其飞行中的重要环节,而对无人机进行精准定位是保障无人机安全稳定着陆的前提。传统的GPS(Global Positioning System)、RTK(Real Time Kinematic)等定位方式易受极端天气、卫星状况以及电离层等因素的影响,无法满足高精度定位、适应性强等要求。视觉定位是一种利用摄像机进行定位的技术,其抗干扰能力强、定位精度高,能适应大多数无人机着陆场景。本文
学位
多字段数据,又称为表格数据,是机器学习领域最为经典,应用最为广泛的数据类型。随着深度学习的发展,各种用于多字段数据领域的深度学习模型被不断提出。而特征表示作为影响深度学习模型性能的一个重要因素,对从数据中获取更多有价值的信息具有重要意义。离散化是特征表示中的一项重要技术。近年来的研究表明,离散化在许多模型中均能起到正面作用。但在深度学习中,通常仍对定性特征编码并对定量特征归一化,而没有对离散化的作
学位
显微CT是一种非破坏性的3D成像技术,可以在不破坏样本的情况下了解样本的内部显微结构。在石油地质领域,岩石作为最基本的研究对象,其特性能够直接反映出油气田的分布和存储能力。通过对将显微CT应用于岩芯样本而得到的岩芯断面CT图像进行计算机视觉处理,可实现岩石物性特征分析和计算的目的。在图像超分辨率领域中,深度学习可以依靠图像驱动来获得较优的网络模型,该类模型可直接从低分辨率图像重建出高分辨率图像,且
学位
油气井工程的智能化研究对于增加油气田产能、降低实际操作成本和促进油气井管理水平精细化发展具有重要意义,但是在现实开采中总是充斥着机器故障频发、及时监控困难和产量水平不可控等问题,给高效地完成油气井开采工作形成了阻碍。机器学习方法在油气井开采中相关关键问题的解决上起到了推动作用,可以有效地降低各种干扰因素的影响,减少客观问题引起突发情况的发生概率,提高油气田产量和经济效益。本文以提升油气井智能化水平
学位
随着信息化技术的不断发展,石油行业对油田生产过程的精准监控提出了新的需求,为了获取生产现场的实时工况,实现对油田生产的远程管理,就需要对采油现场的一些数据进行采集,这些实时数据是可以通过施工现场的仪器仪表获得的,本文主要对油田中仪器仪表自动化识读技术的可行性展开研究。机器视觉(Computer Vision)是专门研究用机器来模拟生物视觉功能的学科,又被称为计算机视觉,是当前精密测量领域发展的一个
学位
针对石油开采过程中相继出现的各种油井沉没度模型,或多或少地包含一些经验因素,使模型的相关参数在现场应用中需实时校正,影响模型应用的精确度。因此,构建符合抽油过程中油井渗流自然规律的沉没度模型,为油田抽油管控提供可靠的理论依据,对我国大多数已进入开采中后期的油田至关重要。为此,本文通过综合分析油井抽油过程中的流体流动规律,构建了油井抽油沉没度综合模型。在此基础上,给出了两种应用方法,提高了模型在实际
学位
近年航空领域流量成倍增长,为了保证飞行目标在飞行过程中的飞行安全,需要对飞行目标异常行为状态进行实时监控和分析,并通过飞行目标异常行为分析系统辅助操作员对飞行目标进行管理和监测。本课题主要研究内容包含异常行为分析算法和飞行目标异常行为分析系统实现两部分。在异常行为分析算法方面,传统MDLOF异常行为检测算法依赖于近邻参数k,会造成飞行目标异常行为检测准确率较低的问题,且MDLOF算法不能对异常行为
学位
随着无人机技术的广泛应用,其安全着陆被越来越多的学者关注,无人机着陆中首要的任务是准确识别着陆跑道线,这成为了近年来研究的热点方向和急需解决的难题。目前无人机视觉着陆主要分为两种方法,一种方法是利用图像处理技术和着陆标识物进行算法设计,但该方法的着陆标识物在真实场景中容易受到光照变化、遮挡等情况以及需要人工设计特征提取器和手动调整各种参数,算法的泛化性能很难保证;另一种方法是利用深度学习检测算法代
学位
公路的路面在日常生活中易于受到车辆和环境因素的影响,从而道路表面会出现各种路面病害,这些路面病害会导致公路的承载性能下降,甚至会严重影响公共交通安全,给人们的安全出行埋下隐患。为此,公路管护部门定期开展路面病害检测工作,尤其需要对路面裂缝这类病害进行检测。本文将深度学习理论引入到路面裂缝检测中,以路面裂缝为研究对象,建立了较为完备的基于深度学习的路面裂缝检测方案,确定了以目标检测技术和图像分割技术
学位
随着经济及路由建设的飞速发展,安置在道路上的监控设施不断增加,带来了海量的交通视频数据。这些数据根本无法完全通过人工手段进行处理,因此,亟需开发出高度可靠并值得信赖的智能化算法来实现这些监控视频数据的处理。车辆目标检测是交通监控系统中至关重要的一环,是诸如车辆计数,事故检测等一系列后续处理的基础。本文在对现有车辆目标检测算法进行调研及比较的基础上,通过检测精度与速度的权衡,选择了YOLOv3-ti
学位