基于粗糙集理论的决策树预修剪学习算法研究

来源 :重庆邮电学院 重庆邮电大学 | 被引量 : 0次 | 上传用户:jieyses1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然,目前我们还不知道怎样使计算机和人一样具备强大的学习能力,然而近年来机器学习无论在应用、算法、理论,还是生物系统的研究中都已经取得了令人瞩目的进步。在这些进步中智能知识获取的研究起到了重要的作用。决策树学习是应用最广泛的归纳推理算法之一。决策树通过一个简洁的树型结构代表了原始数据的信息。它潜在的预测能力以及它的可理解性的大小,很大程度上取决于学习算法是否能够简洁地概括了这个结构。一棵决策树中不具有预测能力的部分应该终止它的生长或者对其进行修剪,修剪策略需要一种工具来衡量决策树与训练数据的关系,信息系统(决策表)的不确定性度量方法就是一种理想的工具。决策树修剪主要有预修剪和后修剪两种方法。预修剪方法比较简单直接,但精确地估计何时停止决策树的增长很困难,往往需要人为控制,或者需要专家领域知识、先验知识的控制,这大大降低了该方法的智能性,也限制了其应用的推广。文章通过分析决策表的不确定性度量,用条件属性对决策表的整体确定性来控制决策树的预修剪过程,实现了一种数据驱动下的自主式知识获取算法。并通过实验验证了算法的可行性和有效性。
其他文献
近年来,云计算的兴起为IT产业带来了新的变革。在云计算环境下,海量数据都集中存储在若干数据中心上,数据存储规模庞大。传统的存储架构难以应对海量数据带来的巨大挑战,因此研究
我国航天远景规划提出要开发星载实时综合数据处理系统,研发此系统的关键技术之一是开发优秀的、通用的嵌入式实时操作系统。同时,高性能的嵌入式实时操作系统也是我国信息产
面向服务的体系结构(SOA:Service Oriented Architecture)是一种新的软件体系结构风格类型。SOA具有分布式、跨平台、可互操作性和松散耦合等特点。它是解决企业信息化过程中
为了进一步提高软件复用程度,为软件的工业化大生产创造必要的技术条件和生产模式,对象管理组织(OMG)于2001年7月推出了模型驱动体系结构(Model Driven Architecture,MDA)草案。
本文旨在研究云计算环境中多约束情况下的虚拟资源调度管理问题。多约束一方面是指来自用户的质量属性约束,比如对响应时间和吞吐量等性能要求和对部署在云平台上应用的可用性
贝叶斯网络作为不确定性知识表达和推理的一种方法在很多领域都有着广泛的应用。贝叶斯网络是一种将贝叶斯概率方法和有向无环图的网络拓扑结构有机结合的表示模型。它是描述
信息已随着计算机技术的迅猛发展,逐步伸展到交通、工业经济、科学技术、社会安全和公共生活的各个领域,成为现代社会中不可分割的一部分。保护重要信息的安全,成为国际社会
入侵检测技术是继“防火墙”、“数据加密”等传统安全保护设施后的新一代安全保障技术。它可以识别针对计算机或网络资源的恶意企图和行为,并对此作出相应的反应,已越来越成为
随着Internet 流量的剧增,路由器成为了网络速度的瓶颈,提高其处理速度成为了路由器的研究重点之一。同时路由器作为互联网的核心设备,其可靠性同样是一个不容忽视的问题。根
前馈式神经网络是最具有代表性、应用最广的神经网络模型。误差反向传播算法(Backpropagation,BP)是其经典的训练算法。但由于BP算法是基于固定学习率的梯度算法,所以不可避免