基于最大Margin的决策树归纳

来源 :河北大学 | 被引量 : 0次 | 上传用户:heyun102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
归学习是机器学习最主要的分支,其主要目的是从大量的数据中归纳出知识规则)用于预测新观察到事例的类别。决策树归纳是归纳学习的一种。由于NP困难,寻找最优的决策树是不现实的,从而探索各种启发式算法去产生一个高精度的决策树变成了这类研究的焦点。考虑到支持向量机(SVM)的分类间隔与泛化能力的关系,可以使用SVM的最大间隔作为生成决策树的启发式信息,使得决策树有较强的泛化能力。本课题基于统计学习理论和支持向量机,对小样本下的最大margin的决策树归纳学习系统进行了研究。本文在深入分析支持向量机及其反问题的基础上,针对实值型数据,提出了种基于最大margin的决策树归纳算法。首先,对支持向量机基本问题及其快速求解算法进行了探讨,在此基础上讨论了支持向量机反问题及其求解,给出了利用聚类求解支持向量机反问题的算法。然后,给出了用最大margin乍为启发式来生成决策树的设计思想:在生成决策树过程中,通过求解SVM反问题来划分结点。最后,给出了实验过程,与用熵作启发式的二叉决策树的比较结果表明了本文算法的有效性。
其他文献
进入九十年代以来,互联网得到了极大的发展,产生了海量的非结构化和半结构化文本信息。如何对之进行有效的组织和管理,使用户能方便、准确地查找到所需要的信息,是信息处理的一大
决策树归纳算法是归纳学习中最重要的分支之一,是归纳推理中应用最广,最实用的方法之一。模糊决策树算法是决策树算法的一种推广,使之能够处理模糊性和不可指定性信息。模糊
学位
工作流技术起源于办公自动化领域,对现代企业的发展起到了巨大的推动作用。但是,随着企业的分布性和动态性的加强,也带来了信息安全方面的问题,对数据的访问控制是企业工作流
时间序列数据大量存在于生活中的各个方面,对于时间序列数据特性的挖掘研究,具有重要的科学理论意义和工程应用价值本文针对时间序列数据以及时序数据的异常检测问题进行了相关
随着IP技术的广泛应用和无线数据业务的高速增长,无线数据业务在人们的生活中扮演着越来越重要的角色。3GPP 从 R5 版本开始在核心网采用全 IP 的网络架构,通过开放的业务开发
在传统的Web中,资源的语义信息通常是以机器难以处理的自由文本方式存储的,而资源间的语义关系是以一种隐含的方式存在。由于缺乏明确的描述,这些语义信息将不可避免地被丢失。
学位
并行软件开发是集群系统设计的关键问题之一。由于集群系统涉及复杂的组织计算,并且目前并行编程语言仍无统一标准,因此,在集群环境下直接编写大型的并行软件非常困难。随着自动
在非真实感绘制领域中,艺术风格的生成与转换一直是一个研究热点。艺术图案(线条画)被广泛的应用于科技文献插图、工业图案设计以及平面广告设计等领域,因此,风格的重用和转
随着ATM交换网和宽带综合业务数字网(B-ISDN)的迅速发展,计算机网络包含了话音、数据、视频等多种服务业务,每种业务都有不同的统计特性并需要不同的服务质量(QoS),为了充分利用