SVM在决策树归纳中的应用

来源 :河北大学 | 被引量 : 0次 | 上传用户:Hzw_56
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树归纳学习算法是机器学习中最重要的算法之一。目前通常采用启发式方法来构建决策树,因此探索各种启发式算法成了决策树研究的一个焦点。支持向量机(SVM)是基于统计学习理论的一种小样本学习方法,考虑到支持向量机的分类间隔与泛化能力的关系,可以将SVM应用于决策树的归纳过程,使用最大间隔作为生成决策树的启发式信息,使得决策树有较强的泛化能力。本课题基于统计学习理论和支持向量机,对小样本下用最大间隔作为启发式的决策树归纳学习进行了研究。为提高决策树的泛化能力,本文在深入分析支持向量机及其反问题的基础上,将支持向量机的最大间隔理论应用到了决策树的归纳过程。首先,对支持向量机基本问题及其快速求解算法进行了探讨,在此基础上讨论了支持向量机反问题及其求解,给出了利用k-means聚类求解支持向量机反问题的算法。然后,讨论了SVM在决策树归纳中的应用,给出了用最大间隔作为启发式生成决策树的设计算法,并对算法进行了分析。最后,给出了实验过程,与用熵作启发式的二叉决策树的比较结果表明了本文算法的有效性。
其他文献
为提高光设法解决的 potentiometric 传感器(臀部) 并且进一步的反应改进它的信号 -- 噪音比率(SNR ) ,一个光集中方法被采用。试验性的研究和理论分析表明应答的信号的大小被
我国幅员辽阔,各地区的经济发展不平衡,各个城市的发展水平也不平衡,本文选取了全国36个省会城市和计划单列市作为研究考察对象,这36个城市是我国具有战略意义的重要城市,在国家和
粗集理论是一种处理不确定和不精确性问题的新型数学工具。它是在1982年被波兰数学家Z.Pawlak首次提出的,其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策
分形理论是非线性科学研究中十分活跃的一个分支,现在已被广泛应用于各个学科领域。本文主要研究时间序列的分形性质。首先,我们研究了线性和非线性多项式滤波对时间序列信号的
蒙特卡洛方法是通过不断产生随机数序列来模拟过程。它是通过产生随机数来实现的,所以计算出的问题的解存在一定的误差,所以用蒙特卡洛方法求解问题最好加入误差分析,以便可以求
样本量计算在临床试验设计或者调查中至关重要,合适的样本量可以提供合理的功效来检测临床上有显著意义的差别。为保证假设检验的结论可靠性高,常常需要一定规模的样本量。而在
为明确青春221中抗叶锈病基因的有效性及其遗传机制,以青春221为父本,分别与感病品种铭贤169和Thatcher以及小麦抗叶锈病近等基因系Lr1、Lr3和Lr23的载体品系杂交,获得F1、F2
本文是针对教育部重大项目“高校本科专业设置预测系统”中的科技人才数量预测的子问题进行研究。随着大学生数量的增加,大学生就业难的问题将日渐突出。特别是今年,金融危机渗
High signal-to-noise ratio can be achieved with the electron multiplying charge-coupled-device(EMCCD) applied in the Shack–Hartmann wavefront sensor(S–H WFS)
电力负荷预测水平己成为衡量电力系统运行管理现代化的标志之一,电力系统的正确调度、规划和运行都离不开电力负荷预测,准确的负荷预测不仅对电力系统的安全、可靠、经济运行起着重要作用,同时也是潜在节约能源的方法。尤其是准确的短期负荷预测更具有重要的意义。负荷预测的影响因素较多,不只由负荷本身的历史数据决定,还要受众多非负荷因素的影响。本文分析了电力系统负荷预测的意义和方法,介绍了电力短期负荷预测的特点及研