层次粒度支持向量机学习算法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:huoyinghaiyangzhixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine, SVM)作为机器学习研究中的一个热点,建立在统计学习理论的VC维理论和结构化风险最小化原理的基础上,在模式识别和时间序列预测等很多数据挖掘领域得到广泛的应用,具有简洁的数学形式、标准快捷的训练方法和良好的泛化性能。目前,SVM在处理实际应用中的复杂庞大数据集时能力非常有限,训练样本的多少极大地影响了SVM的训练效率且SVM在处理特定空间的分类问题时效率不高。因此,如何提高支持向量机的泛化能力且保证训练效率成为支持向量机研究中的一个重要问题,这也是本文研究的目的。支持向量机学习算法在训练过程中容易产生冗余样本,不同的训练样本对于训练过程的贡献度不同,容易错分的样本对构造分类超平面的贡献度较大,而不容易错分的样本对构造分类超平面的贡献度较小。因此,根据样本对决策超平面的贡献程度进而构造粒度支持向量机是一种简化训练复杂度提高效率的有效方法。本文将层次分类思想、粒度计算理论和传统SVM分类方法进行了融合,建立了一种有效的层次粒度支持向量机学习机制,通过引入一个衡量粒的重要性的评价指标,筛选出对建立决策边界贡献度比较大的粒,剔除部分冗余粒,用保留粒中的代表点进行构造支持向量机的训练集。这种学习机制抽取重要分类信息构造训练集进行学习器的训练,分类速度远远高于SVM,同时,由于训练可在不同层次的粒中进行,所以可获得令人满意的优于传统粒度SVM的泛化能力。论文主要工作包括:(1)对传统的SVM模型的构造和原理进行了详细的介绍,指出SVM在解决分类问题中出现的主要问题。对粒度支持向量机的算法思想进行分析和探讨,同时,对粒度支持向量机算法的优点和缺点做了详细的阐述,针对这些问题本文进行了探索研究。(2)提出一种针对大规模数据集分类的层次粒度支持向量机学习算法。这种模型通过定义一个新的数据置信度来挑选出有价值的样本(即对建立决策边界贡献度较大),并在每一层的训练中根据粒的分布情况进行自动粒划分,以获得更好的泛化能力。(3)提出一种针对密度分布不均匀数据集的动态粒度支持向量机学习算法,并对动态粒度支持向量机算法的思想进行探讨和研究。这种模型根据粒的不同分布自动进行粒划分,使SVM可以在不同层次的粒上训练,可以有效地克服传统SVM在处理大规模数据集时训练效率低下的问题,同时,也可获得较好的泛化性能。(4)为了对本文所提出的层次粒度SVM学习算法进行验证,在标准UCI数据集上进行了一系列的实验,取得了满意的预期效果。通过将本文提出的方法与经典SVM算法和传统粒度SVM算法进行实验比较,表明本文提出的层次粒度支持向量机和动态粒度支持向量机算法非常有效。本文提出的层次粒度支持向量机机制可以有效地解决大规模数据集以及数据分布不均匀的分类问题。取得的研究成果在丰富了SVM应用研究的同时,为基于认知的机器学习方法的实用化进行了有益的探索。
其他文献
  本文采用OOP技术,按照软件工程的原则,设计了一种开放式通讯模型,使其不但可兼容多种通讯协议,进行数据采集,又能做到模块的快速开发,并在实验室开发的ECON变电站监控系统中得
随着信息技术的飞速发展,作为信息载体的传输网络在各自壮大的同时,正朝着相互融合的方向进展,利用传输网络各自的优势,实施跨网业务的新技术不断涌现。本文介绍的基于嵌入式
针对复杂非线性系统的表达和控制问题一直是控制理论界的难题之一。作为一种表述方法和控制手段,模糊逻辑理论得到了大家的共同关注。本文介绍了基于Takagi—Sugeno(TS)模糊
机器人的建模与控制一直作为机器人研究中最重要的领域之一,工业、学术等各界都给予了高度重视。机器人的发展主要是控制技术的提升,机器人系统存在着非线性、强耦合、时变及其
在许多工程实际和科学研究问题中混沌现象已经成为一个无法避免的存在,因而对混沌的控制显得越来越重要。虽然自上世纪九十年代以来,混沌控制研究得到了蓬勃发展并取得了突破性
当前,随着科学的发展和技术的进步,汽车已成为人们生活中必不可少的现代交通工具,方便了人们的生活。但是不容忽视的一个问题是汽车数量的快速增长不仅带来了环境污染严重、
废纸的回收利用,是解决造纸行业原料短缺、污染严重、耗能大等问题的一条行之有效的途径,本文结合河北银象纸业废纸制浆工程对制浆过程DCS控制系统进行了研究。工作重点有两个:
本文首先介绍了网页信息抽取的背景和发展。根据所使用方法的不同,对多项相关的研究做了概要性的叙述,介绍了这些研究的思想及其优、缺点。对于目标记录所在区域的确定,本文使用
水质监测和保护是一项关系到工农业生产发展和人民身体健康的大事,由多种参数测量构成的水质监测系统具有越来越重要的地位。目前,水质监测系统除了测量准确度和实时性更高以
本文首先对网络数据库系统的体系结构、网络技术、关系数据库等进行了简单的介绍,指出随着因特网的发展,网络数据库系统的体系结构已经从主从结构发展到了B/S(Browser/server