基于多维关联规则的粒度支持向量机学习方法研究

来源 :山西大学 | 被引量 : 3次 | 上传用户:yht_816
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine, SVM)是一种通用高效的机器学习方法,能较好地处理小样本、非线性、高维数据等实际问题,目前已经成为机器学习的研究热点,并广泛应用于模式识别、函数估计和时间序列预测等数据挖掘问题,然而SVM在解决实际问题时仍然存在一定局限性,如SVM的训练速度极大地受到训练集规模的影响、在特定的空间中泛化能力受到限制、应用领域有待于进一步拓展等。针对以上问题,本文将粒度计算(Granular Computing)思想引入SVM中,用以改进传统SVM分类器的上述缺陷。本文在粒度计算和支持向量机学习框架下,以多维关联规则挖掘为手段,提出一种粒度支持向量机(Granular SVM, GSVM)学习方法,称为AR-GSVM,并且在AR-GSVM的基础上提出一种核空间上的粒度支持向量机学习方法,称为AR-KGSVM。本文的研究内容主要有以下几个方面:(1)对现有的粒度支持向量机学习模型进行了深入系统的分析。(2)提出一种原始数据空间上基于多维关联规则的粒度支持向量机学习方法AR-GSVM,该方法不仅可以有效地降低分类器的复杂性,而且本质上的可并行计算可以提高其学习效率,同时算法重点考察靠近分类边界的数据(有可能是支持向量数据),从而保证分类器具有良好的泛化能力。(3)在AR-GSVM的基础上,考虑到算法在原始空间做粒划分而在核空间进行训练造成数据分布的不一致,而使泛化能力下降的情况,本文提出核空间上的粒度支持向量机学习方法AR-KGSVM,尝试先将样本映射到高维特征空间再进行粒划分,保证了粒划分和数据训练在同一空间,从而使学习器具有更强的泛化能力。(4)在标准UCI数据集上对本文提出的学习方法进行了验证,获得了良好的预期效果。本文提出方法的重要应用是对非平衡数据的处理,通过在标准数据集上与常用非平衡数据处理方法的比较,说明了本文提出的AR-GSVM和AR-KGSVM算法非常有效。本文提出的基于多维关联规则的粒度支持向量机学习方法,将强大的机器学习方法SVM与粒度计算思想相融合,研究成果不仅可以丰富SVM的理论和方法研究,同时SVM在非平衡数据处理的成功应用也有望进一步拓展SVM的应用领域。
其他文献
地质体三维可视化(Three-dimension Geologic Body Visualization)研究作为科学计算化的核心已经成为当今研究的前沿课题之一,为深入了解地下矿体结构提供了有效解决方法。地
学位
软件漏洞是软件安全性问题的重要表现。随着系统和软件的复杂度提高和应用场景的扩展,软件漏洞呈现出数量多、影响广、危害大的趋势。针对软件漏洞的研究一直是工业界和学术界
随着通信和其他业务的不断扩展,各种交易渠道也不断增加,同时,业务的增加也带来了更多的业务处理系统,各系统向数据共享也增加,本设计就是为了改变目前多渠道、多系统之间的
随着地理信息技术的发展,地理信息系统(Geography Information System,简称GIS)的应用已渗透到各个领域,特别是Google公司在2005年推出谷歌地图产品后,给了人们以直观的GIS体
学位
近年来,XML数据流的查询处理引起了国内外学者的广泛兴趣。如何在XML数据流中有效地查询大量XPath表达式是当今研究的一个热点问题。目前,已经提出很多种在XML文档上进行XPat
信息技术的蓬勃发展,以及企业对信息系统需求的不断深化,一方面也加剧了企业对软件系统的依赖,另一方面也迫切需要企业不断的发展自身的信息化水平。企业的应用系统也从比较
学位
智能交通系统是通信技术、控制技术和计算机等技术的有效集成,其目的是充分利用现有道路基础设施资源,从整体上改善交通的安全性、高效性与舒适性。公路收费系统是智能交通系统
学位
随着传感器技术的发展及计算机计算能力的提高,关于多传感器的信息融合技术的应用也越来越广泛。在军事领域,以多传感器技术为核心内容的战场感知已成为现代战争中最具影响力的
学位
随着经济全球化和电子商务的迅猛发展,企业业务集成将面对分布、异构和动态的应用环境,传统的工作流技术也将面临巨大挑战。与此同时,面向服务的计算模式逐渐流行,Web服务技
近年来,随着物联网的发展,作为其中最为重要的射频识别(RFID)技术引起人们的广泛关注。在RFID系统基础上,结合网络技术来构建一个由大量读写器和标签所组成的物联网成为RFID