基于SVM和组合特征的分类算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:liongliong548
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会中,数据信息以爆炸式增长,数据的样本量和维度都不断增高。数据挖掘技术的出现,有效地解决了如何从海量数据中发现有价值信息的问题。分类是数据挖掘中最重要的技术之一,被广泛应用于多个领域。如何有效地利用特征信息,提高分类算法的效果,一直是分类技术研究的热点。通过组合特征扩大特征空间的算法被证明可以有效地提高分类算法的分类效果。TSP(Top Scoring Pair)算法以特征对的形式组合特征,并选择最优特征对进行分类,具有简单高效等优点。k-TSP算法是对TSP算法的一种扩展,区别于TSP算法使用一对特征进行分类的方式,k-TSP算法使用k>0对特征进行分类。从组合特征的角度看,TSP算法使用固定的形式将任意两个特征组合为特征对,是特征线性组合的一种特殊形式。组合方式的约束限制了TSP算法中特征对的分类能力。本文使用SVM(Support Vector Machine)算法构造两特征的线性组合,用其代替TSP算法中固定的特征组合,提出了LC-TSP算法,并将LC-TSP算法扩展为使用多个线性组合特征进行分类的LC-k-TSP算法。在公共数据集上的实验证明了LC-TSP算法和LC-k-TSP算法具有比TSP算法和k-TSP算法更优的分类性能。相关性组合特征是基于一对特征的皮尔森相关系数构造出的新特征,有研究证明了其可以表示特征间相关性的变化,有利于发现类别区分能力强的特征。然而相关性组合特征的构造会引入过多的特征,可能造成维数灾难。本文根据相关性组合特征的形式和原理提出了相关性核函数,以核函数的形式隐式地构造相关性组合特征,在避免维数灾难的同时将相关性组合特征扩展到高阶多项式形式。相关性核函数本质上是一种改进的多项式核函数。本文将相关性核函数应用于SVM分类算法,提出了PCC-SVM算法。在公共数据集上对PCC-SVM算法和使用多项式核函数的SVM分类算法进行了对比。实验结果表明,PCC-SVM算法的分类效果要优于使用多项式核函数的SVM分类算法。
其他文献
本文通过对集美组长隆酒店二期项目的部分艺术工程的创作过程中的设计能力、灵感来源、材料运用、创作思维等设计元素和环节的剖析,从而论证和体现出了民间艺术在现代环境艺
"一带一路"政策的提出为中国钢铁企业指明了方向,将过剩的产能向发展中国家输出或将成为未来的研究热点;本文阐述了"一带一路"国家的钢铁行情现状,分析了我国钢铁企业融入"一
南极半岛及其附近岛屿属中新生代褶皱带,大面积分布巨厚的中新生代火山岩系,主要为钙碱性安山岩类和玄武岩类及一些花岗岩侵入体。局部出露三叠系基底沉积地层。由于南极半岛
随着人们物质生活的逐渐提高,车辆拥有量也逐年增加,但紧接着而来的交通安全问题也越发频繁。每一年的违法案例和治安管理等交通问题不断增多,比方车牌遮挡、车牌套牌和车辆
指出利用弯沉盆数据,对路面各结构层材料模量(性能)进行反算,是评价路面工作性能的重要手段,参考了大量相关文献,就目前国内外常用的反算方法进行了分析比较,对模量反算方法进行了展
2002年2月,我开始了一个习惯,随时随地收集起一些记忆和思索的碎片,其中包括一些人事的启迪,创作的体验以及读书的感悟。四年过去了,这些支离破碎的纪录逐渐彼此连接,形成一
教学改革是高等医学教育目前面临的重要课题。为了提高教学质量,结合本学科自身特点,通过以问题为基础的学习(PBL)教学模式在代谢疾病教学改革中的具体实施,培养学生解决临床工
本文采用文献研究的方法对当前国内乙型肝炎歧视的现状以及旨在消除艾滋歧视的国际项目进行研究,目的是借鉴其成功经验,研究如何有效消除乙型肝炎歧视。研究结果表明,我国在