基于边界检测的快速一类支持向量机训练方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:liqingxian1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,数据的有效处理与应用变得尤为重要,而机器学习则是进行数据处理的重要工具。其中,分类是机器学习中十分重要的研究课题。分类指的是对训练样本进行学习而得到分类器,然后用分类器将一个未知标签的样本标记为某个类别。而单分类/一分类(One Class Classification,OCC)是一种特殊的分类问题,即在分类器的学习训练阶段,只通过对正样本这一个类别的数据进行学习,就可以得到分类器(这不同于二分类问题,必须通过对正负两类数据的学习训练,才能得到分类器)。而应用最为广泛的单分类算法是单类/一类支持向量机(One-Class Support Vector Machine,OC-SVM)。由于继承了支持向量机的优良特性,遵从结构风险化原则,优秀的泛化性能,在模式识别,文本分类,异类检测等领域应用广泛。本文对单分类方法(OCC)尤其是单类支持向量机(OC-SVM)进行了系统的研究,所取得的主要研究成果为:  1.对常见的单分类算法(OCC)进行了系统阐述和比较,并分析了常见单分类算法间的不同特点与应用场合。对单类支持向量机算法(OC-SVM)做了深入研究,分析了两种单类支持向量机算法,即支持向量数据描述(Support Vector Data Description,SVDD)和?-支持向量分类器(Support Vector Classifier,ν-SVC),并在几何和数学意义上统一描述了这两种单类支持向量机的等同性。  2.对单类支持向量机在大规模数据上的训练时间复杂度问题进行了研究。利用其支持向量特点,提出了一种基于边界检测的快速训练方法,有效解决了其训练时间复杂度问题。为更好地提取边界样本,本文提出了一种基于角度-密度度量的边界检测方法。在多个标准数据集上进行了实验验证,实验结果表明,这种方法可以有效解决单类支持向量机的训练复杂度问题。单类支持向量机的决策函数由位于边界区域的少量的支持向量决定。因此位于边界区域的样本被认为是对分类结果最有影响的样本子集。所以本人将会用边界样本来重构一个更小规模的样本子集。同时为了保留训练样本的全局分布特性,本文将聚类中心点与边界样本合并得到重构样本集。这样,在重构样本集上训练的单类支持向量机拥有更小的训练复杂度,且分类精度可以得到保持。  3.对单类支持向量机在噪声下的过拟合问题进行了研究。提出了一种新的训练数据加权方法,用来克服噪声影响。实验结果表明,在不影响训练复杂度的情况下,这种加权方法可以有效解决噪声影响及过拟合问题。
其他文献
目的:探讨抑郁症护理工作中合理应用“共情护理”方案的价值与效果。方法:以106例于2013年01月至2016年04月因患抑郁症进入本院精神科的患者为本研究干预对象,以不同护理模式间
左、右心室因肺循环联系为一整体,它们之间是相互制约、相互影响的。慢性肺源性心脏病主要是指各种慢性肺疾病引起的右心室扩大、肥厚,伴或不伴右心功能不全。对于慢性肺源性心
MIMO—OFDM作为很有希望解决下一代通信系统物理层方案的技术,正在成为国内外通信领域研究的热点。本文首先讨论了MIMO信道的建模和仿真方法,并在此模型基础上,分别研究了在假设
目的:观察并比较利巴韦林与喜炎平注射液治疗流行性腮腺炎的临床疗效。方法:将2014年1月至2016年1月期间来本院就诊的60例流行性腮腺炎患儿,随机分为治疗组(30例)和对照组(30例)。两
目的:观察中西医结合治疗小儿支原体肺炎的临床疗效。方法:将142例支原体肺炎患者随机分为两组,对照组70例,采用西药大环内脂类药物治疗;治疗组72例,采用中西医结合疗法,在对照组治
通信网络和广播电视覆盖的三种基本传输方式为卫星、光缆和微波。由于卫星广播电视传输具有覆盖范围广、传输环节少、效益高、接收方便等特点,目前卫星传输已成为我国广播电视
目的:观察超声波联合依托芬那脂凝胶透入治疗膝骨关节炎的临床效果。方法:将80例膝骨关节炎患者随机分为治疗组40例和对照组40例,治疗组在超短波、调制中频的理疗基础上给予超声
USB( Universal Serial Bus)是为解决计算机外设种类的日益增加与有限的主板插槽和端口之间的矛盾而提出制定的。它是把使用USB的外围设备连接到主板的一种外部总线结构。同
目的:对高血压患者的临床用药情况与临床治疗效果进行分析探讨,为今后的临床治疗工作提供可靠的参考依据。方法:抽取在2012年1月至2013年7月间我院收治的高血压临床患者356例,将
目的:研究CT与高KV摄影对于临床上检查矽肺的意义,选择临床上对于检查矽肺的有效合理方法。方法:以2013年1月-2016年1月来我院就诊的为矽肺的120例患者,按照随机分配的原则,分为CT