基于数据分布特征的支撑向量机核选择方法研究

来源 :山西大学 | 被引量 : 8次 | 上传用户:a522920779a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支撑向量机(Support Vector Machine,SVM)是近年来受到广泛关注的一类学习机器,它以统计学习理论(Statistical Learning Theory,SLT)为基础,具有简洁的数学形式、标准快捷的训练方法和良好的泛化性能,已广泛应用于模式识别、函数估计和时间序列预测等数据挖掘问题。目前SVM的研究热点主要有:SVM的模型选择、快速学习算法研究等。由于支撑向量机是一种基于核的学习方法,所以核及相关参数的选取对泛化能力有着重要的影响,进而对支撑向量机的性能也有着重要的影响。如何有效地进行核及相关参数的选择是支撑向量机研究领域的一个重要问题。本文对于SVM的核及相关参数的选择问题进行了系统研究,主要内容如下:(1)对现有的核函数及核选择方法进行了详细的分析和研究。(2)给出了四种测试训练集几何分布的算法。本文利用分类问题的几何意义直接从数据集出发,按照两类样本点之间的距离关系,分别给出SVM训练集呈圆形、环形、球状、柱状分布的测试算法,为基于数据分布的核选择方法提供了实现的基础。(3)提出了基于数据分布的核函数及参数选择方法。目前大多数核选择方法都不考虑数据的分布特征,没有充分利用隐含在数据中的信息。如果已知数据的分布特征或可得到其数据分布特征的近似,在此基础上,再进行SVM核函数及其参数的选择,则可提高SVM的泛化能力。本文在确定训练数据集几何分布的基础上,从给定的核函数集中选择一种最恰当的核函数,应用到支撑向量机上,以期获得最优的性能。(4)给出了数据呈某种分布时分类效果最佳的核函数选择方法。论文分别选取了坐标变换核、高斯核和多项式核函数作为研究对象,在人工数据集和真实数据集上进行了测试,验证了本文所提出方法的可行性和有效性。本文研究的内容是SVM研究中的热点问题之一,研究结果不仅具有重要的理论意义,而且对于实际问题具有直接的应用价值。
其他文献
本文意在提出一种行之有效基于数字水印技术的印刷品防伪算法。首先分析了数字水印技术应用到印刷品防伪涉及的几个理论,充分考虑水印嵌入后图像的可见性、算法的鲁棒性、安
生成图片文本描述任务综合了计算机视觉(CV)和自然语言处理(NLP)这两个领域的技术,是当前人工智能领域的研究热点之一。受自然语言处理中神经机器翻译的编码-解码结构的启发,目前大
随着人口老龄化趋势的加剧,独居老人的数量逐渐增多,如何保障独居老人的生活质量与身体健康已经引起了人们的重视。尤其是当老人发生坠床等危险行为时,如何在第一时间检测到危险
随着21世纪的到来,计算机技术、网络技术及控制技术相结合,极大地促进了工业的发展,各种基于网络技术与分布式概念的系统大量应用于工业实践,给工业生产带来了革命性的变化,作为现
随着信息技术和数据获取技术的发展,研究人员收集并保存了大量的与空间位置有关的历史数据。针对这些庞大的数据,人们迫切希望找到强有力的数据分析工具来挖掘空间数据中隐含的
支持向量机SVM(Support Vector Machine)是AT&T Bell实验室的V.Vapnik提出的针对分类和回归问题的统计学习理论方法,是特殊的神经网络方法。实验表明SVM是分类(识别)和数据拟合
在化工、纺织、造纸等行业,迫切需要根据工艺要求,对高浓度碱液的浓度进行在线实时检测与控制。目前国内普遍采用手工滴定的方法,这不能实时反映和控制生产过程中碱液的浓度,故难
在钢铁企业中,一些设备如高炉、焦炉和转炉都会生成副产品——煤气。煤气混合过程即为回收利用这些副产煤气,不仅节约能源,而且降低了环境污染,是钢铁生产的重要环节。混合煤气热
传统的变频/工频运行切换控制只能实现交流电动机在切换前后运行频率和转向(相序)的一致,而由于切换前后交流电源的相位不同,往往会导致电机的电流和转矩发生较大的瞬时冲击性波动,对变频器、电网、电机及其负载都会带来严重冲击,同时会产生刺耳的噪声污染、缩短设备寿命,甚至会导致设备损坏。本课题以单片机数字化测控技术为核心,研究开发一种交流电机变频/工频运行切换锁相同步控制系统。主要研究内容包括:(1)强、弱
本文主要介绍了一种基于多维本体的便携式个性化用户模式构建方法。文章首先对相关研究做了文献综述,分析了现有方法存在的问题,并提出了多维本体的思想,对其表达方法和使用