基于先验信息的支持向量机核函数选择

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:guojiaguangdian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机是由统计学习理论发展而来的一种机器学习方法,是众多机器学习方法在发展过程中从经验风险到结构风险的一次重大理论突破。它对传统机器学习方法中难以处理的小样本以及非线性等问题具有特有的优势,被广泛应用于人工智能领域。支持向量机对非线性可分问题拥有较好的学习能力,这是因为它是一种基于核的学习方法。核函数的引入使得支持向量机模型不必再针对输入空间计算内积,而是将输入空间嵌入到高维特征空间中进行计算。这样不仅可以实现非线性问题的分类,同时也降低了计算的复杂度。然而,各核函数相对应的映射方式不同,也就是核函数蕴含的度量特征不同,故核函数对支持向量机模型的泛化性能有着极其重要的影响。因此,针对支持向量机模型在训练的过程中怎样高效地选择核函数是支持向量机研究中至关重要的部分。核函数决定支持向量机模型性能的关键点在于通过映射使得输入的样本点在特征空间中的相互关系。而现有核选择研究大多数仅考虑核函数本身的特征,如全局特性、局部特性等,或者根据经验进行选择。这些核选择方法显然存在着一系列的偶然性和局限性,故本文针对训练样本蕴含的先验信息以及不同核函数生成的核矩阵的特征信息进行综合分析,设计出基于输入样本先验信息的支持向量机核函数选择机制。主要工作有:1.对支持向量机相关理论进行阐述,通过相应的理论推导引出本文研究的重点—核函数,首先对核函数的定义、核函数的性质以及常用的核函数等方面加以描述;然后从黎曼度量、距离度量和角度度量详细地分析核函数所蕴藏的特征信息;最后从研究背景、理论依据以及实际具体问题的先验信息分布等方面做出阐述,对后续研究内容做一铺垫。2.由于诸多实际问题可以借助图论知识加以表达,本文创造性地将图论中无向图邻接矩阵的概念与输入样本相结合,然后针对生成的邻接矩阵进行分析得到样本分布信息,并利用主成成分分析方法求得邻接矩阵的本征维数,以及结合不同类型的核函数所蕴藏的本征维数,从而确定选择核函数类型。最后通过不同的数值实例仿真,验证本文方法能够在充分考虑样本先验信息的前提下有效地进行核选择,避免核函数选择的盲目性。3.针对实际问题中往往无法用整数描述给定样本的本征维数,同时对于复杂问题简单核函数也难以使生成的模型拥有较好的性能。本文建设性地借助分形几何中的分形维数对样本的先验信息进行估计,同时依据分形中自相似性的特点进行基核函数选择或者混合核函数选择。首先利用关联维数的方法计算训练样本的分形维数,并通过实验分析得出阈值进行核函数的选择;然后引入信息熵对训练样本的分布信息表征,以此为基础选择或者组合适合于具体问题的核函数。该方法即可以有效地对训练样本的先验信息进行计算,又能够兼顾核函数的特征信息,并通过相应的数值实例仿真验证了其有效性。4.考虑到上述研究均是以UCI中的数据为基础进行的,本文利用在上海某公司实习期间所采集的数据与基于深度学习和人脸五官点信息的人脸姿态分类算法分别进行了相应的仿真实验,以测试上述核函数选择方法的优越性。通过具体实例仿真得到,利用本文方法选择的核函数构造支持向量机模型对人脸姿态分类的准确率要比基于深度学习的方法分类准确率高,同时在运行时间上支持向量机模型的速度远优于深度学习模型的运行速度。通过对UCI数据库中的数据以及现实生活中提取的人脸数据进行仿真证明,上述方法在充分运用样本的先验信息与核函数的特征信息进行核函数选择的方法是行之有效的。
其他文献
本论文在之前学者与专家研究的基础上,选取我国6名优秀的女子链球运动员,针对链球这个运动项目从时间、速度、轨迹三个大方面,运用数学科目的MATLAB绘图与计算功能、运动学知识、统计学知识进行分析。本文使用MATLAB软件分析我国优秀女子运动员的器械运行特征参数,目的在探索一种体育与计算机软件相结合的新的分析方法,通过女子链球比赛中的动态变化科学地分析和研究,为女子链球运动今后的训练方法和训练规划提供
数字全息显微术(DHM)通过在数字全息光路中的物光里引入显微光学成像系统,使显微样品经显微光学系统放大后所成的像与参考光干涉并把干涉图样通过记录介质存储、并输送给计算
间歇过程是工业生产中的一种重要生产方式,因能够实现小批量、多品种、高附加值等产品的生产,已广泛应用于制药、发酵、半导体加工等领域。间歇过程生产方案的多样性及其工艺
在拟Hopf代数中,双边双余边Hopf模范畴及广义的Yetter-Drifeld模范畴是重要的研究对象,D.Bulacu等人讨论了这些模范畴,并揭示了它们之间的等价关系.本文将在Monoidal Hom-Hop
质量、成本、进度是项目管理的三大要素,而进度管理又会对成本、质量产生的影响,因而成为项目管理者关注的重点。然而,现有项目进度管理仅关注了各个工序之间的相互衔接,而忽略了项目实施过程中各个工序之间存在资源约束,因而使得项目进度管理效果不尽人意。关键链进度管理技术引入了约束理论,强调项目进度管理过程中资源的冲突,对于项目管理进度控制和管理具有重要意义。本文以FS轨道交通控制中心设备安装工程进度管理为研
最优化问题以及问题的求解已成为各领域进行科研与生产绕不开的课题。智能优化算法因对问题具体信息与条件的依赖度较小,取代了传统优化方法成为求解最优化问题的主流工具。从上世纪下半叶至今,各式各类的智能优化算法被相继提出,其设计灵感大多来源于物理现象、生物进化与动植物行为,如,混沌优化算法、模拟退火算法、遗传算法、鸟群算法。诸多算法中以种群作为寻优空间的算法占据主体,其中,文化算法是为数不多的拥有双进化空
随着科学的进步和物理学研究的深入,因其在生物医疗、天体物理、成像机制、等离子体物理等方面的广泛应用,电子与分子碰撞的问题受到了越来越多的重视。人们在电子分子散射实
众所周知,不管是复杂网络还是神经网络因其广泛的应用在众多领域而被越来越多的专家学者关注,现实生活里的许多问题都能够通过复杂系统的模型来描述进而被形象化,例如万维网、食物链、模式识别、社会科学等等。其中复杂系统的同步是用已知的动力系统来识别未知动力系统的基础,因为它通常表示两个系统的状态轨迹在一段时间内是一致的。同步行为是复杂的动态网络中非常有意思的集体活动,已经成为相当多的探究课题中心,本文就在前
经过数十年的全球化发展后,世界各国的经济联系日益紧密,世界市场的动态变化将通过国际贸易渠道影响各个国家的实体经济,一国的经济贸易越来越受到全球性突发事件的影响。尤其是2008年全球金融危机爆发后,不确定性对经济的负面作用凸显出来。危机过后,各国政府为促进经济恢复积极调整经济政策,却加剧了全球的经济政策不确定性。IMF、OECD等国际经济组织都认为凸显出来的政策不确定性延缓了金融危机后全球经济的复苏
并购行为是企业间调节最优生产边界、优化资源配置的一种经济手段,它对调节资源、资金、人才等生产要素在行业间,甚至跨行业间的充分流动非常有效,运用得当可大幅度提升全社