支持向量机中参数选取的一个问题

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:Willy_Liang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和信息技术的快速发展,人们需要花费昂贵的代价收集、存储和处理海量的数据。数据挖掘源于数据库技术引发的海量数据和人们利用这些数据的愿望。用数据管理系统存储数据,用机器学习的方法分析数据、挖掘海量数据背后的知识,便促成了数据挖掘(data mining)的产生。如何从中发现有用的信息,已经成为一个迫切需要解决的问题,数据挖掘技术在这种背景下应运而生。数据挖掘就是在数据库中发现有用的、潜在的、最终可理解的模式的非平凡过程。它是一门交叉学科,涉及机器学习、数学规划、数理统计、模式识别等相关技术。支持向量机(support vector machine,SVM)是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。它是机器学习领域若干标准技术的集大成者。它集成了最大间隔超平面、Mercer核、凸二次规划、稀疏解和松弛变量等多项技术。在若干挑战性的应用中,获得了目前为止最好的性能。在美国科学杂志上,支持向量机以及核学习方法被认为是“机器学习领域非常流行的方法和成功的例子,并是一个十分令人瞩目的发展放向”。首先本文给出了一种新的计算支持向量机中正则参数和核参数的方法,与已有的一些算法不同,它是将C和γ作为优化问题中的变量来处理,并通过遗传算法和确定性算法相结合来解这个平衡约束优化问题,从而求出支持向量机(SVM)在分类问题中的正则参数C和γ。其中遗传算法用来求解以C和γ为变量的优化问题,而确定性算法对每一对C和γ值求解约束。另外通过数值计算将该方法的的结果与已有的grid search方法进行比较,可以得出用文中所述的方法求得的C和γ值能明显提高支持向量机的泛化性能。
其他文献
农村土地征收中存在着各种行政裁量,裁量的行使在某种程度上关涉农民的切身利益。目前的裁量控制是四元结构控制,即立法控制、行政自制、司法控制以及社会控制,但四维度控制
<正>据史料记载:泾阳成为南茶加工转运的集散地和中转站,始于汉,闻于唐,兴于宋,盛于明清。从汉代起,陕西关中地区的泾阳就是川茶、湖茶销往西北牧区及丝绸之路上的茶叶集散地
京津冀城市群由首都经济圈的概念发展而来。京津冀包括北京市、天津市两个直辖市以及河北省的十一个地级市,其中北京、天津、保定、廊坊为中部核心功能区,是我国北方经济体量
在系统地分析传统企业技术创新与转型升级协同的内涵基础上,建立传统企业技术创新与转型升级协同过程模型。并从创新构思协同、技术研发协同、技术生产协同、技术成果商业化
运用导数光谱分析技术,研究了不同氮肥水平下不同品种花生的叶面积指数(Leaf Area In-dex,LAI)与冠层导数光谱及其衍生参数的定量关系。结果表明,花生导数光谱在红边区域680~7
<正> 涟源地区地处湖南中部,为半山半丘陵地带。历史上群众有种茶习惯,产茶历史较久。解放前,新化、涟源、双丰等县产茶较多,其他各县部分地区也产茶。但由于国民党的严重摧
<正> 湖北省洪湖县1979年在全县范围内试行粮食产购合同制,即在年初把粮食产量和统购任务(包括定购任务和当年超购任务)定到基本核算单位,实行“一年早知道”的作法,对于安定