基于GEP的支持向量机分类算法研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:leninho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,信息不断地膨胀,各种各样的数据库系统的开发,使得更多的数据以前所未有的速度收集在计算机中。面对众多的数据,人们希望计算机帮助我们分析数据、理解数据,帮助我们基于丰富的数据作出决策,做人力所不能及的事。数据挖掘从大量数据中用非平凡的方法发现有用的知识,就成为了一种自然的需求。正是这种需求引起了人们的广泛的关注,导致了数据挖掘研究的蓬勃发展。 数据挖掘技术包括分类、关联、和聚类等基本概念和技术,分类作为数据挖掘中一种重要的数据分析技术,得到了广泛的研究和应用。支持向量机是一种针对分类和回归问题的新型机器学习方法,它以统计学习理论为基础,作为结构风险最小化准则的具体实现,支持向量机方法具有全局最优、结构简单、泛化能力强等优点,可以有效避免经典学习方法中维数灾难、局部极小等传统分类算法存在的问题。然而对于线性不可分数据的分类问题,支持向量机在训练之前需要选择核函数,而且核函数的参数也要确定,选择的核函数以及核函数的参数都对支持向量机的训练的速度和精度均有影响。常用的核函数有多项式核函数、高斯径向基核函数,其中高斯核函数由于它特殊的性质及良好的分类性能,得到了研究者的广泛应用。然而高斯核函数与其它核函数一样在训练支持向量机前需要确定参数,如核半径(σ),和惩罚参数(C),不同的参数设置对支持向量机的性能有很大的影响,通过本文的数值实验可以看出。核半径和惩罚参数很难通过先验知识来确定,现实中往往是通过变换参数,用不同的参数对训练样本进行多次训练,选择一个最好的参数设置,这种选择参数的方法限制了支持向量机在现实系统中的应用。针对支持向量机的这些问题本文提出了一种基于GEP(Gene Expression Programming)的支持向量机训练算法:GepSVM,用GepSVM训练支持向量机之前无需选择核函数,也无需选择核参数,利用GEP在演化过程中找到一个适合训练数据的核函数。通过大量实验,表明GepSVM算法同时也可以提高SVM分类器的分类精度。
其他文献
随着虚拟化技术的快速发展,越来越多的数据中心中部署了虚拟化软件系统。利用虚拟化技术,单个物理机可以被虚拟化成多个虚拟机。多个虚拟机之间相互独立,运行各自不同的操作系统
数据中心是数据传输、计算和存储的中心,为支撑其业务,数据中心内部网络设备需要进行大量的配置。复杂琐碎的网络设备配置耗费了系统管理员巨大精力,整个过程成本高耗时久,人工配
随着现代战争进程的推进,无人机作为一种优良的飞行平台,越来越显示出它的实用价值和巨大优势,世界各国都在争相进行无人机的研究,目前已有众多国家拥有各种无人机。综合控制计算
过去50年中,人工智能研究的主要问题是“单主体静态可预测环境中的问题求解”,其标准问题是国际象棋人-机对抗赛;未来50年中,人工智能的主要问题是“多主体动态不可预测环境中的
RFID(Radio Frequency Identification)也称无线射频识别,该技术利用射频方式进行非接触双向通信和数据交换,以实现目标的自动识别和远程实时监控及管理。随着大规模集成电路技
模拟退火算法(SA)是一种强大的随机搜索算法,它基于对金属冷却和退火的热力学分析。它广泛应用在组合问题。它能解决大多数优化问题,特别是复杂的连续或步连续的问题。它对初始
无线移动通信技术的快速发展不断为大众提供丰富多彩的业务和应用,同时迅速增长的用户需求也推动着技术本身的不断进步。随着人类社会逐渐进入移动信息时代,无线移动通信技术领
随着通信、计算机等技术的飞速发展,特别是远程传输手段的多元化和技术水平的提高,远程数据采集技术正得到越来越广泛的应用。基于无线网络的数据采集涉及传感器、计算机、网络
交通设施与道路状况的复杂多变性引起各个路口在相互制约和影响的条件下竞争有限的交通资源,因此多个交通路口调度问题是一个博弈问题。当把交通问题定性为一个博弈问题之后,首
从某种意义上来说,界面对于用户而言就是整个软件系统,用户界面对于软件系统的重要性不言自明。用户界面在应用软件中平均占开发量的48%和运行时间的50%,提高用户界面的开发效率,无