支持向量机在数据挖掘中的应用

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:qishikdjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门多学科交叉的应用技术,与机器学习和统计学紧密相关。目前数据挖掘中的挖掘算法主要是对机器学习或统计分析等领域中的常用技术的改进。分类即通过由经验数据训练得到的分类器预测未知数据的归属,是模式识别、机器学习、统计分析等领域的一个基本问题,也是一种最常见的数据挖掘任务。 分类可以看作基于经验数据的学习问题。不同于传统统计学的渐进理论,统计学习专门研究有限样本情况下的机器学习规律,它从理论上证明了实际风险的界是由经验风险和置信范围两部分构成的,并给出了控制置信范围的方法VC维。结构风险最小化归纳原则通过控制经验风险和置信范围来控制实际风险的界。支持向量机是在统计学习理论基础上发展起来的一种通用学习机器,其关键的思想是利用核函数把一个复杂的分类任务通过核函数映射使之转化成一个在高维特征空间中构造线性分类超平面的问题。离分类超平面最近的点到分类超平面的距离称为间隔,间隔最大的分类超平面具有最好的推广能力,称为最优分类超平面。而寻找最优分类超平面需要解决二次规划这样一个特殊的优化问题,通过优化,每个向量(样本)被赋予一个权值,权值不为0的向量称为支持向量,分类超平面是由支持向量构造的。由于现实世界的数据量一般比较大,因此对优化的效率要求较高,分解是第一种实用的可处理大数据集的技术,它把训练集分成固定大小的工作集和非工作集两部分,每次迭代只解决一个工作集中的子优化问题。分解与基于可行方向的优化技术结合为解决大数据集的支持向量机训练提供了一种可行的方法。 文中分析了支持向量机在抽油机泵参调整数据挖掘系统中的应用效果,与神经网络BP算法做了比较。结果表明它在一些主要性能指标上要优于BP算法。本文把支持向量机引入数据挖掘,可以吸引更多数据挖掘领域研究者的注意,为数据挖掘系统的设计提供一种新的选择。
其他文献
针对小型无人机长航时条件下安全飞行时的可靠性需求,对双余度飞控系统进行了研究。充分利用近年来电子、总线、传感器和软件等领域的技术进步,通过选取具有高可靠双核锁步技
期刊
目的观察外用中药煎剂治疗手部角化性湿疹的临床疗效、安全性研究。方法采取前瞻性随机对照临床研究方法。治疗组给予外用中药煎剂并外用白凡士林软膏;对照组外用卤米松乳膏
在我国教育体制改革的大环境下,新课程的改革也在不断的深入,对于小学语文的教学也有新的要求,如何提高小学语文教学的有效性已经成为了教育教学的重心。如何打破传统的教育模式
<正>修改后刑诉法规定的不起诉决定有法定不起诉、酌定不起诉和存疑不起诉三种。对于酌定不起诉,修改后刑诉法规定被不起诉人可以提出申诉,而对法定不起诉和存疑不起诉的被不
本文应用振动分析方法研究了汽车变速箱齿轮产生振动的原因和齿轮故障发生的机理。针对变速箱齿轮运行状态的振动信号的特点,根据LC5T81变速箱疲劳寿命的台架试验所采集的数据
为更好提升高职学院教师业务能力,从协同治理的角度,研究教师业务能力系统化开发和有序状态形成过程,明确教师业务能力系统化开发的协同学特征,以期为我国职业教育师资队伍建
目的探讨迈之灵在缓解复杂甲状腺术后并发症方面的作用。方法回顾性分析2015年1月至2016年1月本院收治的复杂甲状腺术后病例582例,根据术后是否使用迈之灵分为迈之灵组(试验
本文以江苏食品职业技术学院为例,分析高职院校图书馆文献资源建设现状和存在问题,并针对这些现状,提出通过文献资源建设规划、创新采购方式以及优化馆藏结构等方面来改进文献资
随着新课程改革的不断深入推进,对学校教育的教学活动提出了更高的要求,要求教师能够创新教学结构、创新各种教学活动展开的方式和方法、创新教学内容。初中班主任要能够创新