一种基于聚类的支持向量机反问题求解算法

来源 :河北大学 | 被引量 : 0次 | 上传用户:shanchy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(SVM)是机器学习领域一种非常重要的分类算法,它的出现是以统计学习理论为基础的。由于其良好的泛化能力,使得这种分类方法在很多领域都有应用。但是时间复杂度高的缺点一直是困扰这种优秀的分类器进一步发展的原因。支持向量机反问题的提出是希望作为一种启发式而产生一种有更强泛化能力的决策树,其本质是如何将一个事例集分为两部分,才能使这两部分之间的间隔最大。但是惊人的时间复杂度使得这种算法很难应用到具有一定规模的数据集上。本课题针对如何提高该算法的求解效率做了有意义的探索。本文在深入分析支持向量机反问题求解过程的基础上,提出了一种基于聚类的支持向量机反问题求解算法。首先对支持向量机反问题高时间复杂度的原因进行了探讨,发现主要原因是需要枚举出所有可能的划分。然后,通过分析核聚类的特点,发现核聚类对于减少支持向量机反问题的时间复杂度很有帮助,提出了先聚类再求反问题的策略:用核聚类算法对数据进行预处理,把数据聚成有限数量的几簇,在簇之间做划分,取代了原有的在所有点之问做划分的枚举算法。最后,给出了本文算法的实现过程及其实验结果,并与用K-means聚类方法作为数据预处理的方法做了比较,测试数据表明该算法可行、有效。
其他文献
学位
基于IP核复用的系统芯片SoC是超深亚微米和纳米阶段的代表性产品,它不论在开发周期,还是在系统功能、性能方面,都体现出无可比拟的优点。然而随着集成的IP核数量的增加,芯片复杂
人工神经网络是一种模拟生物神经系统的信息处理模型,在很多领域得到了成功的应用,并在很多问题上表现出极大的优势和潜力。分类是神经网络的主要用途之一,而分类能力是人类智能
随着技术的不断进步,针对各种移动对象的服务也越来越多,移动对象的轨迹数据作为移动对象的历史活动数据,在某种程度能够体现移动对象的属性、状态、行为等内外部特征。本文以数
Web服务是近年来蓬勃兴起的一种分布式计算模型,它能够实现在不同平台上、不同程序语言编写的应用程序或者应用程序组件之间无缝的互操作。这种互操作性将传统的分布式计算带
当前,数字语音压缩技术在通信领域中获取越来越广泛应用,Voice overIP(VoIP)技术正在不断普及,中低速率(16kbps以下)的高质量的语音编码的需求越来越迫切,ITU-T(国际电信联盟标准
近年来微博呈现出爆炸式发展,已经成为人们运用互联网进行沟通的一种重要途径。在微博网络中用户是其核心,通过对微博用户特征以及其对微博信息传播所起到的作用的研究发现,少量
本文针对上述问题对车辆性能分析、配件选型辅助决策支持系统展开研究和设计,主要工作如下: (1)对决策支持系统体系结构进行了深入的研究,并基于ORM的分层系统设计理念给
现在很多计算机系统是并发系统。并发系统固有的复杂性以及对并发性的本质没有全面正确的认识使开发出的这类系统的可靠性与正确性无法得到保证。为了解释并发性的本质并在此
随着空间数据获取技术的快速发展,空间数据量呈指数级快速增长,造成了“数据丰富,知识贫乏”的现象。如何从大量的、高维的、含有多种不确定性的空间数据中挖掘隐含的、有价值的