基于弹球支持向量机的性能提升

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:litian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于分类问题,基于数据的分位数距离的弹球支持向量机相较于基于数据的最短距离的经典的hinge损失的支持向量机,具有更好的稳健性。本文基于弹球支持向量机方法,分别结合“分布式”和“复合”的思想,从计算效率和参数估计有效性两方面做方法和算法的性能提升。为了解决现代大规模数据带来的计算机内存限制、计算成本耗费等问题,本文提出并研究了一种适用于大数据环境下二元分类任务的pinball损失线性支持向量机(pin-SVM)的分布式估计方法。在本文中,我们基于pinball损失函数的光滑化近似,对参数进行迭代求解并得到pin-SVM的参数的多轮分布线性型估计。通过数值模拟及其在实际数据集上的应用,可以验证我们的方法不仅对参数估计具备较高的精准性,而且对于噪音具有稳健性。同时分布式计算极大程度得加快了计算速度,减少了计算成本。为了进一步提升pin-SVM的参数估计有效性,我们提出复合弹球支持向量机方法。首先,我们给出复合弹球支持向量机的线性形式,并从理论上证明线性复合弹球支持向量机的渐近收敛性质。其次,我们给出复合弹球支持向量机的非线性核形式,并在此形式上推导出其对偶问题。最后,为了所提出方法的实用性,我们设计解决复合弹球支持向量机优化问题的序列最小优化算法,并通过数值实验说明我们的方法参数估计有效性方面具有优良表现。
其他文献
随着互联网技术的高速发展,各式各样的互联网产品进入了人们的生活,用户行为的堆积形成了海量数据,与此同时,海量数据本身的规模属性和结构特征给数据处理带来了新的挑战。Spark作为快速通用的分布式计算引擎,广泛应用于大数据处理中,其基于内存的计算方式提升了系统的性能,而Shuffle过程仍然存在着资源利用率低和分区数据偏斜的问题。本文针对Spark框架中的不足之处,对Spark Shuffle过程中的
国家质量基础设施(National Quality Infrastructure,NQI)综合服务信息平台通过整合优质的服务资源,为企业等用户提供计量、标准、检验检测与认证认可等一站式的公共服务。为了更好的厘清NQI综合服务信息平台的实际发展现状,为“十四五”的发展提供示范和服务,对NQI综合服务信息平台的运行效率及服务质量进行科学合理的评价变得尤为重要。本文通过文献阅读、问卷调查、模型分析与实证
村落是社会的重要组成部分。随着人类社会的工业化发展和城市化的不断推进,传统的村落结构正在组向衰败,甚至是遭到破坏和消亡,村落的地域多样性也在逐渐丧失。因此对于传统村落乡镇形态的分析、研究和保护工作迫在眉睫。河南省禹州市神垕镇是“因陶而生,因瓷而兴”的历史文化名镇。现古镇格局是由明清时期5个寨子演变而来;镇内古窑遗址28处,最早可追溯至唐代;明清商业街保存较好,当地人称“老街”、“七里长街”,街道两
定位和建图是自主无人系统执行智能化任务的重要保障,围绕定位和地图两个目标,即时定位与建图技术(Simultaneous Localization and Mapping,SLAM)[1]应运而生,旨在解决未知环境中移动机器人定位与地图感知难题。本论文重点研究面向户外场景下,基于视与激光的融合的即时定位与地图系统,主要贡献如下:(1)完成对激光和视觉传感器的外参标定。一方面,激光传感器具有探测距离远
随着计算机技术的快速革新与全球工业化进程的不断推进,CAD软件蓬勃发展,成为工业生产过程中不可或缺的工具。然而目前CAD软件市场完全被国外商业软件占据甚至是垄断,中小企业需要向国外厂商购买整套软件并且支付高昂的使用费用,使得软件的使用成本增加,开发一款轻量级的CAD软件或许能为中小企业提供了一种新的出路,也将助力于“中国制造2025”的战略实施。本文基于图形化用户界面框架Qt和几何开发引擎Open
汽车的出现深刻地改写了人们的出行方式,但随着数量的剧增,它给能源以及环境带来的危机日益突显。因此研究者们提出各种技术朝着“小马拉大车”的方向发展,即在减小发动机排量的同时增加其功率,以达到节能减排的目的,使得其热负荷越来越高。另一方面,传统冷却系统属于被动调节,难以满足复杂多变的实际工况。智能化一直以来都是发动机的重要发展方向,智能冷却系统更是解决上述问题的有效途径。故本文在传统冷却系统的基础上采
张家山汉简《引书》中多见"精""气""精气"之语,其理论背景应是先秦道家"精气"思想,"导气"是对这种"精气"思想的应用和发挥。本文以此为依据,考察"人生于清"句和"治身欲与天地相求"一段,认为"人生于清"之"清"当取李学勤之说读为"精",意谓人系精气所化生;"治身欲与天地相求"意谓人体内集有天之精气,应该仿效橐籥,运用导气之法,吐故纳新,保持体内精气调和;闭阖"玄府"(汗孔)以敛藏精气,开通"缪
幼儿主要是通过直接经验来学习的,端坐静听不是幼儿学习的主要方式,教师应尽可能创设生动、有趣的情境,提供多样化的环境和材料,让幼儿与环境、同伴及教师产生多样化的相互作用,并由此获得新的经验。春天是万物复苏的季节,红花绿草、枝头嫩芽、彩色蝴蝶……这些都深深吸引着孩子们走进春天,去观察、探索周围事物的变化。作为教师,要学会运用《3-6岁儿童学习与发展指南》(以下简称《指南》)科学分析和观察幼儿的行为,并
期刊
情绪体现了个体对事物的态度体验以及相应的行为,其充斥在我们生活的每一个角落。但情绪概念本身较为复杂抽象且不可感知,其隐喻表征的研究一直是认知心理学中的热门话题。在具身认知及概念隐喻理论的背景下,共通过三个行为实验,探究情绪概念效价与空间上下方位和红黑颜色的隐喻表征关系,以及两种隐喻类型是否与情感效价存在双重隐喻效应。实验一:采用2(垂直空间位置:上方vs下方)×2(词汇类型:积极词汇vs消极词汇)
近年来得到欧美音乐理论界高度关注的“图式理论”(Schema Theory)为音乐分析提供了一个值得深入探究的研究视角。该理论以“图式”——也即思维的认知框架为基础,在音乐历史和音乐语料研究的依托之下,将音乐认知与音乐本体以理论化和实践性兼具的方式关联在一起,并提供了一套以惯例性的外声部对位框架为基础的针对18世纪“华丽风格”(Galant Style)音乐的分析模式。本文在图式理论已有研究成果之