孪生支持向量回归机的研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:jzlh6890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
孪生支持向量回归机(Twin Support Vector Regression,TSVR)是一种有效的机器学习方法。由于TSVR只需求解一对规模较小的二次规划问题,每个二次规划问题的约束条件仅为支持向量回归机(Support Vector Regression,SVR)的一半,因此TSVR的运行效率是SVR的四倍,已逐渐成为机器学习领域的研究热点。实际中,由于数据的来源比较复杂,而TSVR追求的是拟合误差的最小化,缺乏对样本的整体结构信息、异常点以及位置信息的关注,容易导致算法在实际应用中泛化性能变差。本课题主要从提升算法的泛化性能、降低算法对异常点的敏感度以及参数优化三个方面对TSVR开展研究,取得的研究成果如下:(1)针对TSVR对样本整体结构与位置信息的盲目性问题,提出了一种结构加权孪生支持向量回归机(Structural Weighted Twin Support Vector Regression,SWTSVR)算法。该算法首先在TSVR原始形式的基础上,添加通过Wards链式聚类算法获取样本的结构信息,并融入使用K近邻算法获取每个样本的位置信息,使得样本整体结构与位置信息能够反映在TSVR算法的原始形式中,借此提高算法整体的泛化性能;其次,为了加快算法的训练过程,采用连续超松弛(Successive Over-Relaxation,SOR)算法求解原始形式中的二次规划问题。实验结果表明,SWTSVR算法具有更好的拟合效果。(2)针对TSVR对异常点十分敏感的问题,提出了一种基于快速聚类的加权孪生支持向量回归机(Fast Clustering-based Weighted Twin Support Vector Regression,FCWTSVR)算法。该算法首先使用快速聚类算法根据样本的相似性将样本快速分为边缘点、异常点以及中心点,并通过设置合理的规则将异常点剔除;其次,将样本整体的结构信息和位置信息分别以协方差和加权对角矩阵的形式融入到TSVR的原始形式中;然后,为了加快算法的训练过程,同样采用SOR算法求解FCWTSVR算法中的二次规划问题。实验结果表明,FCWTSVR算法具有更好的预测性能和抗干扰能力。(3)算法拟合性能的好坏与参数设置密切相关。果蝇算法是一种有效的群智能算法,收敛速度快,并且具有很强的全局搜索能力。针对TSVR中参数过多而导致寻优时间较长的问题,采用果蝇算法优化TSVR的参数。借助果蝇的具体位置来表示TSVR算法中所需要优化的参数,通过使用拟合精度作为果蝇算法中的适应度函数,并让果蝇随机飞行以避免陷入局部最优,经过有限次数迭代得到的最高的拟合精度与果蝇的最终位置相对应。实验结果表明,果蝇算法能够找到合适的参数,与其他参数优化方法相比,寻优时间更短。
其他文献
我国是一个多山的国家,山地分布较广,一直是世界上滑坡灾害频发的国家之一。同时,由于工程建设范围不断扩大,对一些地质地形条件较为复杂的地区进行适当改变不可避免,其中诱
随着智能家居的发展,越来越多的家庭内部设备需要接入以太网,因此就需要设计家庭网关对其进行统一的上网接入服务。而ZigBee技术因为具有无线应用,且在低功耗情况下可以满足
随着信息技术和网络通信技术的高速发展和人们对家居品质的要求不断提高,家居环境控制越来越追求便利化和智能化。人们希望在日常生活中可以方便的、随时随地的监测和控制家
随着城镇化和现代化的迅速发展,城市地下可用空间越来越少,如何更加有效地利用地下空间逐渐成为一个非常重要的课题。与单圆隧道施工相比,双圆盾构隧道施工具有施工效率高、
压气机作为燃气轮机重要组成部件之一,如何提高其性能一直是主要研究方向。压气机叶片前缘的尺寸虽小,但其几何形状的变化会影响整个流场的分布,因此,对前缘进行合理的优化,
视觉监视系统是近些年来机器人和计算机视觉领域的热门研究方向之一,其主要目的是利用场景下所得到的一系列图像检测和跟踪特定目标。视觉监视系统在生产生活中得到了广泛的
钢铁业面对日益突显的能源紧缺、环境污染和严峻的钢铁市场形势,企业唯有依托国家节能减有排政策,大力支持技术创新,利用技术创新来获取新产品、新工艺、新技术,为企业实现更
以水泥砂浆为锚固剂的锚杆属于粘结型锚杆。它在水电、金属矿山、土木交通和地质灾害领域应用得比较多,其支护效果在工程灾害防治和调控上起着重要的作用。由于我国经济发展,
PPP(Public-Private-Partnership)作为改善公共服务供给机制的一种融资模式,不仅可以有效的缓解政府财政支出的压力,还极大的推进了我国基础设施的建设。PPP模式下准经营项目
主题发现和演化一直是自然语言处理领域的研究热点。主题发现是指从大的语料库中抽取出关键词组,能够简洁地表示出这个语料库的概述信息。主题演化是指发现主题的内容或者强