基于光滑非凸损失的鲁棒支持向量机及其稀疏算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xiaoxiaodeai1002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
带噪声的大规模数据分类问题是数据挖掘中的重要研究内容。支持向量机作为一种经典的数据挖掘技术,因其具有较强的泛化能力而被广泛的应用于各个领域中。有研究表明,基于非凸非光滑损失函数的支持向量机分类模型对带标签噪声的数据具有鲁棒性,能降低噪声对分类超平面的影响,提高数据的分类精度。然而,非光滑损失函数的使用导致对该模型的求解困难。针对上述问题,本文提出基于光滑非凸损失函数的鲁棒支持向量机模型,对带标签噪声的大规模数据分类问题进行研究,给出该模型的一种快速求解算法。本文所取得研究成果主要有:首先,研究分析了基于光滑非凸损失函数的鲁棒支持向量机分类模型,尽管该类模型对标签噪声具有鲁棒性,但需通过迭代求解二次规划来获得该模型的最优解,计算量大且收敛速度慢,不适合训练大规模分类问题。为了解决上述问题,本文给出了一种快速收敛求解方法并对其进行验证,实验结果表明了该方法的有效性。其次,基于最小二乘的思想,提出了一种推广的鲁棒最小二乘支持向量机模型,并用一种快速收敛算法进行求解,从理论上解释了模型的鲁棒性。为了有效的处理带标签噪声的大规模分类问题,在对核矩阵采用低秩近似方法的基础上,提出了稀疏推广的鲁棒最小二乘支持向量机算法和稀疏鲁棒支持向量机算法。实验结果表明,所提算法在收敛速度、测试精度和训练时间等方面均优于相关算法。最后,将鲁棒支持向量机的光滑非凸损失函数进行改进,提出了多参控制的鲁棒支持向量机模型,在其对偶空间上证明了它的强鲁棒性,给出了该模型的快速收敛求解方法,并利用核矩阵的低秩近似,给出了该模型的稀疏求解算法。通过大量的实验,证明了该算法的有效性。
其他文献
数据规约技术的目标是在不影响后续挖掘效果的前提下,缩减数据集合的规模,进而提高后续挖掘的性能,是知识发现过程中预处理数据的一个重要步骤。实例选取作为数据规约中的一
蛋白质的空间结构决定着其功能,其空间结构的确定非常复杂。通过前人的研究表明获得蛋白质的结构类,可以确定肽链的折叠形态,从而缩小空间结构自然搜索的范围,为其结构测定提供了方向,节省了许多时间和物力。但结构类的预测准确率一直很低,特别是在低相似性序列数据集上。导致其预测率低的原因在于用传统的方法所提取结构类序列的特征信息中有很多冗余信息。基于此,本文的工作如下:(1)提出了一种基于降维的特征融合和迭代
用户在淘宝、京东、Amazon、豆瓣、大众点评、Tripadvisor等Web2.0应用上的评分行为产生了海量评分数据,这些数据直观反映了用户对商品或服务的评价,同时蕴含着用户潜在偏好。评分数据涉及应用广泛,具有稀疏、多维等特点,一般包括用户属性、评分对象属性以及评分值。基于评分数据对用户偏好建模,构建能描述评分数据各变量间依赖关系的用户偏好模型,对实现个性化服务、精准营销有着重要意义。此外,为了
新媒体时代相对于传统媒体而言,网络信息的传播量更大、更快捷和广泛、即时性和互动性更强,任何人可以突破时空界限在各类新媒体平台上发布信息和推送舆情,方式上显得更为时
生命体中,各种蛋白组装体发挥其特殊的功能,如新陈代谢、维持细胞形态等,以蛋白为操作基元构建功能化的组装体一直是蛋白工程领域前沿课题。基于蛋白多样结构特性和识别能力,
全国青少年校园足球自2009年开展以来,得到了国家领导人和社会各界人士的关注及支持。孝感市三里棚小学为了更好的发展和推广校园足球,学校领导大胆革新,通过服务外包的模式,
网络社群已成为大学生群体聚集的重要平台,教育对象网络化、教育载体技术化、教育评价数字化、教育方法专业化是大学生网络社群思想政治教育的鲜明特征。网络社群的"原子化运
本文主要对具有结构阻尼和无限时滞的梁振动方程解的存在性进行研究.本文由五章内容组成.第一章,主要对课题的研究背景、本文的主要工作和课题研究所要用到的定义和基本结果进行了简要概述.比如算子半群理论,相空间理论,非紧性测度理论,凝聚映射等.第二章,主要是关于非线性项为f(t,ut)的梁振动方程mild解的存在性的讨论.此类初值问题的特殊性在于它考虑了时间的滞后性这个因素.应用算子半群理论,相空间理论和
本研究以产琼胶酶的微球菌为实验菌株,通过克隆获得其全基因组序列,在Blast上比对序列、分析结构,氨基酸序列构建发育树,得知该酶属于GH16家族的β-琼胶酶。通过克隆表达含不
随着移动视频流量的迅猛增长,基站和核心网链路面临着巨大的压力。无线业务量的激增,使得现有的移动网络难以满足用户对高带宽、低时延缓存服务的需求。在边缘侧提供超高速缓