基于核范数正规化的矩阵型支持向量机模型及其应用

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:rovewind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据时代的蓬勃发展离不开机器学习坚实的理论基础,同时机器学习也是解决人工智能问题的一大主流方法,但激增的数据量稀释了有效信息的“密度”,给数据科学带来了很大的挑战。许多机器学习算法都能在一定程度上处理数据冗余性的问题,寻找有价值的数据,这样一类方法被称为稀疏学习。大多数机器学习的算法是基于向量的模型,然而,现实中的大量数据都是二维矩阵数据甚至是更高维度的张量,此时若直接套用基于向量的模型可能会出现损失部分信息、扰乱数据原有关联性等问题。传统的支持向量机已在多个实际领域中取得了广泛的应用,是公认最成功的机器学习算法之一;同时它也是稀疏学习中比较有代表性的一个算法,具有样本稀疏性,换句话说,模型只被一少部分的样本决定。关于其统计性质,各国学者从不同方面展开了诸多研究,但是现有的研究基本上使用的都是向量形式的数据结构,而有关矩阵形式的支持向量机的研究相对较少。已有的理论研究结果表明,相比于支持向量机最初采用的平方范数正则化,l1支持向量机具有良好的稀疏性。因此,本文将主要研究一个估计与降维同时进行的正则化方法,即考虑一个基于矩阵核范数正则项的M估计(若正则项为目标矩阵的核范数平方时,该模型等价于l2范数支持向量机),并比较该正则化方法与传统的l2范数支持向量机的分类效果与稀疏学习能力,同时尝试推导在此种情况下的误差分析,具体内容如下。首先,本文对现有机器学习背景下的各种稀疏学习、正则化方法、迹回归以及主要的支持向量机模型及其变体等进行梳理。本文结合迹回归模型与支持向量机模型的优点,考虑矩阵内积作为模型线性部分的支持向量机模型,并将矩阵的核范数作为正则项。其次,类似于线性支持向量机模型通过引入拉格朗日乘子转化成一个二次规划问题,根据半正定规划的理论基础,本文将原本基于矩阵形式的支持向量机模型转化为一个半正定问题,并得到了支持矩阵的条件以及求解问题的方法。在此过程中我,本文发现所提出的模型既有样本稀疏性,同时也能通过调整调优参数得到低秩解。另外,由于半正定规划方法本身的局限性,本文也介绍了如何使用凸优化的方法寻找下降方向,迭代求解。随后,本文在所提出的条件下(比如次高斯矩阵、限制特征根以及一些矩条件),对本模型的误差做了全面而细致的分析,不仅得到了误差置信上界的定量分析,同时还推导出了矩阵形式下模型去偏的具体过程。最后,本文将所提出的方法应用到了医学领域中的脑电图图像分类问题上,同时设计合成数据,验证本模型的分类能力与模型选择能力。综上所述,本文通过结合迹回归模型与支持向量机模型的优点,提出了基于核范数正则化的矩阵型支持向量机模型,并根据优化理论推导模型求解的算法,从数值模拟与实证分析两个角度验证了当处理的原始数据为矩阵形式时,基于核范数正则化的支持向量机模型相比传统模型具有更好的分类效果与模型选择效果。本文所研究的对象拓展了机器学习的研究范围,同时也深化了矩阵估计的研究方法,对于许多实际数据的处理,如面板数据、图像数据等具有重要意义。
其他文献
医药制造业是我国的“朝阳产业”,其产业发展与人们身体健康和生活质量密切相关。同时,作为资源密集型和知识密集型的高新技术产业,创新也成为医药制造业高质量发展的重要动力。然而,现阶段我国医药制造业普遍存在技术落后、产品单一和基础薄弱等问题,这些问题严重阻碍了其发展。而医药制造业创新能力的提高有利于解决目前行业普遍存在的问题,从而提高医药制造业生产效率,进而实现行业高质量发展。另外,我国医药制造业创新能
学位
家庭农场经营是世界上大多数发达国家最主要的农业经营模式。当前,我国高度重视农业现代化问题,鼓励发展家庭农场。近年来,我国家庭农场的数量和质量得到了长足发展,但仍存在诸多的发展瓶颈和挑战,突出表现为家庭农场的抗风险能力较弱、家庭农场主心理韧性不足、社会支持力度不够、家庭农场经营可持续性较低。本研究关注如何通过社工介入,提升家庭农场主的心理韧性,增强家庭农场的抗风险能力。本研究以河南省L乡D村家庭农场
学位
近几年人工智能高速发展,在语音识别、图像处理、自动翻译、自动驾驶等多个领域取得了突破性进展,也为教育领域的变革注入了新的活力,国务院与教育部更是相继发布诸多文件指出在推动教育变革过程中教学评价的重要战略地位。传统的教学评价方法主要依赖评教专家或观察员在课堂中通过听评课的方式来完成对课堂、对教师的评价,这种方式对评教专家自身素质、专业能力具有较高的要求,同时需要消耗大量的精力。随着技术与时代的发展,
学位
随着我国近年来工业化、城市化迅速推进,矿物燃料的消耗迅速增加,大量的大气污染物向空气中扩散,造成了严重的环境和空气污染,严重的空气污染不仅危害百姓身体健康,还会造成巨大的社会经济损失。空气质量指数是大气环境监测的一种主要指标,可为人们日常活动提供可靠的依据,同时也为保护人民群众的健康提出了科学的意见。因此,空气质量指数的预测研究对于治理空气污染有着重要的现实意义。在此背景下,本文选取武汉市2018
学位
城镇污水管道系统中产生的甲烷是城镇碳排放的主要来源之一,深入研究污水管道系统中甲烷的产排特性及发生机制对城镇污水提质增效和碳减排至关重要。综述了城镇污水管道系统中甲烷产排的研究现状,分析了甲烷产排的主要影响因素及发生机制,归纳了污水管道系统中甲烷产排的模拟评估方法。结果表明:污水管道内部环境、水质特性、水力条件等是影响甲烷产排的主要因素;生物膜-管道沉积物-污水多相界面的生化反应和传质过程是造成甲
期刊
为探明城市污水管道中流速变化对甲烷和硫化物生成的影响特性,通过控制污水管道中试系统的污水流速,探究了不同流速下产甲烷菌(MA)和硫酸盐还原菌(SRB)的菌群与功能基因分布特性.结果表明,污水管道中甲烷和硫化物主要分布于固相沉积物间隙水和液相污水中,当流速从0.1m/s升高至0.7m/s时,固相中10%的甲烷和硫化物会转移到液相和气相中.同时对管道中微生物进行宏基因组测序,发现MA菌群相对丰度升高1
期刊
通货膨胀是作为衡量一国经济发展稳定性的重要指标,通货膨胀预测的预见性有助于中央等政府部门制定出有效的货币政策以稳定物价,也有助于金融机构和投资者更好地做出投资决策。未来通货膨胀率的准确预测对货币政策的制定和实施起着关键性作用,即央行可根据通胀预测值对未来的经济形势做出合理的预测,减少货币政策延迟导致的效果偏差,使宏观调控更加准确到位和货币政策的实施更加高效。通货膨胀预测模型种类繁多,其中自回归和因
学位
制造业是立国之本,强国之基。推动制造业的升级发展,是实现我们民族伟大复兴的重要途径。在制造业的发展过程中,公共服务业起到了巨大的帮扶作用,它可以有效地减少制造业厂商的成本,促进地区引进优质企业,推动地区制造业升级和发展。同时,一个地区制造业发展也会带动该地区经济发展,从而促进该地区的公共服务质量得到提高。两者之间的有效协调发展不仅有利于实现地区的繁荣兴盛,还能提高地区普通百姓的生活质量和幸福水平。
学位
黄河流域经济发展与生态环境问题备受瞩目,随着“高质量发展”举措的提出,黄河流域的经济建设再次被推至高质量发展战略性地位。当前,黄河流域正处于经济高质量发展的关键期,而生态环境问题一直是牵制黄河流域经济发展的重要因素,同时经济的快速发展又造成黄河流域环境容纳量的急剧缩减。环境承载力作为衡量经济社会协调发展以及可持续发展能力的重要理念,能正确认识和评价一个地区环境容纳量,是精准提升我国经济发展能力的基
学位
报纸