大规模稀疏最小二乘支持向量机的算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:tianyemin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最小二乘支持向量机是一个重要的机器学习模型,被广泛应用于实际问题中。其主要的缺陷是模型的解是非稀疏的,这导致几乎所有的训练样本都对最终决策起作用,从而使得模型预测速度变得缓慢。随着互联网的飞速发展,现有数据规模变得非常庞大,在单机上训练模型变得极其困难。主要原因在于:一方面,单机内存放不下海量的数据,另一方面,单机计算能力有限,计算复杂的任务耗时漫长。因此,如何得到大规模最小二乘支持向量机模型的稀疏解是一个重要的研究课题。针对最小二乘支持向量机模型的解不稀疏的问题,基于1正则回归,本文提出了一个稀疏最小二乘向量机算法。针对大规模问题,受集成学习方法的启发,本文首先利用Bootstrap采样选择训练样本,然后并行计算每一个1正则回归模型,最后利用集成学习策略得到原始大规模问题的解。为了验证所提算法的有效性,本文首先分别在小规模回归数据集和分类数据集上进行实验。实验结果表明:在测试精度没有显著下降的情况下,所提算法在小规模问题上得到的解是稀疏的。在大规模数据上的测试结果表明:与现有的大规模算法相比,在耗时较少、测试精度没有显著下降的情况下,本文所提出的算法同样得到了稀疏解。
其他文献
Adsorption properties of L-histidine on active carbon were studied in the paper, which are affected by the main parameters, such as the quantity percent of acti
Ultrasound (US)-induced cavitation is an effective way in oxidizing organic contaminants in wastewater either as the independent operation unit or in combinatio
【正】 偉大的艺术总是进步的,总是站在人民一边,表现人民的思想、感情,替人民說話。所以,任何民族,当人民处在水深火热的时代里,那个时代的偉大的艺术对于人民的痛苦,一定要
目的:了解安徽省县域医共体运行现状,为完善县域医共体政策提供参考。方法:采用定量与定性结合的方法,收集样本县医共体中双向转诊、县域检验检查中心、家庭医生签约、医师多
【正】 以波兰鋼琴家的身份,代表着正在进行社会主义建設的波兰人民,来我国举行十九世紀波兰人民的歌手——肖邦作品独奏会,这件事情本身,即包含着深刻的意义。 肖邦,这个亲
目的:在我国深化医疗卫生体制改革的背景下,本研究通过对医生处方行为影响因素的全面剖析,旨在改善医生处方行为,促进医生合理用药,更好的保障公众健康。方法:运用扎根理论的
养鸡业是我国家禽业的重要支柱产业,2013年爆发的H7N9禽流感事件对我国养鸡产业造成了较大影响,保障养鸡产业的稳定对我国经济的健康发展具有重要意义。本文以黄鸡养殖企业X
随着互联网的广泛应用和数字技术的持续更新与发展,媒介不断地进化与完善,网络社交媒体渐渐转变成为了将信息、意见等都包含在内的舆论表达平台,影响了传统媒体原先具备的议程设置功能以及话语优势,如此,对于主流媒体的新闻报道与舆论引导来说毫无疑问是一项挑战。党报作为传统媒体的代表,为应对新媒体带来的挑战,也开始探寻全新的媒体融合之路。2013年年初,为适应新的媒介生态,“《人民日报》微信公众号”应势而生,根
用差示扫描量热法(DSC)研究了PETN、RDX、Tetryl、BTF、HMX、NQ、GAP与聚乙烯醇缩丁醛(PVB)的相容性,结果表明:NQ、GAP与PVB有着良好的相容性;RDX、HMX、Tetryl与PVB的相容性较差;而PETN和BTF与PVB严重不相容。
地方性应用型高校的教学改革的研究与实践,须以其地方性和应用型这两个特性为核心。这类院校的中文专业的古代文学课程的教学改革,包括教学内容与教学形式两个方面。针对毕业