分布式系数正则化回归学习

来源 :济南大学 | 被引量 : 2次 | 上传用户:lb878719
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,有关大数据分析的研究热度居高不下,已经成为了统计、数学、计算机科学等多个学科领域中的热点研究课题之一。大数据其实有两层含义,一是数据的数量大;二是无标号的、杂乱的数据多。针对数据的数量大的特点,并行计算与分布式学习的思想在学习理论中得到了广泛的关注。分布式学习的基本思想是把一个超大的数据集{z i}Ni(28)1以某种方式分拆成m个不相交的部分送到m个数据处理单位,每个部分先被单独并行处理分析,然后处理结果再被聚合在一起。由于数据分析的目的不同,分布式学习的算法也多种多样。本文将主要致力于分布式学习和基于系数的正则化回归学习的数学基础的研究,通过样本算子、积分算子和算子差的分解技巧和关于误差分解的一些新的想法,推导出令人满意的误差界和学习速率。我们的研究结果表明当m不超过一定的阈值时,分布式学习和对整个数据进行一次性学习得到的学习速率是一致的。本文的内容主要分为:第一章介绍统计学习理论的发展历史与基本框架。第二章介绍正则化学习算法的研究现状和预备知识,重点介绍系数正则化算法。第三章介绍分布式学习问题的研究现状,重点介绍分布式核岭回归学习算法。第四章介绍分布式系数正则化回归学习,这一章主要研究分布式系数正则化回归学习算法和分布式部分系数正则化学习算法,利用样本算子、积分算子和算子差的分解技巧,分别得到上述两种学习算法的误差界和学习速率。第五章总结与展望。
其他文献
香蕉是不少发展中国家的主要农产品,香蕉本身富含较高的营养价值,其国际需求量一直很大.据联合国粮农组织(FAO)数据显示,全球香蕉年均消费量达1.07 亿t,但多数产区主要依赖农药
基于互相关函数和 VB、Fortran 联合编程技术开发了单孔法剪切波速测试分析软件。该软件具有自动计算剪切波速、自动生成剪切波速报告的功能,提高了剪切波速测试工作的效率。
提出一种基于核岭回归(KRR)建模的内模控制策略.该方法充分利用基于结构风险最小化为学习规则的回归方法的非线性拟合性能,建立内模控制系统,从理论上分析了内模控制系统的稳
以枯草芽胞杆菌母药为研究对象,通过对载体、分散剂、表面活性剂、保护剂的筛选,确定了枯草芽胞杆菌微粉剂的最佳配方。其配方为:枯草芽胞杆菌母药50%、载体白炭黑20%、分散
文学批评家黄子平在文学批评的风格上具有一种审美体验的印象主义特征,尤其在上世纪80年代的批评作品中表现得非常突出,从这一时期黄子平笔下的文字中我们可以窥见作为一个批
近年来,随着人们对环保问题和可持续发展战略认识的不断加强,在国民经济各领域,特别是工业领域,绿色化学、清洁生产技术受到越来越多的重视。超临界CO2以其作为溶剂优异的性质(化
由于人类活动的影响,自然环境的破坏程度和速度都在不断的增大,由此造成了一系列的生态和环境问题:物种多样性减少、生态系统退化、森林锐减、沙漠化,环境污染、水土流失等,人类赖
在金黄色葡萄球菌检测过程中,由于样品中金黄色葡萄球茵计数受到样品制备、溶液稀释、向培养基添加样液、培养时间和操作人员技能等因素的影响,使检测结果离散度较大。实验主要
通过日本近年来出版的汉语教材中语用问题的检索和归类 ,运用现代语言学理论进行分析和研究 ,总结产生语用问题的原因 ,阐述语用与文化及文化背景的密切关系 ,说明外语教学不
马克思主义中国化、时代化、大众化是一个相辅相成、艰难曲折的历史任务。毛泽东对推进马克思主义"三化"的历史贡献,可以分为两个相互关联的层次:即实践层次上,是以探索中国