Lasso变量选择的分布式算法

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:jiangliang87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正则化方法是机器学习中常用的一种变量选择方法,适用于稀疏性的回归问题.当样本量巨大或者海量的数据存储在不同的机器上时,分布式计算是减少计算时间提高效率的重要方式.本论文针对中心处理机分布集群存储处理器存储样本数据的情形,分别构造了基于Lasso和AR lasso模型变量选择的分布式新算法.首先,针对随机误差满足正态分布的样本数据,在建立等价优化模型的基础上,利用交替分步迭代的思想,构造了一种适用于Lasso变量选择的分布式算法,并证明了算法的收敛性;数值实验表明,针对于样本集较大的稀疏性线性回归问题,本文构造的分布式算法相比循环坐标下降法和ADMM算法在计算时间和精度上都有较好的优势.其次,将Lasso分布式变量选择的算法思想推广到AR Lasso变量选择模型中.构造了一个基于Fan和Emre(2012)提出的AR lasso模型变量选择的分布式算法,证明了这一算法的收敛性.最后通过数值例子,对本文提出的两类分布式变量选择算法进行比较.实验表明,对于样本误差满足正态分布的情形,各分布式存储的样本量n远远小于选择变量p时,AR Lasso模型在非零参数的判别上效果好于Lasso模型,即使用分布式AR Lasso模型可以捡回被Lasso模型误丢掉的影响变量;在样本误差不具备正态分布情况,用分布式AR lasso模型在零参数和非零参数的判别上,其准确率都远优于分布式Lasso模型.
其他文献
学位
语文教材是语文教育的载体,是教师与学生之间进行有效沟通的桥梁,语文教材中所选课文的质量会直接影响语文教育的预期效果。自2017年部编版语文教材正式使用,标志着“一纲多本”时代的终结。而教材中的选文大多被编者进行了不同程度的删改处理。小说在部编版初中语文教材的选文中占据了较大的比重,通过统计,发现九成左右的小说选文在选编进入教材时进行了不同程度的删改。基于此,本论文以部编版初中语文教材小说选文的删改
2008年的一场世界金融危机导致我国各个行业及各个部门开始实施加杠杆,2015年中共中央总揽全局,在供给侧结构性改革的背景下,提出了“三去一降一补”五大改革政策。此外,中国经济已经处于高质量发展阶段,从微观角度分析,企业的高质量发展程度决定着中国经济高质量发展的实现程度。本文从理论上对去杠杆与企业高质量发展的国内外文献进行了系统梳理后,基于资本结构理论阐述了我国去杠杆的路径方式,介绍了宏观角度高质
随着21世纪消费者公民意识的崛起以及市场竞争的日愈激烈,世界上越来越多的企业在为了经济效益而疲于奔命之际,不得不同时思量自身在社会中的角色定位,并逐渐开始将社会责任标准及道德标准融入到他们的管理战略之中。为了迎合这一需求,善因营销应运而生。作为一种营销工具,善因营销完美贴合了商业交易的本质——等价交换。通过将收益中的一定数量的金额捐助给慈善事业,企业可以换取一定形式的其它利益。这其中包括提升企业社
语义理解是高级的认知活动,具身认知理论强调身体在语义理解过程中起着关键作用。先前研究表明,身体动作动词语义加工能够激活感觉运动脑区,且这些激活的脑区与执行动作所激活的脑区耦合,但过往研究结果存在不一致。因此本研究采用GO/NO go语义判断任务,从行为和ERP层面探讨汉语身体动作字语义加工的具身效应。研究共包括两个实验。实验一采用两因素的混合实验设计,探讨不同词汇类型在两种动作反应类型条件下是否存
随着部分中概股私有化退市,回归中国A股市场。在重组上市史上最严新规的大背景下,晶澳太阳能借壳天业通联,成功在A股上市。本文以天业通联并购晶澳太阳能的案例为研究对象,旨在通过天业通联视角下的动因理论对其并购动因进行梳理,然后对企业并购绩效进行评价,确定企业基于并购动机的预期目标是否已经实现,业绩是否有所提升,并从中总结了一些经验。之后在此基础上提出了优化建议,试图为其他海外上市的优质国内公司回归A股
中国信达资产管理公司经过二十多年的发展,在防范化解金融风险、支持促进国有银行和国有企业改革方面发挥了重要作用。伴随着政策性剥离不良资产处置的基本完成,公司又向商业化转型迈出了坚实步伐,形成了不良资产管理公司特有的重组业务模式,从传统金融资产包的收购经营类债务重组,到非金融机构收购重组,到近一两年提出的实质性重组业务。随着不良资产管理行业的扩张,地方资产管理公司迅速发展,外资资产管理公司陆续进入,竞
随着国内外逐渐重视问题解决能力的培养,国内外学者纷纷开始关注问题解决能力的研究领域。《普通高中信息技术课程标准(2017版)》强调了需要重视学生的知识、技能和问题解决能力等方面的考察。但是,国内的初中生问题解决能力水平并不高,信息技术课程的教学也存在许多的问题。因此,本研究尝试设计出提升初中生问题解决能力的学习支架,并应用于教学实践,为一线信息技术教师提供参考和借鉴。本研究通过查阅信息技术课程、问
当今社会频频发生强制猥亵的犯罪行为。因该罪往往造成极其恶劣的社会影响,但因受制于该罪法定刑的限制,法院判决的刑罚却低于社会公众的预期,故而形成社会情感与法院判决二者之间的情感撕裂。为加大对强制猥亵犯罪的惩处力度,立法机关先后两次对1997年《刑法》第237条进行了修订。那么经修订后,我国法院关于强制猥亵犯罪的量刑究竟存在哪些方面的问题?立法还需要对此作出什么样的回应?基于上述两个问题,文章试图透过
问题行为(包括内隐问题和外显问题)在学前儿童中日益普遍,并对儿童后续的社会适应和认知发展产生严重危害。已有文献提出父母的抑郁情绪是推动儿童问题行为的重要风险因素,且其中的影响机制呈现多层次、多维度的特点。为了深化对影响机制的研究,本项目旨在考察学前期父母的教养压力是否也会是父母抑郁情绪导致儿童问题行为的其中一个中介因素,以及家庭社会经济地位和儿童性别是否会在上述关系中起到调节作用。本研究采用了纵向