大数据的分布式机器学习的策略与原则

来源 :Engineering | 被引量 : 0次 | 上传用户:jiekoala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据的发展已经引领了对能够学习包含数百万至数十亿参数的复杂模型的机器学习系统的新需求,以保证足够的能力来消化海量的数据集,提供强大的预测分析(如高维潜特征、中介表示和决策功能)。为了在这样的尺度上,在成百上千台的分布式机器集群中运行机器学习算法,关键往往是要投入显著的工程性的努力——有人可能会问,这样的工程是否还属于机器学习的研究领域?考虑到如此"大"的机器学习系统可以极大地从根植于机器学习的统计和算法的理解中受益——因此,机器学习的研究人员应该不会回避这样的系统设计——我们讨论了一系列从我们近来对工程尺度的机器学习解决方案的研究中提炼的原则和策略。这些原则和策略从机器学习的应用连续跨越到它的工程和理论研究,以及大型机器学习的系统和架构的发展,目标是了解如何使其有效、广泛地适用,并以收敛和缩放保证支持。它们关注的是机器学习研究传统上注意较少的四个关键问题:一个机器学习程序怎样能分布到一个集群中去?机器学习计算怎样能通过机器间的交流连接起来?这样的交流是如何被执行的?机器间应该交流的内容是什么?通过揭示机器学习程序所独有的,而非常见于传统计算机程序中的基础性的统计和算法上的特点,并通过剖析成功案例,以揭示我们如何利用这些原则来同时设计和开发高性能的分布式机器学习软件以及通用的机器学习框架,我们为机器学习的研究人员和从业者提供了进一步塑造并扩大机器学习与系统之间的领域的机会。
其他文献
"如今,杭州的药店都是被房东牵着鼻子走,续签合同时物业租金涨幅大都在20%~30%之间."说起高租金带给零售药店的压力,浙江英特药房有限公司总经理周祥顺非常无奈地表示,"为了控
期刊
<正>北京市十一学校(以下简称十一学校)自2011年开始承接国家级教育体制改革试点项目,开始了走班选课的课程改革与全员育人、自主管理的变革。信息化掀起了新一波的社会转型,
最近频发的食品安全事件,引起了社会对我国食品安全教育的关注,在全国普及食品安全教育的同时,农村农民的食品安全教育问题仍是工作的重点,在分析了我国农村食品安全现状的基
纵观当今世界的发展潮流,中小企业已成为技术创新和经济发展中不可替代的力量,是促进经济繁荣、增加社会就业、推进社会和谐的重要基础。而我国中小企业却面临产品结构单一、技
截至2004年10月日本大葱的进口量已突破5万吨,大大超出前年进口4.5万吨的历史纪录,创历史新高。由于2004年秋季台风连续登陆、降雨持续,日本蔬菜价格全面上涨。而大葱的进口渠道
<正>1月13日,由甘肃省金融学会丝路普惠金融研究中心主办的"决战脱贫攻坚下的金融扶贫"座谈会在兰州召开,来自政府、高校、金融机构及业界的多位领导、学者和专家围绕"金融扶
从普通医生到知名专家,从超声科主任到医院副院长,从刚毕业的小姑娘到如今事业上的“女超人”,郭君一直在自己热爱的医学事业上勇往直前。
医药行业2005年涌现出的诸多联盟最终或解体或悄无声息,那辽宁和甘肃这两个区域新现的医药联盟能玩得转吗?
微信开机画面中有一个面对蓝色星球的孤独背影,那个背影是"微信之父"张小龙。张小龙治下的微信在2014年迎来重大转折,2014年之前他毫无保留地将自己的产品理念映射到微信上,201
随着我国民主政治的发展,行政听证会作为政府听取民意的一种方式越来越被人们所接受。公众参与存在的问题直接影响到行政听证会的效果。通过剖析国内外对行政听证会相关问题的