【摘 要】
:
矩阵分解作为一项基础通用的机器学习技术,在实际的工业生产中具有广泛应用。然而,随着训练数据的增长,大规模的矩阵分解无法在单机节点完成,需要将训练数据分发至多个节点上
论文部分内容阅读
矩阵分解作为一项基础通用的机器学习技术,在实际的工业生产中具有广泛应用。然而,随着训练数据的增长,大规模的矩阵分解无法在单机节点完成,需要将训练数据分发至多个节点上进行高效的分布式的训练。传统的分布式矩阵分解采用以梯度下降为核心的迭代算法进行,然而,依托典型的MapReduce架构或者Parameter Server的分布式架构不能高效地完成快速迭代。整个训练过程中具有显著的通信开销和I/O开销,由此极大地延长了训练时间,造成资源的浪费;同时,由于多对一的通信模式广泛存在,传统的分布式矩阵分解方案严重影响RDMA的扩展性部署,因此不能很好地利用RDMA技术带来的性能提升。基于此,本文提出一种新型的大规模矩阵分解方案Rima,摒弃了传统的中心化架构,采用去中心化的环形架构消除中心化瓶颈,并实现高效可扩展的大规模分布式矩阵分解。Rima采用环状并行模式,消除中心化瓶颈;通过“一步置换”策略,可以减少一半通信传输,极大提高带宽利用率;并且引入三种“部分随机化”策略,增强算法鲁棒性,保证算法收敛;此外,Rima通过“预定义模式序列”策略,预加载模式序列,从而进一步讲磁盘读取开销和计算通信开销重叠,避免了 I/O开销严重影响训练时间。实验结果表明,Rima相比于传统的分布式矩阵分解方案DSGD,在TCP传输协议下,训练时间可以缩短68.7%,在RDMA传输协议下,训练时间可以缩短85.4%,充分证明了 Rima显著提高分布式矩阵分解的训练速度。
其他文献
随着计算机工业以及人工智能的迅速发展,人机交互技术作为其中不可或缺的一部分,受到越来越多人们的关注。在众多人机交互的手段中,手势交互是最高效、自然、舒适的一种交互
工业磨抛机器人对工件进行打磨时,打磨接触力是打磨质量与效率的重要影响因素之一,不稳定的接触力是损伤工件使工件不达标的主要原因之一。本文改进了基于单一位置参数的机器
切换正系统是混杂系统的一种,在公共交通、生物学、通讯网络等领域有着广泛的应用。但因为此类系统同时拥有正性和切换特性,且这两种特性相互耦合,所以对切换正系统的分析有
在数据流上进行频繁模式挖掘是数据挖掘领域的一个研究热点,然而很多方法研究的是单数据流,其中每条事务是独立的,不考虑某些事务由相同个体产生。在现实生活中,许多应用涉及
虚拟手术仿真系统研发涉及到众多交叉学科,包括影像学、图像处理、人机交互、计算机图形学、机械动力学、医学等,目前仍存在形变计算反馈频率与力反馈算法刷新频率低等问题。
随着普适计算和无线通信等技术的不断发展,体域网已广泛应用于体育训练、医疗诊断、社会保障等各个领域。在体域网研究领域中,人体步态识别已经成为一个热点,可以帮助计算机感知人体步态并理解相关含义,进而为游戏娱乐、医疗监测和运动辅助训练等具体的研究课题提供基础服务。目前的人体步态识别方法通常使用加速度计采集加速度数据,并使用滑动窗口技术分割数据,在此基础上从分割好的数据中提取特征以实现步态识别。这些步态识
胫-距-跟融合术是治疗终末期踝关节和距下关节的有效手段。1906年,Lexer首次报道了该术式,之后得到了不断的丰富发展,并在临床上广泛应用。胫-距-跟融合术涉及距下关节和踝关
模型预测控制(Model Predictive Control,简称MPC)较之传统的PID控制,在处理具有复杂约束的系统中表现出其巨大的优势,并在大型过程工业过程的控制中得到广泛应用。MPC是一种
产学研合作活动作为一种连接教育界与产业界的桥梁,在世界各国创新发展中都发挥着很重要的作用。美国是世界上产学研合作人才培养模式发展最早且最为成功的国家之一,研究美国
随着现代信息技术的发展,融合传感器、信息处理和通信网络等各种技术的物联网将感知提升到了新的高度。各种智能化设备,如智能冰箱、智能音箱等渐渐走进千家万户,为人们提供