高维稀疏大数据中并行随机梯度下降算法研究

来源 :西华师范大学 | 被引量 : 0次 | 上传用户:djsfhkjthrekl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会计算机网络高速发展,信息数据爆炸式增长,大数据的出现促进了推荐系统的发展,从而提高了人们的日常生活质量。在推荐系统中通常使用高维稀疏矩阵来量化不完全矩阵中用户与项目之间的关系。研究者们为了从高维稀疏矩阵中获取一些有用的信息,提出了多种大数据分析方法,其中隐特征分析已被证明能从高维稀疏矩阵中高效地获取和表示信息。基于隐特征分析的推荐系统通常采取随机梯度下降作为学习算法,而随机梯度下降作为一个序列算法,在处理大规模工业问题时具有相当大的时间开销和较低的可扩展性。为了解决以上问题,本文提出了一些新颖的并行策略,提高模型的收敛速率和计算效率。主要研究内容如下:(1)概述了隐特征分析方法在推荐系统中的应用,从理论上分析了随机梯度下降算法在并行时存在的问题,并研究分析了目前基于随机梯度下降的并行隐特征模型。(2)提出了动量结合并行随机梯度下降算法,该算法将动量效应加入随机梯度下降中,并通过新颖的数据分割策略实现算法并行化。在大规模工业数据集上进行实验,结果表明,算法能提高模型的收敛速度和计算效率。(3)提出了一种基于随机梯度下降的分层并行算法,该算法通过两个层次结构实现并行化,在大规模、稀疏、真实的数据集上的实验显示,基于随机梯度下降的分层并行隐特征模型在求解大规模矩阵因子分解时具有更高的加速性能。
其他文献
量子密集编码不仅是量子信息处理的重要研究领域之一,也是量子纠缠共享非常有趣的应用之一,为实现全球量子保密通信的绝对安全提供了前提研究条件。作为量子密集编码必不可少的资源,纠缠可以使无噪声量子信道的经典信息容量加倍。但是,实际的量子系统不可避免地与周围环境存在相互作用,纠缠因此而衰减,这大大降低了密集编码效率,甚至出现量子密集编码逊色于经典编码的情况。因此,有必要寻找能抑制环境退相干保护纠缠增强密集
光的非互易传输是全光信息处理的基础,与具有p-n结的电子二极管非常类似,全光二极管(AOD)允许光仅在一个方向上传输,在相反方向抑制光传输,因而在全光计算、激光技术、全光信息
煤层气是一种非常规油气资源,具有非常大的开发潜力,国内外学者对于煤层气的开发开展了大量研究。水力压裂是煤层气开发的主要手段,它主要是通过注入高压压裂液压裂地层形成
微米级金属纤维由于其独特的微观结构和几何特征,表现出特殊的力学性能,兼具金属纤维和非晶合金的特点。本文采用旋转蘸取工艺制备出Cu-Zr-Ti-RE系金属纤维,系统研究了微量稀土元素Pr、Y、Dy掺杂对Cu-Zr-Ti金属纤维的组织结构、拉伸力学性能及断裂可靠性的影响规律,并在此基础上深入探讨了金属纤维的拉伸变形机理问题。通过XRD、DSC、SEM和TEM等技术手段对制备态Cu-Zr-Ti-RE系金
核糖体蛋白参与蛋白质合成,但在其他细胞活动中的功能,如信号传导途径、花的发育和自交不亲和反应等,尚待进一步研究。在两性被子植物中,雄蕊和柱头彼此靠近,增加了自交的机
人工林作为森林生态系统的一部分,在水土保持和水源涵养方面具有重要的作用。凋落物是森林生态系统中养分的载体,分解过程主要受到气候和凋落物质量的影响,尤其在干旱半干旱
铅冷快堆具备较好的增殖核燃料以及嬗变核废料潜力,兼具良好的经济性以及固有安全性,第四代国际核能论坛(GIF)认为其是四代堆中有希望第一个实现工业使用示范化的堆型。但是
随着现代通信技术的不断发展,光纤通信系统对信道容量的要求也越来越高。光放大器作为光纤通信的重要组成一直是人们研究的重点。光纤喇曼放大器(FRA)因为其具有宽带宽、噪声低、可实现分布式放大等一系列优势成为现代光纤通信中关键技术,在密集波分复用光通讯系统中得到广泛应用。但是光纤喇曼放大器也存在自身的缺点:例如因为对不同波长的光增益不同造成的增益不平坦,导致误码率升高。目前主要使用空间波分复用的方式,但
近半个世纪以来,西南极阿蒙森海地区冰架与冰盖物质损失严重,引发了人们对该地区海洋冰盖稳定性及全球海平面上升的广泛担忧。从该大陆边缘获取高分辨率沉积记录,了解南极过
目的:探讨扶正驱邪方对抗病毒药停药后乙肝复发的疗效及安全性。方法:从成都中医药大学附属医院感染科2016年12月~2018年12月就诊患者中共筛选出140例抗病毒药治疗停药后复发