基于随机投影的大规模矩阵补全方法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:qepwq051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矩阵补全是利用观测到的矩阵元素去估计未知元素,从而恢复整个矩阵。它被广泛应用于协同过滤,推荐系统等机器学习应用中。在这些机器学习应用中,通常用一个矩阵来存储数据。这些数据矩阵通常是低秩的,而且有一些缺失数据,如何通过观测到的数据,应用矩阵低秩的特性,来预测这些缺失数据从而恢复矩阵就是低秩矩阵补全的问题。推荐系统是矩阵补全的一个典型的应用,例如在MovieLens中,存有部分用户对一些电影的打分,矩阵补全就是根据这些已有的打分预测用户对于其他电影的打分,从而推荐用户可能感兴趣的电影。通常我们把低秩作为一个限制条件,然而最小化秩的问题是一个NP Hard的问题,所以通常整个问题会被凸松弛成一个矩阵核范数最小化问题。在解决核范数最小化问题时,通常通过迭代求解,然而在迭代过程中需要对这些数据矩阵做一次或多次的奇异值分解(Singular Value Decomposition,SVD)。由于奇异值分解(SVD)计算复杂度较高,所以当数据矩阵规模较大时,一些常规的矩阵补全算法会受到限制。本文通过引入随机投影来解决这个问题。本文引入随机投影,来对大规模的数据矩阵做随机奇异值分解,从而来加快矩阵的奇异值分解,从而加快经典的Soft-Impute算法。同时本文还对这个算法做了复杂度和界的理论分析。本文在两个典型的推荐系统数据集:Jester和MovieLens上通过实验验证了,我们的算法可以更快更好的实现矩阵补全。
其他文献
随着深度学习技术在图像领域上越来越普及,研究学者对图像超分辨率重建的研究方向从传统方法逐渐转向基于深度学习的算法。图像超分辨率重建的目的是应用某些技术和算法将模
随着社会各界安防意识的加强,监控摄像头的安装需求越来越大,导致监控视频数据急剧增加,仅靠人力进行人流量监测难以及时有效地处理视频数据。基于计算机视觉的人流量统计是
家庭是社会组织管理的最小单位,正是千百万个家庭汇聚成整个社会,个体才能够在社会中生存与发展。家庭的稳定与和谐是社会安定团结的重要基础,也是社会稳定发展的基石。家庭的稳定与和谐一方面需要家庭成员之间建立良好的信任关系,另一方面依靠家庭传统与文化观念的培育与熏陶。家庭文化的传承事关每一个家庭成员对自己在家庭内部的身份认同、道德品性的培养、家庭凝聚力的提升。家庭文化的传承不但需要无形的文化氛围的熏陶也需
自底而上视觉注意力是指人类面对繁杂的视觉场景时,能够迅速地找到与周围区域有明显区别的物体或者区域,并且忽略其它不重要区域的一种初级认知能力。它可以应用在感兴趣目标
随着自动驾驶技术的不断发展,自动驾驶汽车开始应用于各行各业中,如道路清洁、短途运输、交通客运中。与此同时,为了应对不同任务所面临的复杂环境,对自动驾驶的安全性也提出
本篇是马库斯·埃里克森著的《垃圾筏——乘风破浪》节选部分的英汉翻译实践报告。该书记录了塑料污染对海洋生物造成的毁灭性伤害以及马库斯与团队对抗塑料污染所做的全部努力。他们为2015年美国联邦无微珠水法案的顺利通过作出了杰出贡献。在经济全球发展的背景下,政策决策者、工业和企业往往只注重经济利益而忽略对环境的保护。自二战以来,塑料制品的数量剧增,海洋生物成了最大的受害者,而接触微塑料同样给人们带来不可逆
银行账号质押是在我国实行改革开放,国内大举进行招商引资的背景下,由跨国公司带入我国的。最初此担保方式只能作为一种辅助保障措施,质押人为取得巨量资金,将质押项目的所有资产出质,账户作为资产的一个组成部分一并质押。可随着经济社会的发展,不仅大额资金需求量增加,小额贷款也得到了迅猛发展,而这种设立快捷,实现方便的担保方式,自然而然的便受到了社会的青睐。主要形式有三种:银行存款自主质押、质押合同组成部分、
新技术的应用与中国经济的快速发展两个趋势使汉语远程教育占据越来越重要的位置。2008年Dave Cormier自创的慕课平台(Massive Open Online Course,MOOC)从2012年开始成为一
随着社会经济的发展,工业化和城镇化建设造成的空气污染日益严重,PM2.5作为空气污染物的重要组成部分,其浓度值的不断增加给人们日常的工作生活带来了极其严重的困扰。相关研
数控机床是制造业的基础,提高工件的加工精度是制造业不懈的追求,而高精度的数控机床是实现该目标的必经途径。数控机床的几何误差是影响工件加工精度的重要因素,尤其对于高