推荐系统中矩阵分解算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yifanvip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线服务的快速发展,互联网上拥有的信息量呈现爆炸性增长趋势,导致人们很难有效地获取感兴趣的内容。推荐系统是帮助用户发现符合其兴趣偏好的物品,缓解信息过载问题的有效工具之一。矩阵分解算法是目前推荐系统领域研究的前沿之一。该算法将用户对物品的评分矩阵分解为隐因子空间上用户、物品隐因子矩阵,具有理论基础好、预测准确性高等诸多优点。目前,矩阵分解算法仍存在学习速率调参耗时、倾斜数据集上并行效果差和稀疏评分数据集上推荐效果不理想等问题。本文围绕矩阵分解算法,深入分析其存在的三个问题,并提出了相应的改进方案。本文的主要内容和贡献如下:我们提出了一个求解矩阵分解模型的自适应学习速率算法。随机梯度下降算法是求解矩阵分解模型的有效算法之一,其性能很大程度上依赖于训练过程中学习速率的调整方案。在优化矩阵分解算法的目标函数时,由于学习速率选取的不合适,目标函数会出现收敛速度慢、收敛结果不理想等问题。本文在分析各种学习速率方案缺点的基础上,提出了一个求解矩阵分解模型的自适应学习速率算法AALRSMF。该算法来源于ADADELTA算法,不需要手动设置全局学习速率,并且表现出对超参数选择的鲁棒性。和ADADELTA算法相比,AALRSMF算法将空间复杂度从O(k(m+ n))降低为O(m + n),将每次迭代的计算代价减少了 O(10k)。实验结果表明,AALRSMF算法能够显著地减少目标函数收敛的迭代次数。我们提出了一个并行矩阵分解算法。矩阵分解算法的并行化一直是一个研究热点,但是当用户评分矩阵倾斜时,已有的并行矩阵分解算法会导致目标函数出现收敛速度慢、收敛结果不理想等问题。本文在分析已有的并行算法在分解倾斜评分矩阵缺点的基础上,提出了一个基于KD树的并行矩阵分解算法KDMF。该算法利用KD树对用户评分矩阵进行划分,使得每个分区块中的评分数目尽可能相近,然后基于部分匹配查询,设计出一个异步调度算法,最小化调度分区块的时间花费。实验结果表明,KDMF算法能够显著地减少目标函数收敛所需要的时间,并且收敛结果好于其他并行算法。我们提出了一个基于文本上下文的矩阵分解算法。在实际应用中,用户评分矩阵往往是极度稀疏的。在这样的数据集上,传统的矩阵分解算法学习效果往往不理想。研究人员考虑将一些辅助信息加入到矩阵分解模型中,来提高推荐算法的性能。本文基于前人的工作,并针对他们工作中存在的问题,提出了一个基于字符表征信息的矩阵分解算法CharConvMF。该算法将物品的文本内容作为辅助信息,利用深度卷积神经网络从字符的角度提取文本内容的表征信息,然后将提取到的表征信息集成到基于邻居的矩阵分解算法中。实验结果表明,即使是在用户评分矩阵极度稀疏的情况下,CharConvMF算法评分预测的准确性依然好于其他矩阵分解算法。
其他文献
随着互联网多媒体技术的发展,用户希望能看到信息更加丰富,效果更加生动的页面。无论是在电子商务活动和互动游戏等应用领域,还是在图形图像等研究领域,网络化三维建模作为反映实
直升机巡检输电线路图像背景复杂多变,目标物众多,给边缘检测和后续的识别诊断带来很大困难。本文结合实际项目的应用需求,以直升机巡检输电线路图像为实验数据,针对直升机巡
多租户数据存储是软件及服务(SaaS, Software as a Service)中一个重要的研究内容。针对SaaS应用“单实例多租赁”这一特点,人们提出了很多解决多租户数据存储问题的方法,其
作为软件生命周期中必不可少的阶段,软件测试是保障软件安全性和可靠性的重要手段。随着并行程序逐渐成为主流,软件测试的研究方向也逐渐向并行方面转移。然而,并行程序通常由多
随着计算机技术的发展进步,计算机视觉技术也在发生着日新月异的改进。其中作为这项技术中的重要组成部分的运动目标检测和跟踪技术也在日益完善和发展。尽管如此,在我们的实
近些年,企业规模和业务不断向多个地区扩展,企业数据环境也因此变得更加复杂。ETL,即数据抽取、转换和加载过程,是构建数据仓库的重要环节,所占工作量很大。如何提高ETL的处理能力
随着无线射频识别技术(Radio Frequency Identification,RFID)的广泛应用,RFID供应链中信息的安全和隐私保护问题变得越来越严峻,阻碍了RFID技术在各行业的进一步应用。研究有效的
互联网迅猛发展,使得互联网成为一个庞大的信息源。结构化数据作为网络中比较常见的数据形式之一,具有多种网页呈现方式,对于这些数据的抽取,往往需要大量的人工操作,这给数据的抽
随着社会信息化技术的快速发展,企业越来越依赖运用信息化技术管理内部业务。因此企业开发出了各种不同的应用系统,而这些系统是在不同时期由不同人员开发设计的,它们都有独
药品食品安全是保障人类正常生活的前提,如何提高药品食品安全是当今社会迫切需要解决的问题。加强对药品信息的管理是提高药品安全的有效途径之一。   本课题基于如何提高