论文部分内容阅读
随着信息技术和互联网的高速发展,现代人们逐渐从信息资源匮乏的时代走向了信息过载(information overload)的时代,数以万计的用户规模和海量的信息让用户使用者以及信息的提供者都面临着巨大的考验;对于信息的使用者和消费者而言,在海量信息资源中找寻到真正自己所需要的资源是一件非常困难的事情,而且对于资源和信息的生产者来说,如何让自己的产品脱颖而出,受到了不同用户的关注,也是一件难题。至此,推荐系统应运而生,它联系着用户与物品,并且让最有用的信息呈现在对它感兴趣的用户面前,从而让用户和物品生产者达到一种双赢,让用户产生更强的信任感,并让物品生产者得到更大的赢利。近些年来,推荐系统和其算法在全世界都已经有颇具成熟的研究,移动通信网络的崛起,让更多地用户开始使用智能移动设备(如智能手机、平板电脑等)来获取网络服务。基于移动的上下文推荐系统便是在这种环境下应运而生的。现代智能移动设备通过收集移动用户的浏览行为,并且运用了个性化的推荐算法来预测用户偏好,为用户主动推荐满足其个性化需求的产品。移动智能终端能够更好地收集到用户所处的上下文(context)。这些上下文包括用户当前所处的时间、地点、心情等等。这些上下文信息对于提高推荐系统的准确度是非常有用的。因此,准确地收集到用户的上下文信息,并将这些指标运用到算法中是设计出一个优秀的推荐系统的关键。本文的主要工作内容包括:第一章回顾和阐述了推荐系统的定义、结构、经典的推荐系统算法、国内外研究成果以及评价评测指标、评测维度等等。着重介绍了经典的协同过滤算法,以及机器学习中的优秀算法,总结和比较了这些算法的适用场景。第二章对推荐系统领域的经典推荐算法进行阐述,其中包括基于用户,基于物品的协同过滤算法,混合推荐技术,基于图的推荐(随即游走算法)、以及对上下文对推荐的影响。第三章详细介绍了因子分解理论,并且对机器学习的理论知识,损失函数的分类做了详细的解释。接下来对于现阶段推荐系统领域最为热门的矩阵分解理论的经典算法进行了回顾并且引出了两个高性能的推荐算法:张量的多元推荐(Multiverse Recommendation)和因子分解机(Factorization Machines)。这篇文章中主要应用了因式分解机(Factorization Machines)作为主要的研究算法,在深刻介绍因式分解的发展历史与理论的基础上提出因式分解机模型并描述了因子分解机的模型表示。第四章主要进行实证分析,研究了因子分解机模型中的优化算法对比,算法时间复杂度的分析,分解维度k的取值对预测质量的影响,并且选取了很多关键的上下文特征融入到系统中,还同张量分解算法Multiverse Recommendation进行了对比,获得了比它更好的性能。本文在三个国际公开数据集上对比传统的推荐系统算法,获得了比它们更好的推荐结果。这篇文章针对了因子分解理论对两种推荐系统领域中最新的模型进行了研究,其中本文主要分析了因子分解机,它在算法的时间复杂度上是线性的,这对于处理大规模的数据提供了很好的性能。并且此算法具有通用性,可以通过指定的输入方式对不同的算法进行模拟。经过实验中和传统的算法的对比,因子分解机是推荐领域最优秀算法之一