论文部分内容阅读
在当今的学术界和工业界,有一个词总是会萦绕在耳边,那就是大数据,或者称为海量数据。因为随着互联网发展,人们工作生活各方面产生的各种结构类型的海量数据层出不穷。面对这些海量的数据,如何才能挖掘出其中隐含着的,对人们有价值的信息,已成为当今计算信息领域一个大的课题与研究方向。而推荐系统采用了协同过滤,知识挖掘及机器学习等技术,给予用户可靠的推荐服务,从而被成功地应用于电子商务,图书、电影和视频推荐等不同的领域。本文主要的研究内容如下所示:本文首先简单地研究了基于协同过滤推荐算法中的相似度模型,而基于用户的协同过滤推荐算法核心是对于与目标用户相似的邻居用户的选择。普遍的相似度主要是用户间的评分相似度,实际上,仅仅从评分信息方面,不能够准确地反映出用户间的偏好,还有许多其他的附加信息。一个主要的方面就是物品的类别特征,本文就用户对物品的类别偏好与评分信息进行加权结合,从而更好地选出目标用户的邻居用户,通过实验展示了该混合方法对于目标用户评分预测的良好效果。基于网络结构的概率传播推荐算法是一种利用用户对项目的关联关系构建基于用户与项目的二分网络图,再对该网络图结构的关系分析从而对用户进行个性化推荐的简单有效的推荐算法。而在当前背景下,如何把更多数据集中的数据信息如项目内容信息,用户的个人信息等运用到整个算法的过程中,是目前研究的重点。尤其是评分信息可以直观反映出用户的偏好,从物品特征角度出发,用户对于物品的评分信息也可以作为物品与物品间相似程度的反映。因此,本文分别从物品的类别信息与用户对其的评分角度出发,各设计一种项目之间的相似度从而对基于网络结构的概率传播推荐算法计算过程中的物品与物品间的传播矩阵进行加强修正,最终提高该推荐算法的准确性。基于网络结构的项目排名推荐算法是一种基于重启的随机游走的推荐方法,而在对其详细分析的过程中发现,对该算法效果的主要影响因素在于其计算过程中的项目转移矩阵。因此在与基于网络结构的概率传播推荐算法进行对比后,对其算法框架引入参数进行改进,最后通过调节参数提高基于网络结构的项目排名推荐算法性能,并通过实验展示了参数调节之后算法推荐性能的提升。