论文部分内容阅读
随着近几年互联网与信息技术的快速发展,网络向用户提供的信息和应用越来越多,在人们享受着网络所带来方便的同时信息过载现象也变得日趋严重,如何从海量数据中获取满足人们自身需要的信息已成为一个必须解决的问题。现有的一些网络应用,例如搜索引擎(如Google、百度等)、门户站点以及数据索引系统实质上均是辅助人们筛选和获取信息的工具,但他们很难满足不同背景、不同时间以及不同环境的个性化信息需求,所以不能很好地解决信息过载问题。个性化推荐系统作为一种有效的信息过滤技术,是解决当前信息过载问题重要手段。协同过滤技术在目前众多推荐技术当中是最为成功也是应用最为广泛的推荐技术之一,在理论探索与实际应用领域都取得了迅速发展。但是,随着互联网规模和覆盖面的急速扩张,用户数量和信息数量也逐渐增多,致使经典的协同过滤推荐方法受到了数据稀疏问题、冷启动以及―托‖攻击等问题的挑战。针对以上存在的问题,为了提升推荐系统的预测精度和推荐质量,本文完成的成果性工作主要包括:(1)对传统的协同过滤推荐方法进行了研究,分析了互联网中用户之间社交信任的特征,基于信任的特性建立信任网络模型。(2)提出一种基于信任网络随机游走模型的协同过滤推荐方法。融合了基于信任和基于项目的协同过滤推荐方法,将信任模型作为引导推荐的重要因素。该方法不仅考虑信任用户对目标项目的评分,也考虑了他们对于那些和目标项目相似项目的评分。随着在信任网络中游走深度的逐步增加,以相似项目的评分信息替代目标项目的评分信息的概率也将逐渐增大,最终根据多轮迭代游走产生的结果集加权计算最终的预测评分。(3)在传统Pearson相似度计算方法基础之上,引入Sigmoid函数以提高共同评价用户数量对相似度大小的影响,从而增强相似度计算的合理性。(4)本文全部试验数据采用包含用户间信任信息的Epinions数据集。通过实验比较了基于信任网络随机游走模型推荐方法在不同参数下的性能,从而寻求最优参数组合。实验结果证明了本文提出的方法在推荐精度上明显高于传统协同过滤推荐算法。