论文部分内容阅读
随着Web2.0时代的到来,网络技术的迅猛发展以及移动设备的普及,互联网中产生的数据量呈指数增长,用户被淹没在浩瀚的数据的海洋中。为了解决这一问题,推荐系统应运而生,它可以为用户过滤掉绝大部分的垃圾信息,在节约用户时间的同时也在一定程度上解决了信息过载问题。在很多场景中,上下文信息是确定用户兴趣的重要因素。上下文感知推荐系统可以提高许多场景中预测的准确度,正逐渐成为研究热点。距离和时间是设计上下文感知推荐系统时最常见的两个因素。因此,本文将针对距离因素中只考虑了距离中的物理信息而忽略了距离中的文化差异以及时间因素中只考虑了时间衰减效应而忽略了时间记忆效应这两大问题,对推荐算法进行改进以及对结果进行对比分析,以此来提高算法的准确率和召回率,并讨论了如何在数据缺失的情况下提升推荐结果的准确性。(1)基于特征距离的上下文感知推荐技术。在目前的研究中,距离因素一般是指可以直接度量的地理或者物理上的距离。然而,在推荐系统中,用户做的每一个的决定不止与他的所处的地理位置相关,更与家庭环境,经济状况,宗教信仰以及价值观等广义的距离特征有着密切联系,因此只考虑狭义的距离特性的推荐系统有一定的局限性。本文对广义的距离特征这一抽象概念进行量化,在协同过滤推荐系统中引入Hofstede的文化距离模型(一种衡量不同国家文化差异和价值取向的模型),提出了一个基于特征距离的协同过滤推荐算法并预测某些缺失文化距离值的物品的数值。最后在真实数据集上进行实验验证。实验结果表明,与传统的推荐方法相比,本文的算法可以将准确率提高9%。(2)基于时间效应的上下文感知推荐技术。传统的时间上下文感知的推荐系统只考虑了时间衰减效应,认为用户之间的相关性只会随着时间的增长而降低,而忽视了在特定的时间条件下,人们会有特定的记忆并增强两者之间的相关性。为了更好地分析用户意图并产生更精确的推荐结果,本文讨论了时间效应对推荐系统的影响,提出了时间记忆效应的概念,并将其与传统的时间衰减效应结合提出新的时间效应函数。然后根据新的时间效应函数,改变用户相似度的权重并对推荐物品的预测评分产生影响,最后根据预测评分生成推荐结果。基于大规模实际数据的实验结果表明,与传统的推荐方法相比,基于时间效应的上下文感知推荐算法可以将准确率提高7%。