论文部分内容阅读
互联网技术的发展和普及,使得网络已成为人们获取各种信息和资源的重要媒介。网络上的信息就像海洋一样浩瀚无际,用户虽然拥有无穷无尽的选择,但得付出比以往更多的时间和精力来发现自己想要的信息。于是,帮助用户更快地找到所感兴趣的资源解决信息过载问题已成为当前研究的热点。其中一个行之有效的解决信息过载的问题的方案就是的个性化推荐技术。该技术旨在通过挖掘个体用户的兴趣喜好,把用户最感兴趣的资源从浩瀚如海的网络信息中抽取出来推荐给相应用户。个性化推荐技术也逐渐成为了电子商务领域不可缺少的工具之一,比如Amazon, Netflix和豆瓣等许多网站都广泛使用了个性化推荐技术。面向评分的和面向排序是协同过滤系统实现的两种主要方法。面向评分的系统根据用户的历史评分信息来计算用户之间评分的相似度,然后对近邻的评分根据其余目标用户的相似度进行加权来预测目标用户对待推荐产品的评分。然而,当用户之间的评分的差别较大时,基于评分的相似度度量方式便丧失了捕获用户之间偏好相似性的能力。而且当前的面向评分的协同过滤系统只是对单独的产品独立地预测评分,而没有考虑用户对产品对的偏好关系。与之不同,面向排序的协同过滤系统则是根据用户对产品的偏好顺序来计算用户之间的相似度,然而当前面向排序的协同过滤算法只是考虑用户对产品对的偏好是否一致,而忽略了偏好的程度以及偏好的流行度在区分用户时所发挥的作用。为解决上述问题,本文提出的面向排序的协同过滤算法,能够结合用户对产品对的偏好程度以及偏好的流行程度,来向用户推荐满足其偏好的产品。协同过滤和基于内容的推荐系统都有各自的不足之处,因此在实际应用中,大多把不同类型的推荐算法进行综合运用,进而提出了混合推荐系统,以综合不同类型推荐系统的优点。本文将混合推荐系统问题转化成机器学习问题,能够综合考虑用户与产品的内容信息和评分信息。但是不像信息检索中的查询词和文档可以用相似度来衡量两者的相关程度,在推荐系统中,用户和产品在内容上不具有可比性,并不能直接用来计算用户和产品的相关程度。为了解决上述问题,本文抽取了用户和产品的属性特征以及评分特征,对用户和产品进行统一表示,使两者具有了内容上的可比性。在本文构建的特征框架上,任何排序学习算法都可以应用到推荐系统之上。本文主要在以下几个方面的做了相关研究:1)分析了现有面向排序的协同过滤算法的不足,对用户对产品对的偏好从偏好程度以及流行度两个方面进行了定义,在此基础提出了两种计算用户间偏好相似度的方式,运用了两种偏好融合的方法进行最终的排序预测工作。2)在混合推荐系统中,对用户和产品进行统一表示,将推荐系统问题转化成了排序学习问题,构建了可以运用任何排序学习算法来解决推荐系统问题的框架。为了验证本文所提算法的有效性,本文在电影数据集EachMovie和MovieLens上进行了大量实验。实验结果表明,该算法能够有效提高推荐结果的准确性。