论文部分内容阅读
随着互联网不断的发展,人们获取信息的方式变得越来越方便,但是面对浩瀚如海的网上资源,人们常常感到束手无策甚至恐慌,希望计算机能够更智能更主动的为我们筛选出有效的资源,使我们轻松的获得自己需要的有用信息。在此背景下,个性化推荐技术得到了前所未有的重视,通过对网站信息和用户行为信息等内容,利用过滤筛选、数据挖掘等机器学习算法,让系统主动为用户进行“思考”。协同过滤技术是应用的最广泛且最为成功的推荐算法,其认为用户的行为具有普遍联系性,可以利用用户相互协作的思想来预测用户的兴趣偏好并得到推荐结果。但不易挖掘用户多兴趣特征的缺陷使得协同过滤技术在准确率上存在局限,而且协同过滤技术还存在两个比较难解决的问题,项目冷启动问题和可扩展性,基于存在的这三个问题,本文做了以下几方面的工作,首先本文将潜在语义分析模型运用到协同过滤算法中,通过统计学知识利用用户评分向量空间构建一个潜在向量空间,即用户或项目的特征空间,而不需要利用外部知识,来发现用户的潜在兴趣进行协同推荐。通过概率潜在语义分析模型的引入,很好的解决了推荐系统存在的扩展性问题。此外大量事实证明,单一模型算法并不能精确的反应用户行为并且做出推荐。以基于概率潜在语义分析的协同过滤模型为基础,利用混合推荐的优势,分别将PLSA-CF模型与基于项目的协同过滤算法和基于内容的推荐算法融合在一起。其中基于项目的协同过滤推荐中相似度的计算本文进行了一定的改进,引入两个项目被共同打分的次数;第二个混合算法本文叫做称之为潜在群体回归推荐,如同协同过滤算法一样要使用所有用户评分数据,对用户行为进行评分,又有基于内容的推荐系统的优势,为所推荐的项目提供了推荐的解释被用户很好的理解,并且能对新的项目进行推荐,很好的解决了项目冷启动问题。通过实验结果显示,基于PLSA-CF模型比传统的协同过滤推荐算法在准确度上有了很大的提高;另外所提出的两个混合推荐算法比起单一协同过滤推荐不但在准确性上有着很好的表现,而且能够对新项目进行推荐,并提供了推荐解释,提高了推荐系统的透明度,得到更好的用户体验。