论文部分内容阅读
随着互联网的快速发展,各种各样的商品充斥在购物网站上,用户很难找到他们感兴趣的商品。在此背景下,推荐系统应运而生。推荐系统将用户感兴趣的信息推荐给用户,帮助用户快速地挖掘对自己有价值的信息,其应用前景广泛,受到学术界和商业界的高度关注。协同过滤推荐算法是当前推荐系统中应用最广泛和最成功的推荐算法,但是随着电子商务网站的规模不断扩大,传统的协同过滤推荐算法也面临着严峻挑战。本文以推荐系统的协同过滤推荐算法为研究对象,旨在解决协同过滤推荐算法在应用中所遇到的数据稀疏性问题。针对协同过滤推荐算法,本文在以下几个方面作了相应的研究和探索:1、针对推荐系统和推荐算法的总体发展进行了详细介绍,概述了现有的推荐算法并指出其各自的特点并对各种算法的优缺点进行对比;深入研究了协同过滤推荐算法并对其面临的问题和解决方案做出总结,为下一步的研究奠定理论基础。2、分析了传统的协同过滤推荐算法的不足,针对传统的协同过滤推荐算法在数据稀疏时导致推荐精度不高的问题上,提出了一种新的组合协同过滤推荐算法,采用层叠和矩阵填充的方法将基于用户和基于项目的协同过滤推荐算法进行组合。首先,提出传统的协同过滤算法在面临数据稀疏时,使得最近邻的选取不合理,利用基于用户协同过滤算法预测评分并填充原始评分矩阵,数据稀疏度明显降低,最近邻居选取更准确;其次,传统的协同过滤算法只是考虑用户或项目之间的相似性,相似性计算不准确,在填充后的评分矩阵的基础上,采用基于项目的协同过滤推荐算法为用户产生推荐,充分结合这两种传统协同过滤算法的优势。通过Mahout平台进行仿真实验表明,本文提出的组合推荐算法,在精度上优于传统的协同过滤推荐算法。通过上述的研究工作,从一定程度上解决了协同过滤推荐算法所面临的数据稀疏性问题,在一定程度上推动协同过滤推荐算法的理论研究和应用研究的进展。