论文部分内容阅读
伴随着Internet的普及和电子商务应用的广泛深入,供应链和现代物流的不断完善,人们在享受网上购物方便快捷的同时也陷入了信息过载的困境,用户在大量的产品信息中难以找到自己需要的商品。由此,电子商务推荐系统应运而生。推荐系统在电子商务平台上扮演销售人员的角色,向用户推荐其所需要的商品,从而顺利地完成购买过程。电子商务推荐系统具有良好的发展和应用前景,逐渐成为一个重要研究内容,其中个性化推荐系统是为了满足不同用户特定需求而产生的,也是其中的一个研究分支。协同过滤推荐算法是目前推荐系统中应用最为广泛的推荐技术,在诸多方面较其他推荐算法显示出突出的优势。但协同过滤推荐算法还不够成熟,仍然存在一些问题,如数据稀疏性问题、系统的可扩展性问题和时间因素问题等。本文针对电子商务推荐系统和协同过滤推荐算法面临的主要问题,对推荐系统中的推荐策略和推荐算法等关键技术进行了有益的探索和研究。本文的研究工作主要从以下四个方面展开:首先,介绍现有的电子商务推荐系统和主要推荐技术。将电子商务个性化推荐系统和主要推荐技术的有关文献重新梳理和总结,得出电子商务个性化推荐系统的研究内容和构成,分析各种主要推荐技术的实现过程和优缺点,进而分析每种推荐技术的适用情况。其次,对协同过滤推荐算法,尤其是传统的协同过滤推荐算法进行研究。此处在对协同过滤推荐算法相关文献整理后,重新定义协同过滤推荐方法,指出协同过滤推荐算法的原理和实现过程。并重点论述了传统的协同过滤推荐算法,分析其优缺点。在此基础上,总结协同过滤推荐算法面临的瓶颈和解决方法。再次,协同过滤推荐算法的改进,也是本文的核心部分。针对协同过滤推荐算法存在的数据稀疏性和时间因素问题,提出基于SVD和时间加权的改进算法。该改进算法是在一篇文献的基础上,加入了奇异值分解方法和时间函数,并将相似性度量方法改进为相关相似性度量公式。第一步,采用奇异值分解方法对用户-项目评估矩阵降维,降低数据的稀疏程度。第二步,采用BP神经网络来填充降维后的用户-项目评估矩阵中的未评分项,再一次降低数据的稀疏程度。第三步,采用相关相似性度量方法计算用户之间的相似性,得到用户的最近邻居集合。最后一步,在推荐预测阶段考虑到推荐系统的时效性,采用基于时间加权的推荐预测公式,对评价时间较近的数据赋予较大的权重,对评价时间较远的数据赋予较小的权重,提高预测精度。从整体上来看,在一定程度上解决了数据稀疏和时间因素的问题,提高了电子商务推荐系统的推荐质量。最后,仿真测试改进算法的有效性。使用Matlab软件对美国明尼苏达州立大学GroupLens研究小组提供的公用数据集MovieLens进行仿真测试,验证其合理性和有效性。文中设计的两种测试方案,分别是不同数据稀疏程度和不同最近邻居个数,都证明了改进算法较原有的算法有明显的优势,提高了电子商务推荐系统的推荐质量。基于以上的研究内容,本文的创新点如下:第一,对协同过滤的概念给予重新的定义。第二,改进算法中,将SVD和BP神经网络结合使用,双重降低用户-项目评估矩阵的稀疏程度。第三,考虑到评价信息的实时性,应用基于时间函数的推荐预测公式。第四,设计仿真测试证明了改进算法有效地提高了推荐系统的推荐质量。